Jak używać OpenAI do przetwarzania PDF w C# z IronPDF

This article was translated from English: Does it need improvement?
Translated
View the article in English

Rozszerzenie AI IronPDF umożliwia ulepszenie PDF z wykorzystaniem OpenAI w aplikacjach C#. Dodaj funkcje podsumowania, zapytań i zapamiętywania używając Microsoft Semantic Kernel z minimalną ilością kodu.

Chatgpt related to Jak używać OpenAI do przetwarzania PDF w C# z IronPDF

OpenAI to laboratorium badawcze rozwijające zaawansowane technologie sztucznej inteligencji. Dostarcza potężne modele językowe dostępne przez API, umożliwiając deweloperom integrację możliwości AI w swoich aplikacjach.

Pakiet NuGet IronPdf.Extensions.AI wprowadza OpenAI do przetwarzania plików PDF: streszczania, wyszukiwania i zapamiętywania. Oparte na Microsoft Semantic Kernel, ten SDK upraszcza integrację usług AI w aplikacjach .NET. Automatyczne wyciąganie wniosków, odpowiadanie na pytania i generowanie podsumowań z dokumentów PDF.

Kluczowe zastosowania obejmują przetwarzanie dużych ilości dokumentów, wyciąganie informacji z raportów, tworzenie podsumowań do szybkiego przeglądu i budowanie inteligentnych systemów zarządzania dokumentami. Integracja wspiera zarówno jednorazowe podsumowanie, jak i ciągłe zapytania dla różnych aplikacji. Więcej funkcji PDF można znaleźć w kompleksowej dokumentacji IronPDF lub nauczyć się tworzenia PDF z HTML.

Szybki start: Podsumowanie PDF z IronPDF i OpenAI

Rozpocznij integrację OpenAI w swoim przepływie pracy przetwarzania PDF z IronPDF w C#. Ten przykład pokazuje szybkie podsumowanie PDF zaledwie w kilku liniach kodu.

  1. Install IronPDF with NuGet Package Manager

    PM > Install-Package IronPdf
  2. Skopiuj i uruchom ten fragment kodu.

    // Install-Package IronPdf.Extensions.AI
    await IronPdf.AI.PdfAIEngine.Summarize("input.pdf", "summary.txt", azureEndpoint, azureApiKey);
  3. Wdrożenie do testowania w środowisku produkcyjnym

    Rozpocznij używanie IronPDF w swoim projekcie już dziś z darmową wersją próbną

    arrow pointer


Wymagane pakiety:

Przed wdrożeniem funkcji AI skonfiguruj usługę Azure OpenAI. Potrzebna jest subskrypcja platformy Azure z dostępem do usługi Azure OpenAI Service. Usługa zapewnia bezpieczeństwo i zgodność z przepisami na poziomie Enterprise dla aplikacji produkcyjnych. Szczegółowe instrukcje można znaleźć w przeglądzie instalacji IronPDF.

Jak podsumować pliki PDF za pomocą OpenAI?

Aby korzystać z funkcji OpenAI, skonfiguruj Semantic Kernel, podając swój punkt końcowy Azure i klucz API. Zaimportuj dokument PDF i użyj metody Summarize do wygenerowania streszczeń.

Funkcja tworzenia streszczeń działa z różnymi typami plików PDF:

  • Zeskanowane dokumenty (w połączeniu z OCR)
  • Złożone układy z wieloma kolumnami
  • Dokumenty zawierające obrazy i tabele

IronPDF wyodrębnia treść tekstową i przetwarza ją za pomocą modelu AI. W przypadku innych formatów zobacz konwersję DOCX na PDF lub konwersję Markdown na PDF.

Zwróć uwagę
Uwaga: mogą pojawić się błędy SKEXP0001, SKEXP0010 i SKEXP0050, ponieważ metody Semantic Kernel mają charakter eksperymentalny. Dodaj to do pliku .csproj, aby je wyłączyć:

<Project Sdk="Microsoft.NET.Sdk">
  <PropertyGroup>
    <NoWarn>$(NoWarn);SKEXP0001,SKEXP0010,SKEXP0050</NoWarn>
  </PropertyGroup>
</Project>
<Project Sdk="Microsoft.NET.Sdk">
  <PropertyGroup>
    <NoWarn>$(NoWarn);SKEXP0001,SKEXP0010,SKEXP0050</NoWarn>
  </PropertyGroup>
</Project>
XML

)}]

Oto jak podsumować plik PDF za pomocą Semantic Kernel w języku C#:

:path=/static-assets/pdf/content-code-examples/how-to/openai-summarize.cs
using IronPdf;
using IronPdf.AI;
using Microsoft.SemanticKernel;
using Microsoft.SemanticKernel.Connectors.OpenAI;
using Microsoft.SemanticKernel.Memory;
using System;
using System.Threading.Tasks;

// Setup OpenAI
var azureEndpoint = "<<enter your azure endpoint here>>";
var apiKey = "<<enter your azure API key here>>";
var builder = Kernel.CreateBuilder()
    .AddAzureOpenAITextEmbeddingGeneration("oaiembed", azureEndpoint, apiKey)
    .AddAzureOpenAIChatCompletion("oaichat", azureEndpoint, apiKey);
var kernel = builder.Build();

// Setup Memory
var memory_builder = new MemoryBuilder()
    // optionally use new ChromaMemoryStore("http://127.0.0.1:8000") (see https://github.com/microsoft/semantic-kernel/blob/main/dotnet/notebooks/09-memory-with-chroma.ipynb)
    .WithMemoryStore(new VolatileMemoryStore())
    .WithAzureOpenAITextEmbeddingGeneration("oaiembed", azureEndpoint, apiKey);
var memory = memory_builder.Build();

// Initialize IronAI
IronDocumentAI.Initialize(kernel, memory);

License.LicenseKey = "<<enter your IronPdf license key here";

// Import PDF document
PdfDocument pdf = PdfDocument.FromFile("wikipedia.pdf");

// Summarize the document
Console.WriteLine("Please wait while I summarize the document...");
string summary = await pdf.Summarize(); // optionally pass AI instance or use AI instance directly
Console.WriteLine($"Document summary: {summary}\n\n");
Imports Microsoft.VisualBasic
Imports IronPdf
Imports IronPdf.AI
Imports Microsoft.SemanticKernel
Imports Microsoft.SemanticKernel.Connectors.OpenAI
Imports Microsoft.SemanticKernel.Memory
Imports System
Imports System.Threading.Tasks

' Setup OpenAI
Private azureEndpoint = "<<enter your azure endpoint here>>"
Private apiKey = "<<enter your azure API key here>>"
Private builder = Kernel.CreateBuilder().AddAzureOpenAITextEmbeddingGeneration("oaiembed", azureEndpoint, apiKey).AddAzureOpenAIChatCompletion("oaichat", azureEndpoint, apiKey)
Private kernel = builder.Build()

' Setup Memory
Private memory_builder = (New MemoryBuilder()).WithMemoryStore(New VolatileMemoryStore()).WithAzureOpenAITextEmbeddingGeneration("oaiembed", azureEndpoint, apiKey)
Private memory = memory_builder.Build()

' Initialize IronAI
IronDocumentAI.Initialize(kernel, memory)

License.LicenseKey = "<<enter your IronPdf license key here"

' Import PDF document
Dim pdf As PdfDocument = PdfDocument.FromFile("wikipedia.pdf")

' Summarize the document
Console.WriteLine("Please wait while I summarize the document...")
Dim summary As String = Await pdf.Summarize() ' optionally pass AI instance or use AI instance directly
Console.WriteLine($"Document summary: {summary}" & vbLf & vbLf)
$vbLabelText   $csharpLabel

Kod inicjuje zarówno Semantic Kernel, jak i magazyn pamięci. Pamięci buforujące zachowują kontekst podczas ciągłych zapytań. Wybierz spośród:

  • VolatileMemoryStore: Pamięć w pamięci operacyjnej do celów programistycznych i testowych
  • ChromaMemoryStore: Trwała baza danych wektorowych do użytku produkcyjnego
  • Inne przechowalnie: Azure Cognitive Search, Qdrant i więcej

W środowisku produkcyjnym należy wdrożyć obsługę błędów i niestandardowe logowanie w celu śledzenia operacji AI. Zapoznaj się z technologią asynchroniczną i wielowątkowością, aby przetwarzać wiele dokumentów jednocześnie.

Jak wygląda podsumowanie?

Konsola debugowania Visual Studio wyświetlająca podsumowanie w formacie PDF dotyczące stosów technologicznych popularnych stron internetowych, w tym języków i baz danych

Podsumowanie zawiera zwięzły przegląd dokumentu, wyodrębniając główne tematy, ważne fakty i istotne szczegóły. Model AI identyfikuje i nadaje priorytet istotnym treściom, umożliwiając szybkie zrozumienie długich dokumentów.

Jak na bieżąco przeszukiwać pliki PDF?

Pojedyncze zapytania nie pasują do wszystkich scenariuszy. Pakiet IronPdf.Extensions.AI oferuje metodę Query do ciągłych zapytań. Twórz interfejsy konwersacyjne, narzędzia badawcze lub aplikacje do analizy dokumentów, w których użytkownicy zadają wiele pytań dotyczących tego samego dokumentu.

Ciągłe zadawanie pytań pozwala zachować kontekst rozmowy, umożliwiając zadawanie pytań uzupełniających i uzyskiwanie wyjaśnień. Idealny dla:

  • Systemy obsługi klienta odwołujące się do dokumentacji
  • Analiza dokumentów prawnych wymagająca interpretacji klauzul
  • Aplikacje edukacyjne do nauki złożonych materiałów
  • Narzędzia badawcze służące do pozyskiwania konkretnych informacji

Aby usprawnić przetwarzanie, warto rozważyć oddzielne wyodrębnianie tekstu i obrazów lub zastosowanie kompresji plików PDF w celu optymalizacji dużych dokumentów przed przetworzeniem przez sztuczną inteligencję.

:path=/static-assets/pdf/content-code-examples/how-to/openai-summarize.cs
using IronPdf;
using IronPdf.AI;
using Microsoft.SemanticKernel;
using Microsoft.SemanticKernel.Connectors.OpenAI;
using Microsoft.SemanticKernel.Memory;
using System;
using System.Threading.Tasks;

// Setup OpenAI
var azureEndpoint = "<<enter your azure endpoint here>>";
var apiKey = "<<enter your azure API key here>>";
var builder = Kernel.CreateBuilder()
    .AddAzureOpenAITextEmbeddingGeneration("oaiembed", azureEndpoint, apiKey)
    .AddAzureOpenAIChatCompletion("oaichat", azureEndpoint, apiKey);
var kernel = builder.Build();

// Setup Memory
var memory_builder = new MemoryBuilder()
    // optionally use new ChromaMemoryStore("http://127.0.0.1:8000") (see https://github.com/microsoft/semantic-kernel/blob/main/dotnet/notebooks/09-memory-with-chroma.ipynb)
    .WithMemoryStore(new VolatileMemoryStore())
    .WithAzureOpenAITextEmbeddingGeneration("oaiembed", azureEndpoint, apiKey);
var memory = memory_builder.Build();

// Initialize IronAI
IronDocumentAI.Initialize(kernel, memory);

License.LicenseKey = "<<enter your IronPdf license key here";

// Import PDF document
PdfDocument pdf = PdfDocument.FromFile("wikipedia.pdf");

// Summarize the document
Console.WriteLine("Please wait while I summarize the document...");
string summary = await pdf.Summarize(); // optionally pass AI instance or use AI instance directly
Console.WriteLine($"Document summary: {summary}\n\n");
Imports Microsoft.VisualBasic
Imports IronPdf
Imports IronPdf.AI
Imports Microsoft.SemanticKernel
Imports Microsoft.SemanticKernel.Connectors.OpenAI
Imports Microsoft.SemanticKernel.Memory
Imports System
Imports System.Threading.Tasks

' Setup OpenAI
Private azureEndpoint = "<<enter your azure endpoint here>>"
Private apiKey = "<<enter your azure API key here>>"
Private builder = Kernel.CreateBuilder().AddAzureOpenAITextEmbeddingGeneration("oaiembed", azureEndpoint, apiKey).AddAzureOpenAIChatCompletion("oaichat", azureEndpoint, apiKey)
Private kernel = builder.Build()

' Setup Memory
Private memory_builder = (New MemoryBuilder()).WithMemoryStore(New VolatileMemoryStore()).WithAzureOpenAITextEmbeddingGeneration("oaiembed", azureEndpoint, apiKey)
Private memory = memory_builder.Build()

' Initialize IronAI
IronDocumentAI.Initialize(kernel, memory)

License.LicenseKey = "<<enter your IronPdf license key here"

' Import PDF document
Dim pdf As PdfDocument = PdfDocument.FromFile("wikipedia.pdf")

' Summarize the document
Console.WriteLine("Please wait while I summarize the document...")
Dim summary As String = Await pdf.Summarize() ' optionally pass AI instance or use AI instance directly
Console.WriteLine($"Document summary: {summary}" & vbLf & vbLf)
$vbLabelText   $csharpLabel

System ciągłych zapytań wykorzystuje osadzenia do zrozumienia semantyki pytań, zapewniając dokładne, kontekstowe odpowiedzi. Każde zapytanie jest przetwarzane w oparciu o treść dokumentu, a sztuczna inteligencja przechowuje historię rozmów, aby zapewnić coraz bardziej trafne odpowiedzi.

Aby uzyskać optymalną wydajność w przypadku dużych dokumentów lub wielu użytkowników jednocześnie, wdroż strategie buforowania i zapoznaj się z technikami optymalizacji wydajności IronPDF. W przypadku wdrożeń produkcyjnych należy rozważyć ograniczenie szybkości oraz odpowiednie Zarządzanie kluczami licencyjnymi.

W przypadku pracy z dokumentami wrażliwymi należy wdrożyć odpowiednie środki bezpieczeństwa. IronPDF oferuje różne opcje zabezpieczeń i szyfrowania w celu ochrony plików PDF przed i po przetworzeniu przez sztuczną inteligencję.

Często Zadawane Pytania

Jaki jest cel rozszerzenia AI dla przetwarzania PDF?

Pakiet NuGet IronPdf.Extensions.AI umożliwia wspomagana AI poprawke PDF w aplikacjach C#. Pozwala na dodanie funkcji podsumowywania, zapytan i zapamietywania do Twoich PDF przy uzyciu Microsoft Semantic Kernel z minimalnym kodem, pomagajac automatycznie wydobywac spostrzezenia i odpowiadac na pytania z dokumentow.

Jakie sa glówne przypadki zastosowan dla wspomaganego AI przetwarzania PDF?

Rozszerzenie AI IronPDF jest idealne do przetwarzania duzych ilosci dokumentow, wydobywania informacji z raportow, tworzenia podsumowan szybkiego przegladu oraz budowania inteligentnych systemow zarzadzania dokumentami. Integracja wspiera zarowno jednorazowe podsumowywanie, jak i ciagle zadawanie zapytan dla roznych aplikacji.

Jak moge szybko podsumowac PDF przy uzyciu OpenAI?

Dzieki rozszerzeniu AI IronPDF, mozesz podsumowac dowolny PDF za pomoca jednej linii kodu: await IronPdf.AI.PdfAIEngine.Summarize("input.pdf", "summary.txt", azureEndpoint, azureApiKey). To proste wdrozenie umożliwia latwe generowanie podsumowan z dokumentow PDF.

Jakie pakiety muszę zainstalować dla przetwarzania AI PDF?

Aby wdrozyc funkcje AI z IronPDF, potrzebujesz trzech pakietow: IronPdf (glowna biblioteka PDF), IronPdf.Extensions.AI (rozszerzenie AI) oraz Microsoft.SemanticKernel.Plugins.Memory (dla funkcjonalnosci semantic kernel).

Jakie sa wymagania wstepne dla uzywania OpenAI z PDFami?

Przed wdrozeniem funkcji AI z IronPDF, musisz skonfigurowac Azure OpenAI z subskrypcja Azure, która ma dostep do uslugi Azure OpenAI Service. Serwis zapewnia bezpieczenstwo i zgodnosc z klasa biznesowa dla aplikacji produkcyjnych, wymagajac punktu koncowego Azure i klucza API.

Jaki jest minimalny przebieg pracy dla przetwarzania AI PDF?

Minimalny przebieg pracy z IronPDF sklada sie z 5 krokow: 1) Pobierz biblioteke C#, 2) Przygotuj punkt koncowy Azure i klucz API, 3) Wczytaj docelowy dokument PDF, 4) Uzyj metody Summarize, aby wygenerowac podsumowanie, 5) Uzyj metody Query dla ciaglego zadawania zapytan.

Jak integruje sie rozszerzenie AI z Microsoft Semantic Kernel?

Rozszerzenie AI IronPDF jest zbudowane na Microsoft Semantic Kernel, co upraszcza integracje uslug AI w aplikacjach .NET. SDK zarzadza zlozonoscia laczenia sie z uslugami OpenAI i zapewnia prosty interfejs API dla operacji AI specyficznych dla PDF.

Curtis Chau
Autor tekstów technicznych

Curtis Chau posiada tytuł licencjata z informatyki (Uniwersytet Carleton) i specjalizuje się w front-endowym rozwoju, z ekspertką w Node.js, TypeScript, JavaScript i React. Pasjonuje się tworzeniem intuicyjnych i estetycznie przyjemnych interfejsów użytkownika, Curtis cieszy się pracą z nowoczesnymi frameworkami i tworzeniem dobrze zorganizowanych, atrakcyjnych wizualnie podrę...

Czytaj więcej
Gotowy, aby rozpocząć?
Nuget Pliki do pobrania 18,926,724 | Wersja: 2026.5 just released
Still Scrolling Icon

Wciąż przewijasz?

Czy chcesz szybko dowodu? PM > Install-Package IronPdf
Uruchom przykład i zobacz, jak Twój kod HTML zamienia się w plik PDF.