Wie man OpenAI für PDF in C#35; mit IronPDF verwendet

This article was translated from English: Does it need improvement?
Translated
View the article in English

Die KI-Erweiterung von IronPDF ermöglicht eine OpenAI-gestützte PDF-Erweiterung in C#-Anwendungen. Hinzufügen von Zusammenfassungs-, Abfrage- und Erinnerungsfunktionen mit Microsoft Semantic Kernel mit minimalem Code.

Chatgpt related to Wie man OpenAI für PDF in C#35; mit IronPDF verwendet

OpenAI ist ein KI-Forschungslabor, das fortschrittliche Technologien für künstliche Intelligenz entwickelt. Es bietet leistungsstarke Sprachmodelle, die über APIs zugänglich sind und es Entwicklern ermöglichen, KI-Funktionen in ihre Anwendungen zu integrieren.

Das IronPdf.Extensions.AI NuGet-Paket bringt OpenAI in die PDF-Verarbeitung: Zusammenfassen, Abfragen und Merken. Dieses SDK basiert auf dem Microsoft Semantic Kernel und vereinfacht die Integration von KI-Diensten in .NET-Anwendungen. Extrahieren Sie Erkenntnisse, beantworten Sie Fragen und erstellen Sie automatisch Zusammenfassungen aus PDF-Dokumenten.

Zu den wichtigsten Anwendungsfällen gehören die Verarbeitung großer Dokumentenmengen, das Extrahieren von Informationen aus Berichten, die Erstellung von Schnellüberprüfungszusammenfassungen und der Aufbau intelligenter Dokumentenmanagementsysteme. Die Integration unterstützt sowohl einmalige Zusammenfassungen als auch kontinuierliche Abfragen für verschiedene Anwendungen. Weitere PDF-Funktionen finden Sie in der Umfassenden Dokumentation von IronPDF oder in der Erstellung von PDFs aus HTML.

Kurzanleitung: PDFs mit IronPDF und OpenAI zusammenfassen

Beginnen Sie mit der Integration von OpenAI in Ihren PDF-Verarbeitungs-Workflow mit IronPDF in C#. Dieses Beispiel zeigt eine schnelle PDF-Zusammenfassung mit nur ein paar Zeilen Code.

Nuget IconLegen Sie jetzt mit NuGet los, um PDFs zu erstellen:

  1. Installieren Sie IronPDF mit dem NuGet-Paketmanager.

    PM > Install-Package IronPdf

  2. Kopieren Sie diesen Codeausschnitt und führen Sie ihn aus.

    // Install-Package IronPdf.Extensions.AI
    await IronPdf.AI.PdfAIEngine.Summarize("input.pdf", "summary.txt", azureEndpoint, azureApiKey);
  3. Bereitstellen zum Testen in Ihrer Live-Umgebung

    Beginnen Sie noch heute mit der Nutzung von IronPDF in Ihrem Projekt – mit einer kostenlosen Testversion.
    arrow pointer


Erforderliche Pakete:

Bevor Sie KI-Funktionen implementieren, richten Sie Azure OpenAI ein. Sie benötigen ein Azure-Abonnement mit Zugang zum Azure OpenAI Service. Der Dienst bietet Sicherheit und Konformität auf Unternehmensniveau für Produktionsanwendungen. Detaillierte Anweisungen finden Sie in der Installationsübersicht für IronPDF.

Wie fasse ich PDFs mit OpenAI zusammen?

Um OpenAI-Funktionen zu nutzen, konfigurieren Sie den Semantic Kernel mit Ihrem Azure-Endpunkt und API-Schlüssel. Importieren Sie das PDF-Dokument und verwenden Sie die Methode Summarize, um Zusammenfassungen zu erstellen.

Die Zusammenfassungsfunktion funktioniert mit verschiedenen PDF-Typen:

  • Gescannte Dokumente (in Kombination mit OCR)
  • Komplexe Layouts mit mehreren Spalten
  • Dokumente, die Bilder und Tabellen enthalten

IronPDF extrahiert Textinhalte und verarbeitet sie mit dem KI-Modell. Für andere Formate siehe Konvertierung von DOCX in PDF oder Konvertierung von Markdown in PDF.

[{i:( Hinweis: Es können SKEXP0001, SKEXP0010 und SKEXP0050 Fehler auftreten, da die Methoden des Semantic Kernel experimentell sind. Fügen Sie dies zu Ihrer .csproj-Datei hinzu, um sie zu unterdrücken:

<Project Sdk="Microsoft.NET.Sdk">
  <PropertyGroup>
    <NoWarn>$(NoWarn);SKEXP0001,SKEXP0010,SKEXP0050</NoWarn>
  </PropertyGroup>
</Project>
<Project Sdk="Microsoft.NET.Sdk">
  <PropertyGroup>
    <NoWarn>$(NoWarn);SKEXP0001,SKEXP0010,SKEXP0050</NoWarn>
  </PropertyGroup>
</Project>
XML

@@--KLAMMER-SCHLIESSEN--@@

Hier erfahren Sie, wie Sie eine PDF-Datei mit Semantic Kernel in C# zusammenfassen:

:path=/static-assets/pdf/content-code-examples/how-to/openai-summarize.cs
using IronPdf;
using IronPdf.AI;
using Microsoft.SemanticKernel;
using Microsoft.SemanticKernel.Connectors.OpenAI;
using Microsoft.SemanticKernel.Memory;
using System;
using System.Threading.Tasks;

// Setup OpenAI
var azureEndpoint = "<<enter your azure endpoint here>>";
var apiKey = "<<enter your azure API key here>>";
var builder = Kernel.CreateBuilder()
    .AddAzureOpenAITextEmbeddingGeneration("oaiembed", azureEndpoint, apiKey)
    .AddAzureOpenAIChatCompletion("oaichat", azureEndpoint, apiKey);
var kernel = builder.Build();

// Setup Memory
var memory_builder = new MemoryBuilder()
    // optionally use new ChromaMemoryStore("http://127.0.0.1:8000") (see https://github.com/microsoft/semantic-kernel/blob/main/dotnet/notebooks/09-memory-with-chroma.ipynb)
    .WithMemoryStore(new VolatileMemoryStore())
    .WithAzureOpenAITextEmbeddingGeneration("oaiembed", azureEndpoint, apiKey);
var memory = memory_builder.Build();

// Initialize IronAI
IronDocumentAI.Initialize(kernel, memory);

License.LicenseKey = "<<enter your IronPdf license key here";

// Import PDF document
PdfDocument pdf = PdfDocument.FromFile("wikipedia.pdf");

// Summarize the document
Console.WriteLine("Please wait while I summarize the document...");
string summary = await pdf.Summarize(); // optionally pass AI instance or use AI instance directly
Console.WriteLine($"Document summary: {summary}\n\n");
$vbLabelText   $csharpLabel

Der Code initialisiert sowohl den Semantic Kernel als auch den Memory Store. Memory-Speicher halten den Kontext bei kontinuierlichen Abfragen aufrecht. Wählen Sie aus:

  • VolatileMemoryStore: In-Memory-Speicher für Entwicklung und Tests
  • ChromaMemoryStore: Persistente Vektordatenbank für die Produktion
  • Andere Speicher: Azure Cognitive Search, Qdrant, und mehr

Für die Produktion sind eine Fehlerbehandlung und eine angepasste Protokollierung zu implementieren, um KI-Vorgänge zu verfolgen. Entdecken Sie async und multithreading für die gleichzeitige Verarbeitung mehrerer Dokumente.

Wie sieht die zusammenfassende Ausgabe aus?

Visual Studio Debug-Konsole mit PDF-Zusammenfassung der Technologie-Stacks beliebter Websites einschließlich Sprachen und Datenbanken

Die Zusammenfassung bietet einen prägnanten Überblick über das Dokument, wobei die wichtigsten Themen, wichtige Fakten und relevante Details herausgearbeitet werden. Das KI-Modell identifiziert und priorisiert wichtige Inhalte und ermöglicht so ein schnelles Verständnis von langen Dokumenten.

Wie kann ich PDFs fortlaufend abfragen?

Einzelne Abfragen sind nicht für alle Szenarien geeignet. Das IronPdf.Extensions.AI Paket bietet eine Query Methode für kontinuierliche Abfragen. Erstellen Sie Konversationsschnittstellen, Recherchetools oder Anwendungen zur Dokumentenanalyse, bei denen Benutzer mehrere Fragen zum selben Dokument stellen.

Durch kontinuierliche Abfragen wird der Kontext der Konversation aufrechterhalten, um Folgefragen und Klarstellungen zu ermöglichen. Ideal für:

  • Kundensupportsysteme, die auf die Dokumentation verweisen
  • Analyse von Rechtsdokumenten, die die Auslegung von Klauseln erfordern
  • Bildungsanwendungen für das Studium komplexer Materialien
  • Recherchetools zum Extrahieren spezifischer Informationen

Für eine bessere Verarbeitung sollten Sie in Erwägung ziehen, Text und Bilder getrennt zu extrahieren oder PDF-Kompression zu implementieren, um große Dokumente vor der KI-Verarbeitung zu optimieren.

:path=/static-assets/pdf/content-code-examples/how-to/openai-summarize.cs
using IronPdf;
using IronPdf.AI;
using Microsoft.SemanticKernel;
using Microsoft.SemanticKernel.Connectors.OpenAI;
using Microsoft.SemanticKernel.Memory;
using System;
using System.Threading.Tasks;

// Setup OpenAI
var azureEndpoint = "<<enter your azure endpoint here>>";
var apiKey = "<<enter your azure API key here>>";
var builder = Kernel.CreateBuilder()
    .AddAzureOpenAITextEmbeddingGeneration("oaiembed", azureEndpoint, apiKey)
    .AddAzureOpenAIChatCompletion("oaichat", azureEndpoint, apiKey);
var kernel = builder.Build();

// Setup Memory
var memory_builder = new MemoryBuilder()
    // optionally use new ChromaMemoryStore("http://127.0.0.1:8000") (see https://github.com/microsoft/semantic-kernel/blob/main/dotnet/notebooks/09-memory-with-chroma.ipynb)
    .WithMemoryStore(new VolatileMemoryStore())
    .WithAzureOpenAITextEmbeddingGeneration("oaiembed", azureEndpoint, apiKey);
var memory = memory_builder.Build();

// Initialize IronAI
IronDocumentAI.Initialize(kernel, memory);

License.LicenseKey = "<<enter your IronPdf license key here";

// Import PDF document
PdfDocument pdf = PdfDocument.FromFile("wikipedia.pdf");

// Summarize the document
Console.WriteLine("Please wait while I summarize the document...");
string summary = await pdf.Summarize(); // optionally pass AI instance or use AI instance directly
Console.WriteLine($"Document summary: {summary}\n\n");
$vbLabelText   $csharpLabel

Das kontinuierliche Abfragesystem verwendet Einbettungen, um die Semantik der Fragen zu verstehen und genaue, kontextbezogene Antworten zu geben. Jede Abfrage wird mit dem Inhalt des Dokuments abgeglichen, wobei die künstliche Intelligenz die Konversationshistorie für zunehmend relevante Antworten aufrechterhält.

Für eine optimale Leistung bei großen Dokumenten oder gleichzeitigen Nutzern sollten Sie Caching-Strategien implementieren und die Leistungsoptimierungstechniken von IronPDF kennenlernen. Berücksichtigen Sie eine Ratenbegrenzung und ein angemessenes Lizenzschlüsselmanagement für die Produktionsbereitstellung.

Beim Umgang mit sensiblen Dokumenten sind geeignete Sicherheitsmaßnahmen zu treffen. IronPDF bietet verschiedene Sicherheits- und Verschlüsselungsoptionen, um PDFs vor und nach der KI-Verarbeitung zu schützen.

Häufig gestellte Fragen

Was ist der Zweck der KI-Erweiterung für die PDF-Verarbeitung?

Das NuGet-Paket IronPdf.Extensions.AI ermöglicht eine OpenAI-gestützte PDF-Erweiterung in C#-Anwendungen. Mit minimalem Code können Sie Ihre PDFs mit Hilfe von Microsoft Semantic Kernel um Zusammenfassungs-, Abfrage- und Erinnerungsfunktionen erweitern, die Ihnen helfen, Erkenntnisse zu gewinnen und Fragen aus Dokumenten automatisch zu beantworten.

Was sind die wichtigsten Anwendungsfälle für KI-gestützte PDF-Verarbeitung?

Die KI-Erweiterung von IronPDF eignet sich ideal für die Verarbeitung großer Dokumentenmengen, die Extraktion von Informationen aus Berichten, die Erstellung von Schnellüberprüfungszusammenfassungen und den Aufbau intelligenter Dokumentenmanagementsysteme. Die Integration unterstützt sowohl einmalige Zusammenfassungen als auch kontinuierliche Abfragen für verschiedene Anwendungen.

Wie kann ich eine PDF-Datei mit OpenAI schnell zusammenfassen?

Mit der AI-Erweiterung von IronPDF können Sie jede PDF-Datei mit nur einer Zeile Code zusammenfassen: await IronPdf.AI.PdfAIEngine.Summarize("input.pdf", "summary.txt", azureEndpoint, azureApiKey). Diese einfache Implementierung macht es leicht, Zusammenfassungen aus PDF-Dokumenten zu erzeugen.

Welche Pakete muss ich für die AI PDF-Verarbeitung installieren?

Um AI-Funktionen mit IronPDF zu implementieren, benötigen Sie drei Pakete: IronPdf (die Haupt-PDF-Bibliothek), IronPdf.Extensions.AI (die AI-Erweiterung) und Microsoft.SemanticKernel.Plugins.Memory (für die semantische Kernel-Funktionalität).

Was sind die Voraussetzungen für die Verwendung von OpenAI mit PDFs?

Bevor Sie KI-Funktionen mit IronPDF implementieren, müssen Sie Azure OpenAI mit einem Azure-Abonnement einrichten, das Zugriff auf den Azure OpenAI Service hat. Der Dienst bietet Sicherheit und Compliance auf Unternehmensniveau für Produktionsanwendungen und erfordert einen Azure-Endpunkt und einen API-Schlüssel.

Wie sieht der minimale Arbeitsablauf für die KI-PDF-Verarbeitung aus?

Der minimale Arbeitsablauf mit IronPDF besteht aus 5 Schritten: 1) Herunterladen der C#-Bibliothek, 2) Vorbereiten des Azure-Endpunkts und des API-Schlüssels, 3) Importieren des PDF-Zieldokuments, 4) Verwenden der Summarize-Methode zur Erstellung einer Zusammenfassung und 5) Verwenden der Query-Methode zur kontinuierlichen Abfrage.

Wie lässt sich die KI-Erweiterung in den Microsoft Semantic Kernel integrieren?

Die KI-Erweiterung von IronPDF basiert auf dem Microsoft Semantic Kernel, der die Integration von KI-Diensten in .NET-Anwendungen vereinfacht. Dieses SDK bewältigt die Komplexität der Verbindung zu OpenAI-Diensten und bietet eine unkomplizierte API für PDF-spezifische KI-Operationen.

Curtis Chau
Technischer Autor

Curtis Chau hat einen Bachelor-Abschluss in Informatik von der Carleton University und ist spezialisiert auf Frontend-Entwicklung mit Expertise in Node.js, TypeScript, JavaScript und React. Leidenschaftlich widmet er sich der Erstellung intuitiver und ästhetisch ansprechender Benutzerschnittstellen und arbeitet gerne mit modernen Frameworks sowie der Erstellung gut strukturierter, optisch ansprechender ...

Weiterlesen
Bereit anzufangen?
Nuget Downloads 17,012,929 | Version: 2025.12 gerade veröffentlicht