如何在 C# 中使用IronPDF和 OpenAI 處理 PDF

This article was translated from English: Does it need improvement?
Translated
View the article in English

IronPDF 的 AI 擴充功能可在 C# 應用程式中實現基於 OpenAI 的 PDF 增強功能。 使用 Microsoft Semantic Kernel,以最少的程式碼新增摘要、查詢和記憶功能。

Chatgpt related to 如何在 C# 中使用IronPDF和 OpenAI 處理 PDF

OpenAI是一家人工智慧研究實驗室,致力於開發先進的人工智慧技術。 它提供可透過 API 存取的強大語言模型,使開發人員能夠將 AI 功能整合到他們的應用程式中。

IronPdf.Extensions.AI NuGet套件將 OpenAI 引入 PDF 處理:摘要、查詢和記憶。 該 SDK 基於 Microsoft Semantic Kernel構建,簡化了.NET應用程式中 AI 服務的整合。 自動從 PDF 文件中提取資訊、回答問題並產生摘要。

主要應用情境包括處理大量文件、從報告中提取資訊、建立快速審閱摘要以及建立智慧型文件管理系統。 此整合支援一次性摘要和連續查詢,適用於各種應用場景。 如需了解更多 PDF 功能,請瀏覽IronPDF 的綜合文件或了解如何從 HTML 建立 PDF

快速入門:使用IronPDF和 OpenAI 產生 PDF 摘要

使用IronPDF (C#)開始將 OpenAI 整合到您的 PDF 處理工作流程中。 此範例示範如何僅用幾行程式碼快速產生 PDF 摘要。

  1. 使用NuGet套件管理器安裝https://www.nuget.org/packages/IronPdf

    PM > Install-Package IronPdf
  2. 複製並運行這段程式碼。

    // Install-Package IronPdf.Extensions.AI
    await IronPdf.AI.PdfAIEngine.Summarize("input.pdf", "summary.txt", azureEndpoint, azureApiKey);
  3. 部署到您的生產環境進行測試

    今天就在您的專案中開始使用免費試用IronPDF

    arrow pointer


所需軟體包:

在實作 AI 功能之前,請先設定 Azure OpenAI。 您需要擁有 Azure OpenAI 服務存取權限的 Azure 訂閱。 該服務為生產應用程式提供企業級安全性和合規性。 請參閱IronPDF安裝概述以取得詳細說明。

如何使用 OpenAI 產生 PDF 摘要?

若要使用 OpenAI 功能,請使用您的 Azure 終端和 API 金鑰來設定語意核心。 匯入 PDF 文件並使用 Summarize 方法產生摘要。

摘要功能適用於多種 PDF 類型:

  • 掃描文件(與OCR結合使用時)
  • 具有多列的複雜佈局 包含圖像和表格的文檔

IronPDF擷取文字內容並透過人工智慧模型進行處理。 對於不同的格式,請參閱將 DOCX 轉換為 PDF將 Markdown 轉換為 PDF

請注意
注意:由於語意核方法尚處於實驗階段,您可能會遇到 SKEXP0010SKEXP0050 錯誤。 將以下內容新增至您的 .csproj 檔案中即可抑制它們:

<Project Sdk="Microsoft.NET.Sdk">
  <PropertyGroup>
    <NoWarn>$(NoWarn);SKEXP0001,SKEXP0010,SKEXP0050</NoWarn>
  </PropertyGroup>
</Project>
<Project Sdk="Microsoft.NET.Sdk">
  <PropertyGroup>
    <NoWarn>$(NoWarn);SKEXP0001,SKEXP0010,SKEXP0050</NoWarn>
  </PropertyGroup>
</Project>
XML

以下是如何使用 C# 中的語意內核對 PDF 進行摘要:

:path=/static-assets/pdf/content-code-examples/how-to/openai-summarize.cs
using IronPdf;
using IronPdf.AI;
using Microsoft.SemanticKernel;
using Microsoft.SemanticKernel.Connectors.OpenAI;
using Microsoft.SemanticKernel.Memory;
using System;
using System.Threading.Tasks;

// Setup OpenAI
var azureEndpoint = "<<enter your azure endpoint here>>";
var apiKey = "<<enter your azure API key here>>";
var builder = Kernel.CreateBuilder()
    .AddAzureOpenAITextEmbeddingGeneration("oaiembed", azureEndpoint, apiKey)
    .AddAzureOpenAIChatCompletion("oaichat", azureEndpoint, apiKey);
var kernel = builder.Build();

// Setup Memory
var memory_builder = new MemoryBuilder()
    // optionally use new ChromaMemoryStore("http://127.0.0.1:8000") (see https://github.com/microsoft/semantic-kernel/blob/main/dotnet/notebooks/09-memory-with-chroma.ipynb)
    .WithMemoryStore(new VolatileMemoryStore())
    .WithAzureOpenAITextEmbeddingGeneration("oaiembed", azureEndpoint, apiKey);
var memory = memory_builder.Build();

// Initialize IronAI
IronDocumentAI.Initialize(kernel, memory);

License.LicenseKey = "<<enter your IronPdf license key here";

// Import PDF document
PdfDocument pdf = PdfDocument.FromFile("wikipedia.pdf");

// Summarize the document
Console.WriteLine("Please wait while I summarize the document...");
string summary = await pdf.Summarize(); // optionally pass AI instance or use AI instance directly
Console.WriteLine($"Document summary: {summary}\n\n");
$vbLabelText   $csharpLabel

該程式碼初始化語義核心和記憶體儲存。 記憶體儲存會在連續查詢期間維護上下文。 請從以下選項中選擇:

-易失性記憶體:用於開發和測試的記憶體存儲

  • ChromaMemoryStore :用於生產的持久化向量資料庫 其他商店:Azure 認知搜尋、Qdrant 等

在生產環境中,實作錯誤處理和自訂日誌記錄,以追蹤 AI 操作。 探索非同步和多線程技術,以實現多個文件的同時處理。

摘要輸出是什麼樣的?

Visual Studio 偵錯控制台顯示常用網站技術堆疊(包括程式語言和資料庫)的 PDF 摘要

摘要提供了一份簡明扼要的文件概述,提取了主要主題、重要事實和相關細節。 此人工智慧模型能夠識別重要內容並確定其優先級,從而快速理解冗長的文件。

如何連續查詢PDF文件?

單一查詢並不適用於所有場景。 IronPdf.Extensions.AI套件提供了一個 Query 方法用於連續查詢。 建立對話式介面、研究工具或文件分析應用程序,使用者可以就同一文件提出多個問題。

持續提問可以保持對話上下文,允許後續提問和澄清。 適用於:

  • 客戶支援系統參考文檔
  • 需要解釋條款的法律文件分析
  • 用於研究複雜材料的教育應用
  • 用於提取特定資訊的研究工具

為了提高處理效率,可以考慮分別提取文字和圖像,或實施PDF 壓縮來優化大型文檔,然後再進行 AI 處理。

:path=/static-assets/pdf/content-code-examples/how-to/openai-summarize.cs
using IronPdf;
using IronPdf.AI;
using Microsoft.SemanticKernel;
using Microsoft.SemanticKernel.Connectors.OpenAI;
using Microsoft.SemanticKernel.Memory;
using System;
using System.Threading.Tasks;

// Setup OpenAI
var azureEndpoint = "<<enter your azure endpoint here>>";
var apiKey = "<<enter your azure API key here>>";
var builder = Kernel.CreateBuilder()
    .AddAzureOpenAITextEmbeddingGeneration("oaiembed", azureEndpoint, apiKey)
    .AddAzureOpenAIChatCompletion("oaichat", azureEndpoint, apiKey);
var kernel = builder.Build();

// Setup Memory
var memory_builder = new MemoryBuilder()
    // optionally use new ChromaMemoryStore("http://127.0.0.1:8000") (see https://github.com/microsoft/semantic-kernel/blob/main/dotnet/notebooks/09-memory-with-chroma.ipynb)
    .WithMemoryStore(new VolatileMemoryStore())
    .WithAzureOpenAITextEmbeddingGeneration("oaiembed", azureEndpoint, apiKey);
var memory = memory_builder.Build();

// Initialize IronAI
IronDocumentAI.Initialize(kernel, memory);

License.LicenseKey = "<<enter your IronPdf license key here";

// Import PDF document
PdfDocument pdf = PdfDocument.FromFile("wikipedia.pdf");

// Summarize the document
Console.WriteLine("Please wait while I summarize the document...");
string summary = await pdf.Summarize(); // optionally pass AI instance or use AI instance directly
Console.WriteLine($"Document summary: {summary}\n\n");
$vbLabelText   $csharpLabel

連續查詢系統利用嵌入來理解問題的語義,從而提供準確的、上下文相關的回應。 每個查詢都針對文件內容進行處理,人工智慧會維護對話歷史記錄,以便提供越來越相關的答案。

為了在處理大型文件或多用戶並發時獲得最佳效能,請實施快取策略並探索IronPDF 的效能最佳化技術。 對於生產環境部署,請考慮限速和妥善管理許可證金鑰

處理敏感文件時,應採取適當的安全措施。 IronPDF提供多種安全和加密選項,可在 AI 處理前後保護 PDF 文件。

常見問題解答

AI 擴展用於 PDF 處理的目的是什麼?

IronPdf.Extensions.AI NuGet 套件可在 C# 應用程式中實現 OpenAI 驅動的 PDF 增強功能。它可讓您以最少的程式碼,使用 Microsoft Semantic Kernel 將摘要、查詢和記憶功能新增至 PDF,協助自動從文件中萃取洞察力並回答問題。

人工智能驅動的 PDF 處理有哪些主要用例?

IronPDF 的 AI 擴展功能非常適合處理大量文件、從報告中擷取資訊、建立快速檢閱摘要,以及建立智慧型文件管理系統。整合後可支援各種應用程式的一次性摘要與連續查詢。

如何使用 OpenAI 快速概括 PDF?

使用 IronPDF 的 AI 延伸功能,您只需一行程式碼即可總結任何 PDF:await IronPdf.AI.PdfAIEngine.Summarize("input.pdf", "summary.txt", azureEndpoint, azureApiKey)。這個簡單的實作讓您可以輕鬆地從 PDF 文件產生摘要。

AI PDF 處理需要安裝哪些套件?

要使用 IronPDF 實現 AI 功能,您需要三個套件:IronPDF(PDF 主庫)、IronPdf.Extensions.AI(AI 擴充)和 Microsoft.SemanticKernel.Plugins.Memory(用於語義核心功能)。

使用 PDF 的 OpenAI 有哪些先決條件?

在使用 IronPDF 實作 AI 功能之前,您需要使用具有 Azure OpenAI 服務存取權限的 Azure 訂閱設定 Azure OpenAI。該服務為生產應用程式提供企業級的安全性與合規性,需要 Azure 端點與 API 金鑰。

AI PDF 處理的最小工作流程是什麼?

IronPDF 的最小工作流程包括 5 個步驟:1) 下載 C# 函式庫;2) 準備 Azure Endpoint 和 API Key;3) 匯入目標 PDF 文件;4) 使用 Summarize 方法產生摘要;5) 使用 Query 方法進行連續查詢。

AI 延伸如何與 Microsoft Semantic Kernel 整合?

IronPDF for .NET 的 AI 延伸功能建構於 Microsoft Semantic Kernel,可簡化 .NET 應用程式中的 AI 服務整合。此 SDK 可處理連線至 OpenAI 服務的複雜性,並為 PDF 特定的 AI 作業提供直接的 API。

Curtis Chau
技術作家

Curtis Chau 擁有卡爾頓大學計算機科學學士學位,專注於前端開發,擅長於 Node.js、TypeScript、JavaScript 和 React。Curtis 熱衷於創建直觀且美觀的用戶界面,喜歡使用現代框架並打造結構良好、視覺吸引人的手冊。

除了開發之外,Curtis 對物聯網 (IoT) 有著濃厚的興趣,探索將硬體和軟體結合的創新方式。在閒暇時間,他喜愛遊戲並構建 Discord 機器人,結合科技與創意的樂趣。

準備好開始了嗎?
Nuget 下載 17,803,474 | 版本: 2026.3 剛剛發布
Still Scrolling Icon

還在滾動嗎?

想快速取得證據? PM > Install-Package IronPdf
運行範例看著你的HTML程式碼變成PDF檔。