Comment utiliser OpenAI pour les PDF en C# ; avec IronPDF

This article was translated from English: Does it need improvement?
Translated
View the article in English

L'extension AI d'IronPDF permet d'améliorer les PDF à l'aide de l'OpenAI dans les applications C#. Ajouter des fonctions de résumé, d'interrogation et de mémorisation à l'aide de Microsoft Semantic Kernel avec un minimum de code.

Chatgpt related to Comment utiliser OpenAI pour les PDF en C# ; avec IronPDF

<TODO : Ajouter une image ici -->

OpenAI est un laboratoire de recherche en IA qui développe des technologies avancées d'intelligence artificielle. Il fournit de puissants modèles de langage accessibles par le biais d'API, permettant aux développeurs d'intégrer des capacités d'IA dans leurs applications.

Le IronPdf.Extensions.AI package NuGet apporte OpenAI au traitement des PDF : résumé, interrogation et mémorisation. Basé sur le Microsoft Semantic Kernel, ce SDK simplifie l'intégration des services d'intelligence artificielle dans les applications .NET. Extrayez des informations, répondez à des questions et générez automatiquement des résumés à partir de documents PDF.

Les principaux cas d'utilisation comprennent le traitement de gros volumes de documents, l'extraction d'informations à partir de rapports, la création de résumés d'examen rapide et la construction de systèmes intelligents de gestion de documents. L'intégration prend en charge à la fois le résumé ponctuel et l'interrogation continue pour diverses applications. Pour plus de fonctionnalités PDF, explorez la documentation complète d'IronPdf ou découvrez la création de PDF à partir de HTML.

Démarrage rapide : Résumer des PDF avec IronPDF et OpenAI

Commencez à intégrer OpenAI dans votre flux de travail de traitement des PDF avec IronPDF en C#. Cet exemple montre un résumé rapide d'un PDF avec seulement quelques lignes de code.

Nuget IconCommencez dès maintenant à créer des PDF avec NuGet :

  1. Installez IronPDF avec le gestionnaire de packages NuGet

    PM > Install-Package IronPdf

  2. Copiez et exécutez cet extrait de code.

    // Install-Package IronPdf.Extensions.AI
    await IronPdf.AI.PdfAIEngine.Summarize("input.pdf", "summary.txt", azureEndpoint, azureApiKey);
  3. Déployez pour tester sur votre environnement de production.

    Commencez à utiliser IronPDF dans votre projet dès aujourd'hui grâce à un essai gratuit.
    arrow pointer


Paquets requis :

Avant de mettre en œuvre des fonctionnalités d'IA, configurez Azure OpenAI. Vous avez besoin d'un abonnement Azure avec accès à Azure OpenAI Service. Le service offre une sécurité et une conformité de niveau entreprise pour les applications de production. Voir la vue d'ensemble de l'installation d'IronPDF pour des instructions détaillées.

Comment résumer des PDF avec OpenAI?

<TODO : Ajouter une image ici -->

Pour utiliser les fonctionnalités d'OpenAI, configurez le Semantic Kernel avec votre point de terminaison Azure et votre clé API. Importez le document PDF et utilisez la méthode Summarize pour générer des résumés.

La fonction de résumé fonctionne avec différents types de PDF :

  • Documents numérisés (en combinaison avec l'OCR)
  • Mises en page complexes avec plusieurs colonnes
  • Documents contenant des images et des tableaux

IronPDF extrait le contenu textuel et le traite par le biais du modèle d'IA. Pour les différents formats, voir conversion de DOCX en PDF ou conversion de Markdown en PDF.

[{i:( Note : Vous pouvez rencontrer des erreurs SKEXP0001, SKEXP0010, et SKEXP0050 parce que les méthodes du Semantic Kernel sont expérimentales. Ajoutez ceci à votre fichier .csproj pour les supprimer :

<Project Sdk="Microsoft.NET.Sdk">
  <PropertyGroup>
    <NoWarn>$(NoWarn);SKEXP0001,SKEXP0010,SKEXP0050</NoWarn>
  </PropertyGroup>
</Project>
<Project Sdk="Microsoft.NET.Sdk">
  <PropertyGroup>
    <NoWarn>$(NoWarn);SKEXP0001,SKEXP0010,SKEXP0050</NoWarn>
  </PropertyGroup>
</Project>
XML

@@--BRACKET-FERMETURE--@@

Voici comment résumer un PDF à l'aide de Semantic Kernel en C# :

:path=/static-assets/pdf/content-code-examples/how-to/openai-summarize.cs
using IronPdf;
using IronPdf.AI;
using Microsoft.SemanticKernel;
using Microsoft.SemanticKernel.Connectors.OpenAI;
using Microsoft.SemanticKernel.Memory;
using System;
using System.Threading.Tasks;

// Setup OpenAI
var azureEndpoint = "<<enter your azure endpoint here>>";
var apiKey = "<<enter your azure API key here>>";
var builder = Kernel.CreateBuilder()
    .AddAzureOpenAITextEmbeddingGeneration("oaiembed", azureEndpoint, apiKey)
    .AddAzureOpenAIChatCompletion("oaichat", azureEndpoint, apiKey);
var kernel = builder.Build();

// Setup Memory
var memory_builder = new MemoryBuilder()
    // optionally use new ChromaMemoryStore("http://127.0.0.1:8000") (see https://github.com/microsoft/semantic-kernel/blob/main/dotnet/notebooks/09-memory-with-chroma.ipynb)
    .WithMemoryStore(new VolatileMemoryStore())
    .WithAzureOpenAITextEmbeddingGeneration("oaiembed", azureEndpoint, apiKey);
var memory = memory_builder.Build();

// Initialize IronAI
IronDocumentAI.Initialize(kernel, memory);

License.LicenseKey = "<<enter your IronPdf license key here";

// Import PDF document
PdfDocument pdf = PdfDocument.FromFile("wikipedia.pdf");

// Summarize the document
Console.WriteLine("Please wait while I summarize the document...");
string summary = await pdf.Summarize(); // optionally pass AI instance or use AI instance directly
Console.WriteLine($"Document summary: {summary}\n\n");
$vbLabelText   $csharpLabel

Le code initialise à la fois le noyau sémantique et la mémoire. Les mémoires conservent le contexte pendant les requêtes continues. Choisissez parmi :

  • VolatileMemoryStore : stockage en mémoire pour le développement et les tests
  • ChromaMemoryStore : Base de données vectorielles persistantes pour la production
  • Autres magasins : Azure Cognitive Search, Qdrant, et plus encore

Pour la production, mettez en œuvre la gestion des erreurs et la journalisation personnalisée pour suivre les opérations de l'IA. Explorez async et le multithreading pour traiter plusieurs documents simultanément.

À quoi ressemble le résumé de la traduction?

Console de débogage Visual Studio affichant un résumé PDF des piles technologiques de sites web populaires, y compris les langages et les bases de données

Le résumé fournit une vue d'ensemble concise du document, en extrayant les sujets principaux, les faits importants et les détails pertinents. Le modèle d'IA identifie et hiérarchise les contenus importants, ce qui permet une compréhension rapide des longs documents.

Comment interroger les PDF en continu?

Les requêtes uniques ne conviennent pas à tous les scénarios. Le paquet IronPdf.Extensions.AI offre une méthode Query pour les requêtes continues. Créer des interfaces conversationnelles, des outils de recherche ou des applications d'analyse de documents où les utilisateurs posent plusieurs questions sur le même document.

L'interrogation continue maintient le contexte de la conversation, ce qui permet de poser des questions de suivi et d'obtenir des éclaircissements. Idéal pour :

  • Systèmes d'assistance à la clientèle faisant référence à la documentation
  • Analyse de documents juridiques nécessitant l'interprétation de clauses
  • Applications pédagogiques pour l'étude de matériaux complexes
  • Outils de recherche permettant d'extraire des informations spécifiques

Pour un traitement amélioré, envisagez d'extraire le texte et les images séparément ou de mettre en œuvre la compression IronPdf pour optimiser les documents volumineux avant le traitement IronPDF.

:path=/static-assets/pdf/content-code-examples/how-to/openai-summarize.cs
using IronPdf;
using IronPdf.AI;
using Microsoft.SemanticKernel;
using Microsoft.SemanticKernel.Connectors.OpenAI;
using Microsoft.SemanticKernel.Memory;
using System;
using System.Threading.Tasks;

// Setup OpenAI
var azureEndpoint = "<<enter your azure endpoint here>>";
var apiKey = "<<enter your azure API key here>>";
var builder = Kernel.CreateBuilder()
    .AddAzureOpenAITextEmbeddingGeneration("oaiembed", azureEndpoint, apiKey)
    .AddAzureOpenAIChatCompletion("oaichat", azureEndpoint, apiKey);
var kernel = builder.Build();

// Setup Memory
var memory_builder = new MemoryBuilder()
    // optionally use new ChromaMemoryStore("http://127.0.0.1:8000") (see https://github.com/microsoft/semantic-kernel/blob/main/dotnet/notebooks/09-memory-with-chroma.ipynb)
    .WithMemoryStore(new VolatileMemoryStore())
    .WithAzureOpenAITextEmbeddingGeneration("oaiembed", azureEndpoint, apiKey);
var memory = memory_builder.Build();

// Initialize IronAI
IronDocumentAI.Initialize(kernel, memory);

License.LicenseKey = "<<enter your IronPdf license key here";

// Import PDF document
PdfDocument pdf = PdfDocument.FromFile("wikipedia.pdf");

// Summarize the document
Console.WriteLine("Please wait while I summarize the document...");
string summary = await pdf.Summarize(); // optionally pass AI instance or use AI instance directly
Console.WriteLine($"Document summary: {summary}\n\n");
$vbLabelText   $csharpLabel

Le système d'interrogation en continu utilise des enchâssements pour comprendre la sémantique des questions, ce qui permet de fournir des réponses précises et contextuelles. Chaque requête est traitée en fonction du contenu du document, l'IA conservant l'historique des conversations pour des réponses de plus en plus pertinentes.

Pour des performances optimales avec des documents volumineux ou des utilisateurs simultanés, mettez en œuvre des stratégies de mise en cache et explorez les techniques d'optimisation des performances d'IronPDF. Pensez à limiter le débit et à bien gérer les clés de licence pour les déploiements en production.

Lorsque vous manipulez des documents sensibles, mettez en œuvre des mesures de sécurité appropriées. IronPDF propose diverses options de sécurité et de cryptage pour protéger les PDF avant et après le traitement AI.

Questions Fréquemment Posées

À quoi sert l'extension AI pour le traitement des PDF ?

Le package NuGet IronPdf.Extensions.AI permet d'améliorer les PDF grâce à l'IA dans les applications C#. Il vous permet d'ajouter des fonctions de résumé, d'interrogation et de mémorisation à vos PDF à l'aide de Microsoft Semantic Kernel avec un minimum de code, ce qui permet d'extraire des informations et de répondre à des questions à partir de documents de manière automatique.

Quels sont les principaux cas d'utilisation du traitement des PDF par l'IA ?

L'extension AI d'IronPDF est idéale pour traiter de gros volumes de documents, extraire des informations de rapports, créer des résumés à examen rapide et construire des systèmes de gestion documentaire intelligents. L'intégration prend en charge à la fois le résumé ponctuel et l'interrogation continue pour diverses applications.

Comment puis-je résumer rapidement un PDF à l'aide d'OpenAI ?

Grâce à l'extension AI d'IronPDF, vous pouvez résumer n'importe quel PDF en une seule ligne de code : await IronPdf.AI.PdfAIEngine.Summarize("input.pdf", "summary.txt", azureEndpoint, azureApiKey). Cette implémentation simple permet de générer facilement des résumés à partir de documents PDF.

Quels paquets dois-je installer pour le traitement AI PDF ?

Pour mettre en œuvre les fonctionnalités d'IA avec IronPDF, vous avez besoin de trois packages : IronPdf (la bibliothèque PDF principale), IronPdf.Extensions.AI (l'extension AI), et Microsoft.SemanticKernel.Plugins.Memory (pour les fonctionnalités du noyau sémantique).

Quelles sont les conditions préalables à l'utilisation d'OpenAI avec les PDF ?

Avant de mettre en œuvre des fonctionnalités d'IA avec IronPDF, vous devez configurer Azure OpenAI avec un abonnement Azure qui dispose d'un accès au service Azure OpenAI. Ce service offre une sécurité et une conformité de niveau entreprise pour les applications de production, et nécessite un point de terminaison Azure et une clé API.

Quel est le flux de travail minimal pour le traitement AI PDF ?

Le flux de travail minimal avec IronPDF se compose de 5 étapes : 1) Télécharger la bibliothèque C#, 2) Préparer le point de terminaison Azure et la clé API, 3) Importer le document PDF cible, 4) Utiliser la méthode Summarize pour générer un résumé, et 5) Utiliser la méthode Query pour une interrogation en continu.

Comment l'extension AI s'intègre-t-elle à Microsoft Semantic Kernel ?

L'extension AI d'IronPDF s'appuie sur le Semantic Kernel de Microsoft, qui simplifie l'intégration des services d'IA dans les applications .NET. Ce SDK gère la complexité de la connexion aux services OpenAI et fournit une API directe pour les opérations d'IA spécifiques au PDF.

Curtis Chau
Rédacteur technique

Curtis Chau détient un baccalauréat en informatique (Université de Carleton) et se spécialise dans le développement front-end avec expertise en Node.js, TypeScript, JavaScript et React. Passionné par la création d'interfaces utilisateur intuitives et esthétiquement plaisantes, Curtis aime travailler avec des frameworks modernes ...

Lire la suite
Prêt à commencer?
Nuget Téléchargements 17,012,929 | Version : 2025.12 vient de sortir