Comment convertir un PDF en HTML en C# | IronPDF

How to Convert PDF to HTML

This article was translated from English: Does it need improvement?
Translated
View the article in English

La conversion de PDF en HTML offre divers avantages, notamment une meilleure accessibilité web pour les utilisateurs, une réactivité pour différents appareils, une optimisation améliorée pour les moteurs de recherche (SEO), une intégration web transparente, une édition de contenu facile via des outils et CMS basés sur le web, une compatibilité multiplateforme, et la possibilité d'utiliser des éléments dynamiques et du multimédia.

IronPDF simplifie le processus de conversion de PDF en HTML en .NET C#.

comme-titre:2(Démarrage rapide : Convertir instantanément un PDF en HTML avec IronPDF)

Transformez vos documents PDF en fichiers HTML adaptés au web avec une seule ligne de code en utilisant IronPDF. Cet exemple démontre la simplicité d'utilisation de la méthode SaveAsHtml d'IronPDF pour obtenir une conversion PDF à HTML rapide et efficace, parfaite pour améliorer l'accessibilité et le SEO. Avec IronPDF, vous pouvez facilement exporter vos PDFs en HTML dans le cadre .NET C#, permettant une intégration transparente dans vos applications web.

Nuget IconGet started making PDFs with NuGet now:

  1. Install IronPDF with NuGet Package Manager

    PM > Install-Package IronPdf

  2. Copy and run this code snippet.

    IronPdf.PdfDocument.FromFile("example.pdf").SaveAsHtml("output.html");
  3. Deploy to test on your live environment

    Start using IronPDF in your project today with a free trial
    arrow pointer
class="hsg-featured-snippet">

Flux de travail minimal (5 étapes)

  1. Téléchargez la bibliothèque IronPdf pour .NET
  2. Importez un document PDF existant en utilisant la méthode FromFile
  3. Configurez la sortie HTML en utilisant la classe HtmlFormatOptions
  4. Convertissez le PDF en une chaîne HTML en utilisant la méthode ToHtmlString
  5. Exportez le fichier HTML en utilisant la méthode SaveAsHtml


Exemple de PDF en HTML

La méthode ToHtmlString est principalement conçue pour permettre aux utilisateurs d'analyser les éléments HTML dans un document PDF existant. Elle sert d'outil utile pour le débogage ou pour des comparaisons de PDF. En plus de convertir un document PDF en une chaîne HTML, nous offrons une méthode directe pour que les utilisateurs enregistrent un document PDF en tant que fichier HTML en utilisant la méthode SaveAsHtml. Cela offre une flexibilité pour que les utilisateurs choisissent l'approche la plus adaptée à leurs besoins spécifiques.

Veuillez noterRemarque : Tous les champs de formulaire interactifs dans le PDF original ne seront plus fonctionnels dans le document HTML résultant.

Exemple de fichier PDF

:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html.cs
using IronPdf;
using System;

PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);

// Convert PDF to HTML file
pdf.SaveAsHtml("myHtml.html");
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

HTML de sortie

L'ensemble du HTML de sortie généré à partir de la méthode SaveAsHtml a été saisi sur le site ci-dessous.


Exemple avancé de PDF en HTML

Les méthodes ToHtmlString et SaveAsHtml offrent plusieurs options de configuration. Ci-dessous les propriétés disponibles :

  • BackgroundColor : Spécifie la couleur de fond.
  • PdfPageMargin : Spécifie la marge de la page.

De plus, les propriétés ci-dessous sont destinées au paramètre 'title' dans les méthodes ToHtmlString et SaveAsHtml. Cela ajoutera un nouveau titre au début du contenu. Elles ne modifieront pas le titre ou h1 du document PDF d'entrée.

  • H1Color : Spécifie la couleur du titre.
  • H1FontSize : Spécifie la taille de la police du titre.
  • H1TextAlignment : Spécifie l'alignement du titre, comme gauche, centre ou droite.
:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html-advanced-settings.cs
using IronPdf;
using IronSoftware.Drawing;
using System;

PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// PDF to HTML configuration options
HtmlFormatOptions htmlformat = new HtmlFormatOptions();
htmlformat.BackgroundColor = Color.White;
htmlformat.PdfPageMargin = 10;
htmlformat.H1Color = Color.Blue;
htmlformat.H1FontSize = 25;
htmlformat.H1TextAlignment = TextAlignment.Center;

// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);

// Convert PDF to HTML file
pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);
IRON VB CONVERTER ERROR developers@ironsoftware.com
$vbLabelText   $csharpLabel

HTML de sortie

L'ensemble du HTML de sortie généré à partir de la méthode SaveAsHtml a été saisi sur le site ci-dessous.

Ces méthodes produiront une chaîne HTML avec CSS en ligne. Le HTML de sortie utilise des termes/étiquettes SVG à la place des étiquettes HTML habituelles. Malgré cette différence, c'est une chaîne HTML valide et peut être rendue de la même manière dans un navigateur web. Cependant, il est important que les utilisateurs soient conscients que la chaîne HTML retournée par cette méthode peut différer de l'entrée HTML lors de l'utilisation d'un document PDF qui a été rendu en utilisant la méthode RenderHtmlAsPdf, pour les raisons mentionnées ci-dessus.

Questions Fréquemment Posées

Quels sont les avantages de la conversion de documents PDF en HTML ?

La conversion de documents PDF en HTML à l'aide d'IronPDF permet une meilleure accessibilité web, une réactivité des dispositifs, un SEO amélioré, une intégration transparente avec les plateformes web, une édition facile du contenu, une compatibilité multiplateforme, et la possibilité d'incorporer des éléments dynamiques et des multimédias.

Comment puis-je convertir un document PDF en un fichier HTML en .NET C# ?

Vous pouvez convertir un document PDF en un fichier HTML en .NET C# en utilisant IronPDF en employant la méthode FromFile pour charger le PDF et la méthode SaveAsHtml pour l'enregistrer en tant que fichier HTML.

Quel est l'objectif de la méthode ToHtmlString dans IronPDF ?

La méthode ToHtmlString dans IronPDF est utilisée pour convertir un document PDF en une chaîne HTML, ce qui est utile pour analyser les éléments HTML, déboguer ou comparer des PDF.

Les champs de formulaire interactifs dans les PDF peuvent-ils être préservés lors de la conversion en HTML ?

Non, les champs de formulaire interactifs du PDF original ne seront pas fonctionnels dans le document HTML résultant lors de l'utilisation d'IronPDF.

Quelles sont les options de personnalisation disponibles lors de la conversion de PDF en HTML ?

IronPDF fournit des options de personnalisation pour la sortie HTML, y compris BackgroundColor, PdfPageMargin, H1Color, H1FontSize, et H1TextAlignment pour adapter l'apparence du HTML.

La sortie HTML d'IronPDF utilise-t-elle des balises HTML standard ?

La sortie HTML d'IronPDF utilise des termes/balises SVG au lieu des balises HTML standard, mais cela reste une chaîne HTML valide et visualisable dans les navigateurs web.

Où puis-je télécharger IronPDF pour .NET ?

Vous pouvez télécharger IronPDF pour .NET à partir du gestionnaire de paquets NuGet à l'adresse https://www.nuget.org/packages/IronPdf/.

Comment puis-je commencer avec la conversion de PDF en HTML en utilisant IronPDF ?

Pour commencer à convertir des PDF en HTML à l'aide d'IronPDF, téléchargez la bibliothèque, importez le PDF avec FromFile, configurez la sortie avec HtmlFormatOptions, convertissez en une chaîne HTML avec ToHtmlString, et exportez en utilisant SaveAsHtml.

Quel est le rôle du paramètre de titre dans la conversion HTML ?

Le paramètre de titre dans les méthodes ToHtmlString et SaveAsHtml vous permet d'ajouter un nouveau titre au début du contenu HTML sans modifier le titre original du PDF ou des éléments h1.

Comment la sortie HTML diffère-t-elle de l'entrée HTML dans IronPDF ?

Lors de l'utilisation d'IronPDF, la chaîne HTML retournée peut différer de l'entrée HTML initiale en raison de variations dans le rendu, surtout lors de l'utilisation de la méthode RenderHtmlAsPdf.

La conversion de PDF en HTML est-elle prise en charge dans .NET 10 avec IronPDF, et y a-t-il des points particuliers à prendre en compte ?

Oui, IronPDF prend en charge .NET 10 et la future version .NET 10 prévue pour 2025 pour la conversion de PDF en HTML, tout en conservant la compatibilité avec ses méthodes telles que FromFile , ToHtmlString et SaveAsHtml . Il est recommandé aux utilisateurs de mettre à jour IronPDF vers la dernière version afin de bénéficier de toutes les améliorations de performances et de compatibilité.

Regan Pun
Ingénieur logiciel
Regan a obtenu son diplôme de l'Université de Reading, avec une licence en ingénierie électronique. Avant de rejoindre Iron Software, ses rôles précédents le poussaient à se concentrer intensément sur des tâches uniques ; et ce qu'il apprécie le plus chez Iron Software, c'est ...
Lire la suite
Revu par
Jeff Fritz
Jeffrey T. Fritz
Responsable principal du programme - Équipe de la communauté .NET
Jeff est également responsable principal du programme pour les équipes .NET et Visual Studio. Il est le producteur exécutif de la série de conférences virtuelles .NET Conf et anime 'Fritz and Friends', une diffusion en direct pour développeurs qui est diffusée deux fois par semaine où il parle de technologie et écrit du code avec les téléspectateurs. Jeff écrit des ateliers, des présentations et prévoit du contenu pour les plus grands événements de développement Microsoft, y compris Microsoft Build, Microsoft Ignite, .NET Conf et le sommet Microsoft MVP
Prêt à commencer?
Nuget Téléchargements 16,154,058 | Version : 2025.11 vient de sortir