Comment convertir un PDF en HTML

This article was translated from English: Does it need improvement?
Translated
View the article in English

par Hairil Hasyimi Bin Omar

La conversion de PDF en HTML offre de nombreux avantages, notamment une meilleure accessibilité au web pour les utilisateurs, une meilleure réactivité pour les différents appareils, une meilleure optimisation pour les moteurs de recherche(RÉFÉRENCEMENT)l'intégration web transparente, la facilité d'édition du contenu grâce aux outils web et aux CMS, la compatibilité multiplateforme et la possibilité d'utiliser des éléments dynamiques et multimédias.

IronPDF simplifie le processus de conversion de PDF en HTML en .NET C#.

Commencez avec IronPDF

Commencez à utiliser IronPDF dans votre projet dès aujourd'hui avec un essai gratuit.

Première étape :
green arrow pointer



Exemple de conversion de PDF en HTML

La méthode ToHtmlString est principalement conçue pour permettre aux utilisateurs d'analyser les éléments HTML dans un document PDF existant. Il s'agit d'un outil utile pour le débogage ou la comparaison des PDF. Outre la conversion d'un document PDF en chaîne HTML, nous proposons une méthode directe permettant aux utilisateurs d'enregistrer un document PDF en tant que fichier HTML à l'aide de la méthode SaveAsHtml. Cela permet aux utilisateurs de choisir l'approche la plus appropriée en fonction de leurs besoins spécifiques.

A noter
Tous les champs de formulaire interactifs du PDF original ne seront plus fonctionnels dans le document HTML résultant.

Exemple de fichier PDF

:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html.cs
using IronPdf;
using System;

PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);

// Convert PDF to HTML file
pdf.SaveAsHtml("myHtml.html");
IRON VB CONVERTER ERROR developers@ironsoftware.com
VB   C#

Sortie HTML

L'ensemble du code HTML généré par la méthode SaveAsHtml a été saisi dans le site web ci-dessous.


Exemple avancé de conversion de PDF en HTML

Les méthodes ToHtmlString et SaveAsHtml offrent toutes deux plusieurs options de configuration. Vous trouverez ci-dessous les propriétés disponibles :

  • Couleur d'arrière-plan : Spécifie la couleur d'arrière-plan.
  • PdfPageMargin : Spécifie la marge de la page.

    De plus, les propriétés ci-dessous sont destinées au paramètre "title" des méthodes ToHtmlString et SaveAsHtml. Cela ajoutera un nouveau titre au début du contenu. Ils ne modifieront pas le titre ou le h1 du document PDF d'entrée.

  • H1Color : Spécifie la couleur du titre.
  • H1FontSize : Spécifie la taille de la police du titre.
  • H1TextAlignment : Spécifie l'alignement du titre, par exemple à gauche, au centre ou à droite.
:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html-advanced-settings.cs
using IronPdf;
using IronSoftware.Drawing;
using System;

PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// PDF to HTML configuration options
HtmlFormatOptions htmlformat = new HtmlFormatOptions();
htmlformat.BackgroundColor = Color.White;
htmlformat.PdfPageMargin = 10;
htmlformat.H1Color = Color.Blue;
htmlformat.H1FontSize = 25;
htmlformat.H1TextAlignment = TextAlignment.Center;

// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);

// Convert PDF to HTML file
pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);
IRON VB CONVERTER ERROR developers@ironsoftware.com
VB   C#

Sortie HTML

L'ensemble du code HTML généré par la méthode SaveAsHtml a été saisi dans le site web ci-dessous.

Ces méthodes produisent une chaîne HTML avec des feuilles de style CSS en ligne. Le code HTML de sortie utilise des termes/balises SVG au lieu des balises HTML habituelles. Malgré cette différence, il s'agit d'une chaîne HTML valide qui peut être restituée de la même manière dans un navigateur web. Cependant, il est important que les utilisateurs sachent que la chaîne HTML renvoyée par cette méthode peut être différente du HTML saisi lors de l'utilisation d'un document PDF rendu à l'aide de la méthode RenderHtmlAsPdf, pour les raisons mentionnées ci-dessus.

Hairil related to Sortie HTML

Hairil Hasyimi Bin Omar

Ingénieur logiciel

Comme tous les grands ingénieurs, Hairil est un fervent apprenant. Il affine ses connaissances en C#, Python et Java, et les utilise pour apporter une valeur ajoutée aux membres de l'équipe d'Iron Software. Hairil a rejoint l'équipe d'Iron Software en provenance de l'Universiti Teknologi MARA en Malaisie, où il a obtenu une licence en génie chimique et des procédés.