PDF zu HTML
Genauso wie IronPDF pixelgenaue PDF-Dateien aus HTML-Inhalten generieren kann, kann es auch verwendet werden, um PDF-Dokumente in HTML zu konvertieren. Durch die Verwendung der Klassen PdfDocument und HtmlFormatOptions erhalten Benutzer Zugriff auf die Methoden, die für die Konvertierung der PDF-Datei in HTML erforderlich sind, und können steuern, wie der endgültige HTML-Inhalt formatiert wird.
5 Schritte zur Konvertierung von PDF in HTML
Hier ist ein schrittweises Codebeispiel, das die Konvertierung veranschaulicht:
Um mit der Konvertierung einer PDF-Datei in HTML zu beginnen, müssen wir zunächst die zu konvertierende PDF-Datei mithilfe der Methode FromFile der Klasse PdfDocument laden. Diese Methode nimmt den Dateinamen oder den Dateipfad, den wir ihr übergeben, und Load ihn in ein neues PdfDocument Objekt, pdf. Nun können wir dieses Objekt einfach referenzieren, wann immer wir es für den Konvertierungsprozess benötigen.
Als nächstes demonstrieren wir die Methode, ein PDF-Dokument in ein einfaches HTML-String-Objekt zu konvertieren, das dann in der Konsole angezeigt und je nach den Anforderungen des Entwicklers weiter bearbeitet werden kann. Die folgende Codezeile zeigt eine andere Möglichkeit auf, bei der wir das PDF in eine HTML-Datei konvertieren, die für komplexere Arbeiten oder zum Teilen bereit ist im Vergleich zum einfachen HTML-String. Beide Methoden erfordern nur eine einzelne Zeile, um den Konvertierungsprozess abzuschließen, was sie einfach und effizient macht.
Betrachten wir nun ein fortgeschritteneres Beispiel, in dem wir die Klasse HtmlFormatOptions verwenden und ihre Eigenschaften nutzen, um die endgültige HTML-Ausgabe anzupassen. Mit dieser Klasse können Sie verschiedene Aspekte wie Hintergrundfarbe, Farbe der Überschrift (H1), Textausrichtung von H1, Seitenränder und mehr anpassen. Zunächst müssen wir eine neue Instanz dieser Klasse erstellen, die im Code htmlFormat heißt.
In diesem Beispiel ändern wir die Hintergrundfarbe auf Weiß und setzen die Textfarbe der H1-Überschrift mithilfe der Klasse IronSoftware.Drawing.Color auf Blau. Dann passen wir die H1-Schriftgröße auf 25 Pixel an. Als nächstes passen wir die Textausrichtung von H1 so an, dass sie zentriert ist. Schließlich setzen wir die PDF-Seitenränder im HTML-Dokument auf 10 Pixel.
Der letzte Schritt besteht darin, die Methode SaveAsHtml erneut zu verwenden, um die PDF-Datei in HTML zu konvertieren, diesmal mit zusätzlichen Parametern. Der erste Parameter ist der Name und Speicherort, um das neu erzeugte HTML-Dokument zu speichern. Anschließend setzen wir einen Booleschen Wert, fullContentWidth, auf "true", wodurch das HTML so konfiguriert wird, dass die volle Breite für den PDF-Inhalt genutzt wird. Wir geben außerdem einen Titel für die HTML-Ausgabe an und wenden schließlich die zuvor erstellten Anpassungs-Einstellungen mit htmlFormatOptions an.
Entdecken Sie jetzt unseren PDF-zu-HTML-Konvertierungsleitfaden!

