Wie konvertiert man PDF in HTML in C# | IronPDF

Konvertieren von PDF in HTML in C#35; mit IronPDF

This article was translated from English: Does it need improvement?
Translated
View the article in English

IronPDF ermöglicht die PDF-zu-HTML-Konvertierung in C# mit nur einer Codezeile unter Verwendung der SaveAsHtml-Methode, wodurch PDFs webfreundlich gemacht werden, um die Zugänglichkeit, SEO und Webintegration zu verbessern. Die IronPDF-Bibliothek bietet eine robuste Lösung für die Umwandlung von PDF-Inhalten in das HTML-Format unter Beibehaltung der visuellen Struktur und des Layouts.

Die Konvertierung von PDF in HTML bietet diese Vorteile:

  • Verbesserte Barrierefreiheit im Web
  • Responsive Design für verschiedene Geräte
  • Verbesserte Suchmaschinenoptimierung
  • Nahtlose Web-Integration
  • Einfache Bearbeitung der Inhalte über Webtools
  • Plattformübergreifende Kompatibilität
  • Unterstützung für dynamische Elemente

Dieser Konvertierungsprozess hilft bei der Wiederverwendung von PDF-Inhalten für Webplattformen oder bei der Extraktion von Text und Bildern aus PDFs zur weiteren Verarbeitung.

IronPDF vereinfacht die PDF-zu-HTML-Konvertierung in .NET C#, indem es Methoden bereitstellt, die den komplexen Konvertierungsprozess intern verarbeiten. Egal, ob es um den Aufbau eines Dokumentenmanagementsystems, die Erstellung eines webbasierten PDF-Viewers oder die Durchsuchbarkeit von PDF-Inhalten durch Suchmaschinen geht, die Konvertierungsfunktionen von IronPDF bieten eine zuverlässige Lösung.

Schnellstart: Sofortiges Konvertieren von PDF zu HTML mit IronPDF

Mit IronPDF können Sie PDF-Dokumente mit nur einer Zeile Code in HTML-Dateien umwandeln. Dieses Beispiel demonstriert die Verwendung der SaveAsHtml-Methode von IronPDF für die schnelle Konvertierung von PDF in HTML.

Nuget IconLegen Sie jetzt mit NuGet los, um PDFs zu erstellen:

  1. Installieren Sie IronPDF mit dem NuGet-Paketmanager.

    PM > Install-Package IronPdf

  2. Kopieren Sie diesen Codeausschnitt und führen Sie ihn aus.

    IronPdf.PdfDocument.FromFile("example.pdf").SaveAsHtml("output.html");
  3. Bereitstellen zum Testen in Ihrer Live-Umgebung

    Beginnen Sie noch heute mit der Nutzung von IronPDF in Ihrem Projekt – mit einer kostenlosen Testversion.
    arrow pointer


Wie konvertiere ich eine einfache PDF-Datei in HTML?

Die Methode ToHtmlString ermöglicht die Analyse von HTML-Elementen in bestehenden PDF-Dokumenten. Sie dient als Werkzeug zur Fehlersuche oder zum PDF-Vergleich. Die Methode SaveAsHtml speichert PDF-Dokumente direkt als HTML-Dateien. Beide Ansätze bieten Flexibilität je nach den spezifischen Anforderungen.

Bei der Konvertierung von PDF in HTML wird das visuelle Layout der PDF-Dokumente beibehalten und gleichzeitig eine HTML-Ausgabe für Webanwendungen erstellt. Dies ist hilfreich, wenn Sie PDF-Inhalte in Webbrowsern anzeigen möchten, ohne dass die Benutzer die PDF-Datei herunterladen oder Reader-Plugins installieren müssen.

Hinweis:Hinweis: Alle interaktiven Formularfelder im Original-PDF sind im resultierenden HTML-Dokument nicht mehr funktionsfähig.

Für Entwickler, die mit PDF-Formularen arbeiten, werden die Formularfelder bei der Konvertierung als statische Inhalte dargestellt. Um die Formularfunktionalität zu erhalten, sollten Sie die Formularbearbeitungsfunktionen von IronPDF nutzen, um die Formulardaten vor der Konvertierung zu extrahieren.

Wie sieht die Beispiel-PDF aus?

Wie implementiere ich den Konvertierungscode?

:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html.cs
using IronPdf;
using System;

PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);

// Convert PDF to HTML file
pdf.SaveAsHtml("myHtml.html");
$vbLabelText   $csharpLabel

Der Code demonstriert zwei primäre Methoden für die Konvertierung von PDF in HTML. Die Methode ToHtmlString funktioniert, wenn Sie HTML-Inhalte programmatisch verarbeiten müssen, während SaveAsHtml Dateien direkt erzeugt. Für mehrere PDFs verarbeiten Sie diese im Stapel mit ähnlichen Techniken.

Wie sieht die HTML-Ausgabe aus?

Das gesamte Ausgabe-HTML, das aus der SaveAsHtml-Methode generiert wurde, wurde auf der nachstehenden Website eingegeben.


Wie kann ich die erweiterten PDF-zu-HTML-Optionen konfigurieren?

Die Methoden ToHtmlString und SaveAsHtml bieten Konfigurationsoptionen über die Klasse HtmlFormatOptions. Dieses Konfigurationssystem passt das Aussehen und Verhalten der generierten HTML-Ausgabe an. Zu den verfügbaren Eigenschaften gehören:

  • BackgroundColor: Legt die Hintergrundfarbe der HTML-Ausgabe fest
  • PdfPageMargin: Setzt die Seitenränder in Pixel

Die folgenden Eigenschaften gelten für den Parameter "title" in den Methoden ToHtmlString und SaveAsHtml. Sie fügen einen neuen Titel am Anfang des Inhalts ein, ohne den ursprünglichen PDF-Titel zu ändern:

  • H1Color: Legt die Titelfarbe fest
  • H1FontSize: Legt die Schriftgröße des Titels in Pixel fest
  • H1TextAlignment: Legt die Ausrichtung des Titels fest (links, mittig oder rechts)

Für Entwickler, die mit angepassten Papiergrößen oder bestimmten Seitenausrichtungen arbeiten, stellen diese Konfigurationsoptionen sicher, dass die HTML-Ausgabe die beabsichtigte visuelle Struktur beibehält.

Welche Konfigurationsoptionen sind verfügbar?

:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html-advanced-settings.cs
using IronPdf;
using IronSoftware.Drawing;
using System;

PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// PDF to HTML configuration options
HtmlFormatOptions htmlformat = new HtmlFormatOptions();
htmlformat.BackgroundColor = Color.White;
htmlformat.PdfPageMargin = 10;
htmlformat.H1Color = Color.Blue;
htmlformat.H1FontSize = 25;
htmlformat.H1TextAlignment = TextAlignment.Center;

// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);

// Convert PDF to HTML file
pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);
$vbLabelText   $csharpLabel

Dieses Beispiel zeigt, wie man eine ansprechende HTML-Ausgabe mit benutzerdefiniertem Styling erstellt. Die Konfigurationsoptionen arbeiten mit der Rendering-Engine von IronPDF zusammen, um hochwertiges HTML zu erzeugen, das die visuelle Treue beibehält.

Wie unterscheidet sich die konfigurierte Ausgabe?

Das gesamte Ausgabe-HTML, das aus der SaveAsHtml-Methode generiert wurde, wurde auf der nachstehenden Website eingegeben.

Warum verwendet die HTML-Ausgabe SVG-Tags?

Diese Methoden erzeugen HTML-Strings mit Inline-CSS. Die HTML-Ausgabe verwendet SVG-Tags anstelle von Standard-HTML-Tags. Trotz dieses Unterschieds wird gültiges HTML erzeugt, das in Webbrowsern korrekt wiedergegeben wird. Der von dieser Methode zurückgegebene HTML-String kann sich von der HTML-Eingabe unterscheiden, wenn ein PDF-Dokument verwendet wird, das mit der Methode RenderHtmlAsPdf gerendert wurde.

Der SVG-basierte Ansatz gewährleistet eine genaue Darstellung komplexer PDF-Layouts, einschließlich präziser Positionierung, Schriftarten und Grafiken. Diese Methode eignet sich gut für PDFs, die Bilder, Diagramme oder komplexe Formatierungen enthalten, die mit Standard-HTML-Elementen nur schwer wiedergegeben werden können.

Zusätzliches Code-Beispiel: Batch-Konvertierung von PDF in HTML

Hier ist ein Beispiel für die Konvertierung mehrerer PDFs in HTML, das ein ganzes Verzeichnis von PDF-Dateien verarbeitet:

using IronPdf;
using System.IO;

public class BatchPdfToHtmlConverter
{
    public static void ConvertPdfDirectory(string inputDirectory, string outputDirectory)
    {
        // Ensure output directory exists
        Directory.CreateDirectory(outputDirectory);

        // Configure HTML output settings once for consistency
        HtmlFormatOptions formatOptions = new HtmlFormatOptions
        {
            BackgroundColor = Color.WhiteSmoke,
            PdfPageMargin = 15,
            H1FontSize = 28,
            H1TextAlignment = TextAlignment.Left
        };

        // Process all PDF files in the directory
        string[] pdfFiles = Directory.GetFiles(inputDirectory, "*.pdf");

        foreach (string pdfPath in pdfFiles)
        {
            try
            {
                // Load PDF document
                PdfDocument pdf = PdfDocument.FromFile(pdfPath);

                // Generate output filename
                string fileName = Path.GetFileNameWithoutExtension(pdfPath);
                string htmlPath = Path.Combine(outputDirectory, $"{fileName}.html");

                // Convert and save as HTML with consistent formatting
                pdf.SaveAsHtml(htmlPath, true, fileName, htmlFormatOptions: formatOptions);

                Console.WriteLine($"Converted: {fileName}.pdf → {fileName}.html");
            }
            catch (Exception ex)
            {
                Console.WriteLine($"Error converting {pdfPath}: {ex.Message}");
            }
        }
    }
}
using IronPdf;
using System.IO;

public class BatchPdfToHtmlConverter
{
    public static void ConvertPdfDirectory(string inputDirectory, string outputDirectory)
    {
        // Ensure output directory exists
        Directory.CreateDirectory(outputDirectory);

        // Configure HTML output settings once for consistency
        HtmlFormatOptions formatOptions = new HtmlFormatOptions
        {
            BackgroundColor = Color.WhiteSmoke,
            PdfPageMargin = 15,
            H1FontSize = 28,
            H1TextAlignment = TextAlignment.Left
        };

        // Process all PDF files in the directory
        string[] pdfFiles = Directory.GetFiles(inputDirectory, "*.pdf");

        foreach (string pdfPath in pdfFiles)
        {
            try
            {
                // Load PDF document
                PdfDocument pdf = PdfDocument.FromFile(pdfPath);

                // Generate output filename
                string fileName = Path.GetFileNameWithoutExtension(pdfPath);
                string htmlPath = Path.Combine(outputDirectory, $"{fileName}.html");

                // Convert and save as HTML with consistent formatting
                pdf.SaveAsHtml(htmlPath, true, fileName, htmlFormatOptions: formatOptions);

                Console.WriteLine($"Converted: {fileName}.pdf → {fileName}.html");
            }
            catch (Exception ex)
            {
                Console.WriteLine($"Error converting {pdfPath}: {ex.Message}");
            }
        }
    }
}
$vbLabelText   $csharpLabel

Dieses Beispiel für eine Stapelkonvertierung eignet sich für Content-Management-Systeme, digitale Archive oder Anwendungen, die große Mengen von PDF-Inhalten im Internet zugänglich machen müssen. Weitere Informationen über die programmatische Arbeit mit PDFs finden Sie in unserem Tutorials-Bereich.

Häufig gestellte Fragen

Wie konvertiere ich in C# eine PDF-Datei in HTML?

Mit IronPDF können Sie ein PDF-Dokument in C# mit nur einer Zeile Code in HTML konvertieren: IronPdf.PdfDocument.FromFile("example.pdf").SaveAsHtml("output.html"). Diese Methode wickelt den komplexen Konvertierungsprozess intern ab und behält dabei die visuelle Struktur und das Layout Ihres PDF-Dokuments bei.

Was sind die Hauptvorteile der Konvertierung von PDF in HTML?

Die PDF-zu-HTML-Konvertierung von IronPDF bietet mehrere Vorteile, darunter verbesserte Webzugänglichkeit, responsives Design für verschiedene Geräte, verbesserte Suchmaschinenoptimierung, nahtlose Webintegration, einfache Bearbeitung von Inhalten mit Webtools, plattformübergreifende Kompatibilität und Unterstützung für dynamische Elemente.

Welche Methoden gibt es für die Konvertierung von PDF in HTML?

IronPDF bietet zwei Hauptmethoden für die PDF-zu-HTML-Konvertierung: die ToHtmlString-Methode, die die Analyse von HTML-Elementen ermöglicht und das HTML als String zurückgibt, und die SaveAsHtml-Methode, die PDF-Dokumente direkt als HTML-Dateien speichert. Bei beiden Methoden bleibt das visuelle Layout des PDF-Dokuments erhalten.

Funktionieren interaktive Formularfelder nach der Konvertierung von PDF in HTML?

Nein, bei der PDF-zu-HTML-Konvertierung von IronPDF sind alle interaktiven Formularfelder in der ursprünglichen PDF-Datei im resultierenden HTML-Dokument nicht mehr funktionsfähig. Die Formularfelder werden als statischer Inhalt wiedergegeben. Um die Formularfunktionalität zu erhalten, sollten Sie die Formularbearbeitungsfunktionen von IronPDF nutzen, um die Formulardaten vor der Konvertierung zu extrahieren.

Kann ich die HTML-Ausgabe bei der Konvertierung von PDF anpassen?

Ja, IronPDF ermöglicht es Ihnen, die HTML-Ausgabe mit Hilfe der Klasse HtmlFormatOptions zu konfigurieren. Damit haben Sie die Kontrolle über verschiedene Aspekte des HTML-Konvertierungsprozesses, um sicherzustellen, dass die Ausgabe Ihren spezifischen Anforderungen entspricht.

Regan Pun
Software Ingenieur
Regan absolvierte die University of Reading mit einem BA in Elektroniktechnik. Vor seinem Eintritt bei Iron Software hatte er in seinen vorherigen Stellen laserfokussierte Aufgaben; was er bei Iron Software am meisten genießt, ist das Spektrum an Arbeiten, die er übernehmen darf, sei es den Vertrieb zu unterstützen, ...
Weiterlesen
Rezensiert von
Jeff Fritz
Jeffrey T. Fritz
Principal Program Manager - .NET Community Team
Jeff ist außerdem Principal Program Manager für das .NET- und Visual Studio-Team. Er ist der ausführende Produzent der .NET Conf Virtual Conference Series und moderiert ‚Fritz and Friends‘, einen Livestream für Entwickler, der zweimal wöchentlich ausgestrahlt wird. Dort spricht er über Technik und schreibt gemeinsam mit den Zuschauern Code. Jeff schreibt Workshops, Präsentationen und plant Inhalte für die größten Microsoft-Entwicklerveranstaltungen, einschließlich Microsoft Build, Microsoft Ignite, .NET Conf und dem Microsoft MVP Summit.
Bereit anzufangen?
Nuget Downloads 17,012,929 | Version: 2025.12 gerade veröffentlicht