.NET-HILFE

HTML Prettifier (Wie es für Entwickler funktioniert)

Chipego
Chipego Kalinda
3. April 2025
Teilen Sie:

Einführung

Bei der Arbeit mit der HTML-zu-PDF-Konvertierung in .NET kann sauberes und gut strukturiertes HTML einen beträchtlichen Unterschied in der Qualität des endgültigen PDFs ausmachen. Die ordnungsgemäße Formatierung von rohem HTML gewährleistet Lesbarkeit, korrekte Darstellung und Konsistenz. Hier kommt ein HTML-Formatter oder ein HTML-Prettifier ins Spiel.

In diesem Artikel werden wir untersuchen, wie man einen HTML-Verschönerer in .NET verwendet, bevor man mit IronPDF HTML in PDF konvertiert. Wir werden die Vorteile der Verschönerung besprechen, Bibliotheken vorstellen, die dabei helfen können, und ein praktisches Codebeispiel geben.

Was ist ein HTML-Prettifier?

Ein HTML-Prettifier ist ein Werkzeug, das rohe oder minifizierte HTML-Codes in ein lesbares, gut strukturiertes Format umformatiert. Dieser Prozess umfasst:

  • Verschachtelte Elemente richtig einrücken
  • Schließen von nicht geschlossenen Tags
  • Formatierungsattribute konsistent verwenden
  • Entfernen von unnötigen Leerzeichen

    Die Verwendung eines HTML-Prettifiers vor der Konvertierung in PDF stellt sicher, dass der Inhalt strukturiert und visuell kohärent bleibt und reduziert Rendering-Probleme im generierten PDF.

IronPDF: Eine leistungsstarke PDF-Lösung

HTML Prettifier (Funktionsweise für Entwickler): Abbildung 1

Von Pixabay hinzufügenHochladen

oder ein Bild hierher ziehen und ablegen

Alternativtext für Bild hinzufügen

IronPDF ist eine umfassende und funktionsreiche .NET-Bibliothek, die für nahtlose HTML-zu-PDF-Konvertierung entwickelt wurde. Es ermöglicht Entwicklern, HTML, URLs oder sogar rohe HTML-Strings mit minimalem Aufwand in qualitativ hochwertige PDFs umzuwandeln. Im Gegensatz zu vielen anderen PDF-Bibliotheken unterstützt IronPDF vollumfänglich moderne Webstandards, einschließlich HTML5, CSS3 und JavaScript, und stellt sicher, dass die gerenderten PDFs ihr beabsichtigtes Design und Layout beibehalten. Dies macht es zu einer idealen Wahl für Projekte, die eine präzise PDF-Ausgabe aus komplexen HTML-Strukturen erfordern.

Einige der Hauptmerkmale von IronPDF umfassen:

HTML in .NET verschönern

In .NET gibt es mehrere Bibliotheken, um unformatierten oder unschönen HTML-Code zu verschönern, darunter:

HtmlAgilityPack

  • Eine beliebte Bibliothek zum Parsen und Modifizieren von HTML-Code in C#.
  • Kann verwendet werden, um HTML-Code vor der Verarbeitung zu formatieren und aufzuräumen.

2. AngleSharp

  • Ein moderner HTML-Parser für .NET, der detaillierte Dokumentmanipulationsfähigkeiten bietet.
  • Kann HTML so formatieren, dass es besser lesbar ist.

3. HTML-Beautifier (BeautifyTools)

  • Formatiert und rückt unordentliches HTML ein, um die Lesbarkeit zu verbessern.
  • Online-Tool, das direkt im Browser funktioniert—keine Installation erforderlich.

Verwendung von HtmlAgilityPack zur Formatierung von HTML-Code

HTML-Prettifier (Wie es für Entwickler funktioniert): Abbildung 2

Von Pixabay hinzufügenHochladen

oder ein Bild hierher ziehen und ablegen

Alternativtext für Bild hinzufügen

HtmlAgilityPack ist eine beliebte .NET-Bibliothek, die eine schnelle und effiziente Möglichkeit bietet, HTML-Dokumente zu parsen und zu manipulieren. Es kann fehlerhaftes oder schlecht strukturiertes HTML verarbeiten, was es zu einer hervorragenden Wahl für Web-Scraping und Datenauswertung macht. Obwohl es nicht ausdrücklich als „Prettifier“ konzipiert ist, kann es verwendet werden, um HTML-Code zu bereinigen und zu formatieren, indem er mit korrekter Einrückung geparst und gespeichert wird.

So verwenden Sie den HtmlAgilityPack, um HTML zu verschönern, bevor Sie es an IronPDF übergeben:

using IronPdf;
using HtmlAgilityPack;
using System.IO;
class Program
{
    static void Main()
    {
     string htmlContent = "<html><body><h1>Hello World!</h1><p>This is a test.</p></body></html>";
        HtmlDocument doc = new HtmlDocument();
        doc.LoadHtml(htmlContent);
        // Prettify the HTML by saving it with indentation
        string prettyHtml = doc.DocumentNode.OuterHtml;
        // Saves the formatted HTML with the prettified indenting
        doc.Save("pretty.html");
    }
}
using IronPdf;
using HtmlAgilityPack;
using System.IO;
class Program
{
    static void Main()
    {
     string htmlContent = "<html><body><h1>Hello World!</h1><p>This is a test.</p></body></html>";
        HtmlDocument doc = new HtmlDocument();
        doc.LoadHtml(htmlContent);
        // Prettify the HTML by saving it with indentation
        string prettyHtml = doc.DocumentNode.OuterHtml;
        // Saves the formatted HTML with the prettified indenting
        doc.Save("pretty.html");
    }
}

HTML-Datei ausgeben

HTML Prettifier (So funktioniert es für Entwickler): Abbildung 3

Von Pixabay hinzufügenHochladen

oder ein Bild hierher ziehen und ablegen

Alternativtext für Bild hinzufügen

Verwendung von AngleSharp als HTML-Prettifier

HTML Prettifier (Wie es für Entwickler funktioniert): Abbildung 4

Von Pixabay hinzufügenHochladen

oder ein Bild hierher ziehen und ablegen

Alternativtext für Bild hinzufügen

AngleSharp ist eine .NET-Bibliothek, die für das Parsen und Manipulieren von HTML-, XML- und SVG-Dokumenten entwickelt wurde. Es bietet einen modernen und flexiblen Ansatz zur DOM-Manipulation und -Formatierung. Die HtmlFormatter-Klasse von AngleSharp kann verwendet werden, um HTML-Inhalte zu formatieren und ein schönes, lesbares Ergebnis zu liefern.

using AngleSharp.Html.Parser;
using AngleSharp.Dom;
using System;
class Program
{
    static void Main()
    {
        string htmlContent = "<html><body><h1>Hello World!</h1><p>This is a test.</p></body></html>";
        var parser = new HtmlParser();
        var document = parser.ParseDocument(htmlContent);
        // Format the HTML using AngleSharp’s HtmlFormatter
        var prettyHtml = document.ToHtml();
    }
}
using AngleSharp.Html.Parser;
using AngleSharp.Dom;
using System;
class Program
{
    static void Main()
    {
        string htmlContent = "<html><body><h1>Hello World!</h1><p>This is a test.</p></body></html>";
        var parser = new HtmlParser();
        var document = parser.ParseDocument(htmlContent);
        // Format the HTML using AngleSharp’s HtmlFormatter
        var prettyHtml = document.ToHtml();
    }
}

HTML-Ausgabe

HTML Prettifier (Wie es für Entwickler funktioniert): Abbildung 5

Von Pixabay hinzufügenHochladen

oder ein Bild hierher ziehen und ablegen

Alternativtext für Bild hinzufügen

Online HTML Beautifier (BeautifyTools)

HTML Prettifier (Wie es für Entwickler funktioniert): Abbildung 6

Von Pixabay hinzufügenHochladen

oder ein Bild hierher ziehen und ablegen

Alternativtext für Bild hinzufügen

BeautifyTools.com bietet einen einfach zu bedienenden Online-HTML-Formatter, der es Ihnen ermöglicht, unübersichtlichen HTML-Code zu formatieren und zu verschönern. Das ist nützlich, wenn Sie eine schnelle und kostenlose Möglichkeit suchen, Ihr HTML zu bereinigen, ohne Bibliotheken zu installieren oder Code zu schreiben.

So verwenden Sie den Online-HTML-Beautifier

  1. Gehe zur Website

    Öffnen Sie BeautifyTools.com HTML Beautifier in Ihrem Webbrowser.

  2. Fügen Sie Ihr HTML ein

    Kopieren Sie Ihren rohen oder minimierten HTML-Code und fügen Sie ihn in das Eingabefeld ein.

  3. Einstellungen anpassen (optional)

    • Wählen Sie das Einrückungsniveau (Leerzeichen: 2, 4, etc.).
    • Zeilenumbrüche und Formatierungsoptionen aktivieren/deaktivieren.
  4. Klicken Sie auf "HTML verschönern"

    Das Tool wird Ihr HTML verarbeiten und das verschönerte Ergebnis im Ausgabefeld anzeigen.

  5. Kopieren Sie das formatierte HTML

    Klicken Sie auf "In die Zwischenablage kopieren" oder kopieren Sie den formatierten HTML-Code manuell zur Verwendung in Ihrem Projekt.

    HTML Prettifier (Wie es für Entwickler funktioniert): Abbildung 7

    Von Pixabay hinzufügenHochladen

    oder ein Bild hierher ziehen und ablegen

    Alternativtext für Bild hinzufügen

Vor- und Nachteile der Verwendung eines Online-Beautifiers

HTML-Schönmacher (So funktioniert es für Entwickler): Abbildung 8

Von Pixabay hinzufügenHochladen

oder ein Bild hierher ziehen und ablegen

Alternativtext für Bild hinzufügen

Vor- und Nachteile der Verwendung eines codebasierten HTML-Prettifiers

HTML Prettifier (Wie es für Entwickler funktioniert): Abbildung 9

Von Pixabay hinzufügenHochladen

oder ein Bild hierher ziehen und ablegen

Alternativtext für Bild hinzufügen

Konvertieren von schön formatiertem HTML zu PDF mit IronPDF

Sobald wir unser HTML verschönert haben, können wir IronPDF verwenden, um es in eine hochwertige PDF-Datei zu konvertieren. Hier ist ein einfaches Beispiel mit AngleSharp:

using AngleSharp.Html.Parser;
using AngleSharp.Dom;
using AngleSharp.Html;
class Program
{
    static void Main()
    {
        string htmlContent = "<html><body><h1>Hello World!</h1><p>This was formatted using AngleSharp.</p><p>Then it was converted using IronPDF.</p></body></html>";
        var parser = new HtmlParser();
        var document = parser.ParseDocument(htmlContent);
        // Format the HTML using AngleSharp’s HtmlFormatter
        using (var writer = new StringWriter())
        {
            document.ToHtml(writer, new PrettyMarkupFormatter());
            var prettyHtml = writer.ToString();
            document.Close();
            // Save the formatted HTML to a file
            string outputPath = "formatted.html";
            File.WriteAllText(outputPath, prettyHtml);
            Console.WriteLine(prettyHtml);
        }
        // Convert the formatted HTML to PDF using IronPdf
        ChromePdfRenderer renderer = new ChromePdfRenderer();
        PdfDocument pdf = renderer.RenderHtmlFileAsPdf("formatted.html");
        pdf.SaveAs("output.pdf");
    }
}
using AngleSharp.Html.Parser;
using AngleSharp.Dom;
using AngleSharp.Html;
class Program
{
    static void Main()
    {
        string htmlContent = "<html><body><h1>Hello World!</h1><p>This was formatted using AngleSharp.</p><p>Then it was converted using IronPDF.</p></body></html>";
        var parser = new HtmlParser();
        var document = parser.ParseDocument(htmlContent);
        // Format the HTML using AngleSharp’s HtmlFormatter
        using (var writer = new StringWriter())
        {
            document.ToHtml(writer, new PrettyMarkupFormatter());
            var prettyHtml = writer.ToString();
            document.Close();
            // Save the formatted HTML to a file
            string outputPath = "formatted.html";
            File.WriteAllText(outputPath, prettyHtml);
            Console.WriteLine(prettyHtml);
        }
        // Convert the formatted HTML to PDF using IronPdf
        ChromePdfRenderer renderer = new ChromePdfRenderer();
        PdfDocument pdf = renderer.RenderHtmlFileAsPdf("formatted.html");
        pdf.SaveAs("output.pdf");
    }
}

Erläuterung

Der obige Code veranschaulicht, wie man HTML mit AngleSharp verschönert und es dann mit IronPDF in eine PDF-Datei umwandelt. Und so funktioniert es:

  1. Definieren Sie den Roh-HTML-Inhalt:

    Das Programm startet mit einem einfachen HTML-String, der eine

    -Überschrift und zwei Absätze enthält.

  2. Analysieren Sie das HTML mit AngleSharp:

    Es initialisiert eine HtmlParser-Instanz und parst das rohe HTML in ein strukturiertes IDocument-Objekt.

  3. Formatieren Sie das HTML mit PrettyMarkupFormatter:

    • Die PrettyMarkupFormatter-Klasse wird verwendet, um das HTML korrekt zu formatieren und einzurücken.

    • Ein StringWriter wird verwendet, um das formatierte HTML als Zeichenfolge zu erfassen.
    • Nach dem Formatieren wird das formatierte HTML in einer Datei mit dem Namen "formatted.html" gespeichert.
  4. Wandeln Sie das formatierte HTML mit IronPDF in PDF um:

    • Eine ChromePdfRenderer-Instanz wird erstellt, um die Konvertierung durchzuführen.

    • Die formatierte HTML-Datei wird geladen und in ein PdfDocument konvertiert.
    • Die resultierende PDF-Datei wird als "output.pdf" gespeichert.
  5. Endgültige Ausgabe:

    • Der verschönerte HTML-Code wird in der Konsole angezeigt.

    • Das Programm erzeugt zwei Ausgabedateien:

      • formatted.html (eine gut strukturierte Version des HTML)
      • output.pdf (das endgültige PDF-Dokument, das aus dem formatierten HTML generiert wird).

    Dieser Ansatz stellt sicher, dass das HTML sauber strukturiert ist, bevor es in ein PDF konvertiert wird, was die Lesbarkeit verbessert und potenzielle Darstellungsprobleme im PDF-Ausgang vermeidet.

    Konsolenausgabe

    HTML Prettifier (Wie es für Entwickler funktioniert): Abbildung 10

    Von Pixabay hinzufügenHochladen

    oder ein Bild hierher ziehen und ablegen

    Alternativtext für Bild hinzufügen

    PDF-Ausgabe

    HTML-Formatter (Funktionsweise für Entwickler): Abbildung 11

    Von Pixabay hinzufügenHochladen

    oder ein Bild hierher ziehen und ablegen

    Alternativtext für Bild hinzufügen

Warum einen Prettifier mit IronPDF verwenden?

Bessere Lesbarkeit und Debugging

Formatierter HTML-Code ist leichter zu lesen, zu debuggen und zu pflegen. Dies ist besonders nützlich, wenn man mit dynamischen Inhalten oder großen HTML-Vorlagen arbeitet.

2. Verbesserte Stilkonstanz

Verschönertes HTML hält konsistente Abstände und Struktur bei, was zu einer vorhersehbareren Darstellung in IronPDF führt.

3. Reduzierte Darstellungsprobleme

Minifizierter oder unstrukturierter HTML kann manchmal unerwartete Probleme bei der PDF-Erzeugung verursachen. Die Verschönerung hilft, fehlende Elemente oder fehlerhafte Layouts zu verhindern.

4. Vereinfacht automatisierte Workflows

Wenn Ihre Anwendung programmgesteuert PDFs erzeugt, verbessert das Sicherstellen, dass HTML sauber und gut formatiert ist, vor der Konvertierung die Stabilität und Genauigkeit.

Schlussfolgerung

Die Verwendung eines HTML-Formatierers mit IronPDF in .NET ist eine einfache, aber effektive Methode, um die PDF-Konvertierung zu verbessern. Indem Sie Ihr HTML korrekt strukturieren, sorgen Sie für eine bessere Darstellung, verbesserte Wartbarkeit und weniger Debugging-Kopfschmerzen.

Mit Bibliotheken wie HtmlAgilityPack, AngleSharp und HTML Beautifier wird das Verschönern von HTML vor der PDF-Erstellung zu einer mühelosen Aufgabe. Wenn Sie häufig mit HTML-zu-PDF-Konvertierungen arbeiten, sollten Sie erwägen, einen HTML-Prettifier in Ihren Workflow zu integrieren, um optimale Ergebnisse zu erzielen.

Probieren Sie es noch heute aus und sehen Sie, wie es Ihre IronPDF-Erfahrung verbessert! Laden Sie die kostenlose Testversion herunter und beginnen Sie, all das zu entdecken, was IronPDF in Ihren eigenen Projekten zu bieten hat.

Chipego
Software-Ingenieur
Chipego hat eine natürliche Fähigkeit zum Zuhören, die ihm hilft, Kundenprobleme zu verstehen und intelligente Lösungen anzubieten. Er trat dem Iron Software-Team 2023 bei, nachdem er einen Bachelor of Science in Informationstechnologie erworben hatte. IronPDF und IronOCR sind die beiden Produkte, auf die sich Chipego konzentriert hat, aber sein Wissen über alle Produkte wächst täglich, da er neue Wege findet, Kunden zu unterstützen. Er genießt die Zusammenarbeit bei Iron Software, da Teammitglieder aus dem gesamten Unternehmen ihre unterschiedlichen Erfahrungen einbringen und so zu effektiven, innovativen Lösungen beitragen. Wenn Chipego nicht an seinem Schreibtisch sitzt, kann man ihn oft bei einem guten Buch oder beim Fußballspielen antreffen.
< PREVIOUS
C#-String-Methoden (Wie es für Entwickler funktioniert)
NÄCHSTES >
C# Zeichenkette in Bubble umwandeln (Wie es für Entwickler funktioniert)