Jak przekonwertować plik PDF na HTML w języku C# | IronPDF

Jak przekonwertować plik PDF na HTML w języku C# za pomocą IronPDF

This article was translated from English: Does it need improvement?
Translated
View the article in English

IronPDF umożliwia konwersję plików PDF do formatu HTML w języku C# za pomocą jednej linii kodu przy użyciu metody SaveAsHtml, dzięki czemu pliki PDF stają się przyjazne dla sieci, co poprawia ich dostępność, pozycjonowanie w wyszukiwarkach oraz integrację z internetem. Biblioteka IronPDF zapewnia solidne rozwiązanie do przekształcania treści PDF do formatu HTML przy zachowaniu struktury wizualnej i układu.

Konwersja plików PDF do formatu HTML oferuje następujące korzyści:

  • Ulepszona dostępność stron internetowych
  • Responsywny projekt dostosowany do różnych urządzeń
  • Ulepszona optymalizacja pod kątem wyszukiwarek
  • Płynna integracja z internetem
  • Łatwa edycja treści za pomocą narzędzi internetowych
  • Kompatybilność międzyplatformowa
  • Obsługa elementów dynamicznych

Ten proces konwersji jest pomocny podczas dostosowywania treści PDF do platform internetowych lub gdy trzeba wyodrębnić tekst i obrazy z plików PDF w celu dalszego przetwarzania.

IronPDF upraszcza konwersję plików PDF do HTML w środowisku .NET C#, udostępniając metody, które wewnętrznie obsługują złożony proces konwersji. Niezależnie od tego, czy tworzysz system zarządzania dokumentami, internetową przeglądarkę plików PDF, czy też chcesz, aby treści PDF były indeksowane przez wyszukiwarki, możliwości konwersji IronPDF oferują niezawodne rozwiązanie.

Szybki start: Natychmiastowa konwersja plików PDF do formatu HTML za pomocą IronPDF

Przekształcaj dokumenty PDF w pliki HTML za pomocą jednej linii kodu, korzystając z IronPDF. Ten przykład pokazuje wykorzystanie metody SaveAsHtml biblioteki IronPDF do szybkiej konwersji plików PDF do formatu HTML.

  1. Install IronPDF with NuGet Package Manager

    PM > Install-Package IronPdf
  2. Skopiuj i uruchom ten fragment kodu.

    IronPdf.PdfDocument.FromFile("example.pdf").SaveAsHtml("output.html");
  3. Wdrożenie do testowania w środowisku produkcyjnym

    Rozpocznij używanie IronPDF w swoim projekcie już dziś z darmową wersją próbną

    arrow pointer


Jak przekonwertować zwykły plik PDF na HTML?

Metoda ToHtmlString umożliwia analizę elementów HTML w istniejących dokumentach PDF. Służy jako narzędzie do debugowania lub porównywania plików PDF. Metoda SaveAsHtml přímo zapisuje dokumenty PDF jako pliky HTML. Oba podejścia zapewniają elastyczność w zależności od konkretnych potrzeb.

Proces konwersji plików PDF do HTML zachowuje układ wizualny dokumentów PDF, tworząc jednocześnie kod HTML przeznaczony dla aplikacji internetowych. Jest to pomocne, gdy chcesz wyświetlać zawartość plików PDF w przeglądarkach internetowych bez konieczności pobierania pliku PDF lub instalowania wtyczek do czytania.

Zwróć uwagęUwaga: Wszystkie interaktywne pola formularza w oryginalnym pliku PDF nie będą już działać w wynikowym dokumencie HTML.

W przypadku programistów pracujących z formularzami PDF proces konwersji renderuje pola formularza jako treść statyczną. Aby zachować funkcjonalność formularzy, warto rozważyć użycie funkcji edycji formularzy IronPDF do wyodrębnienia danych z formularzy przed konwersją.

Jak wygląda przykładowy plik PDF?

Jak zaimplementować kod konwersji?

:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html.cs
using IronPdf;
using System;

PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);

// Convert PDF to HTML file
pdf.SaveAsHtml("myHtml.html");
Imports IronPdf
Imports System

Dim pdf As PdfDocument = PdfDocument.FromFile("sample.pdf")

' Convert PDF to HTML string
Dim html As String = pdf.ToHtmlString()
Console.WriteLine(html)

' Convert PDF to HTML file
pdf.SaveAsHtml("myHtml.html")
$vbLabelText   $csharpLabel

Kod przedstawia dwie podstawowe metody konwersji plików PDF do formatu HTML. Metoda ToHtmlString sprawdza się, gdy trzeba przetwarzać zawartość HTML programowo, podczas gdy SaveAsHtml generuje pliki bezpośrednio. W przypadku wielu plików PDF należy przetwarzać je partiami, stosując podobne techniki.

Jak wygląda wynikowy kod HTML?

Cały kod HTML wygenerowany przez metodę SaveAsHtml został umieszczony na poniższej stronie internetowej.


Jak mogę skonfigurować zaawansowane opcje PDF do HTML?

Obie metody ToHtmlString i SaveAsHtml oferują opcje konfiguracyjne za pośrednictwem klasy HtmlFormatOptions. Ten system konfiguracji dostosowuje wyglad oraz zachowanie wygenerowanego HTML. Dostępne właściwości to:

  • BackgroundColor: Ustawia kolor tła wyjściowego kodu HTML
  • PdfPageMargin: Ustawia marginesy strony w pikselach

Poniższe właściwości dotyczą parametru "title" w metodach ToHtmlString i SaveAsHtml. Dodaja nowy tytuł na początku zawartości, nie modyfikujac oryginalnego tytułu PDF:

  • H1Color: Ustawia kolor tytułu
  • H1FontSize: Ustawia rozmiar czcionki tytułu w pikselach
  • H1TextAlignment: Ustawia wyrównanie tytułu (do lewej, do środka lub do prawej)

Dla programistów pracujacych z niestandardowymi rozmiarami papieru lub specyficznymi orientacjami stron, te opcje konfiguracji zapewniają, ze HTML zachowuje zamierzona strukture wizualna.

Jakie opcje konfiguracyjne są dostępne?

:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html-advanced-settings.cs
using IronPdf;
using IronSoftware.Drawing;
using System;

PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// PDF to HTML configuration options
HtmlFormatOptions htmlformat = new HtmlFormatOptions();
htmlformat.BackgroundColor = Color.White;
htmlformat.PdfPageMargin = 10;
htmlformat.H1Color = Color.Blue;
htmlformat.H1FontSize = 25;
htmlformat.H1TextAlignment = TextAlignment.Center;

// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);

// Convert PDF to HTML file
pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);
Imports IronPdf
Imports IronSoftware.Drawing
Imports System

Dim pdf As PdfDocument = PdfDocument.FromFile("sample.pdf")

' PDF to HTML configuration options
Dim htmlformat As New HtmlFormatOptions()
htmlformat.BackgroundColor = Color.White
htmlformat.PdfPageMargin = 10
htmlformat.H1Color = Color.Blue
htmlformat.H1FontSize = 25
htmlformat.H1TextAlignment = TextAlignment.Center

' Convert PDF to HTML string
Dim html As String = pdf.ToHtmlString()
Console.WriteLine(html)

' Convert PDF to HTML file
pdf.SaveAsHtml("myHtmlConfigured.html", True, "Hello World", htmlFormatOptions:=htmlformat)
$vbLabelText   $csharpLabel

Ten przykład pokazuje, jak stworzyć estetyczny HTML z niestandardowym stylowaniem. Opcje konfiguracji wspolpracuja z silnikiem renderujacym IronPDF w celu uzyskania wysokiej jakosci HTML z zachowaniem wiernosc wizualnej.

Jak sie rozni skonfigurowany wynik?

Cały kod HTML wygenerowany przez metodę SaveAsHtml został umieszczony na poniższej stronie internetowej.

Dłączego wynikowy HTML używa tagow SVG?

Te metody produkuja HTML z ciagami zawierajacymi wbudowane CSS. Wynikowy HTML stosuje tagi SVG zamiast standardowych tagow HTML. Pomimo tej roznicy, generuje prawidłowy HTML, ktory jest poprawnie renderowany w przeglądarkach internetowych. Ciąg HTML zwracany przez tę metodę może różnić się od danych wejściowych HTML w przypadku korzystania z dokumentu PDF renderowanego przy użyciu metody RenderHtmlAsPdf.

Podejscie oparte na SVG zapewnia dokładna reprezentacje zlozonych ukladow PDF, w tym precyzyjne polozenie, czcionki i grafike. Ta metoda działa skutecznie dla PDF-ow z obrazami, wykresami lub zlozonym formatowaniem trudnym do powtorzenia za pomoca standardowych elementow HTML.

Dodatkowy przykład kodu: Konwersja PDF do HTML w pakiecie

Oto przykład konwersji wielu plików PDF do HTML, ktory przetwarza caly katalog plików PDF:

using IronPdf;
using System.IO;

public class BatchPdfToHtmlConverter
{
    public static void ConvertPdfDirectory(string inputDirectory, string outputDirectory)
    {
        // Ensure output directory exists
        Directory.CreateDirectory(outputDirectory);

        // Configure HTML output settings once for consistency
        HtmlFormatOptions formatOptions = new HtmlFormatOptions
        {
            BackgroundColor = Color.WhiteSmoke,
            PdfPageMargin = 15,
            H1FontSize = 28,
            H1TextAlignment = TextAlignment.Left
        };

        // Process all PDF files in the directory
        string[] pdfFiles = Directory.GetFiles(inputDirectory, "*.pdf");

        foreach (string pdfPath in pdfFiles)
        {
            try
            {
                // Load PDF document
                PdfDocument pdf = PdfDocument.FromFile(pdfPath);

                // Generate output filename
                string fileName = Path.GetFileNameWithoutExtension(pdfPath);
                string htmlPath = Path.Combine(outputDirectory, $"{fileName}.html");

                // Convert and save as HTML with consistent formatting
                pdf.SaveAsHtml(htmlPath, true, fileName, htmlFormatOptions: formatOptions);

                Console.WriteLine($"Converted: {fileName}.pdf → {fileName}.html");
            }
            catch (Exception ex)
            {
                Console.WriteLine($"Error converting {pdfPath}: {ex.Message}");
            }
        }
    }
}
using IronPdf;
using System.IO;

public class BatchPdfToHtmlConverter
{
    public static void ConvertPdfDirectory(string inputDirectory, string outputDirectory)
    {
        // Ensure output directory exists
        Directory.CreateDirectory(outputDirectory);

        // Configure HTML output settings once for consistency
        HtmlFormatOptions formatOptions = new HtmlFormatOptions
        {
            BackgroundColor = Color.WhiteSmoke,
            PdfPageMargin = 15,
            H1FontSize = 28,
            H1TextAlignment = TextAlignment.Left
        };

        // Process all PDF files in the directory
        string[] pdfFiles = Directory.GetFiles(inputDirectory, "*.pdf");

        foreach (string pdfPath in pdfFiles)
        {
            try
            {
                // Load PDF document
                PdfDocument pdf = PdfDocument.FromFile(pdfPath);

                // Generate output filename
                string fileName = Path.GetFileNameWithoutExtension(pdfPath);
                string htmlPath = Path.Combine(outputDirectory, $"{fileName}.html");

                // Convert and save as HTML with consistent formatting
                pdf.SaveAsHtml(htmlPath, true, fileName, htmlFormatOptions: formatOptions);

                Console.WriteLine($"Converted: {fileName}.pdf → {fileName}.html");
            }
            catch (Exception ex)
            {
                Console.WriteLine($"Error converting {pdfPath}: {ex.Message}");
            }
        }
    }
}
Imports IronPdf
Imports System.IO

Public Class BatchPdfToHtmlConverter
    Public Shared Sub ConvertPdfDirectory(inputDirectory As String, outputDirectory As String)
        ' Ensure output directory exists
        Directory.CreateDirectory(outputDirectory)

        ' Configure HTML output settings once for consistency
        Dim formatOptions As New HtmlFormatOptions With {
            .BackgroundColor = Color.WhiteSmoke,
            .PdfPageMargin = 15,
            .H1FontSize = 28,
            .H1TextAlignment = TextAlignment.Left
        }

        ' Process all PDF files in the directory
        Dim pdfFiles As String() = Directory.GetFiles(inputDirectory, "*.pdf")

        For Each pdfPath As String In pdfFiles
            Try
                ' Load PDF document
                Dim pdf As PdfDocument = PdfDocument.FromFile(pdfPath)

                ' Generate output filename
                Dim fileName As String = Path.GetFileNameWithoutExtension(pdfPath)
                Dim htmlPath As String = Path.Combine(outputDirectory, $"{fileName}.html")

                ' Convert and save as HTML with consistent formatting
                pdf.SaveAsHtml(htmlPath, True, fileName, htmlFormatOptions:=formatOptions)

                Console.WriteLine($"Converted: {fileName}.pdf → {fileName}.html")
            Catch ex As Exception
                Console.WriteLine($"Error converting {pdfPath}: {ex.Message}")
            End Try
        Next
    End Sub
End Class
$vbLabelText   $csharpLabel

Przyklad konwersji w pakiecie działa w systemach zarządzania zawartościa, archiwach cyfrowych lub aplikacjach, ktore musza udostępnic duza ilosc zawartości PDF w internecie. Aby uzyskać więcej informacji o programowym pracowaniu z PDF, odwiedz nasza sekcje samouczkow.

Często Zadawane Pytania

Jak konwertować plik PDF do HTML w C#?

Z IronPDF możesz konwertować PDF do HTML w C# używając tylko jednej linii kodu: IronPdf.PdfDocument.FromFile("example.pdf").SaveAsHtml("output.html"). Ta metoda wewnętrznie obsługuje złożony proces konwersji, zachowując wizualną strukturę i układ dokumentu PDF.

Jakie są główne korzyści z konwersji PDF do HTML?

Konwersja PDF do HTML w IronPDF oferuje wiele korzyści, w tym ulepszoną dostępność sieciową, responsywny design dla różnych urządzeń, poprawę SEO, bezproblemową integrację z siecią, łatwą edycję treści za pomocą narzędzi webowych, kompatybilność międzyplatformową i wsparcie dla dynamicznych elementów.

Jakie metody są dostępne do konwersji PDF do HTML?

IronPDF oferuje dwie główne metody konwersji PDF do HTML: metodę ToHtmlString, która pozwala na analizę elementów HTML i zwraca HTML jako ciąg znaków, oraz metodę SaveAsHtml, która bezpośrednio zapisuje dokumenty PDF jako pliki HTML. Obie metody zachowują wizualny układ dokumentu PDF.

Czy pola formularzy interaktywnych będą działały po konwersji PDF do HTML?

Nie, podczas używania konwersji PDF do HTML w IronPDF wszystkie interaktywne pola formularzy w oryginalnym PDF nie będą już działały w utworzonym dokumencie HTML. Pola formularzy są renderowane jako statyczna zawartość. Aby zachować funkcjonalność formularzy, powinieneś użyć możliwości edycji formularzy w IronPDF, aby wyodrębnić dane formularza przed konwersją.

Czy mogę dostosować wyjście HTML podczas konwersji z PDF?

Tak, IronPDF pozwala skonfigurować wyjście HTML używając klasy HtmlFormatOptions. Dzięki temu masz kontrolę nad różnymi aspektami procesu konwersji HTML, aby zapewnić, że wynik spełnia określone wymagania.

Curtis Chau
Autor tekstów technicznych

Curtis Chau posiada tytuł licencjata z informatyki (Uniwersytet Carleton) i specjalizuje się w front-endowym rozwoju, z ekspertką w Node.js, TypeScript, JavaScript i React. Pasjonuje się tworzeniem intuicyjnych i estetycznie przyjemnych interfejsów użytkownika, Curtis cieszy się pracą z nowoczesnymi frameworkami i tworzeniem dobrze zorganizowanych, atrakcyjnych wizualnie podrę...

Czytaj więcej
Sprawdzone przez
Jeff Fritz
Jeffrey T. Fritz
Główny Menedżer Programu - Zespół .NET Community
Jeff jest również Głównym Menedżerem Programu dla zespołów .NET i Visual Studio. Jest producentem wykonawczym wirtualnej serii konferencji .NET Conf i prowadzi 'Fritz and Friends', transmisję na żywo dla deweloperów emitowaną dwa razy w tygodniu, gdzie rozmawia o technologii i pisze kod razem z widzami. Jeff pisze warsztaty, prezentacje i planuje treści dla największych wydarzeń Microsoft dla deweloperów, w tym Microsoft Build, Microsoft Ignite, .NET Conf i Microsoft MVP Summit.
Gotowy, aby rozpocząć?
Nuget Pliki do pobrania 18,926,724 | Wersja: 2026.5 just released
Still Scrolling Icon

Wciąż przewijasz?

Czy chcesz szybko dowodu? PM > Install-Package IronPdf
Uruchom przykład i zobacz, jak Twój kod HTML zamienia się w plik PDF.