Jak przekonwertować plik PDF na HTML w języku C# za pomocą IronPDF
IronPDF umozliwia konwersje PDF do HTML w C# przy uzyciu jednej linii kodu z metoda SaveAsHtml, co sprawia, ze PDF-y sa przyjazne dla webu i poprawiaja dostepnosc, SEO oraz integracje z siecia. Biblioteka IronPDF zapewnia solidne rozwiązanie do przekształcania treści PDF do formatu HTML przy zachowaniu struktury wizualnej i układu.
Konwersja plików PDF do formatu HTML oferuje następujące korzyści:
- Ulepszona dostępność stron internetowych
- Responsywny projekt dostosowany do różnych urządzeń
- Ulepszona optymalizacja pod kątem wyszukiwarek
- Płynna integracja z internetem
- Łatwa edycja treści za pomocą narzędzi internetowych
- Kompatybilność międzyplatformowa
- Obsługa elementów dynamicznych
Ten proces konwersji jest pomocny podczas dostosowywania treści PDF do platform internetowych lub gdy trzeba wyodrębnić tekst i obrazy z plików PDF w celu dalszego przetwarzania.
IronPDF upraszcza konwersję plików PDF do HTML w środowisku .NET C#, udostępniając metody, które wewnętrznie obsługują złożony proces konwersji. Niezależnie od tego, czy tworzysz system zarządzania dokumentami, internetową przeglądarkę plików PDF, czy też chcesz, aby treści PDF były indeksowane przez wyszukiwarki, możliwości konwersji IronPDF oferują niezawodne rozwiązanie.
Szybki start: Natychmiastowa konwersja plików PDF do formatu HTML za pomocą IronPDF
Przekształcaj dokumenty PDF w pliki HTML za pomocą jednej linii kodu, korzystając z IronPDF. Ten przyklad demonstruje uzycie metody SaveAsHtml z IronPDF do szybkiej konwersji PDF do HTML.
-
Install IronPDF with NuGet Package Manager
PM > Install-Package IronPdf -
Skopiuj i uruchom ten fragment kodu.
IronPdf.PdfDocument.FromFile("example.pdf").SaveAsHtml("output.html"); -
Wdrożenie do testowania w środowisku produkcyjnym
Rozpocznij używanie IronPDF w swoim projekcie już dziś z darmową wersją próbną
Minimalny proces (5 kroków)
- Pobierz bibliotekę IronPDF for .NET
- Zaimportuj istniejący dokument PDF za pomocą metody
FromFile - Skonfiguruj wyjściowy kod HTML za pomocą klasy
HtmlFormatOptions - Konwertuj plik PDF na ciąg znaków HTML za pomocą metody
ToHtmlString - Wyeksportuj plik HTML za pomocą metody
SaveAsHtml
Jak przekonwertować zwykły plik PDF na HTML?
Metoda ToHtmlString pozwala na analize elementow HTML w istniejacych dokumentach PDF. Służy jako narzędzie do debugowania lub porównywania plików PDF. Metoda SaveAsHtml zapisuje dokumenty PDF bezposrednio jako pliki HTML. Oba podejścia zapewniają elastyczność w zależności od konkretnych potrzeb.
Proces konwersji plików PDF do HTML zachowuje układ wizualny dokumentów PDF, tworząc jednocześnie kod HTML przeznaczony dla aplikacji internetowych. Jest to pomocne, gdy chcesz wyświetlać zawartość plików PDF w przeglądarkach internetowych bez konieczności pobierania pliku PDF lub instalowania wtyczek do czytania.
W przypadku programistów pracujących z formularzami PDF proces konwersji renderuje pola formularza jako treść statyczną. Aby zachować funkcjonalność formularzy, warto rozważyć użycie funkcji edycji formularzy IronPDF do wyodrębnienia danych z formularzy przed konwersją.
Jak wygląda przykładowy plik PDF?
Jak zaimplementować kod konwersji?
:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html.cs
using IronPdf;
using System;
PdfDocument pdf = PdfDocument.FromFile("sample.pdf");
// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);
// Convert PDF to HTML file
pdf.SaveAsHtml("myHtml.html");
Imports IronPdf
Imports System
Dim pdf As PdfDocument = PdfDocument.FromFile("sample.pdf")
' Convert PDF to HTML string
Dim html As String = pdf.ToHtmlString()
Console.WriteLine(html)
' Convert PDF to HTML file
pdf.SaveAsHtml("myHtml.html")
Kod przedstawia dwie podstawowe metody konwersji plików PDF do formatu HTML. Metoda ToHtmlString dziala, gdy potrzebujesz przetworzyc zawartosc HTML programowo, podczas gdy metoda SaveAsHtml generuje pliki bezposrednio. W przypadku wielu plików PDF należy przetwarzać je partiami, stosując podobne techniki.
Jak wygląda wynikowy kod HTML?
Caly wygenerowany HTML z metody SaveAsHtml zostal umieszczony na stronie ponizej.
Jak moge skonfigurowac zaawansowane opcje PDF do HTML?
Zarowno metody ToHtmlString jak i SaveAsHtml oferuja opcje konfiguracji poprzez klase HtmlFormatOptions. Ten system konfiguracji dostosowuje wyglad oraz zachowanie wygenerowanego HTML. Dostepne wlasciwosci to:
- BackgroundColor: Ustawia kolor tla HTML
- PdfPageMargin: Ustawia marginesy stron w pikselach
Ponizsze wlasciwosci odnosza sie do parametru 'title' w metodach ToHtmlString i SaveAsHtml. Dodaja nowy tytul na poczatku zawartosci, nie modyfikujac oryginalnego tytulu PDF:
- H1Color: Ustawia kolor tytulu
- H1FontSize: Ustawia rozmiar czcionki tytulu w pikselach
- H1TextAlignment: Ustawia wyrownanie tytulu (lewy, srodek lub prawy)
Dla programistow pracujacych z niestandardowymi rozmiarami papieru lub specyficznymi orientacjami stron, te opcje konfiguracji zapewniaja, ze HTML zachowuje zamierzona strukture wizualna.
Jakie opcje konfiguracyjne są dostępne?
:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html-advanced-settings.cs
using IronPdf;
using IronSoftware.Drawing;
using System;
PdfDocument pdf = PdfDocument.FromFile("sample.pdf");
// PDF to HTML configuration options
HtmlFormatOptions htmlformat = new HtmlFormatOptions();
htmlformat.BackgroundColor = Color.White;
htmlformat.PdfPageMargin = 10;
htmlformat.H1Color = Color.Blue;
htmlformat.H1FontSize = 25;
htmlformat.H1TextAlignment = TextAlignment.Center;
// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);
// Convert PDF to HTML file
pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);
Imports IronPdf
Imports IronSoftware.Drawing
Imports System
Dim pdf As PdfDocument = PdfDocument.FromFile("sample.pdf")
' PDF to HTML configuration options
Dim htmlformat As New HtmlFormatOptions()
htmlformat.BackgroundColor = Color.White
htmlformat.PdfPageMargin = 10
htmlformat.H1Color = Color.Blue
htmlformat.H1FontSize = 25
htmlformat.H1TextAlignment = TextAlignment.Center
' Convert PDF to HTML string
Dim html As String = pdf.ToHtmlString()
Console.WriteLine(html)
' Convert PDF to HTML file
pdf.SaveAsHtml("myHtmlConfigured.html", True, "Hello World", htmlFormatOptions:=htmlformat)
Ten przyklad pokazuje, jak stworzyc estetyczny HTML z niestandardowym stylowaniem. Opcje konfiguracji wspolpracuja z silnikiem renderujacym IronPDF w celu uzyskania wysokiej jakosci HTML z zachowaniem wiernosc wizualnej.
Jak sie rozni skonfigurowany wynik?
Caly wygenerowany HTML z metody SaveAsHtml zostal umieszczony na stronie ponizej.
Dlaczego wynikowy HTML uzywa tagow SVG?
Te metody produkuja HTML z ciagami zawierajacymi wbudowane CSS. Wynikowy HTML stosuje tagi SVG zamiast standardowych tagow HTML. Pomimo tej roznicy, generuje prawidlowy HTML, ktory jest poprawnie renderowany w przegladarkach internetowych. Zwracany ciag HTML z tej metody moze sie roznic od wprowadzonego HTML przy uzyciu dokumentu PDF renderowanego metoda RenderHtmlAsPdf.
Podejscie oparte na SVG zapewnia dokladna reprezentacje zlozonych ukladow PDF, w tym precyzyjne polozenie, czcionki i grafike. Ta metoda dziala skutecznie dla PDF-ow z obrazami, wykresami lub zlozonym formatowaniem trudnym do powtorzenia za pomoca standardowych elementow HTML.
Dodatkowy przyklad kodu: Konwersja PDF do HTML w pakiecie
Oto przyklad konwersji wielu plikow PDF do HTML, ktory przetwarza caly katalog plikow PDF:
using IronPdf;
using System.IO;
public class BatchPdfToHtmlConverter
{
public static void ConvertPdfDirectory(string inputDirectory, string outputDirectory)
{
// Ensure output directory exists
Directory.CreateDirectory(outputDirectory);
// Configure HTML output settings once for consistency
HtmlFormatOptions formatOptions = new HtmlFormatOptions
{
BackgroundColor = Color.WhiteSmoke,
PdfPageMargin = 15,
H1FontSize = 28,
H1TextAlignment = TextAlignment.Left
};
// Process all PDF files in the directory
string[] pdfFiles = Directory.GetFiles(inputDirectory, "*.pdf");
foreach (string pdfPath in pdfFiles)
{
try
{
// Load PDF document
PdfDocument pdf = PdfDocument.FromFile(pdfPath);
// Generate output filename
string fileName = Path.GetFileNameWithoutExtension(pdfPath);
string htmlPath = Path.Combine(outputDirectory, $"{fileName}.html");
// Convert and save as HTML with consistent formatting
pdf.SaveAsHtml(htmlPath, true, fileName, htmlFormatOptions: formatOptions);
Console.WriteLine($"Converted: {fileName}.pdf → {fileName}.html");
}
catch (Exception ex)
{
Console.WriteLine($"Error converting {pdfPath}: {ex.Message}");
}
}
}
}
using IronPdf;
using System.IO;
public class BatchPdfToHtmlConverter
{
public static void ConvertPdfDirectory(string inputDirectory, string outputDirectory)
{
// Ensure output directory exists
Directory.CreateDirectory(outputDirectory);
// Configure HTML output settings once for consistency
HtmlFormatOptions formatOptions = new HtmlFormatOptions
{
BackgroundColor = Color.WhiteSmoke,
PdfPageMargin = 15,
H1FontSize = 28,
H1TextAlignment = TextAlignment.Left
};
// Process all PDF files in the directory
string[] pdfFiles = Directory.GetFiles(inputDirectory, "*.pdf");
foreach (string pdfPath in pdfFiles)
{
try
{
// Load PDF document
PdfDocument pdf = PdfDocument.FromFile(pdfPath);
// Generate output filename
string fileName = Path.GetFileNameWithoutExtension(pdfPath);
string htmlPath = Path.Combine(outputDirectory, $"{fileName}.html");
// Convert and save as HTML with consistent formatting
pdf.SaveAsHtml(htmlPath, true, fileName, htmlFormatOptions: formatOptions);
Console.WriteLine($"Converted: {fileName}.pdf → {fileName}.html");
}
catch (Exception ex)
{
Console.WriteLine($"Error converting {pdfPath}: {ex.Message}");
}
}
}
}
Imports IronPdf
Imports System.IO
Public Class BatchPdfToHtmlConverter
Public Shared Sub ConvertPdfDirectory(inputDirectory As String, outputDirectory As String)
' Ensure output directory exists
Directory.CreateDirectory(outputDirectory)
' Configure HTML output settings once for consistency
Dim formatOptions As New HtmlFormatOptions With {
.BackgroundColor = Color.WhiteSmoke,
.PdfPageMargin = 15,
.H1FontSize = 28,
.H1TextAlignment = TextAlignment.Left
}
' Process all PDF files in the directory
Dim pdfFiles As String() = Directory.GetFiles(inputDirectory, "*.pdf")
For Each pdfPath As String In pdfFiles
Try
' Load PDF document
Dim pdf As PdfDocument = PdfDocument.FromFile(pdfPath)
' Generate output filename
Dim fileName As String = Path.GetFileNameWithoutExtension(pdfPath)
Dim htmlPath As String = Path.Combine(outputDirectory, $"{fileName}.html")
' Convert and save as HTML with consistent formatting
pdf.SaveAsHtml(htmlPath, True, fileName, htmlFormatOptions:=formatOptions)
Console.WriteLine($"Converted: {fileName}.pdf → {fileName}.html")
Catch ex As Exception
Console.WriteLine($"Error converting {pdfPath}: {ex.Message}")
End Try
Next
End Sub
End Class
Przyklad konwersji w pakiecie dziala w systemach zarzadzania zawartoscia, archiwach cyfrowych lub aplikacjach, ktore musza udostepnic duza ilosc zawartosci PDF w internecie. Aby uzyskac wiecej informacji o programowym pracowaniu z PDF, odwiedz nasza sekcje samouczkow.
Często Zadawane Pytania
How do I convert a PDF file to HTML in C#?
With IronPDF, you can convert a PDF to HTML in C# using just one line of code: IronPdf.PdfDocument.FromFile("example.pdf").SaveAsHtml("output.html"). This method handles the complex conversion process internally while maintaining the visual structure and layout of your PDF document.
What are the main benefits of converting PDF to HTML?
IronPDF's PDF to HTML conversion provides several benefits including enhanced web accessibility, responsive design for different devices, improved SEO, seamless web integration, easy content editing via web tools, cross-platform compatibility, and support for dynamic elements.
What methods are available for PDF to HTML conversion?
IronPDF provides two main methods for PDF to HTML conversion: the ToHtmlString method which allows analysis of HTML elements and returns the HTML as a string, and the SaveAsHtml method which directly saves PDF documents as HTML files. Both methods preserve the visual layout of the PDF document.
Will interactive form fields work after converting PDF to HTML?
No, when using IronPDF's PDF to HTML conversion, all interactive form fields in the original PDF will no longer be functional in the resulting HTML document. The form fields are rendered as static content. To maintain form functionality, you should use IronPDF's form editing capabilities to extract form data before conversion.
Can I customize the HTML output when converting from PDF?
Yes, IronPDF allows you to configure the output HTML using the HtmlFormatOptions class. This gives you control over various aspects of the HTML conversion process to ensure the output meets your specific requirements.

