IronPDFを使ってC#でPDFをHTMLに変換する方法
IronPDF は、SaveAsHtml メソッドを使用して 1 行のコードで C# で PDF から HTML への変換を可能にし、PDF を Web 対応にしてアクセシビリティ、SEO、および Web 統合を強化します。 IronPDFライブラリは、視覚的な構造とレイアウトを維持しながら、PDFコンテンツをHTML形式に変換するための堅牢なソリューションを提供します。
PDFをHTMLに変換すると、次のような利点があります:
- ウェブアクセシビリティの向上
- さまざまなデバイスに対応するレスポンシブデザイン
- 検索エンジン最適化の改善
- シームレスなウェブ統合
- ウェブツールによる簡単なコンテンツ編集
- クロスプラットフォームの互換性
- 動的要素のサポート
この変換プロセスは、PDFコンテンツをWebプラットフォーム用に再利用する場合や、さらなる処理のためにPDFからテキストや画像を抽出する必要がある場合に役立ちます。
IronPDFは.NET C#でのPDFからHTMLへの変換を簡素化し、複雑な変換プロセスを内部で処理するメソッドを提供します。 文書管理システムの構築、ウェブベースのPDFビューアの作成、検索エンジンによるPDFコンテンツの検索可能化など、IronPDFの変換機能は信頼性の高いソリューションを提供します。
クイックスタート: IronPDFでPDF変換(PDFをHTMLに)を瞬時に実行する
IronPDFを使って1行のコードでPDFドキュメントをHTMLファイルに変換します。 この例では、IronPDF の SaveAsHtml メソッドを使用して PDF から HTML への高速変換を行う方法を示します。
最小限のワークフロー(5ステップ)
- .NET用IronPdfライブラリをダウンロードする
- 既存のPDF文書を`FromFile`メソッドを使って取り込みます。
- **`HtmlFormatOptions`**クラスを使用して出力HTMLを設定します。
- `ToHtmlString`メソッドを使ってPDFをHTML文字列に変換します。
- `SaveAsHtml`メソッドを使用してHTMLファイルをエクスポートします。
基本的なPDFをHTMLに変換するには?
ToHtmlString メソッドを使用すると、既存の PDF ドキュメント内の HTML 要素を分析できます。 デバッグやPDFの比較のためのツールとして機能します。 SaveAsHtml メソッドは、PDF ドキュメントを HTML ファイルとして直接保存します。 どちらのアプローチも、特定のニーズに柔軟に対応します。
PDFからHTMLへの変換プロセスでは、PDF文書の視覚的なレイアウトを維持しながら、Webアプリケーション用のHTML出力を作成します。 PDFファイルをダウンロードしたり、リーダープラグインをインストールしたりすることなく、ウェブブラウザでPDFコンテンツを表示する必要がある場合に役立ちます。
PDFフォームを扱う開発者のために、変換プロセスではフォームフィールドを静的コンテンツとしてレンダリングします。 フォームの機能を維持するために、変換前にIronPDFのフォーム編集機能を使ってフォームデータを抽出することを検討してください。
サンプルPDFはどのようなものですか?
どのように変換コードを実装すればよいですか?
:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html.cs
using IronPdf;
using System;
PdfDocument pdf = PdfDocument.FromFile("sample.pdf");
// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);
// Convert PDF to HTML file
pdf.SaveAsHtml("myHtml.html");
Imports IronPdf
Imports System
Dim pdf As PdfDocument = PdfDocument.FromFile("sample.pdf")
' Convert PDF to HTML string
Dim html As String = pdf.ToHtmlString()
Console.WriteLine(html)
' Convert PDF to HTML file
pdf.SaveAsHtml("myHtml.html")
コードは、PDFからHTMLへの変換のための2つの主要な方法を示しています。 ToHtmlString メソッドは HTML コンテンツをプログラムで処理する必要がある場合に機能し、SaveAsHtml はファイルを直接生成します。 複数のPDFについては、同様の手法で一括処理します。
出力されたHTMLはどのように見えますか?
SaveAsHtml メソッドから生成された出力 HTML 全体が以下の Web サイトに入力されています。
高度な PDF to HTML オプションはどのように設定できますか?
ToHtmlString メソッドと SaveAsHtml メソッドはどちらも、HtmlFormatOptions クラスを通じて構成オプションを提供します。 この設定システムは、生成されたHTML出力の外観と動作をカスタマイズします。 利用可能なプロパティは次のとおりです:
- BackgroundColor:HTML出力の背景色を設定します。
- PdfPageMargin: ページの余白をピクセル単位で設定します。
以下のプロパティは、ToHtmlString および SaveAsHtml メソッドの 'title' パラメータに適用されます。 元のPDFのタイトルを変更することなく、コンテンツの最初に新しいタイトルを追加します:
- H1Color:タイトルの色を設定します。
- H1FontSize:タイトルのフォントサイズをピクセル単位で設定します。
- H1TextAlignment:タイトルの配置を設定します(左、中央、または右)。
カスタム用紙サイズや特定のページの向きで作業している開発者のために、これらの設定オプションは、HTML出力が意図された視覚構造を維持することを保証します。
どのような設定オプションがありますか?
:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html-advanced-settings.cs
using IronPdf;
using IronSoftware.Drawing;
using System;
PdfDocument pdf = PdfDocument.FromFile("sample.pdf");
// PDF to HTML configuration options
HtmlFormatOptions htmlformat = new HtmlFormatOptions();
htmlformat.BackgroundColor = Color.White;
htmlformat.PdfPageMargin = 10;
htmlformat.H1Color = Color.Blue;
htmlformat.H1FontSize = 25;
htmlformat.H1TextAlignment = TextAlignment.Center;
// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);
// Convert PDF to HTML file
pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);
Imports IronPdf
Imports IronSoftware.Drawing
Imports System
Dim pdf As PdfDocument = PdfDocument.FromFile("sample.pdf")
' PDF to HTML configuration options
Dim htmlformat As New HtmlFormatOptions()
htmlformat.BackgroundColor = Color.White
htmlformat.PdfPageMargin = 10
htmlformat.H1Color = Color.Blue
htmlformat.H1FontSize = 25
htmlformat.H1TextAlignment = TextAlignment.Center
' Convert PDF to HTML string
Dim html As String = pdf.ToHtmlString()
Console.WriteLine(html)
' Convert PDF to HTML file
pdf.SaveAsHtml("myHtmlConfigured.html", True, "Hello World", htmlFormatOptions:=htmlformat)
この例では、カスタムスタイルで洗練されたHTML出力を作成する方法を示します。 設定オプションはIronPDFのレンダリングエンジンと連動し、視覚的忠実性を維持した高品質のHTMLを生成します。
設定された出力はどのように違いますか?
SaveAsHtml メソッドから生成された出力 HTML 全体が以下の Web サイトに入力されています。
なぜ HTML 出力では SVG タグを使用するのですか?
これらの方法は、インラインCSSを含むHTML文字列を生成します。 出力されるHTMLには、標準的なHTMLタグの代わりにSVGタグが使用されています。 このような違いにもかかわらず、ウェブブラウザで正しく表示される有効なHTMLを作成します。 RenderHtmlAsPdfメソッドを使用してレンダリングされたPDFドキュメントを使用する場合、このメソッドから返されるHTML文字列は、HTML入力と異なる場合があります。
SVGベースのアプローチにより、正確な位置、フォント、グラフィックなど、複雑なPDFレイアウトの正確な表現が保証されます。 この方法は、画像や図表、標準的なHTML要素では再現が難しい複雑な書式を含むPDFに効果的です。
追加のコード例:バッチ PDF から HTML への変換
複数のPDFをHTMLに変換するために、PDFファイルのディレクトリ全体を処理する例を示します:
using IronPdf;
using System.IO;
public class BatchPdfToHtmlConverter
{
public static void ConvertPdfDirectory(string inputDirectory, string outputDirectory)
{
// Ensure output directory exists
Directory.CreateDirectory(outputDirectory);
// Configure HTML output settings once for consistency
HtmlFormatOptions formatOptions = new HtmlFormatOptions
{
BackgroundColor = Color.WhiteSmoke,
PdfPageMargin = 15,
H1FontSize = 28,
H1TextAlignment = TextAlignment.Left
};
// Process all PDF files in the directory
string[] pdfFiles = Directory.GetFiles(inputDirectory, "*.pdf");
foreach (string pdfPath in pdfFiles)
{
try
{
// Load PDF document
PdfDocument pdf = PdfDocument.FromFile(pdfPath);
// Generate output filename
string fileName = Path.GetFileNameWithoutExtension(pdfPath);
string htmlPath = Path.Combine(outputDirectory, $"{fileName}.html");
// Convert and save as HTML with consistent formatting
pdf.SaveAsHtml(htmlPath, true, fileName, htmlFormatOptions: formatOptions);
Console.WriteLine($"Converted: {fileName}.pdf → {fileName}.html");
}
catch (Exception ex)
{
Console.WriteLine($"Error converting {pdfPath}: {ex.Message}");
}
}
}
}
using IronPdf;
using System.IO;
public class BatchPdfToHtmlConverter
{
public static void ConvertPdfDirectory(string inputDirectory, string outputDirectory)
{
// Ensure output directory exists
Directory.CreateDirectory(outputDirectory);
// Configure HTML output settings once for consistency
HtmlFormatOptions formatOptions = new HtmlFormatOptions
{
BackgroundColor = Color.WhiteSmoke,
PdfPageMargin = 15,
H1FontSize = 28,
H1TextAlignment = TextAlignment.Left
};
// Process all PDF files in the directory
string[] pdfFiles = Directory.GetFiles(inputDirectory, "*.pdf");
foreach (string pdfPath in pdfFiles)
{
try
{
// Load PDF document
PdfDocument pdf = PdfDocument.FromFile(pdfPath);
// Generate output filename
string fileName = Path.GetFileNameWithoutExtension(pdfPath);
string htmlPath = Path.Combine(outputDirectory, $"{fileName}.html");
// Convert and save as HTML with consistent formatting
pdf.SaveAsHtml(htmlPath, true, fileName, htmlFormatOptions: formatOptions);
Console.WriteLine($"Converted: {fileName}.pdf → {fileName}.html");
}
catch (Exception ex)
{
Console.WriteLine($"Error converting {pdfPath}: {ex.Message}");
}
}
}
}
Imports IronPdf
Imports System.IO
Public Class BatchPdfToHtmlConverter
Public Shared Sub ConvertPdfDirectory(inputDirectory As String, outputDirectory As String)
' Ensure output directory exists
Directory.CreateDirectory(outputDirectory)
' Configure HTML output settings once for consistency
Dim formatOptions As New HtmlFormatOptions With {
.BackgroundColor = Color.WhiteSmoke,
.PdfPageMargin = 15,
.H1FontSize = 28,
.H1TextAlignment = TextAlignment.Left
}
' Process all PDF files in the directory
Dim pdfFiles As String() = Directory.GetFiles(inputDirectory, "*.pdf")
For Each pdfPath As String In pdfFiles
Try
' Load PDF document
Dim pdf As PdfDocument = PdfDocument.FromFile(pdfPath)
' Generate output filename
Dim fileName As String = Path.GetFileNameWithoutExtension(pdfPath)
Dim htmlPath As String = Path.Combine(outputDirectory, $"{fileName}.html")
' Convert and save as HTML with consistent formatting
pdf.SaveAsHtml(htmlPath, True, fileName, htmlFormatOptions:=formatOptions)
Console.WriteLine($"Converted: {fileName}.pdf → {fileName}.html")
Catch ex As Exception
Console.WriteLine($"Error converting {pdfPath}: {ex.Message}")
End Try
Next
End Sub
End Class
このバッチ変換の例は、コンテンツ管理システム、デジタルアーカイブ、または大量のPDFコンテンツにWeb上でアクセスできるようにする必要があるアプリケーションに適しています。 プログラムでPDFを扱う方法についての詳細は、チュートリアルセクションをご覧ください。
よくある質問
C#でPDFファイルをHTMLに変換するには?
IronPDFを使えば、たった1行のコードでC#でPDFをHTMLに変換することができます:IronPdf.PdfDocument.FromFile("example.pdf").SaveAsHtml("output.html").このメソッドは複雑な変換処理を内部で処理し、PDFドキュメントの視覚的な構造とレイアウトを維持します。
PDFをHTMLに変換する主な利点は何ですか?
IronPDFのPDFからHTMLへの変換は、ウェブアクセシビリティの向上、様々なデバイスに対応したレスポンシブデザイン、SEOの改善、シームレスなウェブ統合、ウェブツールによる簡単なコンテンツ編集、クロスプラットフォーム互換性、動的要素のサポートなど、いくつかの利点を提供します。
PDF から HTML への変換にはどのような方法がありますか?
IronPDFはPDFからHTMLへの変換に2つの主要なメソッドを提供します: HTML要素を解析し、HTMLを文字列として返すToHtmlStringメソッドと、PDFドキュメントを直接HTMLファイルとして保存するSaveAsHtmlメソッドです。どちらのメソッドもPDF文書の視覚的レイアウトを保持します。
PDFをHTMLに変換した後、インタラクティブなフォームフィールドは機能しますか?
IronPDFのPDFからHTMLへの変換では、元のPDFのすべてのインタラクティブなフォームフィールドは、結果のHTMLドキュメントでは機能しなくなります。フォームフィールドは静的コンテンツとしてレンダリングされます。フォームの機能を維持するためには、変換前にIronPDFのフォーム編集機能を使ってフォームデータを抽出する必要があります。
PDFからの変換時にHTML出力をカスタマイズできますか?
はい、IronPDFではHtmlFormatOptionsクラスを使って出力HTMLを設定することができます。これにより、HTML変換プロセスのさまざまな側面を制御し、出力が特定の要件を満たすようにすることができます。

