IronPDFを使ってC#でPDFをHTMLに変換する方法
IronPdfはSaveAsHtmlメソッドを使ってC#でPDFからHTMLへの変換を可能にし、アクセシビリティ、SEO、ウェブ統合を強化するためにPDFをウェブフレンドリーにします。 IronPDFライブラリは、視覚的な構造とレイアウトを維持しながら、PDFコンテンツをHTML形式に変換するための堅牢なソリューションを提供します。
PDFをHTMLに変換すると、次のような利点があります:
- ウェブアクセシビリティの向上
- さまざまなデバイスに対応するレスポンシブデザイン
- 検索エンジン最適化の改善
- シームレスなウェブ統合
- ウェブツールによる簡単なコンテンツ編集
- クロスプラットフォームの互換性
- 動的要素のサポート
この変換プロセスは、PDFコンテンツをWebプラットフォーム用に再利用する場合や、さらなる処理のためにPDFからテキストや画像を抽出する必要がある場合に役立ちます。
IronPDFは.NET C#でのPDFからHTMLへの変換を簡素化し、複雑な変換プロセスを内部で処理するメソッドを提供します。 文書管理システムの構築、ウェブベースのPDFビューアの作成、検索エンジンによるPDFコンテンツの検索可能化など、IronPDFの変換機能は信頼性の高いソリューションを提供します。
クイックスタート: IronPDFを使って即時にPDFをHTMLに変換
IronPDFを使って1行のコードでPDFドキュメントをHTMLファイルに変換します。 この例では、IronPDFのSaveAsHtmlメソッドを使ってPDFをHTMLに高速変換する例を示します。
今すぐ NuGet で PDF を作成してみましょう:
NuGet パッケージ マネージャーを使用して IronPDF をインストールします
このコード スニペットをコピーして実行します。
IronPdf.PdfDocument.FromFile("example.pdf").SaveAsHtml("output.html");実際の環境でテストするためにデプロイする
最小限のワークフロー(5ステップ)
- .NET用IronPdfライブラリをダウンロードする
- 既存のPDF文書を
FromFileメソッドを使って取り込みます。 HtmlFormatOptionsクラスを使用して出力HTMLを設定します。ToHtmlStringメソッドを使ってPDFをHTML文字列に変換します。SaveAsHtmlメソッドを使用してHTMLファイルをエクスポートします。
基本的なPDFをHTMLに変換するには?
ToHtmlStringメソッドは、既存のPDF文書内のHTML要素の解析を可能にします。 デバッグやPDFの比較のためのツールとして機能します。 SaveAsHtmlメソッドは、PDF文書を直接HTMLファイルとして保存します。 どちらのアプローチも、特定のニーズに柔軟に対応します。
PDFからHTMLへの変換プロセスでは、PDF文書の視覚的なレイアウトを維持しながら、Webアプリケーション用のHTML出力を作成します。 PDFファイルをダウンロードしたり、リーダープラグインをインストールしたりすることなく、ウェブブラウザでPDFコンテンツを表示する必要がある場合に役立ちます。
BRACKET-i-OPEN--注意:元のPDFのすべてのインタラクティブなフォームフィールドは、結果のHTMLドキュメントでは機能しなくなります。
PDFフォームを扱う開発者のために、変換プロセスではフォームフィールドを静的コンテンツとしてレンダリングします。 フォームの機能を維持するために、変換前にIronPDFのフォーム編集機能を使ってフォームデータを抽出することを検討してください。
サンプルPDFはどのようなものですか?
どのように変換コードを実装すればよいですか?
:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html.csusing IronPdf;
using System;
PdfDocument pdf = PdfDocument.FromFile("sample.pdf");
// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);
// Convert PDF to HTML file
pdf.SaveAsHtml("myHtml.html");コードは、PDFからHTMLへの変換のための2つの主要な方法を示しています。 ToHtmlStringメソッドは、HTMLコンテンツをプログラムで処理する必要がある場合に機能し、SaveAsHtmlはファイルを直接生成します。 複数のPDFについては、同様の手法で一括処理します。
出力されたHTMLはどのように見えますか?
SaveAsHtmlメソッドから生成された完全な出力HTMLが以下のウェブサイトに入力されています。
高度な PDF to HTML オプションはどのように設定できますか?
ToHtmlStringとSaveAsHtmlメソッドの両方は、HtmlFormatOptionsクラスを通して設定オプションを提供します。 この設定システムは、生成されたHTML出力の外観と動作をカスタマイズします。 利用可能なプロパティは次のとおりです:
- BackgroundColor:HTML出力の背景色を設定します。
- PdfPageMargin: ページの余白をピクセル単位で設定します。
以下のプロパティは、ToHtmlStringとSaveAsHtmlメソッドの'title'パラメータに適用されます。 元のPDFのタイトルを変更することなく、コンテンツの最初に新しいタイトルを追加します:
- H1Color:タイトルの色を設定します。
- H1FontSize:タイトルのフォントサイズをピクセル単位で設定します。
- H1TextAlignment:タイトルの配置を設定します(左、中央、または右)。
カスタム用紙サイズや特定のページの向きで作業している開発者のために、これらの設定オプションは、HTML出力が意図された視覚構造を維持することを保証します。
どのような設定オプションがありますか?
:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html-advanced-settings.csusing IronPdf;
using IronSoftware.Drawing;
using System;
PdfDocument pdf = PdfDocument.FromFile("sample.pdf");
// PDF to HTML configuration options
HtmlFormatOptions htmlformat = new HtmlFormatOptions();
htmlformat.BackgroundColor = Color.White;
htmlformat.PdfPageMargin = 10;
htmlformat.H1Color = Color.Blue;
htmlformat.H1FontSize = 25;
htmlformat.H1TextAlignment = TextAlignment.Center;
// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);
// Convert PDF to HTML file
pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);この例では、カスタムスタイルで洗練されたHTML出力を作成する方法を示します。 設定オプションはIronPDFのレンダリングエンジンと連動し、視覚的忠実性を維持した高品質のHTMLを生成します。
設定された出力はどのように違いますか?
SaveAsHtmlメソッドから生成された完全な出力HTMLが以下のウェブサイトに入力されています。
なぜ HTML 出力では SVG タグを使用するのですか?
これらの方法は、インラインCSSを含むHTML文字列を生成します。 出力されるHTMLには、標準的なHTMLタグの代わりにSVGタグが使用されています。 このような違いにもかかわらず、ウェブブラウザで正しく表示される有効なHTMLを作成します。 RenderHtmlAsPdfメソッドを使用してレンダリングされたPDFドキュメントを使用する場合、このメソッドから返されるHTML文字列は、HTML入力と異なる場合があります。
SVGベースのアプローチにより、正確な位置、フォント、グラフィックなど、複雑なPDFレイアウトの正確な表現が保証されます。 この方法は、画像や図表、標準的なHTML要素では再現が難しい複雑な書式を含むPDFに効果的です。
追加のコード例:バッチ PDF から HTML への変換
複数のPDFをHTMLに変換するために、PDFファイルのディレクトリ全体を処理する例を示します:
using IronPdf;
using System.IO;
public class BatchPdfToHtmlConverter
{
public static void ConvertPdfDirectory(string inputDirectory, string outputDirectory)
{
// Ensure output directory exists
Directory.CreateDirectory(outputDirectory);
// Configure HTML output settings once for consistency
HtmlFormatOptions formatOptions = new HtmlFormatOptions
{
BackgroundColor = Color.WhiteSmoke,
PdfPageMargin = 15,
H1FontSize = 28,
H1TextAlignment = TextAlignment.Left
};
// Process all PDF files in the directory
string[] pdfFiles = Directory.GetFiles(inputDirectory, "*.pdf");
foreach (string pdfPath in pdfFiles)
{
try
{
// Load PDF document
PdfDocument pdf = PdfDocument.FromFile(pdfPath);
// Generate output filename
string fileName = Path.GetFileNameWithoutExtension(pdfPath);
string htmlPath = Path.Combine(outputDirectory, $"{fileName}.html");
// Convert and save as HTML with consistent formatting
pdf.SaveAsHtml(htmlPath, true, fileName, htmlFormatOptions: formatOptions);
Console.WriteLine($"Converted: {fileName}.pdf → {fileName}.html");
}
catch (Exception ex)
{
Console.WriteLine($"Error converting {pdfPath}: {ex.Message}");
}
}
}
}using IronPdf;
using System.IO;
public class BatchPdfToHtmlConverter
{
public static void ConvertPdfDirectory(string inputDirectory, string outputDirectory)
{
// Ensure output directory exists
Directory.CreateDirectory(outputDirectory);
// Configure HTML output settings once for consistency
HtmlFormatOptions formatOptions = new HtmlFormatOptions
{
BackgroundColor = Color.WhiteSmoke,
PdfPageMargin = 15,
H1FontSize = 28,
H1TextAlignment = TextAlignment.Left
};
// Process all PDF files in the directory
string[] pdfFiles = Directory.GetFiles(inputDirectory, "*.pdf");
foreach (string pdfPath in pdfFiles)
{
try
{
// Load PDF document
PdfDocument pdf = PdfDocument.FromFile(pdfPath);
// Generate output filename
string fileName = Path.GetFileNameWithoutExtension(pdfPath);
string htmlPath = Path.Combine(outputDirectory, $"{fileName}.html");
// Convert and save as HTML with consistent formatting
pdf.SaveAsHtml(htmlPath, true, fileName, htmlFormatOptions: formatOptions);
Console.WriteLine($"Converted: {fileName}.pdf → {fileName}.html");
}
catch (Exception ex)
{
Console.WriteLine($"Error converting {pdfPath}: {ex.Message}");
}
}
}
}このバッチ変換の例は、コンテンツ管理システム、デジタルアーカイブ、または大量のPDFコンテンツにWeb上でアクセスできるようにする必要があるアプリケーションに適しています。 プログラムでPDFを扱う方法についての詳細は、チュートリアルセクションをご覧ください。
よくある質問
C#でPDFファイルをHTMLに変換するには?
IronPdfを使えば、たった1行のコードでC#でPDFをHTMLに変換することができます:IronPdf.PdfDocument.FromFile("example.pdf").SaveAsHtml("output.html").このメソッドは複雑な変換処理を内部で処理し、PDFドキュメントの視覚的な構造とレイアウトを維持します。
PDFをHTMLに変換する主な利点は何ですか?
IronPDFのPDFからHTMLへの変換は、ウェブアクセシビリティの向上、様々なデバイスに対応したレスポンシブデザイン、SEOの改善、シームレスなウェブ統合、ウェブツールによる簡単なコンテンツ編集、クロスプラットフォーム互換性、動的要素のサポートなど、いくつかの利点を提供します。
PDF から HTML への変換にはどのような方法がありますか?
IronPDFはPDFからHTMLへの変換に2つの主要なメソッドを提供します: HTML要素を解析し、HTMLを文字列として返すToHtmlStringメソッドと、PDFドキュメントを直接HTMLファイルとして保存するSaveAsHtmlメソッドです。どちらのメソッドもPDF文書の視覚的レイアウトを保持します。
PDFをHTMLに変換した後、インタラクティブなフォームフィールドは機能しますか?
IronPdfのPDFからHTMLへの変換では、元のPDFのすべてのインタラクティブなフォームフィールドは、結果のHTMLドキュメントでは機能しなくなります。フォームフィールドは静的コンテンツとしてレンダリングされます。フォームの機能を維持するためには、変換前にIronPDFのフォーム編集機能を使ってフォームデータを抽出する必要があります。
PDFからの変換時にHTML出力をカスタマイズできますか?
はい、IronPDFではHtmlFormatOptionsクラスを使って出力HTMLを設定することができます。これにより、HTML変換プロセスのさまざまな側面を制御し、出力が特定の要件を満たすようにすることができます。







