HTMLにPDFを変換する方法
PDFをHTMLに変換することは、多くの利点を提供します。ユーザーに対するウェブのアクセシビリティの向上、さまざまなデバイスへの応答性、検索エンジン最適化(SEO)の改善、シームレスなウェブ統合、ウェブベースのツールやCMSを通じたコンテンツ編集の容易さ、クロスプラットフォーム互換性、動的要素やマルチメディアの活用能力などが含まれます。
IronPDFは、.NET C#でPDFをHTMLに変換するプロセスを簡素化します。
IronPDFを始めましょう
今日から無料トライアルでIronPDFをあなたのプロジェクトで使い始めましょう。
今日から無料トライアルでIronPDFをあなたのプロジェクトで使い始めましょう。
HTMLにPDFを変換する方法
- IronPdfライブラリを.NET用にダウンロード
FromFile
メソッドを使用して既存のPDFドキュメントをインポートする- 出力HTMLをHtmlFormatOptionsクラスを使用して設定する
- PDFを
ToHtmlString
メソッドを使用してHTML文字列に変換 - HTMLファイルを
SaveAsHtml
メソッドを使用してエクスポートする
PDF から HTML の例
ToHtmlString
メソッドは、主にユーザーが既存のPDFドキュメント内のHTML要素を分析できるように設計されています。 デバッグやPDF比較の目的に役立つツールとして機能します。 PDFドキュメントをHTML文字列に変換するだけでなく、SaveAsHtml
メソッドを使用してPDFドキュメントをHTMLファイルとして保存するための直接的な方法も提供しています。 これは、ユーザーが自分の特定のニーズに基づいて最も適切なアプローチを選択する柔軟性を提供します。
次の内容にご注意ください。
サンプルPDFファイル
:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html.cs
using IronPdf;
using System;
PdfDocument pdf = PdfDocument.FromFile("sample.pdf");
// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);
// Convert PDF to HTML file
pdf.SaveAsHtml("myHtml.html");
出力HTML
以下のウェブサイトにSaveAsHtml
メソッドから生成された全ての出力HTMLが入力されました。
PDF から HTML への高度な例
ToHtmlString
メソッドとSaveAsHtml
メソッドの両方が、様々な設定オプションを提供します。 以下は利用可能なプロパティです:
- BackgroundColor: 背景色を指定します。
-
PdfPageMargin: ページ余白を指定します。
さらに、以下のプロパティは、
ToHtmlString
およびSaveAsHtml
メソッドの 'title' パラメーターに使用されることを意図しています。 これはコンテンツの冒頭に新しいタイトルを追加します。 入力されたPDFドキュメントのタイトルやh1を変更することはありません。 - H1Color: タイトルの色を指定します。
- H1FontSize: タイトルフォントサイズを指定します。
- H1TextAlignment: タイトルの配置を指定します。左揃え、中央揃え、右揃えなどがあります。
:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html-advanced-settings.cs
using IronPdf;
using IronSoftware.Drawing;
using System;
PdfDocument pdf = PdfDocument.FromFile("sample.pdf");
// PDF to HTML configuration options
HtmlFormatOptions htmlformat = new HtmlFormatOptions();
htmlformat.BackgroundColor = Color.White;
htmlformat.PdfPageMargin = 10;
htmlformat.H1Color = Color.Blue;
htmlformat.H1FontSize = 25;
htmlformat.H1TextAlignment = TextAlignment.Center;
// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);
// Convert PDF to HTML file
pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);
出力HTML
以下のウェブサイトにSaveAsHtml
メソッドから生成された全ての出力HTMLが入力されました。
これらのメソッドは、インラインCSSを持つHTML文字列を生成します。 出力HTMLは通常のHTMLタグの代わりにSVGの用語/タグを使用します。 この違いにもかかわらず、それは有効なHTML文字列であり、ウェブブラウザで同じようにレンダリングすることができます。 しかしながら、前述の理由により、RenderHtmlAsPdf
メソッドを使用してレンダリングされたPDFドキュメントを用いる場合、このメソッドから返されるHTML文字列は入力されたHTMLと異なる可能性があることを利用者が認識しておくことが重要です。