HTMLにPDFを変換する方法

Hairil related to HTMLにPDFを変換する方法
ハイリル ハシミ ビン オマル
2023年7月24日
更新済み 2024年12月10日
共有:
This article was translated from English: Does it need improvement?
Translated
View the article in English

PDFをHTMLに変換することは、多くの利点を提供します。ユーザーに対するウェブのアクセシビリティの向上、さまざまなデバイスへの応答性、検索エンジン最適化(SEO)の改善、シームレスなウェブ統合、ウェブベースのツールやCMSを通じたコンテンツ編集の容易さ、クロスプラットフォーム互換性、動的要素やマルチメディアの活用能力などが含まれます。

IronPDFは、.NET C#でPDFをHTMLに変換するプロセスを簡素化します。

IronPDFを始めましょう

今日から無料トライアルでIronPDFをあなたのプロジェクトで使い始めましょう。

最初のステップ:
green arrow pointer


PDF から HTML の例

ToHtmlString メソッドは、主にユーザーが既存のPDFドキュメント内のHTML要素を分析できるように設計されています。 デバッグやPDF比較の目的に役立つツールとして機能します。 PDFドキュメントをHTML文字列に変換するだけでなく、SaveAsHtmlメソッドを使用してPDFドキュメントをHTMLファイルとして保存するための直接的な方法も提供しています。 これは、ユーザーが自分の特定のニーズに基づいて最も適切なアプローチを選択する柔軟性を提供します。

次の内容にご注意ください。
元のPDF内のすべてのインタラクティブフォームフィールドは、変換後のHTMLドキュメントでは機能しなくなります。

サンプルPDFファイル

:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html.cs
using IronPdf;
using System;

PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);

// Convert PDF to HTML file
pdf.SaveAsHtml("myHtml.html");

出力HTML

以下のウェブサイトにSaveAsHtmlメソッドから生成された全ての出力HTMLが入力されました。


PDF から HTML への高度な例

ToHtmlStringメソッドとSaveAsHtmlメソッドの両方が、様々な設定オプションを提供します。 以下は利用可能なプロパティです:

  • BackgroundColor: 背景色を指定します。
  • PdfPageMargin: ページ余白を指定します。

    さらに、以下のプロパティは、ToHtmlString および SaveAsHtml メソッドの 'title' パラメーターに使用されることを意図しています。 これはコンテンツの冒頭に新しいタイトルを追加します。 入力されたPDFドキュメントのタイトルやh1を変更することはありません。

  • H1Color: タイトルの色を指定します。
  • H1FontSize: タイトルフォントサイズを指定します。
  • H1TextAlignment: タイトルの配置を指定します。左揃え、中央揃え、右揃えなどがあります。
:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html-advanced-settings.cs
using IronPdf;
using IronSoftware.Drawing;
using System;

PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// PDF to HTML configuration options
HtmlFormatOptions htmlformat = new HtmlFormatOptions();
htmlformat.BackgroundColor = Color.White;
htmlformat.PdfPageMargin = 10;
htmlformat.H1Color = Color.Blue;
htmlformat.H1FontSize = 25;
htmlformat.H1TextAlignment = TextAlignment.Center;

// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);

// Convert PDF to HTML file
pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);

出力HTML

以下のウェブサイトにSaveAsHtmlメソッドから生成された全ての出力HTMLが入力されました。

これらのメソッドは、インラインCSSを持つHTML文字列を生成します。 出力HTMLは通常のHTMLタグの代わりにSVGの用語/タグを使用します。 この違いにもかかわらず、それは有効なHTML文字列であり、ウェブブラウザで同じようにレンダリングすることができます。 しかしながら、前述の理由により、RenderHtmlAsPdf メソッドを使用してレンダリングされたPDFドキュメントを用いる場合、このメソッドから返されるHTML文字列は入力されたHTMLと異なる可能性があることを利用者が認識しておくことが重要です。

Hairil related to 出力HTML
ハイリル ハシミ ビン オマル
ソフトウェアエンジニア
すべての優れたエンジニアと同じように、Hairilは熱心な学習者です。C#、Python、およびJavaの知識を洗練させ、その知識を活かしてIron Softwareのチームメンバーに価値を提供しています。Hairilはマレーシアのマラ工科大学(Universiti Teknologi MARA)で化学およびプロセス工学の学士号を取得し、Iron Softwareチームに加わりました。