HTMLにPDFを変換する方法

This article was translated from English: Does it need improvement?
Translated
View the article in English

によって ハイリル ハシミ ビン オマル

PDFをHTMLに変換することには、さまざまな利点があります。例えば、ユーザーにとってのウェブアクセシビリティの向上、さまざまなデバイスに対応するレスポンシブデザイン、検索エンジン最適化(SEO)の改善などが挙げられます。(検索エンジン最適化)シームレスなウェブ統合、ウェブベースのツールとCMSを使用した簡単なコンテンツ編集、クロスプラットフォームの互換性、動的要素やマルチメディアの利用可能性。

IronPDFは、.NET C#でPDFをHTMLに変換するプロセスを簡素化します。

IronPDFを始めましょう

今日から無料トライアルでIronPDFをあなたのプロジェクトで使い始めましょう。

最初のステップ:
green arrow pointer



PDF から HTML の例

ToHtmlString メソッドは、主にユーザーが既存のPDFドキュメント内のHTML要素を解析することを可能にするために設計されています。 デバッグやPDF比較の目的に役立つツールとして機能します。 PDF文書をHTML文字列に変換するだけでなく、SaveAsHtmlメソッドを使ってPDF文書をHTMLファイルとして保存する直接的な方法も提供します。 これは、ユーザーが自分の特定のニーズに基づいて最も適切なアプローチを選択する柔軟性を提供します。

次の内容にご注意ください。
元のPDF内のすべてのインタラクティブフォームフィールドは、変換後のHTMLドキュメントでは機能しなくなります。

サンプルPDFファイル

:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html.cs
using IronPdf;
using System;

PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);

// Convert PDF to HTML file
pdf.SaveAsHtml("myHtml.html");
IRON VB CONVERTER ERROR developers@ironsoftware.com
VB   C#

出力HTML

SaveAsHtml メソッドから生成された全ての出力HTMLは、以下のウェブサイトに入力されました。


PDF から HTML への高度な例

ToHtmlString メソッドと SaveAsHtml メソッドの両方は、さまざまな構成オプションを提供します。 以下は利用可能なプロパティです:

  • BackgroundColor: 背景色を指定します。
  • PdfPageMargin: ページ余白を指定します。

    さらに、以下のプロパティは ToHtmlString および SaveAsHtml メソッドの 'title' パラメーターに使用されることを意図しています。 これはコンテンツの冒頭に新しいタイトルを追加します。 入力されたPDFドキュメントのタイトルやh1を変更することはありません。

  • H1Color: タイトルの色を指定します。
  • H1FontSize: タイトルフォントサイズを指定します。
  • H1TextAlignment: タイトルの整列を指定します。例えば、左揃え、中央揃え、右揃えなどです。
:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html-advanced-settings.cs
using IronPdf;
using IronSoftware.Drawing;
using System;

PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// PDF to HTML configuration options
HtmlFormatOptions htmlformat = new HtmlFormatOptions();
htmlformat.BackgroundColor = Color.White;
htmlformat.PdfPageMargin = 10;
htmlformat.H1Color = Color.Blue;
htmlformat.H1FontSize = 25;
htmlformat.H1TextAlignment = TextAlignment.Center;

// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);

// Convert PDF to HTML file
pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);
IRON VB CONVERTER ERROR developers@ironsoftware.com
VB   C#

出力HTML

SaveAsHtml メソッドから生成された全ての出力HTMLは、以下のウェブサイトに入力されました。

これらのメソッドは、インラインCSSを持つHTML文字列を生成します。 出力HTMLは通常のHTMLタグの代わりにSVGの用語/タグを使用します。 この違いにもかかわらず、それは有効なHTML文字列であり、ウェブブラウザで同じようにレンダリングすることができます。 しかし、ユーザーは注意する必要があります。RenderHtmlAsPdf メソッドを使用してレンダリングされたPDFドキュメントを使用する場合、このメソッドから返されるHTML文字列は、上記の理由により、入力されたHTMLとは異なる場合があります。

Hairil related to 出力HTML

ハイリル ハシミ ビン オマル

ソフトウェアエンジニア

すべての優れたエンジニアと同じように、Hairilは熱心な学習者です。C#、Python、およびJavaの知識を洗練させ、その知識を活かしてIron Softwareのチームメンバーに価値を提供しています。Hairilはマレーシアのマラ工科大学(Universiti Teknologi MARA)で化学およびプロセス工学の学士号を取得し、Iron Softwareチームに加わりました。