PDFをHTMLに変換
IronPDFがHTMLコンテンツからピクセルパーフェクトなPDFファイルを生成できるのと同様に、PDFドキュメントをHTMLに変換するためにも使用できます。 PdfDocument
およびHtmlFormatOptions
クラスを使用することで、ユーザーはPDFをHTMLに変換するために必要なメソッドにアクセスでき、最終的なHTMLコンテンツのフォーマットを制御することができます。
PDFをHTMLに変換する5つのステップ
- PdfDocument pdf = PdfDocument.FromFile("sample.pdf");
- string html = pdf.ToHtmlString();
- pdf.SaveAsHtml("myHtml.html");
- HtmlFormatOptions htmlformat = new HtmlFormatOptions();
-
pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);
PDFファイルをHTMLに変換し始めるには、まず
PdfDocument
クラスを使用してFromFile
を通じて変換したいPDFを読み込む必要があります。 このメソッドは、渡されたファイル名またはファイルの場所を受け取り、新しいPdfDocument
オブジェクトpdfにロードします。 これで、変換プロセスのためにこのオブジェクトにアクセスしたいときは、簡単に参照することができます。次に、PDF ドキュメントを HTML に変換する最初の方法を示します。 このメソッドはPDFを受け取り、シンプルなHTML文字列オブジェクトに変換します。その後、このオブジェクトはコンソール上に表示され、開発者のニーズに応じてさらに操作する準備が整います。 次の行は、PDFをHTMLファイルに変換する別の方法を示しています。これは、単純なHTML文字列と比較して、より複雑な作業や共有に適しています。 これらの方法はいずれも、変換プロセスを実行するために単一の行のみを必要とするため、効率的に使用するのが簡単です。
次に、
HtmlFormatOptions
クラスを使用して、最終的なHTML出力を操作およびカスタマイズする方法を見てみましょう。 このクラスを使用すると、背景色、見出し(H1)の色、H1テキストの配置、ページ余白など、HTML出力のさまざまな側面をカスタマイズできます。 まず、新しいインスタンスを作成する必要があり、これをhtmlformatと名付けました。次に、背景色を白に変更し、H1テキストの色を青に設定します。 これは
IronSoftware.Drawing.Color
クラスにアクセスすることで行われます。 次に、必要に応じてH1のフォントサイズ(ピクセル単位)を調整し、25に設定します。次に行いたいカスタマイズは、H1のテキストの位置合わせを指定し、中央に設定することです。 ここで行う最後のカスタマイズは、HTMLドキュメントでPDFページの余白を(ピクセル単位で)10に設定することです。このプロセスの最終段階は、前回と同じ方法でPDFをHTMLに変換することです。ただし、今回はより多くのパラメータを渡しています。 最初は、新しく生成されたHTMLドキュメントを保存したい名前と場所です。前回と同様です。 二つ目は、fullContentWidthというブール値をtrueに設定することで、HTML内のPDFコンテンツを全幅に設定します。 次のパラメーターはHTML出力のタイトルで、最後に先に作成したカスタマイズ設定をHTML出力に適用します。 クリックして、例、サンプルコード、およびファイルを含むハウツーガイドをご覧ください。