PDFをHTMLに変換

IronPDFがHTMLコンテンツからピクセルパーフェクトなPDFファイルを生成できるのと同様に、PDFドキュメントをHTMLに変換するためにも使用できます。 PdfDocumentおよびHtmlFormatOptionsクラスを使用することで、ユーザーはPDFをHTMLに変換するために必要なメソッドにアクセスでき、最終的なHTMLコンテンツのフォーマットを制御することができます。

PDFをHTMLに変換する5つのステップ

  • PdfDocument pdf = PdfDocument.FromFile("sample.pdf");
  • string html = pdf.ToHtmlString();
  • pdf.SaveAsHtml("myHtml.html");
  • HtmlFormatOptions htmlformat = new HtmlFormatOptions();
  • pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);

    PDFファイルをHTMLに変換し始めるには、まずPdfDocumentクラスを使用してFromFileを通じて変換したいPDFを読み込む必要があります。 このメソッドは、渡されたファイル名またはファイルの場所を受け取り、新しいPdfDocumentオブジェクトpdfにロードします。 これで、変換プロセスのためにこのオブジェクトにアクセスしたいときは、簡単に参照することができます。

    次に、PDF ドキュメントを HTML に変換する最初の方法を示します。 このメソッドはPDFを受け取り、シンプルなHTML文字列オブジェクトに変換します。その後、このオブジェクトはコンソール上に表示され、開発者のニーズに応じてさらに操作する準備が整います。 次の行は、PDFをHTMLファイルに変換する別の方法を示しています。これは、単純なHTML文字列と比較して、より複雑な作業や共有に適しています。 これらの方法はいずれも、変換プロセスを実行するために単一の行のみを必要とするため、効率的に使用するのが簡単です。

    次に、HtmlFormatOptions クラスを使用して、最終的なHTML出力を操作およびカスタマイズする方法を見てみましょう。 このクラスを使用すると、背景色、見出し(H1)の色、H1テキストの配置、ページ余白など、HTML出力のさまざまな側面をカスタマイズできます。 まず、新しいインスタンスを作成する必要があり、これをhtmlformatと名付けました。

    次に、背景色を白に変更し、H1テキストの色を青に設定します。 これはIronSoftware.Drawing.Colorクラスにアクセスすることで行われます。 次に、必要に応じてH1のフォントサイズ(ピクセル単位)を調整し、25に設定します。次に行いたいカスタマイズは、H1のテキストの位置合わせを指定し、中央に設定することです。 ここで行う最後のカスタマイズは、HTMLドキュメントでPDFページの余白を(ピクセル単位で)10に設定することです。

    このプロセスの最終段階は、前回と同じ方法でPDFをHTMLに変換することです。ただし、今回はより多くのパラメータを渡しています。 最初は、新しく生成されたHTMLドキュメントを保存したい名前と場所です。前回と同様です。 二つ目は、fullContentWidthというブール値をtrueに設定することで、HTML内のPDFコンテンツを全幅に設定します。 次のパラメーターはHTML出力のタイトルで、最後に先に作成したカスタマイズ設定をHTML出力に適用します。 クリックして、例、サンプルコード、およびファイルを含むハウツーガイドをご覧ください。