Node.jsでPuppeteerを使用してHTMLをPDFに変換する方法
今日のデジタル世界では、ウェブページやHTMLドキュメントをPDFファイルに変換する能力を持つことが重要です。 これは、レポート生成、請求書作成、または単に情報をより見栄えの良い形式で共有するために役立ちます。 このブログ記事では、Googleが開発したオープンソースライブラリであるNode.jsとPuppeteerを使用してHTMLページをPDFに変換する方法を探ります。
Puppeteerの紹介
Puppeteerは、主にGoogle ChromeまたはChromiumを扱うヘッドレスブラウザを制御し、ウェブスクレイピング、スクリーンショット撮影、PDF生成など、さまざまなアクションを実行できる強力なNode.jsライブラリです。 Puppeteerはブラウザと対話するための広範なAPIを提供し、HTMLをPDFに変換するための優れた選択肢です。
なぜPuppeteerなのか?
- 使いやすさ: Puppeteerは、ヘッドレスブラウザでの作業の複雑さを抽象化する、シンプルで使いやすいAPIを提供します。
- 強力: Puppeteerは、ウェブページの操作やブラウザ要素との相互作用に対する広範な機能を提供します。
- スケーラブル: Puppeteerを使用することで、複数のブラウザインスタンスを並行して実行することで、PDF生成プロセスを簡単にスケールアップできます。
NodeJSプロジェクトの設定
始める前に、新しいNodeJSプロジェクトを設定する必要があります。 開始するには、以下の手順に従ってください:
- まだインストールしていない場合はNodeJSをインストールしてください(NodeJSのウェブサイトからダウンロードできます)。
- プロジェクト用の新しいフォルダーを作成し、Visual Studio Codeや特定のコードエディターで開きます。
npm initを実行して、新しいpackage.jsonファイルをプロジェクト用に作成します。 プロンプトに従って必要な情報を入力します。

npm install puppeteerを実行してPuppeteerをインストールします。

プロジェクトの設定が完了したので、コードに取り組みましょう。
HTMLテンプレートの読み込みとPDFファイルへの変換
Puppeteerを使用してHTMLテンプレートをPDFファイルに変換するには、次の手順に従います。
フォルダーに"HTML To PDF.js"という名前のファイルを作成します。
Puppeteerとfsのインポート
const puppeteer = require('puppeteer');
const fs = require('fs');コードは、puppeteer(ChromeやChromiumのようなヘッドレスブラウザを制御するための多用途ツール)、およびファイルシステム操作を行うための組み込みNodeJSモジュールfsの2つの重要なライブラリをインポートすることから始まります。 Puppeteerを使用すると、HTMLのレンダリング、スクリーンショットの撮影、PDFファイルの生成など、幅広いウェブベースのタスクを自動化できます。
exportWebsiteAsPdf関数の定義
async function exportWebsiteAsPdf(html, outputPath) {
// Create a browser instance
const browser = await puppeteer.launch({
headless: true // Launches the browser in headless mode
});
// Create a new page
const page = await browser.newPage();
// Set the HTML content for the page, waiting for DOM content to load
await page.setContent(html, { waitUntil: 'domcontentloaded' });
// To reflect CSS used for screens instead of print
await page.emulateMediaType('screen');
// Download the PDF
const PDF = await page.pdf({
path: outputPath,
margin: { top: '100px', right: '50px', bottom: '100px', left: '50px' },
printBackground: true,
format: 'A4',
});
// Close the browser instance
await browser.close();
return PDF;
}exportWebsiteAsPdf関数は、コードスニペットの核心を成します。 この非同期関数は、入力パラメーターとしてhtml文字列とoutputPathを受け取り、PDFファイルを返します。関数は次の手順を実行します。
- Puppeteerを使用して新しいヘッドレスブラウザーインスタンスを起動します。
- 新しいブラウザーページを作成します。
- 提供された
html文字列をページコンテンツとして設定し、DOMコンテンツの読み込みを待ちます。 - "screen"メディアタイプをエミュレートし、印刷専用スタイルではなく画面用に使用されるCSSを適用します。
- 読み込まれたHTMLコンテンツからPDFファイルを生成し、余白、背景印刷、および形式(A4)を指定します。
- ブラウザーインスタンスを閉じます。
- 作成されたPDFファイルを返します。
exportWebsiteAsPdf関数の使用
// Usage example
// Get HTML content from HTML file
const html = fs.readFileSync('test.html', 'utf-8');
// Convert the HTML content into a PDF and save it to the specified path
exportWebsiteAsPdf(html, 'result.pdf').then(() => {
console.log('PDF created successfully.');
}).catch((error) => {
console.error('Error creating PDF:', error);
});コードの最後のセクションは、exportWebsiteAsPdf関数の使用方法を示しています。 次の手順を実行します。
fsモジュールのreadFileSyncメソッドを使用して、HTMLファイルからHTMLコンテンツを読み込みます。- 読み込まれた
html文字列と希望するoutputPathを使用してexportWebsiteAsPdf関数を呼び出します。 .thenブロックを使用して、PDFの成功した作成を処理し、コンソールに成功メッセージをログに記録します。.catchブロックを使用して、HTMLからPDFへの変換プロセス中に発生するエラーを管理し、コンソールにエラーメッセージをログに記録します。
このコードスニペットは、NodeJSとPuppeteerを使用してHTMLテンプレートをPDFファイルに変換する方法の包括的な例です。 このソリューションを実装することで、さまざまなアプリケーションやユーザーのニーズに応じた高品質のPDFを効率的に生成できます。

URLのPDFファイルへの変換
HTMLテンプレートの変換に加えて、Puppeteerを使用するとURLを直接PDFファイルに変換することもできます。
Puppeteerのインポート
const puppeteer = require('puppeteer');コードは、ChromeやChromiumのようなヘッドレスブラウザを制御する強力なツールであるPuppeteerライブラリをインポートすることで始まります。 Puppeteerを使用すると、HTMLコードのレンダリング、スクリーンショットの撮影、そして今回のケースのようにPDFファイルの生成など、さまざまなウェブベースのタスクを自動化できます。
exportWebsiteAsPdf関数の定義
async function exportWebsiteAsPdf(websiteUrl, outputPath) {
// Create a browser instance
const browser = await puppeteer.launch({
headless: true // Launches the browser in headless mode
});
// Create a new page
const page = await browser.newPage();
// Open the URL in the current page
await page.goto(websiteUrl, { waitUntil: 'networkidle0' });
// To reflect CSS used for screens instead of print
await page.emulateMediaType('screen');
// Download the PDF
const PDF = await page.pdf({
path: outputPath,
margin: { top: '100px', right: '50px', bottom: '100px', left: '50px' },
printBackground: true,
format: 'A4',
});
// Close the browser instance
await browser.close();
return PDF;
}exportWebsiteAsPdf関数は、コードスニペットの核心を成します。 この非同期関数は、websiteUrlとoutputPathを入力パラメーターとして受け取り、PDFファイルを返します。関数は次の手順を実行します。
- Puppeteerを使用して新しいヘッドレスブラウザーインスタンスを起動します。
- 新しいブラウザーページを作成します。
- 提供された
websiteUrlに移動し、waitUntilオプションをnetworkidle0に設定してネットワークがアイドル状態になるのを待ちます。 - 画面専用スタイルが適用されるように"screen"メディアタイプをエミュレートします。
- 読み込まれたWebページを指定された余白、背景印刷、および形式(A4)でPDFファイルに変換します。
- ブラウザーインスタンスを閉じます。
- 生成されたPDFファイルを返します。
exportWebsiteAsPdf関数の使用
// Usage example
// Convert the URL content into a PDF and save it to the specified path
exportWebsiteAsPdf('https://ironpdf.com/', 'result.pdf').then(() => {
console.log('PDF created successfully.');
}).catch((error) => {
console.error('Error creating PDF:', error);
});コードの最終セクションは、exportWebsiteAsPdf関数の使用方法を示します。 以下の手順を実行します。
- 希望する
websiteUrlとoutputPathを使用してexportWebsiteAsPdf関数を呼び出します。 thenブロックを使用して、PDFが正常に作成されたことを処理します。 このブロックでは、コンソールに成功メッセージをログに記録します。catchブロックを使用して、WebサイトからPDFへの変換プロセス中に発生するエラーを処理します。 エラーが発生した場合、コンソールにエラーメッセージをログに記録します。
このコードスニペットをプロジェクトに統合することで、NodeJSとPuppeteerを使用して簡単に高品質のPDFファイルにURLを変換できます。

C#開発者のための最高のHTML To PDFライブラリ
IronPDFを探るは、PDFファイルの生成、編集、コンテンツ抽出に使用される人気のある.NETライブラリです。 HTML、テキスト、画像、既存のPDFドキュメントからPDFを作成するためのシンプルで効率的なソリューションを提供します。 IronPDFは、.NET Core、.NET Framework、.NET 5.0+プロジェクトに対応しており、さまざまなアプリケーションにとって汎用性の高い選択肢です。
IronPDFの主な機能
IronPDFによるHTMLからPDFへの変換: IronPDFを使用すると、CSSを含むHTMLコンテンツをPDFファイルに変換できます。 この機能によりウェブページやHTMLテンプレートからピクセルパーフェクトなPDFドキュメントを作成できます。
URL レンダリング: IronPDF は、URL を使用してサーバーから Web ページを直接取得し、PDF ファイルに変換できるため、Web コンテンツをアーカイブしたり、動的な Web ページからレポートを生成したりすることが容易になります。
テキスト、画像、PDF の結合: IronPDF を使用すると、テキスト、画像、既存の PDF ファイルを 1 つの PDF ドキュメントに結合することができます。 この機能は、複数のコンテンツソースを持つ複雑なドキュメントを作成するのに特に便利です。
PDF 操作: IronPDF には、ページの追加や削除、メタデータの変更、PDF ドキュメントからのテキストや画像の抽出など、既存の PDF ファイルを編集するためのツールが用意されています。
結論
結論として、多くのアプリケーションでPDFファイルの生成と操作は一般的な要件であり、適切なツールを手元に置くことが重要です。 このこの記事で紹介するソリューション、例えばNodeJSでPuppeteerを使用したり、.NETでIronPDFを使用したりすることで、HTMLコンテンツやURLをプロフェッショナルで高品質のPDFドキュメントに変換するための強力で効率的な方法を提供します。
特にIronPDFは、豊富な機能セットで際立っており、.NET開発者にとって最良の選択肢となっています。 IronPDFは、機能を探ることができる無料トライアルを提供します。
Iron Suiteパッケージは、IronXL、IronPDF、IronOCRなど、5つのプロフェッショナルな.NETライブラリのスイートです。






