using IronPdf; // Disable local disk access or cross-origin requests Installation.EnableWebSecurity = true; // Instantiate Renderer var renderer = new ChromePdfRenderer(); // Create a PDF from a HTML string using C# var pdf = renderer.RenderHtmlAsPdf("<h1>Hello World</h1>"); // Export to a file or Stream pdf.SaveAs("output.pdf"); // Advanced Example with HTML Assets // Load external html assets: Images, CSS and JavaScript. // An optional BasePath 'C:\site\assets\' is set as the file location to load assets from var myAdvancedPdf = renderer.RenderHtmlAsPdf("<img src='icons/iron.png'>", @"C:\site\assets\"); myAdvancedPdf.SaveAs("html-with-assets.pdf");

HERRAMIENTAS PDF

Cómo Convertir HTML a PDF en Node.js usando Puppeteer

Curtis Chau

Actualizado:diciembre 11, 2025

En el mundo digital de hoy, es crucial tener la capacidad de convertir páginas web o documentos HTML en archivos PDF. Esto puede ser útil para generar informes, crear facturas o simplemente compartir información en un formato más presentable. En esta publicación de blog, exploraremos cómo convertir páginas HTML a PDF usando Node.js y Puppeteer, una biblioteca de código abierto desarrollada por Google.

Introducción a Puppeteer

Puppeteer es una poderosa biblioteca de Node.js que permite a los desarrolladores controlar navegadores sin cabeza, principalmente Google Chrome o Chromium, y realizar varias acciones como scraping web, tomar capturas de pantalla y generar PDFs. Puppeteer proporciona una API extensa para interactuar con el navegador, lo que lo convierte en una excelente opción para convertir HTML a PDF.

¿Por qué Puppeteer?

Facilidad de uso: Puppeteer ofrece una API simple y fácil de usar que abstrae las complejidades de trabajar con navegadores sin cabeza.
Poderoso: Puppeteer proporciona amplias capacidades para manipular páginas web e interactuar con elementos del navegador.
Escalable: Con Puppeteer, puedes escalar fácilmente tu proceso de generación de PDF ejecutando varias instancias del navegador en paralelo.

Cómo configurar tu proyecto NodeJS

Antes de comenzar, necesitarás configurar un nuevo proyecto NodeJS. Sigue estos pasos para empezar:

Instala NodeJS si aún no lo has hecho (puedes descargarlo desde el sitio web de NodeJS).
Crea una nueva carpeta para tu proyecto y ábrela en Visual Studio Code o cualquier editor de código específico.
Ejecuta npm init para crear un nuevo archivo package.json para tu proyecto. Sigue las indicaciones y llena la información requerida.

Cómo convertir HTML a PDF en Node.js: Figura 1

Instala Puppeteer ejecutando npm install puppeteer.

Cómo convertir HTML a PDF en Node.js: Figura 2

Ahora que tenemos nuestro proyecto configurado, vamos a sumergirnos en el código.

Carga de plantilla HTML y conversión a archivo PDF

Para convertir plantillas HTML a un archivo PDF usando Puppeteer, sigue estos pasos:

Crea un archivo llamado "HTML To PDF.js" en la carpeta.

Importación de Puppeteer y fs

const puppeteer = require('puppeteer');
const fs = require('fs');

El código comienza importando dos bibliotecas esenciales: puppeteer, una herramienta versátil para controlar navegadores sin cabeza como Chrome y Chromium, y fs, un módulo incorporado de NodeJS para manejar operaciones de sistema de archivos. Puppeteer te permite automatizar una amplia gama de tareas basadas en la web, incluyendo renderizar HTML, capturar capturas de pantalla y generar archivos PDF.

Definición de la función exportWebsiteAsPdf

async function exportWebsiteAsPdf(html, outputPath) {
  // Create a browser instance
  const browser = await puppeteer.launch({
    headless: true // Launches the browser in headless mode
  });

  // Create a new page
  const page = await browser.newPage();

  // Set the HTML content for the page, waiting for DOM content to load
  await page.setContent(html, { waitUntil: 'domcontentloaded' });

  // To reflect CSS used for screens instead of print
  await page.emulateMediaType('screen');

  // Download the PDF
  const PDF = await page.pdf({
    path: outputPath,
    margin: { top: '100px', right: '50px', bottom: '100px', left: '50px' },
    printBackground: true,
    format: 'A4',
  });

  // Close the browser instance
  await browser.close();

  return PDF;
}

La función exportWebsiteAsPdf sirve como el núcleo de nuestro fragmento de código. Esta función asincrónica acepta una cadena html y una outputPath como parámetros de entrada y devuelve un archivo PDF. La función realiza los siguientes pasos:

Lanza una nueva instancia de navegador sin cabeza usando Puppeteer.
Crea una nueva página de navegador.
Establece la cadena html proporcionada como el contenido de la página, esperando a que cargue el contenido DOM.
Emula el tipo de medio 'pantalla' para aplicar el CSS utilizado para pantallas en lugar de estilos específicos para impresión.
Genera un archivo PDF del contenido HTML cargado, especificando márgenes, impresión de fondo y formato (A4).
Cierra la instancia del navegador.
Devuelve el archivo PDF creado.

Uso de la función exportWebsiteAsPdf

// Usage example
// Get HTML content from HTML file
const html = fs.readFileSync('test.html', 'utf-8');

// Convert the HTML content into a PDF and save it to the specified path
exportWebsiteAsPdf(html, 'result.pdf').then(() => {
  console.log('PDF created successfully.');
}).catch((error) => {
  console.error('Error creating PDF:', error);
});

La última sección del código ilustra cómo usar la función exportWebsiteAsPdf. Realizamos los siguientes pasos:

Lee el contenido HTML desde un archivo HTML usando el método readFileSync del módulo fs.
Llama a la función exportWebsiteAsPdf con la cadena html cargada y la outputPath deseada.
Utiliza un bloque .then para manejar la creación exitosa del PDF, registrando un mensaje de éxito en la consola.
Emplea un bloque .catch para manejar cualquier error que ocurra durante el proceso de conversión de HTML a PDF, registrando un mensaje de error en la consola.

Este fragmento de código proporciona un ejemplo completo de cómo convertir una plantilla HTML a un archivo PDF usando NodeJS y Puppeteer. Al implementar esta solución, puedes generar de manera eficiente PDFs de alta calidad, satisfaciendo las necesidades de varias aplicaciones y usuarios.

Cómo convertir HTML a PDF en Node.js: Figura 3

Convertir URL en archivos PDF

Además de convertir plantillas HTML, Puppeteer también te permite convertir URLs directamente en archivos PDF.

Importar Puppeteer

const puppeteer = require('puppeteer');

El código comienza importando la biblioteca Puppeteer, que es una herramienta poderosa para controlar navegadores sin cabeza como Chrome y Chromium. Puppeteer te permite automatizar una variedad de tareas basadas en la web, incluido el renderizado de tu código HTML, la captura de capturas de pantalla y, en nuestro caso, la generación de archivos PDF.

Definición de la función exportWebsiteAsPdf

async function exportWebsiteAsPdf(websiteUrl, outputPath) {
  // Create a browser instance
  const browser = await puppeteer.launch({
    headless: true // Launches the browser in headless mode
  });

  // Create a new page
  const page = await browser.newPage();

  // Open the URL in the current page
  await page.goto(websiteUrl, { waitUntil: 'networkidle0' });

  // To reflect CSS used for screens instead of print
  await page.emulateMediaType('screen');

  // Download the PDF
  const PDF = await page.pdf({
    path: outputPath,
    margin: { top: '100px', right: '50px', bottom: '100px', left: '50px' },
    printBackground: true,
    format: 'A4',
  });

  // Close the browser instance
  await browser.close();

  return PDF;
}

La función exportWebsiteAsPdf es el núcleo de nuestro fragmento de código. Esta función asincrónica acepta un websiteUrl y un outputPath como sus parámetros de entrada y devuelve un archivo PDF. La función realiza los siguientes pasos:

Lanza una nueva instancia de navegador sin cabeza usando Puppeteer.
Crea una nueva página de navegador.
Navega a la websiteUrl proporcionada y espera a que la red se vuelva inactiva usando la opción waitUntil establecida en networkidle0.
Emula el tipo de medio 'pantalla' para asegurar que se aplique el CSS utilizado para pantallas en lugar de estilos específicos para impresión.
Convierte la página web cargada en un archivo PDF con los márgenes especificados, impresión de fondo y formato (A4).
Cierra la instancia del navegador.
Devuelve el archivo PDF generado.

Uso de la función exportWebsiteAsPdf

// Usage example
// Convert the URL content into a PDF and save it to the specified path
exportWebsiteAsPdf('https://ironpdf.com/', 'result.pdf').then(() => {
  console.log('PDF created successfully.');
}).catch((error) => {
  console.error('Error creating PDF:', error);
});

La sección final del código demuestra cómo usar la función exportWebsiteAsPdf. Ejecutamos los siguientes pasos:

Llama a la función exportWebsiteAsPdf con la websiteUrl y outputPath deseadas.
Usa un bloque then para manejar la creación exitosa del PDF. En este bloque, registramos un mensaje de éxito en la consola.
Usa un bloque catch para manejar cualquier error que ocurra durante el proceso de conversión de la página web a PDF. Si ocurre un error, registramos un mensaje de error en la consola.

Al integrar este fragmento de código en tus proyectos, puedes convertir fácilmente URLs en archivos PDF de alta calidad usando NodeJS y Puppeteer.

Cómo convertir HTML a PDF en Node.js: Figura 4

Mejor biblioteca HTML a PDF para desarrolladores de C

Explora IronPDF es una popular biblioteca .NET utilizada para generar, editar y extraer contenido de archivos PDF. Proporciona una solución simple y eficiente para crear PDFs a partir de HTML, texto, imágenes y documentos PDF existentes. IronPDF soporta proyectos .NET Core, .NET Framework, y .NET 5.0+, lo que lo convierte en una opción versátil para varias aplicaciones.

Características principales de IronPDF

Conversión HTML a PDF con IronPDF: IronPDF te permite convertir contenido HTML, incluyendo CSS, a archivos PDF. Esta característica te permite crear documentos PDF de alta calidad a partir de páginas web o plantillas HTML.

Representación de URL: IronPDF puede obtener páginas web directamente desde un servidor mediante una URL y convertirlas en archivos PDF, lo que facilita el archivado de contenido web o la generación de informes a partir de páginas web dinámicas.

Fusión de texto, imágenes y PDF: IronPDF le permite fusionar texto, imágenes y archivos PDF existentes en un solo documento PDF. Esta característica es particularmente útil para crear documentos complejos con múltiples fuentes de contenido.

Manipulación de PDF: IronPDF proporciona herramientas para editar archivos PDF existentes, como agregar o eliminar páginas, modificar metadatos o incluso extraer texto e imágenes de documentos PDF.

Conclusión

En conclusión, generar y manipular archivos PDF es un requisito común en muchas aplicaciones, y contar con las herramientas adecuadas a tu disposición es crucial. Las soluciones proporcionadas en este artículo, como el uso de Puppeteer con NodeJS o IronPDF con .NET, ofrecen métodos poderosos y eficientes para convertir contenido HTML y URLs en documentos PDF profesionales de alta calidad.

IronPDF, en particular, se destaca con su conjunto de características extensas, lo que lo convierte en una elección principal para desarrolladores .NET. IronPDF ofrece una prueba gratuita que te permite explorar sus capacidades.

Los usuarios también pueden beneficiarse del paquete Iron Suite, un conjunto de cinco bibliotecas .NET profesionales que incluyen IronXL, IronPDF, IronOCR y mucho más.

Curtis Chau

Chatea con el equipo de ingeniería ahora

Escritor Técnico

Curtis Chau tiene una licenciatura en Ciencias de la Computación (Carleton University) y se especializa en el desarrollo front-end con experiencia en Node.js, TypeScript, JavaScript y React. Apasionado por crear interfaces de usuario intuitivas y estéticamente agradables, disfruta trabajando con frameworks modernos y creando manuales bien ...