PDF a HTML
Así como IronPDF puede manejar la generación de archivos PDF de alta calidad a partir de contenido HTML, también se puede usar para convertir documentos PDF en HTML. Mediante el uso de las clases PdfDocument y HtmlFormatOptions, los usuarios tendrán acceso a los métodos necesarios para convertir el PDF a HTML y control sobre cómo se formateará el contenido HTML final.
5 pasos para convertir PDF a HTML
Aquí tienes un ejemplo de código paso a paso que ilustra cómo realizar la conversión:
Para comenzar a convertir un archivo PDF a HTML, primero debemos cargar el PDF que deseamos convertir usando el método FromFile de la clase PdfDocument. Este método toma el nombre o la ubicación del archivo que le pasamos y lo carga en un nuevo objeto PdfDocument, pdf. Ahora, podremos simplemente referenciar este objeto siempre que queramos acceder a él para el proceso de conversión.
A continuación, demostramos el método de convertir un documento PDF a un simple objeto de cadena HTML, que luego se puede mostrar en la consola, listo para ser manipulado posteriormente según las necesidades del desarrollador. La siguiente línea de código demuestra otra forma, donde convertimos el PDF a un archivo HTML, listo para trabajos más complejos o para compartirlo en comparación con la simple cadena HTML. Ambos métodos requieren solo una línea para llevar a cabo el proceso de conversión, lo que los hace fáciles de usar de manera eficiente.
Ahora veamos un ejemplo más avanzado donde tomamos la clase HtmlFormatOptions y usamos sus propiedades para personalizar la salida HTML final. Con esta clase, puedes ajustar varios aspectos como el color de fondo, el color de encabezado (H1), la alineación del texto H1, los márgenes de página, y más. En primer lugar, debemos crear una nueva instancia de esta clase, denominada htmlFormat en el código.
En este ejemplo, cambiamos el color de fondo a blanco y establecemos el color del texto H1 a azul usando la clase Iron Software.Drawing.Color. Luego ajustamos el tamaño de fuente del H1 a 25 píxeles. A continuación, personalizamos la alineación del texto H1 para que esté centrada. Finalmente, definimos los márgenes de página del PDF en el documento HTML a 10 píxeles.
El paso final consiste en usar el método SaveAsHtml nuevamente para convertir el PDF a HTML, esta vez con parámetros adicionales. El primer parámetro es el nombre y ubicación para guardar el documento HTML recién generado. A continuación, establecemos un booleano, fullContentWidth, en true, que configura el HTML para utilizar el ancho completo para el contenido del PDF. También especificamos un título para la salida HTML y finalmente aplicamos las configuraciones de personalización que creamos anteriormente con htmlFormatOptions.





