USO DE IRONPDF FOR PYTHON

Cómo convertir PDF a PDFA en Python

Actualizado julio 22, 2023
Compartir:

Introducción

El formato de documento portátil desarrollado por Adobe (PDF) es esencial para mantener la integridad de un contenido rico en texto y estéticamente agradable a la hora de compartir documentos. Diseñado específicamente para su uso en el archivo y la conservación a largo plazo de documentos electrónicos, PDF/A es una versión normalizada ISO del formato de documento portátil (PDF). A diferencia de PDF, PDF/A prohíbe funciones como el cifrado y la vinculación de fuentes, que resultan inadecuadas para el archivado a largo plazo. Las especificaciones ISO para los visores de archivos PDF/A incluyen directrices para la gestión del color, ayuda con los tipos de letra incrustados y una interfaz de usuario para leer las anotaciones incrustadas. En este post, utilizaremos el módulo IronPDF Python para convertir un archivo PDF existente en un archivo PDFA.

2.0 IronPDF

En comparación con otros lenguajes, Python proporciona un dinamismo significativamente mayor a los programadores y permite a éstos crear rápida y fácilmente interfaces gráficas de usuario. Por lo tanto, incorporar la biblioteca IronPDF a Python es un proceso sencillo. Se puede utilizar una amplia gama de herramientas preinstaladas, como PyQt, wxWidgets, Kivy, y varios otros paquetes y bibliotecas, para ensamblar de forma eficiente y segura una GUI completamente funcional.

El diseño y el desarrollo web en Python se simplifican enormemente con la ayuda de IronPDF. Esto se atribuye principalmente a la abundancia de paradigmas de desarrollo web de Python disponibles, incluidos Django, Flask y Pyramid. Sitios web y servicios en línea como Reddit, Mozilla y Spotify han empleado con éxito estos marcos.

2.1 Características de IronPDF

  • HTML, HTML5, ASP, PHP y otras fuentes pueden utilizarse para crear archivos PDF. Además, los archivos de imágenes se pueden convertir a PDF.
  • IronPDF permite crear documentos PDF interactivos. Ofrece funciones como imprimir archivos PDF, rasterizar páginas PDF a imágenes, convertir PDF a HTML, dividir y combinar archivos PDF, extraer texto e imágenes de archivos PDF, buscar frases específicas en archivos PDF y rellenar y enviar formularios interactivos.
  • Con IronPDF, es posible crear un documento a partir de una URL y, al mismo tiempo, admitir agentes de usuario, proxies, cookies, cabeceras HTTP, credenciales de inicio de sesión de red únicas, variables de formulario y agentes de usuario que inician sesión mediante formularios de inicio de sesión HTML.
  • IronPDF permite a los usuarios inspeccionar y anotar archivos PDF.
  • Las imágenes pueden extraerse de los documentos con IronPDF.
  • IronPDF permite añadir encabezados, pies de página, texto, imágenes, marcadores, marcas de agua y mucho más a los documentos.
  • Los usuarios pueden combinar y dividir páginas dentro de un documento nuevo o existente utilizando IronPDF.
  • La conversión de documentos a objetos PDF es posible sin depender de un visor Acrobat.
  • IronPDF permite crear un documento PDF a partir de un archivo CSS.
  • Los archivos CSS con especificaciones de tipo de medio pueden utilizarse para construir documentos con IronPDF.

3.0 Configurar el entorno Python

3.1 Configuración de Python

Asegúrese de que Python está instalado en su ordenador. Visite la página oficial de Python sitio web para descargar e instalar la última versión de Python adecuada para su sistema operativo. Una vez instalado Python, crea un entorno virtual para aislar los requisitos de tu proyecto. Utilice el módulo venv para crear y gestionar entornos virtuales, proporcionando un espacio de trabajo limpio y separado para su proyecto de conversión.

3.2 Nuevo proyecto en PyCharm

Para este tutorial utilizaremos PyCharm, un IDE para el desarrollo en Python.

Después de iniciar el IDE PyCharm, seleccione "Nuevo proyecto" en el menú, como se muestra en la figura siguiente.

Cómo convertir PDF a PDF/A en Python: Figura 1

Cuando seleccione "Nuevo proyecto", aparecerá una nueva ventana que le permitirá especificar la ubicación del proyecto y el entorno Python, como se muestra en la figura siguiente.

Cómo convertir PDF a PDF/A en Python: Figura 2

Tras seleccionar la ubicación del proyecto y la ruta del entorno, pulse el botón "Crear" para iniciar un nuevo proyecto. En la ventana recién abierta, puede introducir su código en un archivo Python. Este tutorial utiliza Python 3.9.

Cómo convertir PDF a PDF/A en Python: Figura 3

3.3 Requisitos de la biblioteca IronPDF

IronPDF en Python utiliza .NET. Por lo tanto, es necesario tener instalado .NET Runtime en su máquina para poder utilizar IronPDF for Python. Viene preinstalado en Windows, pero es posible que los usuarios de Linux y Mac tengan que instalar .NET antes de utilizar este paquete de Python.

3.4 Configuración de la biblioteca IronPDF

Para poder generar, modificar y abrir archivos con extensión ".pdf", es necesario tener instalado el paquete ironpdf. Abra una ventana de terminal e introduzca el siguiente comando para instalar el paquete en PyCharm:

  pip install ironpdf

El paquete ironpdf ha sido instalado, como se muestra en la siguiente captura de pantalla.

Cómo convertir PDF a PDF/A en Python: Figura 4

4.0 Crear PDF/A a partir de un documento PDF

Con la ayuda de la biblioteca IronPDF, crear un documento PDFA/A es un proceso sencillo. Estos archivos están diseñados para almacenar información para su conservación a largo plazo. A continuación se muestra un fragmento de código de ejemplo para convertir un archivo PDF en un archivo PDFA:

from ironpdf import *
pdf = PdfDocument.FromFile("sample.pdf")
pdf.SaveAsPdfA("Converted_pdfa.pdf", PdfAVersions.PdfA3)
PYTHON

El código anterior demuestra cómo podemos convertir fácilmente archivos PDF a formato PDF/A utilizando sólo unas pocas líneas de código Python con la ayuda de IronPDF. En el paso inicial, importamos la biblioteca IronPDF, que nos permite utilizar todas las funciones que proporciona IronPDF. Mediante la clase PdfDocument, podemos procesar archivos PDF existentes y realizar diversas operaciones con ellos.

Mediante el método FromFile, podemos cargar el archivo PDF de entrada especificando su ruta de archivo como parámetro. El objeto PdfDocument proporciona el método SaveAsPdfA, que nos permite guardar y convertir el archivo PDF al formato PDF/A. El método SaveAsPdfA requiere dos parámetros: la nueva ubicación del archivo guardado y la versión PDF/A. El parámetro de versión PDF/A es opcional y, si no se especifica, será por defecto PdfAVersions.PdfA3.

Cómo convertir PDF a PDFA en Python: Figura 5

En la salida, se muestran tanto el archivo de origen como el archivo PDF/A creado. Sin embargo, la marca de agua puede eliminarse utilizando la versión con licencia del programa. Para obtener tutoriales e información más detallada, puede hacer clic en lo siguiente enlace.

5.0 Conclusión

Para mejorar la seguridad de los datos y minimizar los riesgos potenciales, la biblioteca IronPDF ofrece sólidas funciones de seguridad. Es compatible con los principales navegadores y no se limita a ninguno en particular. Con sólo unas pocas líneas de código, los programadores pueden crear y leer fácilmente archivos PDF utilizando IronPDF. La biblioteca ofrece una gama de opciones de licencia para satisfacer las diversas necesidades de los desarrolladores, incluida una licencia gratuita para desarrolladores y licencias de desarrollo adicionales disponibles para su compra.

El paquete Lite, con un precio de $749, incluye una licencia perpetua, una garantía de devolución del dinero de 30 días, un año de soporte de software y opciones de actualización. No hay gastos adicionales tras la compra inicial. Estas licencias son adecuadas para los entornos de desarrollo, ensayo y producción. Además, IronPDF ofrece licencias gratuitas con ciertas restricciones temporales y de redistribución. Los usuarios tienen la oportunidad de probar el software en un entorno real con un prueba gratuita durante el cual no se aplica ninguna marca de agua. Haga clic en enlace para obtener información adicional sobre el precio de prueba y las licencias de IronPDF.

< ANTERIOR
Cómo aplanar un archivo PDF en Python
SIGUIENTE >
Cómo escribir un archivo PDF en Python

¿Listo para empezar? Versión: 2024.8 acaba de salir

Instalación pip gratuita View Licenses >