Passer au contenu du pied de page
OUTILS PDF PYTHON

Comment convertir du HTML en PDF en Python

Si vous vous êtes déjà retrouvé dans une situation où vous deviez convertir un fichier HTML en format PDF, alors nous avons juste la solution pour vous.

Aujourd'hui, nous allons vous guider à travers une méthode rapide et efficace utilisant PyHtml2Pdf qui vous fera gagner du temps et des efforts. À la fin de cet article, vous serez capable de générer des PDFs à partir de HTML sans effort en utilisant Python.

Pourquoi choisir Python

Python est un langage de programmation puissant et facile à apprendre qui possède une vaste bibliothèque de packages et de modules pour vous aider à atteindre vos objectifs. Convertir HTML en PDF avec Python ne fait pas exception, car il existe de nombreuses bibliothèques disponibles pour rendre le processus rapide et efficace. Avec Python, vous pouvez automatiser le processus de conversion, le rendant idéal pour les projets à grande échelle ou le traitement par lots.

Présentation de PyHtml2Pdf

Plusieurs bibliothèques Python facilitent la conversion HTML en PDF, y compris ReportLab, xHtml2Pdf et pyhtml2pdf. Chaque bibliothèque offre des fonctionnalités et des capacités uniques, permettant aux développeurs de choisir l'option la plus adaptée à leurs besoins spécifiques.

PyHTML2PDF est une bibliothèque Python open-source qui convertit votre fichier HTML local en un document PDF formaté professionnellement en quelques secondes. PyHTML2PDF est conçu pour une conversion HTML en PDF à grande vitesse, ce qui en fait un choix idéal pour les applications en temps réel et les services à la demande. Traitez de grands volumes de contenu rapidement et efficacement. Il prend en charge une gamme de fonctionnalités HTML et CSS, garantissant que vos PDFs conservent leur formatage et leur conception d'origine. En tant que projet open-source, PyHTML2PDF bénéficie d'un développement continu et d'un support de la communauté Python. Restez à jour avec les dernières fonctionnalités, améliorations et corrections de bugs.

Configuration de votre environnement Python

Installer Python

Avant de vous lancer dans la conversion HTML en PDF, assurez-vous d'avoir Python installé sur votre système. Visitez le site officiel de Python pour télécharger et installer la dernière version de Python pour votre système d'exploitation.

Configuration de votre environnement Python

Une fois Python installé, configurez un environnement virtuel pour isoler les dépendances de votre projet. Utilisez le module venv pour créer et gérer des environnements virtuels, assurant un espace de travail propre et autonome pour votre projet de conversion.

Installer la bibliothèque

Avant de pouvoir commencer à convertir HTML en PDF, vous devez configurer votre environnement. Tout d'abord, vous devez installer PyHtml2Pdf en utilisant pip :

pip install pyhtml2pdf
pip install pyhtml2pdf
SHELL

Avec ces installations terminées, vous êtes maintenant prêt à commencer à convertir HTML en PDF en utilisant PyHtml2Pdf.

Conversion de HTML en PDF à l'aide de PyHtml2Pdf

Convertir un fichier HTML en PDF en utilisant PyHtml2Pdf est simple. Voici un guide étape par étape :

Étape 1: Importer PyHtml2Pdf

Commencez par importer la bibliothèque PyHtml2Pdf dans votre script Python :

from pyhtml2pdf import converter
from pyhtml2pdf import converter
PYTHON

Étape 2: Convertir HTML en PDF

Pour convertir un fichier HTML en PDF, utilisez la fonction convert. Vous devrez fournir le chemin du fichier HTML d'entrée et le chemin du fichier PDF de sortie comme arguments :

import os
from pyhtml2pdf import converter

# Get the absolute path to the HTML file
path = os.path.abspath('test.html')

# Convert the HTML file to a PDF
converter.convert(f'file:///{path}', 'htmlToPdf.pdf')
import os
from pyhtml2pdf import converter

# Get the absolute path to the HTML file
path = os.path.abspath('test.html')

# Convert the HTML file to a PDF
converter.convert(f'file:///{path}', 'htmlToPdf.pdf')
PYTHON

Pour convertir une URL de site Web en PDF, vous pouvez utiliser le code Python suivant :

from pyhtml2pdf import converter

# Convert the URL to a PDF
converter.convert('https://ironpdf.com/', 'urlToPdf.pdf')
from pyhtml2pdf import converter

# Convert the URL to a PDF
converter.convert('https://ironpdf.com/', 'urlToPdf.pdf')
PYTHON

Étape 3: Exécuter le script

Ouvrez un terminal ou une invite de commande sur votre ordinateur et naviguez jusqu'au répertoire où vous avez enregistré votre script Python.

Exécutez le script en entrant la commande python3 htmltopdf.py dans le terminal ou l'invite de commande. Remplacez htmltopdf.py par le nom réel de votre script Python.

Attendez que le script termine son exécution. Après que le script ait terminé de s'exécuter, allez au chemin de sortie spécifié. Vous devriez trouver un fichier PDF nouvellement généré avec le nom que vous avez spécifié.

Comment convertir HTML en PDF en Python : Figure 1

IronPDF : une alternative puissante pour les développeurs .NET

Bien que PyHtml2Pdf soit un excellent choix pour les utilisateurs de Python, les développeurs .NET pourraient rechercher une alternative adaptée à leur plateforme. In this case, IronPDF is a powerful and feature-rich library designed to work with Python, Java, and .NET applications. IronPDF permet aux développeurs de générer, éditer et extraire du contenu des PDFs avec facilité.

Caractéristiques clés d'IronPDF

IronPDF est livré avec une pléthore de fonctionnalités qui en font un choix incontournable pour les développeurs Python :

  • Conversion HTML en PDF : IronPDF vous permet de convertir le contenu HTML, y compris le CSS, en fichiers PDF. Vous pouvez l'utiliser pour convertir des fichiers HTML, des URL ou même des chaînes HTML directement en PDFs.
  • Manipulation des PDFs : Avec IronPDF, vous pouvez non seulement générer des PDFs mais aussi modifier des existants. Vous pouvez fusionner, diviser et ajouter un filigrane aux documents PDF, ce qui en fait un outil complet de manipulation des PDFs.
  • Remplissage de formulaires : IronPDF vous permet de remplir des formulaires PDF par programmation. Cette fonctionnalité est particulièrement utile lorsque vous avez besoin d'automatiser l'entrée de données dans des fichiers PDF.
  • Extraction de texte PDF : L'extraction de texte à partir de fichiers PDF est un jeu d'enfant avec IronPDF. Vous pouvez utiliser cette fonctionnalité pour analyser les données des documents PDF, ce qui facilite l'analyse et le traitement des informations extraites.

Convertir HTML en PDF en utilisant IronPDF

Installer IronPDF : Exécutez la commande suivante dans le terminal pour installer IronPDF :

pip install ironpdf  # Assuming the package manager route for IronPDF
pip install ironpdf  # Assuming the package manager route for IronPDF
SHELL

Utilisez cet extrait de code pour convertir un fichier HTML d'exemple en PDF.

from IronPdf import *
from IronPdf.Engines.Chrome import *

# Create an instance of the ChromePdfRenderer
renderer = ChromePdfRenderer()

# Render the HTML file as a PDF
htmlToPdf = renderer.RenderHtmlFileAsPdf("test.html")

# Save the PDF file
htmlToPdf.SaveAs("output.pdf")
from IronPdf import *
from IronPdf.Engines.Chrome import *

# Create an instance of the ChromePdfRenderer
renderer = ChromePdfRenderer()

# Render the HTML file as a PDF
htmlToPdf = renderer.RenderHtmlFileAsPdf("test.html")

# Save the PDF file
htmlToPdf.SaveAs("output.pdf")
PYTHON

Ce code crée une nouvelle instance de ChromePdfRenderer, rend le fichier "test.html" en tant que document PDF, puis enregistre le document PDF sous le nom "output.pdf" dans le répertoire de sortie. N'oubliez pas de remplacer "test.html" par le chemin de votre fichier HTML et "output.pdf" par le chemin de sortie souhaité du fichier PDF.

Conclusion

Dans cet article, nous avons exploré comment convertir HTML en PDF en utilisant PyHtml2Pdf. Nous avons discuté des avantages de la conversion de HTML en PDF, présenté PyHtml2Pdf comme une solution puissante, et démontré comment configurer l'environnement et convertir des fichiers HTML en PDFs. Nous avons également abordé la personnalisation de la sortie pour répondre à vos besoins spécifiques.

IronPDF offers a generous essai gratuit généreux, vous permettant d'explorer pleinement ses fonctionnalités et capacités avant de vous engager dans un achat. Une fois que vous avez expérimenté la puissance de IronPDF et que vous décidez qu'il convient parfaitement à votre projet, les options de licence commencent à $799.

Curtis Chau
Rédacteur technique

Curtis Chau détient un baccalauréat en informatique (Université de Carleton) et se spécialise dans le développement front-end avec expertise en Node.js, TypeScript, JavaScript et React. Passionné par la création d'interfaces utilisateur intuitives et esthétiquement plaisantes, Curtis aime travailler avec des frameworks modernes ...

Lire la suite