from ironpdf import *
# Instantiate Renderer
renderer = ChromePdfRenderer()
# Create a PDF from a HTML string using Python
pdf = renderer.RenderHtmlAsPdf("<h1>Hello World</h1>")
# Export to a file or Stream
pdf.SaveAs("output.pdf")
# Advanced Example with HTML Assets
# Load external html assets: Images, CSS and JavaScript.
# An optional BasePath 'C:\site\assets\' is set as the file location to load assets from
myAdvancedPdf = renderer.RenderHtmlAsPdf("<img src='icons/iron.png'>", r"C:\site\assets")
myAdvancedPdf.SaveAs("html-with-assets.pdf")
Les fichiers PDF (Portable Document Format) sont devenus une norme universelle pour le partage de documents. Ils sont largement utilisés pour leur capacité à préserver la mise en page et le formatage d'un document. Cependant, travailler avec des fichiers PDF à l'aide de langages de programmation comme Python peut s'avérer un peu difficile. Cet article présente IronPDF, une bibliothèque PDF Python qui nous permet d'effectuer diverses opérations avec des documents PDF.
IronPDF for Python PDF Library (Bibliothèque PDF Python)
IronPDF est un logiciel avancé deBibliothèque PDF Python qui facilite le travail avec des fichiers au format PDF. Il fournit une API facile à utiliser pour diverses opérations PDF. Vous pouvez lire et écrire des fichiers PDF, convertir des fichiers PDF dans différents formats, combiner plusieurs fichiers PDF, et bien plus encore. Il peut également traiter les objets de page, extraire du texte de toutes les pages du fichier PDF et faire pivoter les pages PDF, entre autres fonctionnalités.
Comment lire des fichiers PDF en Python
Installez la bibliothèque Python PDF à l'aide de Python.
Importez la bibliothèque PDF de Python dans le script Python.
Appliquez la clé de licence de la bibliothèque PDFReader Python.
Charger n'importe quel document PDF en fournissant le chemin d'accès au document.
Lire du contenu PDF sur la console Python.
Lire un fichier PDF à l'aide d'IronPDF
La lecture d'un fichier PDF à l'aide d'IronPDF comporte plusieurs étapes. Voici un guide simple pour vous aider à démarrer :
Étape 1 Créer un environnement virtuel dans Visual Studio
Lorsque l'on travaille avec Python, il est essentiel de créer un environnement isolé, appelé environnement virtuel. Cet environnement vous permet de gérer les dépendances spécifiques au projet sur lequel vous travaillez sans interférer avec les autres projets. La création d'un environnement virtuel devient encore plus simple dans un environnement de développement intégré(L'IDE) comme Visual Studio Code. Pour ce faire, suivez les étapes ci-dessous :
Ouvrez le dossier dans Visual Studio Code. Appuyez sur Ctrl+Shift+P pour ouvrir la palette de commandes. Dans la palette de commandes, recherchez "Python : Créer un environnement"
Sélectionnez la première option, puis choisissez "Venv" comme type d'environnement.
Ensuite, sélectionnez l'interpréteur Python, et il commencera à créer l'environnement virtuel.
Vous avez maintenant votre espace de travail isolé prêt pour vos scripts Python, en vous assurant que les dépendances du projet sont confinées dans cet environnement.
Étape 2 Installer la bibliothèque IronPDF for Python
Une fois l'environnement virtuel mis en place, vous êtes prêt à installer la bibliothèque IronPDF for Python. Vous pouvez l'installer à l'aide de l'installateur de paquets Python 'pip' :
pip install ironpdf
Étape 3 Installer .NET 6.0
IronPDF for Python nécessite l'installation du SDK .NET 6.0.
Veuillez télécharger et installer le SDK .NET 6.0 à partir de l'adresse suivanteSite web de Microsoft .NET.
Étape 4 Importer IronPDF
Après avoir installé IronPDF avec succès, l'étape suivante consiste à l'importer dans votre script Python. L'importation de la bibliothèque rend toutes ses fonctions et méthodes disponibles pour être utilisées dans votre script. Vous pouvez importer IronPDF en utilisant la ligne de code suivante :
from ironpdf import *
from ironpdf import *
PYTHON
Cette ligne de code importe dans votre script tous les modules, fonctions et classes disponibles dans la bibliothèque IronPDF.
Étape 5 Appliquer la clé de licence
Pour exploiter pleinement les capacités de la bibliothèque IronPDF, vous devez appliquer une clé de licence. L'application d'une clé de licence est aussi simple que l'affectation de la clé à la propriété LicenseKey de la classe License. Voici comment procéder :
License.LicenseKey = "License-Key-Here"
License.LicenseKey = "License-Key-Here"
PYTHON
Remplacez "License-Key-Here" par votre clé de licence IronPDF. Avec la clé de licence en place, vous êtes maintenant prêt à exploiter tout le potentiel de la bibliothèque IronPDF dans vos scripts Python.
Étape 6 Définir le chemin d'accès au journal
Ensuite, configurez la journalisation des opérations d'IronPDF. En définissant un chemin d'accès personnalisé, vous pouvez stocker les journaux d'exécution générés par la bibliothèque, ce qui vous aide à déboguer et à diagnostiquer les problèmes qui peuvent survenir pendant l'exécution. Voici comment procéder :
# Set a log path
Logger.EnableDebugging = True
Logger.LogFilePath = "Custom.log"
Logger.LoggingMode = Logger.LoggingModes.All
# Set a log path
Logger.EnableDebugging = True
Logger.LogFilePath = "Custom.log"
Logger.LoggingMode = Logger.LoggingModes.All
PYTHON
Dans cet extrait, Logger.EnableDebugging = True active le débogage, Logger.LogFilePath = "Custom.log fixe le fichier journal de sortie à "Custom.log", et Logger.LoggingMode = Logger.LoggingModes.All s'assure que tous les types d'informations de journal sont enregistrés.
Étape 7 Charger le document PDF
Le chargement d'un document PDF avec IronPDF est aussi simple que l'appel d'une méthode. La méthode PdfDocument.FromFile charge le document PDF à partir du chemin donné dans un objet fichier PDF. Il vous suffit d'indiquer le chemin d'accès au fichier PDF sous la forme d'une chaîne de caractères :
pdf = PdfDocument.FromFile("PDF B.pdf")
pdf = PdfDocument.FromFile("PDF B.pdf")
PYTHON
Dans ce code, pdf devient un objet PdfDocument représentant le fichier PDF spécifié.
Étape 8 Lire le contenu du fichier PDF
IronPDF fournit une méthode appelée ExtractAllText() cela aide pourextraire le contenu textuel du PDF document. C'est particulièrement pratique lorsque vous devez lire et analyser le contenu d'un fichier PDF :
all_text = pdf.ExtractAllText() # Extracts all text from the PDF document
print(all_text) # Prints the extracted text to the console
all_text = pdf.ExtractAllText() # Extracts all text from the PDF document
print(all_text) # Prints the extracted text to the console
PYTHON
Dans cet exemple, all_text contiendra tout le texte du fichier PDF de l'objet pdf. Vous pourrez lire des contenus PDF sur la console.
Étape 9 Charger le deuxième fichier PDF
Tout comme vous avez chargé le premier document PDF, vous pouvez également charger un deuxième document PDF. Cette fonction est utile lorsque vous souhaitez manipuler plusieurs fichiers PDF :
pdf_2 = PdfDocument.FromFile("PDF A.pdf")
pdf_2 = PdfDocument.FromFile("PDF A.pdf")
PYTHON
Dans ce code, pdf_2 est un autre objet PdfDocument représentant le second fichier PDF.
Étape 10 Fusionner les deux fichiers
L'une des fonctionnalités les plus puissantes d'IronPDF est la suivantefusionner plusieurs fichiers PDF en un seul nouveau fichier PDF. Vous pouvez facilement combiner deux documents PDF ou plus en utilisant la méthode PdfDocument.Merge :
merged = PdfDocument.Merge(pdf, pdf_2) # Merges pdf and pdf_2 documents
merged.SaveAs("Merged.pdf") # Saves the merged document as 'Merged.pdf'
merged = PdfDocument.Merge(pdf, pdf_2) # Merges pdf and pdf_2 documents
merged.SaveAs("Merged.pdf") # Saves the merged document as 'Merged.pdf'
PYTHON
Dans cet exemple, merged est un nouvel objet PdfDocument qui est le résultat de la fusion de pdf et pdf_2. La méthode SaveAs enregistre ensuite ce document fusionné sous le nom "Merged.pdf".
Étape 11 Diviser le premier PDF
IronPDF vous permet également dediviser un document PDF et extraire des pages spécifiques dans de nouveaux fichiers PDF. Cette opération s'effectue à l'aide de la méthode CopyPage :
page1doc = pdf.CopyPage(0) # Copies the first page of the pdf document
page1doc.SaveAs("Split1.pdf") # Saves the copied page as a new document 'Split1.pdf'
page1doc = pdf.CopyPage(0) # Copies the first page of the pdf document
page1doc.SaveAs("Split1.pdf") # Saves the copied page as a new document 'Split1.pdf'
PYTHON
Ici, page1doc est un nouvel objet PdfDocument qui contient la première page du document pdf. Cette page est ensuite enregistrée en tant que PDF de sortie nommé "Split1.pdf".
Étape 12 Appliquer le filigrane
Le filigrane est une autre fonction impressionnante offerte par IronPDF. Vous pouvez apposer un filigrane sur votre document PDF avec le texte ou l'image de votre choix. La méthode ApplyWatermark est utilisée pour ajouter un filigrane au PDF représenté par l'objet pdf.
Dans cet extrait, ApplyWatermark applique un filigrane rouge avec le texte "SAMPLE" au centre du PDF. Ensuite, SaveAs enregistre le document filigrané en tant que "Watermarked.pdf".
Compatibilité avec IronPDF
IronPDF est une bibliothèque Python polyvalente compatible avec un grand nombre de versions de Python. Il prend en charge toutes les versions modernes de Python à partir de Python 3.6. IronPDF n'est pas limité à un seul système d'exploitation. Il est indépendant de la plate-forme et peut donc être utilisé sur un grand nombre de systèmes d'exploitation. Qu'il s'agisse de Windows, de Mac ou de Linux, IronPDF fonctionne de manière transparente sur toutes ces plateformes. Cette compatibilité multiplateforme est un avantage considérable qui fait d'IronPDF un choix de premier ordre pour les développeurs, quelles que soient leurs préférences en matière de système d'exploitation.
Conclusion
En conclusion, IronPDF est une excellente bibliothèque Python qui simplifie le traitement des documents PDF. Que vous ayez besoin de fusionner plusieurs PDF, d'extraire du texte, de diviser des fichiers PDF ou d'appliquer des filigranes, IronPDF a tout ce qu'il vous faut. Sa compatibilité avec de multiples plateformes et sa facilité d'utilisation en font un outil précieux pour tout développeur travaillant avec des documents PDF.
IronPDF offre un service deessai gratuit. Cette période d'essai vous donne l'occasion d'expérimenter ses fonctionnalités et d'évaluer son adéquation à vos besoins spécifiques. Une fois que vous l'avez testé, vous pouvez acheter une licence à partir de $749.
Avant de devenir ingénieur logiciel, Kannapat a obtenu un doctorat en ressources environnementales à l'université d'Hokkaido au Japon. Tout en poursuivant ses études, Kannapat est également devenu membre du Vehicle Robotics Laboratory, qui fait partie du Department of Bioproduction Engineering (département d'ingénierie de la bioproduction). En 2022, il a mis à profit ses compétences en C# pour rejoindre l'équipe d'ingénieurs d'Iron Software, où il se concentre sur IronPDF. Kannapat apprécie son travail car il apprend directement auprès du développeur qui écrit la majeure partie du code utilisé dans IronPDF. Outre l'apprentissage par les pairs, Kannapat apprécie l'aspect social du travail chez Iron Software. Lorsqu'il n'écrit pas de code ou de documentation, Kannapat peut généralement être trouvé en train de jouer sur sa PS5 ou de revoir The Last of Us.
< PRÉCÉDENT Comment créer un fichier PDF en Python ?
Des millions d'ingénieurs dans le monde entier lui font confiance
Réservez une démo en direct gratuite
Réservez une démonstration personnelle de 30 minutes.
Pas de contrat, pas de détails de carte, pas d'engagements.
Voici ce à quoi vous pouvez vous attendre :
Une démonstration en direct de notre produit et de ses principales fonctionnalités
Obtenez des recommandations de fonctionnalités spécifiques au projet
Toutes vos questions trouvent réponse pour vous assurer de disposer de toutes les informations dont vous avez besoin. (Aucun engagement de votre part.)
CHOISIR L'HEURE
VOS INFORMATIONS
Réservez votre démo en direct gratuite
Fiable par plus de 2 millions d'ingénieurs dans le monde entier