UTILISATION D'IRONPDF POUR PYTHON

Comment visualiser un fichier PDF en Python

Mise à jour septembre 21, 2024
Partager:

Cet article explorera la manière d'afficher des fichiers PDF en Python à l'aide de la bibliothèque IronPDF.

IronPDF - Bibliothèque Python

IronPDF est une puissante bibliothèque Python qui permet aux développeurs de travailler avec des fichiers PDF de manière programmatique. Avec IronPDF, vous pouvez facilement générer, manipuler et extraire des données de documents PDF, ce qui en fait un outil polyvalent pour diverses tâches liées aux PDF. Que vous ayez besoin de créer des PDF à partir de zéro, de modifier des PDF existants ou d'extraire du contenu de PDF, IronPDF offre un ensemble complet de fonctionnalités pour simplifier votre flux de travail.

Parmi les caractéristiques de la bibliothèque IronPDF for Python, citons :

Conditions préalables

Avant de travailler avec IronPDF for Python, il y a quelques prérequis :

  1. Installation de Python : Assurez-vous que Python est installé sur votre système. IronPDF est compatible avec les versions 3.x de Python, assurez-vous donc d'avoir une installation Python compatible.

  2. Bibliothèque IronPDF : Installez la bibliothèque IronPDF pour accéder à ses fonctionnalités. Vous pouvez l'installer à l'aide du gestionnaire de paquets Python(pip) en exécutant la commande suivante dans votre interface de ligne de commande :
    :InstallCmd pip install ironpdf
  1. Bibliothèque Tkinter : Tkinter est la boîte à outils graphique standard pour Python. Il est utilisé pour créer l'interface utilisateur graphique du visualiseur PDF dans l'extrait de code fourni. Tkinter est généralement préinstallé avec Python, mais si vous rencontrez des problèmes, vous pouvez l'installer à l'aide du gestionnaire de paquets :
    :InstallCmd pip install tkinter
  1. Bibliothèque Pillow : La bibliothèque Pillow est un dérivé de la bibliothèque d'imagerie Python(LIP) et offre des possibilités supplémentaires de traitement d'images. Il est utilisé dans l'extrait de code pour charger et afficher les images extraites du PDF. Installez Pillow à l'aide du gestionnaire de paquets :
    :InstallCmd pip install pillow
  1. Environnement de développement intégré(L'IDE) : L'utilisation d'un IDE pour gérer les projets Python peut grandement améliorer votre expérience de développement. Il offre des fonctionnalités telles que la complétion de code, le débogage et un flux de travail plus rationalisé. PyCharm est un IDE populaire pour le développement de Python. Vous pouvez télécharger et installer PyCharm à partir du site web de JetBrains(https://www.jetbrains.com/pycharm/).

  2. Éditeur de texte : Si vous préférez travailler avec un éditeur de texte léger, vous pouvez utiliser l'éditeur de texte de votre choix, tel que Visual Studio Code, Sublime Text ou Atom. Ces éditeurs proposent la coloration syntaxique et d'autres fonctionnalités utiles pour le développement de Python. Vous pouvez également utiliser l'application IDE de Python pour créer des scripts Python.

Création d'un projet de visualisation de PDF avec PyCharm

Après avoir installé PyCharm IDE, créez un projet PyCharm Python en suivant les étapes ci-dessous :

  1. Lancer PyCharm: Ouvrez PyCharm à partir du lanceur d'applications de votre système ou d'un raccourci sur le bureau.

  2. Créer un nouveau projet: Cliquez sur "Créer un nouveau projet" ou ouvrez un projet Python existant.

    Comment convertir un PDF en texte en Python (tutoriel), Figure 1 : PyCharm IDE

    PyCharm IDE

  3. Configurer les paramètres du projet: Donnez un nom à votre projet et choisissez l'endroit où créer le répertoire du projet. Sélectionnez l'interpréteur Python pour votre projet. Cliquez ensuite sur "Créer".

    Comment convertir un PDF en texte en Python (tutoriel), Figure 2 : Créer un nouveau projet Python

    Créer un nouveau projet Python

  4. Créer les fichiers sources: PyCharm va créer la structure du projet, y compris un fichier Python principal et un répertoire pour les fichiers sources supplémentaires. Commencez à écrire le code et cliquez sur le bouton d'exécution ou appuyez sur Shift+F10 pour exécuter le script.

Etapes pour visualiser des fichiers PDF en Python avec IronPDF for Python

Importer les bibliothèques nécessaires

Pour commencer, importez les bibliothèques nécessaires. Dans ce cas, les bibliothèques os, shutil, ironpdf, tkinter, et PIL seront nécessaires. Les bibliothèques os et shutil sont utilisées pour les opérations sur les fichiers et les dossiers, ironpdf est la bibliothèque pour travailler avec les fichiers PDF, tkinter est utilisée pour créer l'interface utilisateur graphique(GUI)et la LIP est utilisée pour la manipulation de l'image.

import os
import shutil
import ironpdf
from tkinter import *
from PIL import Image, ImageTk
PYTHON

Convertir un document PDF en images

Ensuite, définissez une fonction appelée convert_pdf_to_images. Cette fonction prend en entrée le chemin du fichier PDF. À l'intérieur de la fonction, la bibliothèque IronPDF est utilisée pour charger le document PDF à partir du fichier. Il faut ensuite spécifier un chemin d'accès au dossier pour stocker les fichiers d'image extraits. La méthode pdf.RasterizeToImageFiles d'IronPDF est utilisée pour convertir chaque page du PDF en un fichier image et l'enregistrer dans le dossier spécifié. Une liste est utilisée pour stocker les chemins d'accès aux images. L'exemple de code complet est le suivant :

def convert_pdf_to_images(pdf_file):
    pdf = ironpdf.PdfDocument.FromFile(pdf_file)
    # Extract all pages to a folder as image files
    folder_path = "images"
    pdf.RasterizeToImageFiles(os.path.join(folder_path, "*.png"))
    # List to store the image paths
    image_paths = []
    # Get the list of image files in the folder
    for filename in os.listdir(folder_path):
        if filename.lower().endswith((".png", ".jpg", ".jpeg", ".gif")):
            image_paths.append(os.path.join(folder_path, filename))
    return image_paths
PYTHON

Pour extraire du texte à partir de documents PDF, visitez ce sitepage d'exemples de code.

Poignée Fermeture de la fenêtre

Afin de nettoyer les fichiers images extraits lorsque la fenêtre de l'application est fermée, définissez une fonction on_closing. À l'intérieur de cette fonction, utilisez la fonction shutil.rmtree() pour supprimer l'intégralité du dossier images. Ensuite, définissez cette fonction comme le protocole à exécuter lorsque la fenêtre est fermée. Le code suivant permet de réaliser cette tâche :

def on_closing():
    # Delete the images in the 'images' folder
    shutil.rmtree("images")
    window.destroy()

window.protocol("WM_DELETE_WINDOW", on_closing)
PYTHON

Créer la fenêtre de l'interface graphique

Créons maintenant la fenêtre principale de l'interface graphique à l'aide de l'outil Tk()la traduction doit rester professionnelle, en préservant l'exactitude technique tout en expliquant les caractéristiques et les avantages de ces outils de développement() comme protocole pour gérer la fermeture de la fenêtre.

window = Tk()
window.title("Image Viewer")
window.protocol("WM_DELETE_WINDOW", on_closing)
PYTHON

Créer un canevas déroulant

Pour afficher les images et permettre le défilement, créez un widget Canvas. Le widget Canvas est configuré pour remplir l'espace disponible et s'étendre dans les deux sens en utilisant pack(side=LEFT, fill=BOTH, expand=True). En outre, créez un widget "barre de défilement" et configurez-le pour contrôler le défilement vertical de toutes les pages et de tous les canevas.

canvas = Canvas(window)
canvas.pack(side=LEFT, fill=BOTH, expand=True)
scrollbar = Scrollbar(window, command=canvas.yview)
scrollbar.pack(side=RIGHT, fill=Y)
canvas.configure(yscrollcommand=scrollbar.set)
canvas.bind("<Configure>", lambda e: canvas.configure(
    scrollregion=canvas.bbox("all")))
canvas.bind_all("<MouseWheel>", lambda e: canvas.yview_scroll(
    int(-1*(e.delta/120)), "units"))
PYTHON

Créer un cadre pour les images

Ensuite, créez un widget Frame à l'intérieur du canevas pour contenir les images en utilisant create_window() pour placer le cadre dans la toile. Le (0, 0) et le paramètre anchor='nw' garantissent que le cadre commence dans le coin supérieur gauche de la toile.

frame = Frame(canvas)
canvas.create_window((0, 0), window=frame, anchor="nw")
PYTHON

Convertir un fichier PDF en images et l'afficher

L'étape suivante consiste à appeler la fonction convert_pdf_to_images() avec le nom du chemin d'accès au fichier PDF d'entrée. Cette fonction extrait les pages PDF sous forme d'images et renvoie une liste de chemins d'accès aux images. En parcourant les chemins d'accès aux images et en chargeant chaque image à l'aide de la fonction Image.open()avec la méthodede la bibliothèque PIL, un objet PhotoImage est créé en utilisant ImageTk.PhotoImage(). Créez ensuite un widgetLabel` pour afficher l'image.

images = convert_pdf_to_images("input.pdf")
# Load and display the images in the Frame
for image_path in images:
    image = Image.open(image_path)
    photo = ImageTk.PhotoImage(image)
    label = Label(frame, image=photo)
    label.image = photo  # Store a reference to prevent garbage collection
    label.pack(pady=10)
PYTHON

Comment convertir un PDF en texte en Python (Tutoriel), Figure 3 : Le fichier d'entrée

**Le fichier d'entrée

Exécuter la boucle principale de l'interface graphique

Enfin, exécutons la boucle événementielle principale en utilisant window.mainloop(). Cela garantit que la fenêtre de l'interface graphique reste ouverte et réactive jusqu'à ce qu'elle soit fermée par l'utilisateur.

window.mainloop()
PYTHON

Comment convertir un PDF en texte en Python (Tutoriel), Figure 4 : La sortie de l'interface utilisateur

La sortie de l'interface utilisateur

Conclusion

Ce tutoriel a exploré comment visualiser des documents PDF en Python à l'aide de l'outilIronPDF bibliothèque. Elle couvre les étapes nécessaires pour ouvrir un fichier PDF et le convertir en une série de fichiers images, puis les afficher dans un canevas défilant, et gérer le nettoyage des images extraites à la fermeture de l'application.

Pour plus de détails sur la bibliothèque IronPDF for Python, veuillez vous référer à la page d'accueil de la bibliothèquela documentation.

Télécharger et installerIronPDF for Python et obtenir également unessai gratuit pour tester l'ensemble de ses fonctionnalités dans le cadre d'un développement commercial.

< PRÉCÉDENT
Comment extraire du texte d'un PDF en Python
SUIVANT >
Comment convertir un PDF en texte en Python (Tutoriel)

Prêt à commencer ? Version : 2024.11.1 vient de paraître

Installation gratuite de pip Voir les licences > ;