VERWENDUNG VON IRONPDF FOR PYTHON

Wie man PDF-Dateien in Python anzeigt

Chaknith Bin

2. Juli 2023

Aktualisiert 21. September 2024

Teilen Sie:

In diesem Artikel wird erläutert, wie PDF-Dateien in Python mit der IronPDF-Bibliothek angezeigt werden können.

IronPDF - Python-Bibliothek

IronPDF ist eine leistungsstarke Python-Bibliothek, die Entwicklern ermöglicht, programmgesteuert mit PDF-Dateien zu arbeiten. Mit IronPDF können Sie auf einfache Weise Daten aus PDF-Dokumenten generieren, bearbeiten und extrahieren, was es zu einem vielseitigen Werkzeug für verschiedene PDF-bezogene Aufgaben macht. Ganz gleich, ob Sie PDFs von Grund auf neu erstellen, vorhandene PDFs ändern oder Inhalte aus PDFs extrahieren müssen, IronPDF bietet eine umfassende Reihe von Funktionen, die Ihren Arbeitsablauf vereinfachen.

Einige Merkmale der IronPDF for Python-Bibliothek sind:

Erstellen Sie eine neue PDF-Datei von Grund auf mit HTML oder URL
Vorhandene PDF-Dateien bearbeiten
Drehen von PDF-Seiten
Text extrahieren, Metadaten und Bilder aus PDF-Dateien
PDF-Dateien in andere Formate konvertieren
Sichern Sie PDF-Dateien mit Passwörtern und Einschränkungen
Teilen und zusammenführen von PDFs
Hinweis: IronPDF erstellt eine mit Wasserzeichen versehene PDF-Datei. Um das Wasserzeichen zu entfernen, müssen Sie IronPDF lizenzieren. Wenn Sie eine lizenzierte Version von IronPDF verwenden möchten, besuchen Sie die IronPDF-Website, um einen Lizenzschlüssel zu erhalten.

Voraussetzungen

Bevor Sie mit IronPDF in Python arbeiten können, müssen Sie einige Voraussetzungen erfüllen:

Python-Installation: Stellen Sie sicher, dass Python auf Ihrem System installiert ist. IronPDF ist kompatibel mit Python 3.x Versionen, also stellen Sie sicher, dass Sie eine kompatible Python Installation haben.
IronPDF Library: Installieren Sie die IronPDF-Bibliothek, um auf deren Funktionen zuzugreifen. Sie können es mit dem Python-Paketmanager (pip) installieren, indem Sie den folgenden Befehl in Ihrer Befehlszeilenschnittstelle ausführen:

    :InstallCmd pip install ironpdf

    :InstallCmd pip install ironpdf

SHELL

Tkinter-Bibliothek: Tkinter ist das Standard-GUI-Toolkit für Python. Es wird für die Erstellung der grafischen Benutzeroberfläche für den PDF-Viewer im bereitgestellten Codeschnipsel verwendet. Tkinter wird normalerweise mit Python vorinstalliert, aber wenn Sie auf Probleme stoßen, können Sie es über den Paketmanager installieren:

    :InstallCmd pip install tkinter

    :InstallCmd pip install tkinter

SHELL

Pillow-Bibliothek: Die Pillow-Bibliothek ist ein Fork der Python Imaging Library (PIL) und bietet zusätzliche Bildverarbeitungsfunktionen. Sie wird in dem Codeschnipsel zum Laden und Anzeigen der aus der PDF-Datei extrahierten Bilder verwendet. Installieren Sie Pillow mit dem Paketmanager:

    :InstallCmd pip install pillow

    :InstallCmd pip install pillow

SHELL

Integrierte Entwicklungsumgebung (IDE): Die Verwendung einer IDE zur Verwaltung von Python-Projekten kann Ihre Entwicklungserfahrung erheblich verbessern. Es bietet Funktionen wie Code-Vervollständigung, Debugging und einen effizienteren Arbeitsablauf. Eine beliebte IDE für die Python-Entwicklung ist PyCharm. Sie können PyCharm von der JetBrains-Website herunterladen und installieren (https://www.jetbrains.com/pycharm/).
Texteditor: Alternativ, wenn Sie lieber mit einem leichten Texteditor arbeiten, können Sie jeden beliebigen Texteditor Ihrer Wahl verwenden, wie zum Beispiel Visual Studio Code, Sublime Text oder Atom. Diese Editoren bieten Syntaxhervorhebung und andere nützliche Funktionen für die Python-Entwicklung. Sie können auch die Python-eigene IDE-App für die Erstellung von Python-Skripten verwenden.

Erstellung eines PDF-Viewer-Projekts mit PyCharm

Nachdem Sie die PyCharm IDE installiert haben, erstellen Sie ein PyCharm Python-Projekt, indem Sie die folgenden Schritte ausführen:

Starten Sie PyCharm: Öffnen Sie PyCharm über den Anwendungsstarter Ihres Systems oder die Desktop-Verknüpfung.
Neues Projekt erstellen: Klicken Sie auf "Neues Projekt erstellen" oder öffnen Sie ein bestehendes Python-Projekt.
PyCharm-IDE
Projekteinstellungen konfigurieren: Geben Sie einen Namen für Ihr Projekt an und wählen Sie den Speicherort für das Erstellen des Projektverzeichnisses aus. Wählen Sie den Python-Interpreter für Ihr Projekt aus. Klicken Sie dann auf "Erstellen".
Erstellen Sie ein neues Python-Projekt
Quelldateien erstellen: PyCharm wird die Projektstruktur erstellen, einschließlich einer Haupt-Python-Datei und einem Verzeichnis für zusätzliche Quelldateien. Beginnen Sie mit dem Schreiben des Codes und klicken Sie auf die Schaltfläche Ausführen oder drücken Sie Umschalt+F10, um das Skript auszuführen.

Schritte zum Anzeigen von PDF-Dateien in Python mit IronPDF

Importieren Sie die erforderlichen Bibliotheken

Importieren Sie zunächst die erforderlichen Bibliotheken. In diesem Fall werden die Bibliotheken os, shutil, ironpdf, tkinter und PIL benötigt. Die Bibliotheken os und shutil werden für Datei- und Ordneroperationen verwendet, ironpdf ist die Bibliothek für die Arbeit mit PDF-Dateien, tkinter wird für die Erstellung der grafischen Benutzeroberfläche (GUI) verwendet, und PIL wird für die Bildbearbeitung eingesetzt.

import os
import shutil
import ironpdf
from tkinter import *
from PIL import Image, ImageTk

py

PYTHON

PDF-Dokument in Bilder umwandeln

Als nächstes definieren Sie eine Funktion namens convert_pdf_to_images. Diese Funktion nimmt den Pfad der PDF-Datei als Eingabe. Innerhalb der Funktion wird die IronPDF-Bibliothek verwendet, um das PDF-Dokument aus der Datei zu laden. Anschließend wird ein Ordnerpfad zum Speichern der extrahierten Bilddateien angegeben. Die Methode pdf.RasterizeToImageFiles von IronPDF wird verwendet, um jede PDF-Seite der PDF in eine Bilddatei zu konvertieren und im angegebenen Ordner zu speichern. Und eine Liste wird verwendet, um die Bildpfade zu speichern. Das vollständige Codebeispiel lautet wie folgt:

def convert_pdf_to_images(pdf_file):
    pdf = ironpdf.PdfDocument.FromFile(pdf_file)
    # Extract all pages to a folder as image files
    folder_path = "images"
    pdf.RasterizeToImageFiles(os.path.join(folder_path, "*.png"))
    # List to store the image paths
    image_paths = []
    # Get the list of image files in the folder
    for filename in os.listdir(folder_path):
        if filename.lower().endswith((".png", ".jpg", ".jpeg", ".gif")):
            image_paths.append(os.path.join(folder_path, filename))
    return image_paths

py

PYTHON

Um Text aus PDF-Dokumenten zu extrahieren, besuchen Sie diese Seite mit Codebeispielen.

Handgriff Fensterverschluss

Um die extrahierten Bilddateien zu bereinigen, wenn das Anwendungsfenster geschlossen wird, definieren Sie eine on_closing-Funktion. In dieser Funktion verwenden Sie die shutil.rmtree()-Methode, um den gesamten images-Ordner zu löschen. Legen Sie dann diese Funktion als das Protokoll fest, das beim Schließen des Fensters ausgeführt werden soll. Der folgende Code hilft bei der Erfüllung dieser Aufgabe:

def on_closing():
    # Delete the images in the 'images' folder
    shutil.rmtree("images")
    window.destroy()

window.protocol("WM_DELETE_WINDOW", on_closing)

py

PYTHON

Erstellen Sie das GUI-Fenster

Nun erstellen wir das Haupt-GUI-Fenster mit dem Tk()-Konstruktor, indem wir den Fenstertitel auf "Image Viewer" setzen und die Funktion on_closing() als Protokoll festlegen, um das Schließen des Fensters zu bearbeiten.

window = Tk()
window.title("Image Viewer")
window.protocol("WM_DELETE_WINDOW", on_closing)

py

PYTHON

Erstellen einer rollbaren Leinwand

Um die Bilder anzuzeigen und das Scrollen zu ermöglichen, erstellen Sie ein Canvas-Widget. Das Canvas-Widget ist so konfiguriert, dass es den verfügbaren Raum ausfüllt und sich in beide Richtungen mit pack(side=LEFT, fill=BOTH, expand=True) erweitert. Erstellen Sie zusätzlich ein Scrollbar-Widget und konfigurieren Sie es so, dass es das vertikale Scrollen aller Seiten und Leinwände steuert.

canvas = Canvas(window)
canvas.pack(side=LEFT, fill=BOTH, expand=True)
scrollbar = Scrollbar(window, command=canvas.yview)
scrollbar.pack(side=RIGHT, fill=Y)
canvas.configure(yscrollcommand=scrollbar.set)
canvas.bind("<Configure>", lambda e: canvas.configure(
    scrollregion=canvas.bbox("all")))
canvas.bind_all("<MouseWheel>", lambda e: canvas.yview_scroll(
    int(-1*(e.delta/120)), "units"))

py

PYTHON

Einen Rahmen für Bilder erstellen

Erstellen Sie als nächstes ein Frame-Widget innerhalb der Leinwand, um die Bilder zu halten, indem Sie create_window() verwenden, um den Rahmen innerhalb der Leinwand zu platzieren. Die (0, 0) Koordinaten und der Parameter anchor='nw' gewährleisten, dass der Rahmen in der oberen linken Ecke der Leinwand beginnt.

frame = Frame(canvas)
canvas.create_window((0, 0), window=frame, anchor="nw")

py

PYTHON

PDF-Datei in Bilder umwandeln und anzeigen

Der nächste Schritt besteht darin, die Funktion convert_pdf_to_images() mit dem Dateipfadnamen der Eingabe-PDF-Datei aufzurufen. Diese Funktion extrahiert die PDF-Seiten als Bilder und gibt eine Liste von Bildpfaden zurück. Indem Sie die Bildpfade durchlaufen und jedes Bild mit der Image.open()-Methode aus der PIL-Bibliothek laden, wird ein PhotoImage-Objekt mithilfe von ImageTk.PhotoImage() erstellt. Erstellen Sie dann ein Label-Widget, um das Bild anzuzeigen.

images = convert_pdf_to_images("input.pdf")
# Load and display the images in the Frame
for image_path in images:
    image = Image.open(image_path)
    photo = ImageTk.PhotoImage(image)
    label = Label(frame, image=photo)
    label.image = photo  # Store a reference to prevent garbage collection
    label.pack(pady=10)

py

PYTHON

Wie man PDF in Text in Python konvertiert (Tutorial), Abbildung 3: Die Eingabedatei

Die Eingabedatei

Starten Sie die GUI-Hauptschleife

Abschließend lassen wir die Hauptereignisschleife mit window.mainloop() laufen. Dadurch wird sichergestellt, dass das GUI-Fenster geöffnet und reaktionsfähig bleibt, bis es vom Benutzer geschlossen wird.

window.mainloop()

py

PYTHON

Wie man PDF in Text in Python umwandelt (Tutorial), Abbildung 4: Die Benutzeroberflächenausgabe

Die UI-Ausgabe

Schlussfolgerung

In diesem Tutorial wurde untersucht, wie PDF-Dokumente in Python mit der IronPDF-Bibliothek angezeigt werden können. Es wurden die Schritte beschrieben, die erforderlich sind, um eine PDF-Datei zu öffnen und in eine Reihe von Bilddateien zu konvertieren, diese dann in einer scrollbaren Leinwand anzuzeigen und die Bereinigung der extrahierten Bilder beim Schließen der Anwendung zu handhaben.

Weitere Einzelheiten zur IronPDF for Python-Bibliothek finden Sie in der Dokumentation.

Laden Sie die IronPDF for Python-Bibliothek herunter und installieren Sie sie, und erhalten Sie auch eine kostenlose Testversion, um ihre vollständige Funktionalität in der kommerziellen Entwicklung zu testen.

Chaknith Bin

Jetzt mit dem Ingenieurteam chatten

Software-Ingenieur

Chaknith arbeitet an IronXL und IronBarcode. Er hat tiefgehende Expertise in C# und .NET und hilft, die Software zu verbessern und Kunden zu unterstützen. Seine Erkenntnisse aus Benutzerinteraktionen tragen zu besseren Produkten, Dokumentation und einem insgesamt besseren Erlebnis bei.

< PREVIOUS
Wie man in Python Text aus PDF-Dateien extrahiert

NÄCHSTES >
Konvertieren von PDF in Text in Python (Tutorial)