VERWENDUNG VON IRONPDF FOR PYTHON

Wie man PDF-Dateien in Python anzeigt

Veröffentlicht 2. Juli 2023
Teilen Sie:

PDF (Portable Document Format)

PDF ist ein beliebtes Dateiformat für die gemeinsame Nutzung von Dokumenten. Es handelt sich um ein vielseitiges Format für Dokumenteninformationen, die auf einer Vielzahl von Geräten angezeigt werden können, und es kann auch mit Sicherheitsberechtigungen geschützt werden.

In Python gibt es eine Reihe von Bibliotheken, die zum Lesen und Verarbeiten von PDF-Dokumenten verwendet werden können. Eine dieser Bibliotheken ist IronPDF. IronPDF ist eine leistungsfähige Bibliothek, die eine breite Palette von Funktionen für die Arbeit mit PDF-Dokumenten bietet.

In diesem Artikel lernen wir, wie man PDF-Dateien in Python mit Hilfe der IronPDF-Bibliothek anzeigt.

IronPDF - Python-Bibliothek

IronPDF ist eine leistungsstarke Python-Bibliothek, die es Entwicklern ermöglicht, programmatisch mit PDF-Dateien zu arbeiten. Mit IronPDF können Sie auf einfache Weise Daten aus PDF-Dokumenten generieren, bearbeiten und extrahieren, was es zu einem vielseitigen Werkzeug für verschiedene PDF-bezogene Aufgaben macht. Ganz gleich, ob Sie PDFs von Grund auf neu erstellen, vorhandene PDFs ändern oder Inhalte aus PDFs extrahieren müssen, IronPDF bietet eine umfassende Reihe von Funktionen, die Ihren Arbeitsablauf vereinfachen.

Einige Funktionen der IronPDF for Python-Bibliothek sind:

  • Neue PDF-Datei von Grund auf mit HTML oder URL erstellen
  • Vorhandene PDF-Dateien bearbeiten
  • Drehen von PDF-Seiten
  • Extrahieren von Text, Metadaten und Bildern aus PDF-Dateien
  • PDF-Dateien in andere Formate konvertieren
  • Sichere PDF-Dateien mit Kennwörtern und Einschränkungen
  • PDFs teilen und zusammenführen

    Hinweis: IronPDF erzeugt eine mit Wasserzeichen versehene PDF-Datendatei. Um das Wasserzeichen zu entfernen, müssen Sie IronPDF lizenzieren. Wenn Sie eine lizenzierte Version von IronPDF verwenden möchten, besuchen Sie die IronPDF-Website zu einen Lizenzschlüssel erhalten.

Voraussetzungen

Bevor wir mit IronPDF in Python arbeiten, sollten wir einige Voraussetzungen schaffen:

  1. Python-Installation: Stellen Sie sicher, dass Sie Python auf Ihrem System installiert haben. IronPDF ist kompatibel mit Python 3.x Versionen, also stellen Sie sicher, dass Sie eine kompatible Python Installation haben.

  2. IronPDF-Bibliothek: Installieren Sie die IronPDF-Bibliothek, um auf ihre Funktionen zuzugreifen. Sie können es mit dem Python-Paketmanager installieren (*pip) indem Sie den folgenden Befehl in Ihrer Befehlszeilenschnittstelle ausführen:
    :InstallCmd pip install ironpdf
  1. Tkinter-Bibliothek: Tkinter ist das Standard-GUI-Toolkit für Python. Es wird für die Erstellung der grafischen Benutzeroberfläche für den PDF-Viewer im bereitgestellten Codeschnipsel verwendet. Tkinter wird normalerweise mit Python vorinstalliert, aber wenn Sie auf Probleme stoßen, können Sie es über den Paketmanager installieren:
    :InstallCmd pip install tkinter
  1. Pillow-Bibliothek: Die Pillow-Bibliothek ist eine Abspaltung der Python Imaging Library (PIL) und bietet zusätzliche Bildverarbeitungsfunktionen. Sie wird in dem Codeschnipsel zum Laden und Anzeigen der aus der PDF-Datei extrahierten Bilder verwendet. Installieren Sie Pillow mit dem Paketmanager:
    :InstallCmd pip install pillow
  1. Integrierte Entwicklungsumgebung (IDE): Die Verwendung einer IDE zur Bearbeitung von Python-Projekten kann Ihre Entwicklungserfahrung erheblich verbessern. Es bietet Funktionen wie Code-Vervollständigung, Debugging und einen effizienteren Arbeitsablauf. Eine beliebte IDE für die Python-Entwicklung ist PyCharm. Sie können PyCharm von der JetBrains-Website herunterladen und installieren (https://www.jetbrains.com/pycharm/).

  2. Texteditor: Wenn Sie es vorziehen, mit einem leichtgewichtigen Texteditor zu arbeiten, können Sie auch einen beliebigen Texteditor Ihrer Wahl verwenden, z. B. Visual Studio Code, Sublime Text oder Atom. Diese Editoren bieten Syntaxhervorhebung und andere nützliche Funktionen für die Python-Entwicklung. Für die Erstellung von Python-Skripten können Sie auch die pythoneigene IDLE-App verwenden.

Erstellung eines PDF-Viewer-Projekts mit PyCharm

Nachdem Sie die PyCharm IDE installiert haben, erstellen Sie ein PyCharm-Python-Projekt, indem Sie die folgenden Schritte ausführen:

  1. Starten Sie PyCharm: Öffnen Sie PyCharm über den Anwendungsstarter Ihres Systems oder eine Desktop-Verknüpfung.

  2. Ein neues Projekt erstellen: Klicken Sie auf "Neues Projekt erstellen" oder öffnen Sie ein bestehendes Python-Projekt.

    PDF in Python in Text umwandeln (Tutorial): Abbildung 1

  3. Projekteinstellungen konfigurieren: Geben Sie einen Namen für Ihr Projekt an und wählen Sie den Ort, an dem das Projektverzeichnis erstellt werden soll. Wählen Sie den Python-Interpreter für Ihr Projekt aus. Klicken Sie dann auf "Erstellen".

    PDF in Python in Text umwandeln (Anleitung): Abbildung 2

  4. Quelldateien erstellen: PyCharm erstellt die Projektstruktur, einschließlich einer Python-Hauptdatei und einem Verzeichnis für zusätzliche Quelldateien. Beginnen Sie mit dem Schreiben des Codes und klicken Sie auf die Schaltfläche Ausführen oder drücken Sie Umschalt+F10, um das Skript auszuführen.

Schritte zum Anzeigen von PDF-Dateien in Python mit IronPDF

Importieren Sie die erforderlichen Bibliotheken

Zu Beginn müssen wir die erforderlichen Bibliotheken importieren. In diesem Fall benötigen wir die Bibliotheken os, shutil, ironpdf, tkinter, und PIL. Die Bibliotheken os und shutil werden für Datei- und Ordneroperationen verwendet, ironpdf ist die Bibliothek für die Arbeit mit PDF-Dateien, tkinter wird für die Erstellung der grafischen Benutzeroberfläche verwendet (GUI)und PIL wird für die Bildbearbeitung verwendet.

import os, shutil, ironpdf
from tkinter import *
from PIL import Image, ImageTk
PYTHON

PDF-Dokument in Bilder umwandeln

Als nächstes definieren wir eine Funktion namens convert_pdf_to_images. Diese Funktion nimmt den Pfad der PDF-Datei als Eingabe. Innerhalb der Funktion verwenden wir die IronPDF-Bibliothek, um das PDF-Dokument aus der Datei zu laden. Anschließend geben wir einen Ordnerpfad zum Speichern der extrahierten Bilddateien an. Die IronPDF-Methode "pdf.RasterizeToImageFiles" wird verwendet, um jede PDF-Seite der PDF-Datei in eine Bilddatei zu konvertieren und im angegebenen Ordner zu speichern. Wir erstellen auch eine Liste, in der die Bildpfade gespeichert werden. Das vollständige Codebeispiel lautet wie folgt:

def convert_pdf_to_images(pdf_file):
    pdf = ironpdf.PdfDocument.FromFile(pdf_file)
    # Extract all pages to a folder as image files
    folder_path = "images"
    pdf.RasterizeToImageFiles(os.path.join(folder_path, "*.png"))
    # List to store the image paths
    image_paths = []
    # Get the list of image files in the folder
    for filename in os.listdir(folder_path):
        if filename.lower().endswith((".png", ".jpg", ".jpeg", ".gif")):
            image_paths.append(os.path.join(folder_path, filename))
    return image_paths
PYTHON

Um Text aus PDF-Dokumenten zu extrahieren, besuchen Sie diese Seite mit Codebeispielen link.

Handgriff Fensterverschluss

Um die extrahierten Bilddateien zu bereinigen, wenn das Anwendungsfenster geschlossen wird, definieren wir eine(n) funktion "on_closing". Innerhalb dieser Funktion verwenden wir die Funktion shutil.rmtree()methode, um den gesamten Ordnerimages` zu löschen. Wir legen diese Funktion auch als das Protokoll fest, das beim Schließen des Fensters ausgeführt wird. Der folgende Code hilft bei der Erfüllung dieser Aufgabe:

def on_closing():
    # Delete the images in the 'images' folder
    shutil.rmtree("images")
    window.destroy()

window.protocol("WM_DELETE_WINDOW", on_closing)
PYTHON

Erstellen Sie das GUI-Fenster

Jetzt erstellen wir das Haupt-GUI-Fenster mit dem Tk() Konstrukteur. Wir setzen den Fenstertitel auf "Image Viewer" und setzen die Option `on_closing()funktion als Protokoll für das Schließen von Fenstern.

window = Tk()
window.title("Image Viewer")
window.protocol("WM_DELETE_WINDOW", on_closing)
PYTHON

Erstellen einer rollbaren Leinwand

Um die Bilder anzuzeigen und das Scrollen zu ermöglichen, erstellen wir ein Canvas-Widget. Das Canvas-Widget ist so konfiguriert, dass es den verfügbaren Platz ausfüllt und sich in beide Richtungen ausdehnt, indem es pack(side=LEFT, fill=BOTH, expand=True). Wir erstellen auch ein "Scrollbar"-Widget und konfigurieren es so, dass es das vertikale Scrollen aller Seiten und der Leinwand steuert.

canvas = Canvas(window)
canvas.pack(side=LEFT, fill=BOTH, expand=True)
scrollbar = Scrollbar(window, command=canvas.yview)
scrollbar.pack(side=RIGHT, fill=Y)
canvas.configure(yscrollcommand=scrollbar.set)
canvas.bind("<Configure>", lambda e:canvas.configure(scrollregion=canvas.bbox("all")))
canvas.bind_all("<MouseWheel>", lambda e: canvas.yview_scroll(int(-1*(e.delta/120)), "units"))
PYTHON

Einen Rahmen für Bilder erstellen

Als nächstes erstellen wir ein "Frame"-Widget innerhalb der Leinwand, um die Bilder aufzunehmen. Wir verwenden create_window(), um den Rahmen auf der Leinwand zu platzieren. Die (0, 0)die Koordinaten und der Parameteranchor='nw'` sorgen dafür, dass der Rahmen in der oberen linken Ecke der Leinwand beginnt.

frame = Frame(canvas)
canvas.create_window((0, 0), window=frame, anchor="nw")
PYTHON

PDF-Datei in Bilder umwandeln und anzeigen

Wir nennen die Funktion convert_pdf_to_images()funktion mit dem Dateipfadnamen der PDF-Eingabedatei. Diese Funktion extrahiert die PDF-Seiten als Bilder und gibt eine Liste von Bildpfaden zurück. Wir gehen die Bildpfade durch und laden jedes Bild mit dem BefehlImage.open()Methode aus der PIL-Bibliothek. Dann erstellen wir einPhotoImageObjekt mitImageTk.PhotoImage()und erstellen Sie ein "Label"-Widget zur Anzeige des Bildes.

images = convert_pdf_to_images("input.pdf")
# Load and display the images in the Frame
for image_path in images:
    image = Image.open(image_path)
    photo = ImageTk.PhotoImage(image)
    label = Label(frame, image=photo)
    label.image = photo  # Store a reference to prevent garbage collection
    label.pack(pady=10)
PYTHON

Eingabe-Datei

Konvertierung von PDF in Text in Python (Tutorial): Abbildung 3

Starten Sie die GUI-Hauptschleife

Zum Schluss führen wir die Hauptereignisschleife mit window.mainloop(). Dadurch wird sichergestellt, dass das GUI-Fenster geöffnet und reaktionsfähig bleibt, bis es vom Benutzer geschlossen wird.

window.mainloop()
PYTHON

Ausgabe

Konvertierung von PDF in Text in Python (Tutorial): Abbildung 4

Schlussfolgerung

In diesem Tutorium haben wir gelernt, wie man PDF-Dokumente in Python mit dem IronPDF bibliothek. Wir haben die Schritte behandelt, die erforderlich sind, um eine PDF-Datei zu öffnen und in eine Reihe von Bilddateien zu konvertieren, diese dann in einer scrollbaren Leinwand anzuzeigen und die extrahierten Bilder zu bereinigen, wenn die Anwendung geschlossen wird.

Weitere Einzelheiten über die IronPDF for Python-Bibliothek finden Sie in der dokumentation.

Herunterladen und installieren IronPDF for Python bibliothek und erhalten außerdem eine kostenloser Test um seine vollständige Funktionalität in der kommerziellen Entwicklung zu testen.

< PREVIOUS
Wie man in Python Text aus PDF-Dateien extrahiert
NÄCHSTES >
Konvertieren von PDF in Text in Python (Tutorial)

Sind Sie bereit, loszulegen? Version: 2024.9 gerade veröffentlicht

pip install gratuit Lizenzen anzeigen >