from ironpdf import *
# Instantiate Renderer
renderer = ChromePdfRenderer()
# Create a PDF from a HTML string using Python
pdf = renderer.RenderHtmlAsPdf("<h1>Hello World</h1>")
# Export to a file or Stream
pdf.SaveAs("output.pdf")
# Advanced Example with HTML Assets
# Load external html assets: Images, CSS and JavaScript.
# An optional BasePath 'C:\site\assets\' is set as the file location to load assets from
myAdvancedPdf = renderer.RenderHtmlAsPdf("<img src='icons/iron.png'>", r"C:\site\assets")
myAdvancedPdf.SaveAs("html-with-assets.pdf")
In diesem Artikel wird erläutert, wie PDF-Dateien in Python mit der IronPDF-Bibliothek angezeigt werden können.
IronPDF - Python-Bibliothek
IronPDF ist eine leistungsstarke Python-Bibliothek, die Entwicklern ermöglicht, programmgesteuert mit PDF-Dateien zu arbeiten. Mit IronPDF können Sie auf einfache Weise Daten aus PDF-Dokumenten generieren, bearbeiten und extrahieren, was es zu einem vielseitigen Werkzeug für verschiedene PDF-bezogene Aufgaben macht. Ganz gleich, ob Sie PDFs von Grund auf neu erstellen, vorhandene PDFs ändern oder Inhalte aus PDFs extrahieren müssen, IronPDF bietet eine umfassende Reihe von Funktionen, die Ihren Arbeitsablauf vereinfachen.
Einige Merkmale der IronPDF for Python-Bibliothek sind:
Hinweis: IronPDF erstellt eine mit Wasserzeichen versehene PDF-Datei. Um das Wasserzeichen zu entfernen, müssen Sie IronPDF lizenzieren. Wenn Sie eine lizenzierte Version von IronPDF verwenden möchten, besuchen Sie die IronPDF-Website, um einen Lizenzschlüssel zu erhalten.
Voraussetzungen
Bevor Sie mit IronPDF in Python arbeiten können, müssen Sie einige Voraussetzungen erfüllen:
Python-Installation: Stellen Sie sicher, dass Python auf Ihrem System installiert ist. IronPDF ist kompatibel mit Python 3.x Versionen, also stellen Sie sicher, dass Sie eine kompatible Python Installation haben.
IronPDF Library: Installieren Sie die IronPDF-Bibliothek, um auf deren Funktionen zuzugreifen. Sie können es mit dem Python-Paketmanager (pip) installieren, indem Sie den folgenden Befehl in Ihrer Befehlszeilenschnittstelle ausführen:
:InstallCmd pip install ironpdf
:InstallCmd pip install ironpdf
SHELL
Tkinter-Bibliothek: Tkinter ist das Standard-GUI-Toolkit für Python. Es wird für die Erstellung der grafischen Benutzeroberfläche für den PDF-Viewer im bereitgestellten Codeschnipsel verwendet. Tkinter wird normalerweise mit Python vorinstalliert, aber wenn Sie auf Probleme stoßen, können Sie es über den Paketmanager installieren:
:InstallCmd pip install tkinter
:InstallCmd pip install tkinter
SHELL
Pillow-Bibliothek: Die Pillow-Bibliothek ist ein Fork der Python Imaging Library (PIL) und bietet zusätzliche Bildverarbeitungsfunktionen. Sie wird in dem Codeschnipsel zum Laden und Anzeigen der aus der PDF-Datei extrahierten Bilder verwendet. Installieren Sie Pillow mit dem Paketmanager:
:InstallCmd pip install pillow
:InstallCmd pip install pillow
SHELL
Integrierte Entwicklungsumgebung (IDE): Die Verwendung einer IDE zur Verwaltung von Python-Projekten kann Ihre Entwicklungserfahrung erheblich verbessern. Es bietet Funktionen wie Code-Vervollständigung, Debugging und einen effizienteren Arbeitsablauf. Eine beliebte IDE für die Python-Entwicklung ist PyCharm. Sie können PyCharm von der JetBrains-Website herunterladen und installieren (https://www.jetbrains.com/pycharm/).
Texteditor: Alternativ, wenn Sie lieber mit einem leichten Texteditor arbeiten, können Sie jeden beliebigen Texteditor Ihrer Wahl verwenden, wie zum Beispiel Visual Studio Code, Sublime Text oder Atom. Diese Editoren bieten Syntaxhervorhebung und andere nützliche Funktionen für die Python-Entwicklung. Sie können auch die Python-eigene IDE-App für die Erstellung von Python-Skripten verwenden.
Erstellung eines PDF-Viewer-Projekts mit PyCharm
Nachdem Sie die PyCharm IDE installiert haben, erstellen Sie ein PyCharm Python-Projekt, indem Sie die folgenden Schritte ausführen:
Starten Sie PyCharm: Öffnen Sie PyCharm über den Anwendungsstarter Ihres Systems oder die Desktop-Verknüpfung.
Neues Projekt erstellen: Klicken Sie auf "Neues Projekt erstellen" oder öffnen Sie ein bestehendes Python-Projekt.
PyCharm-IDE
Projekteinstellungen konfigurieren: Geben Sie einen Namen für Ihr Projekt an und wählen Sie den Speicherort für das Erstellen des Projektverzeichnisses aus. Wählen Sie den Python-Interpreter für Ihr Projekt aus. Klicken Sie dann auf "Erstellen".
Erstellen Sie ein neues Python-Projekt
Quelldateien erstellen: PyCharm wird die Projektstruktur erstellen, einschließlich einer Haupt-Python-Datei und einem Verzeichnis für zusätzliche Quelldateien. Beginnen Sie mit dem Schreiben des Codes und klicken Sie auf die Schaltfläche Ausführen oder drücken Sie Umschalt+F10, um das Skript auszuführen.
Schritte zum Anzeigen von PDF-Dateien in Python mit IronPDF
Importieren Sie die erforderlichen Bibliotheken
Importieren Sie zunächst die erforderlichen Bibliotheken. In diesem Fall werden die Bibliotheken os, shutil, ironpdf, tkinter und PIL benötigt. Die Bibliotheken os und shutil werden für Datei- und Ordneroperationen verwendet, ironpdf ist die Bibliothek für die Arbeit mit PDF-Dateien, tkinter wird für die Erstellung der grafischen Benutzeroberfläche (GUI) verwendet, und PIL wird für die Bildbearbeitung eingesetzt.
import os
import shutil
import ironpdf
from tkinter import *
from PIL import Image, ImageTk
py
PYTHON
PDF-Dokument in Bilder umwandeln
Als nächstes definieren Sie eine Funktion namens convert_pdf_to_images. Diese Funktion nimmt den Pfad der PDF-Datei als Eingabe. Innerhalb der Funktion wird die IronPDF-Bibliothek verwendet, um das PDF-Dokument aus der Datei zu laden. Anschließend wird ein Ordnerpfad zum Speichern der extrahierten Bilddateien angegeben. Die Methode pdf.RasterizeToImageFiles von IronPDF wird verwendet, um jede PDF-Seite der PDF in eine Bilddatei zu konvertieren und im angegebenen Ordner zu speichern. Und eine Liste wird verwendet, um die Bildpfade zu speichern. Das vollständige Codebeispiel lautet wie folgt:
def convert_pdf_to_images(pdf_file):
pdf = ironpdf.PdfDocument.FromFile(pdf_file)
# Extract all pages to a folder as image files
folder_path = "images"
pdf.RasterizeToImageFiles(os.path.join(folder_path, "*.png"))
# List to store the image paths
image_paths = []
# Get the list of image files in the folder
for filename in os.listdir(folder_path):
if filename.lower().endswith((".png", ".jpg", ".jpeg", ".gif")):
image_paths.append(os.path.join(folder_path, filename))
return image_paths
Um die extrahierten Bilddateien zu bereinigen, wenn das Anwendungsfenster geschlossen wird, definieren Sie eine on_closing-Funktion. In dieser Funktion verwenden Sie die shutil.rmtree()-Methode, um den gesamten images-Ordner zu löschen. Legen Sie dann diese Funktion als das Protokoll fest, das beim Schließen des Fensters ausgeführt werden soll. Der folgende Code hilft bei der Erfüllung dieser Aufgabe:
def on_closing():
# Delete the images in the 'images' folder
shutil.rmtree("images")
window.destroy()
window.protocol("WM_DELETE_WINDOW", on_closing)
py
PYTHON
Erstellen Sie das GUI-Fenster
Nun erstellen wir das Haupt-GUI-Fenster mit dem Tk()-Konstruktor, indem wir den Fenstertitel auf "Image Viewer" setzen und die Funktion on_closing() als Protokoll festlegen, um das Schließen des Fensters zu bearbeiten.
Um die Bilder anzuzeigen und das Scrollen zu ermöglichen, erstellen Sie ein Canvas-Widget. Das Canvas-Widget ist so konfiguriert, dass es den verfügbaren Raum ausfüllt und sich in beide Richtungen mit pack(side=LEFT, fill=BOTH, expand=True) erweitert. Erstellen Sie zusätzlich ein Scrollbar-Widget und konfigurieren Sie es so, dass es das vertikale Scrollen aller Seiten und Leinwände steuert.
Erstellen Sie als nächstes ein Frame-Widget innerhalb der Leinwand, um die Bilder zu halten, indem Sie create_window() verwenden, um den Rahmen innerhalb der Leinwand zu platzieren. Die (0, 0) Koordinaten und der Parameter anchor='nw' gewährleisten, dass der Rahmen in der oberen linken Ecke der Leinwand beginnt.
Der nächste Schritt besteht darin, die Funktion convert_pdf_to_images() mit dem Dateipfadnamen der Eingabe-PDF-Datei aufzurufen. Diese Funktion extrahiert die PDF-Seiten als Bilder und gibt eine Liste von Bildpfaden zurück. Indem Sie die Bildpfade durchlaufen und jedes Bild mit der Image.open()-Methode aus der PIL-Bibliothek laden, wird ein PhotoImage-Objekt mithilfe von ImageTk.PhotoImage() erstellt. Erstellen Sie dann ein Label-Widget, um das Bild anzuzeigen.
images = convert_pdf_to_images("input.pdf")
# Load and display the images in the Frame
for image_path in images:
image = Image.open(image_path)
photo = ImageTk.PhotoImage(image)
label = Label(frame, image=photo)
label.image = photo # Store a reference to prevent garbage collection
label.pack(pady=10)
py
PYTHON
Die Eingabedatei
Starten Sie die GUI-Hauptschleife
Abschließend lassen wir die Hauptereignisschleife mit window.mainloop() laufen. Dadurch wird sichergestellt, dass das GUI-Fenster geöffnet und reaktionsfähig bleibt, bis es vom Benutzer geschlossen wird.
window.mainloop()
py
PYTHON
Die UI-Ausgabe
Schlussfolgerung
In diesem Tutorial wurde untersucht, wie PDF-Dokumente in Python mit der IronPDF-Bibliothek angezeigt werden können. Es wurden die Schritte beschrieben, die erforderlich sind, um eine PDF-Datei zu öffnen und in eine Reihe von Bilddateien zu konvertieren, diese dann in einer scrollbaren Leinwand anzuzeigen und die Bereinigung der extrahierten Bilder beim Schließen der Anwendung zu handhaben.
Weitere Einzelheiten zur IronPDF for Python-Bibliothek finden Sie in der Dokumentation.
Laden Sie die IronPDF for Python-Bibliothek herunter und installieren Sie sie, und erhalten Sie auch eine kostenlose Testversion, um ihre vollständige Funktionalität in der kommerziellen Entwicklung zu testen.
Chaknith arbeitet an IronXL und IronBarcode. Er hat tiefgehende Expertise in C# und .NET und hilft, die Software zu verbessern und Kunden zu unterstützen. Seine Erkenntnisse aus Benutzerinteraktionen tragen zu besseren Produkten, Dokumentation und einem insgesamt besseren Erlebnis bei.
< PREVIOUS Wie man in Python Text aus PDF-Dateien extrahiert
NÄCHSTES > Konvertieren von PDF in Text in Python (Tutorial)