ライブ環境でテストする
ウォーターマークなしで本番環境でテストしてください。
必要な場所でいつでも動作します。
この記事では、PythonでIronPDFライブラリを使ってPDFファイルを表示する方法を探ります。
IronPDFは、開発者がプログラムでPDFファイルを操作できる強力なPythonライブラリです。 IronPDFを使用すると、PDFドキュメントからデータの生成、操作、および抽出を簡単に行うことができ、さまざまなPDF関連の作業に対応する多用途なツールとなります。 PDFを一から作成する必要がある場合、既存のPDFを修正する必要がある場合、またはPDFからコンテンツを抽出する必要がある場合、IronPDFはワークフローを簡素化するための包括的な機能セットを提供します。
IronPDF for Pythonライブラリのいくつかの特徴は以下の通りです:
PDFファイルを保護するパスワードと制限付きで
IronPDFを利用することで、開発者は簡単にPDFファイルを生成、操作、テキスト抽出、暗号化、そして共有することができます。IronPDF for .NETやIronPDF for Pythonなどの異なるバージョンも提供されています。
また、IronOCRを使用すると、開発者は画像やPDFからテキストを抽出することができます。IronOCRは.NET環境で特に強力な機能を発揮します。
さらに、IronXLはExcelファイルを読み書きするための強力なライブラリです。IronXL for .NETを使えば、簡単にスプレッドシートの作成と管理を行うことができます。
IronBarcodeは、バーコードの生成と読み取りを簡単にします。IronQRも同様に、QRコードの生成と読み取りをサポートします。
IronZIPを使うことで、圧縮ファイルの操作を簡単に行うことができ、IronWordはWordドキュメントの生成や編集を効率化します。
IronPrintとIronWebScraperも含め、Iron Suiteの各ソフトウェアツールは開発者の生産性を高めるために設計されています。
Iron Softwareが提供する各ソフトウェアにはLite LicenseからUnlimited Licenseまで複数のライセンスオプションがあり、それぞれのニーズに応じた選択が可能です。](/python/how-to/python-merge-pdf/)PDFファイル
注意: IronPDF は透かしが入ったPDFデータファイルを生成します。透かしを除去するには、IronPDF をライセンスする必要があります。 ライセンス版のIronPDFを使用したい場合は、こちらをご覧ください: IronPDFのウェブサイト続けます。翻訳するテキストを提供してください。ライセンスキーを取得する.
PythonでIronPDFを使用する前に、いくつかの前提条件があります:
Pythonインストール: システムにPythonがインストールされていることを確認してください。 IronPDFはPython 3.xバージョンと互換性があるため、互換性のあるPythonインストールがあることを確認してください。
:InstallCmd pip install ironpdf
:InstallCmd pip install tkinter
:InstallCmd pip install pillow
統合開発環境(IDE (統合開発環境)(統合開発環境)):Pythonプロジェクトを扱うためにIDEを使うことは、あなたの開発経験を大きく向上させます。 コード補完、デバッグ、およびよりスムーズなワークフローのような機能を提供します。 Python開発向けの人気のIDEの一つはPyCharmです。 JetBrains のウェブサイトから PyCharm をダウンロードしてインストールすることができます。(https://www.jetbrains.com/pycharm/).
PyCharm IDEをインストールしたら、以下の手順に従ってPyCharm Pythonプロジェクトを作成します:
PyCharm を起動: システムのアプリケーションランチャーまたはデスクトップショートカットから PyCharm を開いてください。
新しいプロジェクトを作成する: "新しいプロジェクトを作成 "をクリックするか、既存のPythonプロジェクトを開きます。
PyCharm IDE
プロジェクト設定を構成: プロジェクトに名前を付け、プロジェクトディレクトリを作成する場所を選択します。 プロジェクト用のPythonインタープリターを選択します。 次に、「作成」をクリックします。
新しいPythonプロジェクトを作成する。
はじめに、必要なライブラリをインポートします。 この場合、os
、shutil
、ironpdf
、tkinter
、PIL
ライブラリが必要になります。 os
およびshutil
ライブラリはファイルおよびフォルダ操作に使用され、ironpdf
はPDFファイルを操作するためのライブラリであり、tkinter
はグラフィカルユーザーインターフェースを作成するために使用されます。(GUI (グラフィカルユーザーインターフェース))画像操作にはPILが使用されます。
import os
import shutil
import ironpdf
from tkinter import *
from PIL import Image, ImageTk
次に、convert_pdf_to_images
という関数を定義する。 この関数は、PDFファイルのパスを入力として受け取ります。 関数内部では、IronPDFライブラリがファイルからPDFドキュメントをロードするために使用されます。次に、抽出した画像ファイルを保存するフォルダパスを指定します。 IronPDFのpdf.RasterizeToImageFiles
メソッドは、PDFの各ページを画像ファイルに変換し、指定されたフォルダーに保存するために使用されます。 また、画像パスの保存にはリストが使用されます。 以下は完全なコード例です:
def convert_pdf_to_images(pdf_file):
pdf = ironpdf.PdfDocument.FromFile(pdf_file)
# Extract all pages to a folder as image files
folder_path = "images"
pdf.RasterizeToImageFiles(os.path.join(folder_path, "*.png"))
# List to store the image paths
image_paths = []
# Get the list of image files in the folder
for filename in os.listdir(folder_path):
if filename.lower().endswith((".png", ".jpg", ".jpeg", ".gif")):
image_paths.append(os.path.join(folder_path, filename))
return image_paths
PDF文書からテキストを抽出するには、こちらをご覧ください。コード例ページ.
アプリケーションのウィンドウが閉じられたときに、抽出された画像ファイルをクリーンアップするために、on_closing
関数を定義します。 この関数の内部では、shutil.rmtree()
images`フォルダー全体を削除するメソッド。 次に、ウィンドウが閉じられたときに実行されるプロトコルとして、この関数を設定します。 以下のコードはタスクを達成するのに役立ちます:
def on_closing():
# Delete the images in the 'images' folder
shutil.rmtree("images")
window.destroy()
window.protocol("WM_DELETE_WINDOW", on_closing)
では、メインGUIウィンドウをTk()コンストラクタのウィンドウタイトルを "Image Viewer "に設定し、
on_closing "を設定する。()` function はウィンドウの閉鎖を処理するプロトコルとして動作します。
window = Tk()
window.title("Image Viewer")
window.protocol("WM_DELETE_WINDOW", on_closing)
画像を表示してスクロールできるようにするには、Canvas
ウィジェットを作成します。 Canvasウィジェットは、利用可能なスペースがいっぱいになるように構成され、
pack(サイド=LEFT、フィル=BOTH、エクスパンド=True). さらに、
Scrollbar`ウィジェットを作成し、すべてのページとキャンバスの垂直スクロールを制御するように設定します。
canvas = Canvas(window)
canvas.pack(side=LEFT, fill=BOTH, expand=True)
scrollbar = Scrollbar(window, command=canvas.yview)
scrollbar.pack(side=RIGHT, fill=Y)
canvas.configure(yscrollcommand=scrollbar.set)
canvas.bind("<Configure>", lambda e: canvas.configure(
scrollregion=canvas.bbox("all")))
canvas.bind_all("<MouseWheel>", lambda e: canvas.yview_scroll(
int(-1*(e.delta/120)), "units"))
次に、create_window'を使用して、画像を保持するための
Frameウィジェットをキャンバス内に作成します。()キャンバス内にフレームを配置するためには、
「The 」への翻訳は「
」です。しかし、文の残り部分をご提供いただけましたら、完全な翻訳を提供いたします。(0, 0)coordinates
とanchor='nw'
パラメーターは、フレームがキャンバスの左上隅から開始することを保証します。
frame = Frame(canvas)
canvas.create_window((0, 0), window=frame, anchor="nw")
次のステップは、convert_pdf_to_images' を呼び出すことです。()入力PDFファイルのファイルパス名を基に関数を使用します。この関数はPDFページを画像として抽出し、画像パスのリストを返します。 画像パスを繰り返し、各画像を
Image.open()PILライブラリの メソッド、
ImageTk.PhotoImageを使って
PhotoImageオブジェクトを作成します。()
. 次に、画像を表示するための Label
ウィジェットを作成します。
images = convert_pdf_to_images("input.pdf")
# Load and display the images in the Frame
for image_path in images:
image = Image.open(image_path)
photo = ImageTk.PhotoImage(image)
label = Label(frame, image=photo)
label.image = photo # Store a reference to prevent garbage collection
label.pack(pady=10)
**入力ファイル
最後に、window.mainloop'を使ってメイン・イベント・ループを実行してみましょう。()
. これにより、GUIウィンドウがユーザーによって閉じられるまで開いたまま応答し続けることが保証されます。
window.mainloop()
UIの出力。
このチュートリアルでは、PythonでPDFドキュメントを表示する方法をIronPDFライブラリ。 PDFファイルを開き、それを一連の画像ファイルに変換し、スクロール可能なキャンバスにそれらを表示し、アプリケーションを閉じたときに抽出された画像のクリーンアップを処理するために必要な手順をカバーしました。
IronPDF for Pythonライブラリの詳細についてはドキュメント.
ダウンロードしてインストールIronPDF for Pythonライブラリそしてまたゲット a無料試用商業開発における完全な機能をテストするために。
9つの .NET API製品 オフィス文書用