IRONPDF FOR PYTHONの使用

PythonでPDFファイルを表示する方法

更新済み 2024年9月21日
共有:

この記事では、PythonでIronPDFライブラリを使ってPDFファイルを表示する方法を探ります。

IronPDF - Python ライブラリ

IronPDFは、開発者がプログラムでPDFファイルを操作できる強力なPythonライブラリです。 IronPDFを使用すると、PDFドキュメントからデータの生成、操作、および抽出を簡単に行うことができ、さまざまなPDF関連の作業に対応する多用途なツールとなります。 PDFを一から作成する必要がある場合、既存のPDFを修正する必要がある場合、またはPDFからコンテンツを抽出する必要がある場合、IronPDFはワークフローを簡素化するための包括的な機能セットを提供します。

IronPDF for Pythonライブラリのいくつかの特徴は以下の通りです:

IronPDFを利用することで、開発者は簡単にPDFファイルを生成、操作、テキスト抽出、暗号化、そして共有することができます。IronPDF for .NETやIronPDF for Pythonなどの異なるバージョンも提供されています。

また、IronOCRを使用すると、開発者は画像やPDFからテキストを抽出することができます。IronOCRは.NET環境で特に強力な機能を発揮します。

さらに、IronXLはExcelファイルを読み書きするための強力なライブラリです。IronXL for .NETを使えば、簡単にスプレッドシートの作成と管理を行うことができます。

IronBarcodeは、バーコードの生成と読み取りを簡単にします。IronQRも同様に、QRコードの生成と読み取りをサポートします。

IronZIPを使うことで、圧縮ファイルの操作を簡単に行うことができ、IronWordはWordドキュメントの生成や編集を効率化します。

IronPrintとIronWebScraperも含め、Iron Suiteの各ソフトウェアツールは開発者の生産性を高めるために設計されています。

Iron Softwareが提供する各ソフトウェアにはLite LicenseからUnlimited Licenseまで複数のライセンスオプションがあり、それぞれのニーズに応じた選択が可能です。](/python/how-to/python-merge-pdf/)PDFファイル

注意: IronPDF は透かしが入ったPDFデータファイルを生成します。透かしを除去するには、IronPDF をライセンスする必要があります。 ライセンス版のIronPDFを使用したい場合は、こちらをご覧ください: IronPDFのウェブサイト続けます。翻訳するテキストを提供してください。ライセンスキーを取得する.

前提条件

PythonでIronPDFを使用する前に、いくつかの前提条件があります:

  1. Pythonインストール: システムにPythonがインストールされていることを確認してください。 IronPDFはPython 3.xバージョンと互換性があるため、互換性のあるPythonインストールがあることを確認してください。

  2. IronPDFライブラリ: IronPDFライブラリをインストールして、その機能にアクセスしてください。 Pythonのパッケージマネージャーを使用してインストールすることができます(pip(ピップ))次のコマンドをコマンドラインインターフェースで実行します:
    :InstallCmd pip install ironpdf
  1. Tkinterライブラリ: Tkinterは、Python向けの標準GUIツールキットです。 提供されたコードスニペットでは、PDFビューアのグラフィカルユーザインターフェイスを作成するために使用されます。 一般的にTkinterはPythonにプリインストールされていますが、問題が発生した場合はパッケージマネージャーを使用してインストールすることができます:
    :InstallCmd pip install tkinter
  1. Pillowライブラリ: PillowライブラリはPython Imaging Libraryのフォークです(PIL)および追加の画像処理機能を提供します。 次のコードスニペットでは、PDFから抽出された画像を読み込み、表示するために使用されます。 パッケージマネージャーを使用してPillowをインストールします:
    :InstallCmd pip install pillow
  1. 統合開発環境(IDE (統合開発環境)(統合開発環境)):Pythonプロジェクトを扱うためにIDEを使うことは、あなたの開発経験を大きく向上させます。 コード補完、デバッグ、およびよりスムーズなワークフローのような機能を提供します。 Python開発向けの人気のIDEの一つはPyCharmです。 JetBrains のウェブサイトから PyCharm をダウンロードしてインストールすることができます。(https://www.jetbrains.com/pycharm/).

  2. テキストエディター: また、軽量なテキストエディターを好む場合は、Visual Studio Code、Sublime Text、Atomなど、お好みのテキストエディターを使用できます。 これらのエディターは、Python開発のための構文ハイライトやその他の便利な機能を提供します。 Pythonスクリプトの作成には、Python独自のIDEアプリを使用することもできます。

PyCharm を使用した PDF ビューア プロジェクトの作成

PyCharm IDEをインストールしたら、以下の手順に従ってPyCharm Pythonプロジェクトを作成します:

  1. PyCharm を起動: システムのアプリケーションランチャーまたはデスクトップショートカットから PyCharm を開いてください。

  2. 新しいプロジェクトを作成する: "新しいプロジェクトを作成 "をクリックするか、既存のPythonプロジェクトを開きます。

    PythonでPDFをテキストに変換する方法(チュートリアル)、図1:PyCharm IDE

    PyCharm IDE

  3. プロジェクト設定を構成: プロジェクトに名前を付け、プロジェクトディレクトリを作成する場所を選択します。 プロジェクト用のPythonインタープリターを選択します。 次に、「作成」をクリックします。

    PythonでPDFをテキストに変換する方法(チュートリアル)、図2:新しいPythonプロジェクトを作成する

    新しいPythonプロジェクトを作成する

  4. ソースファイルを作成する: PyCharmはプロジェクト構造を作成します。これにはメインのPythonファイルと追加のソースファイル用ディレクトリが含まれます。 コードを書き始め、「実行」ボタンをクリックするか、Shift+F10を押してスクリプトを実行します。

IronPDFを用いてPythonでPDFファイルを表示する手順

必要なライブラリをインポートする

はじめに、必要なライブラリをインポートします。 この場合、osshutilironpdftkinterPILライブラリが必要になります。 osおよびshutilライブラリはファイルおよびフォルダ操作に使用され、ironpdfはPDFファイルを操作するためのライブラリであり、tkinterはグラフィカルユーザーインターフェースを作成するために使用されます。(GUI (グラフィカルユーザーインターフェース))画像操作にはPILが使用されます。

import os
import shutil
import ironpdf
from tkinter import *
from PIL import Image, ImageTk
PYTHON

PDFドキュメントを画像に変換

次に、convert_pdf_to_imagesという関数を定義する。 この関数は、PDFファイルのパスを入力として受け取ります。 関数内部では、IronPDFライブラリがファイルからPDFドキュメントをロードするために使用されます。次に、抽出した画像ファイルを保存するフォルダパスを指定します。 IronPDFのpdf.RasterizeToImageFilesメソッドは、PDFの各ページを画像ファイルに変換し、指定されたフォルダーに保存するために使用されます。 また、画像パスの保存にはリストが使用されます。 以下は完全なコード例です:

def convert_pdf_to_images(pdf_file):
    pdf = ironpdf.PdfDocument.FromFile(pdf_file)
    # Extract all pages to a folder as image files
    folder_path = "images"
    pdf.RasterizeToImageFiles(os.path.join(folder_path, "*.png"))
    # List to store the image paths
    image_paths = []
    # Get the list of image files in the folder
    for filename in os.listdir(folder_path):
        if filename.lower().endswith((".png", ".jpg", ".jpeg", ".gif")):
            image_paths.append(os.path.join(folder_path, filename))
    return image_paths
PYTHON

PDF文書からテキストを抽出するには、こちらをご覧ください。コード例ページ.

ウィンドウの閉鎖を処理

アプリケーションのウィンドウが閉じられたときに、抽出された画像ファイルをクリーンアップするために、on_closing関数を定義します。 この関数の内部では、shutil.rmtree()images`フォルダー全体を削除するメソッド。 次に、ウィンドウが閉じられたときに実行されるプロトコルとして、この関数を設定します。 以下のコードはタスクを達成するのに役立ちます:

def on_closing():
    # Delete the images in the 'images' folder
    shutil.rmtree("images")
    window.destroy()

window.protocol("WM_DELETE_WINDOW", on_closing)
PYTHON

GUIウィンドウを作成

では、メインGUIウィンドウをTk()コンストラクタのウィンドウタイトルを "Image Viewer "に設定し、on_closing "を設定する。()` function はウィンドウの閉鎖を処理するプロトコルとして動作します。

window = Tk()
window.title("Image Viewer")
window.protocol("WM_DELETE_WINDOW", on_closing)
PYTHON

スクロール可能なキャンバスを作成

画像を表示してスクロールできるようにするには、Canvasウィジェットを作成します。 Canvasウィジェットは、利用可能なスペースがいっぱいになるように構成され、pack(サイド=LEFT、フィル=BOTH、エクスパンド=True). さらに、Scrollbar`ウィジェットを作成し、すべてのページとキャンバスの垂直スクロールを制御するように設定します。

canvas = Canvas(window)
canvas.pack(side=LEFT, fill=BOTH, expand=True)
scrollbar = Scrollbar(window, command=canvas.yview)
scrollbar.pack(side=RIGHT, fill=Y)
canvas.configure(yscrollcommand=scrollbar.set)
canvas.bind("<Configure>", lambda e: canvas.configure(
    scrollregion=canvas.bbox("all")))
canvas.bind_all("<MouseWheel>", lambda e: canvas.yview_scroll(
    int(-1*(e.delta/120)), "units"))
PYTHON

画像にフレームを作成する

次に、create_window'を使用して、画像を保持するためのFrameウィジェットをキャンバス内に作成します。()キャンバス内にフレームを配置するためには、 「The 」への翻訳は「」です。しかし、文の残り部分をご提供いただけましたら、完全な翻訳を提供いたします。(0, 0)coordinatesanchor='nw'パラメーターは、フレームがキャンバスの左上隅から開始することを保証します。

frame = Frame(canvas)
canvas.create_window((0, 0), window=frame, anchor="nw")
PYTHON

PDFファイルを画像に変換して表示

次のステップは、convert_pdf_to_images' を呼び出すことです。()入力PDFファイルのファイルパス名を基に関数を使用します。この関数はPDFページを画像として抽出し、画像パスのリストを返します。 画像パスを繰り返し、各画像をImage.open()PILライブラリの メソッド、ImageTk.PhotoImageを使ってPhotoImageオブジェクトを作成します。(). 次に、画像を表示するための Label ウィジェットを作成します。

images = convert_pdf_to_images("input.pdf")
# Load and display the images in the Frame
for image_path in images:
    image = Image.open(image_path)
    photo = ImageTk.PhotoImage(image)
    label = Label(frame, image=photo)
    label.image = photo  # Store a reference to prevent garbage collection
    label.pack(pady=10)
PYTHON

PythonでPDFをテキストに変換する方法(チュートリアル)、図3:入力ファイル

**入力ファイル

GUIメインループを実行する

最後に、window.mainloop'を使ってメイン・イベント・ループを実行してみましょう。(). これにより、GUIウィンドウがユーザーによって閉じられるまで開いたまま応答し続けることが保証されます。

window.mainloop()
PYTHON

PythonでPDFをテキストに変換する方法(チュートリアル)、図4:UI出力

UIの出力

結論

このチュートリアルでは、PythonでPDFドキュメントを表示する方法をIronPDFライブラリ。 PDFファイルを開き、それを一連の画像ファイルに変換し、スクロール可能なキャンバスにそれらを表示し、アプリケーションを閉じたときに抽出された画像のクリーンアップを処理するために必要な手順をカバーしました。

IronPDF for Pythonライブラリの詳細についてはドキュメント.

ダウンロードしてインストールIronPDF for Pythonライブラリそしてまたゲット a無料試用商業開発における完全な機能をテストするために。

< 以前
PythonでPDFからテキストを抽出する方法
次へ >
PythonでPDFをテキストに変換する方法(チュートリアル)

準備はできましたか? バージョン: 2024.11.1 新発売

無料 pip インストール ライセンスを表示 >