PYTHON用IRONPDFの使用

PythonでPDFファイルを表示する方法

更新済み 7月 2, 2023
共有:

PDF(ポータブル・ドキュメント・フォーマット)

PDFは、ドキュメントを共有するための一般的なファイル形式です。 さまざまなデバイスで閲覧可能な汎用ドキュメント形式であり、セキュリティ権限で保護することもできます。

Pythonでは、PDFドキュメントを読み取り、操作するために使用できるライブラリがいくつかあります。 これらのライブラリの一つがIronPDFです。 IronPDFは、PDF文書を操作するための多彩な機能を提供する強力なライブラリです。

この記事では、IronPDFライブラリを使用してPythonでPDFファイルを表示する方法を学びます。

IronPDF - Python ライブラリ

IronPDF は、開発者がプログラムでPDFファイルを操作できる強力なPythonライブラリです。 IronPDFを使用すると、PDFドキュメントからデータの生成、操作、および抽出を簡単に行うことができ、さまざまなPDF関連の作業に対応する多用途なツールとなります。 PDFを一から作成する必要がある場合、既存のPDFを修正する必要がある場合、またはPDFからコンテンツを抽出する必要がある場合、IronPDFはワークフローを簡素化するための包括的な機能セットを提供します。

IronPDF Pythonライブラリのいくつかの機能には以下が含まれます:

  • HTMLまたはURLを使用してゼロから新しいPDFファイルを作成する
  • 既存のPDFファイルを編集
  • PDFページを回転
  • PDFファイルからテキスト、メタデータ、および画像を抽出する
  • PDFファイルを他の形式に変換
  • パスワードと制限付きでPDFファイルを保護する

  • PDFの分割と結合

    注意: IronPDF は透かしが入ったPDFデータファイルを生成します。透かしを除去するには、IronPDF をライセンスする必要があります。 ライセンス版のIronPDFを使用したい場合は、こちらをご覧ください: IronPDFのウェブサイト 続けます。翻訳するテキストを提供してください。 ライセンスキーを取得する.

前提条件

PythonでIronPDFを使用する前に、いくつかの前提条件を整えておく必要があります。

  1. Pythonインストール: システムにPythonがインストールされていることを確認してください。 IronPDFはPython 3.xバージョンと互換性があるため、互換性のあるPythonインストールがあることを確認してください。

  2. IronPDFライブラリ: IronPDFライブラリをインストールして、その機能にアクセスしてください。 Pythonのパッケージマネージャーを使用してインストールすることができます (pip(ピップ)) 次のコマンドをコマンドラインインターフェースで実行します:
    :InstallCmd pip install ironpdf
  1. Tkinterライブラリ: Tkinterは、Python向けの標準GUIツールキットです。 提供されたコードスニペットでは、PDFビューアのグラフィカルユーザインターフェイスを作成するために使用されます。 一般的にTkinterはPythonにプリインストールされていますが、問題が発生した場合はパッケージマネージャーを使用してインストールすることができます:
    :InstallCmd pip install tkinter
  1. Pillowライブラリ: PillowライブラリはPython Imaging Libraryのフォークです (PIL) および追加の画像処理機能を提供します。 次のコードスニペットでは、PDFから抽出された画像を読み込み、表示するために使用されます。 パッケージマネージャーを使用してPillowをインストールします:
    :InstallCmd pip install pillow
  1. 統合開発環境 (IDE (統合開発環境) (統合開発環境))IDEを使用してPythonプロジェクトを処理することで、開発体験が大幅に向上します。 コード補完、デバッグ、およびよりスムーズなワークフローのような機能を提供します。 Python開発向けの人気のIDEの一つはPyCharmです。 JetBrains のウェブサイトから PyCharm をダウンロードしてインストールすることができます。 ([https://www.jetbrains.com/pycharm/**](https://www.jetbrains.com/pycharm/)).

  2. テキストエディター: また、軽量なテキストエディターを好む場合は、Visual Studio Code、Sublime Text、Atomなど、お好みのテキストエディターを使用できます。 これらのエディターは、Python開発のための構文ハイライトやその他の便利な機能を提供します。 Pythonスクリプトを作成するには、Python独自のIDLEアプリも使用できます。

PyCharm を使用した PDF ビューア プロジェクトの作成

PyCharm IDEをインストールした後、以下の手順に従ってPyCharmのPythonプロジェクトを作成してください。

  1. PyCharm を起動: システムのアプリケーションランチャーまたはデスクトップショートカットから PyCharm を開いてください。

  2. 新しいプロジェクトを作成する: 「Create New Project」をクリックするか、既存のPythonプロジェクトを開きます。

    PythonでPDFをテキストに変換する方法(チュートリアル):図1

  3. プロジェクト設定を構成: プロジェクトに名前を付け、プロジェクトディレクトリを作成する場所を選択します。 プロジェクト用のPythonインタープリターを選択します。 次に、「作成」をクリックします。

    PythonでPDFをテキストに変換する方法(チュートリアル):図2

  4. ソースファイルを作成する: PyCharmはプロジェクト構造を作成します。これにはメインのPythonファイルと追加のソースファイル用ディレクトリが含まれます。 コードを書き始め、「実行」ボタンをクリックするか、Shift+F10を押してスクリプトを実行します。

IronPDFを用いてPythonでPDFファイルを表示する手順

必要なライブラリをインポートする

まず、必要なライブラリをインポートする必要があります。 この場合、osshutilironpdftkinter、および PIL ライブラリが必要です。 osおよびshutilライブラリはファイルおよびフォルダ操作に使用され、ironpdfはPDFファイルを操作するためのライブラリであり、tkinterはグラフィカルユーザーインターフェースを作成するために使用されます。 (GUI (グラフィカルユーザーインターフェース))画像操作にはPILが使用されます。

import os, shutil, ironpdf
from tkinter import *
from PIL import Image, ImageTk
PYTHON

PDFドキュメントを画像に変換

次に、convert_pdf_to_imagesという関数を定義します。 この関数は、PDFファイルのパスを入力として受け取ります。 関数内で、IronPDFライブラリを使用してファイルからPDFドキュメントを読み込みます。その後、抽出した画像ファイルを保存するフォルダーのパスを指定します。 IronPDFのpdf.RasterizeToImageFilesメソッドは、PDFの各ページを画像ファイルに変換し、指定されたフォルダーに保存するために使用されます。 また、画像パスを保存するためのリストを作成します。 以下は完全なコード例です:

def convert_pdf_to_images(pdf_file):
    pdf = ironpdf.PdfDocument.FromFile(pdf_file)
    # Extract all pages to a folder as image files
    folder_path = "images"
    pdf.RasterizeToImageFiles(os.path.join(folder_path, "*.png"))
    # List to store the image paths
    image_paths = []
    # Get the list of image files in the folder
    for filename in os.listdir(folder_path):
        if filename.lower().endswith((".png", ".jpg", ".jpeg", ".gif")):
            image_paths.append(os.path.join(folder_path, filename))
    return image_paths
PYTHON

PDFドキュメントからテキストを抽出するには、このコード例ページを訪問してください リンク.

ウィンドウの閉鎖を処理

アプリケーションウィンドウが閉じられたときに抽出された画像ファイルをクリーンアップするために、以下のように定義します。(n) on_closing 関数。 この関数の内部では、shutil.rmtree を使用しています。()imagesフォルダー全体を削除するメソッド。 ウィンドウが閉じられたときに実行されるプロトコルとして、この関数を設定します。 以下のコードはタスクを達成するのに役立ちます:

def on_closing():
    # Delete the images in the 'images' folder
    shutil.rmtree("images")
    window.destroy()

window.protocol("WM_DELETE_WINDOW", on_closing)
PYTHON

GUIウィンドウを作成

さて、Tkinterモジュールを使用してメインGUIウィンドウを作成します。()コンストラクター (constructor) 「Image Viewer」をウィンドウタイトルに設定し、on_closing を設定します。()` function はウィンドウの閉鎖を処理するプロトコルとして動作します。

window = Tk()
window.title("Image Viewer")
window.protocol("WM_DELETE_WINDOW", on_closing)
PYTHON

スクロール可能なキャンバスを作成

画像を表示し、スクロールを有効にするために、キャンバスウィジェットを作成します。 Canvasウィジェットは、利用可能なスペースを埋め、両方向に拡張するようにpackを使用して設定されています。(サイド=LEFT、フィル=BOTH、エクスパンド=True). また、Scrollbar`ウィジェットを作成し、すべてのページとキャンバスの垂直スクロールを制御するように設定します。

canvas = Canvas(window)
canvas.pack(side=LEFT, fill=BOTH, expand=True)
scrollbar = Scrollbar(window, command=canvas.yview)
scrollbar.pack(side=RIGHT, fill=Y)
canvas.configure(yscrollcommand=scrollbar.set)
canvas.bind("<Configure>", lambda e:canvas.configure(scrollregion=canvas.bbox("all")))
canvas.bind_all("<MouseWheel>", lambda e: canvas.yview_scroll(int(-1*(e.delta/120)), "units"))
PYTHON

画像にフレームを作成する

次に、画像を保持するためにキャンバスの中に Frame ウィジェットを作成します。 create_window関数を使用して、新しいウィンドウを作成します。この関数はパラメータとしてウィンドウのタイトル、幅、高さ、およびその他の設定を受け取ります。以下は具体的な例です。

import tkinter as tk

# 新しいウィンドウを作成
window = tk.Tk()
window.title("サンプルウィンドウ")
window.geometry("800x600")

# アプリケーションのメインループを開始
window.mainloop()
PYTHON

このコードは、Pythonのtkinterモジュールを使用して800x600ピクセルの新しいウィンドウを作成し、そのタイトルを「サンプルウィンドウ」に設定します。次に、tkinterアプリケーションのメインループを開始し、ウィンドウが閉じられるまで実行され続けます。()キャンバス内にフレームを配置するためには、「The」への翻訳は「」です。しかし、文の残り部分をご提供いただけましたら、完全な翻訳を提供いたします。(0, 0)coordinatesanchor='nw'`パラメーターは、フレームがキャンバスの左上隅から開始することを保証します。

frame = Frame(canvas)
canvas.create_window((0, 0), window=frame, anchor="nw")
PYTHON

PDFファイルを画像に変換して表示

convert_pdf_to_images メソッドを呼び出します。()入力PDFファイルのファイルパス名を基に関数を使用します。この関数はPDFページを画像として抽出し、画像パスのリストを返します。 画像パスを繰り返し処理し、各画像をImage.openを使用して読み込みます。()メソッドはPILライブラリから提供されています。 次に、ImageTk.PhotoImageを使用してPhotoImageオブジェクトを作成します。()画像を表示するためにLabel`ウィジェットを作成します。

images = convert_pdf_to_images("input.pdf")
# Load and display the images in the Frame
for image_path in images:
    image = Image.open(image_path)
    photo = ImageTk.PhotoImage(image)
    label = Label(frame, image=photo)
    label.image = photo  # Store a reference to prevent garbage collection
    label.pack(pady=10)
PYTHON

入力ファイル

PythonでPDFをテキストに変換する方法(チュートリアル):図3

GUIメインループを実行する

最後に、window.mainloop を使用してメインイベントループを実行します。()`. これにより、GUIウィンドウがユーザーによって閉じられるまで開いたまま応答し続けることが保証されます。

window.mainloop()
PYTHON

出力

PythonでPDFをテキストに変換する方法(チュートリアル):図4

結論

このチュートリアルでは、Pythonを使用してPDFドキュメントを表示する方法について学びました。 IronPDF ライブラリ。 PDFファイルを開いて一連の画像ファイルに変換し、それらをスクロール可能なキャンバスに表示し、アプリケーションが閉じられたときに抽出された画像をクリーンアップするための手順について説明しました。

IronPDF Pythonライブラリの詳細については、こちらをご参照ください。 ドキュメント.

ダウンロードしてインストール IronPDF Python ライブラリそしてまたゲット a 無料試用 商業開発における完全な機能をテストするために。

< 以前
PythonでPDFからテキストを抽出する方法
次へ >
PythonでPDFをテキストに変換する方法(チュートリアル)

準備はできましたか? バージョン: 2024.9 新発売

無料 pip インストール View Licenses >