JAVA向けIRONPDFの使用

JavaでPDFから画像を抽出する方法

リーガン・パン
リーガン・パン
2023年3月11日
更新済み 2024年9月1日
共有:

この記事では、Javaプログラミング言語を使用して、既存のPDFドキュメントから画像を抽出し、それらを単一のフォルダに保存する方法について説明します。 この目的のために、IronPDF for Java ライブラリが画像を抽出するために使用されます。

IronPDF Java PDFライブラリ

IronPDFは、Javaアプリケーション内で開発者がPDFファイルを生成、変更、データを抽出するのを支援するために設計されたJavaライブラリです。 IronPDFを使用すると、HTMLや画像など、さまざまなソースからPDFドキュメントを作成できます。 さらに、既存のPDFを結合分割、および操作することができます。 IronPDFには、パスワード保護デジタル署名などのセキュリティ機能も含まれています。

Iron Softwareによって開発および維持されているIronPDFは、PDF、HTML、およびURLからテキストを抽出する能力で知られています。 これは、PDFをゼロから作成する場合でも既存のPDFを操作する場合でも、さまざまなアプリケーションに対応できる多用途で強力なツールにします。

前提条件

PDFファイルからデータを抽出するためにIronPDFを使用する前に、いくつかの前提条件を満たす必要があります。

  1. Javaのインストール: システムにJavaがインストールされており、そのパスが環境変数に設定されていることを確認してください。 まだJavaをインストールしていない場合は、Javaウェブサイトのダウンロードページの指示に従ってください。

  2. Java IDE: Java IDE として Eclipse または IntelliJ をインストールしてください。Eclipse はこのリンクから、IntelliJ はこのダウンロードページからダウンロードできます。

  3. IronPDFライブラリ: IronPDFライブラリをダウンロードして、依存関係としてプロジェクトに追加してください。 セットアップ手順については、IronPDF のウェブサイトをご覧ください。

  4. Mavenインストール: PDF変換プロセスを開始する前に、Mavenがインストールされており、IDEに統合されていることを確認してください。 Mavenのインストールと統合のサポートについては、以下のJetBrainsのガイドに従ってください。

IronPDF for Java インストール

IronPDF for Java のインストールは、すべての要件が満たされていれば簡単です。 このガイドでは、JetBrains IntelliJ IDEAを使用してインストールを実行し、サンプルコードを幾つか実行します。

以下のことを行ってください:

IntelliJ IDEAを起動する: システムでJetBrains IntelliJ IDEAを開きます。

Mavenプロジェクトを作成する: IntelliJ IDEAで新しいMavenプロジェクトを作成します。 これはIronPDF for Javaのインストールに適した環境を提供します。

JavaでPDFから画像を抽出する方法、図1: 新しいMavenプロジェクトを作成

新しいMavenプロジェクトを作成

新しいウィンドウが表示されます。 プロジェクト名を入力し、「完了」をクリックしてください。

JavaでPDFから画像を抽出する方法、図2:プロジェクト名を入力する

プロジェクト名を入力してください

完了をクリックすると、新しいプロジェクトが開き、pom.xmlファイルにIronPDF for JavaのMaven依存関係が追加されます。

次に、pom.xmlファイルに以下の依存関係を追加するか、次のMavenリポジトリからJARファイルをダウンロードできます。

<dependency>
   <groupId>com.ironsoftware</groupId>
   <artifactId>com.ironsoftware</artifactId>
   <version>2025.3.6</version>
</dependency>

依存関係をpom.xmlファイルに配置すると、ファイルの右上隅に小さなアイコンが表示されます。

PDFから画像を抽出する方法(Java)、図3: 依存関係をインストールするための小さなアイコンが付いたpom.xmlファイル

依存関係をインストールするための小さなアイコン付きのpom.xmlファイル

このアイコンをクリックして、IronPDF for JavaのMaven依存関係をインストールしてください。 これは、インターネット接続状況によって数分で完了します。

画像を抽出

IronPDFを使用すると、[extractAllImages](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllImages()という単一メソッドでPDFドキュメントから画像を抽出できます。 このメソッドは、PDFファイル内で利用可能なすべての画像を返します。その後、抽出されたすべての画像を、ImageIO.writeメソッドを使用して、出力画像のパスと形式を指定することで、任意のファイルパスに保存できます。

5.1. PDFドキュメントから画像を抽出

次の例では、PDFドキュメントから画像が抽出され、ファイルシステムにPNG画像として保存されます。

import com.ironsoftware.ironpdf.PdfDocument;

import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class main {
    public static void main(String[] args) throws Exception {
        PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));

        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
JAVA

上記のプログラムは「Final Project Report Craft Arena.pdf」ファイルを開き、extractAllImages メソッドを使用して、ファイル内のすべての画像を BufferedImage オブジェクトのリストに抽出します。 それから、各新しいファイルイメージをユニークな名前で別々のPNGファイルに保存します。

JavaでPDFから画像を抽出する方法、図4: PDF出力からの画像抽出

PDF出力からの画像抽出

URLから画像を抽出する

このセクションでは、URLから直接画像を抽出する方法について説明します。 以下のコードでは、URLがPDFページに変換され、その後ナビゲーションを切り替えてPDFから画像を抽出します。

import com.ironsoftware.ironpdf.PdfDocument;

import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class main {
    public static void main(String[] args) throws IOException {
        PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");

        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
JAVA

上記のコードでは、AmazonのホームページURLが入力として提供されており、74枚の画像を返します。

PDFから画像を抽出する方法(Java編)、図5: PDFからの画像抽出結果

PDF出力からの画像抽出

結論

PDFドキュメントから画像を抽出するには、IronPDFライブラリを使用してJavaで行うことができます。 IronPDFをインストールするには、Java、Java IDE(EclipseまたはIntelliJ)、Maven、およびお使いのプロジェクトに統合されたIronPDFライブラリをインストールする必要があります。 IronPDFを使用してPDFドキュメントから画像を抽出するプロセスは簡単で、extractAllImagesメソッドを1回呼び出すだけで済みます。 その後、ImageIO.write メソッドを使用して、任意のファイルパスに画像を保存できます。

この記事では、JavaとIronPDFライブラリを使用してPDFドキュメントから画像を抽出する方法をステップバイステップで説明します。 PDFからテキストを抽出する方法に関する情報を含む詳細は、テキスト抽出コードの例でご確認いただけます。

IronPDFは、商用ライセンスがあり、$749から始まるライブラリです。 ただし、無料トライアルで本番環境で評価できます。

リーガン・パン
ソフトウェアエンジニア
レーガンはリーディング大学で電子工学の学士号を取得しました。Iron Softwareに入社する前の仕事では、一つのタスクに集中して取り組んでいました。Iron Softwareでは、営業、技術サポート、製品開発、マーケティングのいずれにおいても広範な業務に携わることが最も楽しいと感じています。彼は、Iron Softwareライブラリを開発者がどのように使用しているかを理解し、その知識を使ってドキュメントを継続的に改善し、製品を開発することを楽しんでいます。
< 以前
JavaでPDFを生成する方法
次へ >
JavaでPDFからデータを抽出する方法

Mavenでインストール

バージョン:2025.3.6

<dependency>
  <groupId>com.ironsoftware</groupId>
  <artifactId>ironpdf</artifactId>
  <version>2025.3.6</version>
</dependency>