JAVA向けIRONPDFの使用

JavaでPDFから画像を抽出する方法

更新済み 3月 11, 2023
共有:

1. 序論

PDFファイルから画像を抽出する方法をお探しですか? PDFから画像を抽出することは、画像の保存、印刷、出版など、あらゆる業界で多くの用途があります。 PDF形式は、ドキュメントを保存および共有するために広く使用されており、さらに利用するために抽出する必要のある画像を含んでいる場合があります。

この記事では、Javaプログラミング言語を使用して、既存のPDFドキュメントから画像を抽出し、それらを単一のフォルダに保存する方法を学びます。 この目的のために、画像を抽出するためにIronPDF for Javaライブラリを使用します。

2. IronPDF Java PDFライブラリ

IronPDFは、Javaアプリケーション内でPDFファイルを生成、修正、およびデータを抽出するために開発者を支援するために設計されたJavaライブラリです。 IronPDF を使用すると、HTML、ASPX、画像などのさまざまなソースからPDFドキュメントを作成できます。 さらに、既存のPDFを結合、分割、操作する機能があります。 IronPDFには、パスワード保護やデジタル署名などのセキュリティ機能も含まれています。

IronSoftwareによって開発および維持されているIronPDFは、PDF、HTML、およびURLからテキストを抽出する機能で知られています。 これは、PDFをゼロから作成する場合でも既存のPDFを操作する場合でも、さまざまなアプリケーションに対応できる多用途で強力なツールにします。

3. 前提条件

PDFファイルからデータを抽出するためにIronPDFを使用する前に、いくつかの前提条件を満たす必要があります。

  1. Java のインストール: Java がシステムにインストールされていることを確認し、そのパスが環境変数に設定されていることを確認してください。 Javaをまだインストールしていない場合は、以下の手順に従ってください リンク.

  2. Java IDE: Java IDEとしてEclipseまたはIntelliJをインストールしてください。Eclipseは次のリンクからダウンロードできます: リンク からこのIntelliJ リンク.

  3. IronPDF ライブラリ: IronPDF ライブラリをダウンロードし、依存関係としてプロジェクトに追加してください。 セットアップ手順については、次のリンクをご覧ください: IronPDFのウェブサイト.

  4. Mavenのインストール: PDF変換プロセスを開始する前に、MavenがインストールされてIDEと統合されていることを確認してください。 以下のチュートリアルに従ってください リンク Mavenのインストールおよび統合に関する支援。

4. IronPDF for Java のインストール

IronPDF for Java のインストールは、すべての要件が満たされていれば簡単です。 このガイドでは、JetBrains IntelliJ IDEAを使用してインストールの手順を示し、いくつかのサンプルコードを実行します。

以下のことを行ってください:

IntelliJ IDEAを起動する: システムでJetBrains IntelliJ IDEAを開きます。

Mavenプロジェクトを作成する: IntelliJ IDEAで新しいMavenプロジェクトを作成します。 これはIronPDF for Javaのインストールに適した環境を提供します。

JavaでPDFから画像を抽出する方法 - 図1

新しいIntelliJ Mavenプロジェクトを作成

新しいウィンドウが表示されます。 プロジェクト名を入力し、「完了」をクリックしてください。

JavaでPDFから画像を抽出する方法 - 図2

新しい Maven プロジェクトに適した名前を選択し、「次へ」を押して続行します。

完了をクリックすると、新しいプロジェクトが開き、pom.xmlが表示されます。 これを使用して、IronPDF for JavaのMaven依存関係を追加します。

次に、以下の依存関係をpom.xmlファイルに追加するか、以下からJARファイルをダウンロードすることができます。 リンク.

<dependency>
   <groupId>com.ironsoftware</groupId>
   <artifactId>com.ironsoftware</artifactId>
   <version>2024.9.1</version>
</dependency>

依存関係をpom.xmlファイルに配置すると、ファイルの右上隅に小さなアイコンが表示されます。

JavaでPDFから画像を抽出する方法 - 図3

Mavenプロジェクトのクラスパスに定義されたすべての依存関係をインストールするには、浮動するMavenアイコンをクリックしてください。

このアイコンをクリックして、IronPDF for JavaのMaven依存関係をインストールしてください。 これは、インターネット接続状況によって数分で完了します。

画像を抽出

IronPDFを使用して、extractAllImagesという1つのメソッドでPDFドキュメントから画像を抽出することができます。 このメソッドは、PDFファイル内にあるすべての画像を返します。その後、取得した画像をすべて、ImageIO.writeメソッドを使用して、出力画像のパスと形式を指定し、希望のファイルパスに保存することができます。

5.1. PDFドキュメントから画像を抽出

以下の例では、PDFドキュメントから画像を取得し、それをPNG画像としてファイルシステムに保存します。

import com.ironsoftware.ironpdf.License;
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class main {
    public static void main(String [] args) throws Exception {
        PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));

        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
JAVA

上記のプログラムは "Final Project Report Craft Arena.pdf" ファイルを開き、extractAllImages を使用します。() ファイル内のすべての画像をBufferedImageオブジェクトのリストに抽出する方法。 それから、各新しいファイルイメージをユニークな名前で別々のPNGファイルに保存します。

PDFから画像を抽出する方法 (Java) - 図4: PDF出力からの画像抽出

「Final Project Report Craft Arena.pdf」ファイルから抽出された画像

5.2. URLから画像を抽出

このセクションでは、URLから直接画像を抽出する方法について説明します。 以下のコードでは、まずURLをPDFページに変換し、次にナビゲーションを切り替えてPDFから画像を抽出します。

import com.ironsoftware.ironpdf.License;
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class main {
    public static void main(String [] args) throws IOException {
        PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");

        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
JAVA

以下のコードでは、入力としてAmazonのホームページURLを提供し、74枚の画像が返されます。

JavaでPDFから画像を抽出する方法 - 図5: PDF出力からの画像抽出

Amazon.comウェブページから抽出された画像。

結論

PDFドキュメントから画像を抽出するには、IronPDFライブラリを使用してJavaで行うことができます。 IronPDFをインストールするには、Java、Java IDEが必要です。 (エクリプスまたはIntelliJ), Maven、およびIronPDFライブラリがインストールされ、プロジェクトに統合されています。 IronPDFを使用してPDFドキュメントから画像を抽出するプロセスは簡単で、extractAllImagesメソッドの呼び出しだけが必要です。 その後、ImageIO.writeメソッドを使用して、任意のファイルパスに画像を保存することができます。

この記事では、についての段階的なガイドを提供します 画像を抽出する方法 JavaおよびIronPDFライブラリを使用して、PDFドキュメントから。 以下の詳細情報、PDFからテキストを抽出する方法については、 テキスト抽出のコード例.

IronPDFは、ライブラリで 商用ライセンス以下の通り翻訳します:

$749から開始します。 ただし、こちらを本番環境で評価することができます 無料トライアル.

< 以前
JavaでPDFを生成する方法
次へ >
JavaでPDFからデータを抽出する方法

Mavenでインストール

バージョン: 2024.9.1

<dependency>
  <groupId>com.ironsoftware</groupId>
  <artifactId>ironpdf</artifactId>
  <version>2024.9.1</version>
</dependency>

準備はできましたか? バージョン: 2024.9 新発売

無料のMavenダウンロード View Licenses >