フッターコンテンツにスキップ
JAVA用IRONPDFの使用

JavaでPDFから画像を抽出する方法

この記事では、既存のPDFドキュメントから画像を抽出し、Javaプログラミング言語を使用して単一のフォルダに保存する方法を探ります。 この目的のために、IronPDF for Javaライブラリを使用して画像を抽出します。

class="hsg-featured-snippet">

JavaでPDFから画像を抽出する方法

  1. PDFから画像を抽出するためにJavaライブラリをインストール
  2. PDFファイルをロードまたはURLからレンダリング
  3. extractAllImagesメソッドを利用して画像を抽出
  4. 抽出した画像をJavaでファイルまたはストリームに保存
  5. 指定されたディレクトリで抽出された画像を確認

IronPDF Java PDFライブラリ

IronPDFは、開発者がJavaアプリケーション内でPDFファイルからデータを生成、修正、および抽出するのを支援するために設計されたJavaライブラリです。 IronPDFを使用すると、HTML、画像など、さまざまなソースからPDFドキュメントを作成できます。 Additionally, you have the ability to merge, split, and manipulate existing PDFs. IronPDF also includes security features, such as password protection and digital signatures.

Iron Softwareによって開発および維持されているIronPDFは、PDF、HTML、URLからテキストを抽出する能力で知られています。 これにより、新たにPDFを作成する場合でも既存のものを扱う場合でも、さまざまなアプリケーションに対して柔軟で強力なツールとなります。

前提条件

PDFファイルからデータを抽出するためにIronPDFを使用する前に、満たすべきいくつかの前提条件があります:

  1. Javaのインストール: システムにJavaがインストールされており、そのパスが環境変数に設定されていることを確認してください。 まだJavaをインストールしていない場合は、Javaのウェブサイトからのダウンロードページの指示に従ってください。
  2. Java IDE: Have either Eclipse or IntelliJ installed as your Java IDE. You can download Eclipse from this link and IntelliJ from this download page.
  3. IronPDFライブラリ: IronPDFライブラリをダウンロードして、プロジェクトに依存関係として追加してください。 セットアップの手順については、IronPDFのウェブサイトをご覧ください。
  4. Mavenのインストール: PDF変換プロセスを開始する前に、MavenがインストールされてIDEと統合されていることを確認してください。 Mavenのインストールと統合に関する指導は、JetBrainsのガイドをご覧ください。

IronPDF for Javaのインストール

IronPDF for Javaのインストールは、すべての要件が満たされている場合、簡単なプロセスです。 このガイドでは、JetBrains IntelliJ IDEAを使用してインストールを示し、いくつかのサンプルコードを実行します。

  1. IntelliJ IDEAの起動: システムでJetBrains IntelliJ IDEAを開きます。

  2. Mavenプロジェクトの作成: IntelliJ IDEAで新しいMavenプロジェクトを作成します。 これにより、IronPDF for Javaのインストールに適した環境が提供されます。

JavaでPDFから画像を抽出する方法、図1: 新しいMavenプロジェクトを作成 新しいMavenプロジェクトを作成

新しいウィンドウが表示されます。 プロジェクトの名前を入力して終了をクリックします。

JavaでPDFから画像を抽出する方法、図2: プロジェクトの名前を入力 プロジェクトの名前を入力

完了をクリックすると、pom.xmlファイルにMaven依存関係を追加するために新しいプロジェクトが開きます。

次に、pom.xmlファイルに以下の依存関係を追加するか、以下のMavenリポジトリからJARファイルをダウンロードできます。

<dependency>
    <groupId>com.ironsoftware</groupId>
    <artifactId>ironpdf</artifactId>
    <version>YOUR_VERSION_HERE</version>
</dependency>
<dependency>
    <groupId>com.ironsoftware</groupId>
    <artifactId>ironpdf</artifactId>
    <version>YOUR_VERSION_HERE</version>
</dependency>
XML

pom.xmlファイルに依存関係を配置すると、ファイルの右上隅に小さなアイコンが表示されます。

JavaでPDFから画像を抽出する方法、図3: 依存関係をインストールするための小さなアイコン付きのpom.xmlファイル 依存関係をインストールするための小さなアイコン付きのpom.xmlファイル

このアイコンをクリックして、IronPDF for JavaのMaven依存関係をインストールします。 インターネット接続によっては数分しかかかりません。

画像の抽出

IronPDFを使用して、[extractAllImages](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllImages()という1つのメソッドを使用して、PDFドキュメントから画像を抽出できます。 このメソッドは、PDFファイル内のすべての画像を返します。その後、ImageIO.writeメソッドを使用して、出力画像のパスと形式を指定してすべての抽出画像をファイルパスに保存できます。

5.1. PDFドキュメントから画像を抽出

以下の例では、PDFドキュメントから画像を抽出し、PNG画像としてファイルシステムに保存します。

import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class Main {
    public static void main(String[] args) throws Exception {
        // Load PDF document from file
        PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));

        // Extract all images from the PDF document
        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;

        // Save each extracted image to the filesystem as a PNG
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class Main {
    public static void main(String[] args) throws Exception {
        // Load PDF document from file
        PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));

        // Extract all images from the PDF document
        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;

        // Save each extracted image to the filesystem as a PNG
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
JAVA

上のプログラムは「Final Project Report Craft Arena.pdf」ファイルを開き、extractAllImagesメソッドを使用して、ファイル内のすべての画像をBufferedImageオブジェクトのリストに抽出します。 その後、各新しいファイル画像を一意の名前で別々のPNGファイルに保存します。

JavaでPDFから画像を抽出する方法、図4: PDF出力から画像を抽出 PDF出力から画像を抽出

画像の抽出 from URL

このセクションでは、URLから直接画像を抽出する方法について説明します。 下のコードでは、URLがPDFページに変換され、画像を抽出するためのナビゲーショントグルがされます。

import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class Main {
    public static void main(String[] args) throws IOException {
        // Render PDF from a URL
        PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");

        // Extract all images from the rendered PDF document
        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;

        // Save each extracted image to the filesystem as a PNG
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class Main {
    public static void main(String[] args) throws IOException {
        // Render PDF from a URL
        PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");

        // Extract all images from the rendered PDF document
        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;

        // Save each extracted image to the filesystem as a PNG
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
JAVA

上のコードでは、AmazonのホームページURLが入力として提供され、74枚の画像が返されます。

JavaでPDFから画像を抽出する方法、図5: PDF出力から画像を抽出 PDF出力から画像を抽出

結論

PDFドキュメントから画像を抽出するには、JavaでIronPDFライブラリを使用して行うことができます。 IronPDFをインストールするには、Java、Java IDE(EclipseまたはIntelliJ)、Maven、およびIronPDFライブラリがインストールされており、プロジェクトと統合されている必要があります。 IronPDFを使用してPDFドキュメントから画像を抽出するプロセスは簡単で、extractAllImagesメソッドへの1回の呼び出しだけで済みます。 その後、ImageIO.writeメソッドを使用して選択したファイルパスに画像を保存できます。

この記事は、JavaとIronPDFライブラリを使用してPDFドキュメントから画像を抽出する手順を説明します。 PDFからテキストを抽出する方法に関する情報を含む詳細は、テキスト抽出コード例で見つけることができます。

IronPDFは、商用ライセンスcommercial licenseを持つライブラリで、$799から始まります。 ただし、無料トライアルで本番環境で評価することができます。

よくある質問

Javaを使用してPDFから画像を抽出するにはどうすればよいですか?

Javaを使用してPDFから画像を抽出するには、IronPDFライブラリを利用します。PDFドキュメントをロードしてからextractAllImagesメソッドを使用します。抽出された画像はImageIO.writeのようなメソッドを使って保存できます。

JavaでPDFから画像を抽出するために必要な前提条件は何ですか?

Javaを使用してPDFから画像を抽出するには、Javaがインストールされていること、およびEclipseやIntelliJ IDEAなどのJava IDEが必要です。また、Mavenを使用して依存関係を管理し、プロジェクトにIronPDFライブラリを含めるように設定します。

PDF画像抽出用のJavaライブラリをインストールするにはどうすればよいですか?

IronPDFライブラリをインストールするには、IntelliJ IDEAのようなJava IDE内でMavenプロジェクトを作成します。pom.xmlファイルにIronPDF依存関係を追加し、Mavenを使用してプロジェクトにダウンロードして含めます。

JavaでURLから生成されたPDFから画像を抽出できますか?

はい、IronPDFのrenderUrlAsPdfメソッドを使用してURLをPDFに変換し、さらにextractAllImagesメソッドを使用して生成されたPDFから画像を抽出できます。

Java PDFライブラリの試用版はありますか?

IronPDFは、JavaでのPDF管理と画像抽出の機能を探索するための無料の試用版を提供しています。

IronPDFを使用するために適したJava IDEはどれですか?

EclipseとIntelliJ IDEAは、PDFを扱うためのIronPDFライブラリを利用するJavaアプリケーションの開発に推奨されるIDEです。

Javaを使用してPDFから抽出した画像を保存するにはどうすればよいですか?

IronPDFを使用してPDFから画像を抽出したら、ImageIO.writeメソッドを使用して、希望するファイルパスと画像形式を指定して保存できます。

JavaでPDFファイルから画像を抽出する方法はどれですか?

IronPDFでは、extractAllImagesメソッドを使用してPDFドキュメントからすべての画像を抽出します。このメソッドは、さらに処理または保存できる画像のリストを返します。

PDFから抽出した画像を保存する際に使用できる画像形式は何ですか?

抽出した画像は、JavaでImageIO.writeメソッドを使用してPNGなどのさまざまな形式で保存できます。

JavaのPDF管理ライブラリはどのような機能を提供しますか?

IronPDFは、PDFファイルの生成、変更、データ抽出を可能にするJava用の包括的なライブラリで、テキストの抽出、マージ、分割、セキュリティ対策の適用などの機能を含みます。

Darrius Serrant
フルスタックソフトウェアエンジニア(WebOps)

Darrius Serrantは、マイアミ大学でコンピュータサイエンスの学士号を取得し、Iron SoftwareでフルスタックWebOpsマーケティングエンジニアとして働いています。若い頃からコーディングに惹かれ、コンピューティングを神秘的かつアクセス可能なものとし、創造性と問題解決のための完璧な媒体と考えていました。

Iron Softwareでは、新しいものを創造することと、複雑なコンセプトをより理解しやすくすることを楽しんでいます。Resident Developerの一人として、次世代に専門知識を共有するために、学生を教えることにも志願しました。

Darriusにとって、その仕事は価値があり、実際の影響があるため、満足感があります。