ライブ環境でテストする
ウォーターマークなしで本番環境でテストしてください。
必要な場所でいつでも動作します。
この記事では、Javaプログラミング言語を使用して、既存のPDFドキュメントから画像を抽出し、それらを単一のフォルダに保存する方法について説明します。 この目的のために、IronPDF for Java ライブラリが画像を抽出するために使用されます。
IronPDFは、開発者が生成、変更、およびPDFファイルからデータを抽出するJavaアプリケーション内で。 IronPDFを使用すると、HTMLや画像など、さまざまなソースからPDFドキュメントを作成できます。 また、あなたはその能力を持っていますマージ, 分割、既存のPDFを操作します。 IronPDFには、などのセキュリティ機能も含まれています。パスワード保護以下のコンテンツを日本語に翻訳してください:デジタル署名.
Iron Softwareによって開発および維持されているIronPDFは、PDF、HTML、およびURLからテキストを抽出する能力で知られています。 これは、PDFをゼロから作成する場合でも既存のPDFを操作する場合でも、さまざまなアプリケーションに対応できる多用途で強力なツールにします。
PDFファイルからデータを抽出するためにIronPDFを使用する前に、いくつかの前提条件を満たす必要があります。
Java のインストール: Java がシステムにインストールされていることを確認し、そのパスが環境変数に設定されていることを確認してください。 Javaをまだインストールしていない場合は、以下の手順に従ってくださいJavaウェブサイトからのダウンロードページ.
Java IDE: Java IDEとしてEclipseまたはIntelliJをインストールしてください。Eclipseは次のリンクからダウンロードできます:リンクからこのIntelliJダウンロードページ.
IronPDF ライブラリ: IronPDF ライブラリをダウンロードし、依存関係としてプロジェクトに追加してください。 セットアップ手順については、次のリンクをご覧ください:IronPDFのウェブサイト.
IronPDF for Java のインストールは、すべての要件が満たされていれば簡単です。 このガイドでは、JetBrains IntelliJ IDEAを使用してインストールを実行し、サンプルコードを幾つか実行します。
以下のことを行ってください:
IntelliJ IDEAを起動する: システムでJetBrains IntelliJ IDEAを開きます。
Mavenプロジェクトを作成する: IntelliJ IDEAで新しいMavenプロジェクトを作成します。 これはIronPDF for Javaのインストールに適した環境を提供します。
新しいMavenプロジェクトを作成する
新しいウィンドウが表示されます。 プロジェクト名を入力し、「完了」をクリックしてください。
プロジェクトの名前を入力してください
クリックした後に完了すると、IronPDF for JavaのMaven依存関係を追加するための pom.xml
ファイルを含む新しいプロジェクトが開きます。
次に、以下の依存関係を pom.xml
ファイルに追加するか、以下からJARファイルをダウンロードできますMaven リポジトリ.
<dependency>
<groupId>com.ironsoftware</groupId>
<artifactId>com.ironsoftware</artifactId>
<version>2024.11.4</version>
</dependency>
pom.xml
ファイルに依存関係を配置すると、ファイルの右上隅に小さなアイコンが表示されます。
pom.xmlファイルに依存関係をインストールするための小さなアイコン
このアイコンをクリックして、IronPDF for JavaのMaven依存関係をインストールしてください。 これは、インターネット接続状況によって数分で完了します。
PDFドキュメントから画像を抽出するには、IronPDFの「ExtractImages」という単一のメソッドを使用できます。[extractAllImages
-> すべての画像を抽出](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllImages()). このメソッドは、PDFファイル内にあるすべての画像を返します。その後、取得した画像をすべて、ImageIO.write
メソッドを使用して、出力画像のパスと形式を指定し、希望のファイルパスに保存することができます。
次の例では、PDFドキュメントから画像が抽出され、ファイルシステムにPNG画像として保存されます。
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class main {
public static void main(String[] args) throws Exception {
PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}
上記のプログラムは「Final Project Report Craft Arena.pdf」ファイルを開き、extractAllImages
メソッドを使用してファイル内のすべての画像をBufferedImage
オブジェクトのリストに抽出します。 それから、各新しいファイルイメージをユニークな名前で別々のPNGファイルに保存します。
PDF出力からの画像抽出
このセクションでは、URLから直接画像を抽出する方法について説明します。 以下のコードでは、URLがPDFページに変換され、その後ナビゲーションを切り替えてPDFから画像を抽出します。
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class main {
public static void main(String[] args) throws IOException {
PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}
上記のコードでは、AmazonのホームページURLが入力として提供されており、74枚の画像を返します。
PDF出力からの画像抽出
PDFドキュメントから画像を抽出するには、IronPDFライブラリを使用してJavaで行うことができます。 IronPDFをインストールするには、Java、Java IDEが必要です。(エクリプスまたはIntelliJ), Maven、およびIronPDFライブラリがインストールされ、プロジェクトに統合されています。 IronPDFを使用してPDFドキュメントから画像を抽出するプロセスは簡単で、extractAllImages
メソッドの呼び出しだけが必要です。 その後、ImageIO.write
メソッドを使用して、任意のファイルパスに画像を保存することができます。
この記事では、についての段階的なガイドを提供します画像を抽出する方法JavaおよびIronPDFライブラリを使用して、PDFドキュメントから。 以下の詳細情報、PDFからテキストを抽出する方法については、テキスト抽出のコード例.
IronPDFは、ライブラリで商用ライセンス以下の通り翻訳します:
$749から開始します。 しかし、本番環境で評価することができます無料トライアル.
9つの .NET API製品 オフィス文書用