JAVA向けIRONPDFの使用

JavaでPDFファイルを読み取る方法

更新済み 2024年8月25日
共有:

JavaでPDFドキュメントを読み取ることは、ビジネスアプリケーションからデータ分析に至るまで、あらゆるプロジェクトの重要な部分となり得ます。 IronPDFライブラリを使用すると、JavaプロジェクトにPDF処理機能を統合することがこれまでになく簡単になります。

IronPDF: Java PDFライブラリのインポート

IrotPDF Java PDF ライブラリの概要ソフトウェア開発者が高品質の製品を作成するための完璧なソリューションです。HTMLからすばやくキャプチャ対応のPDFを作成. ライブラリには、動的な制御を可能にする強力なドキュメント操作ツールも提供されています。IronPDFのページレイアウトとフォーマットコンテンツおよびフォーマット。

JavaプログラムでIronPDFライブラリを使用して、指定されたパスに保存されているPDFファイルを読み取る方法を見てみましょう。

IronPDFを使ってPDFを読む

最初のステップはMavenを使ってIronPDFをインストールすることです。IronPDFインストールガイド.

MavenにIronPDFをインストール

MavenプロジェクトにIronPDFをインストールする手順は以下の通りです:

  1. お好みのIDEでMavenプロジェクトを開いてください。

  2. pom.xmlファイルのdependenciesセクションにIronPDFライブラリの依存関係を追加します。
    :ProductInstall
  1. pom.xmlファイルを保存し、MavenにIronPDFライブラリをダウンロードしてインストールさせてください。

    インストールが完了すると、プロジェクト内でIronPDFの次のクラスおよびApache Tikaパーサーをインポートして使用できるようになります。

PDFドキュメントを読み取るJavaコード

こちらは、IronPDFライブラリを使用して、新しいファイルをタブ境界の有無にかかわらず読み取るためのコードです。

import com.ironsoftware.ironpdf.*;
import java.io.IOException;
import java.nio.file.Paths;

public class Test {
    public static void main(String[] args) throws IOException {
        PdfDocument pdf = PdfDocument.fromFile(Paths.get("C:\\sample.pdf"));  
        String text = pdf.extractAllText();
        System.out.println(text);
    }
}
JAVA

このプログラムでは、IronPDF`のPdfDocumentクラスは、PDFファイルの内容を読み取るために使用されます。プログラムの最初の行はIronPDFライブラリから必要なクラスをインポートしています。 次の行では、Java標準ライブラリからIOExceptionクラスをインポートします。

プログラムは Test という名前のパブリッククラスを定義します。 クラスの内部には、文字列の配列を引数として受け取るpublic staticメソッドであるmainがあります。

main メソッドはIronPDFにおけるPdfDocumentのfromFileメソッドPdfDocument クラスのメソッドを使用して "C:\sample.pdf" にあるPDFファイルを読み込みます。 このメソッドは、PDFファイルを表す PdfDocument オブジェクトを返します。

PDFファイルが読み込まれたら、プログラムは[IronPDFのPdfDocumentのextractAllTextメソッド。](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllText())PdfDocumentクラスのメソッドを使用して、PDFファイルからすべてのテキストを抽出します。このメソッドは、PDFファイル内のすべてのテキストを含むStringを返します。

抽出されたテキストは、textという名前のString変数に格納されます。 この変数を使用して、PDFファイルの内容を処理または表示することができます。

最後に、プログラムは System.out.println メソッドを使用して、抽出されたテキストをコンソールに印刷します。

Java で PDF ファイルを読み取る方法, 図 1: プログラムの出力

プログラム出力

結論

IronPDFは、Javaで同じパスや複数の異なるパス内のPDFファイルを読み取るための優れたソリューションです。高性能であり、PDFの開発を容易にする多くの機能を提供します。 その構文は分かりやすく、ユーザーフレンドリーです。 そのAPIにより、開発者はプロジェクトに必要なコードを迅速に作成できます。

IronPDFのライセンスオプションを見るプランはわずか $749 から始まり、予算に限りがある方でもコンテンツを抽出することが可能です。 全体として、IronPDFはJavaアプリケーションプログラミングでPDFを扱いたいと考えているJava開発者にとって、優れた選択肢を提供します。

< 以前
JavaでPDFにデジタル署名を追加する方法
次へ >
JavaでPDFファイルを回転する方法

Mavenでインストール

バージョン:2024.11.4

<dependency>
  <groupId>com.ironsoftware</groupId>
  <artifactId>ironpdf</artifactId>
  <version>2024.11.4</version>
</dependency>

準備はできましたか? バージョン: 2024.11 新発売

無料のMavenダウンロード ライセンスを表示 >