JAVA向けIRONPDFの使用

JavaでPDFファイルを読み取る方法

更新済み 2024年9月1日
共有:

この記事では、プログラムでソフトウェアアプリケーションでPDFファイルを開くPDFリーダーの作成方法について探求します。 このタスクを効果的に実行するために、IronPDF for Javaはそのようなシステムライブラリの一つであり、Javaプログラムでファイル名を使用してPDFファイルを開いたり読んだりするのに役立ちます。

IronPDF

IronPDFは、.NETおよびJava、Python、Node.jsでPDFを生成、編集、読み取るための強力なツールです。プログラマー向けに最適化されており、コードからPDFファイルの作成を容易に行うことができます。IronPDFは、HTML、CSS、JavaScript、および画像をPDFドキュメントに変換する能力を提供します。

機能

  • HTML to PDF: HTML、CSS、JavaScriptを利用してPDFを生成。
  • PDFの編集: 既存のPDFドキュメントにテキスト、画像、ページ番号、さらにはカスタムヘッダーやフッターを追加。
  • PDFの読み取り: PDFファイルからテキスト、画像、メタデータを抽出。
  • セキュリティ: パスワード保護や暗号化オプションでPDFドキュメントを保護。

利点

  • 使いやすさ: シンプルなAPIで時間を節約。
  • 高品質: 正確で美しいPDFドキュメントを生成。
  • 柔軟性: 様々なプラットフォームや言語で利用可能。

対応ライセンス

IronPDFは様々なライセンスオプションがあり、Lite License、Plus License、Professional License、Unlimited Licenseが用意されています。

技術サポートや詳細については、Iron Softwareの公式サイトをご覧ください。

についてIronPDF - Javaライブラリは、既に成功を収めている.NET Frameworkの上に構築されています。 IronPDFを他のクラスライブラリ、例えばApache PDFBoxと比較して、PDFドキュメントを扱うための多機能ツールにします。 It provides the facility to の訳は「それは施設を提供します」です。コンテンツの抽出と解析、テキストを読み込む、画像を読み込む。 PDFページをカスタマイズするオプションも提供しています。ページレイアウト, 余白, ヘッダーとフッター, ページの向きなど多くの機能があります。

さらに、IronPDFは他のファイル形式からの変換もサポートしており、PDFをパスワードで保護、デジタル署名、PDFドキュメントのマージや分割も可能です。

JavaでPDFファイルを読み取る方法

前提条件

JavaでPDFリーダーを作成するためにIronPDFを使用するには、次のコンポーネントがコンピューターにインストールされていることを確認する必要があります:

  1. JDK - Java開発キットは、Javaプログラムの構築および実行に必要です。 もしインストールされていない場合は、それをダウンロードしてください。オラクルウェブサイト.

  2. IDE - 統合開発環境は、プログラムの作成、編集、デバッグを支援するソフトウェアです。 Java用の任意のIDEをダウンロードしてください。例:Eclipse、NetBeans、IntelliJ。

  3. Maven - Mavenは、セントラルリポジトリからライブラリをダウンロードするのを助ける自動化ツールです。 以下からダウンロードしてくださいApache Maven ウェブサイト.

  4. IronPDF - 最後に、JavaでPDFファイルを読み取るためにIronPDFが必要です。 これは、Java Mavenプロジェクトに依存関係として追加する必要があります。 以下の例に示すように、pom.xmlファイルにIronPDFアーティファクトとslf4j依存関係を含めてください:
<dependency>
   <groupId>com.ironsoftware</groupId>
   <artifactId>com.ironsoftware</artifactId>
   <version>2024.11.4</version>
</dependency>

必要なインポートの追加

まず、以下のコードをJavaソースファイルの上部に追加し、IronPDFのすべての必要なメソッドを参照してください。 この例では、インポート org は任意です。

import com.ironsoftware.ironpdf.*;
JAVA

次に、有効なライセンスキーを使用してIronPDFを設定し、そのメソッドを使用します。 メインメソッドで setLicenseKey メソッドを呼び出します。

License.setLicenseKey("Your license key");
JAVA

注意: PDFの作成、読み取り、印刷のための無料試用ライセンスキーを入手できます。

Javaで既存のPDFファイルを読む

以下の内容を日本語に翻訳してください:

ToPDFファイルを読み込むPDF ファイルが必要です。 この記事では、既に作成されたPDFファイルを使用します。コードは簡単で、文書からテキストを抽出するための2ステップのプロセスです。

PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractAllText();
System.out.println(text);
JAVA

上記のコードでは、fromFilePDFドキュメントを開きます。 Paths.get メソッドはファイルのディレクトリを取得し、ファイルからコンテンツを抽出する準備ができています。その後、[extractAllText](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllText())ドキュメント内のすべてのテキストを読み取ります。

出力は以下の通りです:

JavaでPDFファイルを読み取る方法、図1:PDFテキスト出力の読み取り

PDFテキスト出力を読む

特定のページからテキストを読み取る

IronPDFは、PDF内の特定のページからコンテンツを読み取ることもできます。 extractTextFromPageメソッドはPageSelectionオブジェクトを使用してページの範囲を受け入れます。(s)テキストが読み取られる元。

次の例では、PDFドキュメントの2ページ目からテキストが抽出されています。 PageSelection.singlePageは、抽出する必要があるページのインデックスを受け取ります。

PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractTextFromPage(PageSelection.singlePage(1));
System.out.println(text);
JAVA

JavaでPDFファイルを読み込む方法、図2: PDFテキスト出力の読み取り

PDFテキスト出力を読む

PageSelectionクラスで利用できるその他のメソッドには、様々なページからテキストを抽出するための以下のものがあります:[firstPage(最初のページ)](/java/object-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#lastPage()), [lastPage](/java/object-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#firstPage()), pageRange(ページ範囲)、および[allPages](/java/object-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#allPages()).

新しく生成されたPDFファイルからテキストを読み取る

HTMLファイルまたはURLから新しく生成されたPDFファイルからもテキスト検索を実行できます。 以下のサンプルコードは、URLからPDFを生成し、ウェブサイトからすべてのテキストを抽出します。

PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://unsplash.com/");
String text = pdf.extractAllText();
System.out.println("Text extracted from the website: " + text);
JAVA

JavaでPDFファイルを読む方法、図2:新しいファイルから読み取る

新しいファイルから読み取る

IronPDFはまた、次のために使用できます。画像を抽出するPDFファイルから。

完全なコードは以下のとおりです:

import com.ironsoftware.ironpdf.License;
import com.ironsoftware.ironpdf.PdfDocument;
import com.ironsoftware.ironpdf.edit.PageSelection;

import java.io.IOException;
import java.nio.file.Paths;

public class Main {
    public static void main(String[] args) throws IOException {

        License.setLicenseKey("YOUR LICENSE KEY HERE");

        PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
        String text = pdf.extractTextFromPage(PageSelection.singlePage(1));
        System.out.println(text);

        pdf = PdfDocument.renderUrlAsPdf("https://unsplash.com/");
        text = pdf.extractAllText();
        System.out.println("Text extracted from the website: " + text);

    }
}
JAVA

サマリー

この記事では、IronPDFを使用してJavaでPDFを開いて読む方法について説明しました。

IronPDFはHTMLやURLから簡単にPDFを作成し、異なるファイルフォーマットから変換することができます。 PDFタスクを迅速かつ簡単に完了するのにも役立ちます。

IronPDFをお試しください。30日間の無料トライアルそして、本番環境でどれほどうまく機能するかを確認してください。 IronPDFの商用ライセンスオプションを調べるこれは、$749 からしか始まりません。

< 以前
JavaでPDFファイルを分割する方法
次へ >
HTML2PDF Java(コード例チュートリアル)

準備はできましたか? バージョン: 2024.11 新発売

無料のMavenダウンロード ライセンスを表示 >