ライブ環境でテストする
ウォーターマークなしで本番環境でテストしてください。
必要な場所でいつでも動作します。
このチュートリアルでは、使用方法を紹介しますIronPDF for JavaPDFファイルからデータを抽出するために。環境のセットアップ、ライブラリのインポート、入力ファイルの読み込み、必要なデータの抽出がすべてコードサンプルで説明されています。
IronPDFは、開発者が生成、編集、およびIronPDF for Javaを使ってPDFファイルからデータを抽出するJavaアプリケーション内で。 それにより、あなたはHTML文書からPDFを作成、画像やその他のものを含む、そしてまた複数のPDFを結合, PDFファイルの分割、既存のPDFを操作します。 IronPDFは、PDFを保護する機能も提供します。パスワード保護機能以下のコンテンツを日本語に翻訳してください:PDFに電子署名を追加するなどの機能が含まれています。
IronPDF for JavaはIron Softwareによって開発および維持されています。 その最も評価の高い機能の一つは、PDFファイルからだけでなく、HTMLやURLからもテキストとデータを抽出することです。
IronPDFを使用してPDFファイルからデータを抽出するには、以下の前提条件を満たす必要があります:
Javaのインストール: システムにJavaがインストールされており、環境変数にパスが設定されていることを確認してください。 まだJavaをインストールしていない場合は、こちらをご参照くださいJavaウェブサイトのダウンロードページ指示については。
Java IDE: EclipseやIntelliJのようなJava IDEをインストールしてください。 こちらからEclipseをダウンロードできますEclipseダウンロードページからこのIntelliJIntelliJダウンロードページ.
IronPDFライブラリ: IronPDFライブラリをダウンロードして、プロジェクトの依存関係として追加します。 ウェブサイトに訪問してくださいIronPDFセットアップ説明ページセットアップの手順について。
すべての要件が満たされていれば、IronPDF for Javaのインストールは簡単かつシンプルです。 このガイドでは、JetBrainsのIntelliJ IDEAを使用して、インストールとサンプルコードの実行を示します。
以下のことを行ってください:
IntelliJ IDEA を開く: お使いのシステムで JetBrains IntelliJ IDEA を起動します。
Mavenプロジェクトを作成する: IntelliJ IDEAで新しいMavenプロジェクトを作成します。 これはIronPDF for Javaのインストールに適した環境を提供します。
IntelliJで新しいMavenプロジェクト
新しいウィンドウが表示されます。 プロジェクト名を入力し、「完了」をクリックしてください。
Mavenプロジェクトに名前を付けて、完了をクリックします
「Finish」をクリックすると、pom.xmlを含む新しいプロジェクトが開きます。 これは、IronPDF Java Maven 依存関係を追加するために使用されます。
pom.xmlファイル
以下の依存関係を pom.xml
ファイルに追加するか、JARファイルをSonatype CentralのIronPDFライブラリページ.
<dependency>
<groupId>com.ironsoftware</groupId>
<artifactId>com.ironsoftware</artifactId>
<version>2024.11.4</version>
</dependency>
pom.xml
ファイルに依存関係を配置すると、ファイルの右上隅に小さなアイコンが表示されます。
浮動アイコンをクリックして、Mavenの依存関係を自動的にインストールします
このボタンをクリックしてIronPDF for JavaのMaven依存関係をインストールしてください。 インターネット接続の速度によっては、これにはほんの数分しかかからないはずです。
IronPDFは、PDFドキュメントの作成、編集、データ抽出のためのJavaライブラリです。 PDFファイル、URL、テーブルからテキストを抽出するためのシンプルなAPIを提供します。
Java 向け IronPDF を使用すると、PDF ドキュメントからテキストデータを簡単に抽出できます。 以下は、PDFファイルからデータを抽出するためのサンプルコードです。
PDF入力
import com.ironsoftware.ironpdf.PdfDocument;
import java.io.IOException;
import java.nio.file.Paths;
public class Main {
public static void main(String[] args) throws IOException {
PdfDocument pdf = PdfDocument.fromFile(Paths.get("business plan.pdf"));
String text = pdf.extractAllText();
System.out.println("Text extracted from the PDF: " + text);
}
}
ソースコードは以下の出力を生成します:
> Text extracted from the PDF:
>
> CRAFT-ARENA
>
> Muhammad Waleed Butt
>
> Hassan Khan
>
> ABOUT US
>
> Craft-Arena is a partnershipbased business that will help local crafters of Pakistan to sell their handy crafts at good prices and helps them earn good living.
IronPDF for Javaは、ランタイム中にURLをPDFに変換し、テキストを抽出します。 この例では、URLからテキストを抽出するためのソースコードを見ていきます。
import com.ironsoftware.ironpdf.PdfDocument;
import java.io.IOException;
public class Main {
public static void main(String[] args) throws IOException {
PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://ironpdf.com/java/");
// new PDF parser
String text = pdf.extractAllText();
System.out.println("Text extracted from the URLs: " + text);
}
}
抽出されたウェブページのデータ
IronPDF for Javaを使用してPDFから表データを抽出するのは非常に簡単です。 テーブルを含むPDFファイルと、下記のコードを実行するだけで済みます。
サンプルPDFテーブル入力
import com.ironsoftware.ironpdf.PdfDocument;
import java.io.IOException;
import java.nio.file.Paths;
public class Main {
public static void main(String[] args) throws IOException {
PdfDocument pdf = PdfDocument.fromFile(Paths.get("table.pdf"));
String text = pdf.extractAllText();
System.out.print("Text extracted from the Marked tables: " + text);
}
}
> Test Case Description Expected Result Actual Result Status
>
> 1 Test login functionality User should be able to log in with valid credentials
>
> User log in successfully Pass
>
> 2 Test search functionality Search results should be relevant and accurate
>
> Search is accurate and provide relevant products Pass
>
> 3 Test checkout process User should be able to complete a purchase successfully
>
> User can purchase successfully Pass
結論として、このチュートリアルでは、IronPDF for Java を使用してPDFファイルから特に表形式データを抽出する方法を示しました。
詳細については、をご参照ください。PDFからテキストを抽出する例IronPDFのウェブサイトで。
IronPDFは、ライブラリで商用ライセンスの詳細以下の通り翻訳します:
$749から開始します。 しかし、本番環境で評価することができます。IronPDFトライアルライセンスを使用した無料トライアル.
9つの .NET API製品 オフィス文書用