ライブ環境でテストする
ウォーターマークなしで本番環境でテストしてください。
必要な場所でいつでも動作します。
JavaでPDFドキュメントを読み取ることは、ビジネスアプリケーションからデータ分析に至るまで、あらゆるプロジェクトの重要な部分となり得ます。 IronPDFライブラリを使用すると、JavaプロジェクトにPDF処理機能を統合することがこれまでになく簡単になります。
fromFile(ファイルから)
メソッドすべてのテキストを抽出
開いたPDFからテキストを読み取る方法IrotPDF Java PDF ライブラリの概要ソフトウェア開発者が高品質の製品を作成するための完璧なソリューションです。HTMLからすばやくキャプチャ対応のPDFを作成. ライブラリには、動的な制御を可能にする強力なドキュメント操作ツールも提供されています。IronPDFのページレイアウトとフォーマットコンテンツおよびフォーマット。
JavaプログラムでIronPDFライブラリを使用して、指定されたパスに保存されているPDFファイルを読み取る方法を見てみましょう。
最初のステップはMavenを使ってIronPDFをインストールすることです。IronPDFインストールガイド.
MavenプロジェクトにIronPDFをインストールする手順は以下の通りです:
お好みのIDEでMavenプロジェクトを開いてください。
pom.xml
ファイルのdependencies
セクションにIronPDFライブラリの依存関係を追加します。 :ProductInstall
pom.xml
ファイルを保存し、MavenにIronPDFライブラリをダウンロードしてインストールさせてください。
インストールが完了すると、プロジェクト内でIronPDFの次のクラスおよびApache Tikaパーサーをインポートして使用できるようになります。
こちらは、IronPDFライブラリを使用して、新しいファイルをタブ境界の有無にかかわらず読み取るためのコードです。
import com.ironsoftware.ironpdf.*;
import java.io.IOException;
import java.nio.file.Paths;
public class Test {
public static void main(String[] args) throws IOException {
PdfDocument pdf = PdfDocument.fromFile(Paths.get("C:\\sample.pdf"));
String text = pdf.extractAllText();
System.out.println(text);
}
}
このプログラムでは、IronPDF`のPdfDocumentクラスは、PDFファイルの内容を読み取るために使用されます。プログラムの最初の行はIronPDFライブラリから必要なクラスをインポートしています。 次の行では、Java標準ライブラリからIOException
クラスをインポートします。
プログラムは Test
という名前のパブリッククラスを定義します。 クラスの内部には、文字列の配列を引数として受け取るpublic static
メソッドであるmain
があります。
main
メソッドはIronPDFにおけるPdfDocumentの
fromFileメソッドPdfDocument
クラスのメソッドを使用して "C:\sample.pdf" にあるPDFファイルを読み込みます。 このメソッドは、PDFファイルを表す PdfDocument
オブジェクトを返します。
PDFファイルが読み込まれたら、プログラムは[IronPDFのPdfDocumentのextractAllTextメソッド
。](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllText())PdfDocument
クラスのメソッドを使用して、PDFファイルからすべてのテキストを抽出します。このメソッドは、PDFファイル内のすべてのテキストを含むString
を返します。
抽出されたテキストは、text
という名前のString
変数に格納されます。 この変数を使用して、PDFファイルの内容を処理または表示することができます。
最後に、プログラムは System.out.println
メソッドを使用して、抽出されたテキストをコンソールに印刷します。
プログラム出力
IronPDFは、Javaで同じパスや複数の異なるパス内のPDFファイルを読み取るための優れたソリューションです。高性能であり、PDFの開発を容易にする多くの機能を提供します。 その構文は分かりやすく、ユーザーフレンドリーです。 そのAPIにより、開発者はプロジェクトに必要なコードを迅速に作成できます。
IronPDFのライセンスオプションを見るプランはわずか $749 から始まり、予算に限りがある方でもコンテンツを抽出することが可能です。 全体として、IronPDFはJavaアプリケーションプログラミングでPDFを扱いたいと考えているJava開発者にとって、優れた選択肢を提供します。
9つの .NET API製品 オフィス文書用