ライブ環境でテストする
ウォーターマークなしで本番環境でテストしてください。
必要な場所でいつでも動作します。
PDFファイルは、現代においてデータを転送するための最も使用されているドキュメント形式です。主に、それがフォーマットを保持して、送信されたときと同じ形でデータを表示できるためです。 PDFドキュメントをロード、オープン、および表示するには、PDFドキュメントリーダーシステムが必要です。 多くのPDFリーダーが利用可能ですが、ソフトウェアアプリケーションでプログラム的にPDFファイルを開きたい場合、適切なクラスライブラリが必要です。
ここでは、Javaプログラムでファイル名を使用してPDFファイルを開き、読み取るのに役立つシステムライブラリの一つを見ていきます。
IronPDFは、.NETおよびJava、Python、Node.jsでPDFを生成、編集、読み取るための強力なツールです。プログラマー向けに最適化されており、コードからPDFファイルの作成を容易に行うことができます。IronPDFは、HTML、CSS、JavaScript、および画像をPDFドキュメントに変換する能力を提供します。
IronPDFは様々なライセンスオプションがあり、Lite License、Plus License、Professional License、Unlimited Licenseが用意されています。
技術サポートや詳細については、Iron Softwareの公式サイトをご覧ください。
IronPDF - Javaライブラリ は、すでに成功している .NET Framework を基盤としています。 これにより、IronPDFは、Apache PDFBoxなどの他のクラス ライブラリと比較して、PDFドキュメントを扱うための多用途ツールになります。 コンテンツの抽出/解析、テキストの読み込み、画像の読み込みの機能を提供します。 また、ページレイアウト、余白、ヘッダーとフッター、ページの向きなど、PDFページをカスタマイズするためのオプションも提供しています。
これに加えて、IronPDFは他のファイル形式からの変換、パスワードによるPDF保護、デジタル署名、PDFドキュメントの結合と分割もサポートしています。
JavaでPDFリーダーを作成するためにIronPDFを使用するには、まずコンピューターに以下のコンポーネントがインストールされていることを確認する必要があります:
JDK - Java開発キットは、Javaプログラムの構築および実行に必要です。 インストールされていない場合は、こちらからダウンロードしてください。 オラクルウェブサイト.
IDE - 統合開発環境は、プログラムの作成、編集、およびデバッグを支援するソフトウェアです。 任意のJava用IDEをダウンロードしてください。 例:Eclipse、Netbeans、Intellij。
Maven - Mavenは、中央リポジトリからライブラリをダウンロードするのを支援する自動化ツールです。 以下からダウンロードしてください Apache Maven のウェブサイト.
:ProductInstall
まず、以下のコードをJavaソースファイルの上部に追加し、IronPDFのすべての必要なメソッドを参照してください。 この例では、インポート org は任意です。
import com.ironsoftware.ironpdf.*;
次に、有効なライセンスキーを使用してIronPDFを設定し、そのメソッドを使用します。 メインメソッドで setLicenseKey
メソッドを呼び出してください。
License.setLicenseKey("Your license key");
注記: PDFを作成、読み取り、印刷するための無料試用ライセンスキーを取得できます。
以下の内容を日本語に翻訳してください:
To PDFファイルを読み込むPDFファイルが存在するか、または作成する必要があります。 ここでは既に作成されたPDFファイルを使用します。このコードはシンプルで、ドキュメントからテキストを抽出するための2ステップのプロセスです。
PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractAllText();
System.out.println(text);
上記のコードでは、fromFile
がPDFドキュメントを開きます。 Paths.get
メソッドはファイルのディレクトリを取得し、ファイルからコンテンツを抽出する準備が整います。その後、extractAllText
がドキュメント内のすべてのテキストを読み取ります。
出力は以下の通りです:
IronPDFは、PDF内の特定のページからコンテンツを読み取ることもできます。 extractTextFromPage
メソッドはPageSelection
オブジェクトを使用してページの範囲を受け入れます。(s) テキストが読み取られる元。
以下の例では、PDFドキュメントの2ページ目からテキストを抽出します。 PageSelection.singlePage
は、抽出する必要があるページのインデックスを受け取ります。
PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractTextFromPage(PageSelection.singlePage(1));
System.out.println(text);
PageSelection
クラスで利用可能な、さまざまなページからテキストを抽出するために使用できる他のメソッドは次のとおりです: [firstPage(最初のページ)
](/java/object-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#lastPage()), [lastPage
](/java/object-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#firstPage()), pageRange(ページ範囲)
、および [allPages
](/java/object-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#allPages()).
HTMLファイルまたはURLから新しく生成されたPDFファイルのテキストを検索することもできます。 次のサンプルコードは、URLからPDFを生成し、ウェブサイトからすべてのテキストを抽出します。
PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://unsplash.com/");
String text = pdf.extractAllText();
System.out.println("Text extracted from the website: " + text);
IronPDFはまた、次のために使用できます。 画像を抽出する PDFファイルから。
完全なコードは以下のとおりです:
import com.ironsoftware.ironpdf.License;
import com.ironsoftware.ironpdf.PdfDocument;
import com.ironsoftware.ironpdf.edit.PageSelection;
import java.*;
import java.io.IOException;
import java.nio.file.Paths;
public class Main {
public static void main(String [] args) throws IOException {
License.setLicenseKey("YOUR LICENSE KEY HERE");
PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractTextFromPage(PageSelection.singlePage(1));
System.out.println(text);
pdf = PdfDocument.renderUrlAsPdf("https://unsplash.com/");
text = pdf.extractAllText();
System.out.println("Text extracted from the website: " + text);
}
}
この記事では、IronPDFを使用してJavaでPDFを開いて読み取る方法について見ていきました。
IronPDFは、HTMLやURLから簡単にPDFを作成したり、異なるファイル形式から変換したりするのに役立ちます。 PDFタスクを迅速かつ簡単に完了するのにも役立ちます。
IronPDFを試してみてください 30日間 本番環境でどの程度うまく機能するかを確認してください。 商用ライセンス $749から始まります。
9つの .NET API製品 オフィス文書用