在實際環境中測試
在生產環境中測試無浮水印。
在任何需要的地方都能運作。
本文將探討如何建立一個 PDF 閱讀器,以在您的軟體應用程序中以程式方式打開 PDF 文件。為了有效地執行此任務,IronPDF for Java 是一個可以幫助使用檔名在 Java 程式中打開和閱讀 PDF 文件的系統庫。
IronPDF - Java 函式庫 建立於已經成功的 .NET Framework 之上。這使 IronPDF 成為一個相比於其他類庫(如 Apache PDFBox)處理 PDF 文件的多功能工具。它提供了這樣的功能來 提取/解析內容, 加載文本, 並加載圖像。它還提供了自定義PDF頁面的選項,如 頁面佈局邊距 頁首和頁尾, 頁面方向 以及更多。
除此之外,IronPDF還支持從其他文件格式轉換、用密碼保護PDF、數字簽名、合併和分割PDF文件。
要使用 IronPDF 製作 Java PDF 閱讀器,需要確保計算機上已安裝以下組件:
JDK - Java 開發工具包是構建和運行 Java 程序所必需的。如果尚未安裝,請從 甲骨文網站.
IDE - 整合開發環境是一種幫助編寫、編輯和調試程式的軟體。下載任何 Java 的 IDE。例如:Eclipse、NetBeans、IntelliJ。
Maven - Maven 是一個幫助從中央倉庫下載庫的自動化工具。從 Apache Maven 網站.
pom.xml
文件中,如下面的示例所示:<dependency>
<groupId>com.ironsoftware</groupId>
<artifactId>com.ironsoftware</artifactId>
<version>2024.9.1</version>
</dependency>
首先,在 Java 源文件的頂部添加以下代碼,以引用 IronPDF 的所有必要方法。此範例中導入 org 是可選的。
import com.ironsoftware.ironpdf.*;
接下來,配置 IronPDF 的有效授權碼以使用其方法。在主方法中調用 setLicenseKey
方法。
License.setLicenseKey("Your license key");
注意: 您可以獲取免費試用許可證密鑰來創建、閱讀和打印PDF。
PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractAllText();
System.out.println(text);
在上面的代碼中, 從檔案
打開 PDF 文件。Paths.get
方法獲取文件的目錄,並準備從文件中提取內容。 然後, [提取所有文本
](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllText()) 讀取文件中的所有文字。
輸出如下:
閱讀 PDF 文本輸出
IronPDF 也可以從 PDF 的特定頁面讀取內容。extractTextFromPage
方法使用 PageSelection
對象來接受頁面範圍(s) 從中將讀取文本。
在以下範例中,文本將從 PDF 文件的第二頁提取。PageSelection.singlePage
採用需要提取的頁面的索引。
PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractTextFromPage(PageSelection.singlePage(1));
System.out.println(text);
閱讀 PDF 文本輸出
PageSelection
類別中還有其他可用的方法,可以用來從不同頁面提取文本,包括: [firstPage
](/java/object-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#lastPage()), [最後一頁
](/java/object-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#firstPage()), 頁面範圍
,和 [所有頁面
](/java/object-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#allPages()).
也可以從新生成的 PDF 文件(來自 HTML 文件或 URL)中進行文本搜索。以下範例代碼從 URL 生成 PDF 並提取網站上的所有文本。
PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://unsplash.com/");
String text = pdf.extractAllText();
System.out.println("Text extracted from the website: " + text);
從新文件讀取
IronPDF 也可用來 提取圖像 從 PDF 檔案。
完整程式碼如下:
import com.ironsoftware.ironpdf.License;
import com.ironsoftware.ironpdf.PdfDocument;
import com.ironsoftware.ironpdf.edit.PageSelection;
import java.io.IOException;
import java.nio.file.Paths;
public class Main {
public static void main(String[] args) throws IOException {
License.setLicenseKey("YOUR LICENSE KEY HERE");
PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractTextFromPage(PageSelection.singlePage(1));
System.out.println(text);
pdf = PdfDocument.renderUrlAsPdf("https://unsplash.com/");
text = pdf.extractAllText();
System.out.println("Text extracted from the website: " + text);
}
}
本文解釋了如何使用 IronPDF 在 Java 中打開和閱讀 PDF。
IronPDF 幫助輕鬆從 HTML 或 URL 創建 PDF 並且也可從不同的文件格式進行轉換。它還幫助快速輕鬆地完成 PDF 任務。