在實際環境中測試
在生產環境中測試無浮水印。
在任何需要的地方都能運作。
在 Java 中閱讀 PDF 文件可以成為任何專案的核心部分,無論是商業應用程式還是資料分析。 借助IronPDF庫,在您的Java專案中整合PDF處理功能比以往任何時候都更容易。
從文件
方法提取所有文本
從打開的 PDF 中讀取文字的方法IrotPDF Java PDF庫概述是需要製作高品質的軟體開發人員的完美解決方案快速從 HTML 生成可捕捉的 PDF. 該程式庫還提供強大的文件操作工具,使動態控制成為可能。IronPDF 中的頁面佈局和格式設定內容和格式。
讓我們看看如何使用IronPDF庫在Java程式中讀取存儲在路徑上的PDF文件。
第一步是使用 Maven 安裝 IronPDF,更多詳細資訊可以在IronPDF 安裝指南.
以下是在 Maven 項目中安裝 IronPDF 的步驟:
在您偏好的 IDE 中打開您的 Maven 專案。
pom.xml
文件的 dependencies
部分中,添加 IronPDF 庫的依賴項。 :ProductInstall
保存 pom.xml
文件,讓 Maven 下載並安裝 IronPDF 庫。
安裝完成後,您應該能夠在您的專案中匯入並使用 IronPDF 的下列類別和 Apache Tika 解析器。
以下是可以使用 IronPDF 庫讀取新文件(無論是否具有表格邊界)的代碼。
import com.ironsoftware.ironpdf.*;
import java.io.IOException;
import java.nio.file.Paths;
public class Test {
public static void main(String[] args) throws IOException {
PdfDocument pdf = PdfDocument.fromFile(Paths.get("C:\\sample.pdf"));
String text = pdf.extractAllText();
System.out.println(text);
}
}
在這個程式中,IronPDF 中的 PdfDocument 類別
用來讀取 PDF 文件的內容。程序的第一行從 IronPDF 庫中導入所需的類別。 第二行從 Java 標準庫導入 IOException
類。
該程式定義了一個名為 Test
的公共類別。 在這個類別中,有一個名為 main
的 public static
方法,它接受一個字串陣列作為參數。
main
方法使用IronPDF 中 PdfDocument 的 fromFile 方法
PdfDocument
類別的方法來載入位於 "C:\sample.pdf" 的 PDF 文件。 此方法返回一個表示 PDF 文件的 PdfDocument
對象。
一旦 PDF 文件被加載,程式會調用[IronPDF 中 PdfDocument 的 extractAllText 方法
](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllText())PdfDocument
類別的方法來提取 PDF 檔案中的所有文本。此方法返回一個包含 PDF 檔案中所有文本的 String
。
提取的文字隨後存儲在名為 "text" 的 String
變數中。 此變數可用於處理或顯示 PDF 文件的內容。
最後,程式使用 System.out.println
方法將提取的文字輸出到控制台。
程式輸出
IronPDF 是在 Java 中读取同一路径或多个不同路径中的 PDF 文件的绝佳解决方案,因为它提供了高性能和许多功能,使 PDF 的开发变得简单。 其語法簡單易用。 它的 API 允許開發者快速撰寫他們專案所需的程式碼。
探索 IronPDF 授權選項方案起始價格僅為 $749,這使得預算有限的人也能夠提取內容。 總體而言,IronPDF 為任何希望在 Java 應用程式中處理 PDF 的 Java 開發人員提供了一個出色的選擇。