在實際環境中測試
在生產環境中測試無浮水印。
在任何需要的地方都能運作。
在Java中讀取PDF文件可以是任何專案的重要部分,從商業應用到數據分析不等。使用IronPDF庫,將PDF處理功能整合到你的Java專案中變得比以往任何時候都更容易。
從文件
方法提取所有文本
方法 to read text from the opened fileIronPDF Java PDF 庫 是需要製作高品質的軟體開發人員的完美解決方案 快速從 HTML 生成可捕捉的 PDF該庫還提供強大的文件操作工具,使能夠動態控制 頁面佈局讓我們看看如何使用 IronPDF 庫在 Java 程式中讀取存儲在路徑中的 PDF 文件。
首先步驟是使用Maven安裝IronPDF,更多詳情可以在這裡找到 安裝指南.
以下是在 Maven 專案中安裝 IronPDF 的步驟:
在您偏好的 IDE 中打開您的 Maven 專案。
pom.xml
檔案中,在 dependencies
部分新增 IronPDF 庫依賴。 :ProductInstall
pom.xml
文件並讓 Maven 下載並安裝 IronPDF 庫。一旦安裝完成,您就應該能夠在您的項目中導入並使用 IronPDF 的以下類和 Apache Tika 解析器。
這是您可以使用IronPDF庫來讀取新文件(無論是否包含表格邊界)的代碼。
import com.ironsoftware.ironpdf.*;
import java.io.IOException;
import java.nio.file.Paths;
public class Test {
public static void main(String[] args) throws IOException {
PdfDocument pdf = PdfDocument.fromFile(Paths.get("C:\\sample.pdf"));
String text = pdf.extractAllText();
System.out.println(text);
}
}
在這個程式中, PdfDocument
從IronPDF庫中使用的類用於讀取PDF文件的內容。程式的第一行從IronPDF庫中匯入所需的類。第二行從Java標準庫中匯入IOException
類。
該程式定義了一個名為Test
的公共類。在該類內,有一個以字符串數組為參數的public static
方法名為main
。
main
方法使用 從檔案
PdfDocument
類別的方法來加載位於 "C:\sample.pdf" 的 PDF 文件。該方法返回一個代表該 PDF 文件的 PdfDocument
對象。
一旦 PDF 文件被加載,程序將調用 [提取所有文本
](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllText()) 要從 PDF 文件中提取所有文本,使用 PdfDocument
類的方法。此方法返回一個包含 PDF 文件中所有文本的 String
。
提取的文本然後存儲在名為 "text" 的 String
變量中。此變量可以用於處理或顯示 PDF 文件的內容。
最後,程序使用 System.out.println
方法將提取的文本打印到控制台上。
程式輸出
IronPDF 是在 Java 中讀取相同路徑或多個不同路徑上的 PDF 文件的絕佳解決方案,因為它具有高性能和許多功能,可輕鬆開發 PDF。 其語法簡單易用。 其 API 允許開發人員快速編寫專案所需的代碼。
IronPDF的授權方式 計劃從僅 $749 開始,使其對於有預算限制的人來說提取內容變得容易。總體而言,IronPDF 為任何希望在 Java 應用程序編程中處理 PDF 的 Java 開發人員提供了一個絕佳的選擇。