Extract Text From PDF
作為 IronPDF 豐富 PDF 建立與編輯功能的一部分,IronPDF 亦透過其內容擷取方法,支援對 PDF 文件內容進行細粒度的處理。
所有 PdfDocument 物件皆提供 extractAllText 方法。 String 所返回的 extractAllText 包含 PDF 中每頁的所有文字。
此方法是從包含多頁面的 PDF 檔案中進行文件層級文字擷取的便捷方式。 若需在頁面層級(即僅從特定頁面集)擷取文字,請改用 extractTextFromPage 方法。
以下簡短的程式碼片段會從 PDF 文件的第一頁擷取文字。
如何在 Java 中從 PDF/A 擷取文字
- 安裝 IronPDF for Java 函式庫以進行 PDF 文字擷取
- 在 Java 中匯入目標 PDF 文件或從 URL 渲染
- 使用
extractAllText方法從 PDF 中擷取文字 - 使用
extractTextFromPage方法對特定頁面進行資料擷取 - 提取文字而不影響原始 PDF
準備開始了嗎?
版本: 2026.5 just released


