在生产环境中测试,无水印。
随时随地满足您的需求。
获得30天的全功能产品。
几分钟内就能启动并运行。
在您的产品试用期间,全面访问我们的支持工程团队。
用 Java 阅读 PDF 文档是任何项目(从商业应用到数据分析)不可或缺的一部分。 有了 IronPDF for Java 库,在 Java 项目中集成 PDF 处理功能变得前所未有的简单。
fromFile
方法加载现有的PDF文档extractAllText
方法从打开的PDF中读取文本IrotPDF Java PDF库概述是软件开发人员的完美解决方案,他们需要快速从HTML生成高质量的捕获就绪PDF。 该库还提供强大的文档操作工具,能够动态控制IronPDF中的页面布局和格式化、内容和格式。
让我们看看如何使用 IronPDF for Java 库在 Java 程序中读取存储在某个路径下的 PDF 文件。
第一步是使用Maven安装IronPDF,更多详情可以在IronPDF安装指南中找到。
以下是在 Maven 项目中安装 IronPDF 的步骤:
在您喜欢的集成开发环境中打开您的 Maven 项目。
pom.xml
文件的dependencies
部分添加IronPDF库依赖。 :ProductInstall
保存pom.xml
文件,然后让Maven下载并安装IronPDF库。
安装完成后,您应该可以在项目中导入并使用 IronPDF 的以下类和 Apache Tika 解析器。
以下是代码,您可以使用 IronPdf 库读取有或无表格边界的新文件。
import com.ironsoftware.ironpdf.*;
import java.io.IOException;
import java.nio.file.Paths;
public class Test {
public static void main(String[] args) throws IOException {
PdfDocument pdf = PdfDocument.fromFile(Paths.get("C:\\sample.pdf"));
String text = pdf.extractAllText();
System.out.println(text);
}
}
在这个程序中,IronPDF中的PdfDocument类
用于读取PDF文件的内容。程序的第一行从IronPDF库中导入所需的类。 第二行从 Java 标准库中导入IOException
类。
该程序定义了一个名为Test
的公共类。 在类中,有一个名为main
的public static
方法,该方法以字符串数组作为参数。
main
方法使用 PdfDocument
类中的 fromFile method of PdfDocument in IronPDF
方法来加载位于 "C:\sample.pdf" 的PDF文件。 此方法返回一个PdfDocument
对象,表示PDF文件。
一旦加载了PDF文件,程序调用[IronPDF中PdfDocument的extractAllText方法
](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllText()),从PDF文件中提取所有文本。此方法返回一个包含PDF文件中所有文本的String
。
提取的文本随后存储在名为“text”的String
变量中。 该变量可用于处理或显示 PDF 文件的内容。
最后,程序使用System.out.println
方法将提取的文本打印到控制台。
程序输出
IronPDF for Java 是在 Java 中读取同一路径或多个不同路径内的 PDF 文件的绝佳解决方案,因为它提供了高性能和许多功能,使开发 PDF 变得非常容易。 其语法简单明了,对用户友好。 其 API 可让开发人员快速编写项目所需的代码。
探索 IronPDF 许可选项 计划起价仅为 $749,使预算有限的人也能够提取内容。 总的来说,IronPDF 为任何希望在 Java 应用编程中使用 PDF 的 Java 开发人员提供了一个极佳的选择。