使用IRONPDF FOR JAVA

如何在Java中读取PDF文件

乔尔迪·巴尔迪亚
乔尔迪·巴尔迪亚
2023年三月19日
更新 2024年八月25日
分享:

用 Java 阅读 PDF 文档是任何项目(从商业应用到数据分析)不可或缺的一部分。 有了 IronPDF for Java 库,在 Java 项目中集成 PDF 处理功能变得前所未有的简单。

IronPDF:导入 Java PDF 库

IrotPDF Java PDF库概述是软件开发人员的完美解决方案,他们需要快速从HTML生成高质量的捕获就绪PDF。 该库还提供强大的文档操作工具,能够动态控制IronPDF中的页面布局和格式化、内容和格式。

让我们看看如何使用 IronPDF for Java 库在 Java 程序中读取存储在某个路径下的 PDF 文件。

使用 IronPDF 阅读 PDFs

第一步是使用Maven安装IronPDF,更多详情可以在IronPDF安装指南中找到。

在 Maven 中安装 IronPDF

以下是在 Maven 项目中安装 IronPDF 的步骤:

  1. 在您喜欢的集成开发环境中打开您的 Maven 项目。

  2. pom.xml文件的dependencies部分添加IronPDF库依赖。
    :ProductInstall
  1. 保存pom.xml文件,然后让Maven下载并安装IronPDF库。

    安装完成后,您应该可以在项目中导入并使用 IronPDF 的以下类和 Apache Tika 解析器。

Java 代码阅读 PDF 文档

以下是代码,您可以使用 IronPdf 库读取有或无表格边界的新文件。

import com.ironsoftware.ironpdf.*;
import java.io.IOException;
import java.nio.file.Paths;

public class Test {
    public static void main(String[] args) throws IOException {
        PdfDocument pdf = PdfDocument.fromFile(Paths.get("C:\\sample.pdf"));  
        String text = pdf.extractAllText();
        System.out.println(text);
    }
}
JAVA

在这个程序中,IronPDF中的PdfDocument类用于读取PDF文件的内容。程序的第一行从IronPDF库中导入所需的类。 第二行从 Java 标准库中导入IOException类。

该程序定义了一个名为Test的公共类。 在类中,有一个名为mainpublic static方法,该方法以字符串数组作为参数。

main 方法使用 PdfDocument 类中的 fromFile method of PdfDocument in IronPDF 方法来加载位于 "C:\sample.pdf" 的PDF文件。 此方法返回一个PdfDocument对象,表示PDF文件。

一旦加载了PDF文件,程序调用[IronPDF中PdfDocument的extractAllText方法](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllText()),从PDF文件中提取所有文本。此方法返回一个包含PDF文件中所有文本的String

提取的文本随后存储在名为“text”的String变量中。 该变量可用于处理或显示 PDF 文件的内容。

最后,程序使用System.out.println方法将提取的文本打印到控制台。

如何在Java中读取PDF文件,图1:程序输出

程序输出

结论

IronPDF for Java 是在 Java 中读取同一路径或多个不同路径内的 PDF 文件的绝佳解决方案,因为它提供了高性能和许多功能,使开发 PDF 变得非常容易。 其语法简单明了,对用户友好。 其 API 可让开发人员快速编写项目所需的代码。

探索 IronPDF 许可选项 计划起价仅为 $749,使预算有限的人也能够提取内容。 总的来说,IronPDF 为任何希望在 Java 应用编程中使用 PDF 的 Java 开发人员提供了一个极佳的选择。

乔尔迪·巴尔迪亚
乔尔迪·巴尔迪亚
软件工程师
Jordi 最擅长 Python、C# 和 C++,当他不在 Iron Software 运用技能时,他会进行游戏编程。作为产品测试、产品开发和研究的负责人之一,Jordi 为持续的产品改进增添了极大的价值。多样化的经验让他充满挑战和参与感,他说这是他在 Iron Software 工作中最喜欢的方面之一。Jordi 在佛罗里达州迈阿密长大,并在佛罗里达大学学习计算机科学和统计学。
< 前一页
如何在 Java 中向 PDF 添加数字签名
下一步 >
如何在Java中旋转PDF文件

通过Maven安装

版本:2025.3.6

<dependency>
  <groupId>com.ironsoftware</groupId>
  <artifactId>ironpdf</artifactId>
  <version>2025.3.6</version>
</dependency>