在实际环境中测试
在生产中测试无水印。
随时随地为您服务。
本文将探讨如何创建PDF阅读器,以在软件应用程序中以编程方式打开PDF文件。 为了有效地完成这项任务,IronPDF for Java 就是这样一个系统库,它可以帮助在 Java 程序中使用文件名打开和读取 PDF 文件。
"(《世界人权宣言》)IronPDF for Java 库构建在已经成功的.NET框架之上。 这使得IronPDF相比于其他类库如Apache PDFBox,在处理PDF文档时成为一个多功能的工具。 它提供了提取和解析内容,加载文本,并加载图像。 它还提供了自定义 PDF 页面选项,例如页面布局, 页边距,页眉和页脚, 页面方向以及更多。
除此之外,IronPDF还支持将其他文件格式转换为PDF,保护PDF密码,加数字签名,合并和拆分PDF文档。
要使用 IronPDF 创建 Java PDF 阅读器,必须确保在计算机上安装以下组件:
JDK - Java开发工具包是构建和运行Java程序所需的。 如果尚未安装,请从以下位置下载甲骨文网站.
IDE - 集成开发环境是一种帮助编写、编辑和调试程序的软件。 下载任何 Java IDE,如 Eclipse、NetBeans 和 IntelliJ。
Maven - Maven 是一种自动化工具,可以帮助从中央仓库下载库。 从官网下载Apache Maven 网站.
pom.xml
文件中包含 IronPDF 工件以及 slf4j 依赖项,如下面的示例所示:<dependency>
<groupId>com.ironsoftware</groupId>
<artifactId>com.ironsoftware</artifactId>
<version>2024.11.4</version>
</dependency>
首先,在 Java 源文件顶部添加以下代码以引用 IronPDF 所需的所有方法。 在此示例中,导入 org 是可选的。
import com.ironsoftware.ironpdf.*;
接下来,配置IronPDF并使用有效的许可证密钥来使用其方法。 在主方法中调用 setLicenseKey
方法。
License.setLicenseKey("Your license key");
注意: 您可以获取免费的试用许可证密钥来创建、读取和打印PDF。
至阅读 PDF 文件此外,必须有 PDF 文件,或者可以创建 PDF 文件。 这篇文章将使用一个已经创建的PDF文件。该代码非常简单,是一个两步的过程来从文档中提取文本。
PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractAllText();
System.out.println(text);
在上面的代码中,fromFile
打开PDF文档。 Paths.get
方法获取文件的目录,并准备从文件中提取内容。然后,[提取所有文本
](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllText())读取文档中的所有文本。
输出如下:
读取PDF文本输出
IronPDF 还可以读取 PDF 中特定页面的内容。 extractTextFromPage
方法使用 PageSelection
对象来接受页面范围(s)从中读取文本。
在以下示例中,文本是从PDF文档的第二页提取的。 PageSelection.singlePage
需要提取的页面索引。
PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractTextFromPage(PageSelection.singlePage(1));
System.out.println(text);
读取PDF文本输出
在 PageSelection
类中,其他可以用于从各种页面提取文本的方法包括:[第一页](/java/object-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#lastPage()), [最后一页](/java/object-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#firstPage()), 页面范围和[所有页面](/java/object-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#allPages()).
还可以从 HTML 文件或 URL 生成的新 PDF 文件中执行文本搜索。 以下示例代码从 URL 生成 PDF,并提取网站上的所有文本。
PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://unsplash.com/");
String text = pdf.extractAllText();
System.out.println("Text extracted from the website: " + text);
从新文件读取
IronPDF 还可用于提取图像从PDF文件。
完整代码如下:
import com.ironsoftware.ironpdf.License;
import com.ironsoftware.ironpdf.PdfDocument;
import com.ironsoftware.ironpdf.edit.PageSelection;
import java.io.IOException;
import java.nio.file.Paths;
public class Main {
public static void main(String[] args) throws IOException {
License.setLicenseKey("YOUR LICENSE KEY HERE");
PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractTextFromPage(PageSelection.singlePage(1));
System.out.println(text);
pdf = PdfDocument.renderUrlAsPdf("https://unsplash.com/");
text = pdf.extractAllText();
System.out.println("Text extracted from the website: " + text);
}
}
本文介绍了如何使用 IronPDF 在 Java 中打开和读取 PDF。
IronPdf 可帮助轻松地从 HTML 或 URL 创建 PDF,并从不同的文件格式进行转换。 它还可以帮助快速轻松地完成PDF任务。
试用 IronPDF for30 天免费试用并了解它在生产环境中的表现如何。 探索 IronPDF 的商业许可选项仅从 $749 开始。