将 Python PDF 转换为图像文件

This article was translated from English: Does it need improvement?
Translated
View the article in English

1.导言

在软件行业中,将 PDF 页面或文档转换为 JPEG、PNG 或 TIFF 等图像文件有多种用途。在某些情况下,您可能需要 PDF 文件中特定页面的图像表示,以便在各种情况下使用。对每一页进行截图往往是不切实际的。然而,当在一个 Python 项目中涉及加载 PDF 页面并将其转换为图像文件以便进一步使用时,传统的 Python 代码就显得力不从心了。这正是 IronPDF for Python 发挥作用,实现无缝高效的PDF到图像转换。

2.Python 版 IronPDF

IronPDF IronPDF for Python 提供了一系列功能,从创建和管理 PDF 文档到无需 Adobe Acrobat 即可修改文档。使用 IronPDF for Python,开发人员可以毫不费力地生成 PDF 文件、加入自定义页眉和页脚、实施密码和加密等安全措施,甚至还能处理附件和签名。该软件包专为优化性能而设计,具有多线程和异步支持等功能。

在接下来的章节中,我们将探索使用 Python 将 PDF 页面转换为 JPEG、JPG 或 PNG 等流行图像格式的过程。

3.使用 IronPDF for Python 将 PDF 文件转换为图像

要将 PDF 文档转换为图像,可以使用 IronPDF for Python 提供的 "RasterizeToImageFiles "方法。通过该方法,您可以从 PDF 文档生成 JPEG 等图像文件。星号 (*) 中的符号代表页码,从 1 开始,并将被相应替换。

如果输出的图像显得模糊,可以考虑提高 DPI (每英寸点数) 值。但请注意,这可能会导致渲染时间延长。

IronPDF for Python 提供的不仅仅是 PDF 到图片的转换。它还能让您直接从 URL 和 HTML 源创建图片。

3.1.将 PDF 文档转换为图像

下面的示例演示了如何将整个 PDF 文档转换为图像。

from ironpdf import *

pdf = PdfDocument.FromFile("my-content.pdf")

# Extract all pages to a folder as image files
pdf.RasterizeToImageFiles("assets/images/*.png",DPI=96)
PYTHON

在下面的示例中,输出图像将保存在项目中的 "assets/images "文件夹中。运行程序前,请确保已创建该文件夹。

图像文件将从 1 开始命名,PDF 文档的每一页都将递增。

Python PDF 转图像

将 PDF 转换为图像输出

3.2.将 URL 转换为 PDF 和将 PDF 转换为图像

使用 IronPDF for Python,您可以直接将 HTML 转换为 PDF,并随后将生成的 PDF 的每一页转换为图像。

下面我们以亚马逊网站为例。下面的程序会将 Amazon.com 的一个特定页面渲染为 PDF 格式,然后将 PDF 的每个页面作为单独的图像保存在 "assets/images "文件夹中。

from ironpdf import *

# Instantiate Renderer
renderer = ChromePdfRenderer()

# Create a PDF from a URL or local file path
pdf = renderer.RenderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20")

# Extract all pages to a folder as image files
pdf.RasterizeToImageFiles("assets/images/*.png",DPI=96)
PYTHON
Python PDF 转图像

将 PDF 转换为图像输出

为了调整上一示例中生成的图像的大小,可以通过设置 ImageMaxWidth 和 ImageMaxHeight 参数来指定所需的宽度和高度。这些参数以像素为单位。

在设置尺寸时,需要注意的是,在考虑高度参数的情况下,页面的宽高比将保持不变。

pdf.RasterizeToImageFiles("assets/images/*.png", ImageMaxWidth=500, ImageMaxHeight=500, DPI=200)
PYTHON

结论

在本指南中,我们探索了使用 IronPDF for Python 将 PDF 转换为图像的过程。从 IronPDF 中获得的图像包括页码,如前面的示例所示。IronPDF 支持多种图像格式,包括 JPEG、JPG、TIFF 等。

使用 IronPDF 的优势之一是可以根据您的具体要求自定义图像分辨率。有关 IronPDF for Python 的更多信息,以及使用 Python 处理 PDF 的其他指南,请访问以下网站 链接.要深入了解将 PDF 转换为图像的主题,可以参考以下内容 链接.

请注意,虽然用于开发目的的 IronPDF 是免费的,但用于商业用途则需要许可证。有关许可条款的详细信息,请访问 链接.

*下载 软件产品。