将 Python PDF 转换为图像文件

This article was translated from English: Does it need improvement?
Translated
View the article in English

1.导言

将PDF页面或文档转换为图像文件,例如JPEG、PNG或TIFF,在软件行业中具有多种用途。 在某些情况下,您可能需要将PDF文件中特定页面的图像表示用于不同的上下文。 经常对每一页进行截图往往是不切实际的。 然而,在处理涉及加载和将PDF页面转换为图像文件以便进一步使用的Python项目时,传统的Python代码则显得力不从心。 这就是IronPDF for Python该功能可实现无缝、高效的 PDF 到图像转换。

2. IronPDF for Python

IronPDFIronPDF for Python提供了一系列功能,从创建和管理PDF文档到在不需要Adobe Acrobat的情况下修改它们。 使用IronPDF for Python,开发者可以轻松生成PDF文件,加入自定义的页眉和页脚,实施安全措施如密码和加密,甚至处理附件和签名。 该软件包旨在提供最佳性能,拥有多线程和异步支持等功能。

在接下来的部分中,我们将探讨使用Python将PDF页面转换为JPEG、JPG或PNG等流行图像格式的过程。

3. 使用IronPDF for Python将PDF文件转换为图像

要将 PDF 文档转换为图像,您可以使用 IronPDF for Python 提供的 RasterizeToImageFiles 方法。 此方法允许您从PDF文档生成图像文件,例如JPEG。 星号(*)方法中的符号代表页码,从1开始,并将相应替换。

如果输出图像看起来模糊,您可以考虑提高DPI(每英寸点数)值。 然而,请注意这可能导致渲染时间变长。

IronPDF for Python 提供的不仅仅是PDF到图像的转换。 它还允许您直接从URL和HTML源创建图像。

3.1. 将PDF文档转换为图片

以下示例展示了如何将整个PDF文档转换为图片。

from ironpdf import *

pdf = PdfDocument.FromFile("my-content.pdf")

# Extract all pages to a folder as image files
pdf.RasterizeToImageFiles("assets/images/*.png",DPI=96)
PYTHON

在下面的示例中,输出图像将保存在项目中的“assets/images”文件夹内。 在运行程序之前,请确保您已经创建了这个文件夹。

图像文件将从1开始命名,并且每增加一页PDF文档,文件名就增加一。

Python PDF 转图像

将 PDF 转换为图像输出

3.2. 将URL转换为PDF和PDF转换为图片

使用IronPDF for Python,您可以直接将HTML转换为PDF,然后将生成的PDF的每一页转换为图像。

对于即将到来的示例,让我们考虑亚马逊网站。以下程序将把 Amazon.com 的一个特定页面渲染成 PDF,然后将 PDF 的每一页保存为“assets/images”文件夹中的单独图片。

from ironpdf import *

# Instantiate Renderer
renderer = ChromePdfRenderer()

# Create a PDF from a URL or local file path
pdf = renderer.RenderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20")

# Extract all pages to a folder as image files
pdf.RasterizeToImageFiles("assets/images/*.png",DPI=96)
PYTHON
Python PDF 转图像

将 PDF 转换为图像输出

为了调整从前一个示例生成的图像的大小,您可以通过设置ImageMaxWidth和ImageMaxHeight参数来指定所需的宽度和高度。 这些参数以像素为单位进行测量。

在设置尺寸时,需要注意的是,页面的纵横比会被保持,并考虑高度参数。

pdf.RasterizeToImageFiles("assets/images/*.png", ImageMaxWidth=500, ImageMaxHeight=500, DPI=200)
PYTHON

结论

在本指南中,我们探讨了使用IronPDF for Python将PDF转换为图片的过程。 从IronPDF获得的结果图像包括页码,如前例所示。 IronPDF支持多种图像格式,包括JPEG、JPG、TIFF等。

使用IronPDF的优势之一是能够根据您的具体需求自定义图像分辨率。 有关 IronPDF for Python 的更多信息以及访问使用 Python 处理 PDF 的其他指南,请访问以下内容链接. 要更深入了解将PDF转换为图像的主题,您可以参考这个链接.

请注意,虽然 IronPDF for Python 用于开发目的是免费的,但商业使用需要购买许可证。 有关许可条款的详细信息,请访问链接.

*下载软件产品。