如何在Python中将PDF转换为图像 | IronPDF

Python PDF 到图像的转换

This article was translated from English: Does it need improvement?
Translated
View the article in English

IronPDF for Python 能够使用 RasterizeToImageFiles 方法将 PDF 文档无缝转换为 JPEG、PNG 和 TIFF 等图像格式,并可自定义 DPI 和尺寸以获得最佳图像质量。 该功能对于在 Python 应用程序中创建缩略图、预览或从 PDF 文档中提取可视内容至关重要。

快速入门:使用 Python 将 PDF 转换为图像

  1. 安装IronPDF:pip install ironpdf
  2. 加载您的 PDF 文档:pdf = PdfDocument.FromFile("my-content.pdf")
  3. Convert to images: pdf.RasterizeToImageFiles("assets/images/*.png", DPI=96)
  4. 使用 DPI 参数自定义质量(数值越高,质量越好)
  5. 使用 ImageMaxWidthImageMaxHeight 参数设置尺寸

为什么开发人员需要将 PDF 转换为图像?

将 PDF 页面转换为 JPEG、PNG 或 TIFF 等图像文件在软件开发中有多种用途。 常见的用例包括:

  • Web 预览生成:为网站上显示的 PDF 文档创建缩略图
  • 文档处理:为机器学习或 OCR 应用程序提取可视内容
  • 报告生成:将 PDF 页面作为图像包含在其他文档格式中
  • 档案系统:与原始文档一起存储可视化表示法

为每一页截图是不切实际的,尤其是对于多页文档或自动化工作流程。 传统的 Python 代码缺乏内置的 PDF 到图像转换功能。 IronPDF for Python 为这些场景提供高效、自动的 PDF 到图片转换。

什么是 IronPDF for Python 及其主要功能?

IronPDF for Python 提供了全面的 PDF 功能,从创建和管理文档到无需 Adobe Acrobat 即可修改文档。 开发人员可以生成 PDF 文件、添加自定义页眉和页脚、实施安全措施以及处理附件和签名。 该软件包支持多线程和async操作,可实现最佳性能。

主要特点包括

以下部分将演示使用 Python 将 PDF 页面转换为 JPEG、JPG 或 PNG 等常用图像格式。

如何使用 IronPDF 将 PDF 文件转换为图像?

要将 PDF 文档转换为图像,请使用IronPDF for Python 提供的 RasterizeToImageFiles 方法。 此方法可从 PDF 文档生成图像文件。 星号 (*) 代表页码,从 1 开始。

如果输出图像模糊,请增加 DPI(每英寸点数)值。 请注意,DPI 值越高,渲染时间越长。 标准 DPI 值为:

  • 72 DPI:屏幕分辨率(处理速度快,文件尺寸小)
  • 96 DPI:标准网页质量
  • 150 DPI:良好的打印质量
  • 300 DPI:高质量打印(文件较大,处理速度较慢)

IronPDF for Python 不仅支持 PDF 到图片的转换。 它还可以直接从 URL 和 HTML 源创建图像。

如何将整个 PDF 文档转换为图像?

以下示例将整个 PDF 文档转换为图像。 这种方法适用于将所有页面提取为单独的图像文件,用于批处理或存档。

```python:title=将 PDF 转换为图像 从 IronPdf 导入 PdfDocument

pdf = PdfDocument.FromFile("my-content.pdf")

pdf.RasterizeToImageFiles("assets/images/*.png", DPI=96)


输出图像保存到项目中的 "assets/images "文件夹。 在运行程序前创建此文件夹。 图像文件从 1 开始编号,每 PDF 页递增。

<div class="content-img-align-center">  
<div class="center-image-wrapper">  
<a rel="nofollow" href="/static-assets/ironpdf-java/howto/java-pdf-to-image/java-pdf-to-image-5.webp" target="_blank"><img src="/static-assets/ironpdf-java/howto/java-pdf-to-image/java-pdf-to-image-5.webp" alt="File explorer showing 11 PNG images (1.png-11.png) generated from PDF conversion using IronPDF Python library" class="img-responsive add-shadow"></a>  
    <p class="content__image-caption">将 PDF 转换为图像输出</p>  
</div>  
</div>

### 如何将 URL 转换为 PDF,然后再转换为图像?

IronPDF for Python 可 [直接将 HTML 转换为 PDF](https://ironpdf.com/python/tutorials/html-to-pdf/) 并将生成的每个 PDF 页面转换为图像。 该功能可创建网页的可视化档案,或为基于网络的文档生成预览图像。

以下示例将 Amazon.com 的一个页面渲染为 PDF 格式,并将每个页面作为单独的图像保存在 "assets/images "文件夹中。

```python
from ironpdf import ChromePdfRenderer

# Instantiate the PDF renderer
renderer = ChromePdfRenderer()

# Create a PDF from a URL or local file path
pdf = renderer.RenderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20")

# 将所有页面以图像文件的形式提取到文件夹中
pdf.RasterizeToImageFiles("assets/images/*.png", DPI=96)
File explorer showing 5 PNG files (1.png-5.png) created from PDF conversion using IronPDF Python library

将 PDF 转换为图像输出

要调整图像大小,请使用 ImageMaxWidthImageMaxHeight 参数指定所需的宽度和高度(以像素为单位)。 该功能可创建缩略图或确保图片符合特定的布局限制。

根据高度参数保持长宽比,防止图像拉伸或扭曲。

# Generate images with specified maximum dimensions and DPI
pdf.RasterizeToImageFiles("assets/images/*.png", ImageMaxWidth=500, ImageMaxHeight=500, DPI=200)
# Generate images with specified maximum dimensions and DPI
pdf.RasterizeToImageFiles("assets/images/*.png", ImageMaxWidth=500, ImageMaxHeight=500, DPI=200)
PYTHON

将 PDF 转换为图像后的下一步是什么?

本指南涉及使用 IronPDF for Python 将 PDF 转换为图像。 如示例所示,所生成的图像包括页码。 IronPDF 支持各种图像格式,包括 JPEG、JPG、TIFF 等。

IronPDF 允许根据具体要求定制图像分辨率。 对于高级图像处理需求,请考虑

  • 批量处理:在一次操作中转换多个 PDF
  • 选择性页面转换:仅将特定页面提取为图像
  • 特定格式选项:针对 JPEG 质量或 TIFF 压缩使用特定于格式的参数
  • 与图像库集成:结合 PIL 或 OpenCV 进行进一步图像处理

了解更多信息,请参阅 IronPDF for Python 入门指南,其中包括 使用 Python 处理 PDF 的其他指南

请注意延伸阅读:将 PDF 转换为图像

IronPDF for Python 可免费用于开发目的。 商业用途需要许可证。 有关详细的许可信息,请访问 IronPDF for Python 许可页面

下载软件产品。

常见问题解答

如何用 Python 将 PDF 转换为图像格式?

IronPDF for Python 提供了 RasterizeToImageFiles 方法,可将 PDF 文档转换为 JPEG、PNG 和 TIFF 等图像格式。只需使用 PdfDocument.FromFile() 加载 PDF 文件,然后调用 RasterizeToImageFiles() 并设置所需的输出格式和质量即可。

转换 PDF 时支持哪些图像格式?

IronPDF 支持转换为主要图像格式,包括 JPEG、PNG 和 TIFF。您可以通过 RasterizeToImageFiles 方法中的文件扩展名来指定格式,如 PNG 为 "*.png",JPEG 格式为 "*.jpg"。

如何控制转换后图像的质量?

IronPDF 允许您通过 RasterizeToImageFiles 方法中的 DPI 参数控制图像质量。较高的 DPI 值(如 150 或 300)可生成质量更好的图像,而较低的值(如 96)可生成适合网页预览的较小文件大小。

能否为转换后的图像设置自定义尺寸?

是的,IronPDF 在 RasterizeToImageFiles 方法中提供了 ImageMaxWidth 和 ImageMaxHeight 参数,用于为转换后的图像设置自定义尺寸,使您可以根据应用程序的需要创建缩略图或特定尺寸的图像。

是否可以通过 PDF 将网页转换为图像?

当然可以!IronPDF 可以首先使用 RenderUrlAsPdf 方法将 URL 转换为 PDF,然后再将这些 PDF 转换为图像。通过这两个步骤,您可以将网页内容截取为高质量的图像,以便存档或处理。

PDF 转换为图像的常见用例有哪些?

IronPDF 的 PDF 到图像转换通常用于生成网页预览、为文档管理系统创建缩略图、为 OCR 应用程序提取可视内容,以及将 PDF 页面作为图像包含在报告或其他文档格式中。

转换是否支持多页 PDF?

是的,IronPDF 的 RasterizeToImageFiles 方法可自动处理多页 PDF,将每页转换为单独的图像文件并自动编号,非常适合批处理和自动化工作流。

大规模转换有哪些性能特点?

IronPDF 支持多线程和异步操作,可在将多个 PDF 或大型文档转换为图像时获得最佳性能,即使在大容量应用中也能确保高效处理。

Curtis Chau
技术作家

Curtis Chau 拥有卡尔顿大学的计算机科学学士学位,专注于前端开发,精通 Node.js、TypeScript、JavaScript 和 React。他热衷于打造直观且美观的用户界面,喜欢使用现代框架并创建结构良好、视觉吸引力强的手册。

除了开发之外,Curtis 对物联网 (IoT) 有浓厚的兴趣,探索将硬件和软件集成的新方法。在空闲时间,他喜欢玩游戏和构建 Discord 机器人,将他对技术的热爱与创造力相结合。

准备开始了吗?
版本: 2026.3 刚刚发布
Still Scrolling Icon

还在滚动吗?

想快速获得证据?
运行示例看着你的HTML代码变成PDF文件。