使用IRONPDF FOR PYTHON

如何在Python中从URL下载PDF

发布 2023年七月12日
分享:

1.0 引言

说到文档共享,Adobe 创建的便携式文档格式 (PDF) 对于保持文本丰富、美观的内容的完整性至关重要。在大多数情况下,访问在线 PDF 文件需要特定的程序。如今,许多重要的数字出版物都需要 PDF 文件。许多企业利用 PDF 文件创建专业文档和发票。为了满足客户的特定需求,开发人员经常使用库来创建 PDF 文档。随着现代库的出现,创建 PDF 文件变得更加容易。在为涉及创建 PDF 的项目选择合适的库时,必须考虑构建、读取和转换功能,以确保无缝集成和最佳性能。在本文中,我们将使用 IronPDF Python 库创建 PDF。

2.0 IronPDF

对于程序员来说,Python 是一种比其他语言更具活力的语言,它允许开发人员快速、轻松地设计图形用户界面。因此,在 Python 中包含 IronPDF 库非常简单。Python 自带大量内置工具,如 PyQt、wxWidgets、Kivy 以及许多其他软件包和库,可用于快速安全地构建功能齐全的图形用户界面。

IronPDF 是用 Python 进行网页开发和设计的高效库。这主要是因为有如此多的 Python 网络开发范例可用,如 Django、Flask 和 Pyramid。包括 Reddit、Mozilla 和 Spotify 在内的众多网站和在线服务都使用了这些框架。

  • PDF 文件可以从 HTML、HTML5、ASP、PHP 网站和其他来源创建。我们有能力将图片文件和 HTML 文件转换为 PDF。
  • 使用 IronPDF 可以创建交互式 PDF 文档。您可以填写和提交交互式表单,合并和分割 PDF 文件,从 PDF 文件中提取文本和图像,搜索 PDF 文件中的特定字词,将 PDF 页面光栅化为图像,将 PDF 转换为 HTML,以及打印 PDF 文件。
  • IronPDF 允许从 URL 生成文档。此外,它还支持用户代理、代理、cookies、HTTP 标头、自定义网络登录凭证、表单变量以及在 HTML 登录表单后登录的用户代理。
  • 你可以使用 IronPDF 程序检查和注释 PDF 文件。
  • IronPDF 可用于从文档中提取图像。
  • 使用 IronPDF,您可以为文档添加页眉、页脚、文本、照片、书签、水印等。
  • 使用 IronPDF,您可以合并和拆分新文档或现有文档的页面。
  • 无需使用 Acrobat 浏览器即可将文档转换为 PDF 对象。
  • 使用 IronPDF 可以从 CSS 文件创建 PDF 文档。
  • 可以使用带有媒体类型规范的 CSS 文件创建文档。

3.0 配置 Python

3.1 设置环境

确保计算机上安装了 Python。要为您的操作系统下载并安装最新版本的 Python,请访问 Python 官方网站 网站.安装好 Python 后,设置一个虚拟环境来隔离项目的依赖关系。使用 venv 模块来创建和管理虚拟环境,这将为您的转换项目提供一个干净、独立的工作空间。

3.2 PyCharm 中的新项目

在本演示中,我们将使用 Python 开发的集成开发环境 PyCharm。

打开 PyCharm IDE 后,选择 "新建项目 "选项,如下图所示。

如何用 Python 从 URL 下载 PDF:图 1

选择 "新建项目 "后会打开一个新窗口,允许你指定项目的位置和 Python 环境,如下图所示。

如何用 Python 从 URL 下载 PDF:图 2

选择项目位置和环境路径后,点击 "Create(创建)"按钮创建新项目。此时将打开一个新窗口,您就可以在 Python 文件中编写代码了。本教程使用 Python 3.9。

如何用 Python 从 URL 下载 PDF:图 3

3.3 IronPDF Python 库要求

IronPDF for Python 使用 .NET 6.0 作为基础技术。因此,要使用 IronPDF Python,您的计算机必须安装 .NET 6.0 运行时。Linux 和 Mac 用户在使用此 Python 软件包之前可能需要安装 Dot NET。要下载所需的运行环境,请点击 这里.

3.3 IronPDF 软件包设置

要创建、编辑和打开扩展名为".pdf "的文件,必须安装 ironpdf 软件包。要在 PyCharm 中安装该软件包,请打开终端窗口并运行以下命令:

 pip install ironpdf

从下面的截图中可以看到,"ironpdf "软件包已经安装。

如何用 Python 从 URL 下载 PDF:图 4

3.4 使用 IronPDF 从 URL 创建 PDF

使用 IronPDF 库,只需几行代码就能用 Python 轻松生成 PDF 文件。IronPDF 是一个独立的库,不需要任何额外的依赖项。它使用功能强大的 Chromium 浏览器,能准确下载包含图片、图表、表格等内容的 URL。以下是生成 PDF 文件的示例代码片段:

from ironpdf import *
renderer = ChromePdfRenderer()
pdf = renderer.RenderUrlAsPdf("https://www.google.com/")
pdf.SaveAs("output.pdf")
print('Completed')
PYTHON

在提供的代码中,我们首先导入 IronPDF 库。然后,我们创建一个 ChromePdfRenderer 类的实例,该类允许我们执行各种 PDF 文件创建过程。使用创建的名为 "renderer "的对象,我们访问 "RenderUrlAsPdf "函数。该函数需要将 PDF URL 转换为 PDF 格式。它将从指定的网页中刮取数据,下载包括图像在内的小块数据文件,并将响应写入二进制文件。最后,我们可以使用 SaveAs 函数将生成的 PDF 文件以 PDF 格式保存到本地目录中。

上述代码的输出结果如下图所示。

如何用 Python 从 URL 下载 PDF:图 5

此外,IronPDF 还可用于 .NET Framework。要了解有关在 .NET Framework 中使用 IronPDF 的更多信息,请点击 这里.

4.0 结论

IronPDF 库提供了强大的安全措施,可降低潜在风险并确保数据得到保护。它兼容所有常用浏览器,不局限于特定浏览器。只需几行代码,程序员就能使用 IronPDF 高效地创建和读取 PDF 文件。为了满足开发人员的不同需求,IronPDF 库提供了多种许可选项,包括免费的开发人员许可和可购买的额外开发许可。

售价为"$liteLicense "的精简版套餐包括永久许可证、30 天退款保证、一年软件支持和升级可能性。首次购买后,无需支付其他费用。这些许可证可用于生产、暂存和开发环境。IronPDF 还提供有一定时间和再分发限制的免费许可证。在实际环境中,用户可以通过以下方式测试软件 免费试用 试用期内无水印。有关 IronPDF 试用定价和许可的详细信息,请参阅以下内容 链接.

下载IronPDF 并试一试。

< 前一页
如何在Python中从PDF提取表格
下一步 >
如何在 Python 中从 PDF 提取文本

准备开始了吗? 版本: 2024.9 刚刚发布

免费 pip 安装 查看许可证 >