PYTHON用IRONPDFの使用

PythonでURLからPDFをダウンロードする方法

更新済み 7月 12, 2023
共有:

1.0 はじめに

ドキュメント共有に関しては、Adobeが作成したPortable Document Format (PDF) は、テキストが豊富で美しいコンテンツの完全性を保護するために重要です。 ほとんどの場合、オンラインPDFファイルにアクセスするには特定のプログラムが必要です。 最近では、多くの重要なデジタル出版物がPDFファイルを必要としています。 多くの企業は、プロフェッショナルな文書や請求書を作成するためにPDFファイルを利用しています。 特定の顧客のニーズに対応するために、開発者はしばしばライブラリを使用してPDFドキュメントを作成します。 現代ライブラリの登場により、PDFの作成が容易になりました。 PDFを作成するプロジェクトに適切なライブラリを選択する際には、シームレスな統合と最適なパフォーマンスを確保するために、ビルド、読み取り、および変換機能を検討することが重要です。 この記事では、IronPDF Pythonライブラリを使用してPDFを作成します。

2.0 IronPDF

Pythonは、他の言語よりもプログラマーにとって非常に動的な言語であり、開発者がグラフィカルユーザーインターフェイスを迅速かつ容易に設計することを可能にします。 したがって、IronPDFライブラリをPythonに含めるのは簡単です。 これは、PyQt、wxWidgets、Kivy、その他多くのパッケージやライブラリのような多くの組み込みツールを備えており、完全に機能するGUIを迅速かつ安全に構築するために使用できます。

IronPDFは、Pythonによるウェブ開発とデザインに非常に効果的なライブラリです。 これは主に、Django、Flask、Pyramidなど、多くのPythonウェブ開発パラダイムが利用可能であるためです。 多くのウェブサイトおよびオンラインサービス、たとえばReddit、Mozilla、Spotifyがこれらのフレームワークを利用しています。

  • PDFファイルは、HTML、HTML5、ASP、PHPサイト、その他のソースから作成できます。 我々は、画像ファイルだけでなくHTMLファイルもPDFに変換する能力を持っています。
  • IronPDFを使用してインタラクティブなPDFドキュメントを作成できます。 インタラクティブフォームを入力して送信したり、PDFファイルを結合および分割したり、PDFファイルからテキストや画像を抽出したり、PDFファイル内の特定の単語を検索したり、PDFページを画像にラスタライズしたり、PDFをHTMLに変換したり、PDFファイルを印刷したりできます。
  • IronPDFは、URLからドキュメントを生成することができます。 さらに、ユーザーエージェント、プロキシ、クッキー、HTTPヘッダー、カスタムネットワークログイン資格情報、フォーム変数、およびHTMLログインフォームの背後でログインするユーザーエージェントをサポートします。
  • IronPDFプログラムを使用してPDFファイルを検査し、注釈を追加することができます。
  • IronPDFはドキュメントから画像を抽出するために使用できます。
  • IronPDFを使用すると、ドキュメントにヘッダー、フッター、テキスト、写真、ブックマーク、ウォーターマークなどを追加できます。
  • IronPDFを使用すると、新しいドキュメントまたは既存のドキュメントでページを結合および分割できます。
  • Acrobatビューアを使用せずにドキュメントをPDFオブジェクトに変換することができます。
  • PDFドキュメントは、IronPDFを使用してCSSファイルから作成できます。
  • ドキュメントは、メディアタイプ指定付きのCSSファイルを使用して作成できます。

3.0 Pythonの設定

環境を設定する

Pythonがコンピュータにインストールされていることを確認してください。 最新バージョンのPythonをお使いのオペレーティングシステムにダウンロードしてインストールするには、公式Pythonサイトにアクセスしてください。 ウェブサイト. Pythonがインストールされたら、プロジェクトの依存関係を分離するために仮想環境を設定してください。 venvモジュールを使用して仮想環境を作成および管理すると、変換プロジェクトのためのクリーンで独立した作業スペースが提供されます。

PyCharmでの新規プロジェクト

このデモンストレーションでは、Python開発用のIDEであるPyCharmを使用します。

PyCharm IDEを開いた後、以下の画像に示されているように「New Project」オプションを選択してください。

PythonでURLからPDFをダウンロードする方法:図1

「新しいプロジェクト」を選択すると、新しいウィンドウが開き、以下の画像に示されているように、プロジェクトの場所とPython環境を指定することができます。

PythonでURLからPDFをダウンロードする方法: 図2

プロジェクトの場所と環境パスを選択した後、「Create」ボタンをクリックして新しいプロジェクトを作成してください。 新しいウィンドウが開き、Pythonファイルにコードを書くことができます。このチュートリアルでは、Python 3.9を使用しています。

URLからPDFをPythonでダウンロードする方法: 図3

3.3 IronPDF Pythonライブラリの要件

IronPDF for Python は基盤技術として .NET 6.0 を利用しています。 したがって、IronPDF Pythonを使用するためには、コンピュータに.NET 6.0ランタイムがインストールされている必要があります。 LinuxおよびMacのユーザーは、このPythonパッケージを使用する前に、Dot NETをインストールする必要があります。 必要なランタイム環境をダウンロードするには、次のリンクをクリックしてください これ.

3.3 IronPDFパッケージのセットアップ

.pdf拡張子のファイルを作成、編集、および開くには、ironpdfパッケージをインストールする必要があります。 PyCharmにパッケージをインストールするには、ターミナルウィンドウを開いて次のコマンドを実行します。

 `pip install ironpdf`

以下のスクリーンショットにあるように、ironpdfパッケージがインストールされています。

URLからPDFをダウンロードする方法 Python: 図4

3.4 IronPDFを使用してURLからPDFを作成する

Pythonを使用して、数行のコードでIronPDFライブラリを使うことによりPDFファイルを簡単に生成することができます。 IronPDFは、追加の依存関係を必要としないスタンドアロンのライブラリです。 強力なChromiumブラウザを利用しており、画像、チャート、テーブルなどを含むURLの正確なダウンロードを可能にします。 以下は、PDFファイルを生成するためのサンプルコードスニペットです:

from ironpdf import *
renderer = ChromePdfRenderer()
pdf = renderer.RenderUrlAsPdf("https://www.google.com/")
pdf.SaveAs("output.pdf")
print('Completed')
PYTHON

提供されたコードでは、最初にIronPDFライブラリをインポートします。 次に、様々なPDFファイル作成プロセスを実行できるChromePdfRendererクラスのインスタンスを作成します。 作成されたオブジェクト「renderer」を使用して、RenderUrlAsPdf関数にアクセスします。 この機能には、PDF形式に変換する必要があるPDFのURLが必要です。 指定されたウェブページからデータをスクレイプし、画像を含むデータを小さなチャンクでダウンロードし、レスポンスをバイナリファイルに書き込みます。最後に、SaveAs 関数を使用して、生成されたPDFファイルをPDF形式でローカルディレクトリに保存することができます。

上記のコードの出力は下の画像に示されています。

PythonでURLからPDFをダウンロードする方法:図5

さらに、IronPDFは.NET Frameworkと共に使用することができます。 IronPDFを.NET Frameworkで使用する方法について詳しく知りたい場合は、クリックしてください これ.

4.0 結論

IronPDFライブラリは、潜在的なリスクを軽減し、データ保護を確保するための強力なセキュリティ対策を提供します。 すべての一般的に使用されているブラウザと互換性があり、特定のブラウザに限定されません。 数行のコードで、プログラマーはIronPDFを使用して効率的にPDFファイルを作成および読み取りできます。 開発者の多様なニーズに対応するために、IronPDFライブラリは、無料の開発者ライセンスや、購入可能な追加の開発ライセンスなど、さまざまなライセンスオプションを提供しています。

Liteパッケージ(価格:$liteLicense)には、永久ライセンス、30日間の返金保証、1年間のソフトウェアサポート、およびアップグレードの可能性が含まれています。 初回購入後、追加費用は発生しません。 これらのライセンスは、プロダクション、ステージング、および開発環境で使用できます。 IronPDFは、特定の時間と再配布の制限付きで無料のライセンスも提供しています。 実際のコンテキストでは、ユーザーはソフトウェアをテストできます 無料試用 透かしなしの期間。 IronPDFのトライアル価格とライセンスに関する詳細情報については、以下をご参照ください。 リンク.

IronPDFをダウンロード そしてお試しください。

< 以前
PythonでPDFから表を抽出する方法
次へ >
PythonでPDFからテキストを抽出する方法

準備はできましたか? バージョン: 2024.9 新発売

無料 pip インストール View Licenses >