PYTHON用IRONPDFの使用

Python PdfWriter(コード例チュートリアル)

更新済み 12月 24, 2023
共有:

イントロダクション

IronPDF は、Python開発者向けの純粋なPython PDFファイルオブジェクトライブラリです PDFファイルを作成する アプリケーション内でPDFファイルを操作または操作する。 IronPDFは、そのシンプルさと多用途性で際立っており、自動化されたPDF作成やソフトウェアシステムへのPDF生成の統合を必要とするタスクに最適な選択肢です。

このガイドでは、IronPDF(純粋なPython PDFライブラリ)を使用して、PDFファイルやPDFページ属性を作成し、PDFファイルを読み取る方法を探ります。 以下に例と実用的なコードスニペットを含めますので、IronPDF for PythonのPdfWriterを使用してPythonプロジェクトでPDFファイルを書き込み、新しいPDFページを作成する方法について実践的な理解を深めることができます。

IronPDFの設定

インストール

IronPDFを使用開始するには、Pythonパッケージインデックス経由でインストールする必要があります。 ターミナルで次のコマンドを実行してください。

 `pip install ironpdf`

PDFファイルの作成とPDFファイルの操作

新しいPDFの作成

IronPDFは、プロセスを簡素化します 新しいPDFファイルを作成する 既存のPDFの編集も行う。 それは、ユーザーパスワードなどのさまざまな要素を含む複雑なドキュメントや単純な1ページPDFであっても、ドキュメントを生成するための直感的なインターフェースを提供します。 この機能は、レポート生成、請求書作成などのタスクにとって不可欠です。

from ironpdf import *     License.LicenseKey = "Your-License-Key"
# Set a log path
Logger.EnableDebugging = True
Logger.LogFilePath = "Custom.log"
Logger.LoggingMode = Logger.LoggingModes.All
html = """
<html>
   <head>
      <title>IronPDF Python!</title>
      <link rel='stylesheet' href='assets/style.css'>
   </head>
   <body>
      <h1>Its' IronPDF World!!</h1>
      <a href='https://ironpdf.com/python/'><img src='assets/logo.png' /></a>
   </body>
</html>
"""
renderer = ChromePdfRenderer()
pdf = renderer.RenderHtmlAsPdf(html)
pdf.SaveAs("New PDF File.pdf")
PYTHON

Python PdfWriter(コード例チュートリアル):図1 - 出力ファイル

PDFファイルの結合

IronPDFは、複数のPDFファイルを一つに結合する作業を簡単にします。 この機能は、様々なレポートの集約、スキャンした文書の編成、または関連する情報の整理に役立ちます。 例えば、複数のソースから包括的なレポートを作成する際や、一連の文書を単一のファイルとして提示する必要がある場合に、PDFファイルを結合する必要があるかもしれません。

from ironpdf import *     License.LicenseKey = "Your-License-Key"
# Set a log path
Logger.EnableDebugging = True
Logger.LogFilePath = "Custom.log"
Logger.LoggingMode = Logger.LoggingModes.All
pdfOne = PdfDocument("Report First.pdf")
pdfTwo = PdfDocument("Report Second.pdf")
merged = PdfDocument.Merge(pdfOne, pdfTwo)
merged.SaveAs("Merged.pdf")
PYTHON

既存のPDFファイルを新しいPDFファイルに統合する機能は、データサイエンスの分野でも役立ちます。統合されたPDFドキュメントは、AIモジュールのトレーニングのためのデータセットとして利用できるからです。 IronPDFはこのタスクを容易に処理し、元のドキュメントの各ページの整合性とフォーマットを維持することで、シームレスで一貫したPDFファイルとして出力します。

Python PdfWriter(パイソン PdfWriter) (コード例チュートリアル): 図2 - 結合されたPDF出力

単一のPDFを分割

逆にIronPDFは、既存のPDFファイルを複数の新しいファイルに分割することにも優れています。 この機能は、大規模なPDFドキュメントから特定のセクションを抽出する必要がある場合や、ドキュメントをより管理しやすい小さな部分に分割する際に便利です。

from ironpdf import *     License.LicenseKey = "Your-License-Key"
# Set a log path
Logger.EnableDebugging = True
Logger.LogFilePath = "Custom.log"
Logger.LoggingMode = Logger.LoggingModes.All
pdf = PdfDocument("Report.pdf")
# take the first page
page1doc = pdf.CopyPage(0)
page1doc.SaveAs("Split1.pdf")
PYTHON

たとえば、大規模なレポートから特定のPDFページを分離したり、本の異なる章から個別のドキュメントを作成したりする場合があります。 IronPDFを使用すると、必要に応じて複数のページを選択して新しいPDFファイルに変換することができ、PDFコンテンツを必要に応じて操作および管理することができます。

Python PdfWriter(コードサンプルトutorial):図3 - PDF出力の分割

セキュリティ機能の実装

機密情報や重要な情報を扱うとき、PDFドキュメントのセキュリティを確保することが最優先事項となります。 IronPDFは、ユーザーパスワード保護および暗号化を含む強力なセキュリティ機能を提供することで、このニーズに対処します。 これにより、PDFファイルが安全に保たれ、許可されたユーザーのみがアクセスできるようになります。

from ironpdf import *     License.LicenseKey = "Your-License-Key"
# Set a log path
Logger.EnableDebugging = True
Logger.LogFilePath = "Custom.log"
Logger.LoggingMode = Logger.LoggingModes.All
pdf = PdfDocument("Report.pdf")
# The following code makes a PDF read only and will disallow copy & paste and printing
pdf.SecuritySettings.RemovePasswordsAndEncryption()
pdf.SecuritySettings.MakePdfDocumentReadOnly("secret-key")
pdf.SecuritySettings.AllowUserAnnotations = False
pdf.SecuritySettings.AllowUserCopyPasteContent = False
pdf.SecuritySettings.AllowUserFormData = False
pdf.SecuritySettings.AllowUserPrinting = PdfPrintSecurity.FullPrintRights
# Change or set the document encryption password
pdf.SecuritySettings.OwnerPassword = "top-secret"  # password to edit the PDF
pdf.SecuritySettings.UserPassword = "sharable"  # password to open the PDF
pdf.SaveAs("secured.pdf")
PYTHON

ユーザーパスワードを実装することで、PDFドキュメントを閲覧または編集できる人を制御できます。 暗号化オプションは追加のセキュリティ層を提供し、不正アクセスからデータを守るため、IronPDF を使用して機密情報をPDF形式で管理する際に信頼される選択肢となります。

PDFからテキストを抽出

IronPDFのもう一つの重要な機能は、PDFドキュメントからテキストを抽出する能力です。 この機能は、データの取得、コンテンツの分析、あるいは既存のPDFから新しいドキュメントへのテキストコンテンツの再利用に特に有用です。

from ironpdf import *     License.LicenseKey = "Your-License-Key"
# Set a log path
Logger.EnableDebugging = True
Logger.LogFilePath = "Custom.log"
Logger.LoggingMode = Logger.LoggingModes.All
pdf = PdfDocument("Report.pdf")
# Extract text from PDF document
allText = pdf.ExtractAllText()
# Extract text from specific page in the document
specificPage = pdf.ExtractTextFromPage(3)
PYTHON

データ分析のためにデータを抽出する場合、大きな文書内で特定の情報を検索する場合、またはPDFからテキストファイルへコンテンツを変換してさらなる処理を行う場合、IronPDFはそれを簡単かつ効率的に行います。 このライブラリは、抽出されたテキストが元の書式や構造を維持するように保証しており、特定のニーズに対して即座に使用可能です。

ドキュメント情報の管理

PDFの効率的な管理には、その内容を超える要素が含まれます。 IronPDFは、著者名、文書タイトル、作成日などの文書メタデータおよびプロパティを効果的に管理することができます。 この機能は、特に文書の出所やメタデータが重要な環境において、PDF文書の整理とカタログ化に不可欠です。

from ironpdf import *     License.LicenseKey = "Your-License-Key"
# Set a log path
Logger.EnableDebugging = True
Logger.LogFilePath = "Custom.log"
Logger.LoggingMode = Logger.LoggingModes.All
# Load an existing PDF or create a new one
pdf = PdfDocument("Report.pdf")
# Edit file metadata
pdf.MetaData.Author = "Satoshi Nakamoto"
pdf.MetaData.Keywords = "SEO, Friendly"
pdf.MetaData.ModifiedDate = Now()
pdf.SaveAs("MetaData Updated.pdf")
PYTHON

例えば、学術や企業の環境において、文書の作成日や作成者を追跡することは、記録保持や文書の検索目的のために不可欠となる場合があります。 IronPDFはこの情報の管理を簡単にし、Pythonアプリケーション内でドキュメント情報を処理および更新するための効率的な方法を提供します。

結論

Python PdfWriter(パイソン PdfWriter) (コード例チュートリアル): 図4 - ライセンス

このチュートリアルでは、IronPDF for Python を使用したPDF操作の基本について説明しました。 新しいPDFファイルの作成から既存のファイルの結合やセキュリティ機能の追加まで、IronPDFはあらゆるPython開発者にとって汎用性の高いツールです。

IronPDF for Pythonは 無料試用 その機能を探索するためのユーザーへ。 試用期間後も使用を続けるには、ライセンスは$749から始まります。 この価格設定により、開発者はプロジェクトでIronPDFの全機能を活用できます。

< 以前
PythonでPDFファイルにウォーターマークを付ける方法
次へ >
PythonでスキャンされたPDFからテキストを抽出する方法

準備はできましたか? バージョン: 2024.9 新発売

無料 pip インストール View Licenses >