製品比較

iText7 C#でPDFを読むための代替ソリューション(VS IronPDF)

PDFは、Adobe Acrobat Readerによって作成されたポータブルドキュメント形式であり、インターネット上でデジタル情報を共有するために広く使用されています。 それはデータのフォーマットを保持し、セキュリティ権限の設定やパスワード保護といった機能を提供します。 C#開発者として、あなたのソフトウェアアプリケーションにPDF機能を統合する必要があるシナリオに直面したことがあるかもしれません。 スクラッチから構築するのは、時間がかかり面倒な作業となる可能性があります。 したがって、アプリケーションのパフォーマンス、効果、および効率を考慮すると、ゼロから新しいサービスを作成するか、プリビルトライブラリを使用するかのトレードオフは重要です。

C# 用の PDF ライブラリはいくつかあります。 この記事では、C#でPDFドキュメントを読み取るための最も人気のある2つのPDFライブラリを探ります。

iText ソフトウェア

iText 7、以前はiText 7 Coreとして知られていた、.NET C#およびJavaでPDFドキュメントをプログラムするためのPDFライブラリです。 それはオープンソースライセンス(AGPL)として利用可能で、商業アプリケーション向けにライセンスされることもできます。

iText Coreは、あらゆる方法でPDFを生成・編集する簡単な方法を提供する高レベルAPIです。 iText 7 Core を使えば、PDF ファイルの分割、結合、注釈、フォームへの記入、デジタル署名など、さまざまなことができます。 iText 7は、HTML to PDFコンバーターを提供しています。

IronPDF

IronPDF についてもっと知る は、URL、HTML ファイル、または HTML 文字列から HTML、CSS、および JavaScript から PDF ドキュメントを生成するために使用される .NET および .NET Framework C# および Java API です。 IronPDFは既存のPDFファイルの分割、結合、注釈、電子署名などの操作を可能にします。

IronPDFはPDFファイルを作成、読み込み、編集するための50以上の機能を備えています。 Adobe Acrobat Readerで高品質でピクセルパーフェクトなプロフェッショナルPDFファイルを提供する必要がある場合は、スピード、使いやすさ、正確さを優先します。 APIは十分に文書化されており、多くのサンプルソースコードがそのコード例ページにあります。

コンソールアプリケーションを作成する

最初にアプリケーションを作成するために、Visual Studio 2022 IDEを使用します。 Visual StudioはC#開発の公式IDEであり、インストールしておく必要があります。 インストールされていない場合は、Microsoft Visual Studioのウェブサイトからダウンロードできます。

次の手順で「DemoApp」という新しいプロジェクトを作成します。

  1. Visual Studio を開き、「Create a New Project」をクリックしてください。

    Itext7 C#でPDFを読む代替手段(VS IronPDF)図1 - 新しいプロジェクト

  2. 「コンソールアプリケーション」を選択し、「次へ」をクリックします。

    Itext7 C#でPDFを読む代替案(VS IronPDF)図2

  3. プロジェクトの名前を設定してください。

    Itext7 で PDF を C# で読み取る代替案 (VS IronPDF) 図 3

  4. .NETバージョンを選択してください。 安定版の.NET 6.0を選択してください。

    Itext7 C#でPDFを読む代替手段(VS IronPDF)図4

IronPDFライブラリのインストール

プロジェクトが作成されたら、それを使用するためにIronPDFライブラリをプロジェクトにインストールする必要があります。 インストールするには、次の手順に従ってください。

  1. ソリューションエクスプローラーまたはツールからNuGetパッケージマネージャーを開きます。

    Itext7でPDFをC#で読む代替手段(VS IronPDF)図5

  2. IronPDF Libraryをブラウズし、現在のプロジェクトに選択してください。 「インストール」をクリックします。

    Itext7 の C# で PDF を読む代替案 (VS IronPDF) 図6

    Program.csファイルの上部に次の名前空間を追加します。

using IronPdf;
using IronPdf;
Imports IronPdf
$vbLabelText   $csharpLabel

iText 7 ライブラリをインストールする

プロジェクトが作成されたら、iText 7 ライブラリを使用するためにプロジェクトにインストールする必要があります。 インストールする手順に従ってください。

  1. ソリューションエクスプローラーまたはツールからNuGetパッケージマネージャーを開きます。

    Itext7 C#でPDFを読む代替手段(VS IronPDF) 図7

  2. iText 7 Library を参照し、現在のプロジェクトで選択してください。 インストールをクリックしてください。

    Itext7 C# での PDF 読み取りの代替案 (VS IronPDF) 図 8

    以下の名前空間をProgram.csファイルの先頭に追加します

using iText.Kernel.Pdf.Canvas.Parser.Listener;
using iText.Kernel.Pdf.Canvas.Parser;
using iText.Kernel.Pdf;
using iText.Kernel.Pdf.Canvas.Parser.Listener;
using iText.Kernel.Pdf.Canvas.Parser;
using iText.Kernel.Pdf;
Imports iText.Kernel.Pdf.Canvas.Parser.Listener
Imports iText.Kernel.Pdf.Canvas.Parser
Imports iText.Kernel.Pdf
$vbLabelText   $csharpLabel

PDFファイルを開く

以下のPDFファイルを使用してテキストを抽出します。 それは2ページのPDFドキュメントです。

Itext7 C#でPDFを読む代替案(VS IronPDF)図9

iTextライブラリーを使用する

iTextライブラリを使用してPDFファイルを開くには、2つのステップがあります。 最初に、PdfReaderオブジェクトを作成し、ファイルの場所をパラメーターとして渡します。 次に、PdfDocument クラスを使用して新しいPDFドキュメントを作成します。 コードは次のようになります:

PdfReader pdfReader = new PdfReader("sample.pdf");
PdfDocument pdfDoc = new PdfDocument(pdfReader);
PdfReader pdfReader = new PdfReader("sample.pdf");
PdfDocument pdfDoc = new PdfDocument(pdfReader);
Dim pdfReader As New PdfReader("sample.pdf")
Dim pdfDoc As New PdfDocument(pdfReader)
$vbLabelText   $csharpLabel

IronPDFの使用

IronPDFを使用してPDFファイルを開くのは簡単です。 PdfDocument クラスの FromFile メソッドを使用して、任意のファイル場所からPDFを開きます。 次の1行コードは、データを読み込むためにPDFファイルを開きます:

var pdf = PdfDocument.FromFile("sample.pdf");
var pdf = PdfDocument.FromFile("sample.pdf");
Dim pdf = PdfDocument.FromFile("sample.pdf")
$vbLabelText   $csharpLabel

PDFファイルからデータを読み取る

iText7ライブラリを使用

PDF データの読み取りは、iText 7 ライブラリではそれほど簡単ではありません。 PDFドキュメントの各ページからテキストを抽出するために、各ページを手動でループする必要があります。 以下のソースコードは、PDFドキュメントからページごとにテキストを抽出するのに役立ちます:

for (int page = 1; page <= pdfDoc.GetNumberOfPages(); page++)
{
    ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
    string pageContent = PdfTextExtractor.GetTextFromPage(pdfDoc.GetPage(page), strategy);
    Console.WriteLine(pageContent);
}
pdfDoc.Close();
pdfReader.Close();
for (int page = 1; page <= pdfDoc.GetNumberOfPages(); page++)
{
    ITextExtractionStrategy strategy = new SimpleTextExtractionStrategy();
    string pageContent = PdfTextExtractor.GetTextFromPage(pdfDoc.GetPage(page), strategy);
    Console.WriteLine(pageContent);
}
pdfDoc.Close();
pdfReader.Close();
Dim page As Integer = 1
Do While page <= pdfDoc.GetNumberOfPages()
	Dim strategy As ITextExtractionStrategy = New SimpleTextExtractionStrategy()
	Dim pageContent As String = PdfTextExtractor.GetTextFromPage(pdfDoc.GetPage(page), strategy)
	Console.WriteLine(pageContent)
	page += 1
Loop
pdfDoc.Close()
pdfReader.Close()
$vbLabelText   $csharpLabel

上記のコードには多くの処理が行われています。 まず、テキスト抽出戦略を宣言し、次に PdfExtractor クラスの GetTextFromPage メソッドを使用してテキストを読み取ります。 このメソッドは2つのパラメータを受け付けます:最初のパラメータはPDFドキュメントのページで、2番目のパラメータはストラテジーです。 PDFドキュメントのページを取得するには、PdfDocumentのインスタンスを使用してGetPageメソッドを呼び出し、ページ番号をパラメーターとして渡します。 出力は文字列として返され、その後コンソール出力画面に表示されます。 最後に、PDFReaderPdfDocument オブジェクトが閉じられます。 また、iText7を使用してPDFからテキストを抽出する例をご覧ください。

出力

Itext7 で PDF を C# で読む代替手段(VS IronPDF)図 10

IronPDFの使用

PDFファイルを開くのが1行のコードであるのと同様に、PDFファイルからテキストを読み取るのも1行のプロセスです。 PDFDocument クラスは、PDFからすべてのコンテンツを読み取るためにExtractAllText メソッドを提供します。 Console.WriteLineはテキストを画面に表示するために使用されます。 コードは以下の通りです:

string text = pdf.ExtractAllText();
Console.WriteLine(text);
string text = pdf.ExtractAllText();
Console.WriteLine(text);
Dim text As String = pdf.ExtractAllText()
Console.WriteLine(text)
$vbLabelText   $csharpLabel

出力

Itext7 の C# での PDF 読み取りの代替案 (VS IronPDF) 図 11

出力は正確でエラーはありません。 ただし、ExtractAllText メソッドを使用するには、ライセンスが必要です。これは本番モードでのみ動作するためです。 30日間の試用ライセンスキーは、IronPDF試用ライセンスページで取得できます。

比較

比較すると、両ライブラリともPDFドキュメントからテキストを抽出する際に100%正確な結果を出します。 正確さに関しては同じです。 しかし、IronPDFはパフォーマンスとコードの可読性に関してより効率的です。

IronPDFは、iTextと同じタスクを達成するのにわずか2行のコードしか必要としません。 追加のロジックを実装することなく、そのままテキスト抽出メソッドを提供します。 iTextコードは少し難しく、PDFドキュメントを開くときに作成される2つのインスタンスを閉じる必要があります。 これに対し、IronPDFはタスクが実行された後に自動的にメモリをクリアします。

サマリー

この記事では、C#でiTextライブラリを使用してPDFドキュメントを読む方法を調べ、IronPDFと比較しました。 どちらのライブラリも正確な結果を与え、作業するための数多くのPDF操作方法を提供します。 これらの両方のライブラリを使用して、PDFファイルを作成、編集、およびPDFファイルからデータを読み取ることができます。

iTextはオープンソースで無料で使用できますが、制約があります。 商業利用向けにライセンスを取得できます。 IronPDFは無料で使用でき、商業活動のためにライセンス取得が可能で、30日間の無料トライアルも利用可能です。

IronPDFをダウンロードして試してください

チペゴ
ソフトウェアエンジニア
チペゴは優れた傾聴能力を持ち、それが顧客の問題を理解し、賢明な解決策を提供する助けとなっています。彼は情報技術の学士号を取得後、2023年にIron Softwareチームに加わりました。現在、彼はIronPDFとIronOCRの2つの製品に注力していますが、顧客をサポートする新しい方法を見つけるにつれて、他の製品に関する知識も日々成長しています。Iron Softwareでの協力的な生活を楽しんでおり、さまざまな経験を持つチームメンバーが集まり、効果的で革新的な解決策を提供することに貢献しています。チペゴがデスクを離れているときは、良い本を楽しんだり、サッカーをしていることが多いです。
< 以前
Itextsharpを使用してPDFを画像に変換する方法
次へ >
IronPDFとFoxit PDF SDKの比較