フッターコンテンツにスキップ
製品比較
iText 7とIronPDFによるPDFからテキストを抽出するための比較

iText7 PDFからのテキスト抽出とIronPDF(コード例チュートリアル)

企業向けの多くの文書を使用するソリューションを構築する際、SaaSアプリ内で請求書を生成する際、または.NETダッシュボードからレポートをエクスポートする際に、常に一つの質問が発生します。

「どのC# PDFライブラリを使用すべきでしょうか?」

In the .NET ecosystem, three libraries stand out: PDFsharp, iTextSharp, and IronPDF. それぞれには独自の強み、特徴、最適な利用シーンがあります。 .NET 6+、.NET Core、あるいは従来の.NETフレームワークを使用してPDFファイルを扱う現代の開発者にとって、本当に最適なのはどれでしょうか?

この包括的なガイドは、各ライブラリを深く掘り下げ、機能、インストール、使いやすさ、および出力品質を比較します。 動作するコード例、それぞれのライブラリの長所と短所を通して実際の開発ニーズに基づいた実用的な推奨事項を提供します。

さあ、始めましょう。

PDFsharpの概要

Itext7 Extract Text From Pdf 1 related to PDFsharpの概要

PDFsharpとは何か?

PDFsharpは、開発者がC#を使用して動的にPDFドキュメントを作成および処理できるオープンソースのライブラリです。 ゼロからのPDF作成をサポートし、既存のPDFファイルを変更する能力も持っています。 そのクリーンでオブジェクト指向のAPIは、軽量で統合しやすいソリューションを探している開発者に最適です。

コミュニティ駆動でありながら、忠実なユーザーベースを享受し、高度なレンダリングやHTMLからの動的コンテンツを必要としないシンプルなPDFタスクのための頼れる選択肢であり続けています。

PDFsharpのインストール

インストールはNuGet経由で簡単です。

Install-Package PDFsharp

PDFsharpCoreと.NET Core環境に対応しています。

サンプルコード:シンプルなPDFの作成

using PdfSharp.Pdf;
using PdfSharp.Drawing;

// Create a new PDF document
var document = new PdfDocument();
document.Info.Title = "Created with PDFsharp";

// Create an empty page
PdfPage page = document.AddPage();

// Get an XGraphics object for drawing
XGraphics gfx = XGraphics.FromPdfPage(page);

// Create a font
XFont font = new XFont("Verdana", 20, XFontStyle.Bold);

// Draw the text
gfx.DrawString("Hello, PDFsharp!", font, XBrushes.Black,
    new XRect(0, 0, page.Width, page.Height), XStringFormats.Center);

// Save the document
document.Save("HelloWorld.pdf");
using PdfSharp.Pdf;
using PdfSharp.Drawing;

// Create a new PDF document
var document = new PdfDocument();
document.Info.Title = "Created with PDFsharp";

// Create an empty page
PdfPage page = document.AddPage();

// Get an XGraphics object for drawing
XGraphics gfx = XGraphics.FromPdfPage(page);

// Create a font
XFont font = new XFont("Verdana", 20, XFontStyle.Bold);

// Draw the text
gfx.DrawString("Hello, PDFsharp!", font, XBrushes.Black,
    new XRect(0, 0, page.Width, page.Height), XStringFormats.Center);

// Save the document
document.Save("HelloWorld.pdf");
Imports PdfSharp.Pdf
Imports PdfSharp.Drawing

' Create a new PDF document
Private document = New PdfDocument()
document.Info.Title = "Created with PDFsharp"

' Create an empty page
Dim page As PdfPage = document.AddPage()

' Get an XGraphics object for drawing
Dim gfx As XGraphics = XGraphics.FromPdfPage(page)

' Create a font
Dim font As New XFont("Verdana", 20, XFontStyle.Bold)

' Draw the text
gfx.DrawString("Hello, PDFsharp!", font, XBrushes.Black, New XRect(0, 0, page.Width, page.Height), XStringFormats.Center)

' Save the document
document.Save("HelloWorld.pdf")
$vbLabelText   $csharpLabel

出力

PDFsharp PDF

ご注意PDFsharpには箱から出してのHTMLレンダリングやCSSパースが対応していないため、ドキュメント生成ベースに最適です。 PDFsharp用のHTMLレンダリングにはHtmlRendererが必要です。

PDFsharpの長所と短所

長所:

  • 無料のオープンソースPDFライブラリ (MITライセンス)
  • 低レベルの描画やシンプルなテキストベースのPDFドキュメントに最適
  • 軽量でインストールが簡単

短所:

  • ネイティブのHTMLからPDFへのサポートがない
  • レンダリング能力が限定されている
  • 高度なユースケースに対しては積極的に保守されていない

iTextSharpの詳細な分析

Itext7 Extract Text From Pdf 3 related to iTextSharpの詳細な分析

iTextSharpとは何か?

iTextSharpは、Javaベースの強力なPDFライブラリiTextの.NET版です。 デジタル署名、フォームフィールド、バーコードなどを含む高度な機能を提供します。 iTextSharpは非常にカスタマイズ可能で、法的または規制文書のニーズを持つ企業に最適です。

しかし、ライセンスという問題があります。 iTextSharpはAGPLライセンスであるため、商業ライセンスを購入するか、プロジェクトをオープンソースにしなければなりません。

iTextSharpのインストール

NuGet経由でインストールします。

Install-Package itext

新しいバージョンではiText Core名前空間を使用しています。 統合前にライセンス条件を確認してください。

サンプルコード:基本的なPDF生成

using iText.Kernel.Pdf;
using iText.Layout;
using iText.Layout.Element;

// Create a writer and initiates a PDF document
PdfWriter writer = new PdfWriter("iTextHello.pdf");
var pdf = new PdfDocument(writer);
Document document = new Document(pdf);

// Add a paragraph to the document
document.Add(new Paragraph("Hello, iTextSharp!"));

// Closing the document
document.Close();
using iText.Kernel.Pdf;
using iText.Layout;
using iText.Layout.Element;

// Create a writer and initiates a PDF document
PdfWriter writer = new PdfWriter("iTextHello.pdf");
var pdf = new PdfDocument(writer);
Document document = new Document(pdf);

// Add a paragraph to the document
document.Add(new Paragraph("Hello, iTextSharp!"));

// Closing the document
document.Close();
Imports iText.Kernel.Pdf
Imports iText.Layout
Imports iText.Layout.Element

' Create a writer and initiates a PDF document
Private writer As New PdfWriter("iTextHello.pdf")
Private pdf = New PdfDocument(writer)
Private document As New Document(pdf)

' Add a paragraph to the document
document.Add(New Paragraph("Hello, iTextSharp!"))

' Closing the document
document.Close()
$vbLabelText   $csharpLabel

出力

iText PDF出力

ヒントiTextSharpのiText 9バージョンはモジュラーになっています。 HTML変換やバーコード生成には、paid add-on pdfHTML)として追加NuGetパッケージが必要です。}]

iTextSharpの強みと弱点

強み:

  • 強力で企業向け
  • PDF/A、暗号化、フォーム入力、デジタル署名をサポート
  • プラグイン付きのモジュラーアーキテクチャ

弱点:

  • AGPLライセンスまたは高価な商業ライセンス
  • 学習曲線が急
  • 同業他社と比べて冗長な構文

IronPDF: C&#のための包括的な選択肢

Itext7 Extract Text From Pdf 5 related to IronPDF: C&#のための包括的な選択肢

IronPDFが際立つ理由

IronPDFは、シンプルさ、レンダリング精度、機能の豊富さを強調する商業グレードの.NETライブラリです。 HTMLを完全なCSS、JavaScript、WebフォントサポートでPDFに変換したい場合は特に強く、モダンでレスポンシブなPDFドキュメント生成に最適です。 ゼロからPDFドキュメントを作成する、HTMLからPDFを生成する、あるいはPDFファイルの操作に優れたツールが必要な場合でも、IronPDFは対応しています。

.NET Core、.NET Framework、Azure、Dockerのサポートにより、IronPDFはスタートアップや企業向けアプリに最適です。強力な機能、良好なドキュメント、およびさまざまなプラットフォームでのパフォーマンス能力により、IronPDFはPDF生成における堅実な選択肢です。

IronPDFのインストール

NuGetパッケージマネージャーコンソールからインストールします。

Install-Package IronPdf

またはVisual StudioのNuGet UIを使用します。 IronPDFは無料トライアルとAGPL制限のない商業利用のための柔軟なライセンスを提供しています。

IronPDFサンプルコード:5行でHTMLからPDFへ

using IronPdf;

var Renderer = new ChromePdfRenderer();
// Render a simple HTML string as a PDF document
var pdf = Renderer.RenderHtmlAsPdf("<h1>Hello from IronPDF!</h1><p>This was rendered using Chrome.</p>");
// Save the PDF document as a file
pdf.SaveAs("IronPdfHello.pdf");
using IronPdf;

var Renderer = new ChromePdfRenderer();
// Render a simple HTML string as a PDF document
var pdf = Renderer.RenderHtmlAsPdf("<h1>Hello from IronPDF!</h1><p>This was rendered using Chrome.</p>");
// Save the PDF document as a file
pdf.SaveAs("IronPdfHello.pdf");
Imports IronPdf

Private Renderer = New ChromePdfRenderer()
' Render a simple HTML string as a PDF document
Private pdf = Renderer.RenderHtmlAsPdf("<h1>Hello from IronPDF!</h1><p>This was rendered using Chrome.</p>")
' Save the PDF document as a file
pdf.SaveAs("IronPdfHello.pdf")
$vbLabelText   $csharpLabel

出力

IronPDF出力

このシンプルな例は、Chromiumエンジンをフル活用して、HTML/CSSをちょうどブラウザのようにレンダリングします—PDFsharpやiTextSharpが苦手なものです。

パフォーマンスと開発者体験

IronPDFは次の点で広く評価されています。

  • 精度: Chromiumエンジンを利用したピクセルパーフェクトなPDF生成
  • 使いやすさ: ページサイズやフォントなどを手動で調整する必要がない
  • 速度: マルチスレッド化対応の高速生成
  • サポート: 活動的なドキュメント、サンプル、顧客サポート

ベンチマークによれば、IronPDFは標準のマシンで2秒以内に複雑なHTML請求書を画像、CSS、およびJavaScript付きで生成でき、iTextSharpのHTMLアドオンやPDFsharpの手動描画方法を大幅に上回っています。

IronPDFを選ぶ理由

IronPDFは最新の開発体験を提供し、次のような重要な機能を備えています。

  • 正確なレンダリングによるHTML5、CSS3、JS、Bootstrap、およびレスポンシブデザインサポートの完全なPDF変換
  • PDF/A、デジタル署名、透かし、マージ、分割などの高度な機能が利用可能
  • 商業製品に適したライセンス—AGPLの心配がない
  • 優れたドキュメントとサンプル豊富なサポート
  • PDFドキュメントからのデータ抽出が簡単
  • IronPDFはC#プログラミング言語に限定されず、Java、Node.js、Pythonバージョンも提供しています

請求書ジェネレーター、レポートエンジン、ブラウザベースのドキュメントシステムを構築する場合でも、IronPDFを使えば簡単かつプロフェッショナルに実現できます。

最終考察:どのC# PDFライブラリを選ぶべきか?

The world of C# PDF libraries is diverse, and each tool we’ve explored—PDFsharp, iTextSharp, and IronPDF—brings its own strengths, weaknesses, and ideal use cases. では.NETアプリケーションのためにどれを選ぶべきでしょうか?

PDFsharp: 軽量およびDIY

小規模なアプリケーションを構築している、基本的な文書のレンダリングニーズがある、PDF描画操作に完全なコントロールを好む場合、PDFsharpは信頼できる出発点です。 そのオープンソースの性質と低オーバーヘッドは、ライセンシングとシンプルさが鍵となるプロジェクトに最適です。 しかし、代償は手作業です:HTMLのサポートなし、モダンなウェブレンダリングなし、そして限られたアクティブな開発。

次の場合にPDFsharpを使用してください。

  • ライン、テキスト、シンプルなレイアウトでPDFファイルをプログラムによって作成しようとしている。
  • アプリがHTML to PDF、CSSのスタイリング、JavaScriptを必要としない。
  • オープンソースの互換性(MITライセンス)が重要な場合。

iTextSharp: 強力だが複雑

iTextSharpは、スペクトルの企業側に位置します。 それは強力で安全で、以下のような複雑なPDF操作に最適です。

  • フォームの記入
  • バーコード生成
  • デジタル署名付きのファイルの保護
  • PDF/AやPDF/UAなどのフォーマットとの適合性

しかし、そのAGPLライセンスは、コードをオープンソースにするか、商業ライセンスを購入する準備が必要でなければ制限されます。その価格は安くありません。さらに、学習曲線は急で、HTMLレンダリングはコア機能ではなくアドオンです。

次の場合にiTextSharpを使用してください。

  • 政府や規制システムを構築していて、フォームフィリングまたは安全なPDFが必要。
  • 低レベルのPDF操作に対して細かなコントロールが必要。
  • 商業ライセンスを購入する予算がある。

IronPDF: 現代的、直感的、そして機能豊富

これに対して、IronPDFはエレガントかつ迅速に実世界の問題を解決するように設計されています。 ウェブ技術(HTML、CSS、JavaScript)の親しみやすさをChromiumレンダリングの力と結びつけ、複雑なレイアウトを美しいPDFに簡単に変換することを可能にします。

以下を処理します。

  • ピクセルパーフェクトなHTML to PDFレンダリング
  • JavaScript実行(チャートや動的データに最適)
  • PDFのマージ、分割、透かし、署名、およびその他の様々なPDFドキュメント操作オプション
  • .NET 6、7、およびそれ以降との統合
  • Azure、Docker、およびCI/CDパイプラインへの簡単な展開

最も重要なのは、IronPDFは開発者体験に焦点を当てています:クリーンな構文、迅速なレンダリング、豊富なドキュメント、迅速なサポート。

次の場合にIronPDFを選んでください。

  • HTMLのブラウザ印刷プレビューのように見えるHTML to PDFレンダリングのための価値のあるツールが必要。
  • 文書がウェブスタイリング(Bootstrap、Flexbox、Google Fonts)に依存している。
  • 柔軟性、サポート、アップデートを備えた商業ライセンスが必要。
  • 時間の市場の価値や開発者の生産性を重視する。

判決:IronPDFはほとんどの.NET開発者に向いている

PDFsharpは基本ニーズに最適ですが、iTextSharpはコンプライアンスが厳しい業界向けで、IronPDFは現代のC#開発者にとって包括的なPDFソリューションとして際立っています。 それは力、シンプルさ、実世界での使いやすさの完全なバランスを取ります。

動的なレポートをレンダリングする場合でも、ウェブテンプレートからのクライアント請求書を生成する場合でも、リッチなドキュメントをエクスポートする場合でも、IronPDFを使用するとアプリケーションに集中でき、PDFレンダリングの細かな部分に悩まされることはありません。

試してみる準備はできましたか?

私たちの言葉を鵜呑みにせず、自分でIronPDFを探る:

IronPDFを使用すると、単にPDFを生成するだけでなく、正確に設計した美しい、プロフェッショナルな、生産対応の文書を構築します。 開発時間を短縮し、レンダリングの頭痛を消し、迅速にリリースします。

[{i:(PDFsharpとiTextSharpはそれぞれの所有者の商標です。 このサイトはPDFsharpまたはiTextSharpとは提携しておらず、推奨もスポンサーもされていません。全製品名、ロゴ、ブランドはそれぞれの所有者の財産です。 比較は情報提供のみを目的としており、執筆時点で公開されている情報を反映しています。

よくある質問

C#でiText7を使用してPDFからテキストを抽出する方法は?

iText7を使用してPDFからテキストを抽出するには、PDFリーダーインスタンスを作成し、`PdfTextExtractor`クラスを使用します。ただし、その複雑な構文とライセンスの制限のために、開発者はより簡単な実装を望む場合、IronPDFのような代替案を好むかもしれません。

HTMLからPDFへの変換でIronPDFが好まれる理由は何ですか?

IronPDFは、HTMLからPDFへの変換でChromiumベースのレンダリングエンジンを使用しており、ピクセル単位の精度を保証し、HTML5、CSS3、JavaScriptを完全にサポートしているため好まれています。

iText7とIronPDFのライセンスの違いは何ですか?

iText7は商用ライセンスを購入しない限り、オープンソースプロジェクトにはAGPLライセンスが必要ですが、IronPDFは商業開発者と個人開発者の両方に訴えるより柔軟なライセンスモデルを提供しています。

IronPDFの一般的な使用例は何ですか?

IronPDFは、.NETアプリケーションでのレポート、請求書、ドキュメントの作成やHTMLコンテンツからのPDF生成によく使用され、使いやすさと強力な機能セットが特徴です。

企業レベルのPDFタスクにより適したライブラリはどれですか?

iText7はデジタル署名やフォームフィールドなどの高度な機能のため、企業レベルのタスクに選ばれることが多いですが、IronPDFは大部分のPDF生成ニーズに対して包括的な機能を備えた、より費用対効果の高いシンプルなソリューションを提供します。

IronPDFはどのようにしてPDFの正確なレンダリングを保証しますか?

IronPDFは、Chromiumベースのエンジンを活用して、現代のウェブスタンダードをサポートし、ウェブコンテンツからPDFへの高忠実度の変換を実現することで、PDFの正確なレンダリングを保証します。

開発者にとってIronPDFを使用する主な利点は何ですか?

開発者はIronPDFのシンプルなAPI、充実したドキュメント、迅速なレンダリング機能から恩恵を受け、C#開発者にとってPDFの生成と操作に最適な選択肢です。

IronPDFはクラウドベースのアプリケーションで使用できますか?

はい、IronPDFはクラウドベースのアプリケーションにスムーズに統合でき、AzureおよびDockerでの展開をサポートしており、現代のソフトウェア開発環境における多様性を高めます。

IronPDFの出力品質は他のPDFライブラリとどう比較されますか?

IronPDFの出力品質は、先進的なレンダリングエンジンによって優れており、HTMLから生成されたPDFが視覚的に一貫性と正確性を保ち、専門的なドキュメント作成に信頼性のある選択肢となります。

C#でのPDF生成に不慣れな開発者に推奨されるライブラリは何ですか?

IronPDFはC#でのPDF生成に不慣れな開発者に推奨され、ユーザーフレンドリーな構文と包括的なサポートにより、簡単な統合と迅速な学習曲線を提供します。

Curtis Chau
テクニカルライター

Curtis Chauは、カールトン大学でコンピュータサイエンスの学士号を取得し、Node.js、TypeScript、JavaScript、およびReactに精通したフロントエンド開発を専門としています。直感的で美しいユーザーインターフェースを作成することに情熱を持ち、Curtisは現代のフレームワークを用いた開発や、構造の良い視覚的に魅力的なマニュアルの作成を楽しんでいます。

開発以外にも、CurtisはIoT(Internet of Things)への強い関心を持ち、ハードウェアとソフトウェアの統合方法を模索しています。余暇には、ゲームをしたりDiscordボットを作成したりして、技術に対する愛情と創造性を組み合わせています。