IRONPDFの使用

C#でPDFファイルを読み取る方法

この記事では、IronPDF for .NET、C# PDFライブラリを使用してPDFファイルを読み取ります。

以下の手順に従って、IronPDFを使用してPDFファイルを読み取ります

  1. Visual Studioをまだダウンロードしていない場合は、ダウンロードしてください。 環境を設定し、IronPDFライブラリをインストールします。

  2. PdfDocument.FromFile メソッドを使用して、目的のPDFファイルを開いてロードします。

  3. IronPDFのExtractAllTextメソッドを利用してコンテンツを取得します。

  4. 必要に応じて抽出されたテキストを解析または操作する。

  5. 抽出されたテキストをコンソールに出力して読んでください。

IronPDF

IronPDFは、C#向けの強力なPDF読み取りライブラリであり、開発者がPDFドキュメントを簡単に扱えるようにします。 その豊富な機能と能力により、IronPDFはPDFドキュメントの取り扱いを簡単にし、ユーザーがPDFコンテンツを容易に読み、抽出し、操作することを可能にします。 ドキュメント処理を自動化する際や、分析のためにデータや画像を抽出する際、またはゼロからPDFを作成する際、IronPDFはこれらのタスクを効率化するための包括的なツールセットを提供します。

この記事では、C#でIronPDFを使用した効率的なPDF処理の世界を探究し、開発者のソフトウェア開発の旅において不可欠なツールとしてのその多様性と価値を紹介します。

新しいVisual Studioプロジェクトの作成

コーディングの側面に入る前に、新しいVisual Studio C#コンソールアプリケーションプロジェクトの設定を始めましょう。 このプロジェクトは、開発と実例の両方のための専用ワークスペースとして機能します。

  1. このプロセスを開始するには、Visual Studioを起動し、「ファイル」メニューに移動して「新規作成」、次に「プロジェクト」を選択して新しいプロジェクトを作成します。

    C#でPDFファイルを読む方法、図1:Visual Studioで「プロジェクトの作成」ダイアログに移動する

    Visual Studio でプロジェクトの作成ダイアログに移動

  2. このアクションにより、新しいウィンドウが表示され、プロジェクトテンプレートを指定する機会が提供されます。 この簡単さのために、「コンソールアプリケーション」テンプレートを選択し、ウィンドウの左下隅に配置されている次へボタンをクリックして進んでください。

    C#でPDFファイルを読む方法、図2: Visual Studioで新しいプロジェクトを作成する

    Visual Studioで新しいプロジェクトを作成する

  3. 次のウィンドウで、プロジェクト名を指定し、希望するプロジェクトの場所を設定するよう求められます。 これらの詳細が整ったら、次へボタンをクリックして続行してください。

    C#でPDFファイルを読む方法、図3: プロジェクトの構成

    プロジェクトを構成する

  4. このステップで、希望するターゲットフレームワークを選択し、作成 ボタンをクリックしてプロジェクト作成プロセスを終了します。

    C#でPDFファイルを読む方法、図4:.NET Frameworkの選択

    .NET Frameworkの選択

    プロジェクトがしっかりと確立された今、次の重要なステップはIronPDFのインストールです。

IronPDFのインストール

IronPDFは、PDFライブラリのダウンロードとインストールのための多くのオプションを提供しています。 このガイドのために、NuGet パッケージ マネージャーを使用して IronPDF をインストールすることに焦点を当てます。これは熟練して広く採用されている方法です。

  1. Visual Studio内で、「ツール」メニューに移動し、「NuGetパッケージマネージャー」オプションにカーソルを優雅にホバリングします。

  2. 拡張メニューから「ソリューションのためのNuGetパッケージマネージャー」を選択します。

    C#でPDFファイルを読む方法、図5: NuGetパッケージマネージャーに移動

    NuGet パッケージ マネージャーに移動

  3. このオプションを選択すると、新しいウィンドウが開きます。 この精緻なウィンドウ内で、「Browse」メニューに進み、「IronPDF」を検索バーに入力します。

  4. 画面には、利用可能なIronPDFパッケージが表示されます。 続行するには、リストから最新のパッケージを選択し、「インストール」オプションをクリックしてこの選択を実行してください。

    C#でPDFファイルを読む方法、図6:NuGetパッケージマネージャーUIでIronPdfパッケージを検索しインストール

    NuGet パッケージ マネージャー UI で IronPdf パッケージを検索してインストールする

    コマンドラインアプローチを好む方には、NuGetパッケージマネージャーコンソールが優雅な方法を提供します。 このコンソールを開き、次のコマンドを入力して、「Enter」キーを押してください。

Install-Package IronPdf

また、NuGetのWebサイトのリンクから直接パッケージを取得するオプションがあります。

IronPDFを使用してPDFファイルを読む

このセクションでは、IronPDFを使用してC#プログラミング言語でPDFファイルを開き、読み取る方法を紹介します。

using IronPdf;
using System;

IronPdf.License.LicenseKey = "";
//raw text string path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

string text = pdf.ExtractAllText();

Console.WriteLine(text);
using IronPdf;
using System;

IronPdf.License.LicenseKey = "";
//raw text string path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

string text = pdf.ExtractAllText();

Console.WriteLine(text);
Imports IronPdf
Imports System

IronPdf.License.LicenseKey = ""
'raw text string path
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")

Dim text As String = pdf.ExtractAllText()

Console.WriteLine(text)
$vbLabelText   $csharpLabel

必要なライブラリのインポート

始めに、必要な名前空間をインポートする必要があります。 上記のコード例では、PDFを扱うための基本的な機能を含むIronPdf名前空間がインポートされています。 さらに、一般的なシステムレベルの操作のためにSystem名前空間もインポートされます。

using IronPdf;
using System;
using IronPdf;
using System;
Imports IronPdf
Imports System
$vbLabelText   $csharpLabel

2. IronPDFライセンスキーの設定

IronPDFは、本番環境で使用するには有効なライセンスキーが必要です。 コード例では、ライセンスキーを設定する行があります。 しかし、提供されたコードでは、ライセンスキーが空のままです""。 本番環境でIronPDFを使用する際は、空の文字列を有効なライセンスキーに置き換えてください。

IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here"
$vbLabelText   $csharpLabel

3. PDFドキュメントの読み込み

次のステップは、PDFファイルを読み込んで解析することです。提供されたコードでは、PdfDocument.FromFile メソッドを使用して、ファイル名 "document_scaled_compressed.pdf" からPDFを読み込み、それをpdf 変数に割り当てます。 このPDFファイルはテキスト抽出に使用されます。

var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")
$vbLabelText   $csharpLabel

PDFドキュメントからテキストを抽出する

IronPDFは、読み込まれたPDFドキュメントからテキストを抽出するためのシンプルな方法を提供します。 ExtractAllText メソッドは、PDFの各ページからすべてのテキスト内容を抽出し、それをtextという名前のstring変数に格納することができます。これは、PDFを****テキストに変換する機能として機能します。

string text = pdf.ExtractAllText();
string text = pdf.ExtractAllText();
Dim text As String = pdf.ExtractAllText()
$vbLabelText   $csharpLabel

抽出されたテキストの表示

最終段階は、抽出されたテキストを表示することです。 コード内で、Console.WriteLine は抽出されたテキストをコンソールに出力して書き込みます。 これは、デバッグやユーザーにテキストを提示するのに便利な方法です。

Console.WriteLine(text);
Console.WriteLine(text);
Console.WriteLine(text)
$vbLabelText   $csharpLabel

PDFファイルから抽出されたテキスト

C#でPDFファイルを読む方法、図7: PDFファイルから抽出されたテキスト

PDFファイルから抽出されたテキスト

結論

この記事では、IronPDFライブラリを使用してC#でPDFファイルを効果的に操作するプロセスを開発者に案内しました。 それは、専用のVisual Studioプロジェクトの設定を示すことから始まり、続いてNuGet Package Managerを介してIronPDFの簡単なインストールが行われました。 その記事では、必要なライブラリのインポート方法、IronPDFのライセンスキーの設定方法、PDFファイルの読み込み方法、テキストコンテンツの抽出方法、および全ページから抽出されたテキストを表示する方法について、段階的な説明が提供されました。 C#を使用して抽出したテキストをTXTファイルとして保存することもできます。

その使いやすいアプローチと包括的な機能により、IronPDF は、文書プロセスの自動化、データ抽出、およびHTMLやURL、画像からのPDF作成に欠かせないツールとなり、C# でのPDFファイル処理を伴うソフトウェア開発プロジェクトを向上させる貴重な資産となります。

PDFファイルの読み取りについての完全な記事は、次のハウツーページにて見つかります。 C# PDFリーダーのコード例も利用可能です。 IronPDFを使用したさらなるコード例については、この例のページをご覧ください。 IronPDFは、すべての開発者の質問に答えるための充実したドキュメントを提供し、完全なハンズオンサポートを提供します。 IronPDF は無料のトライアル ライセンスを提供しており、ユーザーは永久ライセンスを購入する前にその全機能を試すことができます。

チペゴ
ソフトウェアエンジニア
チペゴは優れた傾聴能力を持ち、それが顧客の問題を理解し、賢明な解決策を提供する助けとなっています。彼は情報技術の学士号を取得後、2023年にIron Softwareチームに加わりました。現在、彼はIronPDFとIronOCRの2つの製品に注力していますが、顧客をサポートする新しい方法を見つけるにつれて、他の製品に関する知識も日々成長しています。Iron Softwareでの協力的な生活を楽しんでおり、さまざまな経験を持つチームメンバーが集まり、効果的で革新的な解決策を提供することに貢献しています。チペゴがデスクを離れているときは、良い本を楽しんだり、サッカーをしていることが多いです。
< 以前
C#でPDFスタンプを追加する方法
次へ >
.NETライブラリでPDFファイルを圧縮する方法