IRONPDFの使用

C# チュートリアル: IronPDF で PDF テキスト コンテンツ ビューアを構築する (Windows フォーム)

今日のデジタル時代において、PDFファイルは教育、ビジネス、および個人使用において多くのワークフローに不可欠です。 それらは、テキスト、画像、テーブルを含む多様なデータを共有し、提示するための標準形式です。

C# Windows Forms アプリケーション内で完全なビジュアル忠実度を持つ完全なPDFドキュメントを表示するには、専用のレンダリングコンポーネントが必要な場合がありますが、開発者にはしばしば他のニーズがあります。 時には、目的はC#でPDFテキストを読み取り、データを抽出したり、素早くレビュー、インデックス化、またはアクセシビリティのためにPDFのテキストコンテンツを表示することです。

この記事では、強力な.NETライブラリであるIronPDFを使用して、シンプルなC# PDFテキストコンテンツビューアを構築するという特定のタスクに焦点を当てたアプリケーションの作成方法を案内します。 IronPDFを使用してPDFを読み込み、Windows Formsアプリケーションでそのテキストコンテンツを効果的に抽出および表示する方法を学びます。

IronPDFとは何ですか?

IronPDF は、.NET開発者がアプリケーション内でPDFファイルを作成、編集、および処理できるようにする包括的なC#ライブラリです。 ユーザーはHTML、画像、SVGをPDFドキュメントに変換することができ、このチュートリアルにおいて重要なのは、既存のPDFからコンテンツを読み取って抽出することです。 IronPDFは使いやすさを重視して設計されており、PDFファイルを操作するための幅広い機能を提供します。

Windows Windowsインストーラー
IronPDF Windowsインストーラーを使用して、直接製品をインストールしてください。

PDFテキストビューアの構築要件

このC# PDFテキスト表示アプリケーションを作成するには、以下が必要です:

  • Visual Studio: Windowsフォームアプリケーションを作成するための統合開発環境(IDE)。
  • IronPDF: PDFドキュメントの読み込み、作成、および操作機能を提供し、テキスト抽出を含むNuGetパッケージです。

    HTMLからPDFへの変換コンセプトを示すイラスト

    IronPDF は、HTML から PDF を作成することもできます。これは、このチュートリアルで示されているテキスト抽出とは別の機能です。

IronPDFを使用したC#でのPDFテキストコンテンツビューアー作成手順

ステップ 1: Visual Studio で新しい Windows Forms アプリケーションを作成する

始めに、Visual Studio を起動し、「新しいプロジェクトの作成」をクリックします。リストから「Windows フォーム アプリ (.NET Framework)」または類似の .NET テンプレートを選択します。

Visual Studio 新しいプロジェクト ダイアログ

Visual Studio 新しいプロジェクトの作成

次に、プロジェクトに名前を付け(例:CSharpPdfTextReader)、[作成] ボタンをクリックします。 これにより、新しいWindows Formsアプリケーションプロジェクトが設定されます。

ステップ 2: IronPDFライブラリをインストールする

NuGet パッケージ マネージャー GUI を使用する

  1. ソリューション エクスプローラーでプロジェクトを右クリックし、「NuGet パッケージの管理...」を選択します。

  2. 「ブラウズ」タブに移動し、「IronPdf」を検索してください。

  3. IronPdfパッケージを選択し、「インストール」をクリックします。

    Visual Studio の NuGet パッケージ マネージャーで IronPDF を検索

    NuGetパッケージマネージャーを使用してIronPDFをインストールする

    NuGet NuGetでインストール

    PM >  Install-Package IronPdf

    IronPDFNuGetでチェックして、すばやくインストールしましょう。1,000万以上のダウンロードを記録しており、C#によるPDF開発を革新しています。 また、DLLまたはWindows インストーラーをダウンロードすることもできます。

NuGet パッケージ マネージャー コンソールを使用

または、パッケージ マネージャー コンソール (ツール > NuGet パッケージ マネージャー > パッケージ マネージャー コンソール) を開き、コマンドを実行します:

Install-Package IronPdf
Install-Package IronPdf
SHELL

これにより、IronPDFとその依存関係がプロジェクトにダウンロードされてインストールされます。

ステップ 3: Form に RichTextBox を追加してテキストを表示する

私たちは、RichTextBoxコントロールを使用してPDFから抽出したテキストコンテンツを表示します。 RichTextBox は書式付きテキストを表示するのに適していますが、このチュートリアルでは、IronPDF によって抽出されたプレーンテキストを表示することが主な役割です。 それは、PDFの元の視覚的なレイアウトをレンダリングしようとすることなく、テキスト情報を効果的に表示します。

RichTextBoxを追加するには:

  1. デザイナー ビューでフォームを開きます。

  2. ツールボックスに移動します(表示 > ツールボックス)。

  3. "Common Controls" の下に RichTextBox を見つけて、フォームにドラッグします。

  4. 必要に応じてサイズと位置を調整します。 プロパティウィンドウでは、そのName(例:pdfDataRichTextBox)を設定し、フォームの大部分を占めさせたい場合はDockプロパティをFillに設定できます。

    PDF ビューアー C# ウィンドウズ アプリケーション(チュートリアル)、図 4: Form1 の RickTextBox にアクセス

    抽出されたPDFテキストを表示するためにForm1にRichTextBoxを追加する

ステップ4: PDFファイルを選択するボタンを追加する

フォームにButtonコントロールを追加します。 ユーザーはこのボタンをクリックしてファイルダイアログを開き、テキスト抽出のためにPDFファイルを選択します。

  1. ツールボックスからフォームにButtonをドラッグします。

  2. プロパティウィンドウで、Name(例:openBtn)とText(例:「Open PDF & Display Text」)を設定します。

    PDF ビューア C# Windows アプリケーション (チュートリアル)、図 5: フォーム1に新しいボタンを追加

    Form1にボタンを追加してPDFの選択をトリガーする

ステップ5: PDFを読み込みテキストを抽出するC#コードを追加

追加したボタン(「Open PDF & Display Text」)をダブルクリックして、Form1.csでそのClickイベントハンドラーを作成します。

まず、Form1.cs ファイルの先頭に IronPDF 名前空間をインポートしていることを確認してください。

using IronPdf;
using System; // For EventArgs, Exception
using System.Windows.Forms; // For OpenFileDialog, MessageBox, DialogResult, etc.
using IronPdf;
using System; // For EventArgs, Exception
using System.Windows.Forms; // For OpenFileDialog, MessageBox, DialogResult, etc.
Imports IronPdf
Imports System ' For EventArgs, Exception
Imports System.Windows.Forms ' For OpenFileDialog, MessageBox, DialogResult, etc.
$vbLabelText   $csharpLabel

次に、ボタンクリックのイベントハンドラを実装します。 このコードは次のことを行います:

  1. ユーザーにPDFファイルを選択するように促します。

  2. IronPDFを使用して、選択したPDFをロードしてください。

  3. IronPDF の ExtractAllText() メソッドを使用して、PDF からすべてのテキストを取得します。

  4. この抽出されたテキストをRichTextBoxに表示します。
private void openBtn_Click(object sender, EventArgs e)
{
    var openFileDialog = new OpenFileDialog();
    openFileDialog.Filter = "PDF files (*.pdf)
*.pdf
All files (*.*)
*.*";
    openFileDialog.Title = "Select a PDF file to extract text from";

    if (openFileDialog.ShowDialog() == DialogResult.OK)
    {
        try
        {
            // It's recommended to set your license key once at application startup.
            // License.LicenseKey = "YourIronPdfLicenseKey"; 
            // If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
            // For text extraction, the trial is fully functional for development.

            // Load the selected PDF using IronPDF
            var pdf = PdfDocument.FromFile(openFileDialog.FileName);

            // Extract all text content from the PDF
            string extractedText = pdf.ExtractAllText();

            // Display the extracted text in the RichTextBox
            // (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
            pdfDataRichTextBox.Text = extractedText; 
        }
        catch (Exception ex)
        {
            MessageBox.Show("An error occurred while processing the PDF file: " + ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error);
        }
    }
}
private void openBtn_Click(object sender, EventArgs e)
{
    var openFileDialog = new OpenFileDialog();
    openFileDialog.Filter = "PDF files (*.pdf)
*.pdf
All files (*.*)
*.*";
    openFileDialog.Title = "Select a PDF file to extract text from";

    if (openFileDialog.ShowDialog() == DialogResult.OK)
    {
        try
        {
            // It's recommended to set your license key once at application startup.
            // License.LicenseKey = "YourIronPdfLicenseKey"; 
            // If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
            // For text extraction, the trial is fully functional for development.

            // Load the selected PDF using IronPDF
            var pdf = PdfDocument.FromFile(openFileDialog.FileName);

            // Extract all text content from the PDF
            string extractedText = pdf.ExtractAllText();

            // Display the extracted text in the RichTextBox
            // (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
            pdfDataRichTextBox.Text = extractedText; 
        }
        catch (Exception ex)
        {
            MessageBox.Show("An error occurred while processing the PDF file: " + ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error);
        }
    }
}
Private Sub openBtn_Click(ByVal sender As Object, ByVal e As EventArgs)
	Dim openFileDialog As New OpenFileDialog()
	openFileDialog.Filter = "PDF files (*.pdf) *.pdf All files (*.*) *.*"
	openFileDialog.Title = "Select a PDF file to extract text from"

	If openFileDialog.ShowDialog() = DialogResult.OK Then
		Try
			' It's recommended to set your license key once at application startup.
			' License.LicenseKey = "YourIronPdfLicenseKey"; 
			' If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
			' For text extraction, the trial is fully functional for development.

			' Load the selected PDF using IronPDF
			Dim pdf = PdfDocument.FromFile(openFileDialog.FileName)

			' Extract all text content from the PDF
			Dim extractedText As String = pdf.ExtractAllText()

			' Display the extracted text in the RichTextBox
			' (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
			pdfDataRichTextBox.Text = extractedText
		Catch ex As Exception
			MessageBox.Show("An error occurred while processing the PDF file: " & ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error)
		End Try
	End If
End Sub
$vbLabelText   $csharpLabel

コード内訳:

  • openFileDialog: PDFファイル用にフィルタリングされた、ファイル選択用の標準ダイアログ。
  • PdfDocument.FromFile(openFileDialog.FileName): このIronPDFメソッドは、選択されたPDFをPdfDocumentオブジェクトにロードします。
  • pdf.ExtractAllText(): これはこのチュートリアルのための重要なIronPDF関数です。 PDF全体を読み取り、判別可能なすべてのテキストコンテンツを1つの文字列に抽出します。 これはC# で PDF テキストを解析するシナリオにおいて非常に役立ちます。
  • pdfDataRichTextBox.Text = extractedText;: 抽出されたテキストは、RichTextBoxTextプロパティに割り当てられます(pdfDataRichTextBoxの名前がRichTextBoxコントロールに与えた名前と一致していることを確認してください)。

    これは、IronPDFがC#でPDFテキストを読み取ることを簡単にし、開発者が最小限の労力でプログラム的にPDFコンテンツにアクセスできるようにする方法を示しています。

ステップ6: C# PDFテキストビューアアプリケーションのビルドと実行

  1. Visual Studioで、「ビルド」メニューに移動し、「ソリューションのビルド」を選択します。

  2. ビルドが成功したら、「F5」を押すか「スタート」ボタンをクリックしてアプリケーションを実行します。

    アプリケーションウィンドウが表示されます。 「PDFを開く&テキストを表示」ボタンをクリックし、コンピュータからPDFファイルを選択して、「開く」をクリックします。

    PDFビューアーC# Windowsアプリケーション(チュートリアル)、図6:アプリケーションを実行する

    C# PDF テキストビューアアプリケーションの実行

    RichTextBoxは、選択されたPDFファイルから抽出されたテキストコンテンツを表示します。

    PDFビューアC# Windowsアプリケーション(チュートリアル)、図7: PDFファイルを選択した後にテキストコンテンツを表示

    PDFから抽出されたテキストコンテンツがRichTextBoxに表示されます

    MAUI アプリケーションでの PDF の視覚的レンダリングに関する情報については(このチュートリアルのテキスト抽出の焦点とは異なります)、"PDF Viewing in MAUI Tutorial" を探索してみてください。

結論:C#とIronPDFでPDFテキストコンテンツへのアクセスが簡単に

これらの手順に従うことで、IronPDFを使用してPDFファイルからテキストコンテンツを効果的に抽出し表示するC# Windowsフォームアプリケーションを作成しました。 このアプローチは、.NETアプリケーションでPDF内のテキスト情報を表示、分析、またはさらに処理するためにプログラムでアクセスする必要がある場合に価値があります。

IronPDFは、C# PDFテキスト抽出のための強力な機能を提供しており、それはその包括的な機能セットの一部に過ぎません。 また、より高度なタスクには、PDF内のテキスト検索、PDFフォームの編集にIronPDFを使用することもできます。

このチュートリアルでは、特定のユースケース、つまりC#アプリケーションでPDFテキストを利用可能にすることに焦点を当てました。 この基盤を利用して、より複雑な要件に適応し、拡張することができます。

IronPDFの可能性を最大限に引き出すことに興味がある場合:

  • IronPDF ドキュメントにアクセスして、詳細なガイドと例を確認してください。
  • IronPDFを試用制限なしで本番アプリケーションで使用するには、ライセンスキーが必要です。 IronPDFのウェブサイトからライセンスを購入できます。 ライセンスは$749から始まります。
  • また、無料試用版で完全な商用バージョンを評価することもできます。

    ライブラリ_製品のお試し版_拡張ブロック

チペゴ
ソフトウェアエンジニア
チペゴは優れた傾聴能力を持ち、それが顧客の問題を理解し、賢明な解決策を提供する助けとなっています。彼は情報技術の学士号を取得後、2023年にIron Softwareチームに加わりました。現在、彼はIronPDFとIronOCRの2つの製品に注力していますが、顧客をサポートする新しい方法を見つけるにつれて、他の製品に関する知識も日々成長しています。Iron Softwareでの協力的な生活を楽しんでおり、さまざまな経験を持つチームメンバーが集まり、効果的で革新的な解決策を提供することに貢献しています。チペゴがデスクを離れているときは、良い本を楽しんだり、サッカーをしていることが多いです。
< 以前
C# で PDF テーブルを読む方法
次へ >
C#でWord(Docx)をPDFに変換する方法(チュートリアル)