フッターコンテンツにスキップ
IRONPDFの使用

C#チュートリアル: IronPDFを使用してPDFテキストコンテンツビューアを構築します(Windowsフォーム)

今日のデジタル時代において、PDFファイルは教育、ビジネス、個人使用など、多くのワークフローに不可欠です。 Node.jsは、テキスト、画像、表などの多様なデータを共有し、提示するための標準フォーマットです。

C# Windows Forms アプリケーション内で完全な PDF 文書を完全な視覚的忠実度で表示するには、専用のレンダリングコンポーネントが必要ですが、開発者はしばしば他のニーズを持っています。 時には、C#でPDFのテキストを読み、データを抽出したり、PDFのテキストコンテンツを表示して、すばやく確認したり、インデックスを作成したり、アクセシビリティを確保したりすることが目標になることもあります。

この記事では、強力な.NETライブラリであるIronPDFを使用したシンプルなC# PDFテキストコンテンツビューアの構築という、この特定のタスクに焦点を当てたアプリケーションの作成について説明します。 IronPdfを使ってPDFを読み込み、そのテキストコンテンツをWindowsフォームアプリケーションで効果的に抽出して表示する方法を学びます。

IronPDFとは何ですか?

IronPDFは、.NET開発者がアプリケーション内でPDFファイルを作成、編集、処理できるようにする包括的なC#ライブラリです。 HTML、画像、SVGをPDF文書に変換したり、このチュートリアルにとって重要なことですが、既存のPDFからコンテンツを読み出したりすることができます。 IronPDFは使いやすく設計されており、PDFファイルを操作するための幅広い機能を提供します。

PDFテキスト ビューアを構築するための要件

この C# PDF テキスト表示アプリケーションを作成するには、以下のものが必要です:

  • Visual Studio:Windows Formsアプリケーションを作成するための統合開発環境(IDE)。
  • IronPdf:テキスト抽出を含む、PDF文書の読み取り、作成、操作機能を提供するNuGetパッケージ。

HTMLからPDFへの変換コンセプトを示すイラストIronPDFはHTMLからPDFを作成することもできます。このチュートリアルで紹介するテキスト抽出とは別の機能です。

C#でIronPDFを使ってPDFテキストコンテンツビューアを作成するステップ

ステップ1: Visual Studioで新しいWindowsフォームアプリケーションを作成する

まず、Visual Studioを起動し、"Create a new project "をクリックします。リストから "Windows Forms App (.NET Framework) "または同様の.NETテンプレートを選択します。

Visual Studio の新規プロジェクト ダイアログビジュアルスタジオ新規プロジェクト作成

次に、プロジェクトの名前(CSharpPdfTextReaderなど)を入力し、[作成]ボタンをクリックします。 これは新しいWindows Forms Applicationプロジェクトを立ち上げます。

ステップ2:IronPDFライブラリをインストール

NuGetパッケージマネージャGUIを使用する。

1.ソリューション・エクスプローラで、プロジェクトを右クリックし、"NuGetパッケージの管理... "を選択します。
2.参照"タブで "IronPdf "を検索してください。
3.IronPdfパッケージを選択し、"インストール"をクリックしてください。

VisualStudioのNuGetパッケージマネージャでPDFを検索するNuGetパッケージマネージャによるIronPDFのインストール

NuGetパッケージマネージャーコンソールを使用する。

または、Package Manager Console(Tools ˶> NuGet Package Manager ˶> Package Manager Console)を開き、コマンドを実行してください:

Install-Package IronPdf

これはIronPDFとその依存関係をダウンロードし、あなたのプロジェクトにインストールします。

ステップ 3: テキスト表示のためにフォームにリッチテキストボックスを追加する

PDFから抽出されたテキストコンテンツを表示するために、RichTextBoxコントロールを使用します。 RichTextBoxはフォーマットされたテキストを表示するのに適していますが、このチュートリアルではIronPDFによって抽出されたプレーンテキストを表示するのが主な役割です。 PDFの元のビジュアルレイアウトをレンダリングしようとすることなく、テキスト情報を効果的に示します。

RichTextBoxを追加するには:

1.デザイナー・ビューでフォームを開きます。
2.ツールボックス(表示 > ツールボックス)に移動します。
3.Common Controls"でRichTextBoxを見つけ、フォームにドラッグします。
4.必要に応じて、サイズと位置を調整してください。 プロパティウィンドウでは、Nameを設定し(例えば、pdfDataRichTextBox)、フォームの大部分を占めるようにしたい場合は、DockプロパティをFillに設定します。

PDFビューアC# Windowsアプリケーション(チュートリアル)、図4:Form1のRickTextBoxにアクセスする抽出されたPDFテキストを表示するためにForm1にRichTextBoxを追加する

ステップ4: PDFファイルを選択するボタンを追加する

フォームにButtonコントロールを追加します。 ユーザーはこのボタンをクリックしてファイルダイアログを開き、テキスト抽出用のPDFファイルを選択します。

1.ツールボックスからボタンをフォームにドラッグします。
2.プロパティウィンドウで、Name(例:openBtn)とText(例:"Open PDF & Display Text")を設定します。

PDFビューアC# Windowsアプリケーション(チュートリアル)、図5: Form1に新しいボタンを追加するPDF選択をトリガーするためにForm1にボタンを追加する

ステップ 5: PDF を読み込んでテキストを抽出する C# コードを追加する

Form1.csClickイベントハンドラを作成するために、追加したボタン("PDFを開いてテキストを表示する")をダブルクリックします。

まず、Form1.csファイルの先頭にIronPDF名前空間がインポートされていることを確認してください:

using IronPdf;
using System; // For EventArgs, Exception
using System.Windows.Forms; // For OpenFileDialog, MessageBox, DialogResult, etc.
using IronPdf;
using System; // For EventArgs, Exception
using System.Windows.Forms; // For OpenFileDialog, MessageBox, DialogResult, etc.
Imports IronPdf
Imports System ' For EventArgs, Exception
Imports System.Windows.Forms ' For OpenFileDialog, MessageBox, DialogResult, etc.
$vbLabelText   $csharpLabel

では、ボタンクリックのイベントハンドラを実装してください。 このコードは次のようになります:

1.ユーザーにPDFファイルを選択するように促します。
2.選択したPDFを読み込むにはIronPDFを使用してください。
3.PDFからすべてのテキストを取得するにはIronPDFのExtractAllText()メソッドを使用してください。
4.この抽出されたテキストをRichTextBoxに表示します。

private void openBtn_Click(object sender, EventArgs e)
{
    // Create an OpenFileDialog to open PDF files
    var openFileDialog = new OpenFileDialog
    {
        Filter = "PDF files (*.pdf)|*.pdf|All files (*.*)|*.*", // Filter to show only PDFs
        Title = "Select a PDF file to extract text from" // Dialog title
    };

    // Show dialog and check if the user selected a file
    if (openFileDialog.ShowDialog() == DialogResult.OK)
    {
        try
        {
            // It's recommended to set your license key once at application startup.
            // License.LicenseKey = "YourIronPdfLicenseKey"; 
            // If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
            // For text extraction, the trial is fully functional for development.

            // Load the selected PDF using IronPDF
            var pdf = PdfDocument.FromFile(openFileDialog.FileName);

            // Extract all text content from the PDF using IronPDF
            string extractedText = pdf.ExtractAllText();

            // Display the extracted text in the RichTextBox
            // (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
            pdfDataRichTextBox.Text = extractedText; 
        }
        catch (Exception ex)
        {
            // Show error message if an exception occurs
            MessageBox.Show("An error occurred while processing the PDF file: " + ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error);
        }
    }
}
private void openBtn_Click(object sender, EventArgs e)
{
    // Create an OpenFileDialog to open PDF files
    var openFileDialog = new OpenFileDialog
    {
        Filter = "PDF files (*.pdf)|*.pdf|All files (*.*)|*.*", // Filter to show only PDFs
        Title = "Select a PDF file to extract text from" // Dialog title
    };

    // Show dialog and check if the user selected a file
    if (openFileDialog.ShowDialog() == DialogResult.OK)
    {
        try
        {
            // It's recommended to set your license key once at application startup.
            // License.LicenseKey = "YourIronPdfLicenseKey"; 
            // If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
            // For text extraction, the trial is fully functional for development.

            // Load the selected PDF using IronPDF
            var pdf = PdfDocument.FromFile(openFileDialog.FileName);

            // Extract all text content from the PDF using IronPDF
            string extractedText = pdf.ExtractAllText();

            // Display the extracted text in the RichTextBox
            // (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
            pdfDataRichTextBox.Text = extractedText; 
        }
        catch (Exception ex)
        {
            // Show error message if an exception occurs
            MessageBox.Show("An error occurred while processing the PDF file: " + ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error);
        }
    }
}
Private Sub openBtn_Click(ByVal sender As Object, ByVal e As EventArgs)
	' Create an OpenFileDialog to open PDF files
	Dim openFileDialog As New OpenFileDialog With {
		.Filter = "PDF files (*.pdf)|*.pdf|All files (*.*)|*.*",
		.Title = "Select a PDF file to extract text from"
	}

	' Show dialog and check if the user selected a file
	If openFileDialog.ShowDialog() = DialogResult.OK Then
		Try
			' It's recommended to set your license key once at application startup.
			' License.LicenseKey = "YourIronPdfLicenseKey"; 
			' If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
			' For text extraction, the trial is fully functional for development.

			' Load the selected PDF using IronPDF
			Dim pdf = PdfDocument.FromFile(openFileDialog.FileName)

			' Extract all text content from the PDF using IronPDF
			Dim extractedText As String = pdf.ExtractAllText()

			' Display the extracted text in the RichTextBox
			' (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
			pdfDataRichTextBox.Text = extractedText
		Catch ex As Exception
			' Show error message if an exception occurs
			MessageBox.Show("An error occurred while processing the PDF file: " & ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error)
		End Try
	End If
End Sub
$vbLabelText   $csharpLabel

コードの内訳:

  • openFileDialog:PDFファイル用にフィルタリングされた、ファイル選択用の標準ダイアログです。
  • PdfDocument.FromFile(openFileDialog.FileName): このIronPDFメソッドは選択されたPDFをPdfDocumentオブジェクトにロードします。
  • pdf.ExtractAllText(): このチュートリアルのキーとなるIronPDF関数です。 PDF全体を読み取り、識別可能なすべてのテキストコンテンツを単一の文字列に抽出します。 これは、C#によるPDFテキストの解析シナリオに非常に役立ちます。
  • pdfDataRichTextBox.Text = extractedText;: 抽出されたテキストは、RichTextBoxTextプロパティに代入されます(pdfDataRichTextBoxという名前が、RichTextBoxコントロールに付けた名前と一致していることを確認してください)。

これはIronPDFがどのようにC#でPDFテキストを読むことを簡素化し、開発者が最小限の労力でプログラムからPDFコンテンツにアクセスできるようにするかを示しています。

ステップ 6: C# PDF テキスト ビューアー アプリケーションをビルドして実行する

1.Visual Studioの "Build "メニューから "Build Solution "を選択してください。
2.ビルドが成功したら、"F5 "を押すか、"Start "ボタンをクリックしてアプリケーションを実行してください。

アプリケーションウィンドウが表示されます。 PDFを開く&テキストを表示"ボタンをクリックし、コンピュータからPDFファイルを選択し、"開く"をクリックします。

PDFビューアC# Windowsアプリケーション(チュートリアル)、図6:アプリケーションの実行C#PDFテキストビューアアプリケーションの実行

そして、RichTextBoxは、選択されたPDFファイルから抽出されたテキストコンテンツを表示します。

PDFビューアC# Windowsアプリケーション(チュートリアル)、図7:PDFファイルを選択した後にテキストコンテンツを表示するPDFから抽出され、RichTextBoxに表示されるテキストコンテンツ。

MAUIアプリケーションでPDFを視覚的にレンダリングする情報(このチュートリアルのテキスト抽出の焦点とは異なります)については、"PDF Viewing in MAUI Tutorial"を調べてみてください。

結論:C#とIronPDFでPDFテキストコンテンツに簡単にアクセスする

以上の手順により、IronPDFを使用してPDFファイルからテキストコンテンツを効果的に抽出し表示するC# Windowsフォームアプリケーションを作成しました。 このアプローチは、.NETアプリケーションで表示、分析、またはさらなる処理のために、PDF内のテキスト情報にプログラムでアクセスする必要がある場合に価値があります。

IronPDFはC# PDFテキスト抽出のための堅牢な機能を提供しますが、それは包括的な機能セットの一部に過ぎません。 また、PDF内のテキスト検索、注釈の追加PDFドキュメントの印刷PDFの暗号化と復号化PDFフォームの編集など、より高度なタスクのためにIronPDFを使用することができます。

このチュートリアルは、C# アプリケーションで PDF テキストをアクセシブルにするという、ある特定のユースケースに焦点を当てています。 より複雑な要件に対応するために、この基礎の上に適応し、拡張することができます。

IronPDFの可能性を最大限に引き出すことにご興味があれば、ぜひご連絡ください:

  • IronPDFのドキュメントで詳細なガイドや例をご覧ください。
  • IronPDFを試用制限なしにプロダクションアプリケーションで使用するには、ライセンスキーが必要です。 ライセンスはIronPDFのウェブサイトからご購入いただけます。 ライセンスは、$799から始まります。
  • 無料トライアルで完全な商用バージョンを評価することもできます。

よくある質問

C#アプリケーションでPDFからテキストを抽出するにはどうすればいいですか?

IronPDFのExtractAllText()メソッドを使用して、C#アプリケーション内でPDFドキュメントからすべての判読可能なテキストコンテンツを効率的に抽出できます。

C#でPDFテキストビューアを作成するにはどのようなツールが必要ですか?

C#でPDFテキストビューアを作成するには、開発環境としてVisual Studioと、NuGetパッケージマネージャーを通じてインストールできるIronPDFライブラリが必要です。

Windows Formsアプリケーションで抽出したPDFテキストを表示するにはどうすればいいですか?

Windows Formsアプリケーションでは、PDFから抽出したテキストコンテンツを表示するためにRichTextBoxコントロールを使用できます。これにより、フォーマットされたテキストの表示が可能です。

C#アプリケーションでPDFファイルを選択するプロセスは何ですか?

PDFファイルを選択するには、ファイルダイアログを開くボタンコントロールをフォームに追加します。これにより、ユーザーは処理したいPDFファイルをブラウズして選択できます。

C#でのPDF処理中にエラーを処理するにはどうすればいいですか?

PDF処理コードをtry-catchブロックでカプセル化し、例外が発生した場合はMessageBox.Showを使用してエラーメッセージを表示することによってエラーを処理できます。

IronPDFはどのような追加の機能を提供しますか?

IronPDFはテキスト抽出以外にも、HTMLからPDFへの変換、注釈の追加、テキストの検索、PDFの暗号化と復号、印刷、PDFフォームの編集などの機能を提供します。

PDF処理のための新しいWindows FormsプロジェクトをVisual Studioで設定する方法

Visual Studioで 「Create a new project」を選択し、「Windows Forms App(.NET Framework)」を選択します。プロジェクトに名前を付け、「Create」をクリックしてPDF処理のためのプロジェクトを設定します。

C#でPDFテキストビューアアプリケーションを実行するために必要な手順は何ですか?

Visual Studioのビルドメニューから「ビルドソリューション」を選択し、F5キーを押すか「開始」をクリックしてアプリケーションを実行します。ボタンを使用してPDFファイルを選択し、そのテキストを表示します。

IronPDFはHTMLをPDFに変換するために使用できますか?

はい、IronPDFはRenderHtmlAsPdfメソッドでHTML文字列を、RenderHtmlFileAsPdfメソッドでHTMLファイルをPDFに変換できます。

PDFテキスト抽出の一般的なトラブルシューティングシナリオは何ですか?

一般的な問題には、標準外のフォントや暗号化されたPDFの処理が含まれます。テキスト抽出が失敗する場合は、PDFファイルがパスワード保護されていないことを確認し、フォントの互換性を確認してください。

IronPDF は .NET 10 と互換性がありますか?

はい。IronPDF は、.NET 10 と以前のバージョン (.NET 9、8、7、6、.NET Core、.NET Standard、.NET Framework など) の両方をサポートしています。つまり、互換性の問題が発生することなく、.NET 10 プロジェクトで IronPDF を使用して Windows フォーム テキスト ビューアーを構築できます。

カーティス・チャウ
テクニカルライター

Curtis Chauは、カールトン大学でコンピュータサイエンスの学士号を取得し、Node.js、TypeScript、JavaScript、およびReactに精通したフロントエンド開発を専門としています。直感的で美しいユーザーインターフェースを作成することに情熱を持ち、Curtisは現代のフレームワークを用いた開発や、構造の良い視覚的に魅力的なマニュアルの作成を楽しんでいます。

開発以外にも、CurtisはIoT(Internet of Things)への強い関心を持ち、ハードウェアとソフトウェアの統合方法を模索しています。余暇には、ゲームをしたりDiscordボットを作成したりして、技術に対する愛情と創造性を組み合わせています。