C#チュートリアル: IronPDFを使用してPDFテキストコンテンツビューアを構築します(Windowsフォーム)
今日のデジタル時代において、PDFファイルは教育、ビジネス、個人使用など、多くのワークフローに不可欠です。 Node.jsは、テキスト、画像、表などの多様なデータを共有し、提示するための標準フォーマットです。
C# Windows Forms アプリケーション内で完全な PDF 文書を完全な視覚的忠実度で表示するには、専用のレンダリングコンポーネントが必要ですが、開発者はしばしば他のニーズを持っています。 時には、C#でPDFのテキストを読み、データを抽出したり、PDFのテキストコンテンツを表示して、すばやく確認したり、インデックスを作成したり、アクセシビリティを確保したりすることが目標になることもあります。
この記事では、強力な.NETライブラリであるIronPDFを使用したシンプルなC# PDFテキストコンテンツビューアの構築という、この特定のタスクに焦点を当てたアプリケーションの作成について説明します。 IronPdfを使ってPDFを読み込み、そのテキストコンテンツをWindowsフォームアプリケーションで効果的に抽出して表示する方法を学びます。
IronPDFとは何ですか?
IronPDFは、.NET開発者がアプリケーション内でPDFファイルを作成、編集、処理できるようにする包括的なC#ライブラリです。 HTML、画像、SVGをPDF文書に変換したり、このチュートリアルにとって重要なことですが、既存のPDFからコンテンツを読み出したりすることができます。 IronPDFは使いやすく設計されており、PDFファイルを操作するための幅広い機能を提供します。
PDFテキスト ビューアを構築するための要件
この C# PDF テキスト表示アプリケーションを作成するには、以下のものが必要です:
- Visual Studio:Windows Formsアプリケーションを作成するための統合開発環境(IDE)。
- IronPdf:テキスト抽出を含む、PDF文書の読み取り、作成、操作機能を提供するNuGetパッケージ。
HTMLからPDFへの変換コンセプトを示すイラスト。 IronPDFはHTMLからPDFを作成することもできます。このチュートリアルで紹介するテキスト抽出とは別の機能です。
C#でIronPDFを使ってPDFテキストコンテンツビューアを作成するステップ
ステップ1: Visual Studioで新しいWindowsフォームアプリケーションを作成する
まず、Visual Studioを起動し、"Create a new project "をクリックします。リストから "Windows Forms App (.NET Framework) "または同様の.NETテンプレートを選択します。
Visual Studio の新規プロジェクト ダイアログ。 ビジュアルスタジオ新規プロジェクト作成
次に、プロジェクトの名前(CSharpPdfTextReaderなど)を入力し、[作成]ボタンをクリックします。 これは新しいWindows Forms Applicationプロジェクトを立ち上げます。
ステップ2:IronPDFライブラリをインストール
NuGetパッケージマネージャGUIを使用する。
1.ソリューション・エクスプローラで、プロジェクトを右クリックし、"NuGetパッケージの管理... "を選択します。
2.参照"タブで "IronPdf "を検索してください。
3.IronPdfパッケージを選択し、"インストール"をクリックしてください。
VisualStudioのNuGetパッケージマネージャでPDFを検索する。 NuGetパッケージマネージャによるIronPDFのインストール
NuGetパッケージマネージャーコンソールを使用する。
または、Package Manager Console(Tools ˶> NuGet Package Manager ˶> Package Manager Console)を開き、コマンドを実行してください:
Install-Package IronPdf
これはIronPDFとその依存関係をダウンロードし、あなたのプロジェクトにインストールします。
ステップ 3: テキスト表示のためにフォームにリッチテキストボックスを追加する
PDFから抽出されたテキストコンテンツを表示するために、RichTextBoxコントロールを使用します。 RichTextBoxはフォーマットされたテキストを表示するのに適していますが、このチュートリアルではIronPDFによって抽出されたプレーンテキストを表示するのが主な役割です。 PDFの元のビジュアルレイアウトをレンダリングしようとすることなく、テキスト情報を効果的に示します。
RichTextBoxを追加するには:
1.デザイナー・ビューでフォームを開きます。
2.ツールボックス(表示 > ツールボックス)に移動します。
3.Common Controls"でRichTextBoxを見つけ、フォームにドラッグします。
4.必要に応じて、サイズと位置を調整してください。 プロパティウィンドウでは、Nameを設定し(例えば、pdfDataRichTextBox)、フォームの大部分を占めるようにしたい場合は、DockプロパティをFillに設定します。
PDFビューアC# Windowsアプリケーション(チュートリアル)、図4:Form1のRickTextBoxにアクセスする。 抽出されたPDFテキストを表示するためにForm1にRichTextBoxを追加する。
ステップ4: PDFファイルを選択するボタンを追加する
フォームにButtonコントロールを追加します。 ユーザーはこのボタンをクリックしてファイルダイアログを開き、テキスト抽出用のPDFファイルを選択します。
1.ツールボックスからボタンをフォームにドラッグします。
2.プロパティウィンドウで、Name(例:openBtn)とText(例:"Open PDF & Display Text")を設定します。
PDFビューアC# Windowsアプリケーション(チュートリアル)、図5: Form1に新しいボタンを追加する。 PDF選択をトリガーするためにForm1にボタンを追加する。
ステップ 5: PDF を読み込んでテキストを抽出する C# コードを追加する
Form1.csにClickイベントハンドラを作成するために、追加したボタン("PDFを開いてテキストを表示する")をダブルクリックします。
まず、Form1.csファイルの先頭にIronPDF名前空間がインポートされていることを確認してください:
using IronPdf;
using System; // For EventArgs, Exception
using System.Windows.Forms; // For OpenFileDialog, MessageBox, DialogResult, etc.using IronPdf;
using System; // For EventArgs, Exception
using System.Windows.Forms; // For OpenFileDialog, MessageBox, DialogResult, etc.Imports IronPdf
Imports System ' For EventArgs, Exception
Imports System.Windows.Forms ' For OpenFileDialog, MessageBox, DialogResult, etc.では、ボタンクリックのイベントハンドラを実装してください。 このコードは次のようになります:
1.ユーザーにPDFファイルを選択するように促します。
2.選択したPDFを読み込むにはIronPDFを使用してください。
3.PDFからすべてのテキストを取得するにはIronPDFのExtractAllText()メソッドを使用してください。
4.この抽出されたテキストをRichTextBoxに表示します。
private void openBtn_Click(object sender, EventArgs e)
{
// Create an OpenFileDialog to open PDF files
var openFileDialog = new OpenFileDialog
{
Filter = "PDF files (*.pdf)|*.pdf|All files (*.*)|*.*", // Filter to show only PDFs
Title = "Select a PDF file to extract text from" // Dialog title
};
// Show dialog and check if the user selected a file
if (openFileDialog.ShowDialog() == DialogResult.OK)
{
try
{
// It's recommended to set your license key once at application startup.
// License.LicenseKey = "YourIronPdfLicenseKey";
// If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
// For text extraction, the trial is fully functional for development.
// Load the selected PDF using IronPDF
var pdf = PdfDocument.FromFile(openFileDialog.FileName);
// Extract all text content from the PDF using IronPDF
string extractedText = pdf.ExtractAllText();
// Display the extracted text in the RichTextBox
// (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
pdfDataRichTextBox.Text = extractedText;
}
catch (Exception ex)
{
// Show error message if an exception occurs
MessageBox.Show("An error occurred while processing the PDF file: " + ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error);
}
}
}private void openBtn_Click(object sender, EventArgs e)
{
// Create an OpenFileDialog to open PDF files
var openFileDialog = new OpenFileDialog
{
Filter = "PDF files (*.pdf)|*.pdf|All files (*.*)|*.*", // Filter to show only PDFs
Title = "Select a PDF file to extract text from" // Dialog title
};
// Show dialog and check if the user selected a file
if (openFileDialog.ShowDialog() == DialogResult.OK)
{
try
{
// It's recommended to set your license key once at application startup.
// License.LicenseKey = "YourIronPdfLicenseKey";
// If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
// For text extraction, the trial is fully functional for development.
// Load the selected PDF using IronPDF
var pdf = PdfDocument.FromFile(openFileDialog.FileName);
// Extract all text content from the PDF using IronPDF
string extractedText = pdf.ExtractAllText();
// Display the extracted text in the RichTextBox
// (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
pdfDataRichTextBox.Text = extractedText;
}
catch (Exception ex)
{
// Show error message if an exception occurs
MessageBox.Show("An error occurred while processing the PDF file: " + ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error);
}
}
}Private Sub openBtn_Click(ByVal sender As Object, ByVal e As EventArgs)
' Create an OpenFileDialog to open PDF files
Dim openFileDialog As New OpenFileDialog With {
.Filter = "PDF files (*.pdf)|*.pdf|All files (*.*)|*.*",
.Title = "Select a PDF file to extract text from"
}
' Show dialog and check if the user selected a file
If openFileDialog.ShowDialog() = DialogResult.OK Then
Try
' It's recommended to set your license key once at application startup.
' License.LicenseKey = "YourIronPdfLicenseKey";
' If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
' For text extraction, the trial is fully functional for development.
' Load the selected PDF using IronPDF
Dim pdf = PdfDocument.FromFile(openFileDialog.FileName)
' Extract all text content from the PDF using IronPDF
Dim extractedText As String = pdf.ExtractAllText()
' Display the extracted text in the RichTextBox
' (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
pdfDataRichTextBox.Text = extractedText
Catch ex As Exception
' Show error message if an exception occurs
MessageBox.Show("An error occurred while processing the PDF file: " & ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error)
End Try
End If
End Subコードの内訳:
openFileDialog:PDFファイル用にフィルタリングされた、ファイル選択用の標準ダイアログです。PdfDocument.FromFile(openFileDialog.FileName): このIronPDFメソッドは選択されたPDFをPdfDocumentオブジェクトにロードします。pdf.ExtractAllText(): このチュートリアルのキーとなるIronPDF関数です。 PDF全体を読み取り、識別可能なすべてのテキストコンテンツを単一の文字列に抽出します。 これは、C#によるPDFテキストの解析シナリオに非常に役立ちます。pdfDataRichTextBox.Text = extractedText;: 抽出されたテキストは、RichTextBoxのTextプロパティに代入されます(pdfDataRichTextBoxという名前が、RichTextBoxコントロールに付けた名前と一致していることを確認してください)。
これはIronPDFがどのようにC#でPDFテキストを読むことを簡素化し、開発者が最小限の労力でプログラムからPDFコンテンツにアクセスできるようにするかを示しています。
ステップ 6: C# PDF テキスト ビューアー アプリケーションをビルドして実行する
1.Visual Studioの "Build "メニューから "Build Solution "を選択してください。
2.ビルドが成功したら、"F5 "を押すか、"Start "ボタンをクリックしてアプリケーションを実行してください。
アプリケーションウィンドウが表示されます。 PDFを開く&テキストを表示"ボタンをクリックし、コンピュータからPDFファイルを選択し、"開く"をクリックします。
PDFビューアC# Windowsアプリケーション(チュートリアル)、図6:アプリケーションの実行。 C#PDFテキストビューアアプリケーションの実行
そして、RichTextBoxは、選択されたPDFファイルから抽出されたテキストコンテンツを表示します。
PDFビューアC# Windowsアプリケーション(チュートリアル)、図7:PDFファイルを選択した後にテキストコンテンツを表示する。 PDFから抽出され、RichTextBoxに表示されるテキストコンテンツ。
MAUIアプリケーションでPDFを視覚的にレンダリングする情報(このチュートリアルのテキスト抽出の焦点とは異なります)については、"PDF Viewing in MAUI Tutorial"を調べてみてください。
結論:C#とIronPDFでPDFテキストコンテンツに簡単にアクセスする
以上の手順により、IronPDFを使用してPDFファイルからテキストコンテンツを効果的に抽出し表示するC# Windowsフォームアプリケーションを作成しました。 このアプローチは、.NETアプリケーションで表示、分析、またはさらなる処理のために、PDF内のテキスト情報にプログラムでアクセスする必要がある場合に価値があります。
IronPDFはC# PDFテキスト抽出のための堅牢な機能を提供しますが、それは包括的な機能セットの一部に過ぎません。 また、PDF内のテキスト検索、注釈の追加、PDFドキュメントの印刷、PDFの暗号化と復号化、PDFフォームの編集など、より高度なタスクのためにIronPDFを使用することができます。
このチュートリアルは、C# アプリケーションで PDF テキストをアクセシブルにするという、ある特定のユースケースに焦点を当てています。 より複雑な要件に対応するために、この基礎の上に適応し、拡張することができます。
IronPDFの可能性を最大限に引き出すことにご興味があれば、ぜひご連絡ください:
- IronPDFのドキュメントで詳細なガイドや例をご覧ください。
- IronPDFを試用制限なしにプロダクションアプリケーションで使用するには、ライセンスキーが必要です。 ライセンスはIronPDFのウェブサイトからご購入いただけます。 ライセンスは、$799から始まります。
- 無料トライアルで完全な商用バージョンを評価することもできます。
よくある質問
C#アプリケーションでPDFからテキストを抽出するにはどうすればいいですか?
IronPDFのExtractAllText()メソッドを使用して、C#アプリケーション内でPDFドキュメントからすべての判読可能なテキストコンテンツを効率的に抽出できます。
C#でPDFテキストビューアを作成するにはどのようなツールが必要ですか?
C#でPDFテキストビューアを作成するには、開発環境としてVisual Studioと、NuGetパッケージマネージャーを通じてインストールできるIronPDFライブラリが必要です。
Windows Formsアプリケーションで抽出したPDFテキストを表示するにはどうすればいいですか?
Windows Formsアプリケーションでは、PDFから抽出したテキストコンテンツを表示するためにRichTextBoxコントロールを使用できます。これにより、フォーマットされたテキストの表示が可能です。
C#アプリケーションでPDFファイルを選択するプロセスは何ですか?
PDFファイルを選択するには、ファイルダイアログを開くボタンコントロールをフォームに追加します。これにより、ユーザーは処理したいPDFファイルをブラウズして選択できます。
C#でのPDF処理中にエラーを処理するにはどうすればいいですか?
PDF処理コードをtry-catchブロックでカプセル化し、例外が発生した場合はMessageBox.Showを使用してエラーメッセージを表示することによってエラーを処理できます。
IronPDFはどのような追加の機能を提供しますか?
IronPDFはテキスト抽出以外にも、HTMLからPDFへの変換、注釈の追加、テキストの検索、PDFの暗号化と復号、印刷、PDFフォームの編集などの機能を提供します。
PDF処理のための新しいWindows FormsプロジェクトをVisual Studioで設定する方法
Visual Studioで 「Create a new project」を選択し、「Windows Forms App(.NET Framework)」を選択します。プロジェクトに名前を付け、「Create」をクリックしてPDF処理のためのプロジェクトを設定します。
C#でPDFテキストビューアアプリケーションを実行するために必要な手順は何ですか?
Visual Studioのビルドメニューから「ビルドソリューション」を選択し、F5キーを押すか「開始」をクリックしてアプリケーションを実行します。ボタンを使用してPDFファイルを選択し、そのテキストを表示します。
IronPDFはHTMLをPDFに変換するために使用できますか?
はい、IronPDFはRenderHtmlAsPdfメソッドでHTML文字列を、RenderHtmlFileAsPdfメソッドでHTMLファイルをPDFに変換できます。
PDFテキスト抽出の一般的なトラブルシューティングシナリオは何ですか?
一般的な問題には、標準外のフォントや暗号化されたPDFの処理が含まれます。テキスト抽出が失敗する場合は、PDFファイルがパスワード保護されていないことを確認し、フォントの互換性を確認してください。
IronPDF は .NET 10 と互換性がありますか?
はい。IronPDF は、.NET 10 と以前のバージョン (.NET 9、8、7、6、.NET Core、.NET Standard、.NET Framework など) の両方をサポートしています。つまり、互換性の問題が発生することなく、.NET 10 プロジェクトで IronPDF を使用して Windows フォーム テキスト ビューアーを構築できます。






