フッターコンテンツにスキップ
IRONPDFの使用

C#チュートリアル: IronPDFを使用してPDFテキストコンテンツビューアを構築します(Windowsフォーム)

今日のデジタル時代において、PDFファイルは教育、ビジネス、個人使用など、多くのワークフローに不可欠です。 Node.jsは、テキスト、画像、表などの多様なデータを共有し、提示するための標準フォーマットです。

C# Windows Forms アプリケーション内で完全な PDF 文書を完全な視覚的忠実度で表示するには、専用のレンダリングコンポーネントが必要ですが、開発者はしばしば他のニーズを持っています。 時には、C#でPDFのテキストを読み、データを抽出したり、PDFのテキストコンテンツを表示して、すばやく確認したり、インデックスを作成したり、アクセシビリティを確保したりすることが目標になることもあります。

この記事では、強力な.NETライブラリであるIronPDFを使用したシンプルなC# PDFテキストコンテンツビューアの構築という、この特定のタスクに焦点を当てたアプリケーションの作成について説明します。 IronPdfを使ってPDFを読み込み、そのテキストコンテンツをWindowsフォームアプリケーションで効果的に抽出して表示する方法を学びます。

IronPDFとは何ですか?

IronPDFは、.NET開発者がアプリケーション内でPDFファイルを作成、編集、処理できるようにする包括的なC#ライブラリです。 HTML、画像、SVGをPDF文書に変換したり、このチュートリアルにとって重要なことですが、既存のPDFからコンテンツを読み出したりすることができます。 IronPDFは使いやすく設計されており、PDFファイルを操作するための幅広い機能を提供します。

PDFテキスト ビューアを構築するための要件

この C# PDF テキスト表示アプリケーションを作成するには、以下のものが必要です:

  • Visual Studio: Windows フォーム アプリケーションを作成するための統合開発環境 (IDE)。
  • IronPDF:テキスト抽出を含む PDF ドキュメントの読み取り、作成、操作機能を提供するNuGetパッケージ。

HTML から PDF への変換の概念を示す図 IronPDFはHTMLからPDFを作成することもできます。このチュートリアルで紹介するテキスト抽出とは別の機能です。

C#でIronPDFを使ってPDFテキストコンテンツビューアを作成するステップ

ステップ1: Visual Studioで新しいWindowsフォームアプリケーションを作成する

まず、Visual Studioを起動し、"Create a new project "をクリックします。リストから "Windows Forms App (.NET Framework) "または同様 for .NETテンプレートを選択します。

Visual Studio の新規プロジェクト ダイアログ Visual Studio新規プロジェクト作成

次に、プロジェクトの名前 (例: CSharpPdfTextReader) を入力し、[作成] ボタンをクリックします。 これは新しいWindows Forms Applicationプロジェクトを立ち上げます。

ステップ2:IronPDFライブラリをインストール

NuGetパッケージマネージャGUIを使用する

1.ソリューション・エクスプローラで、プロジェクトを右クリックし、"NuGetパッケージの管理... "を選択します。
2.参照"タブで "IronPdf "を検索してください。

  1. IronPdf パッケージを選択し、"インストール"をクリックします。

 Visual Studio のNuGetパッケージ マネージャーでIronPDFを検索 NuGetパッケージマネージャによるIronPDFのインストール

NuGetパッケージマネージャーコンソールを使用する

または、Package Manager Console(Tools ˶> NuGet Package Manager ˶> Package Manager Console)を開き、コマンドを実行してください:

Install-Package IronPdf

これはIronPDFとその依存関係をダウンロードし、あなたのプロジェクトにインストールします。

ステップ 3: テキスト表示のためにフォームにリッチテキストボックスを追加する

PDF から抽出されたテキスト コンテンツを表示するには、RichTextBox コントロールを使用します。 RichTextBox はフォーマットされたテキストを表示するのに適していますが、このチュートリアルでは、その主な役割はIronPDFによって抽出されたプレーンテキストを表示することです。 PDFの元のビジュアルレイアウトをレンダリングしようとすることなく、テキスト情報を効果的に示します。

RichTextBox を追加するには:

1.デザイナー・ビューでフォームを開きます。
2.ツールボックス(表示 > ツールボックス)に移動します。

  1. "共通コントロール"の下にある RichTextBox を見つけて、フォームにドラッグします。
    4.必要に応じて、サイズと位置を調整してください。 プロパティ ウィンドウで、その Name (例: pdfDataRichTextBox) を設定し、その Dock プロパティを Fill に設定して、フォームの大部分を占めるようにすることができます。

PDF ビューア C# Windows アプリケーション (チュートリアル)、図 4: Form1 の RickTextBox にアクセスする 抽出されたPDFテキストを表示するためにForm1にRichTextBoxを追加する

ステップ4: PDFファイルを選択するボタンを追加する

フォームに Button コントロールを追加します。 ユーザーはこのボタンをクリックしてファイルダイアログを開き、テキスト抽出用のPDFファイルを選択します。

  1. ツールボックスからフォームに Button をドラッグします。
  2. プロパティ ウィンドウで、Name (例: openBtn) と Text (例:"PDF を開いてテキストを表示") を設定します。

PDF ビューアー C# Windows アプリケーション (チュートリアル)、図 5: Form1 に新しいボタンを追加する PDF選択をトリガーするためにForm1にボタンを追加する

ステップ 5: PDF を読み込んでテキストを抽出する C# コードを追加する

追加したボタン ("PDF を開いてテキストを表示") をダブルクリックして、Click イベント ハンドラーを Form1.cs に作成します。

まず、Form1.cs ファイルの先頭にIronPDF名前空間がインポートされていることを確認します。

using IronPdf;
using System; // For EventArgs, Exception
using System.Windows.Forms; // For OpenFileDialog, MessageBox, DialogResult, etc.
using IronPdf;
using System; // For EventArgs, Exception
using System.Windows.Forms; // For OpenFileDialog, MessageBox, DialogResult, etc.
$vbLabelText   $csharpLabel

では、ボタンクリックのイベントハンドラを実装してください。 このコードは次のようになります:

1.ユーザーにPDFファイルを選択するように促します。
2.選択したPDFを読み込むにはIronPDFを使用してください。

  1. IronPDF の ExtractAllText() メソッドを使用して、PDF からすべてのテキストを取得します。
  2. 抽出したテキストをRichTextBoxに表示します。
private void openBtn_Click(object sender, EventArgs e)
{
    // Create an OpenFileDialog to open PDF files
    var openFileDialog = new OpenFileDialog
    {
        Filter = "PDF files (*.pdf)|*.pdf|All files (*.*)|*.*", // Filter to show only PDFs
        Title = "Select a PDF file to extract text from" // Dialog title
    };

    // Show dialog and check if the user selected a file
    if (openFileDialog.ShowDialog() == DialogResult.OK)
    {
        try
        {
            // It's recommended to set your license key once at application startup.
            // License.LicenseKey = "YourIronPdfLicenseKey"; 
            // If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
            // For text extraction, the trial is fully functional for development.

            // Load the selected PDF using IronPDF
            var pdf = PdfDocument.FromFile(openFileDialog.FileName);

            // Extract all text content from the PDF using IronPDF
            string extractedText = pdf.ExtractAllText();

            // Display the extracted text in the RichTextBox
            // (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
            pdfDataRichTextBox.Text = extractedText; 
        }
        catch (Exception ex)
        {
            // Show error message if an exception occurs
            MessageBox.Show("An error occurred while processing the PDF file: " + ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error);
        }
    }
}
private void openBtn_Click(object sender, EventArgs e)
{
    // Create an OpenFileDialog to open PDF files
    var openFileDialog = new OpenFileDialog
    {
        Filter = "PDF files (*.pdf)|*.pdf|All files (*.*)|*.*", // Filter to show only PDFs
        Title = "Select a PDF file to extract text from" // Dialog title
    };

    // Show dialog and check if the user selected a file
    if (openFileDialog.ShowDialog() == DialogResult.OK)
    {
        try
        {
            // It's recommended to set your license key once at application startup.
            // License.LicenseKey = "YourIronPdfLicenseKey"; 
            // If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
            // For text extraction, the trial is fully functional for development.

            // Load the selected PDF using IronPDF
            var pdf = PdfDocument.FromFile(openFileDialog.FileName);

            // Extract all text content from the PDF using IronPDF
            string extractedText = pdf.ExtractAllText();

            // Display the extracted text in the RichTextBox
            // (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
            pdfDataRichTextBox.Text = extractedText; 
        }
        catch (Exception ex)
        {
            // Show error message if an exception occurs
            MessageBox.Show("An error occurred while processing the PDF file: " + ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error);
        }
    }
}
$vbLabelText   $csharpLabel

コードの内訳:

  • openFileDialog: PDF ファイル用にフィルタリングされたファイル選択用の標準ダイアログ。
  • PdfDocument.FromFile(openFileDialog.FileName): このIronPDFメソッドは、選択した PDF を PdfDocument オブジェクトに読み込みます。
  • pdf.ExtractAllText(): これは、このチュートリアルの主要なIronPDF関数です。 PDF全体を読み取り、識別可能なすべてのテキストコンテンツを単一の文字列に抽出します。 これは、C#によるPDFテキストの解析シナリオに非常に役立ちます。
  • pdfDataRichTextBox.Text = extractedText;: 抽出されたテキストは、RichTextBoxText プロパティに割り当てられます (名前 pdfDataRichTextBox が RichTextBox コントロールに付けた名前と一致していることを確認してください)。

これはIronPDFがどのようにC#でPDFテキストを読むことを簡素化し、開発者が最小限の労力でプログラムからPDFコンテンツにアクセスできるようにするかを示しています。

ステップ 6: C# PDF テキスト ビューアー アプリケーションをビルドして実行する

1.Visual Studioの "Build "メニューから "Build Solution "を選択してください。
2.ビルドが成功したら、"F5 "を押すか、"Start "ボタンをクリックしてアプリケーションを実行してください。

アプリケーションウィンドウが表示されます。 PDFを開く&テキストを表示"ボタンをクリックし、コンピュータからPDFファイルを選択し、"開く"をクリックします。

PDF ビューア C# Windows アプリケーション (チュートリアル)、図 6: アプリケーションの実行 C#PDFテキストビューアアプリケーションの実行

RichTextBox は、選択した PDF ファイルから抽出されたテキスト コンテンツを表示します。

PDF ビューア C# Windows アプリケーション (チュートリアル)、図 7: PDF ファイルを選択した後にテキスト コンテンツを表示する PDF から抽出され、RichTextBox に表示されるテキスト コンテンツ

MAUIアプリケーションでPDFを視覚的にレンダリングする情報(このチュートリアルのテキスト抽出の焦点とは異なります)については、"PDF Viewing in MAUI Tutorial"を調べてみてください。

結論:C#とIronPDFでPDFテキストコンテンツに簡単にアクセスする

以上の手順により、IronPDFを使用してPDFファイルからテキストコンテンツを効果的に抽出し表示するC# Windowsフォームアプリケーションを作成しました。 このアプローチは、.NETアプリケーションで表示、分析、またはさらなる処理のために、PDF内のテキスト情報にプログラムでアクセスする必要がある場合に価値があります。

IronPDFはC# PDFテキスト抽出のための堅牢な機能を提供しますが、それは包括的な機能セットの一部に過ぎません。 また、PDF内のテキスト検索、注釈の追加PDFドキュメントの印刷PDFの暗号化と復号化PDFフォームの編集など、より高度なタスクのためにIronPDFを使用することができます。

このチュートリアルは、C# アプリケーションで PDF テキストをアクセシブルにするという、ある特定のユースケースに焦点を当てています。 より複雑な要件に対応するために、この基礎の上に適応し、拡張することができます。

IronPDFの可能性を最大限に引き出すことにご興味があれば、ぜひご連絡ください:

  • IronPDFのドキュメントで詳細なガイドや例をご覧ください。
  • IronPDFを試用制限なしにプロダクションアプリケーションで使用するには、ライセンスキーが必要です。 ライセンスはIronPDFのウェブサイトからご購入いただけます。 ライセンスは$799から始まります。
  • 無料トライアルで完全な商用バージョンを評価することもできます。

よくある質問

C#アプリケーションでPDFからテキストを抽出するにはどうすればいいですか?

IronPDFのExtractAllText()メソッドを使用して、C#アプリケーション内でPDFドキュメントからすべての判読可能なテキストコンテンツを効率的に抽出できます。

C#でPDFテキストビューアを作成するにはどのようなツールが必要ですか?

C#でPDFテキストビューアを作成するには、開発環境としてVisual Studioと、NuGetパッケージマネージャーを通じてインストールできるIronPDFライブラリが必要です。

Windows Formsアプリケーションで抽出したPDFテキストを表示するにはどうすればいいですか?

Windows Formsアプリケーションでは、PDFから抽出したテキストコンテンツを表示するためにRichTextBoxコントロールを使用できます。これにより、フォーマットされたテキストの表示が可能です。

C#アプリケーションでPDFファイルを選択するプロセスは何ですか?

PDFファイルを選択するには、ファイルダイアログを開くボタンコントロールをフォームに追加します。これにより、ユーザーは処理したいPDFファイルをブラウズして選択できます。

C#でのPDF処理中にエラーを処理するにはどうすればいいですか?

PDF処理コードをtry-catchブロックでカプセル化し、例外が発生した場合はMessageBox.Showを使用してエラーメッセージを表示することによってエラーを処理できます。

IronPDFはどのような追加の機能を提供しますか?

IronPDFはテキスト抽出以外にも、HTMLからPDFへの変換、注釈の追加、テキストの検索、PDFの暗号化と復号、印刷、PDFフォームの編集などの機能を提供します。

PDF処理のための新しいWindows FormsプロジェクトをVisual Studioで設定する方法

Visual Studioで 「Create a new project」を選択し、「Windows Forms App(.NET Framework)」を選択します。プロジェクトに名前を付け、「Create」をクリックしてPDF処理のためのプロジェクトを設定します。

C#でPDFテキストビューアアプリケーションを実行するために必要な手順は何ですか?

Visual Studioのビルドメニューから「ビルドソリューション」を選択し、F5キーを押すか「開始」をクリックしてアプリケーションを実行します。ボタンを使用してPDFファイルを選択し、そのテキストを表示します。

IronPDFはHTMLをPDFに変換するために使用できますか?

はい、IronPDFはRenderHtmlAsPdfメソッドでHTML文字列を、RenderHtmlFileAsPdfメソッドでHTMLファイルをPDFに変換できます。

PDFテキスト抽出の一般的なトラブルシューティングシナリオは何ですか?

一般的な問題には、標準外のフォントや暗号化されたPDFの処理が含まれます。テキスト抽出が失敗する場合は、PDFファイルがパスワード保護されていないことを確認し、フォントの互換性を確認してください。

IronPDF は .NET 10 と互換性がありますか?

はい。IronPDF は、.NET 10 と以前のバージョン (.NET 9、8、7、6、.NET Core、.NET Standard、.NET Framework など) の両方をサポートしています。つまり、互換性の問題が発生することなく、.NET 10 プロジェクトで IronPDF を使用して Windows フォーム テキスト ビューアーを構築できます。

カーティス・チャウ
テクニカルライター

Curtis Chauは、カールトン大学でコンピュータサイエンスの学士号を取得し、Node.js、TypeScript、JavaScript、およびReactに精通したフロントエンド開発を専門としています。直感的で美しいユーザーインターフェースを作成することに情熱を持ち、Curtisは現代のフレームワークを用いた開発や、構造の良い視覚的に魅力的なマニュアルの作成を楽しんでいます。

開発以外にも、CurtisはIoT(Internet of Things)への強い関心を持ち、ハードウェアとソフトウェアの統合方法を模索しています。余暇には、ゲームをしたりDiscordボットを作成したりして、技術に対する愛情と創造性を組み合わせています。

Iron Support Team

We're online 24 hours, 5 days a week.
Chat
Email
Call Me