IRONPDFの使用

C# PDFファイルの読み取り: 簡単なチュートリアル

開発者であれば、PDFファイルからテキストを読み取ろうとして問題に直面したことがあるかもしれません。おそらく以下の状況のいずれかに該当するでしょう。

  1. アプリケーションを開発しており、2つのPDFドキュメントを入力として受け取り、それらのドキュメントの類似性を識別する機能を持たせます。

  2. あなたは、IronPDFを使用してPDFドキュメントを読み取るアプリケーションを開発中で、単語数を返す必要があります。

  3. IronPDFを使用してPDFファイルからデータを抽出し、構造化データベースに格納するアプリケーションを開発しています。

  4. アプリケーションを開発しており、PDFのテキスト内容を抽出して文字列に変換する必要があります。

  5. C#を使用してPDFファイルからデータを抽出することは、IronPDFの開発まで困難で複雑な作業でした。

    IronPDF Library Overviewは、開発者がPDFファイルを読み取るのを大幅に簡単にするライブラリです。

    IronPDF および Iron Software Suite の提供内容 についてさらに詳しく知ることができます。

    わずか2行のコードを使用するだけで、PDFファイルを読み取り、データをC#のテキストボックスに表示できます。 はい、たった2行のコードです。 PDFからすべての画像を抽出することもできます。 さらに、これらの画像を含む別のドキュメントを作成したり、要求に応じてアプリケーションに表示することができます。

    やり方をお見せしましょう。

    次のステップを踏んで任意のPDFファイルを選択し、その内容を表示するアプリケーションを進めることができます。

    以下の手順では、C#でPDFファイルを読む方法を示します:

    前提知識:

  6. C#プログラミングの基本知識

  7. C# GUIコントロールの基本知識

    このチュートリアルは、プログラミングの知識がない方でも進められるように設計しました。

    この情報を読むべき人

    どのC#の初心者も、IronPDFを使用してPDFファイルを読む方法を知っておくべきです。これはキャリアで確実に使用することになるからです。

    プロの開発者は、PDFドキュメントの読み取り、生成、操作を支援するIronPDFライブラリを理解するためにもこれを読むべきです。

    さて、私たちのプロジェクトでこのライブラリをどのように使ってPDFファイルを読むことができるでしょうか?

    デモンストレーションのためにWindows Formsアプリを使用しています。 コンソールアプリケーション、WPFアプリケーション、またはASP.NETウェブアプリケーションを好みに応じて使用できます。

    IronPDFライブラリのもう一つの大きな利点は、C#とVB.NETの両方で使用できることです。

    では、ただちにデモンストレーションを開始しましょう。


ステップ #1:Visual Studio プロジェクトを作成する

Visual Studioを開きます。 Visual Studio 2019を使用しています。

「Create New Project」をクリックしてください。

C# PDFファイルを読む: 簡単なチュートリアル, 図3: 新しいプロジェクトを作成

新しいプロジェクトを作成

テンプレートから「Windows フォーム アプリ」を選択し、「次へ」を押すと、次のウィンドウが表示されます。 プロジェクト名を入力してください。 私は「IronPDFを使用してPDFを読み取る」と書きました。

C# PDFファイルの読み取り: 簡単なチュートリアル、図16: Visual Studioを介したプロジェクトの構成

Visual Studioを使用してプロジェクトを構成する

次に「Next」をクリックすると、次のウィンドウが表示されます。 ドロップダウンメニューから「.NET Core 3.1」を選択します。

C# PDFファイルの読み取り: 簡単なチュートリアル, 図9: .NET Core 3.1バージョン

.NET Core 3.1 バージョン

「作成」ボタンをクリックすると、プロジェクトが以下のように作成されます。

C# PDFファイルの読み取り:簡単チュートリアル、図6:新しいWindows Formsアプリケーションの初期段階

新しいWindows Formsアプリケーションの初期段階


ステップ2: IronPDF NuGetパッケージのインストール

メニューバーからプロジェクトメニューをクリックすると、ドロップダウンリストが表示されます。 「Manage NuGet Packages」を選択し、クリックします。 次のウィンドウが表示されます:

C# PDFファイルを読む: 簡単なチュートリアル、図1: NuGetパッケージマネージャー

NuGet パッケージ マネージャー

「Browse」をクリックしてください。 次のウィンドウが表示されます:

C# PDF ファイルを読む: 簡単チュートリアル、図2:NuGet パッケージ マネージャー UI

NuGet パッケージ マネージャー UI

検索ボックスに「IronPDF」と入力し、"Enter"キーを押してください。 次のウィンドウが表示されます:

C# PDFファイルを読む方法: 簡単なチュートリアル, 図4: NuGetソリューション

NuGet ソリューション

IronPDFを選択してクリックしてください。 次のウィンドウが表示されます:

C# PDFファイルの読み取り: 簡単チュートリアル、図7: 無料のIronPdfをインストール

無料のIronPdfをインストール

「インストール」ボタンを押して、インストールが完了するのを待ちます。 インストールが成功すると、次のウィンドウが表示されます:

C# PDFファイルを読む: 簡単チュートリアル、図5: IronPdf for .NET

IronPdf for .NET

「OK」ボタンを押すと、準備完了です。

注: NuGet パッケージをダウンロードする他の方法もあります。 また、パッケージ マネージャー コンソールを使用して IronPdf をインストールすることもできます。 これを実行するには、パッケージ マネージャー コンソールを開き、次のコードを入力します:

Install-Package IronPdf

それはIronPDF の NuGet パッケージページからもダウンロードできます。

次のReadme.txtファイルが開きます:

C# PDFファイルを読む: 簡単チュートリアル, 図12: IronPdfのreadmeファイルとコードサンプル

IronPdf のリードミーファイルとコードサンプル

このライブラリについてのすべてのリンクを確認し、IronPDF のコードサンプルをもっと探索することをお勧めします。


ステップ3:Windowsフォームアプリを設計する

プロジェクトが作成され、NuGetパッケージがインストールされたら、次のステップは、ユーザーにファイルの参照を求め、その内容を表示するWindows Formsアプリを設計することです。

Form1 デザインを開く:

C# PDFファイル読込: 簡単チュートリアル, 図14: Form1デザインUI

Form1 デザイン UI

ウィンドウの左側にあるツールバーをクリックしてください。

C# PDFファイルを読む: 簡単なチュートリアル, 図15: ラベルとテキストボックスのためのツールボックスUI

ラベルとテキストボックスのためのツールボックスUI

ラベルを検索し、フォームデザインにドラッグ&ドロップしてください。

ラベルに名前を付けてください。 ここでは、「C# Read Pdf using IronPDF」と名付けました。

C# PDFファイルを読む:簡単チュートリアル、図20:ラベルが追加されたForm1 UI

Labelが追加されたForm1 UI

次に、テキストボックスを1つ(ファイルパスを表示するため)、ボタンを3つ(ファイルを参照するためのボタン1つ、IronPDFを使用してPDFファイルを読み込むためのボタン1つ、「テキストをクリアする」フィールド用のボタン1つ)、リッチテキストボックスを1つ(ファイル内容を読み込み表示するため)をドラッグアンドドロップします。

テキストボックスおよびリッチテキストボックスの「Read Only Property」を「False」に設定します。 これは、ユーザーが内容とファイルパスのみを読み取ることができるようにするためです。

C# PDFファイルを読む: 簡単なチュートリアル、図10: Form1の完全設計

フォーム1が完全に設計されました


ステップ#4: PDFファイルを閲覧するためのバックエンドコードを追加する

「ブラウズ」ボタンをダブルクリックすると、次のウィンドウが表示されます:

private void Browse_Click(object sender, EventArgs e)
{
}
private void Browse_Click(object sender, EventArgs e)
{
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
$vbLabelText   $csharpLabel

次に、以下のコードをBrowse_Click関数の中に記述してください:

private void Browse_Click(object sender, EventArgs e)
{
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)
*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        FilePath.Text = browseFile.FileName;
    }
}
private void Browse_Click(object sender, EventArgs e)
{
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)
*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        FilePath.Text = browseFile.FileName;
    }
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
	Dim browseFile As New OpenFileDialog With {
		.InitialDirectory = "D:\",
		.Title = "Browse Pdf Files",
		.CheckFileExists = True,
		.CheckPathExists = True,
		.DefaultExt = "pdf",
		.Filter = "pdf files (*.pdf) *.pdf",
		.FilterIndex = 2,
		.RestoreDirectory = True,
		.ReadOnlyChecked = True,
		.ShowReadOnly = True
	}
	If browseFile.ShowDialog() = DialogResult.OK Then
		FilePath.Text = browseFile.FileName
	End If
End Sub
$vbLabelText   $csharpLabel

OpenFileDialogue は、Windows Forms アプリのファイル ダイアログ コントロールのインスタンスを作成します。

初期パスをDドライブに設定しましたが、任意のドライブに設定することができます。

私はDefaultExt = "pdf"を設定しました。なぜなら、私たちはPDFファイルのみを読む必要があるからです。

フィルターを使用して、ブラウズファイルダイアログでPDFファイルのみが表示されるようにしました。

ユーザーが「OK」をクリックすると、ファイルパスのフィールドにファイルパスが表示されます。

ソリューションを実行し、「Browse」ボタンをテストしましょう。

C# PDFファイルの読み取り:簡単なチュートリアル、図10:Form1 UI

Form1 UI

「参照」ボタンを押すと、次のウィンドウが表示されます:

C# PDFファイルの読み取り: 簡単なチュートリアル、図11: PDFファイルを選択するためのファイルの参照ダイアログ

PDFファイルを選択するためのファイル選択ダイアログ

ファイルを選択し(私はIronPDFTest.pdfを選択しています)、"Open"を押します。 次のウィンドウが表示されます。

C# PDFファイルを読み取る: 簡単なチュートリアル、図13: C#内のPDF

C#でのPDF

次に、「Read」ボタンの裏側のコードを記述してファイルを読み込みましょう。


Step #5: IronPDFを使ってPDFドキュメントを読むためのバックエンドコードの追加

PDFファイルを読み取るコードは、複雑で理解しにくいものだと思っているかもしれません。

心配しないでください。 IronPDFは物事を簡単にし、すべてをはるかに容易にしました。 2行のコードだけでPDFファイルを簡単に読み取ることができます。

Form1のデザインに移動し、「Read」ボタンを「ダブルクリック」してください。 次のウィンドウが表示されます:

private void Read_Click(object sender, EventArgs e)
{
}
private void Read_Click(object sender, EventArgs e)
{
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
$vbLabelText   $csharpLabel

名前空間using IronPdfを追加して、IronPDFライブラリをインポートします。

using System;
using IronPdf;
using System;
using IronPdf;
Imports System
Imports IronPdf
$vbLabelText   $csharpLabel

Read_Click 関数の内部に次のコードを書いてください:

private void Read_Click(object sender, EventArgs e)
{
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
    FileContent.Text = pdf.ExtractAllText(); 
}
private void Read_Click(object sender, EventArgs e)
{
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
    FileContent.Text = pdf.ExtractAllText(); 
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
	Using pdf As PdfDocument = PdfDocument.FromFile(FilePath.Text)
		FileContent.Text = pdf.ExtractAllText()
	End Using
End Sub
$vbLabelText   $csharpLabel

FilePath は、読みたいPDFドキュメントの場所を表示するテキストフィールドの名前です。 ファイルの場所を動的に取得します。

IronPDFのExtractAllTextは、PDFページからすべてのデータを抽出するIronPDFの機能です。 このデータは、その後、リッチテキストボックスに表示され「ファイル内容」と名付けられます。

それでは、「クリアボタン」のコードを記述しましょう。 PDFドキュメントを読んだ後にスクリーンをクリアしたい場合のための追加アイテムです。

「Clear Button」をダブルクリックすると、次のコードに移動します。

void Clear_Click(object sender, EventArgs e)
{
}
void Clear_Click(object sender, EventArgs e)
{
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
$vbLabelText   $csharpLabel

以下のコードをClear_Click関数内に記述します:

void Clear_Click(object sender, EventArgs e)
{
    FileContent.Text = "";
    FilePath.Text = "";
}
void Clear_Click(object sender, EventArgs e)
{
    FileContent.Text = "";
    FilePath.Text = "";
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
	FileContent.Text = ""
	FilePath.Text = ""
End Sub
$vbLabelText   $csharpLabel

ソリューションを実行

「ブラウズ」ボタンをクリックして、読みたいドキュメントを選択してください。 私の場合、例としてIronPDF.pdfファイルを読んでいます。

C# PDFファイルの読み込み:簡単なチュートリアル、 図8:PDFドキュメント

PDFドキュメント

「開く」ボタンを押すと、次のウィンドウが表示されます。

C# PDFファイルを読み込む: 簡単なチュートリアル、図13: 選択されたPDFファイルを持つアプリケーション

選択済みPDFファイルを使用したアプリケーション

「Read」ボタンを押してください。 ファイルを読み取り、以下に示す内容を表示します。

C# PDFファイルを読む: 簡単なチュートリアル, 図19: PDFテキスト内容を表示

PDFテキスト内容を表示


サマリー

これは例のソリューションです。 PDFファイルに含まれるページ数、画像、テキストの量に関係なく、IronPDFはすべてのテキストと画像を抽出し、任意の目的で使用できるようにします。 ライブラリのライセンスを取得し、使用を開始するだけです。

これでチュートリアルが完了します。 すべて理解していただけたことを願っています。ご不明な点がありましたら、コメント欄にお気軽にご投稿ください。

プロジェクトのzipファイルをダウンロードできます。 Iron Software製品のフルパッケージを購入したい場合、特別オファーにより、今なら全てを2つの価格で購入することができます。 ライセンスとサポートに関する詳細が必要な場合は、Iron Softwareの価格情報をクリックしてください。 無料のトライアルライセンス提供も取得できます。

チペゴ
ソフトウェアエンジニア
チペゴは優れた傾聴能力を持ち、それが顧客の問題を理解し、賢明な解決策を提供する助けとなっています。彼は情報技術の学士号を取得後、2023年にIron Softwareチームに加わりました。現在、彼はIronPDFとIronOCRの2つの製品に注力していますが、顧客をサポートする新しい方法を見つけるにつれて、他の製品に関する知識も日々成長しています。Iron Softwareでの協力的な生活を楽しんでおり、さまざまな経験を持つチームメンバーが集まり、効果的で革新的な解決策を提供することに貢献しています。チペゴがデスクを離れているときは、良い本を楽しんだり、サッカーをしていることが多いです。
< 以前
ワンクリックで .NET PDF ジェネレーター
次へ >
PDF ドキュメントにパスワードを設定する方法