IRONPDFの使用

C# PDFファイルの読み取り: 簡単なチュートリアル

更新済み 11月 25, 2021
共有:

開発者であれば、PDFファイルからテキストを読み取ろうとして問題に直面したことがあるかもしれません。おそらく以下の状況のいずれかに該当するでしょう。

  1. アプリケーションを開発しており、2つのPDFドキュメントを入力として受け取り、それらのドキュメントの類似性を識別する機能を持たせます。

  2. アプリケーションを開発している際に、それが必要である PDFドキュメントを読み取る で、単語数を返す。

  3. アプリケーションを開発しています PDFファイルからデータを抽出します。 構造化されたデータベースに格納します。

  4. アプリケーションを開発している際に、それが必要である PDFテキストコンテンツの抽出 文字列に変換します。

  5. C#を使用してPDFファイルからデータを抽出することは、IronPDFの開発まで困難で複雑な作業でした。

    IronPDF は、開発者がPDFファイルを読み取るのを非常に簡単にするライブラリです。

    詳細については、 IronPDF と Iron Software Suite.

    わずか2行のコードを使用するだけで、PDFファイルを読み取り、データをC#のテキストボックスに表示できます。 はい、たった2行のコードです。 また すべての画像を抽出する PDFファイル内。 さらに、これらの画像を含む別のドキュメントを作成したり、要求に応じてアプリケーションに表示することができます。

    やり方をお見せしましょう。

    次のステップを踏んで任意のPDFファイルを選択し、その内容を表示するアプリケーションを進めることができます。

    以下の手順では、C#でPDFファイルを読む方法を示します:

    事前知識:

  6. C#プログラミングの基本知識

  7. C# GUIコントロールの基本知識

    このチュートリアルは、プログラミングの知識がない方でも進められるように設計しました。

    対象読者

    C#を学んでいる初心者は以下の点を知っておくべきです。 PDFファイルを読み込む これは確実にあなたのキャリアで使用するものだからです。

    プロフェッショナルな開発者はこれを読むべきです。IronPDFライブラリを理解することができ、PDFドキュメントの読み取り、生成、および操作を支援するからです。

    では、このライブラリをプロジェクトで使用してPDFファイルを読み取るにはどうすればよいでしょうか?

    デモンストレーションのためにWindows Formsアプリを使用しています。 コンソールアプリケーション、WPFアプリケーション、またはASP.NETウェブアプリケーションを、お好みに合わせて使用できます。

    IronPDFライブラリのもう一つの大きな利点は、C#とVB.NETの両方で使用できることです。

    では、ただちにデモンストレーションを開始しましょう。


ステップ #1:Visual Studio プロジェクトを作成する

Visual Studioを開きます。 Visual Studio 2019を使用しています。

「Create New Project」をクリックしてください。

C# PDFファイルの読み込み: 簡単なチュートリアル, 図3: 新しいプロジェクトの作成

新しいプロジェクトを作成

テンプレートから「Windows フォーム アプリ」を選択し、「次へ」を押すと、次のウィンドウが表示されます。 プロジェクト名を入力してください。 私は「IronPDFを使用してPDFを読み取る」と書きました。

C# PDFファイルの読み取り:簡単なチュートリアル、図16:Visual Studioを介したプロジェクトの設定

Visual Studio を使用したプロジェクトの構成

次に「Next」をクリックすると、次のウィンドウが表示されます。 ドロップダウンメニューから「.NET Core 3.1」を選択します。

C# PDFファイル読み取り: 簡単なチュートリアル、図9: .NET Core 3.1バージョン

.NET Core 3.1 バージョン

「作成」ボタンをクリックすると、プロジェクトが以下のように作成されます。

C# PDFファイル読み取り: 簡単なチュートリアル, 図6: 新しいWindows Formsアプリケーションの初期段階

新しいWindows Formsアプリケーションの初期段階


ステップ #2: IronPDF の NuGet パッケージをインストールする

メニューバーからプロジェクトメニューをクリックすると、ドロップダウンリストが表示されます。 「Manage NuGet Packages」を選択し、クリックします。 次のウィンドウが表示されます:

C# PDFファイルの読み取り: 簡単なチュートリアル、図1: NuGetパッケージマネージャー

NuGet パッケージ マネージャー

「Browse」をクリックしてください。 次のウィンドウが表示されます:

C# PDFファイルの読み取り: 簡単チュートリアル、図2: NuGetパッケージマネージャーUI

NuGet パッケージ マネージャー UI

検索ボックスに「IronPDF」と入力し、"Enter"キーを押してください。 次のウィンドウが表示されます:

C# PDFファイル読み込み:簡単なチュートリアル、図4:NuGetソリューション

NuGet ソリューション

IronPDFを選択してクリックしてください。 次のウィンドウが表示されます:

C# PDFファイルを読み込む: 簡単なチュートリアル, 図7: 無料のIronPDFをインストール

無料のIronPDFのインストール

「インストール」ボタンを押して、インストールが完了するのを待ちます。 インストールが成功すると、以下のウィンドウが表示されます:

C# PDFファイルを読み取る:簡単なチュートリアル、図5:IronPDF for .NET

IronPDF for .NET (アイアンPDF フォー ドットネット)

「OK」ボタンを押すと、準備完了です。

注: NuGet パッケージをダウンロードする他の方法もあります。 また、Package Manager Consoleを使用して IronPDF をインストールすることもできます。 これを実行するには、パッケージ マネージャー コンソールを開き、次のコードを入力します:

Install-Package IronPdf

以下でもダウンロードできます NuGetのウェブサイト.

次のReadme.txtファイルが開きます:

C# PDFファイルを読む:簡単なチュートリアル、図12:IronPDFのreadmeファイルのコードサンプル

IronPDFのreadmeファイルとコードサンプル

提案させていただくのは、すべてのリンクを確認し より多くのコードサンプルを探索する ライブラリについて。


ステップ3:Windowsフォームアプリを設計する

プロジェクトが作成され、NuGetパッケージがインストールされたら、次のステップは、ユーザーにファイルの参照を求め、その内容を表示するWindows Formsアプリを設計することです。

Form1 デザインを開く:

C# PDFファイルを読む: 簡単チュートリアル, 図14: Form1デザインUI

Form1 デザインUI

ウィンドウの左側にあるツールバーをクリックしてください。

C# PDFファイル読み取り:簡単なチュートリアル、図15:ラベルとテキストボックスのためのツールボックスUI

ラベルおよびテキストボックス用ツールボックスUI

ラベルを検索し、フォームデザインにドラッグ&ドロップしてください。

ラベルに名前を付けてください。 ここでは、「C# Read Pdf using IronPDF」と名付けました。

C# PDFファイルの読み取り: 簡単なチュートリアル、図20: ラベルが追加されたForm1のUI

ラベルを追加したForm1 UI

次に、テキストボックスをドラッグ&ドロップします。 (ファイルパスを表示する)3つのボタン (ファイルを閲覧するためのボタン1つ、IronPDFを使用してPDFファイルを読むためのボタン1つ、および「テキストをクリア」のフィールド用の3つ目のボタン。)そして、一つのRichTextBox (ファイル内容の読み取りと表示).

テキストボックスおよびリッチテキストボックスの「Read Only Property」を「False」に設定します。 これは、ユーザーが内容とファイルパスのみを読み取ることができるようにするためです。

C# PDFファイルを読み取る: 簡単なチュートリアル、図10: デザインが完了したForm1

Form1 フルデザイン済み


ステップ#4: PDFファイルを閲覧するためのバックエンドコードを追加する

「ブラウズ」ボタンをダブルクリックすると、次のウィンドウが表示されます:

private void Browse_Click(object sender, EventArgs e)
{
}
private void Browse_Click(object sender, EventArgs e)
{
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
VB   C#

次に、以下のコードをBrowse_Click関数の中に記述してください:

private void Browse_Click(object sender, EventArgs e)
{
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)
*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        FilePath.Text = browseFile.FileName;
    }
}
private void Browse_Click(object sender, EventArgs e)
{
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)
*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        FilePath.Text = browseFile.FileName;
    }
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
	Dim browseFile As New OpenFileDialog With {
		.InitialDirectory = "D:\",
		.Title = "Browse Pdf Files",
		.CheckFileExists = True,
		.CheckPathExists = True,
		.DefaultExt = "pdf",
		.Filter = "pdf files (*.pdf) *.pdf",
		.FilterIndex = 2,
		.RestoreDirectory = True,
		.ReadOnlyChecked = True,
		.ShowReadOnly = True
	}
	If browseFile.ShowDialog() = DialogResult.OK Then
		FilePath.Text = browseFile.FileName
	End If
End Sub
VB   C#

OpenFileDialogue は、Windows Forms アプリのファイルダイアログコントロールのインスタンスを作成します。

初期パスをDドライブに設定しましたが、任意のドライブに設定することができます。

DefaultExt = "pdf"と設定しましたので、PDFファイルのみを読み取る必要があります。

フィルターを使用して、ブラウズファイルダイアログでPDFファイルのみが表示されるようにしました。

ユーザーが「OK」をクリックすると、ファイルパスのフィールドにファイルパスが表示されます。

ソリューションを実行し、「Browse」ボタンをテストしましょう。

C# PDFファイルを読み取る方法:簡単なチュートリアル、図10: Form1 UI

Form1 UI (フォーム1 UI)

「参照」ボタンを押すと、次のウィンドウが表示されます:

C# PDFファイル読み取り: 簡単なチュートリアル、図11: PDFファイルを選択するためのファイル参照ダイアログ

PDFファイルを選択するためのファイルブラウズダイアログ

ファイルを選択 (IronPDFTest.pdfを選択しています。) 「開く」を押します。 次のウィンドウが表示されます。

C# で PDF ファイルを読む: 簡単なチュートリアル, 図 13: C# の PDF

C# でのPDF

次に、「Read」ボタンの裏側のコードを記述してファイルを読み込みましょう。


ステップ #5: IronPDFを使用してPDFドキュメントを読み取るためのバックエンドコードを追加する

PDFファイルを読み取るコードは、複雑で理解しにくいものだと思っているかもしれません。

心配しないでください。 IronPDFは物事を簡単にし、すべてをはるかに容易にしました。 2行のコードだけでPDFファイルを簡単に読み取ることができます。

Form1のデザインに移動し、「Read」ボタンを「ダブルクリック」してください。 次のウィンドウが表示されます:

private void Read_Click(object sender, EventArgs e)
{
}
private void Read_Click(object sender, EventArgs e)
{
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
VB   C#

名前空間 using IronPdf を追加して、IronPDFライブラリをインポートします。

using System;
using IronPdf;
using System;
using IronPdf;
Imports System
Imports IronPdf
VB   C#

次のコードをRead_Click関数内に書き込んでください:

private void Read_Click(object sender, EventArgs e)
{
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
    FileContent.Text = pdf.ExtractAllText(); 
}
private void Read_Click(object sender, EventArgs e)
{
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
    FileContent.Text = pdf.ExtractAllText(); 
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
	Using pdf As PdfDocument = PdfDocument.FromFile(FilePath.Text)
		FileContent.Text = pdf.ExtractAllText()
	End Using
End Sub
VB   C#

FilePathは、読み取りたいPDFドキュメントの場所を表示するテキストフィールドの名前です。 ファイルの場所を動的に取得します。

全てのテキストを抽出 これは、PDFページからすべてのデータを抽出するIronPDF機能です。 このデータは、その後、リッチテキストボックスに表示され「ファイル内容」と名付けられます。

それでは、「クリアボタン」のコードを記述しましょう。 PDFドキュメントを読んだ後にスクリーンをクリアしたい場合のための追加アイテムです。

「Clear Button」をダブルクリックすると、次のコードに移動します。

void Clear_Click(object sender, EventArgs e)
{
}
void Clear_Click(object sender, EventArgs e)
{
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
VB   C#

次のコードを Clear_Click 関数内に記述してください:

void Clear_Click(object sender, EventArgs e)
{
    FileContent.Text = "";
    FilePath.Text = "";
}
void Clear_Click(object sender, EventArgs e)
{
    FileContent.Text = "";
    FilePath.Text = "";
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
	FileContent.Text = ""
	FilePath.Text = ""
End Sub
VB   C#

ソリューションを実行

「ブラウズ」ボタンをクリックして、読みたいドキュメントを選択してください。 私の場合、例としてIronPDF.pdfファイルを読んでいます。

C# PDFファイルの読み取り: 簡単なチュートリアル, 図8: PDFドキュメント

PDF ドキュメント

「開く」ボタンを押すと、次のウィンドウが表示されます。

C# PDFファイル読み込み:簡単なチュートリアル 図13:選択されたPDFファイルを含むアプリケーション

選択されたPDFファイルによるアプリケーション

「Read」ボタンを押してください。 ファイルを読み取り、以下に示す内容を表示します。

C#でPDFファイルを読む: 簡単チュートリアル, 図19: PDFのテキスト内容を表示

PDFテキストコンテンツを表示


サマリー

これは例のソリューションです。 PDFファイルに含まれるページ数、画像、テキストの量に関係なく、IronPDFはすべてのテキストと画像を抽出し、任意の目的で使用できるようにします。 ライブラリのライセンスを取得し、使用を開始するだけです。

これでチュートリアルが完了します。 すべて理解していただけたことを願っています。ご不明な点がありましたら、コメント欄にお気軽にご投稿ください。

ダウンロードできます プロジェクトZIPファイル. アイアンソフトウェア製品のフルパッケージを購入したい場合、特別オファーにより、今なら全てを2つの価格で購入することができます。 ライセンスとサポートの詳細が必要な場合は、こちらをクリックしてください 料金ページ. 次のものも取得できます 無料トライアルライセンス

< 以前
ワンクリックで .NET PDF ジェネレーター
次へ >
PDF ドキュメントにパスワードを設定する方法

準備はできましたか? バージョン: 2024.9 新発売

無料のNuGetダウンロード 総ダウンロード数: 10,659,073 View Licenses >