IRONPDFの使用

C# PDFファイルの読み取り: 簡単なチュートリアル

更新済み 2023年12月2日
共有:

開発者であれば、PDFファイルからテキストを読み取ろうとして問題に直面したことがあるかもしれません。おそらく以下の状況のいずれかに該当するでしょう。

  1. アプリケーションを開発しており、2つのPDFドキュメントを入力として受け取り、それらのドキュメントの類似性を識別する機能を持たせます。

  2. アプリケーションを開発している際に、それが必要であるIronPDFでPDFドキュメントを読むで、単語数を返す。

  3. アプリケーションを開発していますIronPDFを使ってPDFファイルからデータを取り出す構造化されたデータベースに格納します。

  4. アプリケーションを開発している際に、それが必要であるPDFテキストコンテンツの抽出を作成し、文字列に変換します。

  5. C#を使用してPDFファイルからデータを抽出することは、IronPDFの開発まで困難で複雑な作業でした。

    IronPDFライブラリの概要は、開発者がPDFファイルを読み取るのを非常に簡単にするライブラリです。

    詳細については、IronPDFとIron Software Suiteが提供するもの.

    わずか2行のコードを使用するだけで、PDFファイルを読み取り、データをC#のテキストボックスに表示できます。 はい、たった2行のコードです。 またPDFからすべての画像を抽出. さらに、これらの画像を含む別のドキュメントを作成したり、要求に応じてアプリケーションに表示することができます。

    やり方をお見せしましょう。

    次のステップを踏んで任意のPDFファイルを選択し、その内容を表示するアプリケーションを進めることができます。

    以下の手順では、C#でPDFファイルを読む方法を示します:

    事前知識:

  6. C#プログラミングの基本知識

  7. C# GUIコントロールの基本知識

    このチュートリアルは、プログラミングの知識がない方でも進められるように設計しました。

    対象読者

    C#を学んでいる初心者は以下の点を知っておくべきです。IronPDFを使ってPDFファイルを読むこれは確実にあなたのキャリアで使用するものだからです。

    プロの開発者は、PDFドキュメントの読み取り、生成、操作を支援するIronPDFライブラリを理解するためにもこれを読むべきです。

    さて、私たちのプロジェクトでこのライブラリをどのように使ってPDFファイルを読むことができるでしょうか?

    デモンストレーションのためにWindows Formsアプリを使用しています。 コンソールアプリケーション、WPFアプリケーション、またはASP.NETウェブアプリケーションを好みに応じて使用できます。

    IronPDFライブラリのもう一つの大きな利点は、C#とVB.NETの両方で使用できることです。

    では、ただちにデモンストレーションを開始しましょう。


ステップ #1:Visual Studio プロジェクトを作成する

Visual Studioを開きます。 Visual Studio 2019を使用しています。

「Create New Project」をクリックしてください。

C# PDFファイルの読み込み: 簡単なチュートリアル, 図3: 新しいプロジェクトの作成

新しいプロジェクトを作成

テンプレートから「Windows フォーム アプリ」を選択し、「次へ」を押すと、次のウィンドウが表示されます。 プロジェクト名を入力してください。 私は「IronPDFを使用してPDFを読み取る」と書きました。

C# PDFファイルの読み取り:簡単なチュートリアル、図16:Visual Studioを介したプロジェクトの設定

Visual Studio を使用したプロジェクトの構成

次に「Next」をクリックすると、次のウィンドウが表示されます。 ドロップダウンメニューから「.NET Core 3.1」を選択します。

C# PDFファイル読み取り: 簡単なチュートリアル、図9: .NET Core 3.1バージョン

.NET Core 3.1 バージョン

「作成」ボタンをクリックすると、プロジェクトが以下のように作成されます。

C# PDFファイル読み取り: 簡単なチュートリアル, 図6: 新しいWindows Formsアプリケーションの初期段階

新しいWindows Formsアプリケーションの初期段階


ステップ2: IronPDF NuGetパッケージのインストール

メニューバーからプロジェクトメニューをクリックすると、ドロップダウンリストが表示されます。 「Manage NuGet Packages」を選択し、クリックします。 次のウィンドウが表示されます:

C# PDFファイルの読み取り: 簡単なチュートリアル、図1: NuGetパッケージマネージャー

NuGet パッケージ マネージャー

「Browse」をクリックしてください。 次のウィンドウが表示されます:

C# PDFファイルの読み取り: 簡単チュートリアル、図2: NuGetパッケージマネージャーUI

NuGet パッケージ マネージャー UI

検索ボックスに「IronPDF」と入力し、"Enter"キーを押してください。 次のウィンドウが表示されます:

C# PDFファイル読み込み:簡単なチュートリアル、図4:NuGetソリューション

NuGet ソリューション

IronPDFを選択してクリックしてください。 次のウィンドウが表示されます:

C# PDFファイルを読み込む: 簡単なチュートリアル, 図7: 無料のIronPDFをインストール

無料のIronPDFのインストール

「インストール」ボタンを押して、インストールが完了するのを待ちます。 インストールが成功すると、次のウィンドウが表示されます:

C# PDFファイルを読み取る:簡単なチュートリアル、図5:IronPDF for .NET

IronPDF for .NET (IronPDF フォー ドットネット)

「OK」ボタンを押すと、準備完了です。

注: NuGet パッケージをダウンロードする他の方法もあります。 また、Package Manager Consoleを使用して IronPDF をインストールすることもできます。 これを実行するには、パッケージ マネージャー コンソールを開き、次のコードを入力します:

Install-Package IronPdf

以下でもダウンロードできますIronPDFのNuGetパッケージページ.

次のReadme.txtファイルが開きます:

C# PDFファイルを読む:簡単なチュートリアル、図12:IronPDFのreadmeファイルのコードサンプル

IronPDFのreadmeファイルとコードサンプル

提案させていただくのは、すべてのリンクを確認しIronPDFのコードサンプルをもっと見るライブラリについて。


ステップ3:Windowsフォームアプリを設計する

プロジェクトが作成され、NuGetパッケージがインストールされたら、次のステップは、ユーザーにファイルの参照を求め、その内容を表示するWindows Formsアプリを設計することです。

Form1 デザインを開く:

C# PDFファイルを読む: 簡単チュートリアル, 図14: Form1デザインUI

Form1 デザインUI

ウィンドウの左側にあるツールバーをクリックしてください。

C# PDFファイル読み取り:簡単なチュートリアル、図15:ラベルとテキストボックスのためのツールボックスUI

ラベルおよびテキストボックス用ツールボックスUI

ラベルを検索し、フォームデザインにドラッグ&ドロップしてください。

ラベルに名前を付けてください。 ここでは、「C# Read Pdf using IronPDF」と名付けました。

C# PDFファイルの読み取り: 簡単なチュートリアル、図20: ラベルが追加されたForm1のUI

ラベルを追加したForm1 UI

次に、テキストボックスをドラッグ&ドロップします。(ファイルパスを表示する)3つのボタン(ファイルを閲覧するためのボタン、IronPDFを使ってPDFファイルを読むためのボタン、そして "テキストをクリア "するための3番目のボタンです。)そして、一つのRichTextBox(ファイル内容の読み取りと表示).

テキストボックスおよびリッチテキストボックスの「Read Only Property」を「False」に設定します。 これは、ユーザーが内容とファイルパスのみを読み取ることができるようにするためです。

C# PDF ファイルを読む: 簡単なチュートリアル、図 10: Form1 の完全なデザイン

Form1 フルデザイン


ステップ#4: PDFファイルを閲覧するためのバックエンドコードを追加する

「ブラウズ」ボタンをダブルクリックすると、次のウィンドウが表示されます:

private void Browse_Click(object sender, EventArgs e)
{
}
private void Browse_Click(object sender, EventArgs e)
{
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
VB   C#

次に、以下のコードをBrowse_Click関数の中に記述してください:

private void Browse_Click(object sender, EventArgs e)
{
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)
*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        FilePath.Text = browseFile.FileName;
    }
}
private void Browse_Click(object sender, EventArgs e)
{
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)
*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        FilePath.Text = browseFile.FileName;
    }
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
	Dim browseFile As New OpenFileDialog With {
		.InitialDirectory = "D:\",
		.Title = "Browse Pdf Files",
		.CheckFileExists = True,
		.CheckPathExists = True,
		.DefaultExt = "pdf",
		.Filter = "pdf files (*.pdf) *.pdf",
		.FilterIndex = 2,
		.RestoreDirectory = True,
		.ReadOnlyChecked = True,
		.ShowReadOnly = True
	}
	If browseFile.ShowDialog() = DialogResult.OK Then
		FilePath.Text = browseFile.FileName
	End If
End Sub
VB   C#

OpenFileDialogue は、Windows Forms アプリのファイルダイアログコントロールのインスタンスを作成します。

初期パスをDドライブに設定しましたが、任意のドライブに設定することができます。

PDFファイルを読むだけなので、DefaultExt = "pdf"としました。

フィルターを使用して、ブラウズファイルダイアログでPDFファイルのみが表示されるようにしました。

ユーザーが「OK」をクリックすると、ファイルパスのフィールドにファイルパスが表示されます。

ソリューションを実行し、「Browse」ボタンをテストしましょう。

C# PDFファイルを読み取る方法:簡単なチュートリアル、図10: Form1 UI

Form1 UI (フォーム1 UI)

「参照」ボタンを押すと、次のウィンドウが表示されます:

C# PDFファイル読み取り: 簡単なチュートリアル、図11: PDFファイルを選択するためのファイル参照ダイアログ

PDFファイルを選択するためのファイルブラウズダイアログ

ファイルを選択(IronPDFTest.pdfを選択しています。)「開く」を押します。 次のウィンドウが表示されます。

C# で PDF ファイルを読む: 簡単なチュートリアル, 図 13: C# の PDF

C# でのPDF

次に、「Read」ボタンの裏側のコードを記述してファイルを読み込みましょう。


Step #5: IronPDFを使ってPDFドキュメントを読むためのバックエンドコードの追加

PDFファイルを読み取るコードは、複雑で理解しにくいものだと思っているかもしれません。

心配しないでください。 IronPDFは物事を簡単にし、すべてをはるかに容易にしました。 2行のコードだけでPDFファイルを簡単に読み取ることができます。

Form1のデザインに移動し、「Read」ボタンを「ダブルクリック」してください。 次のウィンドウが表示されます:

private void Read_Click(object sender, EventArgs e)
{
}
private void Read_Click(object sender, EventArgs e)
{
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
VB   C#

名前空間 using IronPdf を追加して、IronPDFライブラリをインポートします。

using System;
using IronPdf;
using System;
using IronPdf;
Imports System
Imports IronPdf
VB   C#

次のコードをRead_Click関数内に書き込んでください:

private void Read_Click(object sender, EventArgs e)
{
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
    FileContent.Text = pdf.ExtractAllText(); 
}
private void Read_Click(object sender, EventArgs e)
{
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
    FileContent.Text = pdf.ExtractAllText(); 
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
	Using pdf As PdfDocument = PdfDocument.FromFile(FilePath.Text)
		FileContent.Text = pdf.ExtractAllText()
	End Using
End Sub
VB   C#

FilePathは、読み取りたいPDFドキュメントの場所を表示するテキストフィールドの名前です。 ファイルの場所を動的に取得します。

ExtractAllTextとIronPDFはPDFページからすべてのデータを抽出するIronPDF関数です。 このデータは、その後、リッチテキストボックスに表示され「ファイル内容」と名付けられます。

それでは、「クリアボタン」のコードを記述しましょう。 PDFドキュメントを読んだ後にスクリーンをクリアしたい場合のための追加アイテムです。

「Clear Button」をダブルクリックすると、次のコードに移動します。

void Clear_Click(object sender, EventArgs e)
{
}
void Clear_Click(object sender, EventArgs e)
{
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
VB   C#

次のコードを Clear_Click 関数内に記述してください:

void Clear_Click(object sender, EventArgs e)
{
    FileContent.Text = "";
    FilePath.Text = "";
}
void Clear_Click(object sender, EventArgs e)
{
    FileContent.Text = "";
    FilePath.Text = "";
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
	FileContent.Text = ""
	FilePath.Text = ""
End Sub
VB   C#

ソリューションを実行

「ブラウズ」ボタンをクリックして、読みたいドキュメントを選択してください。 私の場合、例としてIronPDF.pdfファイルを読んでいます。

C# PDFファイルの読み取り: 簡単なチュートリアル, 図8: PDFドキュメント

PDF ドキュメント

「開く」ボタンを押すと、次のウィンドウが表示されます。

C# PDFファイル読み込み:簡単なチュートリアル 図13:選択されたPDFファイルを含むアプリケーション

選択されたPDFファイルによるアプリケーション

「Read」ボタンを押してください。 ファイルを読み取り、以下に示す内容を表示します。

C#でPDFファイルを読む: 簡単チュートリアル, 図19: PDFのテキスト内容を表示

PDFテキストコンテンツを表示


サマリー

これは例のソリューションです。 PDFファイルに含まれるページ数、画像、テキストの量に関係なく、IronPDFはすべてのテキストと画像を抽出し、任意の目的で使用できるようにします。 ライブラリのライセンスを取得し、使用を開始するだけです。

これでチュートリアルが完了します。 すべて理解していただけたことを願っています。ご不明な点がありましたら、コメント欄にお気軽にご投稿ください。

ダウンロードできますプロジェクトZIPファイル. Iron Software製品のフルパッケージを購入したい場合、特別オファーにより、今なら全てを2つの価格で購入することができます。 ライセンスとサポートの詳細が必要な場合は、こちらをクリックしてくださいIron Softwareの価格情報. 次のものも取得できます無料トライアルライセンス.

< 以前
ワンクリックで .NET PDF ジェネレーター
次へ >
PDF ドキュメントにパスワードを設定する方法