透かしなしで本番環境でテストしてください。
必要な場所で動作します。
30日間、完全に機能する製品をご利用いただけます。
数分で稼働させることができます。
製品トライアル期間中にサポートエンジニアリングチームへの完全アクセス
開発者であれば、PDFファイルからテキストを読み取ろうとして問題に直面したことがあるかもしれません。おそらく以下の状況のいずれかに該当するでしょう。
アプリケーションを開発しており、2つのPDFドキュメントを入力として受け取り、それらのドキュメントの類似性を識別する機能を持たせます。
あなたは、IronPDFを使用してPDFドキュメントを読み取るアプリケーションを開発中で、単語数を返す必要があります。
IronPDFを使用してPDFファイルからデータを抽出し、構造化データベースに格納するアプリケーションを開発しています。
アプリケーションを開発しており、PDFのテキスト内容を抽出して文字列に変換する必要があります。
C#を使用してPDFファイルからデータを抽出することは、IronPDFの開発まで困難で複雑な作業でした。
IronPDF Library Overviewは、開発者がPDFファイルを読み取るのを大幅に簡単にするライブラリです。
IronPDF および Iron Software Suite の提供内容 についてさらに詳しく知ることができます。
わずか2行のコードを使用するだけで、PDFファイルを読み取り、データをC#のテキストボックスに表示できます。 はい、たった2行のコードです。 PDFからすべての画像を抽出することもできます。 さらに、これらの画像を含む別のドキュメントを作成したり、要求に応じてアプリケーションに表示することができます。
やり方をお見せしましょう。
次のステップを踏んで任意のPDFファイルを選択し、その内容を表示するアプリケーションを進めることができます。
以下の手順では、C#でPDFファイルを読む方法を示します:
前提知識:
C#プログラミングの基本知識
C# GUIコントロールの基本知識
このチュートリアルは、プログラミングの知識がない方でも進められるように設計しました。
この情報を読むべき人
どのC#の初心者も、IronPDFを使用してPDFファイルを読む方法を知っておくべきです。これはキャリアで確実に使用することになるからです。
プロの開発者は、PDFドキュメントの読み取り、生成、操作を支援するIronPDFライブラリを理解するためにもこれを読むべきです。
さて、私たちのプロジェクトでこのライブラリをどのように使ってPDFファイルを読むことができるでしょうか?
デモンストレーションのためにWindows Formsアプリを使用しています。 コンソールアプリケーション、WPFアプリケーション、またはASP.NETウェブアプリケーションを好みに応じて使用できます。
IronPDFライブラリのもう一つの大きな利点は、C#とVB.NETの両方で使用できることです。
では、ただちにデモンストレーションを開始しましょう。
Visual Studioを開きます。 Visual Studio 2019を使用しています。
「Create New Project」をクリックしてください。
新しいプロジェクトを作成
テンプレートから「Windows フォーム アプリ」を選択し、「次へ」を押すと、次のウィンドウが表示されます。 プロジェクト名を入力してください。 私は「IronPDFを使用してPDFを読み取る」と書きました。
Visual Studioを使用してプロジェクトを構成する
次に「Next」をクリックすると、次のウィンドウが表示されます。 ドロップダウンメニューから「.NET Core 3.1」を選択します。
.NET Core 3.1 バージョン
「作成」ボタンをクリックすると、プロジェクトが以下のように作成されます。
新しいWindows Formsアプリケーションの初期段階
メニューバーからプロジェクトメニューをクリックすると、ドロップダウンリストが表示されます。 「Manage NuGet Packages」を選択し、クリックします。 次のウィンドウが表示されます:
NuGet パッケージ マネージャー
「Browse」をクリックしてください。 次のウィンドウが表示されます:
NuGet パッケージ マネージャー UI
検索ボックスに「IronPDF」と入力し、"Enter"キーを押してください。 次のウィンドウが表示されます:
NuGet ソリューション
IronPDFを選択してクリックしてください。 次のウィンドウが表示されます:
無料のIronPdfをインストール
「インストール」ボタンを押して、インストールが完了するのを待ちます。 インストールが成功すると、次のウィンドウが表示されます:
IronPdf for .NET
「OK」ボタンを押すと、準備完了です。
注: NuGet パッケージをダウンロードする他の方法もあります。 また、パッケージ マネージャー コンソールを使用して IronPdf
をインストールすることもできます。 これを実行するには、パッケージ マネージャー コンソールを開き、次のコードを入力します:
Install-Package IronPdf
それはIronPDF の NuGet パッケージページからもダウンロードできます。
次のReadme.txtファイルが開きます:
IronPdf のリードミーファイルとコードサンプル
このライブラリについてのすべてのリンクを確認し、IronPDF のコードサンプルをもっと探索することをお勧めします。
プロジェクトが作成され、NuGetパッケージがインストールされたら、次のステップは、ユーザーにファイルの参照を求め、その内容を表示するWindows Formsアプリを設計することです。
Form1 デザインを開く:
Form1 デザイン UI
ウィンドウの左側にあるツールバーをクリックしてください。
ラベルとテキストボックスのためのツールボックスUI
ラベルを検索し、フォームデザインにドラッグ&ドロップしてください。
ラベルに名前を付けてください。 ここでは、「C# Read Pdf using IronPDF」と名付けました。
Labelが追加されたForm1 UI
次に、テキストボックスを1つ(ファイルパスを表示するため)、ボタンを3つ(ファイルを参照するためのボタン1つ、IronPDFを使用してPDFファイルを読み込むためのボタン1つ、「テキストをクリアする」フィールド用のボタン1つ)、リッチテキストボックスを1つ(ファイル内容を読み込み表示するため)をドラッグアンドドロップします。
テキストボックスおよびリッチテキストボックスの「Read Only Property」を「False」に設定します。 これは、ユーザーが内容とファイルパスのみを読み取ることができるようにするためです。
フォーム1が完全に設計されました
「ブラウズ」ボタンをダブルクリックすると、次のウィンドウが表示されます:
private void Browse_Click(object sender, EventArgs e)
{
}
private void Browse_Click(object sender, EventArgs e)
{
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
次に、以下のコードをBrowse_Click関数の中に記述してください:
private void Browse_Click(object sender, EventArgs e)
{
OpenFileDialog browseFile = new OpenFileDialog
{
InitialDirectory = @"D:\",
Title = "Browse Pdf Files",
CheckFileExists = true,
CheckPathExists = true,
DefaultExt = "pdf",
Filter = "pdf files (*.pdf)
*.pdf",
FilterIndex = 2,
RestoreDirectory = true,
ReadOnlyChecked = true,
ShowReadOnly = true
};
if (browseFile.ShowDialog() == DialogResult.OK)
{
FilePath.Text = browseFile.FileName;
}
}
private void Browse_Click(object sender, EventArgs e)
{
OpenFileDialog browseFile = new OpenFileDialog
{
InitialDirectory = @"D:\",
Title = "Browse Pdf Files",
CheckFileExists = true,
CheckPathExists = true,
DefaultExt = "pdf",
Filter = "pdf files (*.pdf)
*.pdf",
FilterIndex = 2,
RestoreDirectory = true,
ReadOnlyChecked = true,
ShowReadOnly = true
};
if (browseFile.ShowDialog() == DialogResult.OK)
{
FilePath.Text = browseFile.FileName;
}
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
Dim browseFile As New OpenFileDialog With {
.InitialDirectory = "D:\",
.Title = "Browse Pdf Files",
.CheckFileExists = True,
.CheckPathExists = True,
.DefaultExt = "pdf",
.Filter = "pdf files (*.pdf) *.pdf",
.FilterIndex = 2,
.RestoreDirectory = True,
.ReadOnlyChecked = True,
.ShowReadOnly = True
}
If browseFile.ShowDialog() = DialogResult.OK Then
FilePath.Text = browseFile.FileName
End If
End Sub
OpenFileDialogue
は、Windows Forms アプリのファイル ダイアログ コントロールのインスタンスを作成します。
初期パスをDドライブに設定しましたが、任意のドライブに設定することができます。
私はDefaultExt = "pdf"
を設定しました。なぜなら、私たちはPDFファイルのみを読む必要があるからです。
フィルターを使用して、ブラウズファイルダイアログでPDFファイルのみが表示されるようにしました。
ユーザーが「OK」をクリックすると、ファイルパスのフィールドにファイルパスが表示されます。
ソリューションを実行し、「Browse」ボタンをテストしましょう。
Form1 UI
「参照」ボタンを押すと、次のウィンドウが表示されます:
PDFファイルを選択するためのファイル選択ダイアログ
ファイルを選択し(私はIronPDFTest.pdfを選択しています)、"Open"を押します。 次のウィンドウが表示されます。
C#でのPDF
次に、「Read」ボタンの裏側のコードを記述してファイルを読み込みましょう。
PDFファイルを読み取るコードは、複雑で理解しにくいものだと思っているかもしれません。
心配しないでください。 IronPDFは物事を簡単にし、すべてをはるかに容易にしました。 2行のコードだけでPDFファイルを簡単に読み取ることができます。
Form1のデザインに移動し、「Read」ボタンを「ダブルクリック」してください。 次のウィンドウが表示されます:
private void Read_Click(object sender, EventArgs e)
{
}
private void Read_Click(object sender, EventArgs e)
{
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
名前空間using IronPdf
を追加して、IronPDFライブラリをインポートします。
using System;
using IronPdf;
using System;
using IronPdf;
Imports System
Imports IronPdf
Read_Click
関数の内部に次のコードを書いてください:
private void Read_Click(object sender, EventArgs e)
{
using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
FileContent.Text = pdf.ExtractAllText();
}
private void Read_Click(object sender, EventArgs e)
{
using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
FileContent.Text = pdf.ExtractAllText();
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
Using pdf As PdfDocument = PdfDocument.FromFile(FilePath.Text)
FileContent.Text = pdf.ExtractAllText()
End Using
End Sub
FilePath
は、読みたいPDFドキュメントの場所を表示するテキストフィールドの名前です。 ファイルの場所を動的に取得します。
IronPDFのExtractAllTextは、PDFページからすべてのデータを抽出するIronPDFの機能です。 このデータは、その後、リッチテキストボックスに表示され「ファイル内容」と名付けられます。
それでは、「クリアボタン」のコードを記述しましょう。 PDFドキュメントを読んだ後にスクリーンをクリアしたい場合のための追加アイテムです。
「Clear Button」をダブルクリックすると、次のコードに移動します。
void Clear_Click(object sender, EventArgs e)
{
}
void Clear_Click(object sender, EventArgs e)
{
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
以下のコードをClear_Click
関数内に記述します:
void Clear_Click(object sender, EventArgs e)
{
FileContent.Text = "";
FilePath.Text = "";
}
void Clear_Click(object sender, EventArgs e)
{
FileContent.Text = "";
FilePath.Text = "";
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
FileContent.Text = ""
FilePath.Text = ""
End Sub
「ブラウズ」ボタンをクリックして、読みたいドキュメントを選択してください。 私の場合、例としてIronPDF.pdfファイルを読んでいます。
PDFドキュメント
「開く」ボタンを押すと、次のウィンドウが表示されます。
選択済みPDFファイルを使用したアプリケーション
「Read」ボタンを押してください。 ファイルを読み取り、以下に示す内容を表示します。
PDFテキスト内容を表示
これは例のソリューションです。 PDFファイルに含まれるページ数、画像、テキストの量に関係なく、IronPDFはすべてのテキストと画像を抽出し、任意の目的で使用できるようにします。 ライブラリのライセンスを取得し、使用を開始するだけです。
これでチュートリアルが完了します。 すべて理解していただけたことを願っています。ご不明な点がありましたら、コメント欄にお気軽にご投稿ください。
プロジェクトのzipファイルをダウンロードできます。 Iron Software製品のフルパッケージを購入したい場合、特別オファーにより、今なら全てを2つの価格で購入することができます。 ライセンスとサポートに関する詳細が必要な場合は、Iron Softwareの価格情報をクリックしてください。 無料のトライアルライセンス提供も取得できます。