ライブ環境でテストする
ウォーターマークなしで本番環境でテストしてください。
必要な場所でいつでも動作します。
開発者であれば、PDFファイルからテキストを読み取ろうとして問題に直面したことがあるかもしれません。おそらく以下の状況のいずれかに該当するでしょう。
アプリケーションを開発しており、2つのPDFドキュメントを入力として受け取り、それらのドキュメントの類似性を識別する機能を持たせます。
アプリケーションを開発している際に、それが必要であるIronPDFでPDFドキュメントを読むで、単語数を返す。
アプリケーションを開発していますIronPDFを使ってPDFファイルからデータを取り出す構造化されたデータベースに格納します。
アプリケーションを開発している際に、それが必要であるPDFテキストコンテンツの抽出を作成し、文字列に変換します。
C#を使用してPDFファイルからデータを抽出することは、IronPDFの開発まで困難で複雑な作業でした。
IronPDFライブラリの概要は、開発者がPDFファイルを読み取るのを非常に簡単にするライブラリです。
詳細については、IronPDFとIron Software Suiteが提供するもの.
わずか2行のコードを使用するだけで、PDFファイルを読み取り、データをC#のテキストボックスに表示できます。 はい、たった2行のコードです。 またPDFからすべての画像を抽出. さらに、これらの画像を含む別のドキュメントを作成したり、要求に応じてアプリケーションに表示することができます。
やり方をお見せしましょう。
次のステップを踏んで任意のPDFファイルを選択し、その内容を表示するアプリケーションを進めることができます。
以下の手順では、C#でPDFファイルを読む方法を示します:
事前知識:
C#プログラミングの基本知識
C# GUIコントロールの基本知識
このチュートリアルは、プログラミングの知識がない方でも進められるように設計しました。
対象読者
C#を学んでいる初心者は以下の点を知っておくべきです。IronPDFを使ってPDFファイルを読むこれは確実にあなたのキャリアで使用するものだからです。
プロの開発者は、PDFドキュメントの読み取り、生成、操作を支援するIronPDFライブラリを理解するためにもこれを読むべきです。
さて、私たちのプロジェクトでこのライブラリをどのように使ってPDFファイルを読むことができるでしょうか?
デモンストレーションのためにWindows Formsアプリを使用しています。 コンソールアプリケーション、WPFアプリケーション、またはASP.NETウェブアプリケーションを好みに応じて使用できます。
IronPDFライブラリのもう一つの大きな利点は、C#とVB.NETの両方で使用できることです。
では、ただちにデモンストレーションを開始しましょう。
Visual Studioを開きます。 Visual Studio 2019を使用しています。
「Create New Project」をクリックしてください。
新しいプロジェクトを作成
テンプレートから「Windows フォーム アプリ」を選択し、「次へ」を押すと、次のウィンドウが表示されます。 プロジェクト名を入力してください。 私は「IronPDFを使用してPDFを読み取る」と書きました。
Visual Studio を使用したプロジェクトの構成
次に「Next」をクリックすると、次のウィンドウが表示されます。 ドロップダウンメニューから「.NET Core 3.1」を選択します。
.NET Core 3.1 バージョン
「作成」ボタンをクリックすると、プロジェクトが以下のように作成されます。
新しいWindows Formsアプリケーションの初期段階
メニューバーからプロジェクトメニューをクリックすると、ドロップダウンリストが表示されます。 「Manage NuGet Packages」を選択し、クリックします。 次のウィンドウが表示されます:
NuGet パッケージ マネージャー
「Browse」をクリックしてください。 次のウィンドウが表示されます:
NuGet パッケージ マネージャー UI
検索ボックスに「IronPDF」と入力し、"Enter"キーを押してください。 次のウィンドウが表示されます:
NuGet ソリューション
IronPDFを選択してクリックしてください。 次のウィンドウが表示されます:
無料のIronPDFのインストール
「インストール」ボタンを押して、インストールが完了するのを待ちます。 インストールが成功すると、次のウィンドウが表示されます:
IronPDF for .NET (IronPDF フォー ドットネット)
「OK」ボタンを押すと、準備完了です。
注: NuGet パッケージをダウンロードする他の方法もあります。 また、Package Manager Consoleを使用して IronPDF
をインストールすることもできます。 これを実行するには、パッケージ マネージャー コンソールを開き、次のコードを入力します:
Install-Package IronPdf
以下でもダウンロードできますIronPDFのNuGetパッケージページ.
次のReadme.txtファイルが開きます:
IronPDFのreadmeファイルとコードサンプル
提案させていただくのは、すべてのリンクを確認しIronPDFのコードサンプルをもっと見るライブラリについて。
プロジェクトが作成され、NuGetパッケージがインストールされたら、次のステップは、ユーザーにファイルの参照を求め、その内容を表示するWindows Formsアプリを設計することです。
Form1 デザインを開く:
Form1 デザインUI
ウィンドウの左側にあるツールバーをクリックしてください。
ラベルおよびテキストボックス用ツールボックスUI
ラベルを検索し、フォームデザインにドラッグ&ドロップしてください。
ラベルに名前を付けてください。 ここでは、「C# Read Pdf using IronPDF」と名付けました。
ラベルを追加したForm1 UI
次に、テキストボックスをドラッグ&ドロップします。(ファイルパスを表示する)3つのボタン(ファイルを閲覧するためのボタン、IronPDFを使ってPDFファイルを読むためのボタン、そして "テキストをクリア "するための3番目のボタンです。)そして、一つのRichTextBox(ファイル内容の読み取りと表示).
テキストボックスおよびリッチテキストボックスの「Read Only Property」を「False」に設定します。 これは、ユーザーが内容とファイルパスのみを読み取ることができるようにするためです。
Form1 フルデザイン
「ブラウズ」ボタンをダブルクリックすると、次のウィンドウが表示されます:
private void Browse_Click(object sender, EventArgs e)
{
}
private void Browse_Click(object sender, EventArgs e)
{
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
次に、以下のコードをBrowse_Click関数の中に記述してください:
private void Browse_Click(object sender, EventArgs e)
{
OpenFileDialog browseFile = new OpenFileDialog
{
InitialDirectory = @"D:\",
Title = "Browse Pdf Files",
CheckFileExists = true,
CheckPathExists = true,
DefaultExt = "pdf",
Filter = "pdf files (*.pdf)
*.pdf",
FilterIndex = 2,
RestoreDirectory = true,
ReadOnlyChecked = true,
ShowReadOnly = true
};
if (browseFile.ShowDialog() == DialogResult.OK)
{
FilePath.Text = browseFile.FileName;
}
}
private void Browse_Click(object sender, EventArgs e)
{
OpenFileDialog browseFile = new OpenFileDialog
{
InitialDirectory = @"D:\",
Title = "Browse Pdf Files",
CheckFileExists = true,
CheckPathExists = true,
DefaultExt = "pdf",
Filter = "pdf files (*.pdf)
*.pdf",
FilterIndex = 2,
RestoreDirectory = true,
ReadOnlyChecked = true,
ShowReadOnly = true
};
if (browseFile.ShowDialog() == DialogResult.OK)
{
FilePath.Text = browseFile.FileName;
}
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
Dim browseFile As New OpenFileDialog With {
.InitialDirectory = "D:\",
.Title = "Browse Pdf Files",
.CheckFileExists = True,
.CheckPathExists = True,
.DefaultExt = "pdf",
.Filter = "pdf files (*.pdf) *.pdf",
.FilterIndex = 2,
.RestoreDirectory = True,
.ReadOnlyChecked = True,
.ShowReadOnly = True
}
If browseFile.ShowDialog() = DialogResult.OK Then
FilePath.Text = browseFile.FileName
End If
End Sub
OpenFileDialogue
は、Windows Forms アプリのファイルダイアログコントロールのインスタンスを作成します。
初期パスをDドライブに設定しましたが、任意のドライブに設定することができます。
PDFファイルを読むだけなので、DefaultExt = "pdf"
としました。
フィルターを使用して、ブラウズファイルダイアログでPDFファイルのみが表示されるようにしました。
ユーザーが「OK」をクリックすると、ファイルパスのフィールドにファイルパスが表示されます。
ソリューションを実行し、「Browse」ボタンをテストしましょう。
Form1 UI (フォーム1 UI)
「参照」ボタンを押すと、次のウィンドウが表示されます:
PDFファイルを選択するためのファイルブラウズダイアログ
ファイルを選択(IronPDFTest.pdfを選択しています。)「開く」を押します。 次のウィンドウが表示されます。
C# でのPDF
次に、「Read」ボタンの裏側のコードを記述してファイルを読み込みましょう。
PDFファイルを読み取るコードは、複雑で理解しにくいものだと思っているかもしれません。
心配しないでください。 IronPDFは物事を簡単にし、すべてをはるかに容易にしました。 2行のコードだけでPDFファイルを簡単に読み取ることができます。
Form1のデザインに移動し、「Read」ボタンを「ダブルクリック」してください。 次のウィンドウが表示されます:
private void Read_Click(object sender, EventArgs e)
{
}
private void Read_Click(object sender, EventArgs e)
{
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
名前空間 using IronPdf
を追加して、IronPDFライブラリをインポートします。
using System;
using IronPdf;
using System;
using IronPdf;
Imports System
Imports IronPdf
次のコードをRead_Click
関数内に書き込んでください:
private void Read_Click(object sender, EventArgs e)
{
using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
FileContent.Text = pdf.ExtractAllText();
}
private void Read_Click(object sender, EventArgs e)
{
using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
FileContent.Text = pdf.ExtractAllText();
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
Using pdf As PdfDocument = PdfDocument.FromFile(FilePath.Text)
FileContent.Text = pdf.ExtractAllText()
End Using
End Sub
FilePath
は、読み取りたいPDFドキュメントの場所を表示するテキストフィールドの名前です。 ファイルの場所を動的に取得します。
ExtractAllTextとIronPDFはPDFページからすべてのデータを抽出するIronPDF関数です。 このデータは、その後、リッチテキストボックスに表示され「ファイル内容」と名付けられます。
それでは、「クリアボタン」のコードを記述しましょう。 PDFドキュメントを読んだ後にスクリーンをクリアしたい場合のための追加アイテムです。
「Clear Button」をダブルクリックすると、次のコードに移動します。
void Clear_Click(object sender, EventArgs e)
{
}
void Clear_Click(object sender, EventArgs e)
{
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
次のコードを Clear_Click
関数内に記述してください:
void Clear_Click(object sender, EventArgs e)
{
FileContent.Text = "";
FilePath.Text = "";
}
void Clear_Click(object sender, EventArgs e)
{
FileContent.Text = "";
FilePath.Text = "";
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
FileContent.Text = ""
FilePath.Text = ""
End Sub
「ブラウズ」ボタンをクリックして、読みたいドキュメントを選択してください。 私の場合、例としてIronPDF.pdfファイルを読んでいます。
PDF ドキュメント
「開く」ボタンを押すと、次のウィンドウが表示されます。
選択されたPDFファイルによるアプリケーション
「Read」ボタンを押してください。 ファイルを読み取り、以下に示す内容を表示します。
PDFテキストコンテンツを表示
これは例のソリューションです。 PDFファイルに含まれるページ数、画像、テキストの量に関係なく、IronPDFはすべてのテキストと画像を抽出し、任意の目的で使用できるようにします。 ライブラリのライセンスを取得し、使用を開始するだけです。
これでチュートリアルが完了します。 すべて理解していただけたことを願っています。ご不明な点がありましたら、コメント欄にお気軽にご投稿ください。
ダウンロードできますプロジェクトZIPファイル. Iron Software製品のフルパッケージを購入したい場合、特別オファーにより、今なら全てを2つの価格で購入することができます。 ライセンスとサポートの詳細が必要な場合は、こちらをクリックしてくださいIron Softwareの価格情報. 次のものも取得できます無料トライアルライセンス.
9つの .NET API製品 オフィス文書用