C# PDFファイル読み取り:簡単なチュートリアル
開発者である場合、おそらくPDFファイルからテキストを読み取る際に問題に直面したことがあるでしょう。次のシナリオのうち1つ以上が当てはまるかもしれません:
- 2つのPDF文書を入力として取得し、それらの文書間で類似性を見つけるアプリケーションを開発しています。
- IronPDFを使用してPDF文書を読み、単語数を返す必要があるアプリケーションを開発しています。
- IronPDFを使用してPDFファイルからデータを抽出し、それを構造化されたデータベースに入れるアプリケーションを開発しています。
- PDFテキストを抽出し、それを文字列に変換する必要があるアプリケーションを開発しています。
- C#を使用したPDFファイルからのデータ抽出は、IronPDFの開発まで困難で複雑な作業でした。
IronPDF Library Overviewは、開発者がPDFファイルを読み取る際に非常に簡単にするライブラリです。
IronPDFとIron Software Suiteのオファリングについてさらに探求できます。
2行のコードを使うだけで、PDFファイルを読み込み、そのデータをC#のテキストボックスに表示できます。 そう、コードはたった2行です。 PDFからすべての画像を抽出することもできます。 さらに、それらの画像で別の文書を作成したり、アプリケーション内に表示したりできます。
そのやり方をお見せしましょう。
手順に従ってアプリケーションを進め、任意のPDFファイルを選択してその内容を表示することができます。
C#でPDFファイルを読む方法を以下の手順で示します:
次のステップでは、C#でPDFファイルを読む方法を説明します。
- Print to PDF C# Libraryをダウンロードする。
- コンピューターから PDF ファイルを選択
- 印刷する特定のプリンターを選び、解像度を設定
- プリンターからの PDF 出力を確認
- C# を使用して印刷プロセスを追跡
前提知識:
- C#プログラミングの基本的な知識
- C# GUIコントロールの基本的な知識
プログラミングの背景がない人でも進められるように、このチュートリアルを設計しました。
読むべき人
C#を学んでいる新参者は、IronPDFを使ってPDFファイルを読む方法を知るべきです。これは職業において必ず使用することになるものです。
プロの開発者も、私たちがPDF文書を読み、生成し、操作するのに役立つIronPDFライブラリを理解するためにこれを読むべきです。
では、このライブラリをプロジェクトでどのように使用してPDFファイルを読むことができるのでしょうか?
デモンストレーションにはWindows Forms Appを使用しています。 コンソールアプリケーション、WPFアプリケーション、またはASP.NETのWebアプリケーションを好みに応じて使用できます。
IronPDFライブラリのもう1つの大きな利点は、C#とVB.NETの両方で使用できることです。
では、デモンストレーションを始めましょう。
ステップ #1: Visual Studioプロジェクトを作成
Visual Studioを開きます。 Visual Studio 2019を使用しています。
"新しいプロジェクトを作成"をクリック:
新しいプロジェクトを作成
テンプレートからWindows Forms Appを選択し、"次へ"を押すと、次のウィンドウが表示されます。 プロジェクト名を入力します。 "Read Pdf using IronPDF"と書きました。
Visual Studioによるプロジェクトの設定
"次へ"をクリックすると、次のウィンドウが表示されます。 ドロップダウンメニューから".NET Core 3.1"を選択します。
.NET Core 3.1バージョン
"作成"ボタンをクリックすると、プロジェクトが以下のように作成されます。
新しいWindows Formsアプリケーションの初期段階
ステップ #2: IronPDF NuGetパッケージをインストール
メニューバーからプロジェクトメニューをクリックすると、ドロップダウンリストが表示されます。 NuGetパッケージの管理を選択し、それをクリックします。 次のウィンドウが表示されます:
NuGetパッケージマネージャー
"参照"をクリックします。 次のウィンドウが表示されます:
NuGetパッケージマネージャUI
検索ボックスにIronPdfを入力し、"Enter"を押します。 次のウィンドウが表示されます:
NuGetソリューション
IronPdfを選択してクリックします。 次のウィンドウが表示されます:
無料IronPdfのインストール
"インストール"ボタンを押し、インストールが完了するのを待ちます。 インストールが成功すると、以下のウィンドウが表示されます:
IronPdf for .NET
"Ok"ボタンを押せば、準備完了です。
注意: NuGetパッケージをダウンロードする他の方法もあります。 パッケージマネージャーコンソールを使用してIronPdfをインストールすることもできます; これを行うには、パッケージマネージャーコンソールを開き、次のコードを書きます:
Install-Package IronPdf
NuGetパッケージページのIronPDFでダウンロードすることもできます。
次のReadme.txtファイルが開きます:
IronPdfのリードミーファイルとコードサンプル
すべてのリンクをたどり、このライブラリについての追加のIronPDFコードサンプルを探ることをお勧めします。
ステップ #3: Windows Forms Appのデザイン
プロジェクトが作成され、NuGetパッケージがインストールされたら、次のステップはファイルをブラウズしてその内容を表示するためのWindows Forms Appをデザインすることです。
Form1 Designを開く:
Form1 Design UI
ウィンドウの左側にあるツールバーをクリック:
ラベルとテキストボックス用のツールボックスUI
"ラベル"を検索し、フォームデザインにドラッグ&ドロップする
ラベルの名前を付ける。 ここでは"C# Read Pdf using IronPDF"と名付けました。
ラベルが追加されたForm1 UI
次に、1つのテキストボックス(ファイルパスを表示するため)、3つのボタン(1つはファイルをブラウズするため、1つはIronPDFを使ってPDFファイルを読むため、3つ目のボタンは"テキストをクリアする"フィールドのため)、および1つのRichTextBox(ファイル内容を読むためおよび表示するため)をドラッグ&ドロップします。
テキストボックスとリッチテキストボックスの"読み取り専用プロパティ"を"False"に設定。 ユーザーが内容とファイルパスのみを読むことができるようにします。
完全に設計されたForm1
ステップ #4: PDFファイルをブラウズするバックエンドコードを追加
"ブラウズ"ボタンをダブルクリックすると、次のウィンドウが表示されます。
private void Browse_Click(object sender, EventArgs e)
{
}private void Browse_Click(object sender, EventArgs e)
{
}次に、Browse_Click関数内に次のコードを書きます:
private void Browse_Click(object sender, EventArgs e)
{
// Initialize and configure OpenFileDialog
OpenFileDialog browseFile = new OpenFileDialog
{
InitialDirectory = @"D:\",
Title = "Browse Pdf Files",
CheckFileExists = true,
CheckPathExists = true,
DefaultExt = "pdf",
Filter = "pdf files (*.pdf)|*.pdf",
FilterIndex = 2,
RestoreDirectory = true,
ReadOnlyChecked = true,
ShowReadOnly = true
};
// Show the dialog and get result
if (browseFile.ShowDialog() == DialogResult.OK)
{
// Set the text box with the selected file path
FilePath.Text = browseFile.FileName;
}
}private void Browse_Click(object sender, EventArgs e)
{
// Initialize and configure OpenFileDialog
OpenFileDialog browseFile = new OpenFileDialog
{
InitialDirectory = @"D:\",
Title = "Browse Pdf Files",
CheckFileExists = true,
CheckPathExists = true,
DefaultExt = "pdf",
Filter = "pdf files (*.pdf)|*.pdf",
FilterIndex = 2,
RestoreDirectory = true,
ReadOnlyChecked = true,
ShowReadOnly = true
};
// Show the dialog and get result
if (browseFile.ShowDialog() == DialogResult.OK)
{
// Set the text box with the selected file path
FilePath.Text = browseFile.FileName;
}
}OpenFileDialogはWindows Forms Appのファイルダイアログコントロールのインスタンスを作成します。
初期パスをDドライブに設定しましたが、任意の場所に設定できます。
DefaultExt = "pdf"に設定しているのは、PDFファイルのみを読む必要があるからです。
参照ファイルダイアログではPDFファイルのみを表示して選択できるようにフィルターを使用しました。
ユーザーが"OK"をクリックすると、ファイルパスがファイルパスフィールドに表示されます。
ソリューションを実行して"ブラウズ"ボタンをテストしましょう。
Form1 UI
"ブラウズ"ボタンを押すと、次のウィンドウが表示されます:
PDFファイルを選択するためのブラウズファイルダイアログ
ファイルを選択(私はIronPDFTest.pdfを選択しています)し、"開く"を押します。 次のウィンドウが表示されます。
C#でPDF
次は、ファイルを読むための"Read"ボタンのコードを書きます。
ステップ #5: IronPDFを使用してPDF文書を読むバックエンドコードを追加
PDFファイルを読むためのコードは複雑で書くのが難しいと思うかもしれません。
心配しないでください。 IronPDFが物事を簡単にし、すべてを非常に簡単にしました。 簡単にPDFファイルを2行のコードで読むことができます。
Form1 Designに移動し、"Read"ボタンをダブルクリックします。 次のウィンドウが表示されます:
private void Read_Click(object sender, EventArgs e)
{
}private void Read_Click(object sender, EventArgs e)
{
}IronPDFライブラリをインポートするためにusing IronPdfという名前空間を追加します:
using System;
using IronPdf;using System;
using IronPdf;Read_Click関数内に次のコードを書きます:
private void Read_Click(object sender, EventArgs e)
{
// Read the PDF file using IronPdf
using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
// Extract and display the text from the PDF
FileContent.Text = pdf.ExtractAllText();
}private void Read_Click(object sender, EventArgs e)
{
// Read the PDF file using IronPdf
using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);
// Extract and display the text from the PDF
FileContent.Text = pdf.ExtractAllText();
}FilePathは読み取りたいPDF文書の場所を表示するテキストフィールドの名前です。 ファイルの場所を動的に取得します。
IronPDFでのExtractAllTextはIronPDFの機能で、PDFページからすべてのデータを抽出します。 このデータはリッチテキストボックスに表示され、"File Content"という名前が付けられます。
次に、"クリアボタン"の背後のコードを書きましょう。 これは、PDF文書を読み終えた後に画面をクリアしたい場合に備えた追加項目です。
"クリアボタン"をダブルクリックすると、次のコードに移動します:
void Clear_Click(object sender, EventArgs e)
{
}void Clear_Click(object sender, EventArgs e)
{
}Clear_Click関数内に次のコードを書きます:
void Clear_Click(object sender, EventArgs e)
{
// Clear the file path and content display fields
FileContent.Text = "";
FilePath.Text = "";
}void Clear_Click(object sender, EventArgs e)
{
// Clear the file path and content display fields
FileContent.Text = "";
FilePath.Text = "";
}ソリューションを実行
"ブラウズ"ボタンをクリックし、読みたい文書を選択します。 私の場合、例としてIronPDF.pdfファイルを読んでいます:
PDF文書
"開く"ボタンを押すと、次のウィンドウが表示されます:
選択されたPDFファイルを持つアプリケーション
"Read"ボタンを押します。 ファイルを読み取り、以下のように内容を表示します。
PDFのテキスト内容を表示
まとめ
これは例のソリューションです。 PDFファイルに含まれるページ、画像、またはテキストの数に関係なく、IronPDFはすべてのテキストと画像を抽出して、任意の目的に使用できます。 ライセンスを取得し、ライブラリを使用し始めるだけで済みます。
これでチュートリアルは完了です。 すべてを理解したことを願っていますが、何か質問があればコメント欄に自由に投稿してください。
プロジェクトのzipファイルをダウンロードできます。 Ironソフトウェア製品の完全なパッケージを購入したい場合、私たちの[特別オファー](Iron Suite)により、今なら2つのLiteライセンスの価格でそれらをすべて購入できます。
よくある質問
C#を使用してPDFファイルからテキストを読み取る方法は?
IronPDFを使用して、ExtractAllTextメソッドを利用してPDFドキュメントから全てのテキスト内容を容易に抽出し、PDFファイルからテキストを読み取ることができます。
C# での PDF 操作に IronPDF を使用する利点は何ですか?
IronPDFはC#でのPDFの読み取り、生成、および操作へのシンプルなアプローチを提供します。テキスト抽出や画像取得などのタスクを最小限のコード行で達成し、生産性と効率を向上させます。
C#プロジェクトへのIronPDFライブラリをインストールする方法は?
IronPDFをインストールするには、Visual StudioのNuGetパッケージマネージャーを使用します。パッケージマネージャーコンソールで「IronPdf」を検索し、「インストール」をクリックしてプロジェクトに含めます。
IronPDFを使用してPDFファイルから画像を抽出することはできますか?
はい、IronPDFはPDFファイルから画像を抽出する機能を提供しており、開発者がドキュメント内のすべての画像にアクセスして操作できるようにします。
PDFファイルを読み取るためのVisual Studioプロジェクトをセットアップする手順は何ですか?
プロジェクトのセットアップには、新しいVisual Studioプロジェクトの作成、IronPDF NuGetパッケージのインストール、Windows Forms Appのデザイン、およびバックエンドコードを実装してPDFファイルを参照および読み取ることが含まれます。
PDFを読み取った後にアプリケーションのフィールドがクリアされていることを確認する方法は?
アプリケーションに「クリア」ボタンを実装し、TextBoxとRichTextBoxの内容を空の文字列にリセットすることで、PDF処理後にフィールドがクリアされたことを確認できます。
VB.NETでもIronPDFを使用することは可能ですか?
はい、IronPDFはC#とVB.NETの両方に対応しており、異なる.NET言語で作業する開発者にとって柔軟な選択肢です。
IronPDFを使用してPDFコンテンツを表示するために必要なコード行数は?
IronPDFを使用して、わずか2行のコードでPDFコンテンツを表示することができ、PDF処理タスクを簡素化する能力を示しています。
IronPDFで使われる「RenderHtmlAsPdf」メソッドとは何に使われるのですか?
IronPDFのRenderHtmlAsPdfメソッドは、HTML文字列をPDFドキュメントに変換するために使用され、WebコンテンツのPDFファイルへのシームレスな統合を可能にします。
IronPDF は .NET 10 と完全に互換性がありますか?
はい。IronPDFは、.NET 10だけでなく、.NET 6~9、.NET Core、.NET Standard、.NET Frameworkなどの以前のバージョンとも完全に互換性を持つように設計されています。NuGet経由のインストールをサポートし、Windows、Linux、macOSを含む複数のプラットフォームでシームレスに動作します。









