フッターコンテンツにスキップ
IRONPDFの使用

C# PDFファイル読み取り:簡単なチュートリアル

開発者である場合、おそらくPDFファイルからテキストを読み取る際に問題に直面したことがあるでしょう。次のシナリオのうち1つ以上が当てはまるかもしれません:

  1. 2つのPDF文書を入力として取得し、それらの文書間で類似性を見つけるアプリケーションを開発しています。
  2. IronPDFを使用してPDF文書を読み、単語数を返す必要があるアプリケーションを開発しています。
  3. IronPDFを使用してPDFファイルからデータを抽出し、それを構造化されたデータベースに入れるアプリケーションを開発しています。
  4. PDFテキストを抽出し、それを文字列に変換する必要があるアプリケーションを開発しています。
  5. C#を使用したPDFファイルからのデータ抽出は、IronPDFの開発まで困難で複雑な作業でした。

IronPDF Library Overviewは、開発者がPDFファイルを読み取る際に非常に簡単にするライブラリです。

IronPDFとIron Software Suiteのオファリングについてさらに探求できます。

2行のコードを使うだけで、PDFファイルを読み込み、そのデータをC#のテキストボックスに表示できます。 そう、コードはたった2行です。 PDFからすべての画像を抽出することもできます。 さらに、それらの画像で別の文書を作成したり、アプリケーション内に表示したりできます。

そのやり方をお見せしましょう。

手順に従ってアプリケーションを進め、任意のPDFファイルを選択してその内容を表示することができます。

C#でPDFファイルを読む方法を以下の手順で示します:

class="hsg-featured-snippet">

C#でPDFファイルを読む方法を示す手順

  1. Print to PDF C#ライブラリをダウンロード
  2. コンピュータからPDFファイルを選ぶ
  3. 特定のプリンタを選択し、解像度を設定
  4. プリンタからのPDF出力を確認
  5. C#を使用して印刷プロセスを追跡

前提知識:

  1. C#プログラミングの基本的な知識
  2. C# GUIコントロールの基本的な知識

プログラミングの背景がない人でも進められるように、このチュートリアルを設計しました。

読むべき人

C#を学んでいる新参者は、IronPDFを使ってPDFファイルを読む方法を知るべきです。これは職業において必ず使用することになるものです。

プロの開発者も、私たちがPDF文書を読み、生成し、操作するのに役立つIronPDFライブラリを理解するためにこれを読むべきです。

では、このライブラリをプロジェクトでどのように使用してPDFファイルを読むことができるのでしょうか?

デモンストレーションにはWindows Forms Appを使用しています。 コンソールアプリケーション、WPFアプリケーション、またはASP.NETのWebアプリケーションを好みに応じて使用できます。

IronPDFライブラリのもう1つの大きな利点は、C#とVB.NETの両方で使用できることです。

では、デモンストレーションを始めましょう。


ステップ #1: Visual Studioプロジェクトを作成

Visual Studioを開きます。 Visual Studio 2019を使用しています。

「新しいプロジェクトを作成」をクリック:

C# PDFファイルを読む: 簡単なチュートリアル、図3: 新しいプロジェクトを作成 新しいプロジェクトを作成

テンプレートからWindows Forms Appを選択し、「次へ」を押すと、次のウィンドウが表示されます。 プロジェクト名を入力します。 「Read Pdf using IronPDF」と書きました。

C# PDFファイルを読む: 簡単なチュートリアル、図16: Visual Studioによるプロジェクトの設定 Visual Studioによるプロジェクトの設定

「次へ」をクリックすると、次のウィンドウが表示されます。 ドロップダウンメニューから「.NET Core 3.1」を選択します。

C# PDFファイルを読む: 簡単なチュートリアル、図9: .NET Core 3.1バージョン .NET Core 3.1バージョン

「作成」ボタンをクリックすると、プロジェクトが以下のように作成されます。

C# PDFファイルを読む: 簡単なチュートリアル、図6: 新しいWindows Formsアプリケーションの初期段階 新しいWindows Formsアプリケーションの初期段階


ステップ #2: IronPDF NuGetパッケージをインストール

メニューバーからプロジェクトメニューをクリックすると、ドロップダウンリストが表示されます。 NuGetパッケージの管理を選択し、それをクリックします。 次のウィンドウが表示されます:

C# PDFファイルを読む: 簡単なチュートリアル、図1: NuGetパッケージマネージャー NuGetパッケージマネージャー

「参照」をクリックします。 次のウィンドウが表示されます:

C# PDFファイルを読む: 簡単なチュートリアル、図2: NuGetパッケージマネージャーUI NuGetパッケージマネージャUI

検索ボックスにIronPdfを入力し、「Enter」を押します。 次のウィンドウが表示されます:

C# PDFファイルを読む: 簡単なチュートリアル、図4: NuGetソリューション NuGetソリューション

IronPdfを選択してクリックします。 次のウィンドウが表示されます: C# PDFファイルを読む: 簡単なチュートリアル、図7: 無料IronPdfのインストール 無料IronPdfのインストール

「インストール」ボタンを押し、インストールが完了するのを待ちます。 インストールが成功すると、以下のウィンドウが表示されます:

C# PDFファイルを読む: 簡単なチュートリアル、図5: IronPdf for .NET IronPdf for .NET

「Ok」ボタンを押せば、準備完了です。

注意: NuGetパッケージをダウンロードする他の方法もあります。 パッケージマネージャーコンソールを使用してIronPdfをインストールすることもできます; これを行うには、パッケージマネージャーコンソールを開き、次のコードを書きます:

Install-Package IronPdf

NuGetパッケージページのIronPDFでダウンロードすることもできます。

次のReadme.txtファイルが開きます:

C# PDFファイルを読む: 簡単なチュートリアル、図12: IronPdfのリードミーファイルとコードサンプル IronPdfのリードミーファイルとコードサンプル

すべてのリンクをたどり、このライブラリについての追加のIronPDFコードサンプルを探ることをお勧めします。


ステップ #3: Windows Forms Appのデザイン

プロジェクトが作成され、NuGetパッケージがインストールされたら、次のステップはファイルをブラウズしてその内容を表示するためのWindows Forms Appをデザインすることです。

Form1 Designを開く:

C# PDFファイルを読む: 簡単なチュートリアル、図14: Form1 Design UI Form1 Design UI

ウィンドウの左側にあるツールバーをクリック:

C# PDFファイルを読む: 簡単なチュートリアル、図15: ラベルとテキストボックス用のツールボックスUI ラベルとテキストボックス用のツールボックスUI

「ラベル」を検索し、フォームデザインにドラッグ&ドロップする

ラベルの名前を付ける。 ここでは「C# Read Pdf using IronPDF」と名付けました。

C# PDFファイルを読む: 簡単なチュートリアル、図20: ラベルが追加されたForm1 UI ラベルが追加されたForm1 UI

次に、1つのテキストボックス(ファイルパスを表示するため)、3つのボタン(1つはファイルをブラウズするため、1つはIronPDFを使ってPDFファイルを読むため、3つ目のボタンは「テキストをクリアする」フィールドのため)、および1つのRichTextBox(ファイル内容を読むためおよび表示するため)をドラッグ&ドロップします。

テキストボックスとリッチテキストボックスの「読み取り専用プロパティ」を「False」に設定。 ユーザーが内容とファイルパスのみを読むことができるようにします。

C# PDFファイルを読む: 簡単なチュートリアル、図10: 完全に設計されたForm1 完全に設計されたForm1


ステップ #4: PDFファイルをブラウズするバックエンドコードを追加

「ブラウズ」ボタンをダブルクリックすると、次のウィンドウが表示されます。

private void Browse_Click(object sender, EventArgs e)
{
}
private void Browse_Click(object sender, EventArgs e)
{
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
$vbLabelText   $csharpLabel

次に、Browse_Click関数内に次のコードを書きます:

private void Browse_Click(object sender, EventArgs e)
{
    // Initialize and configure OpenFileDialog
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)|*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };

    // Show the dialog and get result
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        // Set the text box with the selected file path
        FilePath.Text = browseFile.FileName;
    }
}
private void Browse_Click(object sender, EventArgs e)
{
    // Initialize and configure OpenFileDialog
    OpenFileDialog browseFile = new OpenFileDialog
    {
        InitialDirectory = @"D:\",
        Title = "Browse Pdf Files",
        CheckFileExists = true,
        CheckPathExists = true,
        DefaultExt = "pdf",
        Filter = "pdf files (*.pdf)|*.pdf",
        FilterIndex = 2,
        RestoreDirectory = true,
        ReadOnlyChecked = true,
        ShowReadOnly = true
    };

    // Show the dialog and get result
    if (browseFile.ShowDialog() == DialogResult.OK)
    {
        // Set the text box with the selected file path
        FilePath.Text = browseFile.FileName;
    }
}
Private Sub Browse_Click(ByVal sender As Object, ByVal e As EventArgs)
	' Initialize and configure OpenFileDialog
	Dim browseFile As New OpenFileDialog With {
		.InitialDirectory = "D:\",
		.Title = "Browse Pdf Files",
		.CheckFileExists = True,
		.CheckPathExists = True,
		.DefaultExt = "pdf",
		.Filter = "pdf files (*.pdf)|*.pdf",
		.FilterIndex = 2,
		.RestoreDirectory = True,
		.ReadOnlyChecked = True,
		.ShowReadOnly = True
	}

	' Show the dialog and get result
	If browseFile.ShowDialog() = DialogResult.OK Then
		' Set the text box with the selected file path
		FilePath.Text = browseFile.FileName
	End If
End Sub
$vbLabelText   $csharpLabel

OpenFileDialogはWindows Forms Appのファイルダイアログコントロールのインスタンスを作成します。

初期パスをDドライブに設定しましたが、任意の場所に設定できます。

DefaultExt = "pdf"に設定しているのは、PDFファイルのみを読む必要があるからです。

参照ファイルダイアログではPDFファイルのみを表示して選択できるようにフィルターを使用しました。

ユーザーが「OK」をクリックすると、ファイルパスがファイルパスフィールドに表示されます。

ソリューションを実行して「ブラウズ」ボタンをテストしましょう。

C# PDFファイルを読む: 簡単なチュートリアル、図10: Form1 UI Form1 UI

「ブラウズ」ボタンを押すと、次のウィンドウが表示されます:

C# PDFファイルを読む: 簡単なチュートリアル、図11: PDFファイルを選択するためのブラウズファイルダイアログ PDFファイルを選択するためのブラウズファイルダイアログ

ファイルを選択(私はIronPDFTest.pdfを選択しています)し、「開く」を押します。 次のウィンドウが表示されます。

C# PDFファイルを読む: 簡単なチュートリアル、図13: C#でPDF C#でPDF

次は、ファイルを読むための「Read」ボタンのコードを書きます。


ステップ #5: IronPDFを使用してPDF文書を読むバックエンドコードを追加

PDFファイルを読むためのコードは複雑で書くのが難しいと思うかもしれません。

心配しないでください。 IronPDFが物事を簡単にし、すべてを非常に簡単にしました。 簡単にPDFファイルを2行のコードで読むことができます。

Form1 Designに移動し、「Read」ボタンをダブルクリックします。 次のウィンドウが表示されます:

private void Read_Click(object sender, EventArgs e)
{
}
private void Read_Click(object sender, EventArgs e)
{
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
$vbLabelText   $csharpLabel

IronPDFライブラリをインポートするためにusing IronPdfという名前空間を追加します:

using System;
using IronPdf;
using System;
using IronPdf;
Imports System
Imports IronPdf
$vbLabelText   $csharpLabel

Read_Click関数内に次のコードを書きます:

private void Read_Click(object sender, EventArgs e)
{
    // Read the PDF file using IronPdf
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);

    // Extract and display the text from the PDF
    FileContent.Text = pdf.ExtractAllText(); 
}
private void Read_Click(object sender, EventArgs e)
{
    // Read the PDF file using IronPdf
    using PdfDocument pdf = PdfDocument.FromFile(FilePath.Text);

    // Extract and display the text from the PDF
    FileContent.Text = pdf.ExtractAllText(); 
}
Private Sub Read_Click(ByVal sender As Object, ByVal e As EventArgs)
	' Read the PDF file using IronPdf
	Using pdf As PdfDocument = PdfDocument.FromFile(FilePath.Text)
	
		' Extract and display the text from the PDF
		FileContent.Text = pdf.ExtractAllText()
	End Using
End Sub
$vbLabelText   $csharpLabel

FilePathは読み取りたいPDF文書の場所を表示するテキストフィールドの名前です。 ファイルの場所を動的に取得します。

IronPDFでのExtractAllTextはIronPDFの機能で、PDFページからすべてのデータを抽出します。 このデータはリッチテキストボックスに表示され、「File Content」という名前が付けられます。

次に、「クリアボタン」の背後のコードを書きましょう。 これは、PDF文書を読み終えた後に画面をクリアしたい場合に備えた追加項目です。

「クリアボタン」をダブルクリックすると、次のコードに移動します:

void Clear_Click(object sender, EventArgs e)
{
}
void Clear_Click(object sender, EventArgs e)
{
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
End Sub
$vbLabelText   $csharpLabel

Clear_Click関数内に次のコードを書きます:

void Clear_Click(object sender, EventArgs e)
{
    // Clear the file path and content display fields
    FileContent.Text = "";
    FilePath.Text = "";
}
void Clear_Click(object sender, EventArgs e)
{
    // Clear the file path and content display fields
    FileContent.Text = "";
    FilePath.Text = "";
}
Private Sub Clear_Click(ByVal sender As Object, ByVal e As EventArgs)
	' Clear the file path and content display fields
	FileContent.Text = ""
	FilePath.Text = ""
End Sub
$vbLabelText   $csharpLabel

ソリューションを実行

「ブラウズ」ボタンをクリックし、読みたい文書を選択します。 私の場合、例としてIronPDF.pdfファイルを読んでいます:

C# PDFファイルを読む: 簡単なチュートリアル、図8: PDF文書 PDF文書

「開く」ボタンを押すと、次のウィンドウが表示されます:

C# PDFファイルを読む: 簡単なチュートリアル、図13: 選択されたPDFファイルを持つアプリケーション 選択されたPDFファイルを持つアプリケーション

「Read」ボタンを押します。 ファイルを読み取り、以下のように内容を表示します。

C# PDFファイルを読む: 簡単なチュートリアル、図19: PDFのテキスト内容を表示 PDFのテキスト内容を表示


まとめ

これは例のソリューションです。 PDFファイルに含まれるページ、画像、またはテキストの数に関係なく、IronPDFはすべてのテキストと画像を抽出して、任意の目的に使用できます。 ライブラリを利用するためのライセンスを取得する必要があるだけです。

これでチュートリアルは完了です。 すべてを理解したことを願っていますが、何か質問があればコメント欄に自由に投稿してください。

プロジェクトのzipファイルをダウンロードできます。 Ironソフトウェア製品の完全なパッケージを購入したい場合、私たちの特別オファーにより、今なら2つのLiteライセンスの価格でそれらをすべて購入できます。

よくある質問

C#を使用してPDFファイルからテキストを読み取る方法は?

IronPDFを使用して、ExtractAllTextメソッドを利用してPDFドキュメントから全てのテキスト内容を容易に抽出し、PDFファイルからテキストを読み取ることができます。

C# での PDF 操作に IronPDF を使用する利点は何ですか?

IronPDFはC#でのPDFの読み取り、生成、および操作へのシンプルなアプローチを提供します。テキスト抽出や画像取得などのタスクを最小限のコード行で達成し、生産性と効率を向上させます。

C#プロジェクトへのIronPDFライブラリをインストールする方法は?

IronPDFをインストールするには、Visual StudioのNuGetパッケージマネージャーを使用します。パッケージマネージャーコンソールで「IronPdf」を検索し、「インストール」をクリックしてプロジェクトに含めます。

IronPDFを使用してPDFファイルから画像を抽出することはできますか?

はい、IronPDFはPDFファイルから画像を抽出する機能を提供しており、開発者がドキュメント内のすべての画像にアクセスして操作できるようにします。

PDFファイルを読み取るためのVisual Studioプロジェクトをセットアップする手順は何ですか?

プロジェクトのセットアップには、新しいVisual Studioプロジェクトの作成、IronPDF NuGetパッケージのインストール、Windows Forms Appのデザイン、およびバックエンドコードを実装してPDFファイルを参照および読み取ることが含まれます。

PDFを読み取った後にアプリケーションのフィールドがクリアされていることを確認する方法は?

アプリケーションに「クリア」ボタンを実装し、TextBoxとRichTextBoxの内容を空の文字列にリセットすることで、PDF処理後にフィールドがクリアされたことを確認できます。

VB.NETでもIronPDFを使用することは可能ですか?

はい、IronPDFはC#とVB.NETの両方に対応しており、異なる.NET言語で作業する開発者にとって柔軟な選択肢です。

IronPDFを使用してPDFコンテンツを表示するために必要なコード行数は?

IronPDFを使用して、わずか2行のコードでPDFコンテンツを表示することができ、PDF処理タスクを簡素化する能力を示しています。

IronPDFで使われる「RenderHtmlAsPdf」メソッドとは何に使われるのですか?

IronPDFのRenderHtmlAsPdfメソッドは、HTML文字列をPDFドキュメントに変換するために使用され、WebコンテンツのPDFファイルへのシームレスな統合を可能にします。

IronPDF は .NET 10 と完全に互換性がありますか?

はい。IronPDFは、.NET 10だけでなく、.NET 6~9、.NET Core、.NET Standard、.NET Frameworkなどの以前のバージョンとも完全に互換性を持つように設計されています。NuGet経由のインストールをサポートし、Windows、Linux、macOSを含む複数のプラットフォームでシームレスに動作します。

Curtis Chau
テクニカルライター

Curtis Chauは、カールトン大学でコンピュータサイエンスの学士号を取得し、Node.js、TypeScript、JavaScript、およびReactに精通したフロントエンド開発を専門としています。直感的で美しいユーザーインターフェースを作成することに情熱を持ち、Curtisは現代のフレームワークを用いた開発や、構造の良い視覚的に魅力的なマニュアルの作成を楽しんでいます。

開発以外にも、CurtisはIoT(Internet of Things)への強い関心を持ち、ハードウェアとソフトウェアの統合方法を模索しています。余暇には、ゲームをしたりDiscordボットを作成したりして、技術に対する愛情と創造性を組み合わせています。