フッターコンテンツにスキップ
IRONPDFの使用

C#で1行ごとにPDFを読み取る方法

PDFを静的なドキュメントと考えることがあるかもしれませんが、ますます動的になっています。 PDFを使用すれば、インタラクティブで共有可能なドキュメントを作成できます。 PDFの構造を理解するには、AdobeのウェブサイトにあるAcrobat SDKの「ポータブル・ドキュメント・フォーマット・リファレンス」を読むことができます。プログラムでPDFを作成する最も一般的な理由は以下の2つです。

  1. グラフィックとフォーマットが必要で、印刷用の準備ができないPDFでは実現できないニュースレターやその他のデジタル出版物。
  2. 電子書籍やデジタルマガジンのインタラクティブ性を作成する。

プログラムでPDFファイルを読むことは難しい作業です。なぜならPDFファイルからテキストを抽出することは簡単ではないからです。 PDFの構造は複雑で、特に画像を含めることができるためです。 では、開発者がAdobe Acrobatを使わずにPDFファイルから行ごとにテキストを取得する解決策は何でしょうか? その答えはIronPDF C# PDFライブラリです。 このチュートリアルでは、IronPDF C#ライブラリを使用してC#でプログラム的にPDFファイルを読む方法を説明します。

How to Read a PDF Line By Line in C#

この記事の内容は次の通りです。

  1. IronPDF: C#のPDFライブラリ
  2. PDFドキュメントを読む手順
  3. Visual StudioでC#プロジェクトを作成する NuGetパッケージマネージャーでIronPDFライブラリをインストールする
  4. PDFファイルを読むコードを書く
  5. 結論: PDFを読むベストなライブラリ

IronPDF: A C# PDF Library

IronPDFは、開発者にPDFファイルを生成および読むための簡単で強力な方法を提供する.NET PDFライブラリです。 最初から.NET Core、ASP.NET Core、および.NET Standardと互換性があるように設計されています。

IronPDFは、PDFファイルの作成、操作、生成のための豊富なAPIを開発者に提供します。 開発者は、その直感的なAPIを使用して、プログラム上で新しいPDFファイルを作成したり、既存のファイルを開くことができます。 このライブラリは、PDFドキュメントで生成された画像、ビデオ、テキストドキュメント、ベクトルグラフィックスなどのさまざまなドキュメントをサポートします。

IronPDFを使用してPDFを行ごとに読む方法を見てみましょう。

Create a C# Project in Visual Studio

私はVisual Studio 2022でC#プロジェクトを作成します。 使用しているバージョンはどれでも動作しますが、新しいバージョンを使用するとより良い体験ができます。 IronPDFは、最新のMicrosoftのフレームワーク(.NET 6)と非常に良好に動作します。拡張サポートと安定性が必要な場合は、このフレームワークを使用することをお勧めします。

次に、Microsoft Visual StudioでC#プロジェクトを作成する手順に従ってください。

  1. Visual Studio 2022を開きます。
  2. 下部にある「新しいプロジェクトを作成」ボタンをクリックしてください。
  3. このチュートリアル用に「コンソールアプリケーション」テンプレートを選択します。 お好みに応じて、他のテンプレートを使用することもできます。
  4. プロジェクトに適切な名前を付けてください。
  5. 最新で、拡張サポートがある.NET 6フレームワークを選択します。
  6. 「作成」ボタンをクリックしてください。

上記の手順に従うことで、Visual Studioで簡単にC#プロジェクトを作成できます。 次に、IronPDFライブラリをインストールする時間です。 IronPDFライブラリを使用するために既存のプロジェクトを使用することができます。 割り当てを開き、ライブラリをインストールしなければなりません。 次のセクションでは、IronPDFライブラリのインストール方法を学びます。

Installing the IronPDF Library

IronPDFは、複数の方法でIronPDFライブラリのインストールをサポートしています。 IronPDFは、さまざまなシナリオで利用できるライブラリです。 NuGetパッケージを使用してプログラムをインストールし、パッケージマネージャーコンソールを介して利用することができます。 以下のコマンドを実行するだけで、IronPDFライブラリがプロジェクトにインストールされます。

Install-Package IronPdf

また、ZIPファイルをダウンロードして任意のフォルダーに解凍することにより、IronPDF C#ライブラリを取得することもできます。インストールは必要ありません。 まず、IronPDFをインストールしたいVisual Studioプロジェクトを開きます。 IDEを開いたら、ソリューションエクスプローラーでプロジェクト参照をクリックして参照を追加します。 先ほどダウンロードした「IronPDF」ZIPを検索して選択します。 "OK"ボタンをクリックすると、IronPDFはプロジェクトの参照に追加されます。

これで、IronPDFの準備が整いました。 行ごとにPDFドキュメントを読むコードを書き始めましょう。

Writing code to read a PDF file

今、たった2行のコードでPDFファイルを読む方法をお見せします。 IronPDFの機能は素晴らしく、とても効率的です。 コード例を見てみましょう。

using IronPdf;
using System.Drawing;

// Select the Desired PDF File
using PdfDocument PDF = PdfDocument.FromFile("test.pdf");

// Using ExtractAllText() method to extract all text from the PDF
string line = PDF.ExtractAllText();

// Get all Images
IEnumerable<Image> AllImages = PDF.ExtractAllImages();

// View text in the console
Console.WriteLine(line);
using IronPdf;
using System.Drawing;

// Select the Desired PDF File
using PdfDocument PDF = PdfDocument.FromFile("test.pdf");

// Using ExtractAllText() method to extract all text from the PDF
string line = PDF.ExtractAllText();

// Get all Images
IEnumerable<Image> AllImages = PDF.ExtractAllImages();

// View text in the console
Console.WriteLine(line);
Imports IronPdf
Imports System.Drawing

' Select the Desired PDF File
Private PdfDocument As using

' Using ExtractAllText() method to extract all text from the PDF
Private line As String = PDF.ExtractAllText()

' Get all Images
Private AllImages As IEnumerable(Of Image) = PDF.ExtractAllImages()

' View text in the console
Console.WriteLine(line)
$vbLabelText   $csharpLabel

上記のコードは、そのテストPDFのすべてのページからテキストを抽出します。 抽出したテキストをテキストファイルに保存したり、コンソールに表示したりすることができます。 IronPDFテキスト抽出例ページで、さらに多くのチュートリアルを見ることができます。 この関数をプログラム内のどこでも使用できるように、関数の形で次の関数を書くことができます。

private void Extract()
{
    // Select the Desired PDF File
    using PdfDocument PDF = PdfDocument.FromFile("any.pdf");

    // Using ExtractAllText() method to extract all text from the PDF
    string line = PDF.ExtractAllText();

    // View text in the console
    Console.WriteLine(line);
}
private void Extract()
{
    // Select the Desired PDF File
    using PdfDocument PDF = PdfDocument.FromFile("any.pdf");

    // Using ExtractAllText() method to extract all text from the PDF
    string line = PDF.ExtractAllText();

    // View text in the console
    Console.WriteLine(line);
}
Private Sub Extract()
	' Select the Desired PDF File
	Using PDF As PdfDocument = PdfDocument.FromFile("any.pdf")
	
		' Using ExtractAllText() method to extract all text from the PDF
		Dim line As String = PDF.ExtractAllText()
	
		' View text in the console
		Console.WriteLine(line)
	End Using
End Sub
$vbLabelText   $csharpLabel

IronPDFで生成された出力を見てみましょう。

Output Text

How to Read a PDF Line By Line in C#: Figure 1

IronPDFは完璧にテキストを抽出し、エラーを起こしません。 結果は一流です。

Conclusion: The Best Library for PDF Reading

多くの開発者がPDFを読むための異なるライブラリをソフトウェアやその他のプログラムで使用しています。 PDFファイルの操作や読み込みを行うための複数のライブラリが利用可能です。 しかし、IronPDFは、PDFに関わるすべての操作のための最高のライブラリです。

多くの業界や分野が、PDFの生成プログラムを使用してPDFドキュメントを生成および印刷しています。 市場にはPDF Sharpライブラリや他の多くの.NETライブラリなど、コンテンツを素早く直感的に生成することができるライブラリが多数存在します。 しかし、プログラムによるPDF生成のための最高のライブラリはIronPDFです。 IronPDFは、暗号化、パスワード保護、MS Office形式からPDFへの変換を含む多くの機能を提供します。 IronPDFを使用することで、これらの強力なツールを使用してPDFドキュメントを簡単に作成できます。

IronPDFは無料のライブラリですが、商業目的で使用するためには支払いが必要です。 30日間の試用期間があり、実際の環境でテストすることができます。 IronPDFは非常に手頃な価格で入手可能で、現在、たった2プログラムの価格で5つの異なるソフトウェアの完全セットを購入することもできます。 IronPDFライセンスページで、価格設定プランに関するすべての情報が見つかります。

よくある質問

C#でPDFファイルを一行ずつ読むにはどうすればよいですか?

IronPDFを使用すると、PdfDocument.FromFile()メソッドでファイルを開き、ExtractAllText()メソッドでテキストコンテンツを一行ずつ取り出すことができます。

.NET PDFライブラリを使用してPDFを読むことの利点は何ですか?

IronPDFのような.NET PDFライブラリは、複雑なPDF構造からのテキストの読取りと抽出プロセスを簡素化し、開発者がドキュメントをプログラム的に簡単に処理できるようにします。

IronPDFを使用してPDFからテキストだけでなく画像も抽出できますか?

はい、IronPDFは、PDFファイルからテキストと画像の両方を抽出することができ、PDF内のさまざまな要素にアクセスするメソッドを提供する包括的なAPIを備えています。

C#プロジェクトにIronPDFをインストールする最良の方法は何ですか?

NuGetパッケージマネージャーを使用して'Install-Package IronPdf'コマンドを使用するか、Visual Studioで参照として追加することでC#プロジェクトにIronPDFをインストールできます。

.NETライブラリを使用してPDFファイルを保護することは可能ですか?

IronPDFはPDFの暗号化とパスワード保護をサポートしており、C#アプリケーション内でプログラム的にPDFドキュメントを保護できます。

プログラム的にPDFを生成する一般的なユースケースは何ですか?

開発者は通常、デジタル出版物やインタラクティブコンテンツの作成、ドキュメントの共有、異なるプラットフォーム間での一貫したドキュメント形式を確保するためにPDFを生成します。

機能面で他のPDFライブラリと比較してIronPDFはどうですか?

IronPDFは、PDFの生成、テキストと画像の抽出、暗号化、形式変換などの堅牢な機能で高く評価され、開発者の間で好まれる選択肢となっています。

IronPDFは.NET Coreアプリケーションでも使用できますか?

はい、IronPDFは.NET Core、ASP.NET Core、および.NET Standardと互換性があり、最新の.NETアプリケーションにシームレスに統合できます。

IronPDF は .NET 10 と完全に互換性がありますか?

はい。IronPDFは、新しいランタイムと言語拡張機能を活用し、.NET 10で問題なく動作します。追加の設定なしで、.NET 10プロジェクトでPDFの読み取り、書き込み、変換、編集にすぐに使用できます。

.NET 10 のどのような改善点が IronPDF のパフォーマンスに役立ちますか?

.NET 10 では、メモリ割り当ての削減、JIT パフォーマンスの高速化、ASP.NET Core 機能の改善、IronPDF で活用できるランタイム最適化などの機能強化が提供されており、レンダリング、変換、テキスト/画像抽出などのタスクをより効率的に実行できます。これらのメリットは、IronPDF を使用するデスクトップ、Web、クラウドアプリに当てはまります。

Curtis Chau
テクニカルライター

Curtis Chauは、カールトン大学でコンピュータサイエンスの学士号を取得し、Node.js、TypeScript、JavaScript、およびReactに精通したフロントエンド開発を専門としています。直感的で美しいユーザーインターフェースを作成することに情熱を持ち、Curtisは現代のフレームワークを用いた開発や、構造の良い視覚的に魅力的なマニュアルの作成を楽しんでいます。

開発以外にも、CurtisはIoT(Internet of Things)への強い関心を持ち、ハードウェアとソフトウェアの統合方法を模索しています。余暇には、ゲームをしたりDiscordボットを作成したりして、技術に対する愛情と創造性を組み合わせています。