IRONPDFの使用

C#でPDFを行ごとに読む方法

公開済み 2024年4月29日
共有:

PDFは静的なドキュメントと考えているかもしれませんが、ますます動的になっています。 PDFを使用すれば、インタラクティブで共有可能なドキュメントを作成することができます。 PDFの構造を理解するには、AdobeのWebサイトにあるAcrobat SDKの「Portable Document Format Reference」を参照してください。PDFをプログラム的に作成する最も一般的な理由は以下の二つです:

  1. ニュースレターや他のデジタル出版物には、印刷可能なPDFでは対応できないグラフィックやフォーマットが必要です。

  2. 電子書籍またはデジタル雑誌にインタラクティビティを追加するために。

    プログラムでPDFファイルを読み取ることは困難な作業です。なぜなら、PDFファイルからテキストを抽出するのは簡単ではないからです。 PDFの構造は複雑であり、特に画像を含む場合があります。 では、開発者がAdobe Acrobatを使用せずにPDFファイルから行単位でテキストを取得する必要がある場合の解決策は何でしょうか? 答えはIronPDF C# PDFライブラリです。 このチュートリアルでは、IronPDF C#ライブラリを使用して、C#でプログラム的にPDFファイルを読み取る方法について説明します。

C#でPDFを行ごとに読み取る方法

この記事の内容は次のとおりです:

  1. IronPDF: C# PDFライブラリ

  2. PDFドキュメントを読む手順

  3. Visual StudioでC#プロジェクトを作成する

    申し訳ありませんが、提供された内容が「4.」のみですでに終わっているようです。続きの内容があれば、それを提供していただくことが必要です。正確な翻訳を行うために、もう少し具体的な情報やテキストを入力していただけますか?NuGetパッケージマネージャーでIronPDFライブラリをインストールする

  4. PDFファイルを読み取るコードの記述

  5. 結論: PDFを読むための最良のライブラリ

IronPDF: C# PDFライブラリ

IronPDFは、開発者にPDFファイルの生成と読み取りを簡単かつ強力に行う方法を提供する.NET PDFライブラリです。 最初から.NET Core、ASP.NET Core、および.NET Standardに対応するように設計されています。

IronPDFは、開発者にPDFファイルの作成、操作、および生成のための豊富なAPIを提供します。 開発者は、直感的なAPIを使用してプログラム的に新しいPDFファイルを作成したり、既存のPDFファイルを開くことができます。 ライブラリは、PDFドキュメント内で生成された画像、ビデオ、テキストドキュメント、ベクターグラフィックなど、さまざまなドキュメントをサポートします。

IronPDFを使用してPDFを1行ずつ読む方法を見てみましょう。

Visual Studio で C# プロジェクトを作成する

Visual Studio 2022を使用してC#プロジェクトを作成します。 お持ちのバージョンはどれでも動作しますが、最新バージョンを使用することを推奨します。より良い経験のためです。 IronPDFは、Microsoftの最新バージョンのフレームワークである.NET 6と良好に動作します。拡張サポートと安定性が必要な場合、このフレームワークを使用することをお勧めします。

次に、Microsoft Visual StudioでC#プロジェクトを作成する手順に従ってください:

  1. Visual Studio 2022を開きます。

  2. 下部にある「Create a new project」ボタンをクリックします。

  3. このチュートリアルでは、「コンソールアプリケーション」テンプレートを選択してください。 要件に応じて任意のテンプレートを使用できます。

  4. プロジェクトに適切な名前をつけてください。

  5. .NET 6 フレームワークを選択する理由は、最新であり、サポートが拡張されているためです。

  6. 「Create」ボタンをクリックしてください。

    上記の手順に従うことで、Visual Studioで簡単にC#プロジェクトを作成できます。 では、IronPDFライブラリをインストールする時間です。 既存のプロジェクトを使用してIronPDFライブラリを利用できます。 あなたは課題を開いてライブラリをインストールする必要があります。 次のセクションでは、IronPDFライブラリのインストール方法について学びます。

IronPDFライブラリのインストール

IronPDFは、さまざまな方法でIronPDFライブラリのインストールをサポートしています。 IronPDFは、さまざまなシナリオで使用できるライブラリです。 NuGetパッケージでプログラムをインストールし、パッケージマネージャーコンソールを通じて利用することができます。 以下のコマンドを実行するだけで、IronPDFライブラリがプロジェクトにインストールされます:

Install-Package IronPDF

または、IronPDF C# ライブラリを ZIP ファイルとしてダウンロードし、ハードドライブ上の任意のフォルダーに解凍することで取得できます。これにはインストールが不要です。 まず、IronPDFをインストールしたいVisual Studioプロジェクトを開きます。 IDE内で、ソリューションエクスプローラーのプロジェクト参照をクリックし、「参照の追加」をクリックします。 先ほどダウンロードした"IronPDF"のzipを検索して選択してください。 「OK」ボタンをクリックすると、IronPDFがプロジェクトの参照として追加されます。

さて、プロジェクトはIronPDFの準備が整いました。 行ごとにPDFドキュメントを読み取るためのコードを書き始めましょう。

PDFファイルを読み取るコードの作成

これから、たった二行のコードでPDFファイルを読み取る方法をお見せします。 IronPDFの機能は非常に素晴らしく、非常に効率的です。 コード例を見てみましょう:

using IronPdf;
using System.Drawing;
//Select the Desired PDF File
using PdfDocument PDF = PdfDocument.FromFile("test.pdf");
//Using ExtractAllText() method, extract every single text from an pdf
string line = PDF.ExtractAllText();
//Get all Images
IEnumerable<Image> AllImages = PDF.ExtractAllImages();
//View text in an Label or textbox
Console.WriteLine(line);
using IronPdf;
using System.Drawing;
//Select the Desired PDF File
using PdfDocument PDF = PdfDocument.FromFile("test.pdf");
//Using ExtractAllText() method, extract every single text from an pdf
string line = PDF.ExtractAllText();
//Get all Images
IEnumerable<Image> AllImages = PDF.ExtractAllImages();
//View text in an Label or textbox
Console.WriteLine(line);
Imports IronPdf
Imports System.Drawing
'Select the Desired PDF File
Private PdfDocument As using
'Using ExtractAllText() method, extract every single text from an pdf
Private line As String = PDF.ExtractAllText()
'Get all Images
Private AllImages As IEnumerable(Of Image) = PDF.ExtractAllImages()
'View text in an Label or textbox
Console.WriteLine(line)
VB   C#

上記のコードはPDFファイルを読み取るのに役立ちます。"FromFile"のパラメータには、入力PDFファイルのパスを指定します。次に、ExtractAllText関数がテストPDFのすべてのページからテキストを抽出します。 テキストをテキストファイルに保存するか、コンソールに表示することができます。 もっと多くのチュートリアルはこのページで確認できます:IronPDF テキスト抽出例ページ. プログラムのどこでも使用できる関数の形で次の機能を書くことができます。このように:

private void Extract()
{
    // Select the Desired PDF File
    using PdfDocument PDF = PdfDocument.FromFile("any.pdf");
    //Using ExtractAllText() method, extract every single text from an pdf
    string line = PDF.ExtractAllText();
    //View text in the console
    Console.WriteLine(line);
}
private void Extract()
{
    // Select the Desired PDF File
    using PdfDocument PDF = PdfDocument.FromFile("any.pdf");
    //Using ExtractAllText() method, extract every single text from an pdf
    string line = PDF.ExtractAllText();
    //View text in the console
    Console.WriteLine(line);
}
Private Sub Extract()
	' Select the Desired PDF File
	Using PDF As PdfDocument = PdfDocument.FromFile("any.pdf")
		'Using ExtractAllText() method, extract every single text from an pdf
		Dim line As String = PDF.ExtractAllText()
		'View text in the console
		Console.WriteLine(line)
	End Using
End Sub
VB   C#

IronPDFによって生成された出力を見てみましょう。

出力テキスト

C#でPDFを行ごとに読む方法:図1

IronPDFはテキストを完全に、エラーなしで抽出します。 結果は一流です。

結論: PDF読み取りのための最高のライブラリ

多くの開発者は、ソフトウェアや他のプログラムで異なるPDF読み取りライブラリを使用しています。 PDFファイルの操作と読み取りに利用できる複数のライブラリがあります。 しかし、IronPDFはPDFに関わるすべての操作において最良のライブラリです。

多くの業界や分野が、PDF文書を生成および印刷するためにPDF生成プログラムを使用しています。 市場には、PDF Sharpライブラリやその他の多くの.NETライブラリのように、コンテンツを迅速にPDFに変換することができるライブラリがたくさん存在します。 しかし、プログラムによるPDF生成に最適なライブラリはIronPDFです。 IronPDFは、暗号化、パスワード保護、MS Office形式をPDFに変換する機能など、多くの機能を提供します。 IronPDFを使用すると、これらの強力なツールを使用して簡単にPDFドキュメントを作成することができます。

IronPDFは無料のライブラリですが、商業利用する場合は支払いが必要です。 30日間の試用期間があり、実際の運用環境でテストすることができます。 IronPDFは非常に手頃な価格で利用可能であり、現在、5種類のソフトウェアを2つのコストで購入することができます。 料金プランに関する情報はすべてIronPDFライセンスページ.

< 以前
C#を使用してPDFをビットマップに変換する方法
次へ >
C#でレポート作成アプリケーションを作成する方法