IRONPDFの使用

C#でPDFファイルを読み取る方法

更新済み 11月 13, 2023
共有:

この記事では IronPDF .NET 用の PDF ファイルを読み取るための C# PDF ライブラリ。

以下の手順に従って、IronPDFを使用してPDFファイルを読み取ります

  1. Visual Studioをまだダウンロードしていない場合は、ダウンロードしてください。 環境を設定し、IronPDFライブラリをインストールします。

  2. 使用 `PdfDocument.FromFile(ファイルパス)もちろん、英語のテキストを教えていただけますでしょうか? 目的のPDFファイルを開いて読み込むメソッド。

  3. IronPDFのExtractAllTextメソッドを利用してコンテンツを取得します。

  4. 必要に応じて抽出されたテキストを解析または操作する。

  5. 抽出されたテキストをコンソールに出力して読んでください。

    IronPDF

IronPDFは、.NETおよびJava、Python、Node.jsでPDFを生成、編集、読み取るための強力なツールです。プログラマー向けに最適化されており、コードからPDFファイルの作成を容易に行うことができます。IronPDFは、HTML、CSS、JavaScript、および画像をPDFドキュメントに変換する能力を提供します。

機能

  • HTML to PDF: HTML、CSS、JavaScriptを利用してPDFを生成。
  • PDFの編集: 既存のPDFドキュメントにテキスト、画像、ページ番号、さらにはカスタムヘッダーやフッターを追加。
  • PDFの読み取り: PDFファイルからテキスト、画像、メタデータを抽出。
  • セキュリティ: パスワード保護や暗号化オプションでPDFドキュメントを保護。

利点

  • 使いやすさ: シンプルなAPIで時間を節約。
  • 高品質: 正確で美しいPDFドキュメントを生成。
  • 柔軟性: 様々なプラットフォームや言語で利用可能。

対応ライセンス

IronPDFは様々なライセンスオプションがあり、Lite License、Plus License、Professional License、Unlimited Licenseが用意されています。

技術サポートや詳細については、Iron Softwareの公式サイトをご覧ください。

IronPDFC#用の強力なPDFリーダーライブラリであるIronPDFにより、開発者はPDFドキュメントを簡単に操作することができます。 その豊富な機能と能力により、IronPDFはPDFドキュメントの取り扱いを簡単にし、ユーザーがPDFコンテンツを容易に読み、抽出し、操作することを可能にします。 ドキュメント処理を自動化する際や、分析のためにデータや画像を抽出する際、またはゼロからPDFを作成する際、IronPDFはこれらのタスクを効率化するための包括的なツールセットを提供します。

この記事では、C#を使用して効率的にPDFを処理する方法について探ります。 IronPDF, 開発者のソフトウェア開発の旅において、不可欠なツールとしての多様性と価値を示しています。

新しいVisual Studioプロジェクトの作成

まず、コーディングに入る前に新しい環境を設定しましょう ビジュアルスタジオ C# コンソールアプリケーションプロジェクト。 このプロジェクトは、開発と実例の両方のための専用ワークスペースとして機能します。

  1. このプロセスを開始するには、Visual Studioを起動し、「ファイル」メニューに移動して「新規作成」、次に「プロジェクト」を選択して新しいプロジェクトを作成します。

    C#でPDFファイルを読み取る方法、図1:Visual Studioで[プロジェクトの作成]ダイアログに移動します

    Visual Studioの「プロジェクトの作成」ダイアログに移動します。

  2. このアクションにより、新しいウィンドウが表示され、プロジェクトテンプレートを指定する機会が提供されます。 この簡素さのために、"Console Application" テンプレートを選択し、ウィンドウの左下隅に注意深く配置された Next ボタンをクリックして進みます。

    C#でPDFファイルを読み取る方法, 図2: Visual Studioで新しいプロジェクトを作成する

    Visual Studio で新しいプロジェクトを作成する

  3. 次のウィンドウで、プロジェクト名を指定し、希望するプロジェクトの場所を設定するよう求められます。 詳細を入力したら、次へボタンをクリックして続行してください。

    C#でPDFファイルを読み取る方法、図3:プロジェクトの設定

    プロジェクトの構成

  4. このステップでは、お好みのターゲットフレームワークを選択し、Create ボタンをクリックしてプロジェクト作成プロセスを完了します。

    C#でPDFファイルを読む方法, 図4: .NET Frameworkの選択

    .NETフレームワークの選択

    あなたのプロジェクトが確立された今、次の重要なステップは、のインストールです。 IronPDF.

IronPDFのインストール

IronPDF PDFライブラリのダウンロードおよびインストールのための多数のオプションを提供します。 このガイドのために、NuGet パッケージ マネージャーを使用して IronPDF をインストールすることに焦点を当てます。これは熟練して広く採用されている方法です。

  1. Visual Studio内で、「ツール」メニューに移動し、「NuGetパッケージマネージャー」オプションにカーソルを優雅にホバリングします。

  2. 拡張メニューから「ソリューションのためのNuGetパッケージマネージャー」を選択します。

    C#でPDFファイルを読み取る方法、図5:NuGetパッケージマネージャーに移動してください

    NuGetパッケージマネージャーに移動

  3. このオプションを選択すると、新しいウィンドウが開きます。 この精緻なウィンドウ内で、「Browse」メニューに進み、「IronPDF」を検索バーに入力します。

  4. 画面には、利用可能なIronPDFパッケージが表示されます。 続行するには、リストから最新のパッケージを選択し、「インストール」オプションをクリックしてこの選択を実行してください。

    C#でPDFファイルを読む方法、図6:NuGetパッケージマネージャーUIでIronPDFパッケージを検索してインストールする

    NuGetパッケージマネージャーUIでIronPDFパッケージを検索してインストールします

    コマンドラインアプローチを好む方には、NuGetパッケージマネージャーコンソールが優雅な方法を提供します。 このコンソールを開き、次のコマンドを入力して、「Enter」キーを押してください。

Install-Package IronPdf

パッケージを直接取得するオプションにもアクセスできます。 NuGetウェブサイト リンク。

IronPDFを使用してPDFファイルを読む

このセクションでは、IronPDFを使用してC#プログラミング言語でPDFファイルを開き、読み取る方法を紹介します。

using IronPdf;
using System;

IronPdf.License.LicenseKey = "";
//raw text string path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

string text = pdf.ExtractAllText();

Console.WriteLine(text);
using IronPdf;
using System;

IronPdf.License.LicenseKey = "";
//raw text string path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");

string text = pdf.ExtractAllText();

Console.WriteLine(text);
Imports IronPdf
Imports System

IronPdf.License.LicenseKey = ""
'raw text string path
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")

Dim text As String = pdf.ExtractAllText()

Console.WriteLine(text)
VB   C#

必要なライブラリのインポート

始めに、必要な名前空間をインポートする必要があります。 上記のコード例では、IronPdf 名前空間がインポートされており、PDFを扱うための重要な機能が含まれています。 さらに、一般的なシステムレベルの操作のために System ネームスペースもインポートされています。

using IronPdf;
using System;
using IronPdf;
using System;
Imports IronPdf
Imports System
VB   C#

2. IronPDFライセンスキーの設定

IronPDF 本番環境で使用するには、有効なライセンスキーが必要です。 コード例では、ライセンスキーを設定する行があります。 ただし、提供されたコードでは、ライセンスキーが空の""のままになっています。 本番環境でIronPDFを使用する際は、空の文字列を有効なライセンスキーに置き換えてください。

IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here"
VB   C#

3. PDFドキュメントの読み込み

次のステップはPDFファイルを読み込み、解析することです。提供されたコードでは、PdfDocument.FromFileメソッドを使用して、"document_scaled_compressed.pdf"というファイル名のPDFを読み込み、それをpdf変数に割り当てます。 このPDFファイルはテキスト抽出に使用されます。

var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")
VB   C#

PDFドキュメントからテキストを抽出する

IronPDFは、読み込まれたPDFドキュメントからテキストを抽出するためのシンプルな方法を提供します。 について ExtractAllText このメソッドは、PDFの各ページから全てのテキストコンテンツを抽出し、それをtextという名前のstring変数に格納することができます。これは、PDFをテキストに変換するように機能します。

string text = pdf.ExtractAllText();
string text = pdf.ExtractAllText();
Dim text As String = pdf.ExtractAllText()
VB   C#

抽出されたテキストの表示

最終段階は、抽出されたテキストを表示することです。 コードでは、Console.WriteLine が抽出されたテキストをコンソールに出力して書き込みます。 これは、デバッグやユーザーにテキストを提示するのに便利な方法です。

Console.WriteLine(text);
Console.WriteLine(text);
Console.WriteLine(text)
VB   C#

PDFファイルから抽出されたテキスト

C#でPDFファイルを読み取る方法、図7:PDFファイルから抽出されたテキスト

PDFファイルから抽出されたテキスト

結論

この記事では、C# を使用して PDF ファイルを効果的に処理する方法について開発者をガイドしました。 IronPDF ライブラリ。 それは、専用のVisual Studioプロジェクトの設定を示すことから始まり、続いてNuGet Package Managerを介してIronPDFの簡単なインストールが行われました。 その記事では、必要なライブラリのインポート方法、IronPDFのライセンスキーの設定方法、PDFファイルの読み込み方法、テキストコンテンツの抽出方法、および全ページから抽出されたテキストを表示する方法について、段階的な説明が提供されました。 C#を使用して抽出したテキストをTXTファイルとして保存することもできます。

使いやすさと包括的な機能を備えている IronPDF は、ドキュメントプロセスの自動化、データ抽出、HTML、URL、画像からのPDF作成に欠かせないツールとして機能し、C#でのPDFファイル処理を含むソフトウェア開発プロジェクトの向上にとって非常に貴重な資産です。

PDFファイルの読み取りの完全な記事 IronPDF 以下にあります 使い方ページ. コード例は C# PDFリーダー も利用可能です。 IronPDFを使用した詳細なコード例については、こちらをご覧ください サンプルページ. IronPDFは、すべての開発者の質問に答えるための充実したドキュメントを提供し、完全なハンズオンサポートを提供します。 IronPDFは無料の 試用ライセンス ユーザーが購入を決定する前に、その全機能を探索できるように 永久ライセンス.

< 以前
C#でPDFスタンプを追加する方法
次へ >
.NETライブラリでPDFファイルを圧縮する方法

準備はできましたか? バージョン: 2024.9 新発売

無料のNuGetダウンロード 総ダウンロード数: 10,659,073 View Licenses >