ライブ環境でテストする
ウォーターマークなしで本番環境でテストしてください。
必要な場所でいつでも動作します。
この記事ではIronPDF.NET 用の PDF ファイルを読み取るための C# PDF ライブラリ。
Visual Studioをまだダウンロードしていない場合は、ダウンロードしてください。 環境を設定し、IronPDFライブラリをインストールします。
使用`PdfDocument.FromFile(ファイルパス)もちろん、英語のテキストを教えていただけますでしょうか?目的のPDFファイルを開いて読み込むメソッド。
IronPDFのExtractAllText
メソッドを利用してコンテンツを取得します。
必要に応じて抽出されたテキストを解析または操作する。
IronPDFは、.NETおよびJava、Python、Node.jsでPDFを生成、編集、読み取るための強力なツールです。プログラマー向けに最適化されており、コードからPDFファイルの作成を容易に行うことができます。IronPDFは、HTML、CSS、JavaScript、および画像をPDFドキュメントに変換する能力を提供します。
IronPDFは様々なライセンスオプションがあり、Lite License、Plus License、Professional License、Unlimited Licenseが用意されています。
技術サポートや詳細については、Iron Softwareの公式サイトをご覧ください。
IronPDFC#用の強力なPDFリーダーライブラリであるIronPDFにより、開発者はPDFドキュメントを簡単に操作することができます。 その豊富な機能と能力により、IronPDFはPDFドキュメントの取り扱いを簡単にし、ユーザーがPDFコンテンツを容易に読み、抽出し、操作することを可能にします。 ドキュメント処理を自動化する際や、分析のためにデータや画像を抽出する際、またはゼロからPDFを作成する際、IronPDFはこれらのタスクを効率化するための包括的なツールセットを提供します。
この記事では、C#を使用して効率的にPDFを処理する方法について探ります。IronPDF, 開発者のソフトウェア開発の旅において、不可欠なツールとしての多様性と価値を示しています。
まず、コーディングに入る前に新しい環境を設定しましょうビジュアルスタジオC# コンソールアプリケーションプロジェクト。 このプロジェクトは、開発と実例の両方のための専用ワークスペースとして機能します。
このプロセスを開始するには、Visual Studioを起動し、「ファイル」メニューに移動して「新規作成」、次に「プロジェクト」を選択して新しいプロジェクトを作成します。
Visual Studioの「プロジェクトの作成」ダイアログに移動します。
このアクションにより、新しいウィンドウが表示され、プロジェクトテンプレートを指定する機会が提供されます。 この簡素さのために、"Console Application" テンプレートを選択し、ウィンドウの左下隅に注意深く配置された Next ボタンをクリックして進みます。
Visual Studio で新しいプロジェクトを作成する
次のウィンドウで、プロジェクト名を指定し、希望するプロジェクトの場所を設定するよう求められます。 詳細を入力したら、次へボタンをクリックして続行してください。
プロジェクトの構成
このステップでは、お好みのターゲットフレームワークを選択し、Create ボタンをクリックしてプロジェクト作成プロセスを完了します。
.NETフレームワークの選択
あなたのプロジェクトが確立された今、次の重要なステップは、のインストールです。IronPDF.
IronPDF PDFライブラリのダウンロードおよびインストールのための多数のオプションを提供します。 このガイドのために、NuGet パッケージ マネージャーを使用して IronPDF をインストールすることに焦点を当てます。これは熟練して広く採用されている方法です。
Visual Studio内で、「ツール」メニューに移動し、「NuGetパッケージマネージャー」オプションにカーソルを優雅にホバリングします。
拡張メニューから「ソリューションのためのNuGetパッケージマネージャー」を選択します。
NuGetパッケージマネージャーに移動
このオプションを選択すると、新しいウィンドウが開きます。 この精緻なウィンドウ内で、「Browse」メニューに進み、「IronPDF」を検索バーに入力します。
画面には、利用可能なIronPDFパッケージが表示されます。 続行するには、リストから最新のパッケージを選択し、「インストール」オプションをクリックしてこの選択を実行してください。
NuGetパッケージマネージャーUIでIronPDFパッケージを検索してインストールします
コマンドラインアプローチを好む方には、NuGetパッケージマネージャーコンソールが優雅な方法を提供します。 このコンソールを開き、次のコマンドを入力して、「Enter」キーを押してください。
Install-Package IronPdf
パッケージを直接取得するオプションにもアクセスできます。NuGetウェブサイトリンク。
このセクションでは、IronPDFを使用してC#プログラミング言語でPDFファイルを開き、読み取る方法を紹介します。
using IronPdf;
using System;
IronPdf.License.LicenseKey = "";
//raw text string path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
string text = pdf.ExtractAllText();
Console.WriteLine(text);
using IronPdf;
using System;
IronPdf.License.LicenseKey = "";
//raw text string path
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
string text = pdf.ExtractAllText();
Console.WriteLine(text);
Imports IronPdf
Imports System
IronPdf.License.LicenseKey = ""
'raw text string path
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")
Dim text As String = pdf.ExtractAllText()
Console.WriteLine(text)
始めに、必要な名前空間をインポートする必要があります。 上記のコード例では、IronPdf
名前空間がインポートされており、PDFを扱うための重要な機能が含まれています。 さらに、一般的なシステムレベルの操作のために System
ネームスペースもインポートされています。
using IronPdf;
using System;
using IronPdf;
using System;
Imports IronPdf
Imports System
IronPDF本番環境で使用するには、有効なライセンスキーが必要です。 コード例では、ライセンスキーを設定する行があります。 ただし、提供されたコードでは、ライセンスキーが空の""
のままになっています。 本番環境でIronPDFを使用する際は、空の文字列を有効なライセンスキーに置き換えてください。
IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here";
IronPdf.License.LicenseKey = "Your_License_Key_Here"
次のステップはPDFファイルを読み込み、解析することです。提供されたコードでは、PdfDocument.FromFile
メソッドを使用して、"document_scaled_compressed.pdf"というファイル名のPDFを読み込み、それをpdf変数に割り当てます。 このPDFファイルはテキスト抽出に使用されます。
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
var pdf = PdfDocument.FromFile("document_scaled_compressed.pdf");
Dim pdf = PdfDocument.FromFile("document_scaled_compressed.pdf")
IronPDFは、読み込まれたPDFドキュメントからテキストを抽出するためのシンプルな方法を提供します。 についてExtractAllText
このメソッドは、PDFの各ページから全てのテキストコンテンツを抽出し、それをtextという名前のstring変数に格納することができます。これは、PDFをテキストに変換するように機能します。
string text = pdf.ExtractAllText();
string text = pdf.ExtractAllText();
Dim text As String = pdf.ExtractAllText()
最終段階は、抽出されたテキストを表示することです。 コードでは、Console.WriteLine が抽出されたテキストをコンソールに出力して書き込みます。 これは、デバッグやユーザーにテキストを提示するのに便利な方法です。
Console.WriteLine(text);
Console.WriteLine(text);
Console.WriteLine(text)
PDFファイルから抽出されたテキスト
この記事では、C# を使用して PDF ファイルを効果的に処理する方法について開発者をガイドしました。IronPDFライブラリ。 それは、専用のVisual Studioプロジェクトの設定を示すことから始まり、続いてNuGet Package Managerを介してIronPDFの簡単なインストールが行われました。 その記事では、必要なライブラリのインポート方法、IronPDFのライセンスキーの設定方法、PDFファイルの読み込み方法、テキストコンテンツの抽出方法、および全ページから抽出されたテキストを表示する方法について、段階的な説明が提供されました。 C#を使用して抽出したテキストをTXTファイルとして保存することもできます。
使いやすさと包括的な機能を備えているIronPDFは、ドキュメントプロセスの自動化、データ抽出、HTML、URL、画像からのPDF作成に欠かせないツールとして機能し、C#でのPDFファイル処理を含むソフトウェア開発プロジェクトの向上にとって非常に貴重な資産です。
PDFファイルの読み取りの完全な記事IronPDF以下にあります使い方ページ. コード例はC# PDFリーダーも利用可能です。 IronPDFを使用した詳細なコード例については、こちらをご覧くださいサンプルページ. IronPDFは、すべての開発者の質問に答えるための充実したドキュメントを提供し、完全なハンズオンサポートを提供します。 IronPDFは無料の試用ライセンスユーザーが購入を決定する前に、その全機能を探索できるように永久ライセンス.
9つの .NET API製品 オフィス文書用