ライブ環境でテストする
ウォーターマークなしで本番環境でテストしてください。
必要な場所でいつでも動作します。
この記事では、.NET開発者がPDFファイルをTXT形式に変換してより効率的にアクセスするプロセスを説明します。
ステップ 2: IronPDFライブラリをインストールする
方法 1: NuGet パッケージ マネージャー
ステップ 3: IronPDF 名前空間を追加
IronPDFは、.NETおよびJava、Python、Node.jsでPDFを生成、編集、読み取るための強力なツールです。プログラマー向けに最適化されており、コードからPDFファイルの作成を容易に行うことができます。IronPDFは、HTML、CSS、JavaScript、および画像をPDFドキュメントに変換する能力を提供します。
IronPDFは様々なライセンスオプションがあり、Lite License、Plus License、Professional License、Unlimited Licenseが用意されています。
技術サポートや詳細については、Iron Softwareの公式サイトをご覧ください。
IronPDFは、PDF生成のための.NETライブラリです。 それはネイティブの .NET ライブラリであり、外部DLLや他のツールに依存しません。 IronPDFは、PDFドキュメントを扱うために必要なすべての機能を提供するC#と.NETで書かれたクロスプラットフォームライブラリです。 ドキュメントのレンダリング、フォームの編集、テキストの抽出、ファイルの暗号化、およびその他の機能が含まれています。 これらすべての操作は、Windows Forms、WPF、ASP.NET MVCなどのさまざまなプラットフォームで広範にテストされてきた直感的なAPIを通じて実行できます。
現在リリースされているIronPDFでは、次の機能に簡単にアクセスできます:
テキスト抽出 PDFから (OCR (光学式文字認識))
記入可能なフォーム
読み取り専用アクセス ドキュメント内部へ (ビュー、ナビゲーション、注釈):
アクセス先 メタデータおよびドキュメントのプロパティ (タイトル、キーワード、著者、件名):
IronPDFには、さらに役立つヘルパークラスが含まれています。 HTMLドキュメントを完全にフォーマットされたPDFファイルに変換する テキスト抽出を使用して。 IronPDFは、PDFをテキストファイルに変換する非常にシンプルなAPIを提供します。
まず、IronPDFライブラリを使用してPDFドキュメントをテキストファイルに変換する方法について説明します。
最初のステップは、Visual StudioでC#プロジェクトを作成することです。 ニーズに応じて任意のC#アプリケーションテンプレートを選択できます。 簡便化のために、このチュートリアルではコンソールアプリケーションテンプレートを使用します。 既存のC#プロジェクトを使用してPDFファイルをTXTファイルに変換することができます。
Visual StudioでC#プロジェクトを作成するか、既存のプロジェクトを開きます。 最新バージョンのVisual Studioを推奨します。スムーズに動作します。 次の手順に従って、Visual StudioでC#プロジェクトを作成してください。
Visual Studioを開きます。
C#コンソールアプリケーションテンプレートを選択するか、既存のプロジェクトを開いてください。
プロジェクトに適切な名前をつけてください。
IronPDF には、インストールが簡単であるため開発時間が短縮され、混乱を減らす機能も備わっています。 IronPDFライブラリは複数のインストール方法を提供しています:
NuGet パッケージ マネージャー コンソールを使用
NuGet パッケージ マネージャーを使用するには、指定された手順に従ってパッケージ マネージャー タブを開いてください。
C#プロジェクトを開き、「ツール」>「NuGetパッケージマネージャー」>「ソリューションのNuGetパッケージの管理」をクリックします。
NuGetパッケージマネージャーに移動
検索結果からIronPDFを選択し、「Install」をクリックします。 これにより、IronPDF ライブラリがインストールされ、プロジェクトで IronPDF ライブラリを利用できるようになります。
NuGetパッケージマネージャーの検索結果からのIronPdfパッケージ
Package Manager Console で IronPDF ライブラリをインストールするのが最も簡単な方法です。 以下の簡単な手順に従ってください:
Install-Package IronPdf
NuGet パッケージ マネージャー コンソール UI に表示されるインストールの進行状況
ダウンロードできます DLLファイル Iron Softwareのウェブサイトからダウンロードが完了したら、それをプロジェクトの参考として使用してください。
ウェブサイトに訪問してください インストールページ 詳細なインストールガイドについては、こちらをご覧ください。
IronPDFライブラリのインストールが完了しました。 以下の手順に従ってPDFファイルをテキストファイルに変換することができます。
IronPDFを使用するには、すべてのコードファイルにIronPDFの名前空間を追加する必要があります。関連するすべてのコードファイルの先頭に次のコード行を書いてください。これにより、プログラム内でIronPDFの機能を使用できるようになります。
using IronPdf;
using IronPdf;
Imports IronPdf
ステップ4: PDFドキュメントをテキストファイルに変換
PDFファイルをTXTファイルに変換するか、テキストのみを抽出する必要があります。 では、以下のサンプルコードをコードファイルに書き込んでください:
using IronPdf;
using System.Drawing;
// Extracting image and text content from PDF Document
// Open a 128-bit encrypted PDF
using PdfDocument pdf = PdfDocument.FromFile("encrypted.pdf", "password");
// Get all text to put in a search index
string allText = pdf.ExtractAllText();
Console.WriteLine(allText);
using IronPdf;
using System.Drawing;
// Extracting image and text content from PDF Document
// Open a 128-bit encrypted PDF
using PdfDocument pdf = PdfDocument.FromFile("encrypted.pdf", "password");
// Get all text to put in a search index
string allText = pdf.ExtractAllText();
Console.WriteLine(allText);
Imports IronPdf
Imports System.Drawing
' Extracting image and text content from PDF Document
' Open a 128-bit encrypted PDF
Private PdfDocument As using
' Get all text to put in a search index
Private allText As String = pdf.ExtractAllText()
Console.WriteLine(allText)
まず、IronPDFを使用してPDFドキュメントを開きます。 FromFile(ファイルから)
関数から PdfDocument(PDFドキュメント)
クラス。 パラメーターには、ファイル名とパスワードを渡してください。 (何かあれば). その後, その ExtractAllText
PDFファイルからすべてのテキストを抽出し、allText
という名前の変数に保存する関数。 コンソールに出力される以下の内容を翻訳します:
以下の内容をコンソールに表示します
PDF ドキュメントから抽出されたテキスト
これはIronPDFによって抽出された出力テキストです。 PDFファイルに表示されているテキストと同じであり、IronPDFの精度が非常に高いことを示しています。
この記事では、IronPDF .NET PDFライブラリを使用してPDFファイルからテキストを簡単に抽出する方法を紹介します。 これは数行のコードを書くことで達成され、高い精度で実現されました。 また、IronPDFには、HTMLからPDFへの変換、PDFの書式設定ツールなど、PDF編集に不可欠な多くの基本的なPDF機能を備えています。 IronPDFはAdobe Acrobatへの依存も排除します。
IronPDFは開発目的で無料で利用でき、また 無料試用 本番テスト用。 IronPDFは、ニーズに応じて様々な価格プランを提供しています。 IronPDFの価格は競合他社に比べてかなり低く設定されています。 価格は個人から大企業まで様々で、その優れたパフォーマンスから魅力的な購入対象となっています。
Iron Softwareのスイートの価格プラン
さらに、Iron Softwareは、5つのIron Softwareパッケージを2つの価格で提供しています。 ご訪問ください ライセンスページ 詳しくは、こちらをご覧ください。
9つの .NET API製品 オフィス文書用