C#でPDFファイルを読む

IronPDF C# PDF ライブラリの PdfDocument.ExtractAllText メソッドは、標準的な PDF テキスト読み取りタスクに最適です。 このメソッドは、ソースPDFドキュメント内の空白やエンコーディングの不一致を問題なく処理します。

PdfDocument.ExtractTextFromPage は PDF の特定のページからテキストを読み取ります。 以下の例では、特定のページ範囲からテキストコンテンツを取得するために反復的に使用されている様子が示されています。

IronPDF は PDF から生データとして画像を抽出することもできます。 このためには、以下の PdfDocument クラスのいずれかのメソッドを使用します。

  • ExtractAllImages : PDF に埋め込まれたすべての画像を IronSoftware.Drawing.AnyBitmap オブジェクトとして返します。
  • ExtractAllRawImages : 埋め込まれたすべての画像を生のバイトのリストとして取得します (byte[])。
  • ExtractImagesFromPage : インデックスページに含まれる画像を抽出します。
  • ExtractImagesFromPages : ExtractImagesFromPage と同​​じですが、特定のページ範囲または個々のページのリストから取得されます。
  • ExtractRawImagesFromPages : 前の 2 つの方法と同じように動作しますが、抽出された画像を IronSoftware.Drawing.AnyBitmap オブジェクトではなくバイト配列として返します。

Learn more about ExtractTextFromPage Method

準備はできましたか?
Nuget ダウンロード 17,803,474 | バージョン: 2026.3 リリース
Still Scrolling Icon

まだスクロールしていますか?

すぐに証拠が欲しいですか? PM > Install-Package IronPdf
サンプルを実行するHTML が PDF に変換されるのを確認します。