C#でPDFファイルを読む

IronPDF C# PDFライブラリのPdfDocument.ExtractAllTextメソッドは、基本的なPDFテキスト読み取りタスクに最適です。 このメソッドは、ソースPDFドキュメント内の空白やエンコーディングの不一致を問題なく処理します。

PdfDocument.ExtractTextFromPage は、PDFの特定のページからテキストを読み取ります。 以下の例では、特定のページ範囲からテキストコンテンツを取得するために反復的に使用されている様子が示されています。

IronPDF は PDF から生データとして画像を抽出することもできます。 そのためには、以下の PdfDocument クラスにあるいずれかのメソッドを使用してください:

  • ExtractAllImages: PDFに埋め込まれたすべての画像をIronSoftware.Drawing.AnyBitmapオブジェクトとして返します。
  • ExtractAllRawImages: 埋め込まれたすべての画像を生のバイト列のリストとして取得します (byte[])。
  • ExtractImagesFromPage: インデックス登録されたページに含まれる画像を抽出します。
  • ExtractImagesFromPages: ExtractImagesFromPageと同様ですが、特定のページ範囲または個別のページリストから抽出します。
  • ExtractRawImagesFromPage および ExtractRawImagesFromPages: 前の2つのメソッドと同様に動作しますが、抽出された画像を IronSoftware.Drawing.AnyBitmap オブジェクトではなくバイト配列として返します。

Learn more about ExtractTextFromPage Method

準備はできましたか?
Nuget ダウンロード 19,014,616 | バージョン: 2026.5 just released
Still Scrolling Icon

まだスクロールしていますか?

すぐに証拠が欲しいですか? PM > Install-Package IronPdf
サンプルを実行するHTML が PDF に変換されるのを確認します。