C#でPDFファイルを読む

IronPDF C# PDF ライブラリの PdfDocument.ExtractAllText メソッドは、標準的なPDFテキスト読み込みタスクに最適です。 このメソッドは、ソースPDFドキュメント内の空白やエンコーディングの不一致を問題なく処理します。

PdfDocument.ExtractTextFromPage は、PDFの特定のページからテキストを読み取ります。 以下の例では、特定のページ範囲からテキストコンテンツを取得するために反復的に使用されている様子が示されています。

IronPDF は PDF から生データとして画像を抽出することもできます。 これには以下の PdfDocument クラスのいずれかのメソッドを使用してください:

  • ExtractAllImages: PDFに埋め込まれた全ての画像を IronSoftware.Drawing.AnyBitmap オブジェクトとして返します。
  • ExtractAllRawImages: 埋め込まれた全ての画像を生のバイトリスト(byte[])として取得します。
  • ExtractImagesFromPage: インデックス付きページに含まれている画像を抽出します。
  • ExtractImagesFromPages: ExtractImagesFromPageと同様ですが、特定のページ範囲または個々のページのリストから抽出します。
  • ExtractRawImagesFromPage および ExtractRawImagesFromPages: 前述の二つのメソッドと同様に機能しますが、抽出された画像を IronSoftware.Drawing.AnyBitmap オブジェクトではなくバイト配列として返します。
class="hsg-featured-snippet">

C#でPDFファイルを読む方法

  1. IronPDFライブラリをC#用にダウンロード
  2. PDFから画像やテキストを抽出
  3. 特定のドキュメントで単語を読み取り、検索
  4. 元のドキュメントからのPDF出力を表示

ExtractTextFromPageメソッドについて詳しく学ぶ

準備はいいですか?
Nuget ダウンロード 16,154,058 | バージョン: 2025.11 ただ今リリースされました