C#でPDFファイルを読む
IronPDF C# PDF ライブラリの PdfDocument.ExtractAllText メソッドは、標準的なPDFテキスト読み込みタスクに最適です。 このメソッドは、ソースPDFドキュメント内の空白やエンコーディングの不一致を問題なく処理します。
PdfDocument.ExtractTextFromPage は、PDFの特定のページからテキストを読み取ります。 以下の例では、特定のページ範囲からテキストコンテンツを取得するために反復的に使用されている様子が示されています。
IronPDF は PDF から生データとして画像を抽出することもできます。 これには以下の PdfDocument クラスのいずれかのメソッドを使用してください:
ExtractAllImages: PDFに埋め込まれた全ての画像をIron Software.Drawing.AnyBitmapオブジェクトとして返します。ExtractAllRawImages: 埋め込まれた全ての画像を生のバイトリスト(byte[])として取得します。ExtractImagesFromPage: インデックス付きページに含まれている画像を抽出します。ExtractImagesFromPages:ExtractImagesFromPageと同様ですが、特定のページ範囲または個々のページのリストから抽出します。ExtractRawImagesFromPageおよびExtractRawImagesFromPages: 前述の二つのメソッドと同様に機能しますが、抽出された画像をIron Software.Drawing.AnyBitmapオブジェクトではなくバイト配列として返します。
C#でPDFファイルを読み取る方法
- C#用IronPdfライブラリのダウンロード
- PDFから画像やテキストを抽出
- 特定の文書内の単語の読み取りと検索
- 原文のPDF出力を見る





