C#でPDFファイルを読む
IronPDF C# PDFライブラリのPdfDocument.ExtractAllTextメソッドは、基本的なPDFテキスト読み取りタスクに最適です。 このメソッドは、ソースPDFドキュメント内の空白やエンコーディングの不一致を問題なく処理します。
PdfDocument.ExtractTextFromPage は、PDFの特定のページからテキストを読み取ります。 以下の例では、特定のページ範囲からテキストコンテンツを取得するために反復的に使用されている様子が示されています。
IronPDF は PDF から生データとして画像を抽出することもできます。 そのためには、以下の PdfDocument クラスにあるいずれかのメソッドを使用してください:
ExtractAllImages: PDFに埋め込まれたすべての画像をIronSoftware.Drawing.AnyBitmapオブジェクトとして返します。ExtractAllRawImages: 埋め込まれたすべての画像を生のバイト列のリストとして取得します (byte[])。ExtractImagesFromPage: インデックス登録されたページに含まれる画像を抽出します。ExtractImagesFromPages:ExtractImagesFromPageと同様ですが、特定のページ範囲または個別のページリストから抽出します。ExtractRawImagesFromPageおよびExtractRawImagesFromPages: 前の2つのメソッドと同様に動作しますが、抽出された画像をIronSoftware.Drawing.AnyBitmapオブジェクトではなくバイト配列として返します。
C#でPDFファイルを読み取る方法
- C#用IronPDFライブラリのダウンロード
- PDFから画像やテキストを抽出
- 特定の文書内の単語の読み取りと検索
- 原文のPDF出力を見る

