C#でPDFファイルを読む
IronPDF C# PDF ライブラリの PdfDocument.ExtractAllText メソッドは、標準的な PDF テキスト読み取りタスクに最適です。 このメソッドは、ソースPDFドキュメント内の空白やエンコーディングの不一致を問題なく処理します。
PdfDocument.ExtractTextFromPage は PDF の特定のページからテキストを読み取ります。 以下の例では、特定のページ範囲からテキストコンテンツを取得するために反復的に使用されている様子が示されています。
IronPDF は PDF から生データとして画像を抽出することもできます。 このためには、以下の PdfDocument クラスのいずれかのメソッドを使用します。
ExtractAllImages: PDF に埋め込まれたすべての画像をIronSoftware.Drawing.AnyBitmapオブジェクトとして返します。ExtractAllRawImages: 埋め込まれたすべての画像を生のバイトのリストとして取得します (byte[])。ExtractImagesFromPage: インデックスページに含まれる画像を抽出します。ExtractImagesFromPages:ExtractImagesFromPageと同じですが、特定のページ範囲または個々のページのリストから取得されます。ExtractRawImagesFromPages: 前の 2 つの方法と同じように動作しますが、抽出された画像をIronSoftware.Drawing.AnyBitmapオブジェクトではなくバイト配列として返します。
C#でPDFファイルを読み取る方法
- C#用IronPdfライブラリのダウンロード
- PDFから画像やテキストを抽出
- 特定の文書内の単語の読み取りと検索
- 原文のPDF出力を見る

