C#でPDFファイルを読む

テキストや画像の抽出により、ある文書フォーマットから別のフォーマットへの移行時にデータ移行が容易になります。 抽出されたコンテンツは、よりアクセスしやすく編集可能な形式で保存でき、データ損失のリスクを軽減します。

埋め込まれた画像とテキストは、PDFドキュメントとは独立して抽出することができます。 抽出されたテキストは通常の文字列になり、抽出された画像はイメージバッファ形式で、エクスポートまたはさらに処理することができます。

extractText メソッドを使用してテキストを抽出し、extractRawImages メソッドを使用して PDF ドキュメントから画像を抽出します。

これらのメソッドの使用方法についての詳細な手順については、IronPDF ドキュメントをご覧ください。