Leer archivos PDF en C#

La extracción de texto e imágenes puede facilitar la migración de datos al pasar de un formato de documento a otro. El contenido extraído puede conservarse en un formato más accesible y editable, lo que reduce el riesgo de pérdida de datos.

Las imágenes y el texto incrustados pueden extraerse independientemente del documento PDF. El texto extraído estará en una cadena normal, mientras que las imágenes extraídas estarán en formato de búfer de imagen y podrán exportarse o procesarse posteriormente.

Utilice el método extractText para extraer texto y el método extractRawImages para extraer imágenes de un documento PDF.