PDF-Dateien in C# lesen

Das Extrahieren von Text und Bildern kann die Datenmigration bei der Umstellung von einem Dokumentformat auf ein anderes erleichtern. Extrahierte Inhalte können in einem leichter zugänglichen und bearbeitbaren Format aufbewahrt werden, wodurch das Risiko eines Datenverlusts verringert wird.

Eingebettete Bilder und Texte können unabhängig vom PDF-Dokument extrahiert werden. Der extrahierte Text wird in einer normalen Zeichenkette vorliegen, während die extrahierten Bilder im Bildpufferformat vorliegen und dann exportiert oder weiterverarbeitet werden können.

Verwenden Sie die Methode extractText, um Text zu extrahieren, und die Methode extractRawImages, um Bilder aus einem PDF-Dokument zu extrahieren.