PDF-Dateien in C# lesen
Das Extrahieren von Text und Bildern kann die Datenmigration bei der Umstellung von einem Dokumentformat auf ein anderes erleichtern. Extrahierte Inhalte können in einem leichter zugänglichen und bearbeitbaren Format aufbewahrt werden, wodurch das Risiko eines Datenverlusts verringert wird.
Eingebettete Bilder und Texte können unabhängig vom PDF-Dokument extrahiert werden. Der extrahierte Text wird in einer normalen Zeichenkette vorliegen, während die extrahierten Bilder im Bildpufferformat vorliegen und dann exportiert oder weiterverarbeitet werden können.
Verwenden Sie die extractText
-Methode, um Text zu extrahieren, und die extractRawImages
-Methode, um Bilder aus einem PDF-Dokument zu extrahieren.
Für detaillierte Anweisungen zur Verwendung dieser Methoden besuchen Sie die IronPDF-Dokumentation.