PDF-Dateien in C# lesen Das Extrahieren von Text und Bildern kann die Datenmigration bei der Umstellung von einem Dokumentformat auf ein anderes erleichtern. Die extrahierten Inhalte können in einem leichter zugänglichen und bearbeitbaren Format gespeichert werden, wodurch das Risiko eines Datenverlusts verringert wird. Eingebettete Bilder und Texte können unabhängig vom PDF-Dokument extrahiert werden. Der extrahierte Text wird in einer normalen Zeichenkette vorliegen, während die extrahierten Bilder im Bildpufferformat vorliegen und dann exportiert oder weiterverarbeitet werden können. Verwenden Sie die Methode extractText, um Text zu extrahieren, und die Methode extractRawImages, um Bilder aus einem PDF-Dokument zu extrahieren. Hier ist ein korrigiertes und kommentiertes Beispiel, wie Sie dies tun könnten: Im obigen C#-Code: Wir verwenden die IronPDF-Bibliothek, um ein PDF-Dokument zu laden. die Methode ExtractText() wird aufgerufen, um den Text aus der PDF-Datei abzurufen. Dieser Text wird auf der Konsole ausgegeben. die Methode ExtractImages() wird verwendet, um Bilder zu extrahieren, die in Byte-Arrays gespeichert sind. Jedes Bild wird dann im Dateisystem unter einem bestimmten Dateinamen gespeichert. Ausführlichere Anweisungen zur Verwendung dieser Methoden finden Sie in der IronPDF Dokumentation. Erfahren Sie mehr über das Lesen von PDF-Text mit IronPDF Verwandte Doku-Links Auf Github ansehen Verwandtes Tutorial Verwandte Anleitung Klassendokumentation Sprachpakete herunterladen IronPDF DLL herunterladen (Windows, Linux, Azure) Bereit anzufangen? Version: 2025.11 gerade veröffentlicht Kostenlose npm-Installation Lizenzen anzeigen
In einer Live-Umgebung testen Testen Sie ohne Wasserzeichen in der Produktion.Funktioniert dort, wo Sie es brauchen.
Voll funktionsfähiges Produkt Erhalten Sie 30 Tage voll funktionsfähiges Produkt.In wenigen Minuten einsatzbereit.
24/5 technischer Support Voller Zugriff auf unser Support-Engineering-Team während Ihrer Produktprobe