PDF-Dateien in C# lesen
Die Methode PdfDocument.ExtractAllText aus der IronPDF C# PDF-Bibliothek eignet sich perfekt für einfache PDF-Textleseaufgaben. Diese Methode behandelt Leerzeichen und Kodierungsunterschiede innerhalb von PDF-Quelldokumenten ohne Probleme.
PdfDocument.ExtractTextFromPage liest den Text von bestimmten Seiten einer PDF-Datei. Im folgenden Beispiel sehen wir es, wie es iterativ verwendet wird, um Textinhalte aus einem bestimmten Seitenbereich abzurufen.
IronPDF kann auch Rohbilder aus PDFs extrahieren. Verwenden Sie hierfür eine der folgenden Methoden aus der Klasse PdfDocument:
ExtractAllImages: Gibt alle in ein PDF eingebetteten Bilder alsIronSoftware.Drawing.AnyBitmapObjekte zurück.ExtractAllRawImages: Ruft alle eingebetteten Bilder als Liste von Rohbytes ab (byte[]).ExtractImagesFromPage: extrahiert die auf einer indizierten Seite enthaltenen Bilder.ExtractImagesFromPages: dasselbe wieExtractImagesFromPage, jedoch ab einem bestimmten Seitenbereich oder einer Liste einzelner Seiten.ExtractRawImagesFromPageundExtractRawImagesFromPages: funktionieren genauso wie die beiden vorherigen Methoden, geben aber extrahierte Bilder als Byte-Arrays anstatt alsIronSoftware.Drawing.AnyBitmapObjekte zurück.
Wie man PDF-Dateien in C# liest
- Runterladen der IronPDF-Bibliothek für C#
- Bilder oder Text aus PDF extrahieren
- Lesen und Finden von Wörtern in bestimmten Dokumenten
- PDF-Ausgabe des Originaldokuments anzeigen

