PDF-Dateien in C# lesen

Die PdfDocument.ExtractAllText-Methode aus der IronPDF C# PDF-Bibliothek ist perfekt für einfache PDF-Textleseaufgaben geeignet. Diese Methode behandelt Leerzeichen und Kodierungsunterschiede innerhalb von PDF-Quelldokumenten ohne Probleme.

PdfDocument.ExtractTextFromPage liest den Text von bestimmten Seiten eines PDFs. Im folgenden Beispiel sehen wir es, wie es iterativ verwendet wird, um Textinhalte aus einem bestimmten Seitenbereich abzurufen.

IronPDF kann auch Rohbilder aus PDFs extrahieren. Dafür verwenden Sie eine der Methoden der PdfDocument-Klasse unten:

  • ExtractAllImages: gibt alle eingebetteten Bilder in einem PDF als Iron Software.Drawing.AnyBitmap-Objekte zurück.
  • ExtractAllRawImages: ruft alle eingebetteten Bilder als Liste von Rohbytes (byte[]) ab.
  • ExtractImagesFromPage: extrahiert die Bilder, die auf einer indizierten Seite enthalten sind.
  • ExtractImagesFromPages: ähnlich wie ExtractImagesFromPage, aber aus einem bestimmten Seitenbereich oder einer Liste einzelner Seiten.
  • ExtractRawImagesFromPage und ExtractRawImagesFromPages: funktionieren genauso wie die beiden vorherigen Methoden, geben jedoch die extrahierten Bilder als Byte-Arrays zurück anstatt als Iron Software.Drawing.AnyBitmap-Objekte.

Learn more about ExtractTextFromPage Method

Bereit anzufangen?
Nuget Downloads 17,012,929 | Version: 2025.12 gerade veröffentlicht