PDF-Dateien in C# lesen

Die Methode PdfDocument.ExtractAllText aus der IronPDF C# PDF-Bibliothek eignet sich perfekt für einfache PDF-Textleseaufgaben. Diese Methode behandelt Leerzeichen und Kodierungsunterschiede innerhalb von PDF-Quelldokumenten ohne Probleme.

PdfDocument.ExtractTextFromPage liest den Text von bestimmten Seiten einer PDF-Datei. Im folgenden Beispiel sehen wir es, wie es iterativ verwendet wird, um Textinhalte aus einem bestimmten Seitenbereich abzurufen.

IronPDF kann auch Rohbilder aus PDFs extrahieren. Verwenden Sie hierfür eine der folgenden Methoden aus der Klasse PdfDocument:

  • ExtractAllImages : Gibt alle in ein PDF eingebetteten Bilder als IronSoftware.Drawing.AnyBitmap Objekte zurück.
  • ExtractAllRawImages : Ruft alle eingebetteten Bilder als Liste von Rohbytes ab (byte[]).
  • ExtractImagesFromPage : extrahiert die auf einer indizierten Seite enthaltenen Bilder.
  • ExtractImagesFromPages : dasselbe wie ExtractImagesFromPage, jedoch ab einem bestimmten Seitenbereich oder einer Liste einzelner Seiten.
  • ExtractRawImagesFromPage und ExtractRawImagesFromPages : funktionieren genauso wie die beiden vorherigen Methoden, geben aber extrahierte Bilder als Byte-Arrays anstatt als IronSoftware.Drawing.AnyBitmap Objekte zurück.

Learn more about ExtractTextFromPage Method

Bereit anzufangen?
Nuget Downloads 17,803,474 | Version: 2026.3 gerade veröffentlicht
Still Scrolling Icon

Scrollst du immer noch?

Sie brauchen schnell einen Beweis? PM > Install-Package IronPdf
Führen Sie eine Probe aus Sehen Sie zu, wie Ihr HTML-Code in eine PDF-Datei umgewandelt wird.