PDF-Dateien in C# lesen

Die PdfDocument.ExtractAllText-Methode aus der IronPDF-C#-PDF-Bibliothek eignet sich perfekt für einfache PDF-Textlesungsaufgaben. Diese Methode behandelt Leerzeichen und Kodierungsunterschiede innerhalb von PDF-Quelldokumenten ohne Probleme.

PdfDocument.ExtractTextFromPage liest den Text von bestimmten Seiten einer PDF-Datei. Im folgenden Beispiel sehen wir es, wie es iterativ verwendet wird, um Textinhalte aus einem bestimmten Seitenbereich abzurufen.

IronPDF kann auch Rohbilder aus PDFs extrahieren. Verwenden Sie hierfür eine der Methoden aus der unten stehenden Klasse PdfDocument:

  • ExtractAllImages: Gibt alle in einer PDF-Datei eingebetteten Bilder als IronSoftware.Drawing.AnyBitmap-Objekte zurück.
  • ExtractAllRawImages: Ruft alle eingebetteten Bilder als Liste von Rohbytes ab (byte[]).
  • ExtractImagesFromPage: extrahiert die auf einer indizierten Seite enthaltenen Bilder.
  • ExtractImagesFromPages: wie ExtractImagesFromPage, jedoch aus einem bestimmten Seitenbereich oder einer Liste einzelner Seiten.
  • ExtractRawImagesFromPage und ExtractRawImagesFromPages: funktionieren genauso wie die beiden vorherigen Methoden, geben die extrahierten Bilder jedoch als Byte-Arrays statt als IronSoftware.Drawing.AnyBitmap-Objekte zurück.

Learn more about ExtractTextFromPage Method

Bereit anzufangen?
Nuget Downloads 19,014,616 | Version: 2026.5 just released
Still Scrolling Icon

Scrollst du immer noch?

Sie brauchen schnell einen Beweis? PM > Install-Package IronPdf
Führen Sie eine Probe aus Sehen Sie zu, wie Ihr HTML-Code in eine PDF-Datei umgewandelt wird.