PDF-Dateien in C# lesen

Die PdfDocument.ExtractAllText-Methode aus der IronPDF C# PDF-Bibliothek ist perfekt für einfache PDF-Textleseaufgaben geeignet. Diese Methode behandelt Leerzeichen und Kodierungsunterschiede innerhalb von PDF-Quelldokumenten ohne Probleme.

PdfDocument.ExtractTextFromPage liest den Text von bestimmten Seiten eines PDFs. Im folgenden Beispiel sehen wir es, wie es iterativ verwendet wird, um Textinhalte aus einem bestimmten Seitenbereich abzurufen.

IronPDF kann auch Rohbilder aus PDFs extrahieren. Dafür verwenden Sie eine der Methoden der PdfDocument-Klasse unten:

  • ExtractAllImages: gibt alle eingebetteten Bilder in einem PDF als IronSoftware.Drawing.AnyBitmap-Objekte zurück.
  • ExtractAllRawImages: ruft alle eingebetteten Bilder als Liste von Rohbytes (byte[]) ab.
  • ExtractImagesFromPage: extrahiert die Bilder, die auf einer indizierten Seite enthalten sind.
  • ExtractImagesFromPages: ähnlich wie ExtractImagesFromPage, aber aus einem bestimmten Seitenbereich oder einer Liste einzelner Seiten.
  • ExtractRawImagesFromPage und ExtractRawImagesFromPages: funktionieren genauso wie die beiden vorherigen Methoden, geben jedoch die extrahierten Bilder als Byte-Arrays zurück anstatt als IronSoftware.Drawing.AnyBitmap-Objekte.
class="hsg-featured-snippet">

Wie man PDF-Dateien in C# liest

  1. IronPDF-Bibliothek für C# herunterladen
  2. Bilder oder Text aus PDF extrahieren
  3. Wörter in bestimmten Dokumenten lesen und finden
  4. PDF-Ausgabe aus Ihrem Originaldokument anzeigen

Erfahren Sie mehr über die ExtractTextFromPage-Methode

Bereit anzufangen?
Nuget Downloads 16,154,058 | Version: 2025.11 gerade veröffentlicht