PDF-Dateien in C# lesen

VB C#

string(20) "Zum Kopieren klicken"

using IronPdf;
using IronSoftware.Drawing;
using System.Collections.Generic;

// Extracting Image and Text content from Pdf Documents

// open a 128 bit encrypted PDF
var pdf = PdfDocument.FromFile("encrypted.pdf", "password");

// Get all text to put in a search index
string text = pdf.ExtractAllText();

// Get all Images
var allImages = pdf.ExtractAllImages();

// Or even find the precise text and images for each page in the document
for (var index = 0 ; index < pdf.PageCount ; index++)
{
    int pageNumber = index + 1;
    text = pdf.ExtractTextFromPage(index);
    List<AnyBitmap> images = pdf.ExtractBitmapsFromPage(index);
    //...
}

Install-Package IronPdf

PDF-Dateien in C# lesen

Die Methode PdfDocument.ExtractAllText aus der IronPDF C# PDF-Bibliothek eignet sich perfekt für einfache PDF-Textleseaufgaben. Diese Methode behandelt Leerzeichen und Kodierungsunterschiede innerhalb von PDF-Quelldokumenten ohne Probleme.

PdfDocument.ExtractTextFromPage liest den Text von bestimmten Seiten einer PDF-Datei. Im folgenden Beispiel sehen wir es, wie es iterativ verwendet wird, um Textinhalte aus einem bestimmten Seitenbereich abzurufen.

IronPDF kann auch Rohbilder aus PDFs extrahieren. Verwenden Sie hierfür eine der folgenden Methoden aus der Klasse PdfDocument:

ExtractAllImages : Gibt alle in ein PDF eingebetteten Bilder als IronSoftware.Drawing.AnyBitmap Objekte zurück.
ExtractAllRawImages : Ruft alle eingebetteten Bilder als Liste von Rohbytes ab (byte[]).
ExtractImagesFromPage : extrahiert die auf einer indizierten Seite enthaltenen Bilder.
ExtractImagesFromPages : dasselbe wie ExtractImagesFromPage, jedoch ab einem bestimmten Seitenbereich oder einer Liste einzelner Seiten.
ExtractRawImagesFromPage und ExtractRawImagesFromPages : funktionieren genauso wie die beiden vorherigen Methoden, geben aber extrahierte Bilder als Byte-Arrays anstatt als IronSoftware.Drawing.AnyBitmap Objekte zurück.

Wie man PDF-Dateien in C# liest

Runterladen der IronPDF-Bibliothek für C#
Bilder oder Text aus PDF extrahieren
Lesen und Finden von Wörtern in bestimmten Dokumenten
PDF-Ausgabe des Originaldokuments anzeigen

Learn more about ExtractTextFromPage Method

Auf GitHub ansehen

Code

https://github.com/iron-software/IronPDF.Examples/tree/main/examples/reading-pdf-text

ZIP herunterladen

Verwandtes Tutorial
Verwandte Anleitung
Klassendokumentation
Sprachpakete herunterladen
IronPDF DLL herunterladen

Bereit anzufangen?

Nuget Downloads 17,803,474 | Version: 2026.3 gerade veröffentlicht

Lizenzen anzeigen

Scrollst du immer noch?

Sie brauchen schnell einen Beweis? PM > Install-Package IronPdf
Führen Sie eine Probe aus Sehen Sie zu, wie Ihr HTML-Code in eine PDF-Datei umgewandelt wird.