C# PDF-Parser

This article was translated from English: Does it need improvement?
Translated
View the article in English

Mit den richtigen Werkzeugen ist es einfach, mit PDFs in C# zu arbeiten und alle Funktionen zu nutzen, die Sie für eine .NET-Anwendung benötigen, einschließlich der Verwendung von C#-Funktionen zum Parsen von PDF-Dateien. In diesem Tutorial wird IronPDF, eine C#-Bibliothek, verwendet, um dies in wenigen, einfachen Schritten zu erreichen.

C# NuGet-Bibliothek für PDF

Installieren mit NuGet

Install-Package IronPdf
oder
Java PDF JAR

Herunterladen DLL

DLL herunterladen

Manuelle Installation in Ihr Projekt

C# NuGet-Bibliothek für PDF

Installieren mit NuGet

Install-Package IronPdf
oder
Java PDF JAR

Herunterladen DLL

DLL herunterladen

Manuelle Installation in Ihr Projekt

Fangen Sie noch heute an, IronPDF in Ihrem Projekt mit einer kostenlosen Testversion zu verwenden.

Erster Schritt:
green arrow pointer

Schau dir an IronPDF an Nuget Für schnelle Installation und Bereitstellung. Mit über 8 Millionen Downloads verwandelt es PDF mit C#.

C# NuGet-Bibliothek für PDF nuget.org/packages/IronPdf/
Install-Package IronPdf

Erwägen Sie die Installation der IronPDF DLL direkt. Laden Sie es herunter und installieren Sie es manuell für Ihr Projekt oder die GAC-Form: IronPdf.zip

Manuelle Installation in Ihr Projekt

DLL herunterladen

C# Analysieren von PDF-Dateien

Das Parsen von PDF-Dateien ist relativ einfach. Im folgenden Code verwenden wir die Methode ExtractAllText, um jede einzelne Textzeile aus dem gesamten PDF-Dokument zu extrahieren. Später können Sie die extrahierten PDF-Inhalte nebeneinander als Ausgabe sehen.

:path=/static-assets/pdf/content-code-examples/how-to/csharp-parse-pdf-parse-pdf.cs
using IronPdf;

// Select the desired PDF File
PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// Extract all text from an pdf
string allText = pdf.ExtractAllText();

// Extract all text from page 1
string page1Text = pdf.ExtractTextFromPage(0);
Imports IronPdf

' Select the desired PDF File
Private pdf As PdfDocument = PdfDocument.FromFile("sample.pdf")

' Extract all text from an pdf
Private allText As String = pdf.ExtractAllText()

' Extract all text from page 1
Private page1Text As String = pdf.ExtractTextFromPage(0)
VB   C#

Geparste PDF-Inhalte anzeigen

Wir haben ein C#-Formular verwendet, um Ihnen den geparsten PDF-Inhalt aus der obigen Codeausführung zu zeigen. Diese Ausgabe gibt den exakten Text einer PDF-Datei wieder, so dass Sie sie für Ihren persönlichen Bedarf oder für Kundendokumente verwenden können.

~ PDF ~

~ C# Form ~


Bibliothek Schnellzugriff

Dokumentation

In der API-Referenz finden Sie die Dokumentation zu IronPDF und allen seinen Funktionen.

Dokumentation