Test in einer Live-Umgebung
Test in der Produktion ohne Wasserzeichen.
Funktioniert überall, wo Sie es brauchen.
Das Lesen eines PDF-Dokuments in Java kann ein integraler Bestandteil eines jeden Projekts sein, von Geschäftsanwendungen bis hin zu Datenanalysen. Mit der IronPDF-Bibliothek ist es einfacher als je zuvor geworden, PDF-Verarbeitungsfunktionen in Ihre Java-Projekte zu integrieren.
fromFile
methodeextractAllText
Methode zum Lesen von Text aus der geöffneten PDF-DateiIrotPDF Java PDF Library Übersichtist die perfekte Lösung für Softwareentwickler, die hochwertigeErstellen Sie schnell einsatzfähige PDFs aus HTML.. Die Bibliothek bietet auch leistungsstarke Dokumentmanipulationstools, die eine dynamische Kontrolle über seitenlayout und Formatierung in IronPDF, Inhalt und Formatierung.
Sehen wir uns an, wie man eine PDF-Datei, die an einem Pfad gespeichert ist, in einem Java-Programm mit der IronPDF-Bibliothek liest.
Der erste Schritt ist die Installation von IronPDF mit Maven, weitere Details finden Sie in derIronPDF Installationshandbuch.
Hier sind die Schritte zur Installation von IronPDF in einem Maven-Projekt:
Öffnen Sie Ihr Maven-Projekt in Ihrer bevorzugten IDE.
pom.xml
-File die IronPDF-Bibliotheksabhängigkeit im Abschnitt dependencies
hinzu. :ProductInstall
Speichern Sie die Datei pom.xml
und lassen Sie Maven die IronPDF-Bibliothek herunterladen und installieren.
Sobald die Installation abgeschlossen ist, sollten Sie in der Lage sein, die folgenden Klassen von IronPDF und Apache Tika Parser in Ihr Projekt zu importieren und zu verwenden.
Hier ist der Code, den Sie verwenden können, um die neue Datei mit oder ohne tabellarische Begrenzungen unter Verwendung der IronPDF-Bibliothek zu lesen.
import com.ironsoftware.ironpdf.*;
import java.io.IOException;
import java.nio.file.Paths;
public class Test {
public static void main(String[] args) throws IOException {
PdfDocument pdf = PdfDocument.fromFile(Paths.get("C:\\sample.pdf"));
String text = pdf.extractAllText();
System.out.println(text);
}
}
In diesem Programm, derdie Klasse "PDFDocument" in IronPDF wird verwendet, um den Inhalt einer PDF-Datei zu lesen. In der ersten Zeile des Programms werden die erforderlichen Klassen aus der IronPDF-Bibliothek importiert. Die zweite Zeile importiert die Klasse IOException
aus der Java-Standardbibliothek.
Das Programm definiert eine öffentliche Klasse namens Test
. Innerhalb der Klasse gibt es eine "öffentliche statische" Methode namens "main", die ein Array von Strings als Argument annimmt.
Die main
-Methode verwendet diemethode "fromFile" von PdfDocument in IronPDFMethode der Klasse PdfDocument
, um eine PDF-Datei unter "C:\sample.pdf" zu laden. Diese Methode gibt ein PdfDocument
-Objekt zurück, das die PDF-Datei darstellt.
Sobald die PDF-Datei geladen ist, ruft das Programm den[methode "ExtractAllText" von PdfDocument in IronPDF](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllText())Methode der PdfDocument
Klasse, um den gesamten Text aus der PDF-Datei zu extrahieren. Diese Methode gibt einen String
zurück, der den gesamten Text in der PDF-Datei enthält.
Der extrahierte Text wird dann in einer String
-Variablen namens "text" gespeichert. Diese Variable kann verwendet werden, um den Inhalt der PDF-Datei zu verarbeiten oder anzuzeigen.
Schließlich gibt das Programm den extrahierten Text mit der Methode System.out.println
auf der Konsole aus.
Programmausgabe
IronPDF ist eine großartige Lösung für das Lesen von PDF-Dateien innerhalb desselben Pfades oder mehrerer verschiedener Pfade in Java, da es eine hohe Leistung und viele Funktionen bietet, die die Entwicklung von PDFs erleichtern. Die Syntax ist einfach und benutzerfreundlich. Die API ermöglicht es Entwicklern, den Code, den sie für ihre Projekte benötigen, schnell zu erstellen.
Entdecken Sie die IronPDF-Lizenzierungsoptionen die Pläne beginnen bei nur $749, so dass die Extraktion von Inhalten auch für Menschen mit kleinem Budget möglich ist. Insgesamt ist IronPDF eine hervorragende Option für jeden Java-Entwickler, der mit PDFs in seiner Java-Anwendungsprogrammierung arbeiten möchte.
9 .NET API-Produkte für Ihre Bürodokumente