VERWENDUNG VON IRONPDF FOR JAVA

Wie man PDF-Dateien in Java liest

Kannapat Udonpant

26. Februar 2023

Aktualisiert 1. September 2024

Teilen Sie:

Dieser Artikel wird untersuchen, wie man einen PDF-Reader erstellt, um eine PDF-Datei in Ihrer Softwareanwendung programmgesteuert zu öffnen. IronPDF for Java ist eine solche Systembibliothek, die das Öffnen und Lesen von PDF-Dateien anhand des Dateinamens in Java-Programmen ermöglicht.

Wie man PDF-Dateien in Java liest

Laden Sie die IronPDF Java-Bibliothek herunter
Verwenden Sie die fromFile-Methode, um vorhandene PDF-Dokumente zu laden
Rufen Sie die Methode extractAllText auf, um eingebetteten Text in PDFs zu extrahieren
Extrahieren Sie Text von einer bestimmten Seite mit der extractTextFromPage-Methode
Text aus PDFs abrufen, die aus URLs gerendert wurden

IronPDF

Die IronPDF - Java-Bibliothek basiert auf dem bereits erfolgreichen .NET Framework. Dies macht IronPDF im Vergleich zu anderen Klassenbibliotheken wie Apache PDFBox zu einem vielseitigen Werkzeug für die Arbeit mit PDF-Dokumenten. Es bietet die Möglichkeit, Inhalte zu extrahieren und zu parsen, Text zu laden und Bilder zu laden. Es bietet auch Optionen zur Anpassung der PDF-Seiten wie Seitenlayout, Ränder, Kopf- und Fußzeile, Ausrichtung der Seite und vieles mehr.

Zusätzlich dazu unterstützt IronPDF auch die Konvertierung aus anderen Dateiformaten, das Schützen von PDFs mit einem Passwort, das digitale Signieren sowie das Zusammenführen und Aufteilen von PDF-Dokumenten.

Wie man PDF-Dateien in Java liest

Voraussetzungen

Um IronPDF zu verwenden, um einen Java-PDF-Reader zu erstellen, müssen folgende Komponenten auf dem Computer installiert sein:

JDK - Java Development Kit wird benötigt, um Java-Programme zu erstellen und auszuführen. Falls es nicht installiert ist, laden Sie es von der Oracle-Website herunter.
IDE - Integrierte Entwicklungsumgebung ist Software, die beim Schreiben, Bearbeiten und Debuggen eines Programms hilft. Laden Sie eine beliebige IDE für Java herunter, z.B. Eclipse, NetBeans, IntelliJ.
Maven - Maven ist ein Automatisierungstool, das beim Herunterladen von Bibliotheken aus dem Central Repository hilft. Laden Sie es von der Apache Maven Website herunter.
IronPDF - Schließlich wird IronPDF benötigt, um die PDF-Datei in Java zu lesen. Dies muss als Abhängigkeit in Ihrem Java Maven Projekt hinzugefügt werden. Fügen Sie das IronPDF-Artefakt zusammen mit der slf4j-Abhängigkeit in die pom.xml-Datei ein, wie im folgenden Beispiel gezeigt:

<dependency>
   <groupId>com.ironsoftware</groupId>
   <artifactId>com.ironsoftware</artifactId>
   <version>2025.3.6</version>
</dependency>

Hinzufügen notwendiger Importe

Fügen Sie zunächst den folgenden Code in die Java-Quelldatei ein, um alle erforderlichen Methoden von IronPDF zu referenzieren. Import org ist in diesem Beispiel optional.

import com.ironsoftware.ironpdf.*;

import com.ironsoftware.ironpdf.*;

JAVA

Als nächstes konfigurieren Sie IronPDF mit einem gültigen Lizenzschlüssel, um seine Methode zu verwenden. Rufen Sie die setLicenseKey-Methode in der Hauptmethode auf.

License.setLicenseKey("Your license key");

License.setLicenseKey("Your license key");

JAVA

Hinweis: Sie können einen kostenlosen Testlizenzschlüssel erhalten, um PDFs zu erstellen, zu lesen und zu drucken.

Bestehende PDF-Datei in Java lesen

Um PDF-Dateien zu lesen, müssen PDF-Dateien vorhanden sein oder es kann eine erstellt werden. Dieser Artikel verwendet eine bereits erstellte PDF-Datei. Der Code ist einfach und ein zweistufiger Prozess, um Text aus dem Dokument zu extrahieren.

PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractAllText();
System.out.println(text);

PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractAllText();
System.out.println(text);

JAVA

Im obigen Code öffnet fromFile ein PDF-Dokument. Die Paths.get-Methode ruft das Verzeichnis der Datei ab und ist bereit, Inhalte aus der Datei zu extrahieren. Dann liest [extractAllText](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllText()) den gesamten Text im Dokument.

Die Ausgabe ist unten zu sehen:

Wie man eine PDF-Datei in Java liest, Abbildung 1: Ausgabe des gelesenen PDF-Textes

PDF-Textausgabe lesen

Text von einer bestimmten Seite lesen

IronPDF kann auch den Inhalt einer bestimmten Seite in einer PDF-Datei lesen. Die extractTextFromPage-Methode verwendet ein PageSelection-Objekt, um einen Bereich von Seite(n) anzugeben, aus denen Text gelesen wird.

Im folgenden Beispiel wird der Text aus der zweiten Seite des PDF-Dokuments extrahiert. PageSelection.singlePage nimmt den Index der Seite, die extrahiert werden soll.

PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractTextFromPage(PageSelection.singlePage(1));
System.out.println(text);

PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractTextFromPage(PageSelection.singlePage(1));
System.out.println(text);

JAVA

Wie man eine PDF-Datei in Java liest, Abbildung 2: Lesen von PDF-Textausgaben

PDF-Textausgabe lesen

Andere verfügbare Methoden in der PageSelection-Klasse, die verwendet werden können, um Text von verschiedenen Seiten zu extrahieren, sind: [firstPage](/java/object-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#lastPage(), [lastPage](/java/object-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#firstPage(), [pageRange](/java/object-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#pageRange(int,int), und [allPages](/java/object-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#allPages().

Text aus einer neu erzeugten PDF-Datei lesen

Der Suchtext kann auch in einer neu erzeugten PDF-Datei entweder aus einer HTML-Datei oder einer URL durchgeführt werden. Der folgende Beispielcode generiert PDFs aus der URL und extrahiert den gesamten Text von der Website.

PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://unsplash.com/");
String text = pdf.extractAllText();
System.out.println("Text extracted from the website: " + text);

PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://unsplash.com/");
String text = pdf.extractAllText();
System.out.println("Text extracted from the website: " + text);

JAVA

Wie man eine PDF-Datei in Java liest, Abbildung 2: Lesen aus einer neuen Datei

Von einer neuen Datei lesen

IronPDF kann auch verwendet werden, um Bilder aus PDF-Dateien zu extrahieren.

Der vollständige Code lautet wie folgt:

import com.ironsoftware.ironpdf.License;
import com.ironsoftware.ironpdf.PdfDocument;
import com.ironsoftware.ironpdf.edit.PageSelection;

import java.io.IOException;
import java.nio.file.Paths;

public class Main {
    public static void main(String[] args) throws IOException {

        License.setLicenseKey("YOUR LICENSE KEY HERE");

        PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
        String text = pdf.extractTextFromPage(PageSelection.singlePage(1));
        System.out.println(text);

        pdf = PdfDocument.renderUrlAsPdf("https://unsplash.com/");
        text = pdf.extractAllText();
        System.out.println("Text extracted from the website: " + text);

    }
}

import com.ironsoftware.ironpdf.License;
import com.ironsoftware.ironpdf.PdfDocument;
import com.ironsoftware.ironpdf.edit.PageSelection;

import java.io.IOException;
import java.nio.file.Paths;

public class Main {
    public static void main(String[] args) throws IOException {

        License.setLicenseKey("YOUR LICENSE KEY HERE");

        PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
        String text = pdf.extractTextFromPage(PageSelection.singlePage(1));
        System.out.println(text);

        pdf = PdfDocument.renderUrlAsPdf("https://unsplash.com/");
        text = pdf.extractAllText();
        System.out.println("Text extracted from the website: " + text);

    }
}

JAVA

Zusammenfassung

Dieser Artikel erklärt, wie man PDFs in Java mit IronPDF öffnet und liest.

IronPDF hilft bei der einfachen Erstellung von PDFs aus HTML oder URL und bei der Konvertierung aus verschiedenen Dateiformaten. Auch PDF-Aufgaben lassen sich damit schnell und einfach erledigen.

Probieren Sie IronPDF 30 Tage kostenlos mit einer Testversion aus und finden Sie heraus, wie gut es für Sie in der Produktion funktioniert. Erkunden Sie kommerzielle Lizenzierungsoptionen für IronPDF, die bereits ab $749 beginnen.

Kannapat Udonpant

Jetzt mit dem Ingenieurteam chatten

Software-Ingenieur

Bevor er Software-Ingenieur wurde, promovierte Kannapat an der Universität Hokkaido in Japan im Bereich Umweltressourcen. Während seines Studiums wurde Kannapat auch Mitglied des Vehicle Robotics Laboratory, das Teil der Abteilung für Bioproduktionstechnik ist. Im Jahr 2022 wechselte er mit seinen C#-Kenntnissen zum Engineering-Team von Iron Software, wo er sich auf IronPDF konzentriert. Kannapat schätzt an seiner Arbeit, dass er direkt von dem Entwickler lernt, der den Großteil des in IronPDF verwendeten Codes schreibt. Neben dem kollegialen Lernen genießt Kannapat auch den sozialen Aspekt der Arbeit bei Iron Software. Wenn er nicht gerade Code oder Dokumentationen schreibt, kann man Kannapat normalerweise beim Spielen auf seiner PS5 oder beim Wiedersehen mit The Last of Us antreffen.

< PREVIOUS
Wie man PDF-Dateien in Java aufteilt

NÄCHSTES >
HTML2PDF Java (Code-Beispiel-Tutorial)

Installation mit Maven

Version:2025.3.6

<dependency>
  <groupId>com.ironsoftware</groupId>
  <artifactId>ironpdf</artifactId>
  <version>2025.3.6</version>
</dependency>

Ein Problem melden

Nehmen Sie an unserer Bug Bounty für Iron Swag teil

Sind Sie bereit, loszulegen? Version: 2025.3 gerade veröffentlicht

Lizenzen anzeigen >

Wie man PDF-Dateien in Java liest

Wie man PDF-Dateien in Java liest

IronPDF

Wie man PDF-Dateien in Java liest

Voraussetzungen

Hinzufügen notwendiger Importe

Bestehende PDF-Datei in Java lesen

Text von einer bestimmten Seite lesen

Text aus einer neu erzeugten PDF-Datei lesen

Zusammenfassung

Auf dieser Seite

Ein Problem melden

Sind Sie bereit, loszulegen? Version: 2025.3 gerade veröffentlicht

Nächster Schritt: Starten Sie die kostenlose 30-Tage-Testversion

Nächster Schritt: Starten Sie die kostenlose 30-Tage-Testversion

Über 2 Millionen Ingenieure weltweit vertrauen darauf

IronPDF ist ein Teil von IRONSUITE