VERWENDUNG VON IRONPDF FOR JAVA

Wie extrahiere ich ein Bild aus einer PDF-Datei in Java?

Regan Pun
Regan Pun
11. März 2023
Aktualisiert 1. September 2024
Teilen Sie:

Dieser Artikel wird untersuchen, wie man Bilder aus einem bestehenden PDF-Dokument extrahiert und sie in einem einzigen Ordner mithilfe der Programmiersprache Java speichert. Dazu wird die IronPDF for Java-Bibliothek verwendet, um Bilder zu extrahieren.

IronPDF for Java PDF-Bibliothek

IronPDF ist eine Java-Bibliothek, die Entwicklern dabei hilft, PDF-Dateien in ihren Java-Anwendungen zu generieren, zu modifizieren und Daten aus PDF-Dateien zu extrahieren. Mit IronPDF können Sie PDF-Dokumente aus einer Vielzahl von Quellen erstellen, wie HTML, Bilder und mehr. Zusätzlich haben Sie die Möglichkeit, bestehende PDFs zu zusammenzuführen, zu teilen und zu manipulieren. IronPDF umfasst auch Sicherheitsfunktionen, wie zum Beispiel Passwortschutz und digitale Signaturen.

Entwickelt und gewartet von Iron Software, ist IronPDF bekannt für seine Fähigkeit, Text aus PDFs, HTML und URLs zu extrahieren. Das macht es zu einem vielseitigen und leistungsstarken Werkzeug für eine Vielzahl von Anwendungen, egal ob Sie PDFs von Grund auf neu erstellen oder mit bestehenden arbeiten.

Voraussetzungen

Bevor Sie IronPDF zum Extrahieren von Daten aus einer PDF-Datei verwenden können, müssen einige Voraussetzungen erfüllt sein:

  1. Java-Installation: Stellen Sie sicher, dass Java auf Ihrem System installiert ist und dass sein Pfad in den Umgebungsvariablen gesetzt wurde. Wenn Sie Java noch nicht installiert haben, folgen Sie den Anweisungen auf der folgenden Download-Seite der Java-Website.

  2. Java-IDE: Installieren Sie entweder Eclipse oder IntelliJ als Ihre Java-IDE. Sie können Eclipse über diesen Link und IntelliJ von dieser Download-Seite herunterladen.

  3. IronPDF-Bibliothek: Laden Sie die IronPDF-Bibliothek herunter und fügen Sie sie als Abhängigkeit zu Ihrem Projekt hinzu. Für Anweisungen zur Einrichtung besuchen Sie die IronPDF-Website.

  4. Maven-Installation: Stellen Sie sicher, dass Maven installiert und in Ihre IDE integriert ist, bevor Sie mit dem PDF-Konvertierungsprozess beginnen. Folgen Sie dem Tutorial in diesem Leitfaden von JetBrains für Unterstützung bei der Installation und Integration von Maven.

IronPDF for Java Installation

Die Installation von IronPDF for Java ist unkompliziert, sofern alle Voraussetzungen erfüllt sind. Diese Anleitung verwendet JetBrains IntelliJ IDEA, um die Installation zu demonstrieren und einige Beispielcodes auszuführen.

Das ist zu tun:

Starten Sie IntelliJ IDEA: Öffnen Sie JetBrains IntelliJ IDEA auf Ihrem System.

Erstellen Sie ein Maven-Projekt: Erstellen Sie in IntelliJ IDEA ein neues Maven-Projekt. Dadurch wird eine geeignete Umgebung für die Installation von IronPDF for Java geschaffen.

Wie man ein Bild aus einer PDF in Java extrahiert, Abbildung 1: Erstellen Sie ein neues Maven-Projekt

Erstellen Sie ein neues Maven-Projekt

Es erscheint ein neues Fenster. Geben Sie den Namen des Projekts ein und klicken Sie auf Fertig stellen.

So extrahieren Sie ein Bild aus PDF in Java, Abbildung 2: Geben Sie den Namen des Projekts ein

Geben Sie den Namen des Projekts ein

Nachdem Sie auf Fertig stellen geklickt haben, wird ein neues Projekt geöffnet, um eine pom.xml-Datei zu öffnen, um die Maven-Abhängigkeiten von IronPDF for Java hinzuzufügen.

Fügen Sie als Nächstes die folgenden Abhängigkeiten in die pom.xml-Datei ein oder Sie können die JAR-Datei aus dem folgenden Maven-Repository herunterladen.

<dependency>
   <groupId>com.ironsoftware</groupId>
   <artifactId>com.ironsoftware</artifactId>
   <version>2025.3.6</version>
</dependency>

Sobald Sie die Abhängigkeiten in die pom.xml-Datei einfügen, erscheint in der rechten oberen Ecke der Datei ein kleines Symbol.

So extrahieren Sie ein Bild aus PDF in Java, Abbildung 3: Die pom.xml-Datei mit einem kleinen Symbol zum Installieren von Abhängigkeiten

Die pom.xml-Datei mit einem kleinen Symbol zum Installieren von Abhängigkeiten

Klicken Sie auf dieses Symbol, um die Maven-Abhängigkeiten von IronPDF for Java zu installieren. Dies dauert je nach Internetverbindung nur wenige Minuten.

Bilder extrahieren

Sie können Bilder aus einem PDF-Dokument mit IronPDF extrahieren, indem Sie eine einzelne Methode namens [extractAllImages](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllImages() verwenden. Diese Methode gibt alle in einer PDF-Datei verfügbaren Bilder zurück. Danach können Sie alle extrahierten Bilder mithilfe der ImageIO.write-Methode speichern, indem Sie den Pfad und das Format des Ausgabebildes angeben.

5.1. Bilder aus PDF-Dokumenten extrahieren

Im folgenden Beispiel werden die Bilder aus einem PDF-Dokument extrahiert und als PNG-Bilder im Dateisystem gespeichert.

import com.ironsoftware.ironpdf.PdfDocument;

import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class main {
    public static void main(String[] args) throws Exception {
        PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));

        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
JAVA

Das obige Programm öffnet die Datei "Final Project Report Craft Arena.pdf" und verwendet die extractAllImages-Methode, um alle Bilder in der Datei in eine Liste von BufferedImage-Objekten zu extrahieren. Anschließend wird jedes neue Bild in separaten PNG-Dateien mit einem eindeutigen Namen gespeichert.

Wie man ein Bild aus einem PDF in Java extrahiert, Abbildung 4: Bilderextraktion aus PDF-Ausgabe

Bilderextraktion aus PDF-Ausgabe

Bilder von URL extrahieren

In diesem Abschnitt wird erläutert, wie Bilder direkt von URLs extrahiert werden können. Im folgenden Code wird die URL in eine PDF-Seite umgewandelt und dann die Navigation umgeschaltet, um Bilder aus dem PDF zu extrahieren.

import com.ironsoftware.ironpdf.PdfDocument;

import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class main {
    public static void main(String[] args) throws IOException {
        PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");

        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
JAVA

Im obigen Code wird die URL der Amazon-Startseite als Eingabe angegeben, und es werden 74 Bilder zurückgegeben.

Wie man ein Bild aus einem PDF extrahiert in Java, Abbildung 5: Bildextraktion aus PDF-Ausgabe

Bilderextraktion aus PDF-Ausgabe

Schlussfolgerung

Das Extrahieren von Bildern aus einem PDF-Dokument kann in Java mit der IronPDF-Bibliothek durchgeführt werden. Um IronPDF zu installieren, müssen Sie Java, eine Java-IDE (Eclipse oder IntelliJ), Maven und die IronPDF-Bibliothek installiert und in Ihr Projekt integriert haben. Der Prozess des Extrahierens von Bildern aus einem PDF-Dokument mit IronPDF ist einfach und erfordert nur einen einzigen Methodenaufruf für extractAllImages. Sie können die Bilder dann mit der Methode ImageIO.write in einem Dateipfad Ihrer Wahl speichern.

Dieser Artikel bietet eine schrittweise Anleitung, wie man Bilder aus einem PDF-Dokument mithilfe von Java und der IronPDF-Bibliothek extrahiert. Weitere Details, einschließlich Informationen darüber, wie man Text aus PDFs extrahiert, finden Sie im Codebeispiel für die Textextraktion.

IronPDF ist eine Bibliothek mit einer kommerziellen Lizenz, die bei $749 beginnt. Sie können es jedoch in der Produktion mit einer kostenlosen Testversion bewerten.

Regan Pun
Software-Ingenieur
Regan schloss sein Studium an der University of Reading mit einem BA in Elektrotechnik ab. Bevor er zu Iron Software kam, konzentrierte er sich in seinen früheren Jobs auf einzelne Aufgaben. Was ihm bei Iron Software am meisten Spaß macht, ist das Spektrum der Aufgaben, die er übernehmen kann, sei es im Vertrieb, im technischen Support, in der Produktentwicklung oder im Marketing. Es macht ihm Spaß, die Art und Weise zu verstehen, wie Entwickler die Bibliothek von Iron Software nutzen, und dieses Wissen zu nutzen, um die Dokumentation und die Produkte kontinuierlich zu verbessern.
< PREVIOUS
PDF-Erzeugung in Java
NÄCHSTES >
Wie extrahiert man Daten aus PDF in Java?

Installation mit Maven

Version:2025.3.6

<dependency>
  <groupId>com.ironsoftware</groupId>
  <artifactId>ironpdf</artifactId>
  <version>2025.3.6</version>
</dependency>

Sind Sie bereit, loszulegen? Version: 2025.3 gerade veröffentlicht

Lizenzen anzeigen >