import com.ironsoftware.ironpdf.*;
import java.io.IOException;
import java.nio.file.Paths;
// Apply your license key
License.setLicenseKey("YOUR-LICENSE-KEY");
// Set a log path
Settings.setLogPath(Paths.get("C:/tmp/IronPdfEngine.log"));
// Render the HTML as a PDF. Stored in myPdf as type PdfDocument;
PdfDocument myPdf = PdfDocument.renderHtmlAsPdf("<h1> ~Hello World~ </h1> Made with IronPDF!");
// Save the PdfDocument to a file
myPdf.saveAs(Paths.get("html_saved.pdf"));
Wie extrahiere ich ein Bild aus einer PDF-Datei in Java?
Regan Pun
11. März 2023
Aktualisiert 1. September 2024
Teilen Sie:
Dieser Artikel wird untersuchen, wie man Bilder aus einem bestehenden PDF-Dokument extrahiert und sie in einem einzigen Ordner mithilfe der Programmiersprache Java speichert. Dazu wird die IronPDF for Java-Bibliothek verwendet, um Bilder zu extrahieren.
Wie extrahiere ich ein Bild aus einer PDF-Datei in Java?
Überprüfen Sie die extrahierten Bilder im angegebenen Verzeichnis
IronPDF for Java PDF-Bibliothek
IronPDF ist eine Java-Bibliothek, die Entwicklern dabei hilft, PDF-Dateien in ihren Java-Anwendungen zu generieren, zu modifizieren und Daten aus PDF-Dateien zu extrahieren. Mit IronPDF können Sie PDF-Dokumente aus einer Vielzahl von Quellen erstellen, wie HTML, Bilder und mehr. Zusätzlich haben Sie die Möglichkeit, bestehende PDFs zu zusammenzuführen, zu teilen und zu manipulieren. IronPDF umfasst auch Sicherheitsfunktionen, wie zum Beispiel Passwortschutz und digitale Signaturen.
Entwickelt und gewartet von Iron Software, ist IronPDF bekannt für seine Fähigkeit, Text aus PDFs, HTML und URLs zu extrahieren. Das macht es zu einem vielseitigen und leistungsstarken Werkzeug für eine Vielzahl von Anwendungen, egal ob Sie PDFs von Grund auf neu erstellen oder mit bestehenden arbeiten.
Voraussetzungen
Bevor Sie IronPDF zum Extrahieren von Daten aus einer PDF-Datei verwenden können, müssen einige Voraussetzungen erfüllt sein:
Java-Installation: Stellen Sie sicher, dass Java auf Ihrem System installiert ist und dass sein Pfad in den Umgebungsvariablen gesetzt wurde. Wenn Sie Java noch nicht installiert haben, folgen Sie den Anweisungen auf der folgenden Download-Seite der Java-Website.
Java-IDE: Installieren Sie entweder Eclipse oder IntelliJ als Ihre Java-IDE. Sie können Eclipse über diesen Link und IntelliJ von dieser Download-Seite herunterladen.
IronPDF-Bibliothek: Laden Sie die IronPDF-Bibliothek herunter und fügen Sie sie als Abhängigkeit zu Ihrem Projekt hinzu. Für Anweisungen zur Einrichtung besuchen Sie die IronPDF-Website.
Maven-Installation: Stellen Sie sicher, dass Maven installiert und in Ihre IDE integriert ist, bevor Sie mit dem PDF-Konvertierungsprozess beginnen. Folgen Sie dem Tutorial in diesem Leitfaden von JetBrains für Unterstützung bei der Installation und Integration von Maven.
IronPDF for Java Installation
Die Installation von IronPDF for Java ist unkompliziert, sofern alle Voraussetzungen erfüllt sind. Diese Anleitung verwendet JetBrains IntelliJ IDEA, um die Installation zu demonstrieren und einige Beispielcodes auszuführen.
Das ist zu tun:
Starten Sie IntelliJ IDEA: Öffnen Sie JetBrains IntelliJ IDEA auf Ihrem System.
Erstellen Sie ein Maven-Projekt: Erstellen Sie in IntelliJ IDEA ein neues Maven-Projekt. Dadurch wird eine geeignete Umgebung für die Installation von IronPDF for Java geschaffen.
Erstellen Sie ein neues Maven-Projekt
Es erscheint ein neues Fenster. Geben Sie den Namen des Projekts ein und klicken Sie auf Fertig stellen.
Geben Sie den Namen des Projekts ein
Nachdem Sie auf Fertig stellen geklickt haben, wird ein neues Projekt geöffnet, um eine pom.xml-Datei zu öffnen, um die Maven-Abhängigkeiten von IronPDF for Java hinzuzufügen.
Fügen Sie als Nächstes die folgenden Abhängigkeiten in die pom.xml-Datei ein oder Sie können die JAR-Datei aus dem folgenden Maven-Repository herunterladen.
Sobald Sie die Abhängigkeiten in die pom.xml-Datei einfügen, erscheint in der rechten oberen Ecke der Datei ein kleines Symbol.
Die pom.xml-Datei mit einem kleinen Symbol zum Installieren von Abhängigkeiten
Klicken Sie auf dieses Symbol, um die Maven-Abhängigkeiten von IronPDF for Java zu installieren. Dies dauert je nach Internetverbindung nur wenige Minuten.
Bilder extrahieren
Sie können Bilder aus einem PDF-Dokument mit IronPDF extrahieren, indem Sie eine einzelne Methode namens [extractAllImages](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllImages() verwenden. Diese Methode gibt alle in einer PDF-Datei verfügbaren Bilder zurück. Danach können Sie alle extrahierten Bilder mithilfe der ImageIO.write-Methode speichern, indem Sie den Pfad und das Format des Ausgabebildes angeben.
5.1. Bilder aus PDF-Dokumenten extrahieren
Im folgenden Beispiel werden die Bilder aus einem PDF-Dokument extrahiert und als PNG-Bilder im Dateisystem gespeichert.
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class main {
public static void main(String[] args) throws Exception {
PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class main {
public static void main(String[] args) throws Exception {
PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}
JAVA
Das obige Programm öffnet die Datei "Final Project Report Craft Arena.pdf" und verwendet die extractAllImages-Methode, um alle Bilder in der Datei in eine Liste von BufferedImage-Objekten zu extrahieren. Anschließend wird jedes neue Bild in separaten PNG-Dateien mit einem eindeutigen Namen gespeichert.
Bilderextraktion aus PDF-Ausgabe
Bilder von URL extrahieren
In diesem Abschnitt wird erläutert, wie Bilder direkt von URLs extrahiert werden können. Im folgenden Code wird die URL in eine PDF-Seite umgewandelt und dann die Navigation umgeschaltet, um Bilder aus dem PDF zu extrahieren.
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class main {
public static void main(String[] args) throws IOException {
PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}
import com.ironsoftware.ironpdf.PdfDocument;
import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;
public class main {
public static void main(String[] args) throws IOException {
PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");
List<BufferedImage> images = pdf.extractAllImages();
int i = 0;
for (BufferedImage image : images) {
ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
}
}
}
JAVA
Im obigen Code wird die URL der Amazon-Startseite als Eingabe angegeben, und es werden 74 Bilder zurückgegeben.
Bilderextraktion aus PDF-Ausgabe
Schlussfolgerung
Das Extrahieren von Bildern aus einem PDF-Dokument kann in Java mit der IronPDF-Bibliothek durchgeführt werden. Um IronPDF zu installieren, müssen Sie Java, eine Java-IDE (Eclipse oder IntelliJ), Maven und die IronPDF-Bibliothek installiert und in Ihr Projekt integriert haben. Der Prozess des Extrahierens von Bildern aus einem PDF-Dokument mit IronPDF ist einfach und erfordert nur einen einzigen Methodenaufruf für extractAllImages. Sie können die Bilder dann mit der Methode ImageIO.write in einem Dateipfad Ihrer Wahl speichern.
Dieser Artikel bietet eine schrittweise Anleitung, wie man Bilder aus einem PDF-Dokument mithilfe von Java und der IronPDF-Bibliothek extrahiert. Weitere Details, einschließlich Informationen darüber, wie man Text aus PDFs extrahiert, finden Sie im Codebeispiel für die Textextraktion.
Regan schloss sein Studium an der University of Reading mit einem BA in Elektrotechnik ab. Bevor er zu Iron Software kam, konzentrierte er sich in seinen früheren Jobs auf einzelne Aufgaben. Was ihm bei Iron Software am meisten Spaß macht, ist das Spektrum der Aufgaben, die er übernehmen kann, sei es im Vertrieb, im technischen Support, in der Produktentwicklung oder im Marketing. Es macht ihm Spaß, die Art und Weise zu verstehen, wie Entwickler die Bibliothek von Iron Software nutzen, und dieses Wissen zu nutzen, um die Dokumentation und die Produkte kontinuierlich zu verbessern.