USO DE IRONPDF FOR JAVA

Cómo extraer imágenes de un PDF en Java

Kannaopat Udonpant
Kannapat Udonpant
11 de marzo, 2023
Actualizado 1 de septiembre, 2024
Compartir:

Este artículo explorará cómo extraer imágenes de un documento PDF existente y guardarlas en una sola carpeta utilizando el lenguaje de programación Java. Para este propósito, se utiliza la biblioteca IronPDF for Java para extraer imágenes.

Biblioteca PDF Java IronPDF

IronPDF es una biblioteca de Java diseñada para ayudar a los desarrolladores a generar, modificar y extraer datos de archivos PDF dentro de sus aplicaciones Java. Con IronPDF, puedes crear documentos PDF a partir de una variedad de fuentes, como HTML, imágenes y más. Además, tienes la capacidad de combinar, dividir y manipular PDFs existentes. IronPDF también incluye funciones de seguridad, como protección con contraseña y firmas digitales.

Desarrollado y mantenido por Iron Software, IronPDF es conocido por su capacidad para extraer texto de PDFs, HTML y URLs. Esto la convierte en una herramienta versátil y potente para una gran variedad de aplicaciones, tanto si crea PDF desde cero como si trabaja con otros ya existentes.

Requisitos previos

Antes de utilizar IronPDF para extraer datos de un archivo PDF, deben cumplirse algunos requisitos previos:

  1. Instalación de Java: Asegúrese de que Java esté instalado en su sistema y que su ruta se haya configurado en las variables de entorno. Si aún no has instalado Java, sigue las instrucciones en la siguiente página de descarga del sitio web de Java.

  2. Java IDE: Tener Eclipse o IntelliJ instalado como tu IDE de Java. Puedes descargar Eclipse desde este enlace e IntelliJ desde esta página de descarga.

  3. Biblioteca IronPDF: Descarga y agrega la biblioteca IronPDF a tu proyecto como una dependencia. Para obtener instrucciones de configuración, visite el sitio web de IronPDF.

  4. Instalación de Maven: Asegúrate de que Maven esté instalado e integrado con tu IDE antes de comenzar el proceso de conversión de PDF. Sigue el tutorial en la siguiente guía de JetBrains para obtener ayuda con la instalación e integración de Maven.

Instalación de IronPDF for Java

La instalación de IronPDF for Java es un proceso sencillo, siempre que se cumplan todos los requisitos. Esta guía utilizará JetBrains IntelliJ IDEA para demostrar la instalación y ejecutar algún código de muestra.

Esto es lo que hay que hacer:

Inicie IntelliJ IDEA: Abra JetBrains IntelliJ IDEA en su sistema.

Crear un proyecto Maven: En IntelliJ IDEA, crea un nuevo proyecto Maven. Esto proporcionará un entorno adecuado para la instalación de IronPDF for Java.

Cómo Extraer Imagen de PDF en Java, Figura 1: Crear un nuevo proyecto Maven

Crear un nuevo proyecto Maven

Aparecerá una nueva ventana. Introduzca el nombre del proyecto y haga clic en Finalizar.

Cómo extraer una imagen de PDF en Java, Figura 2: Introduzca el nombre del proyecto

Ingrese el nombre del proyecto

Después de hacer clic en Finalizar, se abrirá un nuevo proyecto con un archivo pom.xml para agregar las dependencias de Maven de IronPDF for Java.

A continuación, añade las siguientes dependencias en el archivo pom.xml o puedes descargar el archivo JAR desde el siguiente repositorio de Maven.

<dependency>
   <groupId>com.ironsoftware</groupId>
   <artifactId>com.ironsoftware</artifactId>
   <version>2025.3.6</version>
</dependency>

Una vez que coloques las dependencias en el archivo pom.xml, aparecerá un pequeño ícono en la esquina superior derecha del archivo.

Cómo extraer una imagen de PDF en Java, Figura 3: El archivo pom.xml con un pequeño icono para instalar dependencias

El archivo pom.xml con un pequeño icono para instalar dependencias

Haga clic en este icono para instalar las dependencias Maven de IronPDF for Java. Esto sólo le llevará unos minutos, dependiendo de su conexión a Internet.

Extraer imágenes

Puede extraer imágenes de un documento PDF utilizando IronPDF con un solo método llamado [extractAllImages](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllImages(). Este método devuelve todas las imágenes disponibles en un archivo PDF. Después de eso, puedes guardar todas las imágenes extraídas en la ruta de archivo de tu elección utilizando el método ImageIO.write, proporcionando la ruta y el formato de la imagen de salida.

5.1. Extraer imágenes de un documento PDF

En el siguiente ejemplo, las imágenes de un documento PDF serán extraídas y guardadas en el sistema de archivos como imágenes PNG.

import com.ironsoftware.ironpdf.PdfDocument;

import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class main {
    public static void main(String[] args) throws Exception {
        PdfDocument pdf = PdfDocument.fromFile(Paths.get("Final Project Report Craft Arena.pdf"));

        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
JAVA

El programa anterior abre el archivo "Final Project Report Craft Arena.pdf" y utiliza el método extractAllImages para extraer todas las imágenes del archivo en una lista de objetos BufferedImage. A continuación, guarda cada nueva imagen de archivo en archivos PNG independientes con un nombre único.

Cómo extraer una imagen de un PDF en Java, Figura 4: Extracción de imagen del PDF de salida

Extracción de imágenes del resultado PDF

Extraer imágenes de URL

Esta sección discutirá cómo extraer imágenes directamente desde URL. En el siguiente código, la URL se convierte en una página PDF y luego se activa la navegación para extraer imágenes del PDF.

import com.ironsoftware.ironpdf.PdfDocument;

import javax.imageio.ImageIO;
import java.awt.image.BufferedImage;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Paths;
import java.util.List;

public class main {
    public static void main(String[] args) throws IOException {
        PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://www.amazon.com/?tag=hp2-brobookmark-us-20");

        List<BufferedImage> images = pdf.extractAllImages();
        int i = 0;
        for (BufferedImage image : images) {
            ImageIO.write(image, "PNG", Files.newOutputStream(Paths.get("image" + ++i + ".png")));
        }
    }
}
JAVA

En el código anterior, se proporciona la URL de la página de inicio de Amazon como entrada, y devuelve 74 imágenes.

Cómo extraer imágenes de PDF en Java, Figura 5: Extracción de imágenes del PDF

Extracción de imágenes del resultado PDF

Conclusión

La extracción de imágenes de un documento PDF puede hacerse en Java utilizando la biblioteca IronPDF. Para instalar IronPDF, necesitas tener Java, un IDE de Java (Eclipse o IntelliJ), Maven, y la biblioteca de IronPDF instalada e integrada con tu proyecto. El proceso de extraer imágenes de un documento PDF usando IronPDF es sencillo y solo requiere una llamada al método extractAllImages. Luego puedes guardar las imágenes en una ruta de archivo de tu elección utilizando el método ImageIO.write.

Este artículo proporciona una guía paso a paso sobre cómo extraer imágenes de un documento PDF utilizando Java y la biblioteca IronPDF. Más detalles, incluida información sobre cómo extraer texto de PDFs, se pueden encontrar en el Ejemplo de Código de Extracción de Texto.

IronPDF es una biblioteca con una licencia comercial, a partir de $749. Sin embargo, puedes evaluarlo en producción con una prueba gratuita.

Kannaopat Udonpant
Ingeniero de software
Antes de convertirse en ingeniero de software, Kannapat realizó un doctorado en Recursos Medioambientales en la Universidad de Hokkaido (Japón). Mientras cursaba su licenciatura, Kannapat también se convirtió en miembro del Laboratorio de Robótica Vehicular, que forma parte del Departamento de Ingeniería de Bioproducción. En 2022, aprovechó sus conocimientos de C# para unirse al equipo de ingeniería de Iron Software, donde se centra en IronPDF. Kannapat valora su trabajo porque aprende directamente del desarrollador que escribe la mayor parte del código utilizado en IronPDF. Además del aprendizaje entre iguales, Kannapat disfruta del aspecto social de trabajar en Iron Software. Cuando no está escribiendo código o documentación, Kannapat suele jugar con su PS5 o volver a ver The Last of Us.
< ANTERIOR
Cómo generar PDF en Java
SIGUIENTE >
Cómo extraer datos de un PDF en Java

Instalar con Maven

Versión:2025.3.6

<dependency>
  <groupId>com.ironsoftware</groupId>
  <artifactId>ironpdf</artifactId>
  <version>2025.3.6</version>
</dependency>