USO DE IRONPDF FOR JAVA

Cómo leer archivos PDF en Java

Actualizado marzo 19, 2023
Compartir:

Leer un documento PDF en Java puede ser una parte integral de cualquier proyecto, desde aplicaciones empresariales hasta análisis de datos. Los documentos PDF ofrecen ventajas como la portabilidad de los archivos y unos tiempos de carga rápidos que los hacen especialmente útiles en muchas configuraciones del sistema para el análisis de contenidos.

Con la biblioteca IronPDF, ahora es más fácil que nunca integrar funciones de procesamiento de PDF en sus proyectos Java.

IronPDF: Importar biblioteca PDF Java

Biblioteca Java PDF IronPDF es la solución perfecta para desarrolladores de software que necesitan producir rápidamente archivos PDF de alta calidad y listos para capturar a partir de HTML. La biblioteca también ofrece potentes herramientas de manipulación de documentos que permiten un control dinámico del diseño, el contenido y el formato de las páginas.

Veamos cómo podemos leer un archivo PDF almacenado en una ruta en un programa Java utilizando la biblioteca IronPDF.

Leer PDF con IronPDF

En primer lugar, tuvimos que instalar IronPDF en nuestro Maven proyecto.

Instalar IronPDF en Maven

Estos son los pasos para instalar IronPDF en un proyecto Maven:

  1. Abra su proyecto Maven en su IDE preferido.

  2. En el archivo pom.xml, añada la dependencia de la biblioteca IronPDF en la sección dependencies.

    :ProductInstall
  1. Guarde el archivo pom.xml y deje que Maven descargue e instale la biblioteca IronPDF.

    Una vez completada la instalación, debería poder importar y utilizar las siguientes clases de IronPDF y los analizadores Apache tika en su proyecto.

Código Java para leer documentos PDF

Aquí está el código que puede utilizar para leer el nuevo archivo con o sin límites tabulares utilizando la biblioteca IronPDF.

import com.ironsoftware.ironpdf.*;
import java.io.IOException;
import java.nio.file.Paths;

public class test{
    public static void main(String [] args) throws IOException {
    PdfDocument pdf = PdfDocument.fromFile(Paths.get("C:\\sample.pdf"));  
    String text = pdf.extractAllText();
    System.out.println(text);
    }
}
JAVA

En este programa se utiliza la clase PdfDocument de la librería IronPDF para leer el contenido de un fichero PDF. La primera línea del programa importa las clases necesarias de la biblioteca IronPDF. La segunda línea importa la clase IOException de la biblioteca estándar de Java.

El programa define una clase pública llamada "test". Dentro de la clase, hay un método public static llamado main que toma un array de cadenas como argumento.

El método main utiliza el método fromFile de la clase PdfDocument para cargar un archivo PDF ubicado en "C:\sample.pdf". Este método devuelve un objeto PdfDocument que representa el archivo PDF.

Una vez cargado el archivo PDF, el programa llama al método extractAllText de la clase PdfDocument para extraer todo el texto del archivo PDF. Este método devuelve una cadena que contiene todo el texto del archivo PDF.

El texto extraído se almacena en una variable de cadena llamada "texto". Esta variable puede utilizarse para procesar o mostrar el contenido del archivo PDF.

Por último, el programa imprime el texto extraído en la consola utilizando el método System.out.println.

Lectura de PDF en Java - Figura 1: Salida del programa

Los resultados de ejecutar el código mostrado arriba

Conclusión

IronPDF es una gran solución para leer archivos PDF dentro de la misma ruta o de varias rutas diferentes en Java, ya que ofrece un alto rendimiento y muchas funciones que facilitan el desarrollo de PDF. Su sintaxis es sencilla y fácil de usar. Su API permite a los desarrolladores crear rápidamente el código que necesitan para sus proyectos.

Licencias de IronPDF los planes empiezan desde sólo $749, lo que hace accesible la extracción de contenidos para quienes tienen un presupuesto limitado. En general, IronPDF constituye una excelente opción para cualquier desarrollador Java que desee trabajar con archivos PDF en la programación de sus aplicaciones Java.

< ANTERIOR
Cómo añadir firmas digitales a los PDF en Java
SIGUIENTE >
Cómo rotar un archivo PDF en Java

Instalar con Maven

Versión: 2024.8.1

<dependency>
  <groupId>com.ironsoftware</groupId>
  <artifactId>ironpdf</artifactId>
  <version>2024.8.1</version>
</dependency>

¿Listo para empezar? Versión: 2024.8 acaba de salir

Descarga gratuita de Maven View Licenses >