Pruebas en un entorno real
Pruebe en producción sin marcas de agua.
Funciona donde lo necesites.
Este artículo explorará cómo crear un lector de PDF para abrir un archivo PDF en su aplicación de software programáticamente. Para realizar esta tarea con eficacia, IronPDF for Java es una de esas bibliotecas de sistema que ayuda a abrir y leer archivos PDF utilizando el nombre de archivo en programas Java.
EnIronPDF - Biblioteca Javase construye sobre el ya exitoso .NET Framework. Esto convierte a IronPDF en una herramienta versátil para trabajar con documentos PDF en comparación con otras bibliotecas de clases como Apache PDFBox. Proporciona la facilidad paraextraer y analizar contenido, cargar texto, y cargar imágenes. También ofrece opciones para personalizar las páginas PDF, comodiseño de página, márgenes,encabezado y pie de página, orientación de la páginay mucho más.
Además de esto, IronPDF también admite la conversión desde otros formatos de archivo, la protección de PDFs con una contraseña, la firma digital, la fusión y la división de documentos PDF.
Para usar IronPDF para crear un lector de PDF en Java, es necesario asegurarse de que los siguientes componentes estén instalados en el ordenador:
JDK - Java Development Kit es necesario para crear y ejecutar programas Java. Si no está instalado, descárguelo desde elSitio web de Oracle.
IDE - El Entorno de Desarrollo Integrado es un software que ayuda a escribir, editar y depurar un programa. Descarga cualquier IDE para Java, por ejemplo, Eclipse, NetBeans, IntelliJ.
Maven - Maven es una herramienta de automatización que ayuda a descargar bibliotecas del Repositorio Central. Descárguelo delSitio web de Apache Maven.
pom.xml
como se muestra en el ejemplo a continuación:<dependency>
<groupId>com.ironsoftware</groupId>
<artifactId>com.ironsoftware</artifactId>
<version>2024.11.4</version>
</dependency>
En primer lugar, añada el siguiente código en la parte superior del archivo fuente Java para hacer referencia a todos los métodos necesarios de IronPDF. Importar org es opcional en este ejemplo.
import com.ironsoftware.ironpdf.*;
A continuación, configure IronPDF con una clave de licencia válida para utilizar su método. Invoca el método setLicenseKey
en el método main.
License.setLicenseKey("Your license key");
Nota: Puedes obtener una clave de licencia de prueba gratuita para crear, leer e imprimir PDFs.
Aleer archivos PDFademás, debe haber archivos PDF, o se puede crear uno. Este artículo utilizará un archivo PDF ya creado. El código es simple y un proceso de dos pasos para extraer texto del documento.
PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractAllText();
System.out.println(text);
En el código anterior,deArchivoabre un documento PDF. El método Paths.get
obtiene el directorio del archivo y está listo para extraer contenido del archivo. Luego,[extractAllText
](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllText())lee todo el texto en el documento.
El resultado es el siguiente:
Lectura de Texto de Salida de PDF
IronPDF también puede leer el contenido de una página específica de un PDF. El método extractTextFromPage
utiliza un objeto PageSelection
para aceptar un rango de páginas(s) del que se leerá el texto.
En el siguiente ejemplo, el texto se extrae de la segunda página del documento PDF. PageSelection.singlePage
toma el índice de la página que hay que extraer.
PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractTextFromPage(PageSelection.singlePage(1));
System.out.println(text);
Lectura de Texto de Salida de PDF
Otros métodos disponibles en la clase PageSelection
que se pueden utilizar para extraer texto de varias páginas incluyen:[primeraPágina
](/java/object-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#lastPage()), [Última página](/java/object-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#firstPage()), rangoDePágina
y[Todas las páginas](/java/object-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#allPages()).
La búsqueda de texto también se puede realizar desde un archivo PDF recién generado a partir de un archivo HTML o URL. El siguiente código de ejemplo genera PDF a partir de URL y extrae todo el texto del sitio web.
PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://unsplash.com/");
String text = pdf.extractAllText();
System.out.println("Text extracted from the website: " + text);
Leer desde un nuevo archivo
IronPDF también puede utilizarse paraextraer imágenes de archivos PDF.
El código completo es el siguiente:
import com.ironsoftware.ironpdf.License;
import com.ironsoftware.ironpdf.PdfDocument;
import com.ironsoftware.ironpdf.edit.PageSelection;
import java.io.IOException;
import java.nio.file.Paths;
public class Main {
public static void main(String[] args) throws IOException {
License.setLicenseKey("YOUR LICENSE KEY HERE");
PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractTextFromPage(PageSelection.singlePage(1));
System.out.println(text);
pdf = PdfDocument.renderUrlAsPdf("https://unsplash.com/");
text = pdf.extractAllText();
System.out.println("Text extracted from the website: " + text);
}
}
Este artículo explicó cómo abrir y leer PDFs en Java utilizando IronPDF.
IronPDF ayuda a crear fácilmente archivos PDF a partir de HTML o URL y a convertirlos a partir de diferentes formatos de archivo. También ayuda a realizar tareas en PDF de forma rápida y sencilla.
Pruebe IronPDF para30 días de prueba gratuitay descubre qué tan bien funciona para ti en producción. Explore las opciones de licencia comercial para IronPDF que parten únicamente de $749.
9 productos API .NET para sus documentos de oficina