import com.ironsoftware.ironpdf.*;
import java.io.IOException;
import java.nio.file.Paths;
// Apply your license key
License.setLicenseKey("YOUR-LICENSE-KEY");
// Set a log path
Settings.setLogPath(Paths.get("C:/tmp/IronPdfEngine.log"));
// Render the HTML as a PDF. Stored in myPdf as type PdfDocument;
PdfDocument myPdf = PdfDocument.renderHtmlAsPdf("<h1> ~Hello World~ </h1> Made with IronPDF!");
// Save the PdfDocument to a file
myPdf.saveAs(Paths.get("html_saved.pdf"));
Cet article explorera comment créer un lecteur PDF pour ouvrir un fichier PDF dans votre application logicielle par programmation. Pour accomplir cette tâche efficacement, IronPDF for Java est l'une de ces bibliothèques système qui permet d'ouvrir et de lire des fichiers PDF à l'aide du nom de fichier dans les programmes Java.
LesIronPDF for Java - Bibliothèque Javaest construit sur le cadre déjà réussi de .NET Framework. Cela fait de IronPDF un outil polyvalent pour travailler avec des documents PDF par rapport à d'autres bibliothèques de classes telles qu'Apache PDFBox. Il offre la possibilité deextraire et analyser le contenu, charger du texte et charger des images. Il offre également des options pour personnaliser les pages PDF telles quemise en page, marges,l'en-tête et le pied de page, orientation des pageset bien d'autres choses encore.
En plus de cela, IronPDF prend également en charge la conversion d'autres formats de fichiers, la protection des PDFs par mot de passe, la signature numérique, la fusion et la division des documents PDF.
Comment lire des fichiers PDF en Java ?
Conditions préalables
Pour utiliser IronPDF afin de créer un lecteur PDF Java, il est nécessaire de s'assurer que les composants suivants sont installés sur l'ordinateur :
JDK - Le kit de développement Java est nécessaire pour construire et exécuter des programmes Java. S'il n'est pas installé, téléchargez-le depuis leSite web d'Oracle.
IDE - Un environnement de développement intégré est un logiciel qui aide à écrire, éditer et déboguer un programme. Téléchargez n'importe quel IDE pour Java, par exemple Eclipse, NetBeans, IntelliJ.
Maven - Maven est un outil d'automatisation qui aide à télécharger des bibliothèques depuis le Central Repository. Téléchargez-le à partir de la pageSite web d'Apache Maven.
IronPDF - Enfin, IronPDF est nécessaire pour lire le fichier PDF en Java. Il doit être ajouté en tant que dépendance dans votre projet Java Maven. Incluez l'artefact IronPDF ainsi que la dépendance slf4j dans le fichier pom.xml comme indiqué dans l'exemple ci-dessous :
Tout d'abord, ajoutez le code suivant au fichier source Java pour référencer toutes les méthodes requises d'IronPDF. L'importation d'org est facultative dans cet exemple.
import com.ironsoftware.ironpdf.*;
import com.ironsoftware.ironpdf.*;
JAVA
Ensuite, configurez IronPDF avec une clé de licence valide pour utiliser sa méthode. Invoquez la méthode setLicenseKey dans la méthode principale.
License.setLicenseKey("Your license key");
License.setLicenseKey("Your license key");
JAVA
Remarque : Vous pouvez obtenir une clé de licence d'essai gratuite pour créer, lire et imprimer des PDF.
Lire un fichier PDF existant en Java
Pourlire des fichiers PDFles fichiers PDF doivent être disponibles ou peuvent être créés. Cet article utilisera un fichier PDF déjà créé. Le code est simple et consiste en un processus en deux étapes pour extraire le texte du document.
PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractAllText();
System.out.println(text);
PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractAllText();
System.out.println(text);
JAVA
Dans le code ci-dessus,fromFileouvre un document PDF. La méthode Paths.get obtient le répertoire du fichier et est prête à extraire le contenu du fichier. Ensuite,[extraireToutLeTexte](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllText())lit tout le texte du document.
Le résultat est le suivant :
Lecture de la sortie de texte PDF
Lire le texte d'une page spécifique
IronPDF peut également lire le contenu d'une page spécifique d'un PDF. La méthode extractTextFromPage utilise un objet PageSelection pour accepter une série de pages(s) à partir duquel le texte sera lu.
Dans l'exemple suivant, le texte est extrait de la deuxième page du document PDF. PageSelection.singlePage prend l'index de la page à extraire.
PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractTextFromPage(PageSelection.singlePage(1));
System.out.println(text);
PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractTextFromPage(PageSelection.singlePage(1));
System.out.println(text);
JAVA
Lecture de la sortie de texte PDF
D'autres méthodes disponibles dans la classe PageSelection qui peuvent être utilisées pour extraire du texte de différentes pages incluent :[firstPage](/java/objet-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#lastPage()), [lastPage](/java/objet-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#firstPage()), pageRangeet[allPages](/java/objet-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#allPages()).
Lire le texte d'un fichier PDF nouvellement généré
Le texte de recherche peut également être effectué à partir d'un fichier PDF nouvellement généré à partir d'un fichier HTML ou d'une URL. L'exemple de code suivant génère des PDF à partir d'une URL et extrait tout le texte du site web.
PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://unsplash.com/");
String text = pdf.extractAllText();
System.out.println("Text extracted from the website: " + text);
PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://unsplash.com/");
String text = pdf.extractAllText();
System.out.println("Text extracted from the website: " + text);
JAVA
Lire depuis un nouveau fichier
IronPDF peut également être utilisé pourextraire des images à partir de fichiers PDF.
Le code complet est le suivant :
import com.ironsoftware.ironpdf.License;
import com.ironsoftware.ironpdf.PdfDocument;
import com.ironsoftware.ironpdf.edit.PageSelection;
import java.io.IOException;
import java.nio.file.Paths;
public class Main {
public static void main(String[] args) throws IOException {
License.setLicenseKey("YOUR LICENSE KEY HERE");
PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractTextFromPage(PageSelection.singlePage(1));
System.out.println(text);
pdf = PdfDocument.renderUrlAsPdf("https://unsplash.com/");
text = pdf.extractAllText();
System.out.println("Text extracted from the website: " + text);
}
}
import com.ironsoftware.ironpdf.License;
import com.ironsoftware.ironpdf.PdfDocument;
import com.ironsoftware.ironpdf.edit.PageSelection;
import java.io.IOException;
import java.nio.file.Paths;
public class Main {
public static void main(String[] args) throws IOException {
License.setLicenseKey("YOUR LICENSE KEY HERE");
PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractTextFromPage(PageSelection.singlePage(1));
System.out.println(text);
pdf = PdfDocument.renderUrlAsPdf("https://unsplash.com/");
text = pdf.extractAllText();
System.out.println("Text extracted from the website: " + text);
}
}
JAVA
Résumé
Cet article explique comment ouvrir et lire des PDF en Java en utilisant IronPDF.
IronPDF permet de créer facilement des PDF à partir de HTML ou d'URL et de les convertir à partir de différents formats de fichiers. Il permet également d'effectuer des tâches PDF rapidement et facilement.
Regan est diplômé de l'université de Reading, où il a obtenu une licence en ingénierie électronique. Avant de rejoindre Iron Software, il s'était concentré sur une seule tâche. Ce qu'il apprécie le plus chez Iron Software, c'est la diversité des tâches qu'il peut accomplir, qu'il s'agisse d'apporter une valeur ajoutée aux ventes, à l'assistance technique, au développement de produits ou à la commercialisation. Il aime comprendre comment les développeurs utilisent la bibliothèque d'Iron Software et utiliser ces connaissances pour améliorer continuellement la documentation et développer les produits.
< PRÉCÉDENT Comment diviser des fichiers PDF en Java
SUIVANT > HTML2PDF Java (Tutoriel d'exemple de code)
Des millions d'ingénieurs dans le monde entier lui font confiance
Réservez une démo en direct gratuite
Réservez une démonstration personnelle de 30 minutes.
Pas de contrat, pas de détails de carte, pas d'engagements.
Voici ce à quoi vous pouvez vous attendre :
Une démonstration en direct de notre produit et de ses principales fonctionnalités
Obtenez des recommandations de fonctionnalités spécifiques au projet
Toutes vos questions trouvent réponse pour vous assurer de disposer de toutes les informations dont vous avez besoin. (Aucune obligation de votre part.)
CHOISIR L'HEURE
VOS INFORMATIONS
Réservez votre gratuit Démonstration en direct
Fiable par plus de 2 millions d'ingénieurs dans le monde entier