Test dans un environnement réel
Test en production sans filigrane.
Fonctionne partout où vous en avez besoin.
La lecture d'un document PDF en Java peut faire partie intégrante de n'importe quel projet, qu'il s'agisse d'applications commerciales ou d'analyses de données. Avec la bibliothèque IronPDF, il est devenu plus facile que jamais d'intégrer des capacités de traitement de fichiers PDF dans vos projets Java.
fromFile
méthodeextraireToutTexte
méthode to read text from the opened fileIronPDF for Java PDF library (bibliothèque PDF Java) est la solution parfaite pour les développeurs de logiciels qui ont besoin de produire des des PDF prêts à l'utilisation rapidement à partir de HTML. La bibliothèque fournit également des outils puissants de manipulation de documents permettant un contrôle dynamique sur mise en page, contenu et mise en forme.
Voyons comment lire un fichier PDF stocké à un chemin dans un programme Java en utilisant la bibliothèque IronPDF.
La première étape consiste à installer IronPDF en utilisant Maven, plus de détails peuvent être trouvés dans cette guide d'installation.
Voici les étapes pour installer IronPDF dans un projet Maven :
pom.xml
, ajoutez la dépendance de la bibliothèque IronPDF dans la section dependencies
. :ProductInstall
Enregistrez le fichier pom.xml
et laissez Maven télécharger et installer la bibliothèque IronPDF.
Une fois l'installation terminée, vous devriez pouvoir importer et utiliser les classes suivantes d'IronPDF et les analyseurs Apache Tika dans votre projet.
Voici le code que vous pouvez utiliser pour lire le nouveau fichier avec ou sans limites tabulaires en utilisant la bibliothèque IronPDF.
import com.ironsoftware.ironpdf.*;
import java.io.IOException;
import java.nio.file.Paths;
public class Test {
public static void main(String[] args) throws IOException {
PdfDocument pdf = PdfDocument.fromFile(Paths.get("C:\\sample.pdf"));
String text = pdf.extractAllText();
System.out.println(text);
}
}
Dans ce programme, le PdfDocument
La classe de la bibliothèque IronPDF est utilisée pour lire le contenu d'un fichier PDF. La première ligne du programme importe les classes nécessaires de la bibliothèque IronPDF. La deuxième ligne importe la classe IOException
de la bibliothèque standard de Java.
Le programme définit une classe publique nommée Test
. Dans la classe, il y a une méthode public static
nommée main
qui prend un tableau de chaînes de caractères comme argument.
La méthode `main` utilise le
``` [`fromFile`](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#fromFile(java.nio.file.Path)) méthode de la classe `PdfDocument` pour charger un fichier PDF situé à "C:\\sample.pdf". Cette méthode renvoie un objet `PdfDocument` qui représente le fichier PDF.
Une fois que le fichier PDF est chargé, le programme appelle le [`extraireToutLeTexte`](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllText()) méthode de la classe `PdfDocument` pour extraire tout le texte du fichier PDF. Cette méthode renvoie une `String` qui contient tout le texte du fichier PDF.
Le texte extrait est ensuite stocké dans une variable `String` nommée "text". Cette variable peut être utilisée pour traiter ou afficher le contenu du fichier PDF.
Enfin, le programme imprime le texte extrait sur la console à l'aide de la méthode `System.out.println`.
![Comment lire un fichier PDF en Java, Figure 1 : Résultat du programme](/static-assets/pdf/blog/java-read-pdf-tutorial/java-read-pdf-tutorial-1.webp) **Sortie du programme**
### Conclusion
IronPDF est une excellente solution pour lire des fichiers PDF dans le même chemin ou dans plusieurs chemins différents en Java, car il offre des performances élevées et de nombreuses fonctionnalités qui facilitent le développement de PDF. Sa syntaxe est simple et conviviale. Son API permet aux développeurs de créer rapidement le code dont ils ont besoin pour leurs projets.
[Licence d'IronPDF](/java/licensing/) commencent à partir de $749, ce qui rend l'extraction de contenu accessible aux personnes disposant d'un budget limité. Dans l'ensemble, IronPDF constitue une excellente option pour tout développeur Java souhaitant travailler avec des PDF dans le cadre de la programmation d'applications Java.
9 produits de l'API .NET pour vos documents de bureau