Conversion de PDF en images en Python

Q: Comment convertir un PDF en image en Python ?

Installez IronPDF avec pip install ironpdf , puis chargez le PDF en utilisant PdfDocument.FromFile("file.pdf") et appelez RasterizeToImageFiles("output/*.png", DPI=96) . Cela écrit une image par page dans le répertoire spécifié.

Q: Comment contrôler la qualité de l'image lors de la conversion d'un PDF ?

Utilisez le paramètre DPI dans RasterizeToImageFiles . Une valeur de 96 est standard pour la qualité web. 150 convient aux aperçus d'impression. 300 produit une sortie d'impression de haute qualité. Des valeurs de DPI plus élevées augmentent la taille du fichier et le temps de traitement.

Q: Puis-je définir une largeur ou une hauteur maximale pour les images de sortie ?

Oui. Passez ImageMaxWidth et ImageMaxHeight en pixels à RasterizeToImageFiles . IronPDF préserve le rapport d'aspect basé sur la valeur de hauteur, donc l'image ne sera pas déformée.

Q: Puis-je convertir une URL de page web en images en using IronPDF ?

Oui. Utilisez ChromePdfRenderer pour appeler RenderUrlAsPdf avec l'URL, qui renvoie un PdfDocument . Ensuite, appelez RasterizeToImageFiles sur ce document pour produire des fichiers image à partir de chaque page rendue.

Q: Pourquoi mes images converties apparaissent floues ?

Une sortie floue est causée par une valeur DPI faible. Augmentez-la par défaut de 96 à 150 ou 300 pour des résultats plus nets. Notez qu'un DPI plus élevé produit des fichiers de plus grande taille et prend plus de temps à traiter.

Curtis Chau

Mis à jour:3 mai 2026

Translated

View the article in English

La conversion de PDF en image est une exigence courante dans les applications Python. Les développeurs l'utilisent pour générer des vignettes de documents, des aperçus web, et pour alimenter les contenus PDF dans des pipelines de traitement d'images. IronPDF for Python fournit la méthode RasterizeToImageFiles, qui convertit n'importe quel document PDF (ou URL) en fichiers image JPEG, PNG ou TIFF avec une résolution (PPP) et des dimensions configurables.

Ce guide montre comment convertir des fichiers PDF en images en Python, comment contrôler la qualité de sortie, et comment dimensionner les images résultantes pour s'adapter aux contraintes de mise en page.

Démarrage rapide : Convertir un PDF en images

Installer IronPDF : pip install ironpdf
Charger un document PDF : pdf = PdfDocument.FromFile("document.pdf")
Convertir chaque page au format PNG : pdf.RasterizeToImageFiles("output/*.png", PPP=96)

#:path=/static-assets/pdf/content-code-examples/how-to/python-pdf-to-image/quickstart.py
from ironpdf import PdfDocument

pdf = PdfDocument.FromFile("document.pdf")
pdf.RasterizeToImageFiles("output/*.png", PPP=96)

#:path=/static-assets/pdf/content-code-examples/how-to/python-pdf-to-image/quickstart.py
from ironpdf import PdfDocument

pdf = PdfDocument.FromFile("document.pdf")
pdf.RasterizeToImageFiles("output/*.png", PPP=96)

PYTHON

Comment convertir un PDF en image en Python

Installez la bibliothèque IronPDF for Python
Chargez un PDF avec PdfDocument.FromFile ou rendez à partir d'une URL avec ChromePdfRenderer
Appelez RasterizeToImageFiles avec un modèle de chemin de sortie (par exemple, output/*.png)
Réglez PPP pour contrôler la qualité de l'image - des valeurs plus élevées produisent une sortie plus nette
Utilisez ImageMaxWidth et ImageMaxHeight pour limiter les dimensions de sortie

Pourquoi les développeurs convertissent-ils des PDFs en images ?

La conversion de PDF en image résout plusieurs problèmes pratiques en développement logiciel. L'exigence la plus courante est la génération d'aperçus - afficher une vignette d'un document PDF dans une interface web ou une application mobile sans forcer les utilisateurs à télécharger et ouvrir le fichier complet.

D'autres cas d'utilisation fréquents incluent :

Pipelines de machine learning : Les modèles OCR, les outils d'analyse de mise en page et les systèmes de vision par ordinateur acceptent les entrées d'images, pas les PDFs
Archivage et conformité : Stocker une capture visuelle aux côtés du PDF original assure une lisibilité à long terme même lorsque les visionneuses PDF changent
Intégration de rapports : Inclure des pages PDF spécifiques comme images à l'intérieur d'autres documents ou modèles d'e-mails
Tests automatisés : Comparer les captures d'écran de pages rendues pour détecter les régressions visuelles dans la sortie PDF

Python n'inclut pas de fonctionnalité native de conversion PDF en image dans sa bibliothèque standard. Des outils tels que pdf2image nécessitent l'installation de Poppler en tant que binaire externe, ce qui ajoute à la complexité du déploiement. IronPDF gère le rendu en interne ; ainsi, l'ajout d'une conversion PDF vers image à n'importe quel projet Python ne nécessite qu'un seul pip install.

Veuillez noterIronPDF utilise un moteur de rendu basé sur Chromium. Les PDFs rendus en HTML produisent des images qui ressemblent exactement à ce qu'un navigateur afficherait, ce qui est utile lorsque les PDFs proviennent de sources HTML ou URL.

Comment convertir un fichier PDF en images ?

Pour convertir un PDF en images, appelez RasterizeToImageFiles sur une instance PdfDocument. La méthode écrit un fichier image par page dans le répertoire spécifié. L'astérisque (*) dans le chemin de sortie est remplacé par le numéro de page commençant à 1, de sorte que assets/images/*.png produit assets/images/1.png, assets/images/2.png, et ainsi de suite.

Créez le répertoire de sortie avant d'appeler la méthode. IronPDF ne le créera pas automatiquement s'il n'existe pas.

#:path=/static-assets/pdf/content-code-examples/how-to/python-pdf-to-image/convert-pdf-to-images.py
from ironpdf import PdfDocument

# Load a PDF from disk
pdf = PdfDocument.FromFile("my-content.pdf")

# Write each page to a PNG file in the "assets/images" folder
# The folder must exist before calling this method
pdf.RasterizeToImageFiles("assets/images/*.png", PPP=96)

#:path=/static-assets/pdf/content-code-examples/how-to/python-pdf-to-image/convert-pdf-to-images.py
from ironpdf import PdfDocument

# Load a PDF from disk
pdf = PdfDocument.FromFile("my-content.pdf")

# Write each page to a PNG file in the "assets/images" folder
# The folder must exist before calling this method
pdf.RasterizeToImageFiles("assets/images/*.png", PPP=96)

PYTHON

Le paramètre PPP contrôle la résolution de l'image. Un PPP plus élevé produit une image plus nette au prix d'une taille de fichier plus grande et d'un temps de traitement plus long. Valeurs standard :

Valeurs de PPP et cas d'utilisation typiques
PPP	Utilisation typique
72	Résolution d'écran, traitement rapide
96	Qualité web standard
150	Bonne qualité d'impression
300	Sortie d'impression de haute qualité

Répertoire de sortie avec un fichier PNG par page PDF

Si les images de sortie apparaissent floues, augmentez la valeur PPP. Le traitement à 300 PPP sur un document de 50 pages prend sensiblement plus de temps que 96 PPP - choisissez en fonction des exigences de qualité réelle pour le cas d'utilisation.

ConseilsPour la génération de vignettes web, 96 PPP est suffisant et garde les tailles des fichiers petites. Réservez 150-300 PPP pour les cas où l'image sera imprimée ou affichée en taille réelle.

Comment convertir une plage de pages spécifique en images ?

Pour ne convertir qu'un sous-ensemble de pages, passez les indices de page en tant que deuxième argument à RasterizeToImageFiles. Les indices de pages sont des entiers basés sur zéro.

#:path=/static-assets/pdf/content-code-examples/how-to/python-pdf-to-image/convert-page-range.py
from ironpdf import PdfDocument

pdf = PdfDocument.FromFile("my-content.pdf")

# Convert only pages 1, 2, and 3 (zero-based indices: 0, 1, 2)
pdf.RasterizeToImageFiles("assets/images/*.png", [0, 1, 2], PPP=96)

#:path=/static-assets/pdf/content-code-examples/how-to/python-pdf-to-image/convert-page-range.py
from ironpdf import PdfDocument

pdf = PdfDocument.FromFile("my-content.pdf")

# Convert only pages 1, 2, and 3 (zero-based indices: 0, 1, 2)
pdf.RasterizeToImageFiles("assets/images/*.png", [0, 1, 2], PPP=96)

PYTHON

L'extraction sélective de pages est utile pour les documents où seules les premières pages doivent être prévisualisées, évitant ainsi un traitement inutile de l'intégralité du fichier. Pour les flux de travail qui extraient des images déjà intégrées dans un PDF, IronPDF fournit des méthodes d'extraction séparées.

Comment convertir une URL en images ?

IronPDF peut rendre une page web en PDF, puis convertir ce PDF en images dans un flux de travail unique. Utilisez ChromePdfRenderer pour récupérer et afficher l'URL, puis appelez RasterizeToImageFiles sur le résultat PdfDocument. Cette approche crée des archives visuelles de pages web ou génère des aperçus d'images pour des contenus basés sur le web sans nécessiter un outil de capture d'écran séparé.

#:path=/static-assets/pdf/content-code-examples/how-to/python-pdf-to-image/url-to-images.py
from ironpdf import ChromePdfRenderer

# Render a web page to PDF
renderer = ChromePdfRenderer()
pdf = renderer.RenderUrlAsPdf("https://www.example.com")

# Convert each rendered page to a PNG image
pdf.RasterizeToImageFiles("assets/images/*.png", PPP=96)

#:path=/static-assets/pdf/content-code-examples/how-to/python-pdf-to-image/url-to-images.py
from ironpdf import ChromePdfRenderer

# Render a web page to PDF
renderer = ChromePdfRenderer()
pdf = renderer.RenderUrlAsPdf("https://www.example.com")

# Convert each rendered page to a PNG image
pdf.RasterizeToImageFiles("assets/images/*.png", PPP=96)

PYTHON

Les images rendues reflètent l'apparence de la page dans un navigateur Chromium, y compris les styles CSS et le contenu rendu par JavaScript. Pour les pages nécessitant une authentification ou une interaction, envisagez d'utiliser le tutoriel HTML to PDF de IronPDF pour fournir directement le balisage pré-rendu. Le PDF résultant peut ensuite être rasterisé en utilisant la même approche que celle montrée ci-dessus.

Images générées à partir d'une URL rendue par IronPDF

Comment contrôler les dimensions des images de sortie ?

Par défaut, RasterizeToImageFiles génère des images aux dimensions natives de la page, mises à l'échelle par le facteur PPP. Pour limiter la taille du résultat, définissez ImageMaxWidth et ImageMaxHeight, toutes deux mesurées en pixels.

IronPDF conserve le rapport d'aspect d'origine en fonction de la valeur ImageMaxHeight. La sortie ne sera pas étirée ou déformée même si la largeur et la hauteur spécifiées ont un rapport différent de celui de la page source.

#:path=/static-assets/pdf/content-code-examples/how-to/python-pdf-to-image/constrained-dimensions.py
from ironpdf import PdfDocument

pdf = PdfDocument.FromFile("my-content.pdf")

# Generate thumbnail images constrained to 500x500 pixels
pdf.RasterizeToImageFiles(
    "assets/images/*.png",
    ImageMaxWidth=500,
    ImageMaxHeight=500,
    PPP=200
)

#:path=/static-assets/pdf/content-code-examples/how-to/python-pdf-to-image/constrained-dimensions.py
from ironpdf import PdfDocument

pdf = PdfDocument.FromFile("my-content.pdf")

# Generate thumbnail images constrained to 500x500 pixels
pdf.RasterizeToImageFiles(
    "assets/images/*.png",
    ImageMaxWidth=500,
    ImageMaxHeight=500,
    PPP=200
)

PYTHON

Régler ImageMaxWidth=500, ImageMaxHeight=500 à 200 PPP permet d'obtenir des images adaptées à l'affichage de vignettes ou à des mises en page d'interface utilisateur sous forme de cartes. Ajustez ces valeurs pour correspondre aux dimensions requises par la conception de l'application. Pour générer le contenu PDF en cours de rasterisation, IronPDF prend également en charge la création de PDFs à partir de Python et la fusion de plusieurs PDFs avant la conversion.

ImportantLe rapport d'aspect est préservé selon la hauteur. Si la page source est plus large que haute, l'image obtenue peut être plus étroite que ImageMaxWidth. Concevez des mises en page pour gérer des vignettes de largeur variable.

Quelles sont les prochaines étapes pour la conversion de PDF en image ?

Ce guide a couvert trois flux de travail principaux : convertir un fichier PDF en images, convertir une URL en images et contrôler les dimensions et la qualité des images. IronPDF prend en charge les formats JPEG, JPG, PNG, TIFF et d'autres formats via la même méthode RasterizeToImageFiles. Changez l'extension de fichier dans le modèle de chemin de sortie pour changer de formats.

Pour une automatisation supplémentaire, envisagez ces prochaines étapes :

Traitement par lots : parcourez un répertoire de fichiers PDF et convertissez-les les uns après les autres, ou utilisez le module concurrent.futures de Python pour un traitement en parallèle
Extraction sélective : Utilisez le paramètre d'index de page pour extraire uniquement les pages pertinentes pour le cas d'utilisation
Intégration au pipeline d'images : Alimentez les fichiers de sortie dans PIL/Pillow ou OpenCV pour un traitement complémentaire tel que le recadrage, l'annotation ou la normalisation de format
Compression avant conversion : Utilisez la compression PDF de IronPDF pour réduire la taille des fichiers avant de rasteriser de grands documents
Flux de travail des formulaires : Remplir les formulaires PDF de manière programmatique puis convertir les pages de formulaire complétées en images pour examen ou archivage

Pour continuer à construire avec IronPDF, explorez la documentation IronPDF for Python et l'exemple de rasterisation de PDF en images.

Commencez un essai gratuit de 30 jours d'IronPDF for Python pour utiliser ces fonctionnalités en production. Quand vous êtes prêt à déployer, consultez les options de licence pour le plan qui s'adapte à l'échelle du projet.

Veuillez noterPour en savoir plus : Convertir des PDF en images

Questions Fréquemment Posées

Comment convertir un PDF en image en Python ?

Installez IronPDF avec pip install ironpdf, puis chargez le PDF en utilisant PdfDocument.FromFile("file.pdf") et appelez RasterizeToImageFiles("output/*.png", DPI=96). Cela écrit une image par page dans le répertoire spécifié.

Quels formats d'image IronPDF prend-il en charge pour la conversion de PDF ?

IronPDF prend en charge les formats de sortie PNG, JPEG, JPG et TIFF. Spécifiez le format en changeant l'extension de fichier dans le modèle de chemin de sortie passé à RasterizeToImageFiles, tel que *.jpg pour JPEG ou *.tiff pour TIFF.

Comment contrôler la qualité de l'image lors de la conversion d'un PDF ?

Utilisez le paramètre DPI dans RasterizeToImageFiles. Une valeur de 96 est standard pour la qualité web. 150 convient aux aperçus d'impression. 300 produit une sortie d'impression de haute qualité. Des valeurs de DPI plus élevées augmentent la taille du fichier et le temps de traitement.

Puis-je définir une largeur ou une hauteur maximale pour les images de sortie ?

Oui. Passez ImageMaxWidth et ImageMaxHeight en pixels à RasterizeToImageFiles. IronPDF préserve le rapport d'aspect basé sur la valeur de hauteur, donc l'image ne sera pas déformée.

Comment convertir uniquement des pages spécifiques d'un PDF en images ?

Passez une liste d'indices de pages à base zéro comme deuxième argument à RasterizeToImageFiles. Par exemple, [0, 1, 2] convertit uniquement les trois premières pages.

Puis-je convertir une URL de page web en images en using IronPDF ?

Oui. Utilisez ChromePdfRenderer pour appeler RenderUrlAsPdf avec l'URL, qui renvoie un PdfDocument. Ensuite, appelez RasterizeToImageFiles sur ce document pour produire des fichiers image à partir de chaque page rendue.

IronPDF nécessite-t-il des binaires externes pour la conversion de PDF en image ?

Non. IronPDF inclut son propre moteur de rendu basé sur Chromium et ne nécessite pas Poppler, Ghostscript, ou quelque installation binaire externe. Un pip install ironpdf est suffisant pour commencer.

Pourquoi mes images converties apparaissent floues ?

Une sortie floue est causée par une valeur DPI faible. Augmentez-la par défaut de 96 à 150 ou 300 pour des résultats plus nets. Notez qu'un DPI plus élevé produit des fichiers de plus grande taille et prend plus de temps à traiter.

Curtis Chau

Discutez maintenant avec l'équipe d'ingénierie

Rédacteur technique

Curtis Chau détient un baccalauréat en informatique (Université de Carleton) et se spécialise dans le développement front-end avec expertise en Node.js, TypeScript, JavaScript et React. Passionné par la création d'interfaces utilisateur intuitives et esthétiquement plaisantes, Curtis aime travailler avec des frameworks modernes ...

Prêt à commencer?

Version : 2026.5 just released