Python'da PDF'yi Görüntüye Nasıl Dönüştürürüm
PDF (Taşınabilir Belge Formatı), internet üzerinden veri aktarımında, içerik biçimlendirmesini koruduğu ve güvenlik izinleri ile veriyi koruduğu için en popüler dosya formatıdır. PDF dosyalarını JPG görüntülerine veya PNG, BMP, TIFF ya da GIF gibi başka bir görüntü formatına dönüştürmemiz gereken senaryolar vardır. JPG dönüştürme için birçok çevrimiçi kaynak mevcuttur, ancak kendi PDF'den Görüntüye dönüştürme aracımızı Python'da oluşturmak ne kadar havalı olurdu?
Python Nedir?
Python, yazılım uygulamaları, web siteleri oluşturmak, görevleri otomatikleştirmek, veri analizi yapmak ve Yapay Zeka ve Makine Öğrenimi görevlerini gerçekleştirmek için kullanılan yüksek seviyeli bir programlama dilidir. Ayrıca, yorumlandığı için daha hızlı geliştirme ve test açısından daha güçlü olan bir betik dilidir.
PDF'den görüntüye bir dönüştürücü oluşturmak için, bilgisayarınıza Python 3+ yüklü olması gerekir. resmi web sitesinden en son sürümü indirin ve yükleyin.
Bu makalede, Python PDF'den görüntüye kütüphaneleri kullanarak kendi görüntü dönüştürme uygulamamızı oluşturacağız. Bu amaçla, Python'un en popüler kütüphanelerinden ikisini kullanacağız: PDF2Image ve PyMuPDF.
Python'da PDF Dosyalarını Görüntü Dosyalarına Dönüştürme
- PDF'den görüntüye dönüştürmek için Python kütüphanesini yükleyin.
- Herhangi bir konumdan mevcut bir PDF dosyası yükleyin.
- Dönüştürme yöntemlerini kullanın.
- Dosyanın sayfalarında yineleme yapın.
- Her sayfayı kaydetme yöntemi ile bir JPG veya PNG görüntüsü olarak kaydedin.
Yeni bir Python Dosyası Oluşturun
- Python IDLE uygulamasını açın ve Ctrl + N tuşlarına basın. Metin düzenleyici açılacak. Bu işlem için tercih ettiğiniz metin düzenleyicisini kullanabilirsiniz.
- Dosyayı, resimlere dönüştürmek istediğiniz PDF dosyası ile aynı konuma pdf2image.py olarak kaydedin.
Kullanacağımız giriş PDF dosyası 28 sayfa içermekte ve aşağıdaki gibidir:

PDF2Image Kitaplığı Kullanarak PDF Dosyalarını Görüntü Dosyalarına Dönüştürme
1. PDF2Image Python Kitaplığını Yükleyin
PDF2Image, pdftocairo ve pdftoppm kapsamını saran bir modüldür. Python 3.7+ üzerinde çalışarak PDF'yi bir PIL görüntü nesnesine dönüştürür. Önceki sürüm geçmişi, PDF'yi resimlere dönüştürmek için sadece pdftoppm kapsadığını ve yalnızca Python 3+ üzerinde çalıştığını göstermektedir.
pdf2image paketini yüklemek için Windows komut istemcisi veya Windows PowerShell'ınızı açın ve aşağıdaki pip komutunu kullanın:
pip install pdf2imagepip install pdf2imagePip (Tercih Edilen Yükleyici Programı), Python'un paket yöneticisidir. Python standart kütüphanesinde bulunmayan, özellik ve işlevsellik sunan üçüncü taraf yazılım paketlerini indirir ve yükler.
Not: Bu komutu komut satırında herhangi bir yerden çalıştırmak için, Python'un PATH'e eklenmiş olması gerekir. Python 3+ için, güncellenmiş pip sürümü olduğu için pip3 kullanılması önerilir.
2. Poppler'ı Yükleyin
Poppler, PDF dosyaları ile çalışmak için ücretsiz ve açık kaynaklı bir kütüphanedir. PDF dosyalarını görüntülemek, içeriği okumak ve PDF dosyaları içindeki içeriği değiştirmek için kullanılır. Genellikle Linux kullanıcıları tarafından kullanılır. Ancak, Windows için en son Poppler sürümünü indirmeniz gerekecek.
Windows için
Windows kullanıcıları en son Poppler sürümünü buradan indirebilir: @oschwartz10612 sürümü. Daha sonra bin/dosyayı PATH Ortam değişkenine eklemeniz gerekecek.
Mac için
Mac kullanıcıları da Poppler yüklemek zorunda kalacak. Brew kullanılarak yüklenebilir:
brew install popplerbrew install popplerLinux için
Çoğu Linux dağıtımı, pdftoppm ve pdftocairo komut satırı yardımcı programları ile birlikte gelir. Bu yardımcı programlar kurulu değilse, poppler-utils yüklemek için paket yöneticisini kullanabilirsiniz.
Platformdan bağımsız (conda kullanarak)
poppleryükleyin:conda install -c conda-forge popplerconda install -c conda-forge popplerSHELLpdf2image'ı yükleyin:
pip install pdf2imagepip install pdf2imageSHELL
Şimdi her şey hazır, PDF'leri görüntülere dönüştürme koduyla başlayalım.
3. PDF Dosyalarını Görüntü Dosyalarına Dönüştürme Kodu
Aşağıdaki kod, giriş PDF dosyasının görüntü dönüşümünü gerçekleştirecektir:
from pdf2image import convert_from_path
# Notify the user that the process is starting
print("Please wait while the file is being loaded.")
file = convert_from_path('file.pdf')
# Iterate over all pages in the PDF file
for i in range(len(file)):
# Update user on progress
print("Progress: " + str(round(i / len(file) * 100)) + "%")
# Save each page as a JPG image file
file[i].save('page' + str(i + 1) + '.jpg', 'JPEG')
# Notify the user that the conversion is successful
print("Conversion Successful")from pdf2image import convert_from_path
# Notify the user that the process is starting
print("Please wait while the file is being loaded.")
file = convert_from_path('file.pdf')
# Iterate over all pages in the PDF file
for i in range(len(file)):
# Update user on progress
print("Progress: " + str(round(i / len(file) * 100)) + "%")
# Save each page as a JPG image file
file[i].save('page' + str(i + 1) + '.jpg', 'JPEG')
# Notify the user that the conversion is successful
print("Conversion Successful")Yukarıdaki kodda, önce dosyayı convert_from_path yöntemiyle açıyoruz. Bu yöntem, belirtilen yolda bulunan dosyayı açar. Ardından, JPG görüntülere dönüştürülmek üzere PDF dosyasının her sayfası üzerinde döngü yapıyoruz. Son olarak, save yöntemi her bir dönüştürülen sayfayı bir JPG resim dosyası olarak kaydetmek için kullanılır. Şimdi programı çalıştırın ve dönüşümün tamamlanmasını bekleyin. Çıktı görüntü dosyaları, programla aynı klasöre kaydedilir.


PyMuPDF Kitaplığı Kullanarak PDF Dosyalarını Görüntülere Dönüştürme
1. PyMuPDF Python Kitaplığını Yükleyin
PyMuPDF, MuPDF'ye yönelik genişletilmiş bir Python bağlamasıdır, bu da hafif bir e-kitap, PDF ve XPS görüntüleyici, render edici ve araç setidir. PDF'yi JPG veya PNG gibi diğer formatlara dönüştürmek için kullanılabilir. PyMuPDF, Python 3.7+ sürümlerinde çalışır.
PyMuPDF paketini yüklemek için Windows komut istemcisi veya Windows PowerShell'ınızı açın ve aşağıdaki pip komutunu kullanın:
pip install pymupdfpip install pymupdfPDF2Image paketi gibi PyMuPDF, herhangi bir ek kütüphane gerektirmez.
2. PDF Dosyalarını Görüntülere Dönüştürme Kodu
Aşağıdaki kod, PyMuPDF'den fitz modülünü ithal edecek, böylece PDF'yi imgelere dönüştürebiliriz:
import fitz # PyMuPDF
# Open the PDF file
doc = fitz.open("file.pdf")
# Iterate over each page in the document
for x in range(len(doc)):
page = doc.load_page(x) # Load a specific page
pix = page.get_pixmap() # Render page to image
output = "output/pdfpage" + str(x + 1) + ".png" # Specify output path
pix.save(output) # Save the image to the output path
# Close the document
doc.close()import fitz # PyMuPDF
# Open the PDF file
doc = fitz.open("file.pdf")
# Iterate over each page in the document
for x in range(len(doc)):
page = doc.load_page(x) # Load a specific page
pix = page.get_pixmap() # Render page to image
output = "output/pdfpage" + str(x + 1) + ".png" # Specify output path
pix.save(output) # Save the image to the output path
# Close the document
doc.close()Yukarıdaki kodda, dosya adı fitz.open yöntemine bir argüman olarak iletilir ve dosya açılır. Ardından tüm belgeyi baştan sona döngüye alıp her sayfayı ayrı ayrı yüklerim. get_pixmap yöntemi, her belge sayfasını görüntü pikseline dönüştürmek için kullanılır ve elde edilen görüntü save yöntemiyle çıktı klasöründe kaydedilir. Son olarak, açılan belge, hafızayı serbest bırakmak için kapatılır.
PDF'yi PNG'ye dönüştürmede PyMuPDF, PDF2Image ile karşılaştırıldığında daha hızlıdır. PNG formatı için sıkıştırma oranı nedeniyle PDF2Image yavaş olabilir. Çıktı, PDF2Image ile aynıdır:

Rendering PDF to Image Conversions in C
IronPDF Kitaplığı
IronPDF, PDF dosyaları oluşturmak, okumak ve değiştirmek için kullanılan bir kütüphanedir. Özelliği, HTML'yi Chromium Motoru yardımıyla PDF'ye dönüştürmede yatmaktadır. Bu özellik, HTML dosyalarını veya URL'leri PDF belgelerine dönüştürmesi gereken geliştiriciler arasında popüler hale getirir. Ayrıca, çeşitli formatlardan PDF dosyalarına dönüştürme sağlar.
Sadece iki satır kod kullanarak bir PDF dosyasını görüntülere dönüştürebilirsiniz. Aşağıdaki kod, PDF dosyalarını farklı görüntü formatlarına dönüştürme yöntemini göstermektedir:
using IronPdf;
var Renderer = new IronPdf.ChromePdfRenderer();
var PDF = Renderer.RenderUrlAsPdf("https://example.com");
PDF.SaveAs("html.pdf");
// Rasterize the PDF
List<string> Images = PDF.RasterizeToImageFiles(ImageType.Png);using IronPdf;
var Renderer = new IronPdf.ChromePdfRenderer();
var PDF = Renderer.RenderUrlAsPdf("https://example.com");
PDF.SaveAs("html.pdf");
// Rasterize the PDF
List<string> Images = PDF.RasterizeToImageFiles(ImageType.Png);Imports IronPdf
Private Renderer = New IronPdf.ChromePdfRenderer()
Private PDF = Renderer.RenderUrlAsPdf("https://example.com")
PDF.SaveAs("html.pdf")
' Rasterize the PDF
Dim Images As List(Of String) = PDF.RasterizeToImageFiles(ImageType.Png)IronPDF'i İndir ve ücretsiz denemeyi deneyin.










