Python'da PDF Dosyalarını Okuma
PDF'ler veya Taşınabilir Belge Biçimi dosyaları, belgeleri paylaşmak için evrensel bir standart haline gelmiştir. Bir belgenin düzenini ve biçimlendirmesini koruma yetenekleriyle geniş çapta kullanılmaktadır. Ancak, Python gibi programlama dilleriyle PDF dosyaları ile çalışmak biraz zorlu olabilir. Bu makale, PDF belgeleriyle çeşitli işlemler yapmamıza olanak tanıyan bir Python PDF kütüphanesi olan IronPDF'i tanıtmaktadır.
IronPDF for Python PDF Kitaplığı
IronPDF, PDF format dosyaları ile çalışmayı kolaylaştıran gelişmiş bir Python PDF kutuphanesi dir. Çeşitli PDF işlemleri için kullanımı kolay bir API sunar. PDF dosyalarını okuyabilir ve yazabilir, PDF dosyalarını farklı formatlara dönüştürebilir, birden fazla PDF dosyasını birleştirebilir ve çok daha fazlasını yapabilirsiniz. Sayfa nesneleriyle de ilgilenebilir, PDF dosyasındaki tüm sayfalardan metin çıkarabilir ve PDF sayfalarını döndürebilir, diğer işlevler arasında.
Python'da PDF Dosyalarını Okuma
- Pip kullanarak Python PDF Kütüphanesini yükleyin.
- Python PDF Kütüphanesini Python Script'ine ithal edin.
- PDFReader Python Kütüphanesi için Lisans Anahtarını uygulayın.
- Belge yolunu sağlayarak herhangi bir PDF Belgesini yükleyin.
- Python Konsolunda PDF İçeriğini okuyun.
IronPDF kullanarak PDF Dosyası Okuma
IronPDF kullanarak bir PDF dosyasını okumak birkaç adımdan oluşur. Başlamak için basit bir kılavuz:
Adım 1 Visual Studio'da sanal ortam oluşturma
Python ile çalışırken, sanal ortam olarak bilinen izole bir ortam oluşturmak çok önemlidir. Bu ortam, üzerinde çalıştığınız projeye özgü bağımlılıkları diğer projelere müdahale etmeden yönetmenizi sağlar. Visual Studio Code gibi bir Entegre Geliştirme Ortamında (IDE) sanal ortam oluşturmak daha da kolay hale gelir. Bunu yapmak için aşağıdaki adımları izleyin:
Visual Studio Code'da klasörü açın. Komut Paletini açmak için Ctrl+Shift+P tuşlarına basın. Komut Paletinde "Python: Çevre Oluştur" arayın.

İlk seçeneği seçin ve ardından ortam türü olarak "Venv" seçin.

Daha sonra Python yorumlayıcısını seçin ve sanal ortamın oluşturulmaya başladığını göreceksiniz.

Artık projenizin bağımlılıklarının bu ortam içinde sınırlı kaldığından emin olarak Python scriptleriniz için izole edilmiş çalışma alanınız hazır.
![]()
Adım 2 Python kütuphanesi için IronPDF yükleyin
Sanal ortam kurulduğunda, Python kütuphanesi için IronPDF yüklemeye hazırsınız. Python paket yükleyicisi 'pip' kullanarak yükleyebilirsiniz:
pip install ironpdfpip install ironpdfAdım 3 .NET 6.0 kurun
IronPDF için Python'un .NET 6.0 SDK'sının yüklü olması gerekiyor.
Microsoft .NET Web Sitesinden .NET 6.0 SDK'sını indirip yükleyin.
Adım 4 IronPDF'i ithal edin
IronPDF'i başarılı bir şekilde yükledikten sonra, bir sonraki adım onu Python scriptinize ithal etmektir. Kütüphaneyi ithal etmek, scriptinizde kullanılmak üzere tüm fonksiyonlarını ve metodlarını ulaşılabilir hale getirir. IronPDF'i aşağıdaki kod satırı ile ithal edebilirsiniz:
from ironpdf import *from ironpdf import *Bu kod satırı, IronPDF kutuphanesinde bulunan tüm modülleri, fonksiyonları ve sınıfları scriptinize ithal eder.
Adım 5 Lisans Anahtarını Uygula
IronPDF kutuphanesinin tüm yeteneklerini tamamen açmak için bir lisans anahtarı uygulamanız gerekir. Lisans anahtarını uygulamak, anahtarı LicenseKey sınıfının License özelliğine atamak kadar basittir. Bunu nasıl yapacağınız şu şekildedir:
License.LicenseKey = "License-Key-Here"License.LicenseKey = "License-Key-Here""License-Key-Here" yerine gerçek IronPDF lisans anahtarınızı yerleştirin. Lisans anahtarı yerinde olduğunda, Python scriptlerinizde IronPDF kutuphanesinin tüm potansiyelini kullanmaya hazırsınız.
Adım 6 Günlük Yolunu Ayarla
Sonraki adım, IronPDF işlemleri için günlük tutmayı ayarlamaktır. Özel bir günlük yolu ayarlayarak, kütüphanenin oluşturduğu çalışma zamanı günlüklerini depolayabilir ve yürütme sırasında meydana gelebilecek sorunları hata ayıklamak ve teşhis etmek için kullanabilirsiniz. Bunu ayarlamak için şu şekilde yapabilirsiniz:
# Enable debugging mode for detailed logs
Logger.EnableDebugging = True
# Set the path for the log file
Logger.LogFilePath = "Custom.log"
# Set logging mode to capture all log types
Logger.LoggingMode = Logger.LoggingModes.All# Enable debugging mode for detailed logs
Logger.EnableDebugging = True
# Set the path for the log file
Logger.LogFilePath = "Custom.log"
# Set logging mode to capture all log types
Logger.LoggingMode = Logger.LoggingModes.AllBu kod parçasında, Logger.EnableDebugging = True hata ayıklamayı açar, Logger.LogFilePath = "Custom.log" çıkış log dosyasını 'Custom.log' olarak ayarlar ve Logger.LoggingMode = Logger.LoggingModes.All tüm türlerdeki log bilgilerin kaydedildiğinden emin olur.
Adım 7 PDF belgesi yükleyin
IronPDF ile PDF belgesi yüklemek bir metod çağırmak kadar kolaydır. PdfDocument.FromFile yöntemi, verilen yoldan PDF belgesini bir PDF dosya nesnesine yükler. Sadece PDF dosyasının yolunu bir dize olarak sağlamanız yeterlidir:
pdf = PdfDocument.FromFile("PDF B.pdf")pdf = PdfDocument.FromFile("PDF B.pdf")Bu kodda, pdf belirtilen PDF dosyasını temsil eden bir PdfDocument nesnesi olur.
Adım 8 PDF Dosyası içeriğini okuma
IronPDF, PDF belgesinden metin içeriği çıkarma konusunda yardımcı olan ExtractAllText() adında bir yöntem sunar. Bu, bir PDF dosyasının içeriğini okuyup analiz etmeniz gerektiğinde özellikle kullanışlıdır:
all_text = pdf.ExtractAllText() # Extracts all text from the PDF document
print(all_text) # Prints the extracted text to the consoleall_text = pdf.ExtractAllText() # Extracts all text from the PDF document
print(all_text) # Prints the extracted text to the consoleBu örnekte, all_text, pdf nesnesinden tüm PDF dosyası metnini tutacaktır. Konsolda PDF içeriği okuyabileceksiniz.

Adım 9 İkinci PDF Dosyasını yükleyin
İlk PDF belgesini yüklediğiniz gibi, ikinci bir PDF belgesi de yükleyebilirsiniz. Bu özellik, birden fazla PDF dosyasını manipüle etmek istediğinizde yardımcı olur:
pdf_2 = PdfDocument.FromFile("PDF A.pdf")pdf_2 = PdfDocument.FromFile("PDF A.pdf")Bu kodda, pdf_2 ikinci PDF dosyasını temsil eden başka bir PdfDocument nesnesidir.
Adım 10 Her iki dosyayı birleştirin
IronPDF'un güçlü işlevlerinden biri, birden fazla PDF dosyasını tek bir yeni PDF dosyasında birleştirmektir. PdfDocument.Merge yöntemini kullanarak iki veya daha fazla PDF belgesini kolayca birleştirebilirsiniz:
merged = PdfDocument.Merge(pdf, pdf_2) # Merges pdf and pdf_2 documents
merged.SaveAs("Merged.pdf") # Saves the merged document as 'Merged.pdf'merged = PdfDocument.Merge(pdf, pdf_2) # Merges pdf and pdf_2 documents
merged.SaveAs("Merged.pdf") # Saves the merged document as 'Merged.pdf'Bu örnekte, merged, pdf ve pdf_2 birleştirmenin sonucu olan yeni bir PdfDocument nesnesidir. SaveAs yöntemi daha sonra bu birleştirilmiş belgeyi 'Merged.pdf' adıyla kaydeder.

Adım 11 İlk PDF'yi Ayır
IronPDF ayrıca bir PDF belgesini ayırmanıza ve belirli sayfaları yeni PDF dosyaları olarak çıkarmanıza olanak tanır. Bu, CopyPage yöntemi kullanılarak yapılır:
page1doc = pdf.CopyPage(0) # Copies the first page of the pdf document
page1doc.SaveAs("Split1.pdf") # Saves the copied page as a new document 'Split1.pdf'page1doc = pdf.CopyPage(0) # Copies the first page of the pdf document
page1doc.SaveAs("Split1.pdf") # Saves the copied page as a new document 'Split1.pdf'Burada, page1doc, pdf belgesinin ilk sayfasını içeren yeni bir PdfDocument nesnesidir. Bu sayfa, sonra 'Split1.pdf' adıyla bir çıkış PDF olarak kaydedilir.

Adım 12 Filigran Uygula
Filigranlama, IronPDF'in sunduğu diğer etkileyici bir özelliktir. PDF belgenizi istediğiniz metin veya resimle filigranlayabilirsiniz. ApplyWatermark yöntemi, pdf nesnesi tarafından temsil edilen PDF'ye filigran eklemek için kullanılır.
pdf.ApplyWatermark("<h2 style='color:red'>SAMPLE</h2>", 30, VerticalAlignment.Middle, HorizontalAlignment.Center)
pdf.SaveAs("Watermarked.pdf")pdf.ApplyWatermark("<h2 style='color:red'>SAMPLE</h2>", 30, VerticalAlignment.Middle, HorizontalAlignment.Center)
pdf.SaveAs("Watermarked.pdf")Bu kod parçasında, ApplyWatermark PDF'nin ortasına 'SAMPLE' metniyle kırmızı bir filigran uygular. Ardından, SaveAs filigran eklenmiş belgeyi 'Watermarked.pdf' olarak kaydeder.
IronPDF Uyumluluğu
IronPDF, geniş bir Python sürümleri yelpazesiyle uyumlu olan çok yönlü bir Python kütüphanesidir. Python 3.6'dan itibaren tüm modern Python sürümlerini destekler. IronPDF, tek bir işletim sistemi ile sınırlı değildir. Platform bağımsızdır ve dolayısıyla çeşitli işletim sistemlerinde kullanılabilir. Windows, Mac ya da Linux olsun, IronPDF bu platformlar arasında sorunsuz çalışır. Bu çok platformlu uyumluluk, IronPDF'i geliştiricilerin işletim sistemi tercihinden bağımsız olarak tercih edilen bir seçenek haline getirir.
Sonuç
Sonuç olarak, IronPDF, PDF belgeleriyle başa çıkmayı basitleştiren mükemmel bir Python kütüphanesidir. Birden fazla PDF'yi birleştirmeniz, metin çıkarmanız, PDF dosyalarını bölmeniz veya filigran uygulamanız gereksin, IronPDF size yardımcı olacaktır. Birden fazla platformla uyumluluğu ve kullanımı kolay olması, PDF belgeleriyle çalışan herhangi bir geliştirici için değerli bir araç haline getirir.
IronPDF ücretsiz bir deneme sunar. Bu deneme süresi, işlevselliklerini denemeniz ve özel ihtiyaçlarınıza uygunluğunu değerlendirmeniz için size bolca fırsat sunar. Bunu denedikten sonra, $799'den başlayarak bir lisans satın alabilirsiniz.










