Altbilgi içeriğine atla
PYTHON PDF ARAçLARı

Python'da PDF Dosyalarını Okuma

PDF'ler veya Taşınabilir Belge Biçimi dosyaları, belgeleri paylaşmak için evrensel bir standart haline gelmiştir. Bir belgenin düzenini ve biçimlendirmesini koruma yetenekleriyle geniş çapta kullanılmaktadır. Ancak, Python gibi programlama dilleriyle PDF dosyaları ile çalışmak biraz zorlu olabilir. Bu makale, PDF belgeleriyle çeşitli işlemler yapmamıza olanak tanıyan bir Python PDF kütüphanesi olan IronPDF'i tanıtmaktadır.

IronPDF for Python PDF Kitaplığı

IronPDF, PDF format dosyaları ile çalışmayı kolaylaştıran gelişmiş bir Python PDF kutuphanesi dir. Çeşitli PDF işlemleri için kullanımı kolay bir API sunar. PDF dosyalarını okuyabilir ve yazabilir, PDF dosyalarını farklı formatlara dönüştürebilir, birden fazla PDF dosyasını birleştirebilir ve çok daha fazlasını yapabilirsiniz. Sayfa nesneleriyle de ilgilenebilir, PDF dosyasındaki tüm sayfalardan metin çıkarabilir ve PDF sayfalarını döndürebilir, diğer işlevler arasında.

Python'da PDF Dosyalarını Okuma

  1. Pip kullanarak Python PDF Kütüphanesini yükleyin.
  2. Python PDF Kütüphanesini Python Script'ine ithal edin.
  3. PDFReader Python Kütüphanesi için Lisans Anahtarını uygulayın.
  4. Belge yolunu sağlayarak herhangi bir PDF Belgesini yükleyin.
  5. Python Konsolunda PDF İçeriğini okuyun.

IronPDF kullanarak PDF Dosyası Okuma

IronPDF kullanarak bir PDF dosyasını okumak birkaç adımdan oluşur. Başlamak için basit bir kılavuz:

Adım 1 Visual Studio'da sanal ortam oluşturma

Python ile çalışırken, sanal ortam olarak bilinen izole bir ortam oluşturmak çok önemlidir. Bu ortam, üzerinde çalıştığınız projeye özgü bağımlılıkları diğer projelere müdahale etmeden yönetmenizi sağlar. Visual Studio Code gibi bir Entegre Geliştirme Ortamında (IDE) sanal ortam oluşturmak daha da kolay hale gelir. Bunu yapmak için aşağıdaki adımları izleyin:

  1. Visual Studio Code'da klasörü açın. Komut Paletini açmak için Ctrl+Shift+P tuşlarına basın. Komut Paletinde "Python: Çevre Oluştur" arayın.

    Python'da PDF Dosyalarını Okuma: Şekil 1

  2. İlk seçeneği seçin ve ardından ortam türü olarak "Venv" seçin.

    Python'da PDF Dosyalarını Okuma: Şekil 2

  3. Daha sonra Python yorumlayıcısını seçin ve sanal ortamın oluşturulmaya başladığını göreceksiniz.

    Python'da PDF Dosyalarını Okuma: Şekil 3

Artık projenizin bağımlılıklarının bu ortam içinde sınırlı kaldığından emin olarak Python scriptleriniz için izole edilmiş çalışma alanınız hazır.

Python'da PDF Dosyalarını Okuma: Şekil 4

Adım 2 Python kütuphanesi için IronPDF yükleyin

Sanal ortam kurulduğunda, Python kütuphanesi için IronPDF yüklemeye hazırsınız. Python paket yükleyicisi 'pip' kullanarak yükleyebilirsiniz:

pip install ironpdf
pip install ironpdf
SHELL

Adım 3 .NET 6.0 kurun

IronPDF için Python'un .NET 6.0 SDK'sının yüklü olması gerekiyor.

Microsoft .NET Web Sitesinden .NET 6.0 SDK'sını indirip yükleyin.

Adım 4 IronPDF'i ithal edin

IronPDF'i başarılı bir şekilde yükledikten sonra, bir sonraki adım onu Python scriptinize ithal etmektir. Kütüphaneyi ithal etmek, scriptinizde kullanılmak üzere tüm fonksiyonlarını ve metodlarını ulaşılabilir hale getirir. IronPDF'i aşağıdaki kod satırı ile ithal edebilirsiniz:

from ironpdf import *
from ironpdf import *
PYTHON

Bu kod satırı, IronPDF kutuphanesinde bulunan tüm modülleri, fonksiyonları ve sınıfları scriptinize ithal eder.

Adım 5 Lisans Anahtarını Uygula

IronPDF kutuphanesinin tüm yeteneklerini tamamen açmak için bir lisans anahtarı uygulamanız gerekir. Lisans anahtarını uygulamak, anahtarı LicenseKey sınıfının License özelliğine atamak kadar basittir. Bunu nasıl yapacağınız şu şekildedir:

License.LicenseKey = "License-Key-Here"
License.LicenseKey = "License-Key-Here"
PYTHON

"License-Key-Here" yerine gerçek IronPDF lisans anahtarınızı yerleştirin. Lisans anahtarı yerinde olduğunda, Python scriptlerinizde IronPDF kutuphanesinin tüm potansiyelini kullanmaya hazırsınız.

Adım 6 Günlük Yolunu Ayarla

Sonraki adım, IronPDF işlemleri için günlük tutmayı ayarlamaktır. Özel bir günlük yolu ayarlayarak, kütüphanenin oluşturduğu çalışma zamanı günlüklerini depolayabilir ve yürütme sırasında meydana gelebilecek sorunları hata ayıklamak ve teşhis etmek için kullanabilirsiniz. Bunu ayarlamak için şu şekilde yapabilirsiniz:

# Enable debugging mode for detailed logs
Logger.EnableDebugging = True
# Set the path for the log file
Logger.LogFilePath = "Custom.log"
# Set logging mode to capture all log types
Logger.LoggingMode = Logger.LoggingModes.All
# Enable debugging mode for detailed logs
Logger.EnableDebugging = True
# Set the path for the log file
Logger.LogFilePath = "Custom.log"
# Set logging mode to capture all log types
Logger.LoggingMode = Logger.LoggingModes.All
PYTHON

Bu kod parçasında, Logger.EnableDebugging = True hata ayıklamayı açar, Logger.LogFilePath = "Custom.log" çıkış log dosyasını 'Custom.log' olarak ayarlar ve Logger.LoggingMode = Logger.LoggingModes.All tüm türlerdeki log bilgilerin kaydedildiğinden emin olur.

Adım 7 PDF belgesi yükleyin

IronPDF ile PDF belgesi yüklemek bir metod çağırmak kadar kolaydır. PdfDocument.FromFile yöntemi, verilen yoldan PDF belgesini bir PDF dosya nesnesine yükler. Sadece PDF dosyasının yolunu bir dize olarak sağlamanız yeterlidir:

pdf = PdfDocument.FromFile("PDF B.pdf")
pdf = PdfDocument.FromFile("PDF B.pdf")
PYTHON

Bu kodda, pdf belirtilen PDF dosyasını temsil eden bir PdfDocument nesnesi olur.

Adım 8 PDF Dosyası içeriğini okuma

IronPDF, PDF belgesinden metin içeriği çıkarma konusunda yardımcı olan ExtractAllText() adında bir yöntem sunar. Bu, bir PDF dosyasının içeriğini okuyup analiz etmeniz gerektiğinde özellikle kullanışlıdır:

all_text = pdf.ExtractAllText()  # Extracts all text from the PDF document
print(all_text)  # Prints the extracted text to the console
all_text = pdf.ExtractAllText()  # Extracts all text from the PDF document
print(all_text)  # Prints the extracted text to the console
PYTHON

Bu örnekte, all_text, pdf nesnesinden tüm PDF dosyası metnini tutacaktır. Konsolda PDF içeriği okuyabileceksiniz.

Python'da PDF Dosyalarını Okuma: Şekil 5

Adım 9 İkinci PDF Dosyasını yükleyin

İlk PDF belgesini yüklediğiniz gibi, ikinci bir PDF belgesi de yükleyebilirsiniz. Bu özellik, birden fazla PDF dosyasını manipüle etmek istediğinizde yardımcı olur:

pdf_2 = PdfDocument.FromFile("PDF A.pdf")
pdf_2 = PdfDocument.FromFile("PDF A.pdf")
PYTHON

Bu kodda, pdf_2 ikinci PDF dosyasını temsil eden başka bir PdfDocument nesnesidir.

Adım 10 Her iki dosyayı birleştirin

IronPDF'un güçlü işlevlerinden biri, birden fazla PDF dosyasını tek bir yeni PDF dosyasında birleştirmektir. PdfDocument.Merge yöntemini kullanarak iki veya daha fazla PDF belgesini kolayca birleştirebilirsiniz:

merged = PdfDocument.Merge(pdf, pdf_2)  # Merges pdf and pdf_2 documents
merged.SaveAs("Merged.pdf")  # Saves the merged document as 'Merged.pdf'
merged = PdfDocument.Merge(pdf, pdf_2)  # Merges pdf and pdf_2 documents
merged.SaveAs("Merged.pdf")  # Saves the merged document as 'Merged.pdf'
PYTHON

Bu örnekte, merged, pdf ve pdf_2 birleştirmenin sonucu olan yeni bir PdfDocument nesnesidir. SaveAs yöntemi daha sonra bu birleştirilmiş belgeyi 'Merged.pdf' adıyla kaydeder.

Python'da PDF Dosyalarını Okuma: Şekil 6

Adım 11 İlk PDF'yi Ayır

IronPDF ayrıca bir PDF belgesini ayırmanıza ve belirli sayfaları yeni PDF dosyaları olarak çıkarmanıza olanak tanır. Bu, CopyPage yöntemi kullanılarak yapılır:

page1doc = pdf.CopyPage(0)  # Copies the first page of the pdf document
page1doc.SaveAs("Split1.pdf")  # Saves the copied page as a new document 'Split1.pdf'
page1doc = pdf.CopyPage(0)  # Copies the first page of the pdf document
page1doc.SaveAs("Split1.pdf")  # Saves the copied page as a new document 'Split1.pdf'
PYTHON

Burada, page1doc, pdf belgesinin ilk sayfasını içeren yeni bir PdfDocument nesnesidir. Bu sayfa, sonra 'Split1.pdf' adıyla bir çıkış PDF olarak kaydedilir.

Python'da PDF Dosyalarını Okuma: Şekil 7

Adım 12 Filigran Uygula

Filigranlama, IronPDF'in sunduğu diğer etkileyici bir özelliktir. PDF belgenizi istediğiniz metin veya resimle filigranlayabilirsiniz. ApplyWatermark yöntemi, pdf nesnesi tarafından temsil edilen PDF'ye filigran eklemek için kullanılır.

pdf.ApplyWatermark("<h2 style='color:red'>SAMPLE</h2>", 30, VerticalAlignment.Middle, HorizontalAlignment.Center)
pdf.SaveAs("Watermarked.pdf")
pdf.ApplyWatermark("<h2 style='color:red'>SAMPLE</h2>", 30, VerticalAlignment.Middle, HorizontalAlignment.Center)
pdf.SaveAs("Watermarked.pdf")
PYTHON

Bu kod parçasında, ApplyWatermark PDF'nin ortasına 'SAMPLE' metniyle kırmızı bir filigran uygular. Ardından, SaveAs filigran eklenmiş belgeyi 'Watermarked.pdf' olarak kaydeder.

IronPDF Uyumluluğu

IronPDF, geniş bir Python sürümleri yelpazesiyle uyumlu olan çok yönlü bir Python kütüphanesidir. Python 3.6'dan itibaren tüm modern Python sürümlerini destekler. IronPDF, tek bir işletim sistemi ile sınırlı değildir. Platform bağımsızdır ve dolayısıyla çeşitli işletim sistemlerinde kullanılabilir. Windows, Mac ya da Linux olsun, IronPDF bu platformlar arasında sorunsuz çalışır. Bu çok platformlu uyumluluk, IronPDF'i geliştiricilerin işletim sistemi tercihinden bağımsız olarak tercih edilen bir seçenek haline getirir.

Sonuç

Sonuç olarak, IronPDF, PDF belgeleriyle başa çıkmayı basitleştiren mükemmel bir Python kütüphanesidir. Birden fazla PDF'yi birleştirmeniz, metin çıkarmanız, PDF dosyalarını bölmeniz veya filigran uygulamanız gereksin, IronPDF size yardımcı olacaktır. Birden fazla platformla uyumluluğu ve kullanımı kolay olması, PDF belgeleriyle çalışan herhangi bir geliştirici için değerli bir araç haline getirir.

IronPDF ücretsiz bir deneme sunar. Bu deneme süresi, işlevselliklerini denemeniz ve özel ihtiyaçlarınıza uygunluğunu değerlendirmeniz için size bolca fırsat sunar. Bunu denedikten sonra, $799'den başlayarak bir lisans satın alabilirsiniz.

Curtis Chau
Teknik Yazar

Curtis Chau, Bilgisayar Bilimleri alanında lisans derecesine sahiptir (Carleton Üniversitesi) ve Node.js, TypeScript, JavaScript ve React konularında uzmanlaşmış ön uç geliştirme üzerine uzmanlaşmıştır. Kullanıcı dostu ve estetik açıdan hoş arayüzler tasarlamaya tutkuyla bağlı olan Curtis, modern çerç...

Daha Fazlasını Oku

Iron Destek Ekibi

Haftanın 5 günü, 24 saat çevrimiçiyiz.
Sohbet
E-posta
Beni Ara