Altbilgi içeriğine atla
PYTHON IçIN IRONPDF KULLANARAK

Python'da Metne PDF Dönüştürme (Eğitim)

Bu makale, en güçlü PDF kütüphanelerinden biri olan IronPDF for Python'u kullanarak, herhangi bir PDF belgesinde mevcut olan metni çıkarmanın nasıl yapılacağını gösterecektir.

2.0 Python Kullanarak PDF'ten Nasıl Metin Çıkarılır?

  1. Python indirme sayfasından en son sürümünü yükleyin
  2. Python için herhangi bir IDE aracını açın
  3. .NET Core runtime yükleyin
  4. IronPDF for Python kütüphanesini yükleyin veya PyPI indirme sayfasından indirin
  5. PDF'ten metni çıkarın

2.1 IronPDF for Python Nedir?

IronPDF kütüphanesini Python diline entegre etmek kolaydır çünkü diğer dillere göre daha dinamik bir dildir ve geliştiricilerin hızlı ve kolay bir şekilde grafik kullanıcı arayüzleri oluşturmalarına olanak tanır. PyQT, wxWidgets, kivy ve birçok ek paket ve kitaplık dahil olmak üzere önceden yüklenmiş birçok araç mevcuttur ve bunların tümü, tam bir GUI'yi hızlı ve güvenli bir şekilde oluşturmak için kullanılabilir.

IronPDF for Python, özellikle web geliştirme için son derece etkili bir kütüphanedir. Bu durumdan kısmen, Django, Flask ve Pyramid gibi birçok Python web geliştirme paradigmasının bulunabilirliği sorumludur. Bu çerçeveler, Reddit, Mozilla ve Spotify dahil olmak üzere birçok web sitesi ve çevrimiçi hizmet tarafından kullanılmıştır.

2.2 IronPDF Özellikleri

  • PDF dosyası, HTML, HTML5, ASP ve PHP web siteleri dahil bir çeşitli kaynaklardan oluşturulabilir. HTML dosyalarının yanı sıra, görüntü dosyalarını PDF'ye dönüştürmek da mümkündür.
  • IronPDF, etkileşimli PDF belgeleri oluşturmanıza, etkileşimli formları doldurup göndermenize, PDF dosyalarını bölmenize ve birleştirmenize, PDF dosyalarındaki metin ve görüntüleri çıkarmanıza, PDF dosyası içindeki belirli kelimeleri aramanıza, PDF sayfalarını görüntülere çevrimlemenize, PDF'yi HTML'ye dönüştürmenize ve PDF dosyalarını yazdırmanıza olanak tanır.
  • IronPDF, PDF dosyalarını açabilir ve bir URL'den yazdırabilir. Ayrıca, kullanıcı ajanlarının HTML giriş formlarının, vekillerin, çerezlerin, HTTP başlıklarının, özel ağ giriş kimlik bilgilerinin, form değişkenlerinin ve kullanıcı ajanlarının arkasına giriş yapmasını sağlar.
  • IronPDF kullanarak belgelerden görüntüler çıkarılabilir.
  • IronPDF ile, üstbilgi ve altbilgi, metin ve resimler, yer işaretleri ve filigranlar ve daha fazlasını belgelere eklemek çok kolaydır.
  • IronPDF kullanarak yeni veya mevcut bir belgenin sayfalarını birleştirmek ve ayırmak mümkündür.
  • Acrobat görüntüleyici kullanmadan belgeleri PDF objelere dönüştürmek mümkündür.
  • Bir PDF belgesi oluşturmak için bir CSS dosyası kullanılabilir.
  • Ortam türü CSS dosyaları kullanılarak belge oluşturulması mümkündür.

2.3 IronPDF Kitaplığı'nı İçe Aktarın

IronPDF'ün kullanılacağı kaynak dosyaların başında aşağıdaki içe aktarma ifadelerini ekleyerek IronPDF'ü içe aktarmak:

from ironpdf import *
from ironpdf import *
PYTHON

2.4 Lisans Anahtarını Ayarlayın (Gerekirse)

IronPDF for Python'u kullanmak ücretsizdir, ancak ücretsiz kullanıcılar için PDF dosyalarını döşenmiş bir arka plan ile filigranlar. IronPDF'ü herhangi bir filigran olmadan PDF'ler oluşturmak için kütüphaneye geçerli bir lisans anahtarı vermeniz gereklidir. Aşağıdaki kod parçası, kütüphaneyi bir lisans anahtarı ile nasıl ayarlayacağınızı gösterir:

# Set the license key for IronPDF
License.LicenseKey = "IRONPDF-LICENSE-KEY-ABCDEFGH"
# Set the license key for IronPDF
License.LicenseKey = "IRONPDF-LICENSE-KEY-ABCDEFGH"
PYTHON

PDF dosyalarını oluşturmadan veya içeriklerini değiştirmeden önce lisans anahtarının yapılandırıldığından emin olun. LicenseKey yöntemi, başka herhangi bir kod satırından önce çağrılmalıdır. Ücretsiz deneme lisans anahtarı almak için lisanslama sayfasını ziyaret edin.

2.5 Günlük Dosyalarını Ayarlayın

"Default" adlı bir metin dosyası, Python betiğinin dizinindeki Custom.log tarafından üretilen günlük mesajlarını saklayabilir. Aşağıdaki kod parçacığı, LogFilePath özelliğini ayarlamak ve günlük dosyası adını ve konumunu özelleştirmek için kullanılabilir:

# Enable debugging and set the log file path and mode
Logger.EnableDebugging = True
Logger.LogFilePath = "Custom.log"
Logger.LoggingMode = Logger.LoggingModes.All
# Enable debugging and set the log file path and mode
Logger.EnableDebugging = True
Logger.LogFilePath = "Custom.log"
Logger.LoggingMode = Logger.LoggingModes.All
PYTHON

3.0 IronPDF ile PDF Metnini Çıkartın

IronPDF for Python kütüphanesi, PDF sayfalarını PDF objelere dönüştürebilir ve taranmış PDF dosyaları dahil, PDF dosyalarından metin çıkarmanıza olanak tanır. İşte IronPDF kullanarak mevcut bir PDF'yi nasıl okuyacağınızı gösteren bir örnek.

İlk yöntem, bir PDF'teki mevcut tüm metni çıkarmaktır; Aşağıda bir kod örneği gösterilmiştir.

from ironpdf import *

# Load existing PDF document
pdf = PdfDocument.FromFile("content.pdf")

# Extract all the text from the entire PDF document
all_text = pdf.ExtractAllText()

# Display the extracted text
print(all_text)
from ironpdf import *

# Load existing PDF document
pdf = PdfDocument.FromFile("content.pdf")

# Extract all the text from the entire PDF document
all_text = pdf.ExtractAllText()

# Display the extracted text
print(all_text)
PYTHON

Yukarıdaki kodda gösterildiği gibi, FromFile yöntemi var olan PDF dosyasını yükleyen ve bu dosyayı PDF-belge nesnelerine dönüştüren bir PDF okuyucu nesnesidir. Bu nesne, PDF sayfalarında mevcut olan metin ve görüntüleri okumak için kullanılabilir. Nesne, PDF dosyasının tamamındaki tüm metni çeken ve işlenebilecek bir dize içinde tutan ExtractAllText adlı bir yöntem sağlar. Ardından metni görüntülemek için print fonksiyonunu kullanın.

Python'da PDF'yi Metne Dönüştürme (Eğitim), Şekil 1: Metni Görüntüleme Metnin Görüntülenmesi

Aşağıda kod örneği olan ikinci yöntem, bir PDF dosyasından sayfa sayfa metin çıkarmak için kullanılabilir.

from ironpdf import *

# Load existing PDF document
pdf = PdfDocument.FromFile("content.pdf")

# Extract text from a specific page in the document
page_text = pdf.ExtractTextFromPage(1)

# Display the extracted text from the specified page
print(page_text)
from ironpdf import *

# Load existing PDF document
pdf = PdfDocument.FromFile("content.pdf")

# Extract text from a specific page in the document
page_text = pdf.ExtractTextFromPage(1)

# Display the extracted text from the specified page
print(page_text)
PYTHON

FromFile yöntemi, mevcut bir dosyadan PDF dosyasını yüklemek ve onu bir PDF dosya nesnesine dönüştürmek için kullanılır, yukarıdaki kodda gösterildiği gibi. PDF sayfa nesnesi üzerinde ExtractTextFromPage adlı bir yöntem, bir PDF dosyasındaki bir sayfanın tüm metnini alır. Belirli bir sayfadan metin çıkarmak için sayfa numarası bir parametre olarak sağlanmalıdır. Sonra, metni çıkardıktan sonra, işlenebilecek bilgileri tutmak için page_text kullanılabilir.

Daha fazla orneğe göz atın ve bir PDF'den metin çıkartın.

4.0 Sonuç

IronPDF kutuphanesi, aksine, potansiyel riskleri azaltmak icin guclu guvenlik onlemleri sunar. Herhangi bir tarayıcıya özelleştirilmiş değildir ve yaygın olarak kullanılan tüm tarayıcılarla çalısır. IronPDF, programcıların sadece birkaç satır kodla PDF dosyalarını kolaylıkla oluşturmasını ve okumasını sağlar. IronPDF kutuphanesi, farklı geliştiricilerin ihtiyaçlarını karşılamak için satın alınabilir ek geliştirme lisanslarının yanı sıra ücretsiz bir geliştirici lisansı da içeren bir dizi lisans seçeneği sunar.

IronPDF, süresiz bir lisans, 30 günlük para iade garantisi, bir yıl yazılım desteği ve güncelleme seçeneklerini içerir. İlk satın alımdan sonra ek bir masraf yoktur. Bu lisanslar geliştirme, hazırlık ve üretim ortamlarında kullanılabilir. Ürün lisanslaması hakkında daha fazla bilgi edinin.

Yazılım ürününü indirin.

Sıkça Sorulan Sorular

Bir PDF'yi Python'da metne nasıl dönüştürebilirim?

IronPDF'nin PdfDocument.FromFile yöntemini kullanarak PDF'nizi yükleyebilir ve ardından ExtractAllText veya ExtractTextFromPage yöntemlerini kullanarak gerekli metni çıkarabilirsiniz.

Python'da bir PDF kütüphanesi kullanmak için hangi kurulum gereklidir?

IronPDF'yi kullanmak için Python ve bir IDE'nin yüklü olması, ayrıca .NET Core çalışma zamanına sahip olmanız gerekir. IronPDF, PyPI indirme sayfasından yüklenebilir.

Python kullanarak bir PDF'den belirli bir sayfadan metin çıkarabilir miyim?

Evet, IronPDF ile sayfa numarasını bir parametre olarak sağlayarak belirli bir sayfadan metin çıkarmak için ExtractTextFromPage yöntemini kullanabilirsiniz.

Python'da bir PDF kütüphanesi kullanmak için bedava seçenekler var mı?

IronPDF for Python, PDF’lere filigran ekleyen ücretsiz bir sürüm sunar. Filigranları kaldırmak ve tam özellikleri açmak için bir lisans anahtarı gereklidir.

Django veya Flask gibi web çerçeveleriyle PDF kütüphanesi nasıl entegre edilir?

IronPDF, projelerinizde PDF oluşturmaya ve manipülasyonuna olanak tanıyan Django ve Flask gibi web çerçeveleriyle sorunsuz bir şekilde entegre olur.

Bir Python PDF kütüphanesinde hangi özelliklere bakmalıyım?

HTML ve görüntülerden PDF oluşturmaya, metin çıkarmaya, formlara doldurmaya, PDF’leri birleştirme ve ayırma gibi işlemleri destekleyen kapsamlı bir PDF kitaplık IronPDF, yer imi ve filigran ekleme gibi özellikler sunmalıdır.

Python'da bir PDF kütüphanesi için lisans anahtarını nasıl ayarlarım?

IronPDF için, lisansınızı kaydettirmek ve filigranları kaldırmak için License.LicenseKey yöntemini kullanarak lisans anahtarını ayarlayın ve başka herhangi bir kodu çalıştırmadan önce kayıt yapın.

Python PDF kütüphanesi web sayfalarından PDF oluşturmayı destekliyor mu?

IronPDF, HTML, HTML5 ve ASP veya PHP ile oluşturulmuş web sayfalarından PDF oluşturabilir, bu da onu web tabanlı PDF oluşturma için çok yönlü bir araç yapar.

Python için bir PDF kütüphanesinde hata ayıklamayı nasıl etkinleştirebilirim?

IronPDF'de hata ayıklamayı etkinleştirin ve günlüğü Logger.EnableDebugging olarak true'ya ayarlayarak ve bir log dosyası yolu tanımlayarak sağlayın.

Python PDF kütüphanesinin güvenlik özellikleri nelerdir?

IronPDF, Python'da güvenli PDF manipülasyonu arayan geliştiriciler için güvenilir bir çözüm sunarak güvenliği ve tarayıcılar arası uyumluluğu garanti eder.

Curtis Chau
Teknik Yazar

Curtis Chau, Bilgisayar Bilimleri alanında lisans derecesine sahiptir (Carleton Üniversitesi) ve Node.js, TypeScript, JavaScript ve React konularında uzmanlaşmış ön uç geliştirme üzerine uzmanlaşmıştır. Kullanıcı dostu ve estetik açıdan hoş arayüzler tasarlamaya tutkuyla bağlı olan Curtis, modern çerç...

Daha Fazlasını Oku

Iron Destek Ekibi

Haftanın 5 günü, 24 saat çevrimiçiyiz.
Sohbet
E-posta
Beni Ara