C# PDF'den Metin Çıkarma (Kod Örneği)
Bu makale, .NET geliştiricilerinin PDF dosyalarını daha verimli erişim için TXT formatına dönüştürme sürecini ana hatlarıyla belirtir.
PDF'yi Metin Dosyasına Dönüştürme Nasıl Yapılır C# ile
- PDF Metin C# kutuphanesini İndir
- Visual Studio'da Yeni Proje Oluştur
- Kutuphaneyi Projenize Kurun
- PdfDocument.FromFile fonksiyonu kullanarak PDF belgesini açın
- Çıkarılan metni Görüntüle
Eğitimde Ele Alınan Konular
- IronPDF
- Programlı Olarak PDF Dosyaları Oluşturma Adımları
- Adım 1: Bir C# Projesi Oluşturun
- Adım 2: IronPDF Kutuphanesini Kurun
- Yöntem 1: NuGet Paket Yöneticisi
- Yöntem 2: NuGet Paket Yöneticisi Konsolu
- Yöntem 3: DLL Dosyasını Kullanarak
- Adım 3: IronPDF Namespace Ekle
- Adım 4: PDF'yi Metne Dönüştür
- Çıktı
- Sonuç
IronPDF
IronPDF, PDF üretimi için bir .NET kutuphanesidir. Bu, bağımsız bir .NET kutuphanesidir ve harici DLL'lere veya diğer araçlara bağlı değildir. IronPDF, PDF belgeleri ile çalışmak için gereken tüm işlevselliği sunan C# ve .NET ile yazılmış olan platformlar arası bir kutuphanedir. Belge işleme, form düzenleme, metin çıkarma, dosya şifreleme gibi özellikler içerir. Bu işlemlerin tümü, Windows Forms, WPF, ASP.NET MVC gibi çeşitli platformlarda geniş ölçüde test edilmiş sezgisel bir API aracılığıyla gerçekleştirilebilir.
IronPDF'un mevcut sürümü bu özelliklere kolay erişim sağlar:
- PDF üretimi
- PDF şifreleme
- Şablonlar ve doğrulama mantığıyla PDF form alanları
- PDF'lerden (OCR) Metin çıkarımı
- Doldurulabilir formlar
Yalnızca-okuma erişimi belge iç yapısına (görüntüleme, gezinme, açıklamalar):
metaveri ve belge özelliklerine (başlık, anahtar kelimeler, yazar, konu): erişim.
IronPDF ayrıca HTML belgelerini tamamen biçimlendirilmiş PDF dosyalarına dönüştürme ile ilgili bazı ek yardımcı sınıflar içerir. IronPDF, PDF'yi bir metin dosyasına dönüştürmek için çok basit API'ler sağlar.
Hadi, IronPDF kutuphanesini kullanarak bir PDF belgesini Metin dosyasına nasıl dönüştüreceğimizi öğrenmekle başlayalım.
PDF Belgesini Metin Dosyasına Dönüştürme Adımları
İlk adım, Visual Studio'da bir C# projesi oluşturmaktır. İhtiyaçlarınıza göre herhangi bir C# Uygulama şablonu seçebilirsiniz. Bu eğitimin sadelik amacı için Konsol Uygulaması şablonu kullanılacaktır. Zaten mevcut olan bir C# projesini PDF'yi TXT dosyalarına dönüştürme için kullanabilirsiniz.
Adım 1: Bir C# Projesi Oluşturun
Visual Studio'da bir C# projesi oluşturun veya mevcut bir projeyi açın. En yeni Visual Studio sürümü sorunsuz çalışmak için önerilir. Visual Studio'da bir C# Projesi oluşturmak için verilen adımları izleyin.
- Visual Studio'yu açın.
- C# Konsol Uygulama şablonunu seçin veya mevcut bir projeyi açın.
- Projeye uygun bir ad verin.
- .NET Framework surumu 6.0'i secin. Bu, .NET'in en yeni ve en stabil framework'udur, ancak ihtiyaçlariniza gore baska bir .NET Framework'u de secebilirsiniz.
Adim 2: IronPDF Kutuphanesini Kurun
IronPDF ayni zamanda geliştirme surecini hizlandiran ve kafa karisikligini azaltan kolay bir kuruluma sahiptir. IronPDF kutuphanesi, kurulumu icin bircok yöntem sunar:
- NuGet Paket Yonetici kullanarak
- NuGet Paket Yonetici Konsolu kullanarak
- DLL Dosyasi ile
Yöntem 1: NuGet Paket Yonetici
NuGet Paket Yoneticisi'ni kullanmak icin, Paket Yonetici Sekmesi'ni acmak icin verilen adimlari izleyin.
C# projenizi acin ve Tools > NuGet Package Manager > Manage NuGet Packages for the solution uzerine tiklayin.
NuGet Paket Yöneticisi'ne gitme
- Simdi Goz at sekmesine gidin ve IronPDF arayin.
- Arama sonuclarindan IronPDF'yi secin ve Install uzerine tiklayin. Bu, IronPDF kutuphanesini projede kullanilmak üzere yukleyecektir.
NuGet Paket Yoneticisi arama sonucundan IronPdf paketi
Yöntem 2: NuGet Paket Yonetici Konsolu
IronPDF kutuphanesinin Package Manager Console ile kurulumu en kolay yöntemdir. Bu basit adimlari takip edin:
- Package Manager Console'u acin.
- Konsolda asagidaki satiri yazin ve enter'e basin. Bu, IronPDF kutuphanesini hemen yukleyecektir.
Install-Package IronPdf
NuGet Paket Yonetici Konsolu UI'de gösterilen kurulum ilerlemesi
Yöntem 3: DLL Dosyasi Kullanarak
IronPDF DLL dosyasini Iron Software websitesinden indirebilirsiniz. Indirme tamamlandiktan sonra, projenizde referans olarak kullanin.
Daha ayrintili kurulum kılavuzu icin IronPDF kurulumu kılavuzunu ziyaret edin.
IronPDF kutuphanesinin kurulumu simdi tamamlandi. Asagidaki adimlar, bir PDF dosyasini metin dosyasina nasıl dönüştüreceginizi anlatacaktir.
Adim 3: IronPDF Namespace Ekleme
IronPDF'u kullanmak icin, her kod dosyasina IronPDF namespace eklenmesi gereklidir. Her ilgili kod dosyasinin en ustunde asagidaki kod satirini yazin. Bu, programinizda IronPDF özelliklerini kullanmanizi saglayacaktir.
using IronPdf;
using IronPdf;
Imports IronPdf
Adim 4: PDF Belgesini Metin Dosyasina Dönüştürun
Simdi PDF dosyasini bir TXT dosyasina dönüştürmemiz veya sadece metni cikartmamiz gerekiyor. Bu yuzden, kod dosyaniza asagidaki örnek kodu yazin:
using IronPdf;
using System;
class Program
{
static void Main()
{
// Extracting image and text content from PDF Document
// Open a 128-bit encrypted PDF
using PdfDocument pdf = PdfDocument.FromFile("encrypted.pdf", "password");
// Get all text to put in a search index
string allText = pdf.ExtractAllText();
// Display the extracted text in the console
Console.WriteLine(allText);
}
}
using IronPdf;
using System;
class Program
{
static void Main()
{
// Extracting image and text content from PDF Document
// Open a 128-bit encrypted PDF
using PdfDocument pdf = PdfDocument.FromFile("encrypted.pdf", "password");
// Get all text to put in a search index
string allText = pdf.ExtractAllText();
// Display the extracted text in the console
Console.WriteLine(allText);
}
}
Imports IronPdf
Imports System
Friend Class Program
Shared Sub Main()
' Extracting image and text content from PDF Document
' Open a 128-bit encrypted PDF
Using pdf As PdfDocument = PdfDocument.FromFile("encrypted.pdf", "password")
' Get all text to put in a search index
Dim allText As String = pdf.ExtractAllText()
' Display the extracted text in the console
Console.WriteLine(allText)
End Using
End Sub
End Class
Öncelikle, FromFile function kullanarak PdfDocument class üzerinden PDF belgesini açın. Parametrelerde, dosya adi ve sifreyi (varsa) gecin. Sonrasında, ExtractAllText function kullanarak PDF dosyasındaki tüm metni çıkarın ve allText adlı bir değişkene kaydedin. Ardindan, konsolda cikartilan metin göstertin.
Çıktı
PDF belgesinden cikartilan metin
Bu, IronPDF tarafindan cikartilan cikis metnidir. PDF dosyasinda gorulenle ayni metindir ve IronPDF'nin dogruluk orani çok yuksek oldugunu gösterir.
Sonuç
Bu yazi, IronPDF .NET PDF kutuphanesini kullanarak PDF dosyalarindan metin cikartmanin nasıl kolay oldugunu gösterir. Bu, sadece birkac satir kod yazarak ve yuksek bir dogruluk oraniyla gerceklestirildi. Ayrica, IronPDF ayni zamanda HTML'den PDF'ye dönüştürme, PDF formatlama araclari ve bircok temel PDF ozelligi gibi PDF duzenleme icin gerekli bircok faydali ozellige sahiptir. IronPDF ayrica Adobe Acrobat'a olan bagimliligi ortadan kaldirir.
IronPDF geliştirme amacli ucretsizdir ve ayni zamanda uretim testi icin bir ücretsiz deneme sunar. IronPDF ihtiyaçlariniza gore alabileceginiz çeşitli fiyat planlari sunar. IronPDF'nin fiyati rakiplerine gore oldukca dusuktur. Bireylerden buyuk şirketlere kadar fiyatlandirma çeşitliligi, etkileyici bir performansla cakisan cekici bir satin alma haline getiriyor.
Iron Software'in Suite fiyat planlari
Ayrica, Iron Software iki paket fiyati karsiliginda bes Iron Software paketi sunan bir suite sunuyor. Daha fazla bilgi icin Iron Software lisans bilgilerini ziyaret edin.
Sıkça Sorulan Sorular
Bir C# uygulamasında PDF belgesini metne nasıl dönüştürebilirim?
IronPDF'yi bir PDF belgesini C# uygulamasında metne dönüştürmek için kullanabilirsiniz, PDF'yi yüklemek için PdfDocument.FromFile yöntemini kullanarak ve ardından metin içeriğini almak için ExtractAllText yöntemini çağırarak.
Bir Görsel Studio C# projesinde IronPDF nasıl kurulur?
Bir Görsel Studio C# projesinde IronPDF kurmak için, yeni bir proje oluşturmanız, IronPDF'yi NuGet Paket Yöneticisi, Paket Yöneticisi Konsolu aracılığıyla veya DLL dosyasını elle ekleyerek yüklemeniz ve ardından kod dosyalarınıza IronPDF ad alanını dahil etmeniz gerekir.
IronPDF şifreli PDF dosyalarını işleyebilir mi?
Evet, IronPDF şifreli PDF dosyalarını açıp işleyebilir ve onlardan metin içeriği çıkarabilir.
PDF'yi TXT formatına dönüştürmenin faydaları nelerdir?
IronPDF kullanarak PDF'yi TXT formatına dönüştürmek, daha iyi erişilebilirlik ve metin verilerinin daha kolay manipülasyonuna olanak tanır, bu da metin işleme veya arama gerektiren uygulamalar için faydalıdır.
IronPDF, PDF'lerden metin ayıklamada nasıl doğruluk sağlar?
IronPDF, PDF'de göründüğü şekliyle metnin bütünlüğünü koruyarak metin ayıklamada yüksek doğruluk sağlar, bu da daha da işleme için güvenilir çıktı sağlar.
IronPDF kütüphanesini test etmek için bir ücretsiz deneme var mı?
Evet, IronPDF, geliştirme ve test amacıyla, özelliklerini ve yeteneklerini satın almadan önce değerlendirmenizi sağlayacak bir ücretsiz deneme sunar.
IronPDF'yi çapraz platform geliştirme için uygun bir seçim yapan nedir?
IronPDF, C# ve .NET ile yazılmıştır, bu da onu ek dış araçlara ihtiyaç duymadan çapraz platform geliştirme için uygun bir seçim yapar.
IronPDF yarımcı metin ayıklama dışında başka amaçlarla kullanılabilir mi?
Evet, IronPDF, metin ayıklamanın ötesinde PDF oluşturma, belge şifreleme, form işleme ve HTML'den PDF dönüşümü gibi çeşitli özellikler sunar.
IronPDF, PDF'den metine dönüşüm için .NET 10'u ne kadar iyi destekliyor?
IronPDF, ihtiyaç duyulan özel bir yapılandırma olmadan .NET 10 ile kutudan çıktığı gibi uyumludur. .NET 10'da PDF'leri metne dönüştürmek için IronPDF'yi kullandığınızda, daha hızlı ekstraksiyon ve daha ince hafıza kullanımı sağlayan azaltılmış yığın tahsisi gibi performans iyileştirmelerinden faydalanırsınız.
IronPDF ile .NET 10'u kullanırken hangi platformlar ve proje türleri desteklenmektedir?
IronPDF for .NET 10, Windows (10+, Server), macOS, Linux ve kapsayıcı ortamlar dahil olmak üzere geniş bir platform yelpazesini destekler. Console, Masaüstü (WPF, MAUI), Web (MVC, Blazor) gibi proje türleri ile çalışır ve C#, F#, VB.NET dillerini destekler.




