Altbilgi içeriğine atla
IRONPDF KULLANARAK
IronPDF Kullanarak PDF'lerden Metin Çıkarmak

C#'da PDF'den Veri Nasıl Çıkarılır

PDF'lerden veri çıkarma, manuel giriş için harcanan zamanı tasarruf etmek için önemlidir. Bu makale, geliştiricilerin PDF belgelerinden metin ve görüntüleri çıkarmak için IronPDF kütüphanesini nasıl kullanabileceğini açıklar.

IronPDF: C# PDF Kütüphanesi

IronPDF, PDF dosyaları oluşturmak, düzenlemek ve dönüştürmek için kullanılabilen bir .NET kütüphanesidir. Geliştiricilerin uygulamalarında kullanması için kolayca kullanılabilir bir API sağlar. PDF dosyalarını oluşturmak, düzenlemek ve küresel ölçekte dönüştürmek için en popüler kütüphanelerden biridir. IronPDF ile PDF'lere doğrudan ve hızlı bir çözüm oluşturabilirsiniz. Metniniz, her belge için özelleştirilecektir, düzeniniz kolay okuma için ayarlanacak ve grafikleriniz, birlikte verilen .NET programının yardımıyla tasarlanacaktır.

IronPDF kütüphanesi, PDF dosyalarından veri çıkarmak için harika bir özellik sunar. Bu makale, IronPDF kullanarak verileri nasıl çıkaracağımızı inceleyecektir. Öncelikle bir C# Projesi oluşturulmalı veya açılmalıdır. Bir sonraki bölüme geçelim.

Bir C# Projesi Oluşturmak veya Açmak

Bu öğretici, en son sürüm Visual Studio'yu kullanmanızı önerir.

Visual Studio açıldığında, yeni bir C# Projesi oluşturmak için aşağıdaki adımları izleyin. Kullanmak istediğiniz mevcut bir proje varsa, bu sonraki adımları atlayın ve doğrudan bir sonraki bölüme geçin.

  • Visual Studio'yu açın
  • 'Yeni proje oluştur' butonuna tıklayın.

C# dilinde PDF'lerden Veri Çıkartma, Şekil 1: Visual Studio açılış arayüzü Visual Studio açılış kullanıcı arayüzü

  • Şablonlardan "C# Konsol Uygulaması"nı seçin.

C# dilinde PDF'lerden Veri Çıkartma, Şekil 2: Yeni bir proje oluştur Yeni bir proje oluşturun

  • Projeye bir ad verin ve İleri düğmesine tıklayın.
  • Projenizin gereksinimlerine göre bir .NET Framework seçin ve Oluştur düğmesine tıklayın.

C# dilinde PDF'lerden Veri Çıkartma, Şekil 3: .NET Framework seçimi .NET Framework seçimi

Visual Studio şimdi yeni bir C# .NET projesi oluşturacaktır.

IronPDF Kutuphanesini Yükleme

IronPDF kutuphanesi bircok yöntemle yuklenebilir.

Paket Yonetici Konsolu Kullanarak

  • Araçlar > NuGet Paket Yöneticisi > Paket Yöneticisi Konsolu yoluyla Paket Yöneticisi Konsolu'nu açın.
  • IronPDF kütüphanesini yüklemek için aşağıdaki komutu çalıştırın:
Install-Package IronPdf

C# dilinde PDF'lerden Veri Çıkartma, Şekil 4: Paket Yöneticisi Konsolu sekmesinde yükleme ilerlemesi Paket Yöneticisi Konsolu sekmesinde yükleme ilerlemesi

Kurulumdan sonra, aşağıda gösterildiği gibi Çözüm Gezgini içindeki dependencies bölümünde IronPDF bağımlılığını göreceksiniz.

C# dilinde PDF'lerden Veri Çıkartma, Şekil 5: Çözüm Gezgini'nde IronPdf paketine referans ver Solution Explorer'da IronPdf paketini referans göster

NuGet Paket Yöneticisi Kullanma

IronPDF kütüphanesini yüklemenin bir başka yolu, Visual Studio'nun entegre NuGet Paket Yöneticisi UI'ını kullanmaktır.

  • Ana menüden Araçlar'a gidin. Açılır menüden "NuGet Paket Yöneticisi" üzerine gelin ve "Çözüm için NuGet Paketlerini Yönet..."'i seçin.

C# dilinde PDF'lerden Veri Çıkartma, Şekil 6: NuGet Paket Yöneticisi'ne git NuGet Paket Yöneticisine gidin

  • Bu, NuGet Paket Yonetici penceresini acacaktir. Gözat sekmesine gidin, aramaya IronPdf yazın ve Enter tuşuna basın.
  • Arama sonuçlarından IronPDF'yi seçin ve yüklemeyi başlatmak için "Yükle" düğmesine tıklayın.

C# dilinde PDF'lerden Veri Çıkartma, Şekil 7: IronPdf paketini NuGet Paket Yöneticisi'nden yükle NuGet Paket Yonetici'den IronPdf paketini yukleyin

PDF Dosyalarindan Veri Cikarimi

IronPDF kullanarak veri cikarma konusundaki asagidaki koda bir goz atalim:

// Import necessary namespaces
using IronPdf;
using System.Collections.Generic;
using System.Drawing;

public class PDFExtractor
{
    public void ExtractDataFromPDF()
    {
        // Open a 128-bit encrypted PDF file by providing the filename and password
        using PdfDocument pdf = PdfDocument.FromFile("encrypted.pdf", "password");

        // Extract all text from the PDF document
        string allText = pdf.ExtractAllText();

        // Extract all images from the PDF document
        IEnumerable<Image> allImages = pdf.ExtractAllImages();

        // Iterate over each page in the PDF document
        for (var index = 0; index < pdf.PageCount; index++)
        {
            int pageNumber = index + 1;

            // Extract text from the specific page
            string text = pdf.ExtractTextFromPage(index);

            // Extract images from the specific page
            IEnumerable<Image> images = pdf.ExtractImagesFromPage(index);

            // Code to process the extracted text and images
            //...
        }
    }
}
// Import necessary namespaces
using IronPdf;
using System.Collections.Generic;
using System.Drawing;

public class PDFExtractor
{
    public void ExtractDataFromPDF()
    {
        // Open a 128-bit encrypted PDF file by providing the filename and password
        using PdfDocument pdf = PdfDocument.FromFile("encrypted.pdf", "password");

        // Extract all text from the PDF document
        string allText = pdf.ExtractAllText();

        // Extract all images from the PDF document
        IEnumerable<Image> allImages = pdf.ExtractAllImages();

        // Iterate over each page in the PDF document
        for (var index = 0; index < pdf.PageCount; index++)
        {
            int pageNumber = index + 1;

            // Extract text from the specific page
            string text = pdf.ExtractTextFromPage(index);

            // Extract images from the specific page
            IEnumerable<Image> images = pdf.ExtractImagesFromPage(index);

            // Code to process the extracted text and images
            //...
        }
    }
}
' Import necessary namespaces
Imports IronPdf
Imports System.Collections.Generic
Imports System.Drawing

Public Class PDFExtractor
	Public Sub ExtractDataFromPDF()
		' Open a 128-bit encrypted PDF file by providing the filename and password
		Using pdf As PdfDocument = PdfDocument.FromFile("encrypted.pdf", "password")
	
			' Extract all text from the PDF document
			Dim allText As String = pdf.ExtractAllText()
	
			' Extract all images from the PDF document
			Dim allImages As IEnumerable(Of Image) = pdf.ExtractAllImages()
	
			' Iterate over each page in the PDF document
			For index = 0 To pdf.PageCount - 1
				Dim pageNumber As Integer = index + 1
	
				' Extract text from the specific page
				Dim text As String = pdf.ExtractTextFromPage(index)
	
				' Extract images from the specific page
				Dim images As IEnumerable(Of Image) = pdf.ExtractImagesFromPage(index)
	
				' Code to process the extracted text and images
				'...
			Next index
		End Using
	End Sub
End Class
$vbLabelText   $csharpLabel

Bu kod orneginde:

  1. Girdi PDF belgesini yüklemek için FromFile yöntemi kullanılır; bu belge şifrelenmiştir ve parola gerektirir.
  2. ExtractAllText yöntemi, PDF'deki tüm metin içeriklerini çıkartır.
  3. ExtractAllImages yöntemi, gömülü tüm görselleri alır.
  4. Belgenin her sayfası üzerinde döngü uygulanarak ExtractTextFromPage ve ExtractImagesFromPage kullanılarak o sayfadan metin ve görseller çıkartılır.

Sonuç

IronPDF, geliştiricilerin PDF dosyalarindan metin ve görüntü cikarmasini kolaylastirir. ExtractAllText ve ExtractAllImages kullanılarak, bir PDF dosyasının bütün içeriği anında çıkartılabilir. Alternatif olarak, bu metodlar belirli bir sayfadan içerik cikarmak icin kullanilabilir. Onceki kod, bir dizi sayfadan metin ve görüntü okumak icin her iki metodu nasıl kullanacagini göstermistir.

Ayrica, IronPDF gibi özellikler sunar: grafikler render etme, barkodlar ekleme, sifrelerle guvenligi artirma, watermarking ve PDF formlarini programatik olarak işleme.

IronPDF geliştirme sirasinda ücretsiz olarak mevcuttur, ticari kullanim icin odeme gereklidir. IronPDF'nin ücretsiz denemesi odemesiz uretimde kullanim icin mevcuttur.

Iki IronPDF Lite Lisansi maliyetine Iron Software'in doküman kutuphanelerinin tam suite'ini satin alin.

IronPDF'yi hemen indirin ve bugun PDF'lerden veri cıkarmaya başlayin!

Sıkça Sorulan Sorular

C# ile bir PDF'den metin nasıl çıkarabilirim?

IronPDF'nin ExtractAllText yöntemini kullanarak bir PDF belgesinden tüm metni çıkarabilirsiniz. Bu yöntem, PDF'nin metin içeriğine kolay erişim sağlayarak süreci basitleştirir.

C# kullanarak bir PDF'den resimleri çıkarmanın süreci nedir?

IronPDF ile ExtractAllImages yöntemini kullanarak bir PDF'den resimleri çıkarabilirsiniz. Bu yöntem, PDF dosyasındaki gömülü tüm resimleri etkin bir şekilde alır.

C# projesine PDF işlem kütüphanesi nasıl yüklenir?

C# projesine IronPDF yüklemek için Paket Yöneticisi Konsolu'nu Install-Package IronPdf komutuyla kullanabilir veya Visual Studio'daki NuGet Paket Yöneticisi UI'si aracılığıyla paketi yükleyebilirsiniz.

C# ile şifreli PDF'leri işlemek mümkün mü?

Evet, IronPDF, içeriğe erişmek için dosya adını ve parolayı sağlayabileceğiniz FromFile yöntemini kullanarak şifreli PDF dosyalarını açmanıza ve işlemenize olanak tanır.

C# ile PDF'nin belirli sayfalarından veri çıkarabilir miyim?

IronPDF, bir PDF belgesinin her bir sayfasında dolaşmanıza ve belirli sayfalardan veri çıkarmak için ExtractTextFromPage ve ExtractImagesFromPage gibi yöntemleri kullanmanıza olanak tanır.

C# PDF kütüphanesi hangi ek özellikleri sunar?

Veri çıkarmanın yanı sıra, IronPDF grafik çizme, barkod ekleme, belgelerin güvenliğini parolalarla artırma, filigran ekleme ve PDF formlarını programlı olarak işleme gibi özellikler sunar.

HTML'yi C#'de PDF'ye nasıl dönüştürebilirim?

IronPDF'nin RenderHtmlAsPdf yöntemini kullanarak HTML dizgilerini PDF'lere dönüştürebilirsiniz, bu özellikle web içeriğinden PDF belgeleri oluşturmak için yararlıdır.

C# PDF kütüphanesi için bir deneme sürümü mevcut mu?

IronPDF geliştirme sırasında ücretsiz kullanılabilir, yeteneklerini test etmenize olanak tanır. Üretim kullanımı için ticari bir lisans gereklidir, ancak ücretsiz bir deneme sürümü de mevcuttur.

PDF'lerden veri çıkarmak için C# kütüphanesini nasıl kullanmaya başlayabilirim?

IronPDF kullanarak veri çıkarmaya başlamak için kütüphaneyi indirin, Visual Studio'da bir C# projesi oluşturun veya açın, IronPDF'yi yükleyin ve PDF'lerden metin ve resim çıkarmayı etkin bir şekilde öğrenmek için kod örneklerini takip edin.

.NET 10 uyumluluğu: IronPDF'nin veri çıkarma özelliklerini .NET 10 ile kullanabilir miyim?

Evet — IronPDF, metin ve resim çıkarma gibi veri çıkarma özellikleri dahil olmak üzere .NET 10 üzerinde tam olarak desteklenmektedir. .NET 10 projelerinde IronPDF'yi kullanmak için özel bir yapılandırma gerekmez. .NET 10, .NET 9, .NET 8 ve daha önceki sürümler ile .NET Standard ve .NET Framework'ü destekler. (ironpdf.com)

Curtis Chau
Teknik Yazar

Curtis Chau, Bilgisayar Bilimleri alanında lisans derecesine sahiptir (Carleton Üniversitesi) ve Node.js, TypeScript, JavaScript ve React konularında uzmanlaşmış ön uç geliştirme üzerine uzmanlaşmıştır. Kullanıcı dostu ve estetik açıdan hoş arayüzler tasarlamaya tutkuyla bağlı olan Curtis, modern çerç...

Daha Fazlasını Oku

Iron Destek Ekibi

Haftanın 5 günü, 24 saat çevrimiçiyiz.
Sohbet
E-posta
Beni Ara