Altbilgi içeriğine atla
NODE.JS IçIN IRONPDF KULLANıMı

Node.js'de PDF Belgesi Nasıl Ayrıştırılır

Bu makale, Node.js kütüphanesi ile IronPDF, PDF ayrıştırıcı kullanarak Node.js ile PDF'lerin nasıl ayrıştırılacağını gösterecektir.

Node Nedir?

Platformlar arası, açık kaynaklı Node.js JavaScript çalışma zamanı ortamı, JavaScript kodunun bir web tarayıcısı dışında çalıştırılmasına olanak tanır. Programcılar, sunucu tarafı JavaScript veya JS modül yürütmeyi etkinleştirerek, ölçeklenebilir, hızlı ve etkili ağ uygulamaları oluşturabilir. Node.js, olay odaklı, engellemesiz G/Ç modeli olduğu için, gerçek zamanlı uygulamalar geliştirmek için idealdir; bu, etkileşimli form öğeleri ile aynı anda birden çok bağlantıyı yönetir.

Node.js, genellikle web sunucuları, API'ler, veri yapısı akış uygulamaları, gerçek zamanlı sohbet uygulamaları, Nesnelerin İnterneti (IoT) cihazları ve daha fazlasını oluşturmak için kullanılır. Her şey göz önüne alındığında, Node.js'nin etkisi, hızı ve hem ön hem de arka uçta JavaScript uyumluluğu nedeniyle popülerliği artmaktadır ve bu, tam yığın geliştirme için tek bir dil sağlar. Açıklama web sitesine Node.js hakkında daha fazla bilgi edinmek için belge sayfalarını kontrol edin.

Node.js'de PDF Belgesini Ayrıştırma Nasıl Yapılır

  1. Okunabilir bir akış için PDF'leri ayrıştırmak üzere Node.js paketini indirin.
  2. IronPDF for Node.js kütüphanesini kurun.
  3. Ayrıştırılmış belge verileri ile yeni bir PDF oluşturun veya mevcut birini içe aktarın.
  4. Her satır metni çıkarmak için extractText metodunu kullanın.
  5. Ham PDF okuması için Ayrıştırılmış PDF İçeriklerine göz atın.

IronPDF for Node.js

Ocak 2022'deki son bilgi güncellememe göre, IronPDF, C# veya VB.NET kullanarak geliştiricilerin PDF belgeleriyle çalışmasına olanak tanıyan .NET Framework içinde çalışacak şekilde inşa edilmiş büyük ölçüde bir .NET kütüphanesiydi. Ancak, Node.js için yapılmış yerel veya doğrudan bir IronPDF sürümü yoktu.

IronPDF, Node.js için bağlantılar desteklemek ve içermek üzere genişlettiği için, bu muhtemelen Node.js uygulamalarında PDF belgeleri oluşturma, düzenleme ve işleme araçlarının şimdi IronPDF for Node.js'de mevcut olduğu anlamına gelir.

IronPDF Özellikleri

  • HTML'den PDF Üretimi: HTML içeriğini PDF belgelerine dönüştürme yeteneği.
  • PDF dosyalarından metin, şekiller, resimler ve diğer unsurların eklenmesi, değiştirilmesi veya kaldırılması metin ve resim manipülasyonu olarak adlandırılır.
  • PDF belgelerinin değiştirilmesi örnekleri arasında PDF dosyalarından birleştirme, sayfalar çıkarmak, PDF dosyalarını bölmek, ve şifreleme ve şifre çözme vardır.
  • Form işleme, formları doldurma, form verilerini alma ve programlama yoluyla PDF formlarını kullanmayı kapsar.
  • PDF güvenliği, dijital imzalar, şifreleme ve PDF belgeleri için şifre korumasını içerir.
  • PDF dosyalarını alma ve değiştirme işlemine sayfa meta verisi yönetimi denir.

Eğer IronPDF, bir Node.js sürümü eklemek için ürün gamını genişlettiyse, bu, Node.js uygulamaları yapan geliştiricilerin IronPDF'nin PDF manipülasyon işlevselliğini kullanması için bir yol sağlayabilir. Bu, .NET ortamında IronPDF'ye benzer özellikler sunan bir kütüphane ile çalışmayı tercih edecek geliştiriciler için yararlı olabilir.

Node.js için IronPDF'nin özellikleri, uyumluluğu ve desteği ile ilgili en güncel ve güncel bilgiler için her zaman resmi belgeler, sürüm notları veya IronPDF ekibinden gelen güncellemeler kontrol edilmelidir. IronPDF ve her sürümdeki yeni özellikler hakkında daha fazla bilgi edinmek için buraya gidin. Resmi belge sayfasına IronPDF hakkında daha fazla bilgi edinmek için başvurun.

Paket Gereksinimleri

  • IDE olarak Visual Studio Code
  • Node.js
  • Paket yönetimi için gerekli olan Yarn veya npm, paket kurulumları için kullanılabilir.

Node.js için IronPDF Paketini Kurun

Komut İstemi veya Terminali Başlatın: Komut istemini veya terminali açın. Bunu işletim sisteminize bağlı olarak çeşitli yollarla açabilirsiniz:

  • Windows: PowerShell veya Komut İstemi
  • macOS üzerinde Terminal
  • Linux üzerinde Terminal

Bir paket yüklemek için paket adı ve npm install komutunu kullanın. Örneğin, @ironsoftware/ironpdf paketini yüklemek için terminalde aşağıdaki komutu çalıştırın:

npm install @ironsoftware/ironpdf
npm install @ironsoftware/ironpdf
SHELL

Eğer farklı bir paket yüklemek istiyorsanız @ironsoftware/ironpdf ifadesini istediğiniz paketin adıyla değiştirin.

Node.js'de bir PDF Belgesini Ayrıştırma, Şekil 1: IronPDF Yükleme IronPDF'yi Yükle

Veri Çıkarmak İçin PDF Dosyasını Ayrıştırma

Deneyimden, IronPDF'nin Node.js ile çalışmak için birçok özellik sunduğunu görebilirsiniz. Odak noktası, gerekli formatlarda her türlü PDF belgesini oluşturmak, görüntülemek ve değiştirmektir. PDF dosyalarını ayrıştırmak oldukça basittir.

const { PdfDocument } = require("@ironsoftware/ironpdf");

const pdfProcess = async () => {
  // Load the existing PDF document
  const pdf = await PdfDocument.fromFile("Demo.pdf");
  // Extract text data from the loaded PDF
  const data = await pdf.extractText();
  // Output the extracted text to the console
  console.log(data);
};

pdfProcess();

Yukarıdaki kod, fromFile fonksiyonunun önemini göstermektedir. fromFile metodu, mevcut bir dosya sisteminden dosyayı yükleyerek PDF belgelerini okur ve PDF dosyasını PdfDocument nesnelerine dönüştürür. Bu nedenle PdfDocument, PDF'nin meta verilerini barındırır. PDF nesnesindeki dosya meta verileri, kullanıcının istediği gibi kullanılabilir. Bu nesne ayrıştırılmış belge verileri, PDF sayfa nesnesinde bulunan metin ve grafiklerdir. extractText fonksiyonu verilen PDF dosyasından tüm metni çıkarmak için kullanılır. Daha sonra, elde edilen metin bir dize olarak kaydedilir ve JSON formatı oluşturma gibi ek işlemler için hazırlanır.

Sayfa Sayfa Metin Çıkarma

Aşağıda, PDF dosyasının her sayfasından metin çıkarmayı açıkça anlatan başka bir yaklaşım için kod yer almaktadır.

const pdf = await PdfDocument.fromFile("Demo.pdf");
// Get the total number of pages in the PDF
const pageCount = await pdf.getPageCount();

// Loop through each page to extract text
for (let i = 0; i < pageCount; i++) {
  const pageText = await pdf.extractText(i);
  // Output the text of each page
  console.log(pageText);
}

Bellekte zaten olan bir PDF'den ham PDF okuma, belirtilen dizinden tamamen yüklenerek bu örnek kod tarafından gerçekleştirilir ve ardından PdfDocument adlı pdf bir nesne oluşturur. Bir PDF belgesi, birkaç temel veri nesne türünden oluşan bir veri yapısıdır. Her sayfa verisi, PDF nesnesinde sayfa numarası veya sayfa indeksi kullanılarak alınır, böylece arka arkaya işlenmesi sağlanır. İlk olarak, sağlanan PDF'deki toplam sayfa sayısını bulmak için PDF nesnesinin getPageCount metodunu kullanırız.

for döngüsü, bu sayfa sayısını kullanarak her sayfa üzerinde yineleme yapar ve her PDF sayfasından metin almak için extractText fonksiyonunu çağırır. Ya çıkarılan metin kullanıcının ekranında gösterilebilir ya da bir dize değişkeninde saklanabilir. Bu teknik, bireysel PDF sayfalarından metin çıkarmayı düzenli bir şekilde mümkün kılar. Bu teknikler, PDF görevleri için özel olarak yapılmış bir Node.js kütüphanesi olan IronPDF'nin, PDF dosyalarından metinleri kolayca ve eksiksiz bir şekilde nasıl çıkarabileceğini gösterir. Bu erişilebilirlik, PDF'lerin çeşitli bağlamlarda kullanımını artırır ve birçok pratik uygulamaya sahiptir.

Node.js'de bir PDF Belgesini Ayrıştırma, Şekil 2: PDF'yi Sayfa Sayfa Okuma PDF Sayfa Sayfa Okuma

Yukarıdaki her iki kod da aynı çıktıyı sağlar, ancak tek fark, kullanıcı gereksinimlerine bağlı olarak kodun uygulanışındadır. Detaylı belge sayfalarına IronPDF hakkında daha fazla bilgi edinmek için başvurun.

Sonuç

IronPDF kütüphanesi, riskleri azaltmak ve veri güvenliğini sağlamak için sağlam güvenlik önlemleri sunar. Tüm popüler tarayıcılarla uyumludur ve bunlardan herhangi biriyle sınırlı değildir. Geliştiricilerin çeşitli taleplerini karşılamak için kütüphane, ücretsiz bir geliştirici lisansı ve satın alınabilecek ek geliştirme lisansları da dahil olmak üzere geniş bir lisans seçenekleri yelpazesi sunar.

Kalıcı bir lisans, bir yıllık yazılım bakımı ve otuz günlük para iade garantisine ek olarak, $799 Lite paketi yükseltme olanakları içerir. Kullanıcılar, su damgası ile işaretlenmiş deneme süresi boyunca ürünü pratik uygulama koşullarında değerlendirme fırsatına sahiptir. IronPDF'nin maliyeti, lisansları ve deneme sürümü hakkında daha fazla ayrıntı için sağlanan lisanslama sayfasını kontrol edin. Iron Software tarafından sunulan diğer ürünler hakkında bilgi almak için resmi web sitesine bakın.

Node.js'de bir PDF Belgesini Ayrıştırma, Şekil 3: Iron Software fiyatlandırması Iron Software fiyatlandırma

Sıkça Sorulan Sorular

Node.js kullanarak bir PDF'yi nasıl ayrıştırabilirim?

Node.js kullanarak bir PDF ayrıştırmak için IronPDF kütüphanesini kullanabilirsiniz. npm install @ironsoftware/ironpdf ile IronPDF paketini yükleyerek başlayın. Ardından, PDF'yi fromFile yöntemiyle yükleyin ve metni extractText yöntemiyle çıkarın.

HTML'yi Node.js'de PDF'ye dönüştürmenin adımları nelerdir?

Node.js'de HTML'yi PDF'ye dönüştürmek için IronPDF kullanabilirsiniz. HTML dizelerini RenderHtmlAsPdf yöntemi veya HTML dosyaları için RenderHtmlFileAsPdf yöntemini kullanarak etkili şekilde PDF'ler oluşturun.

Node.js kullanarak bir PDF'nin her sayfasından metin nasıl çıkarabilirim?

IronPDF ile bir PDF'nin her sayfasından metin çıkarmak için sayfalar arasında gezinerek yapabilirsiniz. Sayfa sayısını belirlemek için getPageCount yöntemini ve her sayfadan metin çıkarmak için extractText fonksiyonunu kullanın.

IronPDF kütüphanesi Node.js için hangi özellikleri sunar?

IronPDF for Node.js, HTML'yi PDF'ye dönüştürme, metin ve görüntü düzenleme, PDF birleştirme ve bölme, şifreleme, dijital imzalar ve form işleme dahil olmak üzere birçok özellik sunar.

Node.js'te PDF belgelerinin güvenliğini nasıl sağlayabilirim?

IronPDF, dijital imzalar, şifreleme ve parola koruması gibi kapsamlı güvenlik özellikleri sunar ve Node.js uygulamalarında PDF belgelerini güvence altına alır.

Node.js için bir PDF kütüphanesi seçerken nelere dikkat etmeliyim?

Node.js için bir PDF kütüphanesi seçerken, farklı tarayıcılarla uyumluluk, güvenlik seçenekleri, kullanım kolaylığı, kapsamlı dokümantasyon ve lisanslama esnekliği gibi özellikleri göz önünde bulundurun. IronPDF, geliştiriciler için güçlü bir tercih olmasını sağlayan bu yetenekleri sunar.

Node.js içinde IronPDF için mevcut lisanslama seçenekleri nelerdir?

IronPDF, ücretsiz geliştirici lisansı, kalıcı lisanslar ve bir yıllık yazılım bakımı gibi çeşitli lisanslama seçenekleri sunar. Ayrıca, farklı geliştirici ihtiyaçlarını karşılayan, filigranlı bir sürüm ile birlikte bir deneme süresi de sunarlar.

Node.js içinde PDF'ler içinde görüntüleri manipüle etmek mümkün müdür?

Evet, IronPDF ile Node.js uygulamalarında PDF'ler içinde görüntüleri manipüle edebilirsiniz. Bu, PDF belgelerine gömülü olan görüntüleri eklemeyi, çıkarmayı veya değiştirmeyi içerir.

Darrius Serrant
Tam Yığın Yazılım Mühendisi (WebOps)

Darrius Serrant, Miami Üniversitesi'nden Bilgisayar Bilimleri lisans derecesine sahiptir ve Iron Software'de Tam Yığın WebOps Pazarlama Mühendisi olarak çalışmaktadır. Küçük yaşlardan itibaren kodlamaya ilgi duyan Darrius, bilişimi hem gizemli hem de erişilebilir buldu ve onu yaratıcılık ve problem çö...

Daha Fazlasını Oku

Iron Destek Ekibi

Haftanın 5 günü, 24 saat çevrimiçiyiz.
Sohbet
E-posta
Beni Ara