Java'da PDF Dosyasını Okuma Yöntemi
Bu makale, PDF okuyucu oluşturmayı, yazılım uygulamanızda programlı olarak bir PDF dosyası açmayı keşfedecektir. Bu görevi etkili bir şekilde yerine getirmek için, IronPDF for Java, Java programlarında dosya adı kullanarak PDF dosyalarını açmaya ve okumaya yardımcı olan bir sistem kütüphanesi olarak yer alıyor.
Java'da PDF Dosyaları Nasıl Okunur
- IronPDF Java Kütüphanesini İndirin
- Mevcut PDF belgelerini yüklemek için
fromFileyöntemini kullanın - Yerleştirilmiş metni PDF'lerden çıkarmak için
extractAllTextyöntemini çağırın - Belirli bir sayfadan metin çıkarmak için
extractTextFromPageyöntemini kullanın - URL'den oluşturulmuş PDF'lerden metin alın
IronPDF
IronPDF - Java Kütüphanesi, zaten başarı sağlamış .NET Framework üzerine inşa edilmiştir. Bu, IronPDF'u Apache PDFBox gibi diğer sınıf kütüphaneleriyle karşılaştırıldığında PDF belgeleriyle çalışmak için çok yönlü bir araç yapar. Bu, içerik çıkarmak ve ayrıştırmak, metin yüklemek ve resim yüklemek için olanak sağlar. Ayrıca sayfa düzeni, kenar boşlukları, başlık ve altbilgi, sayfa yönlendirmesi gibi PDF sayfalarını özelleştirme seçenekleri de sunar.
Buna ek olarak, IronPDF aynı zamanda diğer dosya biçimlerinden dönüştürmeyi, PDF'leri parola ile korumayı, dijital imzalamayı, PDF belgelerini birleştirmeyi ve ayırmayı da destekler.
Java'da PDF Dosyaları Nasıl Okunur
Önkoşullar
Java PDF okuyucu yapabilmek için, bilgisayara aşağıdaki bileşenlerin kurulu olduğundan emin olmak gereklidir:
- JDK - Java Geliştirme Kiti, Java programlarını oluşturmak ve çalıştırmak için gereklidir. Eğer yüklü değilse, Oracle Web Sitesinden indirin.
- IDE - Tümleşik Geliştirme Ortamı, bir program yazmak, düzenlemek ve hata ayıklamak için yardımcı olan bir yazılımdır. Java için herhangi bir IDE indirin, örn. Eclipse, NetBeans, IntelliJ.
- Maven - Maven, Merkezi Depodan kütüphaneleri indirmek için yardımcı olan bir otomasyon aracıdır. Apache Maven Web Sitesinden indirin.
- IronPDF - Son olarak, Java'da PDF dosyasını okumak için IronPDF gereklidir. Bu, Java Maven Projesi'ne bağımlılık olarak eklenmelidir. IronPDF artifact'ini slf4j bagimliligi ile birlikte
pom.xmldosyasina, asagidaki örnekte gösterildigi gibi ekleyin:
<dependencies>
<dependency>
<groupId>com.ironsoftware</groupId>
<artifactId>ironpdf</artifactId>
<version>your-version-here</version>
</dependency>
<dependency>
<groupId>org.slf4j</groupId>
<artifactId>slf4j-api</artifactId>
<version>1.7.32</version>
</dependency>
</dependencies>
<dependencies>
<dependency>
<groupId>com.ironsoftware</groupId>
<artifactId>ironpdf</artifactId>
<version>your-version-here</version>
</dependency>
<dependency>
<groupId>org.slf4j</groupId>
<artifactId>slf4j-api</artifactId>
<version>1.7.32</version>
</dependency>
</dependencies>
Gerekli İçeri Aktarmaların Eklenmesi
Öncelikle, IronPDF'den gerekli tüm yöntemlere referans vermek için Java kaynak dosyasının en üstüne aşağıdaki kodu ekleyin:
import com.ironsoftware.ironpdf.*;
// Necessary imports from IronPDF library
import com.ironsoftware.ironpdf.*;
// Necessary imports from IronPDF library
Sonra, IronPDF'u geçerli bir lisans anahtarı ile yapılandırarak yöntemlerini kullanın. Main metodunda setLicenseKey metodunu cagir.
License.setLicenseKey("Your license key");
// Set your IronPDF license key - required for full version
License.setLicenseKey("Your license key");
// Set your IronPDF license key - required for full version
Not: PDF oluşturmak, okumak ve yazdırmak için ücretsiz bir deneme lisans anahtarı alabilirsiniz.
Java'da Mevcut PDF Dosyasını Okuma
PDF dosyalarını okuyabilmek için ya PDF dosyaları olmalı ya da bir tane oluşturulmalı. Bu makalede zaten oluşturulmuş bir PDF dosyası kullanılacak. Belgeden metin çıkarmak için kod basit ve iki aşamalı bir süreçtir:
// Load the PDF document from file
PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
// Extract all text from the PDF
String text = pdf.extractAllText();
// Print the extracted text
System.out.println(text);
// Load the PDF document from file
PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
// Extract all text from the PDF
String text = pdf.extractAllText();
// Print the extracted text
System.out.println(text);
Yukarıdaki kodda, fromFile bir PDF dokümanini acar. Paths.get metodu, dosyanin dizinini alir ve dosyadan içerik çıkarmaya hazırdır. Ardindan, [extractAllText](/java/object-reference/api/com/ironsoftware/ironpdf/PdfDocument.html#extractAllText()) belgedeki tüm metni okur.
Çıktı aşağıdadır:
PDF Metni Okuma Çıktısı
Belirli Bir Sayfadan Metin Okuma
IronPDF, ayrıca PDF'deki belirli bir sayfadan içerik okuyabilir. extractTextFromPage metodu, metin okunacak sayfa araligini kabul etmek icin PageSelection nesnesini kullanir.
Aşağıdaki örnekte, metin PDF belgesinin ikinci sayfasından çıkarılır. PageSelection.singlePage, cikartilmasi gereken sayfanin indeksini alir (indeks 0'dan başlar).
// Load the PDF document from file
PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
// Extract text from the second page (page index based, starts at 0, so 1 means second page)
String text = pdf.extractTextFromPage(PageSelection.singlePage(1));
// Print the extracted text from the specified page
System.out.println(text);
// Load the PDF document from file
PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
// Extract text from the second page (page index based, starts at 0, so 1 means second page)
String text = pdf.extractTextFromPage(PageSelection.singlePage(1));
// Print the extracted text from the specified page
System.out.println(text);
PDF Metni Okuma Çıktısı
PageSelection sinifinda, çeşitli sayfalardan metin cikarmak icin kullanilabilecek diğer metodlar sunlardir: [firstPage](/java/object-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#lastPage(), [lastPage](/java/object-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#firstPage(), [pageRange](/java/object-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#pageRange(int,int) ve [allPages](/java/object-reference/api/com/ironsoftware/ironpdf/edit/PageSelection.html#allPages().
Yeni Oluşturulmuş Bir PDF Dosyasından Metin Okuma
Bir HTML dosyasından veya URL'den yeni oluşturulmuş bir PDF dosyasından da metin arama yapılabilir. Aşağıdaki örnek kod, URL'den PDF'ler oluşturur ve web sitesindeki tüm metni çıkarır.
// Generate PDF from a URL
PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://unsplash.com/");
// Extract all text from the generated PDF
String text = pdf.extractAllText();
// Print the extracted text from the URL
System.out.println("Text extracted from the website: " + text);
// Generate PDF from a URL
PdfDocument pdf = PdfDocument.renderUrlAsPdf("https://unsplash.com/");
// Extract all text from the generated PDF
String text = pdf.extractAllText();
// Print the extracted text from the URL
System.out.println("Text extracted from the website: " + text);
Yeni Bir Dosyadan Oku
IronPDF ayrıca PDF dosyalarından görüntü çıkarma için kullanılabilir.
Tamam kod, şu şekildedir:
import com.ironsoftware.ironpdf.License;
import com.ironsoftware.ironpdf.PdfDocument;
import com.ironsoftware.ironpdf.edit.PageSelection;
import java.io.IOException;
import java.nio.file.Paths;
public class Main {
public static void main(String[] args) throws IOException {
// Set the IronPDF license key for commercial use
License.setLicenseKey("YOUR LICENSE KEY HERE");
// Read text from a specific page in an existing PDF
PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractTextFromPage(PageSelection.singlePage(1));
System.out.println(text);
// Read all text from a PDF generated from a URL
pdf = PdfDocument.renderUrlAsPdf("https://unsplash.com/");
text = pdf.extractAllText();
System.out.println("Text extracted from the website: " + text);
}
}
import com.ironsoftware.ironpdf.License;
import com.ironsoftware.ironpdf.PdfDocument;
import com.ironsoftware.ironpdf.edit.PageSelection;
import java.io.IOException;
import java.nio.file.Paths;
public class Main {
public static void main(String[] args) throws IOException {
// Set the IronPDF license key for commercial use
License.setLicenseKey("YOUR LICENSE KEY HERE");
// Read text from a specific page in an existing PDF
PdfDocument pdf = PdfDocument.fromFile(Paths.get("assets/sample.pdf"));
String text = pdf.extractTextFromPage(PageSelection.singlePage(1));
System.out.println(text);
// Read all text from a PDF generated from a URL
pdf = PdfDocument.renderUrlAsPdf("https://unsplash.com/");
text = pdf.extractAllText();
System.out.println("Text extracted from the website: " + text);
}
}
Özet
Bu makale, IronPDF kullanarak Java'da PDF'leri nasıl açıp okuyacağınızı açıkladı.
IronPDF, HTML veya URL'den kolayca PDF oluşturmanıza ve farklı dosya formatlarından dönüştürme yapmanıza yardımcı olur. Ayrıca, PDF işlemlerini hızlı ve kolay bir şekilde yapmanıza yardımcı olur.
IronPDF'yi 30 gün boyunca ücretsiz deneme ile deneyin ve üretkenliğiniz için ne kadar iyi çalıştığını görün. IronPDF için ticari lisanslama seçeneklerini keşfedin ve $799'den başlar.
Sıkça Sorulan Sorular
Java ile bir PDF okuyucu nasıl oluşturabilirim?
IronPDF kullanarak Java'da bir PDF okuyucu oluşturabilirsiniz. Bunu yapmak için `fromFile` metodunu kullanarak PDF belgelerini yükleyebilir ve ardından `extractAllText` gibi metodları kullanarak içeriği ayrıştırabilir ve manipüle edebilirsiniz.
IronPDF for Java kullanmak için gerekli on koşulları yükleme adimlari nelerdir?
IronPDF'i Java'da kullanmak için Java Development Kit (JDK)'yi yüklemeniz, Eclipse veya IntelliJ gibi bir Entegre Geliştirme Ortami (IDE) kurmanız, bagimlilik yönetimi için Maven'i yapılandırmanız ve projenize IronPDF kütüphanesini dahil etmeniz gerekmektedir.
Java'da bir PDF dosyasından metin nasıl çıkarabilirim?
Java'da IronPDF kullanarak bir PDF dosyasindan metin çıkarmak için, tüm belgenin metnini almak uzere `extractAllText` metodunu ya da belirli bir sayfadan metin çıkarmak için `extractTextFromPage` metodunu kullanabilirsiniz.
Java'da bir URL'den PDF oluşturabilir miyim?
Evet, IronPDF ile `renderUrlAsPdf` yöntemini kullanarak bir URL'den web içeriğini PDF formatına dönüştürebilirsiniz.
IronPDF, Java'da PDF'lere parola koruması eklemeyi destekliyor mu?
Evet, IronPDF, PDF'lere parola koruması eklemeyi, dijital imzalama ve belgeleri birleştirme veya ayırma gibi diğer özelliklerle birlikte destekler.
IronPDF, Java'da PDF'ye hangi dosya formatlarını çevirebilir?
IronPDF, HTML ve diğer belge formatları dahil olmak üzere çeşitli dosya formatlarını PDF'ye çevirebilir ve PDF oluşturma ve manipülasyonu için esnek seçenekler sunar.
Java için IronPDF'nin deneme sürümü mevcut mu?
Evet, IronPDF, Java uygulamalarınızda satın almadan önce özelliklerini test etmenize ve performansını değerlendirmenize olanak tanıyan 30 günlük ücretsiz bir deneme sunar.
Bir Java kütüphanesi kullanarak bir PDF belgesindeki belirli bir sayfadan metin nasıl çıkarılır?
IronPDF kullanarak, `extractTextFromPage` yöntemini kullanarak bir PDF'nin belirli bir sayfasından metin çıkarabilirsiniz; bu yöntem, sayfa numarası veya aralığı belirtmeyi gerektirir.




