Wyciągnij tekst z PDF

W ramach obszernej kolekcji funkcji tworzenia i edycji plików PDF, IronPDF ułatwia również szczegółowe przetwarzanie treści dokumentów PDF dzięki metodom ekstrakcji treści.

Dla wszystkich obiektów PdfDocument dostępna jest metoda extractAllText. String zwracane przez extractAllText zawiera cały tekst znajdujący się na każdej stronie pliku PDF.

Ta metoda stanowi wygodny sposób na ekstrakcję tekstu na poziomie dokumentu z plików PDF zawierających wiele stron. Aby wyodrębnić tekst na poziomie strony (tj. tylko z określonego zestawu stron), należy zamiast tego użyć metody extractTextFromPage.

Poniższy krótki fragment kodu pobiera tekst z pierwszej strony dokumentu PDF.

Explore the extractAllText Method in IronPDF Java Docs

Gotowy, aby rozpocząć?
Wersja: 2026.5 just released
Still Scrolling Icon

Wciąż przewijasz?

Czy chcesz szybko dowodu?
Uruchom przykład i zobacz, jak Twój kod HTML zamienia się w plik PDF.