Wyciągnij tekst z PDF

W ramach obszernej kolekcji funkcji tworzenia i edycji plików PDF, IronPDF ułatwia również szczegółowe przetwarzanie treści dokumentów PDF dzięki metodom ekstrakcji treści.

Dostępna na wszystkich obiektach PdfDocument jest metoda extractAllText. String zwracane przez extractAllText zawiera cały tekst umieszczony na każdej stronie w PDF.

Ta metoda stanowi wygodny sposób na ekstrakcję tekstu na poziomie dokumentu z plików PDF zawierających wiele stron. Aby wyodrębnić tekst na poziomie strony (tj. tylko z określonego zestawu stron), zamiast tego użyj metody extractTextFromPage.

Poniższy krótki fragment kodu pobiera tekst z pierwszej strony dokumentu PDF.

Explore the extractAllText Method in IronPDF Java Docs

Gotowy, aby rozpocząć?
Wersja: 2026.4 just released
Still Scrolling Icon

Wciąż przewijasz?

Czy chcesz szybko dowodu?
Uruchom przykład i zobacz, jak Twój kod HTML zamienia się w plik PDF.