Przejdź do treści stopki
KORZYSTANIE Z IRONPDF

Tutorial C#: Stwórz przeglądarkę tekstu PDF z IronPDF (Windows Forms)

W dzisiejszej erze cyfrowej pliki PDF są integralną częścią wielu przepływów pracy w edukacji, biznesie i użyciu osobistym. Są standardowym formatem do udostępniania i prezentowania różnorodnych danych, w tym tekstu, obrazów i tabel.

Podczas gdy wyświetlanie pełnych dokumentów PDF z pełną wiernością wizualną w aplikacji Windows Forms w języku C# może wymagać dedykowanych komponentów renderujących, deweloperzy często mają inne potrzeby. Czasami celem jest odczytanie tekstu PDF w C#, wyodrębnienie danych lub wyświetlenie treści tekstowej PDF w celu szybkiego przeglądu, indeksowania lub dostępności.

Ten artykuł przeprowadzi Cię przez tworzenie aplikacji, która koncentruje się na tym konkretnym zadaniu: tworzeniu prostego przeglądarki treści tekstowej PDF w C# przy użyciu IronPDF, potężnej biblioteki .NET. Dowiesz się, jak używać IronPDF do ładowania pliku PDF i skutecznego wyodrębniania i wyświetlania jego treści tekstowej w aplikacji Windows Forms.

Czym jest IronPDF?

IronPDF to wszechstronna biblioteka C#, która umożliwia deweloperom .NET tworzenie, edycję i przetwarzanie plików PDF w ich aplikacjach. Pozwala użytkownikom konwertować HTML, obrazy i SVG na dokumenty PDF, a co ważne dla tego poradnika, odczytywać i wyodrębniać treści z istniejących plików PDF. IronPDF jest zaprojektowany z myślą o łatwości użytkowania i oferuje szeroki zakres funkcji do manipulacji plikami PDF.

Wymagania do Tworzenia Przeglądarki Tekstu PDF

Aby stworzyć tę aplikację do wyświetlania tekstu z PDF w C#, będziesz potrzebować:

  • Visual Studio: Zintegrowane środowisko programistyczne (IDE) do tworzenia aplikacji Windows Forms.
  • IronPDF: Pakiet NuGet, który zapewnia funkcjonalność do odczytu, tworzenia i manipulacji dokumentami PDF, w tym wyodrębniania tekstu.

Ilustracja pokazująca koncepcję konwersji HTML do PDF IronPDF może również tworzyć pliki PDF z HTML, co jest oddzielną funkcją od wyodrębniania tekstu pokazanego w tym poradniku.

Kroki do Utworzenia Przeglądarki Treści Tekstowej PDF w C# z IronPDF

Krok 1: Utwórz nową aplikację Windows Forms w Visual Studio

Aby rozpocząć, uruchom Visual Studio i kliknij "Utwórz nowy projekt". Wybierz "Windows Forms App (.NET Framework)" lub podobny szablon .NET z listy.

Dialog nowego projektu w Visual Studio Kreacja nowego projektu w Visual Studio

Następnie podaj nazwę dla swojego projektu (np. CSharpPdfTextReader) i kliknij przycisk Utwórz. To ustawi nowy projekt aplikacji Windows Forms.

Krok 2: Zainstaluj bibliotekę IronPDF

Używanie GUI Menedżera Pakietów NuGet

  1. W Eksploratorze rozwiązań kliknij prawym przyciskiem na swoim projekcie i wybierz "Zarządzaj pakietami NuGet..."
  2. Przejdź na kartę "Przeglądaj" i wyszukaj "IronPdf".
  3. Wybierz pakiet IronPdf i kliknij "Zainstaluj".

Menedżer Pakietów NuGet w Visual Studio wyszukujący IronPDF Instalacja IronPDF za pomocą Menedżera Pakietów NuGet

Używanie Konsoli Menedżera Pakietów NuGet

Alternatywnie, otwórz Konsolę Menedżera Pakietów (Narzędzia > Menedżer Pakietów NuGet > Konsola Menedżera Pakietów) i uruchom polecenie:

Install-Package IronPdf

To pobierze i zainstaluje IronPDF i jego zależności do Twojego projektu.

Krok 3: Dodaj RichTextBox do Formy do Wyświetlania Tekstu

Użyjemy kontrolki RichTextBox do wyświetlania wyodrębnionej treści tekstowej z PDF. Kontrolka RichTextBox nadaje się do wyświetlania formatowanego tekstu, chociaż w tym poradniku jej główną rolą jest prezentacja zwykłego tekstu wyodrębnionego przez IronPDF. Skutecznie pokazuje informacje tekstowe bez próby odtworzenia oryginalnego układu wizualnego PDF.

Aby dodać RichTextBox:

  1. Otwórz swoją formę w widoku Projektanta.
  2. Przejdź do Panelu narzędzi (Widok > Panel narzędzi).
  3. Znajduj RichTextBox pod "Podstawowymi Kontrolkami" i przeciągnij go na swoją formę.
  4. Dostosuj jego rozmiar i położenie w razie potrzeby. W oknie Właściwości można ustawić jego Name (np. pdfDataRichTextBox) i ustawić właściwość Dock na Fill, jeśli chcesz, aby zajmował większość formy.

Przeglądarka PDF Aplikacja C# Windows (Poradnik), Rysunek 4: Uzyskaj dostęp do RickTextBox w Form1 Dodawanie RichTextBox do Form1 do wyświetlania wyodrębnionego tekstu z PDF

Krok 4: Dodaj przycisk do wyboru pliku PDF

Dodaj kontrolkę Button do swojej formy. Użytkownicy będą klikać ten przycisk, aby otworzyć okno dialogowe pliku i wybrać plik PDF do wyodrębnienia tekstu.

  1. Przeciągnij Button z Panelu narzędzi na swoją formę.
  2. W oknie Właściwości ustaw jego Name (np. openBtn) i Text (np. "Otwórz PDF i wyświetl tekst").

Przeglądarka PDF Aplikacja C# Windows (Poradnik), Rysunek 5: Dodaj nowy przycisk do Form1 Dodawanie Przycisku do Form1 do wywoływania wyboru PDF

Krok 5: Dodaj Kod C# do Ładowania PDF i Wyodrębniania Tekstu

Kliknij dwukrotnie przycisk, który właśnie dodałeś ("Otwórz PDF i wyświetl tekst"), aby utworzyć jego obsługę zdarzeń Click w Form1.cs.

Najpierw upewnij się, że masz zaimportowaną przestrzeń nazw IronPDF na początku pliku Form1.cs.

using IronPdf;
using System; // For EventArgs, Exception
using System.Windows.Forms; // For OpenFileDialog, MessageBox, DialogResult, etc.
using IronPdf;
using System; // For EventArgs, Exception
using System.Windows.Forms; // For OpenFileDialog, MessageBox, DialogResult, etc.
Imports IronPdf
Imports System ' For EventArgs, Exception
Imports System.Windows.Forms ' For OpenFileDialog, MessageBox, DialogResult, etc.
$vbLabelText   $csharpLabel

Teraz zaimplementuj obsługę zdarzeń dla kliknięcia przycisku. Ten kod wykona:

  1. Wyświetlenie monitowania użytkownika o wybór pliku PDF.
  2. Użycie IronPDF do załadowania wybranego pliku PDF.
  3. Użycie metody ExtractAllText() IronPDF, aby uzyskać cały tekst z PDF.
  4. Wyświetli wyodrębniony tekst w RichTextBox.
private void openBtn_Click(object sender, EventArgs e)
{
    // Create an OpenFileDialog to open PDF files
    var openFileDialog = new OpenFileDialog
    {
        Filter = "PDF files (*.pdf)|*.pdf|All files (*.*)|*.*", // Filter to show only PDFs
        Title = "Select a PDF file to extract text from" // Dialog title
    };

    // Show dialog and check if the user selected a file
    if (openFileDialog.ShowDialog() == DialogResult.OK)
    {
        try
        {
            // It's recommended to set your license key once at application startup.
            // License.LicenseKey = "YourIronPdfLicenseKey"; 
            // If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
            // For text extraction, the trial is fully functional for development.

            // Load the selected PDF using IronPDF
            var pdf = PdfDocument.FromFile(openFileDialog.FileName);

            // Extract all text content from the PDF using IronPDF
            string extractedText = pdf.ExtractAllText();

            // Display the extracted text in the RichTextBox
            // (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
            pdfDataRichTextBox.Text = extractedText; 
        }
        catch (Exception ex)
        {
            // Show error message if an exception occurs
            MessageBox.Show("An error occurred while processing the PDF file: " + ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error);
        }
    }
}
private void openBtn_Click(object sender, EventArgs e)
{
    // Create an OpenFileDialog to open PDF files
    var openFileDialog = new OpenFileDialog
    {
        Filter = "PDF files (*.pdf)|*.pdf|All files (*.*)|*.*", // Filter to show only PDFs
        Title = "Select a PDF file to extract text from" // Dialog title
    };

    // Show dialog and check if the user selected a file
    if (openFileDialog.ShowDialog() == DialogResult.OK)
    {
        try
        {
            // It's recommended to set your license key once at application startup.
            // License.LicenseKey = "YourIronPdfLicenseKey"; 
            // If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
            // For text extraction, the trial is fully functional for development.

            // Load the selected PDF using IronPDF
            var pdf = PdfDocument.FromFile(openFileDialog.FileName);

            // Extract all text content from the PDF using IronPDF
            string extractedText = pdf.ExtractAllText();

            // Display the extracted text in the RichTextBox
            // (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
            pdfDataRichTextBox.Text = extractedText; 
        }
        catch (Exception ex)
        {
            // Show error message if an exception occurs
            MessageBox.Show("An error occurred while processing the PDF file: " + ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error);
        }
    }
}
Private Sub openBtn_Click(ByVal sender As Object, ByVal e As EventArgs)
	' Create an OpenFileDialog to open PDF files
	Dim openFileDialog As New OpenFileDialog With {
		.Filter = "PDF files (*.pdf)|*.pdf|All files (*.*)|*.*",
		.Title = "Select a PDF file to extract text from"
	}

	' Show dialog and check if the user selected a file
	If openFileDialog.ShowDialog() = DialogResult.OK Then
		Try
			' It's recommended to set your license key once at application startup.
			' License.LicenseKey = "YourIronPdfLicenseKey"; 
			' If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
			' For text extraction, the trial is fully functional for development.

			' Load the selected PDF using IronPDF
			Dim pdf = PdfDocument.FromFile(openFileDialog.FileName)

			' Extract all text content from the PDF using IronPDF
			Dim extractedText As String = pdf.ExtractAllText()

			' Display the extracted text in the RichTextBox
			' (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
			pdfDataRichTextBox.Text = extractedText
		Catch ex As Exception
			' Show error message if an exception occurs
			MessageBox.Show("An error occurred while processing the PDF file: " & ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error)
		End Try
	End If
End Sub
$vbLabelText   $csharpLabel

Podział kodu:

  • openFileDialog: Standardowe okno dialogowe do wyboru plików, filtrowane dla plików PDF.
  • PdfDocument.FromFile(openFileDialog.FileName): Ta metoda IronPDF ładuje wybrany plik PDF do obiektu PdfDocument.
  • pdf.ExtractAllText(): To kluczowa funkcja IronPDF dla tego poradnika. Czyta cały plik PDF i wyodrębnia wszystkie rozpoznawalne treści tekstowe do pojedynczego ciągu znaków. To niesamowicie przydatne w scenariuszach parsowania tekstu PDF w C#.
  • pdfDataRichTextBox.Text = extractedText;: Wyodrębniony tekst jest następnie przypisany do właściwości Text twojego RichTextBox (upewnij się, że nazwa pdfDataRichTextBox zgadza się z nazwą, którą nadałeś swojej kontrolce RichTextBox).

To pokazuje, jak IronPDF upraszcza czytanie tekstu PDF w C#, pozwalając deweloperom na programatyczny dostęp do treści PDF z minimalnym wysiłkiem.

Krok 6: Zbuduj i Uruchom Swoją Aplikację C# Przeglądarki Tekstu PDF

  1. W Visual Studio wejdź do menu "Buduj" i wybierz "Buduj rozwiązanie".
  2. Po pomyślnym zbudowaniu naciśnij "F5" lub kliknij przycisk "Start", aby uruchomić aplikację.

Twoje okno aplikacji pojawi się. Kliknij przycisk "Otwórz PDF i wyświetl tekst", wybierz plik PDF z komputera i kliknij "Otwórz".

Przeglądarka PDF Aplikacja C# Windows (Poradnik), Rysunek 6: Uruchom aplikację Uruchamianie aplikacji C# Przeglądarki Tekstu PDF

RichTextBox następnie wyświetli treść tekstową wyodrębnioną z wybranego pliku PDF.

Przeglądarka PDF Aplikacja C# Windows (Poradnik), Rysunek 7: Wyświetl treść tekstową po wybraniu pliku PDF Treść tekstowa wyodrębniona z PDF i wyświetlona w RichTextBox

Aby uzyskać informacje na temat wizualnego renderowania plików PDF w aplikacjach MAUI (co jest inne niż w tym poradniku skupiającym się na wyodrębnianiu tekstu), możesz eksplorować "Poradnik wyświetlania PDF w MAUI".

Wnioski: Łatwy dostęp do treści tekstowej PDF z C# i IronPDF

Przestrzegając tych kroków, stworzyłeś aplikację Windows Forms w języku C#, która skutecznie wyodrębnia i wyświetla treść tekstową z plików PDF za pomocą IronPDF. To podejście jest wartościowe, gdy potrzebujesz programatycznego dostępu do informacji tekstowych w PDF do wyświetlania, analizy lub dalszego przetwarzania w swoich aplikacjach .NET.

IronPDF oferuje solidne możliwości wyodrębniania tekstu PDF w języku C#, a to tylko jedna część jego wszechstronnego zestawu funkcji. Możesz również używać IronPDF do bardziej zaawansowanych zadań, takich jak wyszukiwanie tekstu w PDF, dodawanie adnotacji, drukowanie dokumentów PDF, szyfrowanie i deszyfrowanie PDF, oraz edytowanie formularzy PDF.

Pamiętaj, że ten poradnik skupiał się na jednym konkretnym użyciu: dostępności tekstu PDF w aplikacji C#. Możesz dostosować i rozbudować tę podstawę, aby spełnić bardziej złożone wymagania.

Jeśli jesteś zainteresowany eksplorowaniem pełnego potencjału IronPDF:

  • Zajrzyj do dokumentacji IronPDF po szczegółowe przewodniki i przykłady.
  • Aby używać IronPDF w swoich aplikacjach produkcyjnych bez ograniczeń wersji próbnej, wymagany jest klucz licencyjny. Możesz kupić licencję z witryny IronPDF. Licencje zaczynają się od $799.
  • Możesz również ocenić pełną wersję komercyjną z bezpłatną wersją próbną.

Często Zadawane Pytania

Jak wyodrębnić tekst z pliku PDF w aplikacji napisanej w języku C#?

Możesz użyć metody ExtractAllText() biblioteki IronPDF, aby efektywnie wyodrębnić całą rozpoznawalną treść tekstową z dokumentu PDF w swojej aplikacji napisanej w języku C#.

Jakie narzędzia są potrzebne do stworzenia przeglądarki tekstu PDF w języku C#?

Aby stworzyć przeglądarkę tekstu PDF w języku C#, potrzebujesz środowiska programistycznego Visual Studio oraz biblioteki IronPDF, którą możesz zainstalować za pomocą menedżera pakietów NuGet.

Jak wyświetlić wyodrębniony tekst z pliku PDF w aplikacji Windows Forms?

W aplikacji Windows Forms można użyć kontrolki RichTextBox do wyświetlania treści tekstowej wyodrębnionej z pliku PDF, co pozwala na wyświetlanie sformatowanego tekstu.

Jak wygląda proces wyboru pliku PDF w aplikacji napisanej w języku C#?

Aby wybrać plik PDF, dodaj do formularza kontrolkę Button, która otwiera okno dialogowe plików. Umożliwi to użytkownikom przeglądanie i wybieranie pliku PDF, który chcą przetworzyć.

Jak radzić sobie z błędami podczas przetwarzania plików PDF w języku C#?

Możesz obsłużyć błędy, umieszczając kod przetwarzania plików PDF w bloku try-catch, a w przypadku wystąpienia wyjątków wyświetlać komunikaty o błędach za pomocą funkcji MessageBox.Show.

Jakie dodatkowe możliwości oferuje IronPDF?

IronPDF oferuje funkcje wykraczające poza wyodrębnianie tekstu, w tym konwersję HTML do PDF, dodawanie adnotacji, wyszukiwanie tekstu, szyfrowanie i deszyfrowanie plików PDF, drukowanie oraz edycję formularzy PDF.

Jak skonfigurować nowy projekt Windows Forms w Visual Studio do przetwarzania plików PDF?

W programie Visual Studio wybierz opcję „Utwórz nowy projekt”, a następnie „Aplikacja Windows Forms (.NET Framework)”. Nadaj nazwę projektowi i kliknij „Utwórz”, aby skonfigurować projekt do przetwarzania plików PDF.

Jakie kroki są wymagane, aby uruchomić aplikację do przeglądania tekstu PDF w języku C#?

Wybierz opcję „Build Solution” z menu Build w Visual Studio, a następnie naciśnij klawisz F5 lub kliknij przycisk „Start”, aby uruchomić aplikację. Użyj przycisku, aby wybrać plik PDF i wyświetlić jego tekst.

Czy IronPDF może służyć do konwersji HTML na PDF?

Tak, IronPDF może konwertować HTML na PDF przy użyciu metod takich jak RenderHtmlAsPdf dla ciągów HTML lub RenderHtmlFileAsPdf dla plików HTML.

Jakie są typowe scenariusze rozwiązywania problemów związanych z ekstrakcją tekstu z plików PDF?

Typowe problemy obejmują obsługę niestandardowych czcionek lub zaszyfrowanych plików PDF. Należy upewnić się, że plik PDF nie jest chroniony hasłem, a w przypadku niepowodzenia wyodrębniania tekstu sprawdzić kompatybilność czcionek.

Czy IronPDF jest kompatybilny z .NET 10?

Tak — IronPDF obsługuje .NET 10 oraz wcześniejsze wersje (takie jak .NET 9, 8, 7, 6, .NET Core, .NET Standard i .NET Framework), co oznacza, że można stworzyć przeglądarkę tekstu Windows Forms przy użyciu IronPDF w projekcie .NET 10 bez problemów z kompatybilnością.

Curtis Chau
Autor tekstów technicznych

Curtis Chau posiada tytuł licencjata z informatyki (Uniwersytet Carleton) i specjalizuje się w front-endowym rozwoju, z ekspertką w Node.js, TypeScript, JavaScript i React. Pasjonuje się tworzeniem intuicyjnych i estetycznie przyjemnych interfejsów użytkownika, Curtis cieszy się pracą z nowoczesnymi frameworkami i tworzeniem dobrze zorganizowanych, atrakcyjnych wizualnie podrę...

Czytaj więcej

Zespol wsparcia Iron

Jestesmy online 24 godziny, 5 dni w tygodniu.
Czat
Email
Zadzwon do mnie