Ir para o conteúdo do rodapé
USANDO O IRONPDF

Tutorial de C#: Crie um visualizador de conteúdo de texto em PDF com IronPDF (Windows Forms)

Na era digital atual, os arquivos PDF são parte integrante de muitos fluxos de trabalho nas áreas da educação, dos negócios e do uso pessoal. São um formato padrão para compartilhar e apresentar diversos tipos de dados, incluindo texto, imagens e tabelas.

Embora exibir documentos PDF completos com fidelidade visual total em um aplicativo Windows Forms em C# possa envolver componentes de renderização dedicados, os desenvolvedores geralmente têm outras necessidades. Às vezes, o objetivo é ler o texto de um PDF em C#, extrair dados ou exibir o conteúdo textual de um PDF para revisão rápida, indexação ou acessibilidade.

Este artigo irá guiá-lo na criação de um aplicativo focado nesta tarefa específica: construir um visualizador de conteúdo de texto em PDF simples em C# usando o IronPDF, uma poderosa biblioteca .NET . Você aprenderá como usar o IronPDF para carregar um PDF e extrair e exibir seu conteúdo de texto de forma eficaz em um aplicativo Windows Forms.

O que é o IronPDF?

IronPDF é uma biblioteca C# abrangente que permite aos desenvolvedores .NET criar, editar e processar arquivos PDF em seus aplicativos. Ele permite aos usuários converter HTML, imagens e SVG em documentos PDF e, o que é importante para este tutorial, ler e extrair conteúdo de PDFs existentes. O IronPDF foi projetado para ser fácil de usar e oferece uma ampla gama de recursos para manipular arquivos PDF.

Requisitos para a criação de um visualizador de texto em PDF

Para criar este aplicativo de exibição de texto em PDF em C#, você precisará de:

  • Visual Studio: Um ambiente de desenvolvimento integrado (IDE) para a criação de aplicativos Windows Forms.
  • IronPDF: Um pacote NuGet que fornece a funcionalidade para ler, criar e manipular documentos PDF, incluindo extração de texto.

Ilustração mostrando o conceito de conversão de HTML para PDF O IronPDF também pode criar PDFs a partir de HTML, um recurso separado da extração de texto mostrada neste tutorial.

Passos para criar um visualizador de conteúdo de texto em PDF em C# com IronPDF

Passo 1: Crie um novo aplicativo Windows Forms no Visual Studio.

Para começar, abra o Visual Studio e clique em "Criar um novo projeto". Selecione "Aplicativo Windows Forms (.NET Framework)" ou um modelo .NET semelhante na lista.

Diálogo de novo projeto do Visual Studio Criação de um novo projeto no Visual Studio

Em seguida, forneça um nome para o seu projeto (por exemplo, CSharpPdfTextReader) e clique no botão Criar. Isso criará um novo projeto de Aplicativo Windows Forms.

Passo 2: Instale a biblioteca IronPDF

Usando a interface gráfica do Gerenciador de Pacotes NuGet

  1. No Solution Explorer, clique com o botão direito do mouse no seu projeto e selecione "Gerenciar Pacotes NuGet ..."
  2. Vá para a aba "Procurar" e pesquise por "IronPDF".
  3. Selecione o pacote IronPdf e clique em "Instalar".

 Gerenciador de Pacotes NuGet no Visual Studio procurando por IronPDF Instalando o IronPDF via Gerenciador de Pacotes NuGet

Usando o console do Gerenciador de Pacotes NuGet

Como alternativa, abra o Console do Gerenciador de Pacotes (Ferramentas > Gerenciador de Pacotes NuGet > Console do Gerenciador de Pacotes) e execute o comando:

Install-Package IronPdf

Isso fará o download e a instalação do IronPDF e suas dependências em seu projeto.

Passo 3: Adicione um RichTextBox ao seu formulário para exibir o texto.

Usaremos um controle RichTextBox para exibir o conteúdo de texto extraído do PDF. Um RichTextBox é adequado para exibir texto formatado, embora para este tutorial, sua função principal seja apresentar o texto simples extraído pelo IronPDF. Exibe de forma eficaz as informações textuais sem tentar reproduzir o layout visual original do PDF.

Para adicionar um RichTextBox:

  1. Abra o formulário na visualização Designer.
  2. Acesse a Caixa de Ferramentas (Exibir > Caixa de Ferramentas).
  3. Encontre RichTextBox em "Controles Comuns" e arraste-o para o seu formulário.
  4. Ajuste seu tamanho e posição conforme necessário. Na janela Propriedades, você pode definir seu Name (por exemplo, pdfDataRichTextBox) e definir sua propriedade Dock para Fill se quiser que ocupe a maior parte do formulário.

Aplicativo Windows Visualizador de PDF em C# (Tutorial), Figura 4: Acessando o RickTextBox no Form1 Adicionando um RichTextBox ao Form1 para exibir o texto extraído do PDF.

Passo 4: Adicione um botão para selecionar o arquivo PDF

Adicione um controle Button ao seu formulário. Os usuários clicarão neste botão para abrir uma caixa de diálogo de arquivo e selecionar um arquivo PDF para extração de texto.

  1. Arraste um Button da Caixa de Ferramentas para o seu formulário.
  2. Na janela Propriedades, defina seus valores Name (por exemplo, openBtn) e Text (por exemplo, "Abrir PDF e exibir texto").

Aplicativo Windows Visualizador de PDF em C# (Tutorial), Figura 5: Adicionar um novo botão ao Form1 Adicionando um botão ao Form1 para acionar a seleção de PDF.

Etapa 5: Adicione o código C# para carregar o PDF e extrair o texto.

Clique duas vezes no botão que você acabou de adicionar ("Abrir PDF e exibir texto") para criar seu manipulador de eventos Click em Form1.cs.

Primeiro, certifique-se de ter importado o namespace IronPDF no início do seu arquivo Form1.cs:

using IronPdf;
using System; // For EventArgs, Exception
using System.Windows.Forms; // For OpenFileDialog, MessageBox, DialogResult, etc.
using IronPdf;
using System; // For EventArgs, Exception
using System.Windows.Forms; // For OpenFileDialog, MessageBox, DialogResult, etc.
Imports IronPdf
Imports System ' For EventArgs, Exception
Imports System.Windows.Forms ' For OpenFileDialog, MessageBox, DialogResult, etc.
$vbLabelText   $csharpLabel

Agora, implemente o manipulador de eventos para o clique do botão. Este código irá:

  1. Solicite ao usuário que selecione um arquivo PDF.
  2. Utilize o IronPDF para carregar o PDF selecionado.
  3. Use o método ExtractAllText() do IronPDF para obter todo o texto do PDF.
  4. Exiba este texto extraído em RichTextBox.
private void openBtn_Click(object sender, EventArgs e)
{
    // Create an OpenFileDialog to open PDF files
    var openFileDialog = new OpenFileDialog
    {
        Filter = "PDF files (*.pdf)|*.pdf|All files (*.*)|*.*", // Filter to show only PDFs
        Title = "Select a PDF file to extract text from" // Dialog title
    };

    // Show dialog and check if the user selected a file
    if (openFileDialog.ShowDialog() == DialogResult.OK)
    {
        try
        {
            // It's recommended to set your license key once at application startup.
            // License.LicenseKey = "YourIronPdfLicenseKey"; 
            // If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
            // For text extraction, the trial is fully functional for development.

            // Load the selected PDF using IronPDF
            var pdf = PdfDocument.FromFile(openFileDialog.FileName);

            // Extract all text content from the PDF using IronPDF
            string extractedText = pdf.ExtractAllText();

            // Display the extracted text in the RichTextBox
            // (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
            pdfDataRichTextBox.Text = extractedText; 
        }
        catch (Exception ex)
        {
            // Show error message if an exception occurs
            MessageBox.Show("An error occurred while processing the PDF file: " + ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error);
        }
    }
}
private void openBtn_Click(object sender, EventArgs e)
{
    // Create an OpenFileDialog to open PDF files
    var openFileDialog = new OpenFileDialog
    {
        Filter = "PDF files (*.pdf)|*.pdf|All files (*.*)|*.*", // Filter to show only PDFs
        Title = "Select a PDF file to extract text from" // Dialog title
    };

    // Show dialog and check if the user selected a file
    if (openFileDialog.ShowDialog() == DialogResult.OK)
    {
        try
        {
            // It's recommended to set your license key once at application startup.
            // License.LicenseKey = "YourIronPdfLicenseKey"; 
            // If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
            // For text extraction, the trial is fully functional for development.

            // Load the selected PDF using IronPDF
            var pdf = PdfDocument.FromFile(openFileDialog.FileName);

            // Extract all text content from the PDF using IronPDF
            string extractedText = pdf.ExtractAllText();

            // Display the extracted text in the RichTextBox
            // (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
            pdfDataRichTextBox.Text = extractedText; 
        }
        catch (Exception ex)
        {
            // Show error message if an exception occurs
            MessageBox.Show("An error occurred while processing the PDF file: " + ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error);
        }
    }
}
Private Sub openBtn_Click(ByVal sender As Object, ByVal e As EventArgs)
	' Create an OpenFileDialog to open PDF files
	Dim openFileDialog As New OpenFileDialog With {
		.Filter = "PDF files (*.pdf)|*.pdf|All files (*.*)|*.*",
		.Title = "Select a PDF file to extract text from"
	}

	' Show dialog and check if the user selected a file
	If openFileDialog.ShowDialog() = DialogResult.OK Then
		Try
			' It's recommended to set your license key once at application startup.
			' License.LicenseKey = "YourIronPdfLicenseKey"; 
			' If no key is set, IronPDF runs in trial mode (watermarks on output, time limits).
			' For text extraction, the trial is fully functional for development.

			' Load the selected PDF using IronPDF
			Dim pdf = PdfDocument.FromFile(openFileDialog.FileName)

			' Extract all text content from the PDF using IronPDF
			Dim extractedText As String = pdf.ExtractAllText()

			' Display the extracted text in the RichTextBox
			' (Assuming your RichTextBox is named pdfDataRichTextBox, change if different)
			pdfDataRichTextBox.Text = extractedText
		Catch ex As Exception
			' Show error message if an exception occurs
			MessageBox.Show("An error occurred while processing the PDF file: " & ex.Message, "Error", MessageBoxButtons.OK, MessageBoxIcon.Error)
		End Try
	End If
End Sub
$vbLabelText   $csharpLabel

Análise do código:

  • openFileDialog: Uma caixa de diálogo padrão para seleção de arquivos, filtrada para arquivos PDF.
  • PdfDocument.FromFile(openFileDialog.FileName): Este método IronPDF carrega o PDF escolhido em um objeto PdfDocument.
  • pdf.ExtractAllText(): Esta é a função principal do IronPDF para este tutorial. Ele lê todo o PDF e extrai todo o conteúdo de texto discernível em uma única sequência. Isso é incrivelmente útil para cenários de análise de texto em PDF com C# .
  • pdfDataRichTextBox.Text = extractedText;: O texto extraído é então atribuído à propriedade Text do seu RichTextBox (certifique-se de que o nome pdfDataRichTextBox corresponda ao nome que você deu ao seu controle RichTextBox).

Isso demonstra como o IronPDF simplifica a leitura de texto em PDFs em C# , permitindo que os desenvolvedores acessem o conteúdo do PDF programaticamente com o mínimo esforço.

Etapa 6: Crie e execute seu aplicativo visualizador de texto PDF em C#

  1. No Visual Studio, vá ao menu "Compilar" e selecione "Compilar Solução".
  2. Após a compilação ser concluída com sucesso, pressione "F5" ou clique no botão "Iniciar" para executar o aplicativo.

A janela do seu aplicativo será exibida. Clique no botão "Abrir PDF e exibir texto", selecione um arquivo PDF do seu computador e clique em "Abrir".

Aplicativo Visualizador de PDF em C# para Windows (Tutorial), Figura 6: Executar o Aplicativo Executando o aplicativo visualizador de texto PDF em C#

O RichTextBox exibirá então o conteúdo de texto extraído do arquivo PDF selecionado.

Aplicativo Visualizador de PDF em C# para Windows (Tutorial), Figura 7: Exibir o conteúdo do texto após selecionar um arquivo PDF Conteúdo de texto extraído do PDF e exibido em RichTextBox

Para obter informações sobre a renderização visual de PDFs em aplicativos MAUI (que é diferente do foco deste tutorial, que é a extração de texto), você pode consultar o " Tutorial de visualização de PDF no MAUI ".

Conclusão: Acessar o conteúdo de texto de um PDF ficou fácil com C# e IronPDF.

Seguindo esses passos, você criou um aplicativo C# Windows Forms que extrai e exibe com eficiência o conteúdo de texto de arquivos PDF usando o IronPDF. Essa abordagem é valiosa quando você precisa acessar programaticamente as informações textuais em PDFs para exibição, análise ou processamento posterior em seus aplicativos .NET .

O IronPDF oferece recursos robustos para extração de texto em PDF usando C#, e essa é apenas uma parte de seu conjunto abrangente de funcionalidades. Você também pode usar o IronPDF para tarefas mais avançadas, como busca de texto em PDFs, adição de anotações , impressão de documentos PDF , criptografia e descriptografia de PDFs e edição de formulários PDF .

Lembre-se, este tutorial focou em um caso de uso específico: tornar o texto de um PDF acessível em um aplicativo C#. Você pode adaptar e expandir essa base para atender a requisitos mais complexos.

Se você estiver interessado em explorar todo o potencial do IronPDF:

  • Consulte a documentação do IronPDF para obter guias e exemplos detalhados.
  • Para usar o IronPDF em seus aplicativos de produção sem as limitações da versão de avaliação, é necessária uma chave de licença. Você pode adquirir uma licença no site da IronPDF . As licenças começam a partir de $799.
  • Você também pode avaliar a versão comercial completa com um período de teste gratuito .

Perguntas frequentes

Como posso extrair texto de um PDF em uma aplicação C#?

Você pode usar o método ExtractAllText() do IronPDF para extrair com eficiência todo o conteúdo de texto discernível de um documento PDF em sua aplicação C#.

Quais ferramentas eu preciso para criar um visualizador de texto em PDF em C#?

Para criar um visualizador de texto em PDF em C#, você precisa do Visual Studio como ambiente de desenvolvimento e da biblioteca IronPDF, que pode ser instalada através do Gerenciador de Pacotes NuGet.

Como faço para exibir o texto extraído de um PDF em um aplicativo Windows Forms?

Você pode usar um controle RichTextBox em seu aplicativo Windows Forms para exibir o conteúdo de texto extraído de um PDF, o que permite a exibição de texto formatado.

Qual é o processo para selecionar um arquivo PDF em uma aplicação C#?

Para selecionar um arquivo PDF, adicione um controle de botão ao seu formulário que abra uma caixa de diálogo de seleção de arquivo. Isso permite que os usuários naveguem e selecionem o arquivo PDF que desejam processar.

Como posso lidar com erros durante o processamento de PDF em C#?

Você pode lidar com erros encapsulando seu código de processamento de PDF em um bloco try-catch e exibindo mensagens de erro usando MessageBox.Show caso ocorram exceções.

Que funcionalidades adicionais o IronPDF oferece?

O IronPDF oferece funcionalidades que vão além da extração de texto, incluindo conversão de HTML para PDF, adição de anotações, busca de texto, criptografia e descriptografia de PDFs, impressão e edição de formulários em PDF.

Como faço para configurar um novo projeto Windows Forms no Visual Studio para processamento de PDF?

No Visual Studio, selecione "Criar um novo projeto" e escolha "Aplicativo Windows Forms (.NET Framework)". Dê um nome ao seu projeto e clique em "Criar" para configurá-lo para processamento de PDF.

Quais são os passos necessários para executar o aplicativo visualizador de texto PDF em C#?

Selecione "Compilar Solução" no menu Compilar do Visual Studio e pressione F5 ou clique em "Iniciar" para executar o aplicativo. Use o botão para selecionar um arquivo PDF e exibir seu texto.

O IronPDF pode ser usado para conversão de HTML para PDF?

Sim, o IronPDF pode converter HTML em PDF usando métodos como RenderHtmlAsPdf para strings HTML ou RenderHtmlFileAsPdf para arquivos HTML.

Quais são alguns cenários comuns de resolução de problemas na extração de texto de PDFs?

Problemas comuns incluem o manuseio de fontes não padronizadas ou PDFs criptografados. Certifique-se de que o arquivo PDF não esteja protegido por senha e verifique a compatibilidade da fonte caso a extração de texto falhe.

O IronPDF é compatível com o .NET 10?

Sim — o IronPDF é compatível com o .NET 10, além de versões anteriores (como .NET 9, 8, 7, 6, .NET Core, .NET Standard e .NET Framework), o que significa que você pode criar seu visualizador de texto do Windows Forms usando o IronPDF em um projeto .NET 10 sem problemas de compatibilidade.

Curtis Chau
Redator Técnico

Curtis Chau é bacharel em Ciência da Computação (Universidade Carleton) e se especializa em desenvolvimento front-end, com experiência em Node.js, TypeScript, JavaScript e React. Apaixonado por criar interfaces de usuário intuitivas e esteticamente agradáveis, Curtis gosta de trabalhar com frameworks modernos e criar manuais ...

Leia mais

Equipe de suporte de ferro

Estamos online 24 horas por dia, 5 dias por semana.
Bater papo
E-mail
Liga para mim