using IronPdf; // Disable local disk access or cross-origin requests Installation.EnableWebSecurity = true; // Instantiate Renderer var renderer = new ChromePdfRenderer(); // Create a PDF from a HTML string using C# var pdf = renderer.RenderHtmlAsPdf("<h1>Hello World</h1>"); // Export to a file or Stream pdf.SaveAs("output.pdf"); // Advanced Example with HTML Assets // Load external html assets: Images, CSS and JavaScript. // An optional BasePath 'C:\site\assets\' is set as the file location to load assets from var myAdvancedPdf = renderer.RenderHtmlAsPdf("<img src='icons/iron.png'>", @"C:\site\assets\"); myAdvancedPdf.SaveAs("html-with-assets.pdf");

USANDO O IRONPDF

Tutorial fácil para ler arquivos PDF em C#

Curtis Chau

Atualizado:junho 20, 2025

O processamento programático de PDFs é crucial em setores como finanças, saúde, direito e educação, onde informações críticas precisam ser processadas, analisadas e extraídas de documentos PDF para fins como análise de dados, gerenciamento de documentos e automação. Apesar de sua importância, essa tarefa pode ser desafiadora.

IronPDF: Uma Biblioteca C# PDF

O IronPDF permite que você execute tarefas incrivelmente difíceis com facilidade. Permite editar facilmente o texto em um documento PDF, de forma semelhante a como se trabalha com arquivos de texto em um documento de texto, possibilitando ainda a exportação de arquivos em qualquer sistema operacional. O aplicativo IronPDF abrange todo o processo de visualização, modificação e extração de conteúdo de um PDF.

Dê o passo certo com o IronPDF

É possível ler e escrever textos em formato PDF de forma rápida e fácil usando qualquer computador com o Iron SoftwarePDF . A instalação é uma tarefa simples. Esta é a melhor maneira de aprender a ler arquivos PDF em C#. Você também pode baixar o IronPDF gratuitamente para desenvolvimento. Ao explorar o IronPDF, você perceberá que a biblioteca oferece ampla funcionalidade, o que facilita muito o uso de PDFs. Explore as aulas no seu tempo livre! Existem vários exemplos em C# que utilizam HTML para criar um PDF, permitindo que você aprenda a gerar uma saída otimizada a partir da leitura de PDFs.

Leia arquivos PDF usando o IronPDF

Passo 1: Instale o pacote IronPDF

Para começar, você precisará instalar o pacote NuGet IronPDF em seu projeto .NET . Você pode fazer isso abrindo o Console do Gerenciador de Pacotes no Visual Studio e digitando o seguinte comando:

Install-Package IronPdf

Passo 2: Importe a biblioteca IronPDF

Em seguida, você precisa importar a biblioteca IronPDF para o seu código, adicionando a seguinte instrução no início do seu arquivo:

using IronPdf;

using IronPdf;

Imports IronPdf

$vbLabelText $csharpLabel

Passo 3: Carregar o documento PDF

Após importar a biblioteca IronPDF , você pode carregar um documento PDF em seu código usando o seguinte código:

// Load the PDF document from file path
PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");

// Define the output path for the saved PDF
var outputPath = "Example.pdf";

// Save the PDF document to the specified output path
pdf.SaveAs(outputPath);

// Load the PDF document from file path
PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");

// Define the output path for the saved PDF
var outputPath = "Example.pdf";

// Save the PDF document to the specified output path
pdf.SaveAs(outputPath);

' Load the PDF document from file path
Dim pdf As PdfDocument = PdfDocument.FromFile("C:\dotnet.pdf")

' Define the output path for the saved PDF
Dim outputPath = "Example.pdf"

' Save the PDF document to the specified output path
pdf.SaveAs(outputPath)

$vbLabelText $csharpLabel

Etapa 4: Extrair o texto do PDF

O IronPDF oferece diversos métodos para extrair texto de um arquivo PDF existente. Por exemplo, você pode começar a extrair texto de um PDF e imprimi-lo no console usando o seguinte trecho de código:

// Extract text from the loaded PDF document
string text = pdf.ExtractText();

// Print the extracted text to the console
Console.WriteLine(text);

// Extract text from the loaded PDF document
string text = pdf.ExtractText();

// Print the extracted text to the console
Console.WriteLine(text);

' Extract text from the loaded PDF document
Dim text As String = pdf.ExtractText()

' Print the extracted text to the console
Console.WriteLine(text)

$vbLabelText $csharpLabel

Usando o código acima, você pode extrair texto de um arquivo PDF .

Como Ler Arquivos PDF em C#, Figura 1: Extraindo Texto de um PDF Usando IronPDF Extraindo texto de um PDF usando o IronPDF

Etapa 5: Rasterizar um PDF em imagens

Vamos rasterizar o arquivo PDF em imagens com o IronPDF usando o IronPDF. Primeiro, importe as bibliotecas necessárias:

using System.Linq;
using IronPdf;
using IronSoftware.Drawing;

using System.Linq;
using IronPdf;
using IronSoftware.Drawing;

Imports System.Linq
Imports IronPdf
Imports IronSoftware.Drawing

$vbLabelText $csharpLabel

O código então usa o RasterizeToImageFiles método para extrair todas as páginas do documento PDF para uma pasta como arquivos de imagem. As imagens extraídas podem ser salvas como arquivos PNG ou JPG, e as dimensões e intervalos de páginas das imagens também podem ser especificados.

// Extract all pages to a folder as image files with PNG format
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Extract all pages to JPG images with specified dimensions
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);

// Extract all pages to a folder as image files with PNG format
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Extract all pages to JPG images with specified dimensions
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);

' Extract all pages to a folder as image files with PNG format
pdf.RasterizeToImageFiles("C:\image\folder\*.png")

' Extract all pages to JPG images with specified dimensions
pdf.RasterizeToImageFiles("C:\image\folder\example_pdf_image_*.jpg", 100, 80)

$vbLabelText $csharpLabel

Finalmente, o código usa o ToBitmap método para extrair todas as páginas do documento PDF como objetos AnyBitmap, que podem ser processados e manipulados adiante no código.

// Extract all pages as AnyBitmap objects for further processing
AnyBitmap[] pdfBitmaps = pdf.ToBitmap();

// Extract all pages as AnyBitmap objects for further processing
AnyBitmap[] pdfBitmaps = pdf.ToBitmap();

' Extract all pages as AnyBitmap objects for further processing
Dim pdfBitmaps() As AnyBitmap = pdf.ToBitmap()

$vbLabelText $csharpLabel

O código acima demonstra como extrair o conteúdo de um arquivo PDF usando IronPDF e salvar os dados extraídos como arquivos de imagem ou objetos AnyBitmap para processamento adicional.

Etapa 7: Manipular páginas do PDF

Vamos aprender como manipular as páginas de um documento PDF usando o IronPDF.

O código primeiro remove as páginas duas e três do documento PDF usando o RemovePages método:

// Remove pages two and three from the PDF document
pdf.RemovePages(1, 2);

// Remove pages two and three from the PDF document
pdf.RemovePages(1, 2);

' Remove pages two and three from the PDF document
pdf.RemovePages(1, 2)

$vbLabelText $csharpLabel

O método RemovePages leva dois argumentos: a página inicial para remover (neste caso, a página 2, representada como 1 já que a numeração começa em 0) e o número de páginas a remover (neste caso, 2 páginas).

Passo 6: Salve o PDF

Finalmente, você pode salvar o arquivo PDF no seu sistema local usando o SaveAs método. O código para salvar o arquivo PDF é o seguinte:

// Save the PDF document to a specified output path
pdf.SaveAs(outputPath);

// Save the PDF document to a specified output path
pdf.SaveAs(outputPath);

' Save the PDF document to a specified output path
pdf.SaveAs(outputPath)

$vbLabelText $csharpLabel

Compatibilidade com IronPDF

O IronPDF é altamente compatível com todas as versões mais recentes do .NET Framework, incluindo o .NET 7. Ele também oferece suporte ao .NET Blazor e ao .NET MAUI, que são as ofertas mais recentes da Microsoft para desenvolvimento web. A compatibilidade da biblioteca com essas estruturas permite que os desenvolvedores integrem o IronPDF em seus aplicativos sem problemas e aproveitem seus recursos avançados.

Uma das principais características do IronPDF é sua capacidade de ler arquivos PDF em .NET Blazor e .NET MAUI. Este recurso permite que os desenvolvedores leiam e extraiam dados de arquivos PDF de forma rápida e fácil, utilizando-os em aplicativos .NET . Essa funcionalidade pode ser especialmente útil ao trabalhar com um grande volume de dados. Os desenvolvedores não precisam de nenhuma outra biblioteca para usar o IronPDF em seus projetos .NET .

Obtenha mais informações sobre como o IronPDF funciona com o .NET Blazor neste tutorial e aprenda sobre como integrar o IronPDF com o .NET MAUI no site do IronPDF.

Conclusão

Em conclusão, a leitura programática de arquivos PDF é crucial em diversos setores. O IronPDF oferece uma solução completa para essa tarefa, disponibilizando ampla funcionalidade para ler, modificar e extrair conteúdo de um arquivo PDF. O IronPDF é fácil de instalar e usar, exigindo apenas alguns passos simples.

A biblioteca oferece métodos para extrair texto de documentos PDF , rasterizar um PDF em uma imagem , manipular páginas e salvar arquivos PDF. Seja você um iniciante no processamento programático de PDFs ou um desenvolvedor experiente, o IronPDF é a ferramenta perfeita para levar suas habilidades para o próximo nível.

Se você procura uma solução confiável e eficiente para leitura de arquivos PDF em C#, vale a pena explorar o IronPDF , especialmente considerando suas opções de licença, informações de preços e a disponibilidade de um período de teste gratuito . Você pode ver mais projetos fornecidos pela IronPDF na imagem abaixo. Você pode selecionar o pacote que melhor atenda às suas necessidades.

Como Ler Arquivos PDF em C#, Figura 2: Preços de Licenciamento IronPDF Preços de licenciamento do IronPDF

Perguntas frequentes

Como posso ler arquivos PDF em C#?

Você pode usar o IronPDF instalando-o primeiro através do gerenciador de pacotes NuGet em seu projeto .NET. Em seguida, importe a biblioteca e use-a para carregar e ler documentos PDF, extraindo o texto e exibindo-o no console.

Quais setores se beneficiam do processamento programático de PDFs?

Setores como o financeiro, o da saúde, o jurídico e o da educação se beneficiam significativamente do processamento programático de PDFs, pois ele permite uma análise de dados eficiente, o gerenciamento de documentos e a automação de tarefas usando ferramentas como o IronPDF.

Como posso extrair dados de um documento PDF usando C#?

Com o IronPDF, você pode extrair dados de um documento PDF carregando o PDF e utilizando métodos como ExtractText para ler e processar o conteúdo programaticamente.

É possível converter arquivos PDF em imagens usando C#?

Sim, com o IronPDF, você pode converter arquivos PDF em imagens usando o método RasterizeToImageFiles , permitindo salvar páginas como arquivos de imagem em formatos como PNG ou JPG.

O IronPDF é compatível com as versões mais recentes do .NET Framework?

O IronPDF é compatível com todas as versões mais recentes do .NET Framework, incluindo o .NET 7. Ele também oferece suporte ao .NET Blazor e ao .NET MAUI, permitindo a integração em diversos tipos de aplicativos.

Como posso modificar e salvar um arquivo PDF usando C#?

Após fazer modificações em um arquivo PDF usando o IronPDF, você pode salvar as alterações usando o método SaveAs , especificando o caminho de saída para o documento modificado.

Quais são os passos envolvidos na utilização de uma biblioteca PDF em um projeto .NET?

Para usar o IronPDF em um projeto .NET, instale a biblioteca via NuGet, importe-a para o seu projeto e, em seguida, use suas funcionalidades para carregar, ler e manipular documentos PDF programaticamente.

O IronPDF requer outras bibliotecas para processamento de PDF no .NET?

Não, o IronPDF é uma biblioteca independente que não requer bibliotecas adicionais, o que facilita a integração em seu projeto .NET para processamento completo de PDFs.

Quais são as principais funcionalidades do IronPDF para processamento de PDFs?

O IronPDF oferece recursos como extração de texto, rasterização de PDFs para imagens, manipulação de páginas e compatibilidade com as mais recentes estruturas .NET, tornando-o uma ferramenta poderosa para lidar com arquivos PDF em C#.

O IronPDF é totalmente compatível com o .NET 10?

Sim, o IronPDF é compatível com o .NET 10 (assim como com versões anteriores como .NET 9, 8, 7 e 6) nativamente. Você pode criar aplicativos usando o IronPDF no .NET 10 sem precisar de configurações especiais ou soluções alternativas.

Curtis Chau

Converse agora mesmo com a equipe de engenharia.

Redator Técnico

Curtis Chau é bacharel em Ciência da Computação (Universidade Carleton) e se especializa em desenvolvimento front-end, com experiência em Node.js, TypeScript, JavaScript e React. Apaixonado por criar interfaces de usuário intuitivas e esteticamente agradáveis, Curtis gosta de trabalhar com frameworks modernos e criar manuais ...

Destaque do cliente:

Destaque do desenvolvedor:

Webinários:

Experimente gratuitamente por 30 dias.

Tutorial fácil para ler arquivos PDF em C#

IronPDF: Uma Biblioteca C# PDF

Dê o passo certo com o IronPDF

Leia arquivos PDF usando o IronPDF

Passo 1: Instale o pacote IronPDF

Passo 2: Importe a biblioteca IronPDF

Passo 3: Carregar o documento PDF

Etapa 4: Extrair o texto do PDF

Etapa 5: Rasterizar um PDF em imagens

Etapa 7: Manipular páginas do PDF

Passo 6: Salve o PDF

Compatibilidade com IronPDF

Conclusão

Perguntas frequentes

Como posso ler arquivos PDF em C#?

Quais setores se beneficiam do processamento programático de PDFs?

Como posso extrair dados de um documento PDF usando C#?

É possível converter arquivos PDF em imagens usando C#?

O IronPDF é compatível com as versões mais recentes do .NET Framework?

Como posso modificar e salvar um arquivo PDF usando C#?

Quais são os passos envolvidos na utilização de uma biblioteca PDF em um projeto .NET?

O IronPDF requer outras bibliotecas para processamento de PDF no .NET?

Quais são as principais funcionalidades do IronPDF para processamento de PDFs?

O IronPDF é totalmente compatível com o .NET 10?

Sua chave de licença foi entregue à sua caixa de entrada

Sua solicitação de demonstração está em andamento.

Equipe de Suporte Iron

Experimente gratuitamente por 30 dias.

Tutorial fácil para ler arquivos PDF em C#

IronPDF: Uma Biblioteca C# PDF

Dê o passo certo com o IronPDF

Leia arquivos PDF usando o IronPDF

Passo 1: Instale o pacote IronPDF

Passo 2: Importe a biblioteca IronPDF

Passo 3: Carregar o documento PDF

Etapa 4: Extrair o texto do PDF

Etapa 5: Rasterizar um PDF em imagens

Etapa 7: Manipular páginas do PDF

Passo 6: Salve o PDF

Compatibilidade com IronPDF

Conclusão

Perguntas frequentes

Como posso ler arquivos PDF em C#?

Quais setores se beneficiam do processamento programático de PDFs?

Como posso extrair dados de um documento PDF usando C#?

É possível converter arquivos PDF em imagens usando C#?

O IronPDF é compatível com as versões mais recentes do .NET Framework?

Como posso modificar e salvar um arquivo PDF usando C#?

Quais são os passos envolvidos na utilização de uma biblioteca PDF em um projeto .NET?

O IronPDF requer outras bibliotecas para processamento de PDF no .NET?

Quais são as principais funcionalidades do IronPDF para processamento de PDFs?

O IronPDF é totalmente compatível com o .NET 10?

Artigos relacionados

Geração de extratos de conta mensais em formato PDF

Tutorial de PDFWriter em C# para desenvolvedores .NET 10

Visualizador de PDF para ASP.NET: Como Exibir PDFs em .NET 10

Próximo passo: Inicie o teste gratuito de 30 dias.

Thank You

Próximo passo: Inicie o teste gratuito de 30 dias.

Quer implantar o IronSuite em um projeto real de graça?

O que está incluído?

Sua chave de licença foi entregue à sua caixa de entrada

Sua solicitação de demonstração está em andamento.

Aprovado por milhões de engenheiros em todo o mundo.

Equipe de Suporte Iron