PDF para HTML
Assim como o IronPDF consegue gerar arquivos PDF com perfeição de pixels a partir de conteúdo HTML, ele também pode ser usado para converter documentos PDF em HTML. Por meio do uso das classes PdfDocument e HtmlFormatOptions, os usuários terão acesso aos métodos necessários para converter o PDF em HTML e controlar a formatação do conteúdo HTML final.
5 passos para converter PDF em HTML
Aqui está um exemplo de código passo a passo que ilustra como realizar a conversão:
Para começar a converter um arquivo PDF em HTML, primeiro devemos carregar o PDF que desejamos converter usando o método FromFile da classe PdfDocument. Este método recebe o nome do arquivo ou o local do arquivo que passamos para ele e o carrega em um novo objeto PdfDocument, pdf . Agora, poderemos simplesmente referenciar esse objeto sempre que quisermos acessá-lo para o processo de conversão.
Em seguida, demonstraremos o método de conversão de um documento PDF em um objeto de string HTML simples, que poderá então ser exibido no console, pronto para ser manipulado posteriormente, dependendo das necessidades do desenvolvedor. A seguinte linha de código demonstra outra maneira, onde convertemos o PDF em um arquivo HTML, pronto para trabalhos mais complexos ou compartilhamento em comparação com a simples string HTML. Ambos os métodos requerem apenas uma única linha para realizar o processo de conversão, tornando-os fáceis de usar e eficientes.
Agora vejamos um exemplo mais avançado, no qual pegamos a classe HtmlFormatOptions e usamos suas propriedades para personalizar a saída HTML final. Com essa classe, você pode ajustar diversos aspectos, como cor de fundo, cor do título (H1), alinhamento do texto H1, margens da página e muito mais. Primeiro, precisamos criar uma nova instância desta classe, chamada htmlFormat no código.
Neste exemplo, alteramos a cor de fundo para branco e definimos a cor do texto H1 para azul usando a classe IronSoftware.Drawing.Color. Em seguida, ajustamos o tamanho da fonte H1 para 25 pixels. Em seguida, personalizamos o alinhamento do texto H1 para que fique centralizado. Por fim, definimos as margens da página PDF no documento HTML para 10 pixels.
A etapa final envolve usar novamente o método SaveAsHtml para converter o PDF em HTML, desta vez com parâmetros adicionais. O primeiro parâmetro é o nome e o local onde o documento HTML recém-gerado será salvo. Em seguida, definimos um valor booleano, fullContentWidth , como verdadeiro, o que configura o HTML para usar a largura total para o conteúdo do PDF. Também especificamos um título para a saída HTML e, finalmente, aplicamos as configurações de personalização que criamos anteriormente com htmlFormatOptions.
Explore agora mesmo o nosso Guia de Conversão de PDF para HTML!

