如何將PDF轉換為HTML

This article was translated from English: Does it need improvement?
Translated
View the article in English

海里海西米·賓·奧馬

將 PDF 轉換為 HTML 提供各種好處,包括增強用戶的網頁可訪問性、不同設備的響應能力以及改進的搜尋引擎優化。 (搜索引擎優化),無縫的網頁整合,透過基於網頁的工具和內容管理系統輕鬆編輯內容,跨平台相容性,並且能夠使用動態元素和多媒體。

IronPDF 簡化了在 .NET C# 中將 PDF 轉換為 HTML 的過程。


C# NuGet 程式庫用于 PDF

安裝與 NuGet

Install-Package IronPdf
Java PDF JAR

下載 DLL

下載DLL

手動安裝到您的項目中

C# NuGet 程式庫用于 PDF

安裝與 NuGet

Install-Package IronPdf
Java PDF JAR

下載 DLL

下載DLL

手動安裝到您的項目中

立即開始在您的專案中使用IronPDF,並享受免費試用。

第一步:
green arrow pointer

查看 IronPDFNuget 快速安裝和部署。已被下載超過800萬次,它正用C#改變PDF。

C# NuGet 程式庫用于 PDF nuget.org/packages/IronPdf/
Install-Package IronPdf

請考慮安裝 IronPDF DLL 直接下載並手動安裝到您的專案或GAC表單: IronPdf.zip

手動安裝到您的項目中

下載DLL

PDF轉HTML範例

ToHtmlString方法主要用於讓使用者分析現有PDF文件中的HTML元素。這是一個用於調試或PDF比較的有用工具。除了將PDF文件轉換為HTML字符串,我們還提供一個直接的方法,使用者可以使用SaveAsHtml方法將PDF文件保存為HTML文件。這為使用者提供了根據其特定需求選擇最合適方法的靈活性。

請注意
原始 PDF 中的所有互動式表單字段在生成的 HTML 文件中將不再可用。

範例 PDF 文件

:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html.cs
using IronPdf;
using System;

PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);

// Convert PDF to HTML file
pdf.SaveAsHtml("myHtml.html");
IRON VB CONVERTER ERROR developers@ironsoftware.com
VB   C#

Output Html

整個由 SaveAsHtml 方法生成的輸出 HTML 已經輸入到下面的網站中。


PDF to HTML 高級範例

ToHtmlStringSaveAsHtml 方法提供各種配置選項。以下是可用的屬性:

  • BackgroundColor:指定背景顏色。
  • PdfPageMargin:指定頁面邊距。

此外,以下屬性適用於 ToHtmlStringSaveAsHtml 方法中的 'title' 參數。這會在內容開頭新增一個標題,但不會修改輸入 PDF 文件的標題或者 h1。

  • H1Color:指定標題顏色。
  • H1FontSize:指定標題字體大小。

  • H1TextAlignment:指定標題對齊方式,如左對齊、居中或右對齊。
:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html-advanced-settings.cs
using IronPdf;
using IronSoftware.Drawing;
using System;

PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// PDF to HTML configuration options
HtmlFormatOptions htmlformat = new HtmlFormatOptions();
htmlformat.BackgroundColor = Color.White;
htmlformat.PdfPageMargin = 10;
htmlformat.H1Color = Color.Blue;
htmlformat.H1FontSize = 25;
htmlformat.H1TextAlignment = TextAlignment.Center;

// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);

// Convert PDF to HTML file
pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);
IRON VB CONVERTER ERROR developers@ironsoftware.com
VB   C#

Output Html

整個由 SaveAsHtml 方法生成的輸出 HTML 已經輸入到下面的網站中。

這些方法將產生帶有內嵌 CSS 的 HTML 字串。輸出的 HTML 使用了 SVG 術語/標籤,而不是通常的 HTML 標籤。儘管有所不同,但它仍然是一個有效的 HTML 字串,並且可以在網頁瀏覽器中同樣呈現。不過,重要的是用戶要注意,當使用 RenderHtmlAsPdf 方法呈現的 PDF 文件時,從此方法返回的 HTML 字串可能會與輸入的 HTML 不同,原因如上所述。

海里海西米·賓·奧馬

軟體工程師

和所有優秀的工程師一樣,Hairil 是一位熱衷學習的人。他正在精進自己對 C#、Python 和 Java 的知識,利用這些知識為 Iron Software 團隊的成員創造價值。Hairil 從馬來西亞的馬來西亞工藝大學加入了 Iron Software 團隊,他在那裡獲得了化學和過程工程學士學位。