如何访问所有 PDF DOM 对象

This article was translated from English: Does it need improvement?
Translated
View the article in English

查克尼特·宾

访问 PDF DOM 对象是指与 PDF 文件结构进行交互,其方式与操作网页的 DOM 类似(文档对象模型). 在 PDF 的上下文中,DOM 是文档内部结构的表示,允许开发人员以编程方式访问和操作不同的元素,如文本、图像、注释和元数据。

立即在您的项目中开始使用IronPDF,并享受免费试用。

第一步:
green arrow pointer

访问 DOM 对象示例

可从 PdfPage 对象访问 ObjectModel 。 首先,导入目标 PDF 并访问其 Pages 属性。 从这里,选择任何页面,您就可以访问 ObjectModel 属性。

警告
此功能仍处于试验阶段。 从 DOM 访问文本对象时会泄露内存。

:path=/static-assets/pdf/content-code-examples/how-to/access-pdf-dom-object.cs
using IronPdf;
using System.Linq;

// Instantiate Renderer
ChromePdfRenderer renderer = new ChromePdfRenderer();

// Create a PDF from a URL
PdfDocument pdf = renderer.RenderUrlAsPdf("https://ironpdf.com/");

// Access DOM Objects
var objects = pdf.Pages.First().ObjectModel;
Imports IronPdf
Imports System.Linq

' Instantiate Renderer
Private renderer As New ChromePdfRenderer()

' Create a PDF from a URL
Private pdf As PdfDocument = renderer.RenderUrlAsPdf("https://ironpdf.com/")

' Access DOM Objects
Private objects = pdf.Pages.First().ObjectModel
VB   C#
调试

目前,ObjectModel 属性包括 ImageObjectPathObjectTextObject。 每个对象都包含其所在页面索引、边界框、比例和翻译等信息。 这些信息也可以修改。

ImageObject

  • 高度:图片高度。
  • 宽度:图片宽度。
  • ExportBytesAsJpg:将图像导出为 JPG 格式字节数组的方法。

    PathObject

  • FillColor:路径的填充颜色。
  • StrokeColor:路径的描边颜色。
  • 点:定义路径的点的集合。

    文本对象

  • 颜色:文本的颜色。
  • 内容:实际文本内容。
Chaknith related to 访问 DOM 对象示例

查克尼特·宾

软件工程师

Chaknith 是开发者中的福尔摩斯。他第一次意识到自己可能在软件工程方面有前途,是在他出于乐趣做代码挑战的时候。他的重点是 IronXL 和 IronBarcode,但他为能帮助客户解决每一款产品的问题而感到自豪。Chaknith 利用他从直接与客户交谈中获得的知识,帮助进一步改进产品。他的轶事反馈不仅仅局限于 Jira 票据,还支持产品开发、文档编写和市场营销,从而提升客户的整体体验。当他不在办公室时,他可能会在学习机器学习、编程或徒步旅行。