如何访问所有 PDF DOM 对象
访问 PDF DOM 对象是指与 PDF 文件结构进行交互,其方式与操作网页的 DOM 类似(文档对象模型). 在 PDF 的上下文中,DOM 是文档内部结构的表示,允许开发人员以编程方式访问和操作不同的元素,如文本、图像、注释和元数据。
如何访问所有 PDF DOM 对象
- 下载访问 PDF DOM 对象的 C# 库
- 导入或渲染目标 PDF 文档
- 访问 PDF 的页面集合并选择所需的页面
- 使用 对象模型 查看 DOM 对象并与之交互的属性
- 保存或导出修改后的 PDF 文档
立即在您的项目中开始使用IronPDF,并享受免费试用。
访问 DOM 对象示例
可从 PdfPage 对象访问 ObjectModel 。 首先,导入目标 PDF 并访问其 Pages 属性。 从这里,选择任何页面,您就可以访问 ObjectModel 属性。
警告
:path=/static-assets/pdf/content-code-examples/how-to/access-pdf-dom-object.cs
using IronPdf;
using System.Linq;
// Instantiate Renderer
ChromePdfRenderer renderer = new ChromePdfRenderer();
// Create a PDF from a URL
PdfDocument pdf = renderer.RenderUrlAsPdf("https://ironpdf.com/");
// Access DOM Objects
var objects = pdf.Pages.First().ObjectModel;
Imports IronPdf
Imports System.Linq
' Instantiate Renderer
Private renderer As New ChromePdfRenderer()
' Create a PDF from a URL
Private pdf As PdfDocument = renderer.RenderUrlAsPdf("https://ironpdf.com/")
' Access DOM Objects
Private objects = pdf.Pages.First().ObjectModel
目前,ObjectModel 属性包括 ImageObject、PathObject 和 TextObject。 每个对象都包含其所在页面索引、边界框、比例和翻译等信息。 这些信息也可以修改。
ImageObject:
- 高度:图片高度。
- 宽度:图片宽度。
ExportBytesAsJpg:将图像导出为 JPG 格式字节数组的方法。
PathObject:
- FillColor:路径的填充颜色。
- StrokeColor:路径的描边颜色。
点:定义路径的点的集合。
文本对象:
- 颜色:文本的颜色。
- 内容:实际文本内容。