Cómo acceder a todos los objetos DOM de PDF

This article was translated from English: Does it need improvement?
Translated
View the article in English

por Chaknith Bin

Acceder al objeto DOM de PDF se refiere a interactuar con la estructura de un archivo PDF de una manera similar a manipular el DOM de una página web.(Modelo de documento objeto). En el contexto de los PDFs, el DOM es una representación de la estructura interna del documento, lo que permite a los desarrolladores acceder y manipular diferentes elementos como texto, imágenes, anotaciones y metadatos de manera programable.

Comience a usar IronPDF en su proyecto hoy con una prueba gratuita.

Primer Paso:
green arrow pointer

Ejemplo de Acceso a Objetos DOM

El ObjectModel se puede acceder desde el objeto PdfPage. Primero, importa el PDF de destino y accede a su propiedad Pages. Desde allí, selecciona cualquier página y tendrás acceso a la propiedad ObjectModel.

Advertencia
Esta función todavía es experimental. Pierde memoria al acceder a objetos de texto desde el DOM.

:path=/static-assets/pdf/content-code-examples/how-to/access-pdf-dom-object.cs
using IronPdf;
using System.Linq;

// Instantiate Renderer
ChromePdfRenderer renderer = new ChromePdfRenderer();

// Create a PDF from a URL
PdfDocument pdf = renderer.RenderUrlAsPdf("https://ironpdf.com/");

// Access DOM Objects
var objects = pdf.Pages.First().ObjectModel;
Imports IronPdf
Imports System.Linq

' Instantiate Renderer
Private renderer As New ChromePdfRenderer()

' Create a PDF from a URL
Private pdf As PdfDocument = renderer.RenderUrlAsPdf("https://ironpdf.com/")

' Access DOM Objects
Private objects = pdf.Pages.First().ObjectModel
VB   C#
Depurar

La propiedad ObjectModel actualmente consta de ImageObject, PathObject y TextObject. Cada objeto contiene información sobre el índice de la página en la que se encuentra, su cuadro delimitador, escala y traducción. Esta información también se puede modificar.

ImageObject:

  • Altura: Altura de la imagen.
  • Ancho: Ancho de la imagen.
  • ExportBytesAsJpg: Un método para exportar la imagen como un arreglo de bytes en formato JPG.

    PathObject:

  • FillColor: El color de relleno del recorrido.
  • StrokeColor: El color del trazo del camino.
  • Puntos: Una colección de puntos que definen el camino.

    TextObject:

  • Color: El color del texto.
  • Contenido: El contenido de texto real.
Chaknith related to Ejemplo de Acceso a Objetos DOM

Chaknith Bin

Ingeniero de software

Chaknith es el Sherlock Holmes de los desarrolladores. La primera vez que se le ocurrió que podría tener futuro en la ingeniería de software fue cuando hacía retos de código por diversión. Su trabajo se centra en IronXL e IronBarcode, pero se enorgullece de ayudar a los clientes con todos los productos. Chaknith aprovecha sus conocimientos, adquiridos hablando directamente con los clientes, para ayudar a mejorar los propios productos. Sus comentarios anecdóticos van más allá de los tickets de Jira y apoyan el desarrollo de productos, la documentación y el marketing, para mejorar la experiencia general del cliente.Cuando no está en la oficina, se le puede encontrar aprendiendo sobre aprendizaje automático, codificación y senderismo.