Comment accéder à tous les objets DOM PDF

This article was translated from English: Does it need improvement?
Translated
View the article in English

par Chaknith Bin

Accéder à l'objet DOM d'un PDF consiste à interagir avec la structure d'un fichier PDF de manière similaire à la manipulation du DOM d'une page web.(Modèle d'objet de document). Dans le contexte des PDFs, le DOM est une représentation de la structure interne du document, permettant aux développeurs d'accéder et de manipuler différents éléments tels que le texte, les images, les annotations et les métadonnées par programmation.

Commencez à utiliser IronPDF dans votre projet dès aujourd'hui avec un essai gratuit.

Première étape :
green arrow pointer

Exemple d'accès aux objets DOM

Le ObjectModel peut être accédé à partir de l'objet PdfPage. Tout d'abord, importez le PDF cible et accédez à sa propriété Pages. À partir de là, sélectionnez n'importe quelle page, et vous aurez accès à la propriété ObjectModel.

Avertissement
Cette fonctionnalité est encore expérimentale. Il y a une fuite de mémoire lors de l'accès aux objets texte depuis le DOM.

:path=/static-assets/pdf/content-code-examples/how-to/access-pdf-dom-object.cs
using IronPdf;
using System.Linq;

// Instantiate Renderer
ChromePdfRenderer renderer = new ChromePdfRenderer();

// Create a PDF from a URL
PdfDocument pdf = renderer.RenderUrlAsPdf("https://ironpdf.com/");

// Access DOM Objects
var objects = pdf.Pages.First().ObjectModel;
Imports IronPdf
Imports System.Linq

' Instantiate Renderer
Private renderer As New ChromePdfRenderer()

' Create a PDF from a URL
Private pdf As PdfDocument = renderer.RenderUrlAsPdf("https://ironpdf.com/")

' Access DOM Objects
Private objects = pdf.Pages.First().ObjectModel
VB   C#
Déboguer

La propriété ObjectModel se compose actuellement de ImageObject, PathObject et TextObject. Chaque objet contient des informations sur l'index de la page sur laquelle il se trouve, sa boîte englobante, son échelle et sa translation. Cette information peut également être modifiée.

ImageObject :

  • Hauteur : Hauteur de l'image.
  • Largeur : Largeur de l'image.
  • ExportBytesAsJpg : Une méthode pour exporter l'image sous forme de tableau d'octets au format JPG.

    PathObject :

  • FillColor : La couleur de remplissage du chemin.
  • StrokeColor : La couleur du trait du chemin.
  • Points : Une collection de points définissant le chemin.

    TextObject:

  • Couleur : La couleur du texte.
  • Contenu : Le contenu textuel réel.
Chaknith related to Exemple d'accès aux objets DOM

Chaknith Bin

Ingénieur logiciel

Chaknith est le Sherlock Holmes des développeurs. C'est en s'amusant à relever des défis de code qu'il s'est rendu compte pour la première fois qu'il pourrait avoir un avenir dans le domaine de l'ingénierie logicielle. Il se concentre sur IronXL et IronBarcode, mais il est fier d'aider les clients avec chaque produit. Chaknith tire parti des connaissances qu'il a acquises en discutant directement avec les clients pour améliorer les produits eux-mêmes. Ses commentaires anecdotiques vont au-delà des tickets Jira et soutiennent le développement de produits, la documentation et le marketing, afin d'améliorer l'expérience globale des clients.Quand il n'est pas au bureau, on peut le trouver en train d'apprendre sur l'apprentissage automatique, le codage et la randonnée.