Test dans un environnement réel
Test en production sans filigrane.
Fonctionne partout où vous en avez besoin.
Dans le monde du développement actuel, travailler avec des fichiers PDF est une exigence courante pour les applications qui doivent gérer des documents, des formulaires ou des rapports. Que vous construisiez une plateforme de commerce électronique, un système de gestion de documents, ou que vous ayez simplement besoin de traiter des factures, extraire et rechercher du texte à partir de PDFs peut être crucial. Cet article vous guidera sur la façon d'utiliserC# string.Contains() avecIronPDFrechercher et extraire du texte à partir de fichiers PDF dans vos projets .NET.
Lors de l'exécution de recherches, vous pouvez avoir besoin d'effectuer des comparaisons de chaînes en fonction d'exigences spécifiques de sous-chaîne de chaîne. Dans de tels cas, C# propose des options telles que string.Contains.(), qui est l'une des formes de comparaison les plus simples.
Si vous avez besoin de spécifier si vous souhaitez ignorer la sensibilité à la casse ou non, vous pouvez utiliser l'énumération StringComparison. Cela vous permet de choisir le type de comparaison de chaînes que vous souhaitez, comme une comparaison ordinale ou une comparaison insensible à la casse.
Si vous souhaitez travailler avec des positions spécifiques dans la chaîne, comme la position du premier ou du dernier caractère, vous pouvez toujours utiliser Substring pour isoler certaines parties de la chaîne en vue d'un traitement ultérieur.
Si vous recherchez des vérifications de chaînes vides ou d'autres cas limites, assurez-vous de gérer ces scénarios dans votre logique.
Si vous traitez des documents volumineux, il est utile d’optimiser la position de départ de votre extraction de texte, afin de n’extraire que les parties pertinentes plutôt que l’ensemble du document. Cela peut être particulièrement utile si vous tentez d'éviter de surcharger la mémoire et le temps de traitement.
Si vous n'êtes pas sûr de la meilleure approche pour les règles de comparaison, considérez la manière dont la méthode spécifique s'exécute et comment vous souhaitez que votre recherche se comporte dans différents scénarios.(par exemple, correspondance de plusieurs termes, gestion des espaces, etc.).
Si vos besoins vont au-delà de simples vérifications de sous-chaînes et nécessitent une correspondance de modèles plus avancée, envisagez d'utiliser des expressions régulières, qui offrent une flexibilité significative lors de la manipulation des fichiers PDF.
Si vous ne l'avez pas encore fait, essayez IronPDF’sessai gratuitaujourd'hui pour explorer ses capacités et voir comment il peut rationaliser vos tâches de gestion de PDF. Que vous construisiez un système de gestion de documents, traitiez des factures ou ayez simplement besoin d'extraire des données de PDFs, IronPDF est l'outil parfait pour le travail.
IronPDF est une bibliothèque puissante conçue pour aider les développeurs travaillant avec des PDF dans l'écosystème .NET. Il vous permet de créer, lire, éditer et manipuler facilement des fichiers PDF sans avoir à dépendre d'outils externes ou de configurations complexes.
IronPDF offre une large gamme de fonctionnalités pour travailler avec des PDF dans des applications C#. Voici quelques-unes de ses principales caractéristiques :
Gestion des formulaires : Extraire ou remplir des champs de formulaire dans des formulaires PDF interactifs.
IronPDF est conçu pour être simple à utiliser, mais également assez flexible pour gérer des scénarios complexes impliquant des PDF. Il fonctionne parfaitement avec .NET Core et .NET Framework, ce qui en fait un choix idéal pour tout projet basé sur .NET.
Pour utiliserIronPDF, installez-le via le NuGet Package Manager dans Visual Studio :
Install-Package IronPdf
Install-Package IronPdf
'INSTANT VB TODO TASK: The following line uses invalid syntax:
'Install-Package IronPdf
Avant de plonger dans la recherche de PDF, commençons par comprendre comment extraire du texte d'un PDF à l'aide de IronPDF.
IronPDF offre une API simple pour extraire du texte des documents PDF. Cela vous permet de rechercher facilement un contenu spécifique dans les PDFs.
L'exemple suivant illustre comment extraire du texte d'un PDF à l'aide d'IronPDF :
using IronPdf;
using System;
public class Program
{
public static void Main(string[] args)
{
PdfDocument pdf = PdfDocument.FromFile("invoice.pdf");
string str = pdf.ExtractAllText();
}
}
using IronPdf;
using System;
public class Program
{
public static void Main(string[] args)
{
PdfDocument pdf = PdfDocument.FromFile("invoice.pdf");
string str = pdf.ExtractAllText();
}
}
Imports IronPdf
Imports System
Public Class Program
Public Shared Sub Main(ByVal args() As String)
Dim pdf As PdfDocument = PdfDocument.FromFile("invoice.pdf")
Dim str As String = pdf.ExtractAllText()
End Sub
End Class
Dans cet exemple, la méthode ExtractAllText() méthode extrait tout le texte du document PDF. Ce texte peut ensuite être traité pour rechercher des mots-clés ou des phrases spécifiques.
Une fois que vous avez extrait le texte du PDF, vous pouvez utiliser la méthode intégrée string.Contains de C#.()méthode pour rechercher des mots ou des phrases spécifiques.
La méthode string.Contains() méthode renvoie une valeur booléenne indiquant si une chaîne spécifiée existe dans une autre chaîne. Ceci est particulièrement utile pour la recherche de texte de base.
Voici comment vous pouvez utiliser string.Contains()pour rechercher un mot-clé dans le texte extrait :
bool isFound = text.Contains("search term", StringComparison.OrdinalIgnoreCase);
bool isFound = text.Contains("search term", StringComparison.OrdinalIgnoreCase);
Dim isFound As Boolean = text.Contains("search term", StringComparison.OrdinalIgnoreCase)
Décomposons cela davantage avec un exemple pratique. Supposons que vous vouliez savoir si un numéro de facture spécifique existe dans un document de facture PDF.
Voici un exemple complet de la façon dont vous pourriez l'implémenter :
using IronPdf;
public class Program
{
public static void Main(string[] args)
{
string searchTerm = "INV-12345";
PdfDocument pdf = PdfDocument.FromFile("exampleInvoice.pdf");
string text = pdf.ExtractAllText();
bool isFound = text.Contains(searchTerm, StringComparison.OrdinalIgnoreCase);
if (isFound)
{
Console.WriteLine($"Invoice number: {searchTerm} found in the document");
}
else
{
Console.WriteLine($"Invoice number {searchTerm} not found in the document");
}
}
}
using IronPdf;
public class Program
{
public static void Main(string[] args)
{
string searchTerm = "INV-12345";
PdfDocument pdf = PdfDocument.FromFile("exampleInvoice.pdf");
string text = pdf.ExtractAllText();
bool isFound = text.Contains(searchTerm, StringComparison.OrdinalIgnoreCase);
if (isFound)
{
Console.WriteLine($"Invoice number: {searchTerm} found in the document");
}
else
{
Console.WriteLine($"Invoice number {searchTerm} not found in the document");
}
}
}
Imports IronPdf
Public Class Program
Public Shared Sub Main(ByVal args() As String)
Dim searchTerm As String = "INV-12345"
Dim pdf As PdfDocument = PdfDocument.FromFile("exampleInvoice.pdf")
Dim text As String = pdf.ExtractAllText()
Dim isFound As Boolean = text.Contains(searchTerm, StringComparison.OrdinalIgnoreCase)
If isFound Then
Console.WriteLine($"Invoice number: {searchTerm} found in the document")
Else
Console.WriteLine($"Invoice number {searchTerm} not found in the document")
End If
End Sub
End Class
Dans cet exemple :
Tandis que string.Contains()fonctionne pour des recherches simples de sous-chaînes, vous pourriez vouloir effectuer des recherches plus complexes, telles que trouver un motif ou une série de mots-clés. Pour cela, vous pouvez utiliser des expressions régulières.
Voici un exemple d'utilisation d'une expression régulière pour rechercher tout format de numéro de facture valide dans le texte PDF :
using IronPdf;
using System.Text.RegularExpressions;
public class Program
{
public static void Main(string[] args)
{
// Define a regex pattern for a typical invoice number format (e.g., INV-12345)
string pattern = @"INV-\d{5}";
PdfDocument pdf = PdfDocument.FromFile("exampleInvoice.pdf");
string text = pdf.ExtractAllText();
// Perform the regex search
Match match = Regex.Match(text, pattern);
}
}
using IronPdf;
using System.Text.RegularExpressions;
public class Program
{
public static void Main(string[] args)
{
// Define a regex pattern for a typical invoice number format (e.g., INV-12345)
string pattern = @"INV-\d{5}";
PdfDocument pdf = PdfDocument.FromFile("exampleInvoice.pdf");
string text = pdf.ExtractAllText();
// Perform the regex search
Match match = Regex.Match(text, pattern);
}
}
Imports IronPdf
Imports System.Text.RegularExpressions
Public Class Program
Public Shared Sub Main(ByVal args() As String)
' Define a regex pattern for a typical invoice number format (e.g., INV-12345)
Dim pattern As String = "INV-\d{5}"
Dim pdf As PdfDocument = PdfDocument.FromFile("exampleInvoice.pdf")
Dim text As String = pdf.ExtractAllText()
' Perform the regex search
Dim match As Match = Regex.Match(text, pattern)
End Sub
End Class
Ce code recherchera tous les numéros de facture qui suivent le modèle INV-XXXXX, où XXXXX est une série de chiffres.
Lorsque vous travaillez avec des fichiers PDF, en particulier des documents volumineux ou complexes, il existe quelques bonnes pratiques à garder à l'esprit :
IronPDF s'intègre facilement aux projets .NET. Après avoir téléchargé et installé la bibliothèque IronPDF via NuGet, il suffit de l'importer dans votre code C#, comme illustré dans les exemples ci-dessus.
La flexibilité d'IronPDF vous permet de créer des flux de travail sophistiqués pour le traitement des documents, tels que :
IronPDFrend le travail avec les PDF facile et efficace, surtout lorsque vous devez extraire et rechercher du texte dans des PDF. En combinant C#'s string.Contains()méthode avec les capacités d'extraction de texte d'IronPDF, vous pouvez rapidement rechercher et traiter des PDF dans vos applications .NET.
Si vous ne l'avez pas encore fait, essayez dès aujourd'hui l'essai gratuit d'IronPDF pour explorer ses fonctionnalités et voir comment il peut simplifier vos tâches de gestion de PDF. Que vous construisiez un système de gestion de documents, traitiez des factures ou ayez simplement besoin d'extraire des données de PDFs, IronPDF est l'outil parfait pour le travail.
Pour commencer avec IronPDF, téléchargez le essai gratuitet découvrez directement ses puissantes fonctionnalités de manipulation de PDF. VisiterLe site web de IronPDFpour commencer dès aujourd'hui.
9 produits de l'API .NET pour vos documents de bureau