C# 讀取 PDF 指南

This article was translated from English: Does it need improvement?
Translated
View the article in English

今天,我們將講解一種簡單的方法來閱讀PDF內容並提取其原始格式的文字。 這可以針對整個文件或特定頁面,在您的C#專案中完成。

Csharp Parse Pdf1 related to C# 讀取 PDF 指南
Csharp Parse Pdf2 related to C# 讀取 PDF 指南
Csharp Parse Pdf3 related to C# 讀取 PDF 指南

開始使用 IronPDF

立即在您的專案中使用IronPDF,並享受免費試用。

第一步:
green arrow pointer


在 C# 中讀取 PDF 文件

使用這個C#庫,我們可以讀取PDF文件、提取內容,甚至提取高質量和原始圖像。 請參考下面的例子,了解我們在 .NET 環境中使用不同功能來滿足我們的 PDF 閱讀需求的多種方式。

:path=/static-assets/pdf/content-code-examples/how-to/csharp-read-pdf-read-pdf.cs
using IronPdf;
using IronSoftware.Drawing;
using System.Collections.Generic;

// Select the desired PDF File
PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// Extract all text from an pdf
string allText = pdf.ExtractAllText();

// Get all Images
IEnumerable<AnyBitmap> AllImages = pdf.ExtractAllImages();

// Else combine above both functionality using PageCount
for (var index = 0; index < pdf.PageCount; index++)
{
    string Text = pdf.ExtractTextFromPage(index);
    IEnumerable<AnyBitmap> Images = pdf.ExtractImagesFromPage(index);
}
Imports IronPdf
Imports IronSoftware.Drawing
Imports System.Collections.Generic

' Select the desired PDF File
Private pdf As PdfDocument = PdfDocument.FromFile("sample.pdf")

' Extract all text from an pdf
Private allText As String = pdf.ExtractAllText()

' Get all Images
Private AllImages As IEnumerable(Of AnyBitmap) = pdf.ExtractAllImages()

' Else combine above both functionality using PageCount
For index = 0 To pdf.PageCount - 1
	Dim Text As String = pdf.ExtractTextFromPage(index)
	Dim Images As IEnumerable(Of AnyBitmap) = pdf.ExtractImagesFromPage(index)
Next index
VB   C#

輸出

我們使用了一個C#表單來展示閱讀PDF內容的完美輸出。 透過這種方法,一切都著重於簡單性,並盡可能使用最少的代碼來滿足您的項目需求。

~ PDF ~

~ C# 表单 ~


資料庫快速訪問

Documentation related to 資料庫快速訪問

庫文檔

IronPDF 函式庫的文件已在方便的 API 參考中提供,供您探索和分享。

IronPDF API 參考文件