IRONPDFの使用

C#でPDFファイルを読み取る方法

更新済み 2月 22, 2023
共有:

プログラムによるPDF処理は、金融、医療、法務、教育などの産業において非常に重要です。これらの分野では、データ分析、文書管理、オートメーションなどの目的で、PDF文書から重要な情報を処理、分析、および抽出する必要があります。 その重要性にもかかわらず、この作業は困難である場合があります。

IronPDF: C# PDFライブラリ

IronPDFにより、非常に困難なタスクを簡単に処理できます。 それは、PDFドキュメント内のテキスト編集を簡単に行えるようにします。テキストドキュメントでテキストファイルを操作するのと同様に、すべてのオペレーティングシステムでファイルをエクスポートすることができます。 IronPDFアプリケーションは、PDFの表示、修正、およびコンテンツの抽出の全プロセスを網羅しています。

IronPDFで正しい一歩を踏み出そう

IronPDFソフトウェアを使用することで、どのコンピュータでもPDFファイル形式のテキストを迅速かつ簡単に読み込んだり、書き込んだりできます。 インストールは簡単な作業です。 これはC#でPDFファイルを読み取る最良の方法です。 開発用にIronPDFを無料でダウンロードすることもできます。 IronPDF を探索すると、このライブラリが非常に使いやすい PDF 機能を豊富に提供していることに気付くでしょう。 自由時間にクラスを探求しましょう! 以下の内容を日本語に翻訳します:

いくつかの C#の例 PDFの読み取りから最適な出力を作成する方法を学ぶために利用可能です。

IronPDFを使用してPDFファイルを読み取る

ステップ1: IronPDF パッケージをインストールする

始めるには、まず IronPDFをインストールする .NETプロジェクトにNuGetパッケージを導入してください。 Visual Studioのパッケージマネージャーコンソールを開き、次のコマンドを入力することでこれを行うことができます:

Install-Package IronPdf

ステップ2: IronPDFライブラリをインポートする

次に、ファイルの先頭に次の文を追加してIronPDFライブラリをコードにインポートする必要があります:

using IronPdf;
using IronPdf;
Imports IronPdf
VB   C#

ステップ 3: PDFドキュメントを読み込む

IronPDFライブラリをインポートしたら、以下のコードを使用してPDFドキュメントをコードにロードすることができます。

PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);
PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);
Dim pdf As PdfDocument = PdfDocument.FromFile("C:\dotnet.pdf")
Dim outputPath = "Example.pdf"
pdf.SaveAs(outputPath)
VB   C#

ステップ 4: PDF からテキストを抽出する

IronPDFは、既存のPDFファイルからテキストを抽出するためのさまざまな方法を提供します。例えば、以下のコードスニペットを使用して、PDFからテキストを抽出し、それをコンソールに出力することができます:

string text = pdf.ExtractText();
Console.Writeline(text);
string text = pdf.ExtractText();
Console.Writeline(text);
Dim text As String = pdf.ExtractText()
Console.Writeline(text)
VB   C#

上記のコードを使用することで、 PDFファイルからテキストを抽出する.

C#でPDFファイルを読む方法、図1: IronPDFを使用したPDFからのテキスト抽出

IronPDFを使用してPDFからテキストを抽出する

ステップ5: PDF を画像にラスタライズする

さあ PDFファイルを画像にラスタライズする IronPDFを使用する。 まず、必要なライブラリをインポートします:

using System.Linq;
using IronPdf;
using IronSoftware.Drawing;
using System.Linq;
using IronPdf;
using IronSoftware.Drawing;
Imports System.Linq
Imports IronPdf
Imports IronSoftware.Drawing
VB   C#

コードは次に使用します RasterizeToImageFiles PDFドキュメントのすべてのページを画像ファイルとしてフォルダーに抽出する方法。 抽出された画像はPNGまたはJPGファイルとして保存でき、画像の寸法やページ範囲も指定することができます。

// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
' Extract all pages to a folder as image files
pdf.RasterizeToImageFiles("C:\image\folder\*.png")

' Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles("C:\image\folder\example_pdf_image_*.jpg", 100, 80)
VB   C#

以下では、コードが使用されています: ToBitmap(ビットマップに変換) PDFドキュメントのすべてのページをAnyBitmapオブジェクトとして抽出し、コード内でさらに処理および操作できるメソッド。

// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();
// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();
' Extract all pages as AnyBitmap objects
Dim pdfBitmaps() As AnyBitmap = pdf.ToBitmap()
VB   C#

上記のコードは、IronPDFを使用してPDFファイルの内容を抽出し、抽出されたデータを画像ファイルまたはさらなる処理のためにAnyBitmapオブジェクトとして保存する方法を示しています。

ステップ 7: PDFページの操作

以下を日本語に翻訳します:

Let's learn how to

学びましょう ページを操作する PDF ファイルを IronPDF を使用して読み取り、PDF ドキュメントの内容を取得します。

コードは最初にページ2と3をPDFドキュメントから削除します。 RemovePages(ページを削除する) メソッド

pdf.RemovePages(1, 2);
pdf.RemovePages(1, 2);
pdf.RemovePages(1, 2)
VB   C#

RemovePages メソッドは2つの引数を取ります: 削除する開始ページ (この場合、ページ番号は0から始まるため、ページ2は 1 として表されます。) 削除するページ数 (この場合、2ページ).

ステップ6: PDFを保存

最後に、PDFファイルをローカルシステムに保存することができます。 SaveAs メソッド。 PDFファイルを保存するためのコードは以下の通りです:

pdf.SaveAs(OutputPath);
pdf.SaveAs(OutputPath);
pdf.SaveAs(OutputPath)
VB   C#

IronPDFの互換性

IronPDFは、.NET 7を含む最新のすべての.NET Frameworkと高度な互換性があります。また、Microsoftによる最新のWeb開発向け技術である.NET Blazorおよび.NET MAUIもサポートしています。 ライブラリのこれらのフレームワークとの互換性により、開発者はIronPDFを自分のアプリケーションにシームレスに統合し、その強力な機能を活用することが可能になります。

IronPDF の主な機能の一つは、.NET Blazor および .NET MAUI で PDF ファイルを読み取る能力です。 この機能により、開発者はPDFファイルからデータを迅速かつ簡単に読み取り、抽出して、それを.NETアプリケーションで使用することができます。 この機能は、大量のデータを扱う際に特に役立ちます。 開発者は、自身の.NETプロジェクトでIronPDFを使用するために他のライブラリを必要としません。

詳細情報はこちらをご覧ください .NET Blazor で動作するIronPDF 以下のコンテンツを日本語に翻訳してください: .NET MAUI IronPDF のウェブサイトで。

結論

結論として、プログラムによってPDFファイルを読み取ることは、さまざまな業界において重要です。 IronPDFは、PDFファイルからコンテンツを読み取り、変更し、抽出するための包括的な機能を提供することで、このタスクを処理するための包括的なソリューションを提供します。IronPDFは、簡単なステップですぐにインストールして使用できます。

ライブラリは、次の方法を提供しています。 テキストを抽出, PDFを画像にラスタライズするページを操作して、PDFファイルを保存します。 プログラムによるPDF処理に不慣れな方も、経験豊富な開発者の方も、IronPDFはスキルを次のレベルに引き上げるための完璧なツールです。

以下の内容を日本語に翻訳してください:

C#でPDFファイルを読み取るための信頼できて効率的なソリューションをお探しなら、IronPDFは特に研究する価値があります。 $749からのライセンス申し訳ありませんが、提供された内容が不完全です。必要な情報をすべて含めて再度送信してください。例えば、"IronPDFは簡単にPDFを生成するためのツールです"のような完全な文を入力してください。 無料試用 利用可能。 以下の画像でIronPDFが提供する他のプランを確認できます。 お客様のニーズに合ったパッケージを選択できます。

C#でPDFファイルを読む方法、図2: IronPDFライセンス料金

IronPDF ライセンス価格

< 以前
C#でWordをPDFに変換する方法 (チュートリアル)
次へ >
IronPDFを購入すべきですか?

準備はできましたか? バージョン: 2024.9 新発売

無料のNuGetダウンロード 総ダウンロード数: 10,659,073 View Licenses >