IRONPDFの使用

C#でPDFファイルを読み取る方法

プログラムによるPDF処理は、金融、医療、法務、教育などの産業において非常に重要です。これらの分野では、データ分析、文書管理、オートメーションなどの目的で、PDF文書から重要な情報を処理、分析、および抽出する必要があります。 その重要性にもかかわらず、この作業は困難である場合があります。

IronPDF: C# PDFライブラリ

IronPDFにより、非常に困難なタスクを簡単に処理できます。 それは、PDFドキュメント内のテキスト編集を簡単に行えるようにします。テキストドキュメントでテキストファイルを操作するのと同様に、すべてのオペレーティングシステムでファイルをエクスポートすることができます。 IronPDFアプリケーションは、PDFの表示、修正、およびコンテンツの抽出の全プロセスを網羅しています。

IronPDFで正しい一歩を踏み出そう

IronPDFソフトウェアを使用することで、どのコンピュータでもPDFファイル形式のテキストを迅速かつ簡単に読み込んだり、書き込んだりできます。 インストールは簡単な作業です。 これはC#でPDFファイルを読み取る最良の方法です。 開発用にIronPDFを無料でダウンロードすることもできます。 IronPDF を探索すると、このライブラリが非常に使いやすい PDF 機能を豊富に提供していることに気付くでしょう。 空き時間にクラスを探索しましょう!PDFを読むことで最適な出力を作成する方法を学ぶための、HTMLを使用してPDFを作成するC#の例がいくつか利用可能です。

IronPDFを使用してPDFファイルを読み取る

ステップ1: IronPDF パッケージをインストールする

まず、.NETプロジェクトにIronPDF NuGetパッケージをインストールする必要があります。 Visual Studioのパッケージマネージャーコンソールを開き、次のコマンドを入力することでこれを行うことができます:

Install-Package IronPdf

ステップ2: IronPDFライブラリをインポートする

次に、ファイルの先頭に次の文を追加してIronPDFライブラリをコードにインポートする必要があります:

using IronPdf;
using IronPdf;
Imports IronPdf
$vbLabelText   $csharpLabel

ステップ 3: PDFドキュメントを読み込む

IronPDFライブラリをインポートしたら、以下のコードを使用してPDFドキュメントをコードにロードすることができます。

PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);
PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);
Dim pdf As PdfDocument = PdfDocument.FromFile("C:\dotnet.pdf")
Dim outputPath = "Example.pdf"
pdf.SaveAs(outputPath)
$vbLabelText   $csharpLabel

ステップ 4: PDF からテキストを抽出する

IronPDFは、既存のPDFファイルからテキストを抽出するためのさまざまな方法を提供します。例えば、以下のコードスニペットを使用して、PDFからテキストを抽出し、それをコンソールに出力することができます:

string text = pdf.ExtractText();
Console.Writeline(text);
string text = pdf.ExtractText();
Console.Writeline(text);
Dim text As String = pdf.ExtractText()
Console.Writeline(text)
$vbLabelText   $csharpLabel

上記のコードを使用すると、PDFファイルからテキストを抽出することができます。

C#でPDFファイルを読む方法、図1:IronPDFを使用してPDFからテキストを抽出

IronPDFを使用してPDFからテキストを抽出する

ステップ5: PDF を画像にラスタライズする

IronPDFを使用してPDFファイルを画像にラスタライズしましょう。 まず、必要なライブラリをインポートします:

using System.Linq;
using IronPdf;
using IronSoftware.Drawing;
using System.Linq;
using IronPdf;
using IronSoftware.Drawing;
Imports System.Linq
Imports IronPdf
Imports IronSoftware.Drawing
$vbLabelText   $csharpLabel

その後、コードはRasterizeToImageFilesメソッドを使用して、PDFドキュメントのすべてのページを画像ファイルとしてフォルダに抽出します。 抽出された画像はPNGまたはJPGファイルとして保存でき、画像の寸法やページ範囲も指定することができます。

// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
' Extract all pages to a folder as image files
pdf.RasterizeToImageFiles("C:\image\folder\*.png")

' Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles("C:\image\folder\example_pdf_image_*.jpg", 100, 80)
$vbLabelText   $csharpLabel

最後に、コードはToBitmapメソッドを使用して、PDFドキュメントのすべてのページをAnyBitmapオブジェクトとして抽出し、コード内でさらに処理および操作できるようにします。

// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();
// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();
' Extract all pages as AnyBitmap objects
Dim pdfBitmaps() As AnyBitmap = pdf.ToBitmap()
$vbLabelText   $csharpLabel

上記のコードは、IronPDFを使用してPDFファイルの内容を抽出し、抽出したデータを画像ファイルまたはさらなる処理のためのAnyBitmapオブジェクトとして保存する方法を示しています。

ステップ 7: PDFページの操作

IronPDFを使用してPDFファイルを読み込むことによって、PDFドキュメントのページを操作する方法を学びましょう。

最初に、コードはPDFドキュメントから2ページ目と3ページ目をRemovePagesメソッドを使用して削除します。

pdf.RemovePages(1, 2);
pdf.RemovePages(1, 2);
pdf.RemovePages(1, 2)
$vbLabelText   $csharpLabel

RemovePages メソッドは2つの引数を取ります。削除する最初のページ(この場合、ページ番号が0から始まるため、ページ2は1として表されます)と、削除するページ数(この場合は2ページ)です。

ステップ6: PDFを保存

最後に、SaveAs メソッドを使用して、PDFファイルをローカルシステムに保存できます。 PDFファイルを保存するためのコードは以下の通りです:

pdf.SaveAs(OutputPath);
pdf.SaveAs(OutputPath);
pdf.SaveAs(OutputPath)
$vbLabelText   $csharpLabel

IronPDFの互換性

IronPDFは、.NET 7を含む最新のすべての.NET Frameworkと高度な互換性があります。また、Microsoftによる最新のWeb開発向け技術である.NET Blazorおよび.NET MAUIもサポートしています。 ライブラリのこれらのフレームワークとの互換性により、開発者はIronPDFを自分のアプリケーションにシームレスに統合し、その強力な機能を活用することが可能になります。

IronPDF の主な機能の一つは、.NET Blazor および .NET MAUI で PDF ファイルを読み取る能力です。 この機能により、開発者はPDFファイルからデータを迅速かつ簡単に読み取り、抽出して、それを.NETアプリケーションで使用することができます。 この機能は、大量のデータを扱う際に特に役立ちます。 開発者は、自身の.NETプロジェクトでIronPDFを使用するために他のライブラリを必要としません。

このチュートリアルでIronPDFと.NET Blazorの動作についての詳細情報を取得し、IronPDFのウェブサイトでIronPDFと.NET MAUIの統合について学びましょう。

結論

結論として、プログラムによってPDFファイルを読み取ることは、さまざまな業界において重要です。 IronPDFは、PDFファイルからコンテンツを読み取り、変更し、抽出するための包括的な機能を提供することで、このタスクを処理するための包括的なソリューションを提供します。IronPDFは、簡単なステップですぐにインストールして使用できます。

このライブラリは、PDF ドキュメントからテキストを抽出し、PDF を画像にラスタライズし、ページを操作し、PDF ファイルを保存するメソッドを提供します。 プログラムによるPDF処理に不慣れな方も、経験豊富な開発者の方も、IronPDFはスキルを次のレベルに引き上げるための完璧なツールです。

C#でPDFファイルを読み取るための信頼性が高く効率的なソリューションを探しているなら、IronPDFを検討する価値があります。特にそのライセンスオプションと価格情報、および無料トライアルが利用可能です。 以下の画像でIronPDFが提供する他のプランを確認できます。 お客様のニーズに合ったパッケージを選択できます。

C#でPDFファイルを読む方法、図2: IronPDFのライセンス価格

IronPDF ライセンス料金

チペゴ
ソフトウェアエンジニア
チペゴは優れた傾聴能力を持ち、それが顧客の問題を理解し、賢明な解決策を提供する助けとなっています。彼は情報技術の学士号を取得後、2023年にIron Softwareチームに加わりました。現在、彼はIronPDFとIronOCRの2つの製品に注力していますが、顧客をサポートする新しい方法を見つけるにつれて、他の製品に関する知識も日々成長しています。Iron Softwareでの協力的な生活を楽しんでおり、さまざまな経験を持つチームメンバーが集まり、効果的で革新的な解決策を提供することに貢献しています。チペゴがデスクを離れているときは、良い本を楽しんだり、サッカーをしていることが多いです。
< 以前
C#でWord(Docx)をPDFに変換する方法(チュートリアル)
次へ >
IronPDFを購入すべきですか?