フッターコンテンツにスキップ
IRONPDFの使用

C#でPDFファイルを読み取る方法

プログラムによるPDF処理は、データ解析、文書管理、自動化などの目的で、PDFドキュメントから重要な情報を処理、分析、抽出する必要がある金融、医療、法務、教育などの業界において非常に重要です。 その重要性にもかかわらず、この作業は困難な場合があります。

IronPDF: A C# PDF Library

IronPDFは、非常に難しいタスクを簡単に処理することを可能にします。 PDFドキュメントのテキストを編集することが容易であり、テキストファイルでの作業と同様に行うことで、どのオペレーティングシステムでもファイルをエクスポートすることができます。 IronPDFアプリケーションは、PDFの表示、修正、コンテンツの抽出の完全なプロセスをカバーします。

Take the Right Step with IronPDF

テキストは、IronPDFソフトウェアを使用することで、どのコンピュータでもPDFファイルフォーマットで迅速かつ簡単に読み書きできます。 インストールは簡単な作業です。 これはC#でPDFファイルを読むことを学ぶ最良の方法です。 開発のためにIronPDFを無料でダウンロードすることもできます。 IronPDFを探索すると、ライブラリがPDFを使いやすくする多くの機能を提供していることに気付くでしょう。 自由時間にクラスを探究してください! PDFを読むことで最適な出力を作成する方法を学ぶために、HTMLを使用してPDFを作成するC#の例がいくつかあります。

Read PDF Files using IronPDF

Step 1: Install the IronPDF Package

まず始めに、.NETプロジェクトにIronPDF NuGetパッケージをインストールする必要があります。 これを行うには、Visual Studioのパッケージ マネージャー コンソールを開き、次のコマンドを入力します。

Install-Package IronPdf

Step 2: Import the IronPDF Library

次に、ファイルの先頭に次のステートメントを追加して、コードにIronPDFライブラリをインポートする必要があります。

using IronPdf;
using IronPdf;
Imports IronPdf
$vbLabelText   $csharpLabel

Step 3: Load the PDF Document

IronPDFライブラリをインポートした後、次のコードを使用してPDFドキュメントをコードにロードできます。

// Load the PDF document from file path
PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");

// Define the output path for the saved PDF
var outputPath = "Example.pdf";

// Save the PDF document to the specified output path
pdf.SaveAs(outputPath);
// Load the PDF document from file path
PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");

// Define the output path for the saved PDF
var outputPath = "Example.pdf";

// Save the PDF document to the specified output path
pdf.SaveAs(outputPath);
' Load the PDF document from file path
Dim pdf As PdfDocument = PdfDocument.FromFile("C:\dotnet.pdf")

' Define the output path for the saved PDF
Dim outputPath = "Example.pdf"

' Save the PDF document to the specified output path
pdf.SaveAs(outputPath)
$vbLabelText   $csharpLabel

Step 4: Extract Text from the PDF

IronPDFは、既存のPDFファイルからテキストを抽出するためのさまざまな方法を提供します。たとえば、次のコードスニペットを使用して、PDFからテキストを抽出し、コンソールに表示することができます。

// Extract text from the loaded PDF document
string text = pdf.ExtractText();

// Print the extracted text to the console
Console.WriteLine(text);
// Extract text from the loaded PDF document
string text = pdf.ExtractText();

// Print the extracted text to the console
Console.WriteLine(text);
' Extract text from the loaded PDF document
Dim text As String = pdf.ExtractText()

' Print the extracted text to the console
Console.WriteLine(text)
$vbLabelText   $csharpLabel

上記のコードを使用して、PDFファイルからテキストを抽出できます。

C#でPDFファイルを読む方法、図1: IronPDFを使用してPDFからテキストを抽出 IronPDFを使用してPDFからテキストを抽出

Step 5: Rasterize a PDF to Images

IronPDFを使用してPDFファイルを画像にラスタライズしましょう。 まず、必要なライブラリをインポートします。

using System.Linq;
using IronPdf;
using IronSoftware.Drawing;
using System.Linq;
using IronPdf;
using IronSoftware.Drawing;
Imports System.Linq
Imports IronPdf
Imports IronSoftware.Drawing
$vbLabelText   $csharpLabel

その後、RasterizeToImageFilesメソッドを使用して、PDFドキュメントのすべてのページを画像ファイルとしてフォルダーに抽出します。 抽出された画像はPNGまたはJPGファイルとして保存でき、画像の寸法とページ範囲も指定できます。

// Extract all pages to a folder as image files with PNG format
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Extract all pages to JPG images with specified dimensions
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
// Extract all pages to a folder as image files with PNG format
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Extract all pages to JPG images with specified dimensions
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);
' Extract all pages to a folder as image files with PNG format
pdf.RasterizeToImageFiles("C:\image\folder\*.png")

' Extract all pages to JPG images with specified dimensions
pdf.RasterizeToImageFiles("C:\image\folder\example_pdf_image_*.jpg", 100, 80)
$vbLabelText   $csharpLabel

最後に、ToBitmapメソッドを使用して、PDFドキュメントのすべてのページをAnyBitmapオブジェクトとして抽出します。それにより、コード内でさらに処理および操作が可能です。

// Extract all pages as AnyBitmap objects for further processing
AnyBitmap[] pdfBitmaps = pdf.ToBitmap();
// Extract all pages as AnyBitmap objects for further processing
AnyBitmap[] pdfBitmaps = pdf.ToBitmap();
' Extract all pages as AnyBitmap objects for further processing
Dim pdfBitmaps() As AnyBitmap = pdf.ToBitmap()
$vbLabelText   $csharpLabel

上記のコードは、IronPDFを使用してPDFファイルの内容を抽出し、抽出されたデータを画像ファイルまたはAnyBitmapオブジェクトとして保存し、さらなる処理を行う方法を示しています。

Step 7: Manipulate PDF Pages

IronPDFを使用してPDFドキュメントのページを操作する方法を学びましょう。

このコードは、まずRemovePagesメソッドを使用して、PDFドキュメントから2ページ目と3ページ目を削除します。

// Remove pages two and three from the PDF document
pdf.RemovePages(1, 2);
// Remove pages two and three from the PDF document
pdf.RemovePages(1, 2);
' Remove pages two and three from the PDF document
pdf.RemovePages(1, 2)
$vbLabelText   $csharpLabel

RemovePagesメソッドは2つの引数を取ります: 削除する開始ページ(この場合はページ2を1として表現します、ページ番号は0から始まるため)と削除するページ数(この場合は2ページ)。

Step 6: Save the PDF

最後に、SaveAsメソッドを使用してPDFファイルをローカルシステムに保存できます。 PDFファイルを保存するコードは以下の通りです。

// Save the PDF document to a specified output path
pdf.SaveAs(outputPath);
// Save the PDF document to a specified output path
pdf.SaveAs(outputPath);
' Save the PDF document to a specified output path
pdf.SaveAs(outputPath)
$vbLabelText   $csharpLabel

IronPDF Compatibility

IronPDFは、.NET 7を含む最新のすべての.NET Frameworkとの互換性が非常に高いです。また、.NET Blazorと.NET MAUIもサポートしています。これらはMicrosoftが提供する最新のウェブ開発用フレームワークです。 これらのフレームワークとの互換性により、開発者はIronPDFをアプリケーションにシームレスに統合し、その強力な機能を利用することが可能です。

IronPDFの主な機能の一つは、.NET Blazorと.NET MAUIでPDFファイルを読み取る能力です。 この機能により、開発者は.NETのアプリケーションでPDFファイルからデータを迅速かつ簡単に読み取り、抽出して使用することができます。 この機能は特に大量のデータを扱う場合に役立ちます。 開発者は、IronPDFを.NETプロジェクトで使用するために他のライブラリを必要としません。

Get more information about IronPDF working with .NET Blazor in this tutorial and learn about integrating IronPDF with .NET MAUI on IronPDF's website.

結論

結論として、プログラムによるPDFファイルの読み取りは、さまざまな業界で重要です。 IronPDFはPDFファイルを読み取り、修正し、内容を抽出するための広範な機能を提供することで、このタスクを処理する包括的なソリューションを提供します。IronPDFはインストールが容易で、数ステップで使用できます。

The library offers methods to extract text from PDF documents, rasterize a PDF to an image, manipulate pages, and save PDF files. プログラムによるPDF処理が初めての方も、経験豊富な開発者も、IronPDFはスキルを次のレベルに引き上げるのに最適なツールです。

If you are looking for a reliable and efficient solution for reading PDF files in C#, IronPDF is worth exploring, especially with its license options and pricing information, and a free trial available. 以下の画像で提供されているIronPDFのプランをもっと見ることができます。 ご自身のニーズに合ったパッケージを選択できます。

C#でPDFファイルを読む方法、図2: IronPDFのライセンス価格 IronPDFのライセンス価格

よくある質問

C#でPDFファイルをどのように読みますか?

IronPDFは、まず.NETプロジェクトでNuGetパッケージマネージャーを介してインストールし、ライブラリをインポートしてから、PDF文書を読み込んで読み取り、テキストを抽出してコンソールに表示できます。

プログラム的PDF処理が恩恵を受ける業界とは?

金融、医療、法務、教育などの業界は、データ分析の効率化、文書管理、IronPDFのようなツールを使用したタスクの自動化を可能にするプログラム的PDF処理から大いに恩恵を受けます。

C#を使用してPDF文書からデータを抽出するにはどうすればよいですか?

IronPDFを使用して、PDFを読み込み、ExtractTextのようなメソッドを利用して、内容をプログラム的に読み取り処理することで、PDF文書からデータを抽出できます。

C#でPDFファイルを画像に変換できますか?

はい、IronPDFを使用すると、RasterizeToImageFilesメソッドを使用してPDFファイルを画像に変換でき、PNGやJPGなどの形式で画像ファイルとしてページを保存できます。

IronPDFは最新の.NETフレームワークと互換性がありますか?

IronPDFは、.NET 7を含むすべての最新の.NETフレームワークと互換性があり、.NET Blazorおよび.NET MAUIもサポートしているため、さまざまな種類のアプリケーションに統合できます。

C#を使用してPDFファイルを変更し保存するにはどうすればよいですか?

IronPDFを使用してPDFファイルに変更を加えた後、変更を出力パスを指定してSaveAsメソッドで保存できます。

.NETプロジェクトでPDFライブラリを使用するためのステップは何ですか?

.NETプロジェクトでIronPDFを使用するには、NuGetを介してライブラリをインストールし、プロジェクトにインポートした後、その機能を使用してPDF文書をプログラム的に読み込み、読み取り、操作します。

.NETでPDF処理するためにIronPDFは他のライブラリを必要としますか?

いいえ、IronPDFはスタンドアロンのライブラリであり、追加のライブラリを必要とせず、.NETプロジェクトに統合して包括的なPDF処理を簡単に行えます。

IronPDFのPDF処理の主な機能は何ですか?

IronPDFは、テキスト抽出、PDFの画像へのラスター化、ページ操作、最新の.NETフレームワークとの互換性などの機能を提供し、C#でPDFファイルを操作するための強力なツールとなります。

IronPDF は .NET 10 と完全に互換性がありますか?

はい、IronPDFは.NET 10(および.NET 9、8、7、6などの以前のバージョン)を標準でサポートしています。特別な設定や回避策を必要とせずに、IronPDFを使用して.NET 10でアプリケーションを構築できます。

Curtis Chau
テクニカルライター

Curtis Chauは、カールトン大学でコンピュータサイエンスの学士号を取得し、Node.js、TypeScript、JavaScript、およびReactに精通したフロントエンド開発を専門としています。直感的で美しいユーザーインターフェースを作成することに情熱を持ち、Curtisは現代のフレームワークを用いた開発や、構造の良い視覚的に魅力的なマニュアルの作成を楽しんでいます。

開発以外にも、CurtisはIoT(Internet of Things)への強い関心を持ち、ハードウェアとソフトウェアの統合方法を模索しています。余暇には、ゲームをしたりDiscordボットを作成したりして、技術に対する愛情と創造性を組み合わせています。