using IronPdf; // Disable local disk access or cross-origin requests Installation.EnableWebSecurity = true; // Instantiate Renderer var renderer = new ChromePdfRenderer(); // Create a PDF from a HTML string using C# var pdf = renderer.RenderHtmlAsPdf("<h1>Hello World</h1>"); // Export to a file or Stream pdf.SaveAs("output.pdf"); // Advanced Example with HTML Assets // Load external html assets: Images, CSS and JavaScript. // An optional BasePath 'C:\site\assets\' is set as the file location to load assets from var myAdvancedPdf = renderer.RenderHtmlAsPdf("<img src='icons/iron.png'>", @"C:\site\assets\"); myAdvancedPdf.SaveAs("html-with-assets.pdf");

IRONPDFの使用

C#でPDFファイルを読み取る方法

リーガン・パン

2023年2月22日

更新済み 2024年2月25日

共有:

プログラムによるPDF処理は、金融、医療、法務、教育などの産業において非常に重要です。これらの分野では、データ分析、文書管理、オートメーションなどの目的で、PDF文書から重要な情報を処理、分析、および抽出する必要があります。その重要性にもかかわらず、この作業は困難である場合があります。

IronPdf：C# PDFライブラリ

IronPDFにより、非常に困難なタスクを簡単に処理できます。それは、PDFドキュメント内のテキスト編集を簡単に行えるようにします。テキストドキュメントでテキストファイルを操作するのと同様に、すべてのオペレーティングシステムでファイルをエクスポートすることができます。 IronPDFアプリケーションは、PDFの表示、修正、およびコンテンツの抽出の全プロセスを網羅しています。

IronPDFで正しい一歩を踏み出そう

IronPDFソフトウェアを使用することで、どのコンピュータでもPDFファイル形式のテキストを迅速かつ簡単に読み込んだり、書き込んだりできます。インストールは簡単な作業です。これはC#でPDFファイルを読み取る最良の方法です。開発用にIronPDFを無料でダウンロードすることもできます。 IronPDF を探索すると、このライブラリが非常に使いやすい PDF 機能を豊富に提供していることに気付くでしょう。自由時間にクラスを探求しましょう!以下の内容を日本語に翻訳します：

いくつかのHTMLを使用してPDFを作成するC#の例PDFの読み取りから最適な出力を作成する方法を学ぶために利用可能です。

IronPDFを使用してPDFファイルを読み取る

ステップ1: IronPDF パッケージをインストールする

始めるには、まずIronPDF NuGetパッケージをインストールするあなたの.NETプロジェクトに Visual Studioのパッケージマネージャーコンソールを開き、次のコマンドを入力することでこれを行うことができます：

Install-Package IronPdf

ステップ2: IronPDFライブラリをインポートする

次に、ファイルの先頭に次の文を追加してIronPDFライブラリをコードにインポートする必要があります:

using IronPdf;

using IronPdf;

Imports IronPdf

ステップ 3: PDFドキュメントを読み込む

IronPDFライブラリをインポートしたら、以下のコードを使用してPDFドキュメントをコードにロードすることができます。

PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);

PdfDocument pdf = PdfDocument.FromFile(@"C:\dotnet.pdf");
var outputPath = "Example.pdf";
pdf.SaveAs(outputPath);

Dim pdf As PdfDocument = PdfDocument.FromFile("C:\dotnet.pdf")
Dim outputPath = "Example.pdf"
pdf.SaveAs(outputPath)

ステップ 4: PDF からテキストを抽出する

IronPDFは、既存のPDFファイルからテキストを抽出するためのさまざまな方法を提供します。例えば、以下のコードスニペットを使用して、PDFからテキストを抽出し、それをコンソールに出力することができます:

string text = pdf.ExtractText();
Console.Writeline(text);

string text = pdf.ExtractText();
Console.Writeline(text);

Dim text As String = pdf.ExtractText()
Console.Writeline(text)

上記のコードを使用することで、PDFファイルからテキストを抽出する.

C#でPDFファイルを読む方法、図1: IronPDFを使用したPDFからのテキスト抽出

IronPDFを使用してPDFからテキストを抽出する

ステップ5: PDF を画像にラスタライズする

さあIronPDFでPDFファイルを画像にラスタライズするIronPDFを使用する。まず、必要なライブラリをインポートします:

using System.Linq;
using IronPdf;
using IronSoftware.Drawing;

using System.Linq;
using IronPdf;
using IronSoftware.Drawing;

Imports System.Linq
Imports IronPdf
Imports IronSoftware.Drawing

コードは次に使用しますRasterizeToImageFiles` メソッドPDF 文書のすべてのページを画像ファイルとしてフォルダに抽出します。抽出された画像はPNGまたはJPGファイルとして保存でき、画像の寸法やページ範囲も指定することができます。

// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);

// Extract all pages to a folder as image files
pdf.RasterizeToImageFiles(@"C:\image\folder\*.png");

// Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles(@"C:\image\folder\example_pdf_image_*.jpg", 100, 80);

' Extract all pages to a folder as image files
pdf.RasterizeToImageFiles("C:\image\folder\*.png")

' Dimensions and page ranges may be specified
pdf.RasterizeToImageFiles("C:\image\folder\example_pdf_image_*.jpg", 100, 80)

以下では、コードが使用されています:ToBitmap` メソッドPDF 文書のすべてのページを AnyBitmap オブジェクトとして抽出し、コード内でさらに処理・操作できるようにします。

// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();

// Extract all pages as AnyBitmap objects
AnyBitmap [] pdfBitmaps = pdf.ToBitmap();

' Extract all pages as AnyBitmap objects
Dim pdfBitmaps() As AnyBitmap = pdf.ToBitmap()

上記のコードは、IronPDFを使用してPDFファイルの内容を抽出し、抽出されたデータを画像ファイルまたはさらなる処理のためにAnyBitmapオブジェクトとして保存する方法を示しています。

ステップ 7: PDFページの操作

以下を日本語に翻訳します：

Let's learn how to

学びましょうPDF文書のページを操作するIronPDFを使ってPDFファイルを読んでください。

コードは最初にページ2と3をPDFドキュメントから削除します。RemovePages`メソッド:

pdf.RemovePages(1, 2);

pdf.RemovePages(1, 2);

pdf.RemovePages(1, 2)

RemovePages メソッドは2つの引数を取ります: 削除する開始ページ(この場合、ページ番号は0から始まるため、ページ2は 1 として表されます。)削除するページ数(この場合、2ページ).

ステップ6: PDFを保存

最後に、PDFファイルをローカルシステムに保存することができます。SaveAs`メソッド. PDFファイルを保存するためのコードは以下の通りです:

pdf.SaveAs(OutputPath);

pdf.SaveAs(OutputPath);

pdf.SaveAs(OutputPath)

IronPDFの互換性

IronPDFは、.NET 7を含む最新のすべての.NET Frameworkと高度な互換性があります。また、Microsoftによる最新のWeb開発向け技術である.NET Blazorおよび.NET MAUIもサポートしています。ライブラリのこれらのフレームワークとの互換性により、開発者はIronPDFを自分のアプリケーションにシームレスに統合し、その強力な機能を活用することが可能になります。

IronPDF の主な機能の一つは、.NET Blazor および .NET MAUI で PDF ファイルを読み取る能力です。この機能により、開発者はPDFファイルからデータを迅速かつ簡単に読み取り、抽出して、それを.NETアプリケーションで使用することができます。この機能は、大量のデータを扱う際に特に役立ちます。開発者は、自身の.NETプロジェクトでIronPDFを使用するために他のライブラリを必要としません。

詳細情報はこちらをご覧くださいこのチュートリアルでは.NET Blazorで動作するIronPDFについて説明します。そしてIronPDF と.NET MAUIの統合IronPDF のウェブサイトで。

結論

結論として、プログラムによってPDFファイルを読み取ることは、さまざまな業界において重要です。 IronPDFは、PDFファイルからコンテンツを読み取り、変更し、抽出するための包括的な機能を提供することで、このタスクを処理するための包括的なソリューションを提供します。IronPDFは、簡単なステップですぐにインストールして使用できます。

ライブラリは、次の方法を提供しています。PDF文書からテキストを抽出, PDFを画像にラスタライズするページを操作して、PDFファイルを保存します。プログラムによるPDF処理に不慣れな方も、経験豊富な開発者の方も、IronPDFはスキルを次のレベルに引き上げるための完璧なツールです。

以下の内容を日本語に翻訳してください：

C#でPDFファイルを読み取るための信頼できて効率的なソリューションをお探しなら、IronPDFは特に研究する価値があります。ライセンスオプションと価格情報申し訳ありませんが、提供された内容が不完全です。必要な情報をすべて含めて再度送信してください。例えば、"IronPDFは簡単にPDFを生成するためのツールです"のような完全な文を入力してください。無料試用利用可能。以下の画像でIronPDFが提供する他のプランを確認できます。お客様のニーズに合ったパッケージを選択できます。

C#でPDFファイルを読む方法、図2: IronPDFライセンス料金

IronPDF ライセンス価格

リーガン・パン

今すぐエンジニアリングチームとチャット

ソフトウェアエンジニア

レーガンはリーディング大学で電子工学の学士号を取得しました。Iron Softwareに入社する前の仕事では、一つのタスクに集中して取り組んでいました。Iron Softwareでは、営業、技術サポート、製品開発、マーケティングのいずれにおいても広範な業務に携わることが最も楽しいと感じています。彼は、Iron Softwareライブラリを開発者がどのように使用しているかを理解し、その知識を使ってドキュメントを継続的に改善し、製品を開発することを楽しんでいます。

< 以前
C#でWord（Docx）をPDFに変換する方法（チュートリアル）

次へ >
IronPDFを購入すべきですか？