IRONPDFの使用 VB.NETでPDFファイルを解析する方法 カーティス・チャウ 更新日:2025年7月28日 IronPDF をダウンロード NuGet ダウンロード DLL ダウンロード Windows 版 無料トライアル LLM向けのコピー LLM向けのコピー LLM 用の Markdown としてページをコピーする ChatGPTで開く このページについてChatGPTに質問する ジェミニで開く このページについてGeminiに問い合わせる Grokで開く このページについてGrokに質問する 困惑の中で開く このページについてPerplexityに問い合わせる 共有する Facebook で共有 Xでシェア(Twitter) LinkedIn で共有 URLをコピー 記事をメールで送る このチュートリアルでは、IronPDFの一流のサポートを受けて、PDFファイルからテキストや画像をプログラムで抽出する方法を紹介します。 VB.NETでPDFファイルを解析する方法 PDFファイルを解析するIronPDF C#ライブラリをダウンロードする. VB.NETで`FromFile`メソッドを利用してPDFファイルを解析する 開いたPDFから`ExtractAllText`メソッドでテキストを抽出する 特定のページからテキストを抽出するには、`ExtractTextFromPages`メソッドを使用します。 開いたPDFから`ExtractRawImagesFromPage`メソッドで画像を抽出する IronPDF 特徴 効率的なPDF変換。 機械でできるほとんどのことを、IronPDFでもできます。 このPDFライブラリのおかげで、開発者は迅速にPDFを作成、テキストコンテンツを読み取り、書き込み、読み込み、操作することができます。 IronPDFは、Chromeエンジンを使用してHTMLをPDFレコードに変換します。Windows Forms、HTML、ASPX、Razor HTML、.NET Core、ASP.NET、Windows Forms、WPFと組み合わせて。 IronPDFはまた、Xamarin、Blazor、Unity、HoloLensアプリケーションをサポートします。 IronPDFは、Microsoft .NETと.NET Coreアプリケーション(ASP.NET Webパッケージと従来のWindowsパッケージの両方)をサポートします。 IronPDFは、美的に魅力的なPDFを作成するために使用できます。 IronPDFは、HTML5、JavaScript、CSS、画像を使用してPDFを作成できます。 IronPDFには、PDFと統合される強力なHTML-to-PDFコンバータもあります。 IronPDFには、Chromiumレンダリングエンジンを使用した強力なPDF変換メカニズムがあります。また、外部ソースには依存していません。 PDF画像は、HTML、HTML5、ASPX、Razor/MVC Viewなど、さまざまなソースから作成できます。 HTMLと画像のアセットの両方をPDFに変換できます。 インタラクティブなPDFを操作するためのツールには、インタラクティブフォームの記入と送信があります。 PDFをマージおよび分割、PDFファイルからテキストと画像を抽出、PDFファイル内のテキストを検索し、PDFを画像にラスタライズ、フォントサイズを変更してPDFファイルを変換します。 ユーザーエージェント、プロキシ、クッキー、HTTPヘッダー、およびフォーム変数を使用して、HTMLログインフォームの確認ができます。 IronPDFは、ユーザー名とパスワードを提供することで、保護されたドキュメントへのアクセスを可能にします。 IronPDFはPDF内のテキストを読み取り、空白を埋めるプログラムです。 テキスト、画像、ブックマーク、ウォーターマークなどを追加できます。 CSSファイルからPDFを作成することができます。 詳細については、このIronPDFライセンス情報ページを訪れて、無料の制限付きキーとプロフェッショナルバージョンをご覧ください。 IronPDF - フォントフォーマット PDFファイルからテキストを抽出する IronPDFは、IronPDFライブラリを使用してPDFファイルからテキストを読み取って抽出することもできます。 以下に示すのは、現在のPDFファイルを確認するために使用できるIronPDFコードのパターンです。 すべてのページからテキストを抽出 以下のコード例は、わずか数行でPDFのすべてのコンテンツを文字列として取得する方法を示しています。 Imports IronPdf Module Program Sub Main(args As String()) ' Create a PDF Document object from an existing PDF file Dim pdfdoc = PdfDocument.FromFile("result.pdf") ' Extract all the text from the PDF Dim AllText As String = pdfdoc.ExtractAllText() ' Output the extracted text to the console Console.WriteLine(AllText) End Sub End Module 上記のサンプル コードは、FromFile メソッドを使用して既存のファイルから PDF を読み取り、それを PDF ドキュメント オブジェクトに変換する方法を示しています。 オブジェクトは、PDF からプレーンテキストを抽出して文字列に変換するExtractAllTextというメソッドを提供します。 ページ番号でテキストを抽出 以下のサンプルコードは、ページ番号を使用してPDFファイルからデータを抽出する方法を示しています。 Imports IronPdf Module Program Sub Main(args As String()) ' Create a PDF Document object from an existing PDF file Dim pdfdoc = PdfDocument.FromFile("result.pdf") ' Extract text from the first page (page numbers are zero-based) Dim AllText As String = pdfdoc.ExtractTextFromPage(0) ' Output the extracted text to the console Console.WriteLine(AllText) End Sub End Module 上記のコードは、既存のファイルから PDF を読み取り、 FromFile関数を使用してそれを PDF ドキュメント オブジェクトに変換する方法を示しています。 テキストと画像は、このオブジェクトを使用してPDF上でアクセスできます。 このオブジェクトには、ページ番号をパラメーターとして送信し、PDF のそのページにあったすべての単語を含む文字列を取得できるExtractTextFromPageというメソッドが用意されています。 ページ間でテキストを抽出 以下のコードは、複数ページ間のデータを抽出する方法を示しています。 Imports IronPdf Module Program Sub Main(args As String()) ' Define a list of page numbers from which to extract text Dim Pages As List(Of Integer) = New List(Of Integer) From {3, 5, 7} ' Create a PDF Document object from an existing PDF file Dim pdfdoc = PdfDocument.FromFile("result.pdf") ' Extract text from the specified pages Dim AllText As String = pdfdoc.ExtractTextFromPages(Pages) ' Output the extracted text to the console Console.WriteLine(AllText) End Sub End Module 上記のコードは、FromFile メソッドを使用して既存のファイルから PDF を読み取り、それを PDF ドキュメント オブジェクトに変換する方法を示しています。 このオブジェクトにより、PDF上のテキストと画像を調べることができます。 オブジェクトには、ページ番号のリストをパラメータとして渡すことで、ドキュメントの特定のページにあるすべてのテキスト コンテンツを含む文字列を取得するために使用できるExtractTextFromPagesというメソッドがあります。 下記の左側はソースPDFで、右側は抽出されたデータです。 ページ間でのテキスト抽出結果 PDFファイルから画像を抽出する IronPDFは、画像を抽出するためのメソッドリストを提供します: ExtractBitmapsFromPage ExtractBitmapsFromPages ExtractImagesFromPage ExtractImagesFromPages ExtractRawImagesFromPage ExtractRawImagesFromPages 各メソッドは、文書の1ページまたは複数ページから画像を抽出することを可能にします。 Imports IronPdf Imports System.Drawing Module Program Sub Main(args As String()) ' Create a PDF Document object from an existing PDF file Dim pdfdoc = PdfDocument.FromFile("result.pdf") ' Extract raw images from the first page Dim images = pdfdoc.ExtractRawImagesFromPage(1) ' Iterate over extracted images For Each imgData As Byte() In images ' Create a memory stream from byte data Using ms As New IO.MemoryStream(imgData) ' Create a Bitmap object from the memory stream Dim image = New Bitmap(ms) ' Save the image to the specified output directory image.Save("output/test.jpg") End Using Next End Sub End Module 上記のコードは、既存のファイルからドキュメントを読み取り、FromFile 関数を使用して PDF ドキュメント オブジェクトに変換する方法を示しています。 オブジェクトの ExtractRawImagesFromPage メソッドにページ番号を渡すと、ドキュメントのそのページに存在していたすべての画像を含むバイトのリストを取得できます。 For Each ループを使用して、各バイト ストリームが処理され、メモリ ストリームに変換され、次に Bitmap に変換されて、画像の保存に役立ちます。 下記の画像は、上記のコードからの出力を示しています。 PDFからの画像抽出結果 IronPDF APIコードチュートリアルについてもっと知りたい方は、IronPDFドキュメントを参照してください。 また、PDFテキストをC#で解析する方法を学ぶ他のチュートリアルも訪問できます。 結論 IronPDFライブラリの開発ライセンスは無料です。 IronPDFをプロダクション環境で使用する場合、開発者のニーズに応じて異なるライセンスを購入できます。 Lite プランは $799 から始まり、継続的なコストは発生しません。 SaaSおよびOEM再配布のオプションも提供されています。 すべてのライセンスには、更新、1年間の製品サポート、および永続ライセンスが含まれています。 これらはまた製造、ステージング、開発においても有用です。 一度の購入です。 追加の無料で時間制限のあるライセンスも利用可能です。 IronPDFの詳細な価格とライセンス情報を読むためには、包括的なIronPDFライセンス情報を訪れてください。 IronPDFはコピー保護用の無料ライセンスも提供しています。 よくある質問 VB.NET で PDF からテキストを抽出するにはどうすればよいですか? IronPDF ライブラリを使用すると、ExtractAllText メソッドを利用して PDF からテキストを抽出できます。これにより、VB.NET プロジェクト内で PDF ドキュメントのすべてのページからテキストを取得することができます。 VB.NET を使用して PDF の特定のページから画像を抽出することは可能ですか? はい、IronPDF は ExtractRawImagesFromPage メソッドを使用して特定のページから画像を抽出することができます。このメソッドは、画像データをバイト配列として返し、これを画像ファイルに変換できます。 VB.NETでHTMLコンテンツをPDF文書に変換するにはどうすれば良いですか? IronPDF は、強力な HTML から PDF への変換を Chromium レンダリング エンジンを使用して提供します。RenderHtmlAsPdf などのメソッドを使用することで、HTML ストリングまたはファイルを効率的に PDF ドキュメントに変換できます。 VB.NET アプリケーションで PDF パースに IronPDF を使用する利点は何ですか? IronPDF は、テキストと画像の抽出のための多様な API を提供し、HTML から PDF への変換をサポートし、ASP.NET、Windows Forms、Blazor を含むさまざまな .NET プラットフォームと互換性があります。開発および本番のニーズに合うさまざまなライセンス オプションも提供しています。 VB.NET プロジェクトに IronPDF を統合するにはどうすればよいですか? IronPDF を統合するには、NuGet からライブラリをダウンロードして、VB.NET プロジェクトに追加します。これにより、プログラムで PDF ファイルをパースおよび操作するためのメソッドにアクセスできるようになります。 IronPDF は PDF の解析と変換タスクの両方を処理できますか? はい、IronPDF は解析 (テキストと画像の抽出) と変換タスク (HTML から PDF など) を効率的に処理するように設計されており、VB.NET で PDF を操作するための包括的なソリューションとなっています。 IronPDFのライセンスオプションはどのようになっていますか? IronPDF は、無料の開発ライセンスとさまざまな本番ライセンス (Lite、SaaS、OEM 再配布を含む) を提供しています。これらのライセンスには、さまざまなプロジェクトのニーズを満たす 1 年間の更新とサポートが含まれています。 IronPDF の機能に外部リソースが依存していますか? いいえ、IronPDF は自己完結型であり、内部的には Chromium レンダリング エンジンを使用しており、PDF の変換と解析のために、外部リソースに依存することなく、堅牢な機能を提供します。 IronPDF は .NET 10 をサポートしていますか? また、VB.NET 開発者にとってどのようなメリットがありますか? はい、IronPDFは.NET 10に加え、.NET 9、8、7、6、Core、Standard、Frameworkなどの以前のバージョンも完全にサポートしています。つまり、.NET 10をターゲットとするVB.NETプロジェクトでは、追加の設定なしでIronPDFを使用できます。開発者は、ヒープ割り当ての削減、ランタイムおよびJIT最適化の向上など、.NET 10の新しいランタイムパフォーマンス向上の恩恵を受けることができ、PDF生成、テキスト/画像抽出、HTMLからPDFへのレンダリングが強化されます。 カーティス・チャウ 今すぐエンジニアリングチームとチャット テクニカルライター Curtis Chauは、カールトン大学でコンピュータサイエンスの学士号を取得し、Node.js、TypeScript、JavaScript、およびReactに精通したフロントエンド開発を専門としています。直感的で美しいユーザーインターフェースを作成することに情熱を持ち、Curtisは現代のフレームワークを用いた開発や、構造の良い視覚的に魅力的なマニュアルの作成を楽しんでいます。開発以外にも、CurtisはIoT(Internet of Things)への強い関心を持ち、ハードウェアとソフトウェアの統合方法を模索しています。余暇には、ゲームをしたりDiscordボットを作成したりして、技術に対する愛情と創造性を組み合わせています。 関連する記事 更新日 2026年3月1日 .NETでIronPDFを使用してPDFファイルを作成する方法 (C#チュートリアル) C#で開発者向けにPDFファイルを作成する効果的な方法を発見します。コーディングスキルを向上させ、プロジェクトを効率化します。この記事を今すぐお読みください! 詳しく読む 更新日 2026年2月27日 C#でPDFファイルをマージする方法 IronPDF で PDF をマージします。シンプルな VB.NET コードを使用して、複数の PDF ファイルを1つのドキュメントに結合する方法を学びます。ステップバイステップの例が含まれています。 詳しく読む 更新日 2026年3月1日 .NET 10 開発者向け C# PDFWriter チュートリアル このステップバイステップガイドで開発者がC# PDFWriterを使用してPDFを効率的に作成する方法を学びます。記事を読んでスキルを向上させましょう! 詳しく読む PDFのセキュリティを解除する方法(初心者向けチュートリアル).NETでPDFをJPGに変換する方法
更新日 2026年3月1日 .NETでIronPDFを使用してPDFファイルを作成する方法 (C#チュートリアル) C#で開発者向けにPDFファイルを作成する効果的な方法を発見します。コーディングスキルを向上させ、プロジェクトを効率化します。この記事を今すぐお読みください! 詳しく読む
更新日 2026年2月27日 C#でPDFファイルをマージする方法 IronPDF で PDF をマージします。シンプルな VB.NET コードを使用して、複数の PDF ファイルを1つのドキュメントに結合する方法を学びます。ステップバイステップの例が含まれています。 詳しく読む
更新日 2026年3月1日 .NET 10 開発者向け C# PDFWriter チュートリアル このステップバイステップガイドで開発者がC# PDFWriterを使用してPDFを効率的に作成する方法を学びます。記事を読んでスキルを向上させましょう! 詳しく読む