C#에서 PDF 파일 읽기

IronPDF C# PDF 라이브러리의 PdfDocument.ExtractAllText 메서드는 기본적인 PDF 텍스트 읽기 작업에 적합합니다. 이 방법은 원본 PDF 문서 내의 공백 및 인코딩 불일치를 문제없이 처리합니다.

PdfDocument.ExtractTextFromPage는 PDF의 특정 페이지에서 텍스트를 읽습니다. 아래 예시에서는 특정 페이지 범위에서 텍스트 콘텐츠를 검색하기 위해 반복적으로 사용되는 것을 볼 수 있습니다.

IronPDF는 PDF에서 원본 이미지를 추출할 수도 있습니다. 이를 위해서는 아래의 PdfDocument 클래스에 있는 메서드 중 하나를 사용하십시오.

  • ExtractAllImages : PDF에 포함된 모든 이미지를 IronSoftware.Drawing.AnyBitmap 객체로 반환합니다.
  • ExtractAllRawImages : 내장된 모든 이미지를 원시 바이트 목록(byte[])으로 검색합니다.
  • ExtractImagesFromPage : 색인된 페이지에 포함된 이미지를 추출합니다.
  • ExtractImagesFromPages : ExtractImagesFromPage 와 동일하지만, 특정 페이지 범위 또는 개별 페이지 목록에서 가져옵니다.
  • ExtractRawImagesFromPageExtractRawImagesFromPages : 이전 두 메서드와 동일하게 작동하지만 추출된 이미지를 IronSoftware.Drawing.AnyBitmap 객체 대신 바이트 배열로 반환합니다.

Learn more about ExtractTextFromPage Method

시작할 준비 되셨나요?
Nuget 다운로드 17,527,568 | 버전: 2026.2 방금 출시되었습니다