C#에서 PDF 파일 읽기

IronPDF C# PDF 라이브러리의 PdfDocument.ExtractAllText 메서드는 기본 PDF 텍스트 읽기 작업에 안성맞춤입니다. 이 방법은 원본 PDF 문서 내의 공백 및 인코딩 불일치를 문제없이 처리합니다.

PdfDocument.ExtractTextFromPage는 PDF의 특정 페이지에서 텍스트를 읽어옵니다. 아래 예시에서는 특정 페이지 범위에서 텍스트 콘텐츠를 검색하기 위해 반복적으로 사용되는 것을 볼 수 있습니다.

IronPDF PDF에서 원본 이미지를 추출할 수도 있습니다. 이를 위해 아래 PdfDocument 클래스의 방법 중 하나를 사용하십시오:

  • ExtractAllImages: PDF에 포함된 모든 이미지를 IronSoftware.Drawing.AnyBitmap 객체로 반환합니다.
  • ExtractAllRawImages: 모든 내장 이미지를 원시 바이트 목록으로 가져옵니다 (byte[]).
  • ExtractImagesFromPage: 색인된 페이지에 포함된 이미지를 추출합니다.
  • ExtractImagesFromPages: ExtractImagesFromPage와 동일하지만, 특정 페이지 범위 또는 개별 페이지 목록에서 추출합니다.
  • ExtractRawImagesFromPageExtractRawImagesFromPages: 앞의 두 방법과 동일하게 작동하지만, 추출된 이미지를 IronSoftware.Drawing.AnyBitmap 객체가 아닌 바이트 배열로 반환합니다.

Learn more about ExtractTextFromPage Method

시작할 준비 되셨나요?
Nuget 다운로드 19,014,616 | 버전: 2026.5 just released
Still Scrolling Icon

아직도 스크롤하고 계신가요?

빠른 증거를 원하시나요? PM > Install-Package IronPdf
샘플을 실행하세요 HTML이 PDF로 변환되는 것을 지켜보세요.