푸터 콘텐츠로 바로가기
IRONPDF 사용하기
C# PDF에서 텍스트 추출

C# PDF를 텍스트로 변환하기 (코드 예제)

이 기사는 .NET 개발자를 위해 PDF 파일을 TXT 형식으로 변환하여 더욱 효율적으로 접근할 수 있는 과정을 설명합니다.

튜토리얼에 포함된 주제

  • IronPDF
  • 프로그래밍 방식으로 PDF 파일을 생성하는 단계
  • 1단계: C# 프로젝트 생성
  • 2단계: IronPDF 라이브러리 설치
    • 방법 1: NuGet 패키지 관리자
    • 방법 2: NuGet 패키지 관리자 콘솔
    • 방법 3: DLL 파일 사용
  • 3단계: IronPDF 네임스페이스 추가
  • 4단계: PDF를 텍스트로 변환
    • 출력
  • 결론

IronPDF

IronPDF는 PDF 생성 for .NET 라이브러리입니다. 이것은 네이티브 .NET 라이브러리이며 외부 DLL이나 기타 도구에 의존하지 않습니다. IronPDF는 C#과 .NET으로 작성된 크로스 플랫폼 라이브러리로, PDF 문서 작업에 필요한 모든 기능을 제공합니다. 문서 렌더링, 양식 편집, 텍스트 추출, 파일 암호화를 포함한 기능들이 포함되어 있습니다. 이러한 모든 작업은 Windows Forms, WPF, ASP.NET MVC 등 다양한 플랫폼에서 광범위하게 테스트된 직관적인 API를 통해 수행할 수 있습니다.

IronPDF의 현재 릴리스는 다음 기능에 간단히 접근할 수 있도록 제공합니다:

문서 내부 읽기 전용 접근 (보기, 탐색, 주석):

메타데이터 및 문서 속성 (제목, 키워드, 저자, 주제):

IronPDF는 HTML 문서를 완전히 형식화된 PDF 파일로 변환하면서 텍스트 추출을 돕는 몇 가지 추가적인 헬퍼 클래스도 포함하고 있습니다. IronPDF는 PDF를 텍스트 파일로 변환하기 위한 매우 간단한 API를 제공합니다.

IronPDF 라이브러리를 사용하여 PDF 문서를 텍스트 파일로 변환하는 방법을 시작해 봅시다.

PDF 문서를 텍스트 파일로 변환하는 단계

첫 번째 단계는 Visual Studio에서 C# 프로젝트를 만드는 것입니다. 필요에 따라 어떤 C# 애플리케이션 템플릿이든 선택할 수 있습니다. 간단히 하기 위해 이 튜토리얼에서는 콘솔 애플리케이션 템플릿을 사용할 것입니다. 이미 존재하는 C# 프로젝트를 이용하여 PDF를 TXT 파일로 변환할 수 있습니다.

1단계: C# 프로젝트 만들기

Visual Studio에서 C# 프로젝트를 만들거나 기존 프로젝트를 엽니다. 최신 버전의 Visual Studio를 사용하면 원활한 작업이 가능합니다. Visual Studio에서 C# 프로젝트를 생성하는 방법은 다음 단계를 따르십시오.

  1. Visual Studio를 엽니다.
  2. C# 콘솔 애플리케이션 템플릿을 선택하거나 기존 프로젝트를 엽니다.
  3. 프로젝트에 적절한 이름을 부여합니다.
  4. .NET Framework 버전 6.0을 선택합니다. 이것은 최신이자 가장 안정적인 .NET의 프레임워크이며, 필요에 따라 다른 .NET Framework를 선택할 수 있습니다.

2단계: IronPDF 라이브러리 설치

IronPDF는 개발 시간을 단축하고 혼동을 줄이는 쉬운 설치 과정을 제공합니다. IronPDF 라이브러리는 여러 가지 설치 방법을 제공합니다:

  • NuGet 패키지 관리자 사용
  • NuGet 패키지 관리자 콘솔 사용
  • DLL 파일로 설치

방법 1: NuGet 패키지 관리자

NuGet 패키지 관리자를 사용하려면 패키지 관리자 탭을 열기 위한 다음 단계를 따르십시오.

C# 프로젝트를 열고 도구 > NuGet 패키지 관리자 > 솔루션용 NuGet 패키지 관리를 클릭합니다.

C# PDF를 텍스트로 변환 (코드 예제), 그림 0: NuGet 패키지 관리자로 이동 NuGet 패키지 관리자에 접근하십시오

  • 이제 찾아보기 탭으로 이동하여 IronPDF를 검색합니다.
  • 검색 결과에서 IronPDF를 선택하고 설치를 클릭합니다. 이렇게 하면 IronPDF 라이브러리가 설치되어 프로젝트에서 IronPDF 라이브러리를 사용할 수 있게 됩니다.

C# PDF를 텍스트로 변환 (코드 예제), 그림 1: NuGet 패키지 관리자 검색 결과에서 IronPdf 패키지 NuGet 패키지 관리자의 검색 결과에서 IronPdf 패키지

방법 2: NuGet 패키지 관리자 콘솔

Package Manager Console로 IronPDF 라이브러리를 설치하는 것이 가장 쉬운 방법입니다. 다음의 간단한 단계를 따르세요:

  • 패키지 관리자 콘솔을 엽니다.
  • 콘솔에 다음 줄을 작성하고 엔터를 누릅니다. 이로 인해 IronPDF 라이브러리가 즉시 설치됩니다.
Install-Package IronPdf

C# PDF를 텍스트로 변환 (코드 예제), 그림 2: NuGet 패키지 관리자 콘솔 UI에 표시된 설치 진행 상황 NuGet 패키지 관리자 콘솔 UI에 표시된 설치 진행 상황

방법 3: DLL 파일 사용

Iron Software 웹사이트에서 IronPDF DLL 파일을 다운로드할 수 있습니다. 다운로드가 완료되면 프로젝트에서 참조로 사용하세요.

더 상세한 설치 가이드를 위해 IronPDF 설치 가이드를 방문하세요.

이제 IronPDF 라이브러리 설치가 완료되었습니다. 다음 단계는 PDF 파일을 텍스트 파일로 변환하는 방법을 안내합니다.

단계 3: IronPDF 네임스페이스 추가

IronPDF를 사용하려면 모든 코드 파일에 IronPDF 네임스페이스를 추가해야 합니다. 관련 코드 파일 상단에 다음의 코드 줄을 작성하세요. 이를 통해 프로그램에서 IronPDF의 기능을 사용할 수 있게 됩니다.

using IronPdf;
using IronPdf;
Imports IronPdf
$vbLabelText   $csharpLabel

단계 4: PDF 문서를 텍스트 파일로 변환

이제 PDF 파일을 TXT 파일로 변환하거나 텍스트만 추출해야 합니다. 그래서, 코드 파일에 다음 샘플 코드를 작성하세요:

using IronPdf;
using System;

class Program
{
    static void Main()
    {
        // Extracting image and text content from PDF Document

        // Open a 128-bit encrypted PDF
        using PdfDocument pdf = PdfDocument.FromFile("encrypted.pdf", "password");

        // Get all text to put in a search index
        string allText = pdf.ExtractAllText();

        // Display the extracted text in the console
        Console.WriteLine(allText);
    }
}
using IronPdf;
using System;

class Program
{
    static void Main()
    {
        // Extracting image and text content from PDF Document

        // Open a 128-bit encrypted PDF
        using PdfDocument pdf = PdfDocument.FromFile("encrypted.pdf", "password");

        // Get all text to put in a search index
        string allText = pdf.ExtractAllText();

        // Display the extracted text in the console
        Console.WriteLine(allText);
    }
}
Imports IronPdf
Imports System

Friend Class Program
	Shared Sub Main()
		' Extracting image and text content from PDF Document

		' Open a 128-bit encrypted PDF
		Using pdf As PdfDocument = PdfDocument.FromFile("encrypted.pdf", "password")
	
			' Get all text to put in a search index
			Dim allText As String = pdf.ExtractAllText()
	
			' Display the extracted text in the console
			Console.WriteLine(allText)
		End Using
	End Sub
End Class
$vbLabelText   $csharpLabel

먼저, FromFile function을 사용하여 PDF 문서를 PdfDocument class에서 엽니다. 매개변수에는 파일 이름과 비밀번호(있는 경우)를 전달하세요. 그런 다음, ExtractAllText function을 사용하여 PDF 파일에서 모든 텍스트를 추출하고 이를 allText라는 변수에 저장합니다. 그 후, 콘솔에 출력 텍스트를 표시하세요.

출력

C# PDF를 텍스트로 변환 (코드 예제), 그림 3: PDF 문서에서 추출한 텍스트 PDF 문서에서 추출된 텍스트

이것은 IronPDF에서 추출한 출력 텍스트입니다. 이것은 PDF 파일에 표시된 동일한 텍스트로, IronPDF의 정확도가 매우 정확함을 보여줍니다.

결론

이 글은 IronPDF .NET PDF 라이브러리를 사용하여 PDF 파일에서 텍스트를 쉽게 추출하는 방법을 보여줍니다. 이는 단 몇 줄의 코드만 작성했음에도 높은 정확도로 달성되었습니다. 추가적으로, IronPDF는 HTML을 PDF로 변환, PDF 형식 도구 등 많은 유용한 기능들을 제공하며, PDF 편집에 필수적인 다양한 핵심 PDF 기능들도 제공합니다. IronPDF는 Adobe Acrobat의 의존성을 제거합니다.

IronPDF는 개발 목적으로 무료이며, 또한 프로덕션 테스트를 위한 무료 체험판을 제공합니다. IronPDF는 필요에 따라 얻을 수 있는 다양한 가격 계획을 제공합니다. IronPDF의 가격은 경쟁사에 비해 상대적으로 상당히 저렴합니다. 개인부터 대기업까지 다양한 가격 변동과 함께, 인상적인 성능으로 설득력 있는 구매로 입증됩니다.

C# PDF를 텍스트로 변환 (코드 예제), 그림 4: Iron Software의 Suite 가격 계획 Iron Software의 Suite에 대한 가격 계획

또한, Iron Software는 두 개의 가격으로 다섯 개의 Iron Software 패키지 Suite를 제공합니다. 자세한 내용을 확인하려면 Iron Software 라이선스 세부 정보를 방문하세요.

자주 묻는 질문

C# 응용 프로그램에서 PDF 문서를 텍스트로 변환할 수 있는 방법은 무엇인가요?

C# 응용 프로그램에서 IronPDF를 사용하여 PDF 문서를 텍스트로 변환하려면 PdfDocument.FromFile 메서드를 사용하여 PDF를 로드하고 ExtractAllText 메서드를 호출하여 텍스트 내용을 가져옵니다.

Visual Studio C# 프로젝트에 IronPDF를 설정하는 과정은 무엇인가요?

Visual Studio C# 프로젝트에서 IronPDF를 설정하려면, 새 프로젝트를 생성하고 NuGet 패키지 관리자, 패키지 관리자 콘솔 또는 DLL을 수동으로 추가하여 IronPDF를 설치한 다음 코드 파일에 IronPDF 네임스페이스를 포함해야 합니다.

IronPDF는 암호화된 PDF 파일을 처리할 수 있나요?

네, IronPDF는 암호화된 PDF 파일을 열고 처리하여 텍스트 내용을 추출할 수 있습니다.

PDF를 TXT 형식으로 변환하는 이점은 무엇인가요?

IronPDF를 사용하여 PDF를 TXT 형식으로 변환하면, 텍스트 데이터의 접근성이 향상되고 조작이 쉬워지며, 이는 텍스트 처리 또는 검색이 필요한 응용 프로그램에 유리합니다.

IronPDF는 PDF에서 텍스트 추출의 정확도를 어떻게 보장하나요?

IronPDF는 PDF에 나타나는 텍스트의 무결성을 유지하여 높은 정확도의 텍스트 추출을 보장하며, 신뢰할 수 있는 출력을 제공하여 추가 프로세싱에 적합합니다.

IronPDF 라이브러리를 테스트하기 위한 무료 체험판이 제공되나요?

네, IronPDF는 개발 및 테스트 목적으로 무료 체험판을 제공하여, 구매 전에 그 기능과 역량을 평가할 수 있게 합니다.

IronPDF가 크로스 플랫폼 개발에 적합한 선택인 이유는 무엇입니까?

IronPDF는 C# 및 .NET으로 작성되어 추가 외부 도구 없이도 크로스 플랫폼 개발에 적합한 선택입니다.

IronPDF를 텍스트 추출 이외의 목적으로 사용할 수 있습니까?

예, IronPDF는 텍스트 추출 외에도 PDF 생성, 문서 암호화, 양식 처리 및 HTML을 PDF로 변환하는 기능을 제공합니다.

.NET 10에서 PDF를 텍스트로 변환하는 데 IronPDF는 얼마나 잘 지원합니까?

IronPDF는 .NET 10과 완벽하게 호환되어, 특별한 구성 없이도 바로 지원합니다. .NET 10에서 PDF를 텍스트로 변환할 때는 힙 할당 감소와 같은 성능 향상과 빠른 추출 및 더 적은 메모리 사용을 가능하게 하는 런타임 개선의 이점이 있습니다.

IronPDF를 .NET 10과 함께 사용할 때 지원되는 플랫폼 및 프로젝트 유형은 무엇입니까?

IronPDF for .NET 10은 Windows (10+, Server), macOS, Linux, 그리고 컨테이너 환경을 포함한 다양한 플랫폼을 지원합니다. 이는 콘솔, 데스크톱(WPF, MAUI), 웹(MVC, Blazor)과 같은 프로젝트 유형에서도 작동하며, C#, F#, VB.NET 등 언어를 지원합니다.

커티스 차우
기술 문서 작성자

커티스 차우는 칼턴 대학교에서 컴퓨터 과학 학사 학위를 취득했으며, Node.js, TypeScript, JavaScript, React를 전문으로 하는 프론트엔드 개발자입니다. 직관적이고 미적으로 뛰어난 사용자 인터페이스를 만드는 데 열정을 가진 그는 최신 프레임워크를 활용하고, 잘 구성되고 시각적으로 매력적인 매뉴얼을 제작하는 것을 즐깁니다.

커티스는 개발 분야 외에도 사물 인터넷(IoT)에 깊은 관심을 가지고 있으며, 하드웨어와 소프트웨어를 통합하는 혁신적인 방법을 연구합니다. 여가 시간에는 게임을 즐기거나 디스코드 봇을 만들면서 기술에 대한 애정과 창의성을 결합합니다.

아이언 서포트 팀

저희는 주 5일, 24시간 온라인으로 운영합니다.
채팅
이메일
전화해