C#에서 PDF를 HTML로 변환하는 방법 | IronPDF

IronPDF를 사용하여 C#에서 PDF를 HTML로 변환하는 방법

This article was translated from English: Does it need improvement?
Translated
View the article in English

IronPDF는 SaveAsHtml 메서드를 사용하여 단 한 줄의 코드로 C#에서 PDF를 HTML로 변환할 수 있도록 지원하며, 이를 통해 PDF를 웹 친화적으로 만들어 접근성, SEO 및 웹 통합을 향상시킵니다. IronPDF 라이브러리는 시각적 구조와 레이아웃을 유지하면서 PDF 콘텐츠를 HTML 형식으로 변환하는 강력한 솔루션을 제공합니다.

PDF를 HTML로 변환하면 다음과 같은 이점이 있습니다.

  • 웹 접근성 향상
  • 다양한 기기에 최적화된 반응형 디자인
  • 검색 엔진 최적화 개선
  • 원활한 웹 통합
  • 웹 도구를 통한 간편한 콘텐츠 편집
  • 크로스 플랫폼 호환성
  • 동적 요소 지원

이 변환 과정은 PDF 콘텐츠를 웹 플랫폼에 맞게 재구성하거나 추가 처리를 위해 PDF에서 텍스트와 이미지를 추출 해야 할 때 유용합니다.

IronPDF는 .NET C#에서 PDF를 HTML로 변환하는 과정을 간소화하며, 복잡한 변환 프로세스를 내부적으로 처리하는 메서드를 제공합니다. 문서 관리 시스템을 구축하든, 웹 기반 PDF 뷰어를 만들든, 또는 검색 엔진에서 PDF 콘텐츠를 검색할 수 있도록 하든, IronPDF의 변환 기능은 안정적인 솔루션을 제공합니다.

빠른 시작: IronPDF로 PDF를 HTML로 즉시 변환하세요

IronPDF를 사용하면 단 한 줄의 코드로 PDF 문서를 HTML 파일로 변환할 수 있습니다. 이 예제는 IronPDF의 SaveAsHtml 메서드를 사용하여 PDF를 HTML로 빠르게 변환하는 방법을 보여줍니다.

Nuget Icon지금 바로 NuGet을 사용하여 PDF 만들기를 시작하세요.

  1. NuGet 패키지 관리자를 사용하여 IronPDF를 설치하세요.

    PM > Install-Package IronPdf

  2. 다음 코드 조각을 복사하여 실행하세요.

    IronPdf.PdfDocument.FromFile("example.pdf").SaveAsHtml("output.html");
  3. 실제 운영 환경에서 테스트할 수 있도록 배포하세요.

    지금 바로 무료 체험판을 통해 프로젝트에서 IronPDF를 사용해 보세요.
    arrow pointer


일반 PDF 파일을 HTML로 변환하는 방법은 무엇인가요?

ToHtmlString 메서드는 기존 PDF 문서의 HTML 요소를 분석할 수 있도록 합니다. 디버깅이나 PDF 비교 도구로 사용할 수 있습니다. SaveAsHtml 메서드는 PDF 문서를 HTML 파일로 직접 저장합니다. 두 접근 방식 모두 특정 요구 사항에 따라 유연성을 제공합니다.

PDF를 HTML로 변환하는 과정은 PDF 문서의 시각적 레이아웃을 유지하면서 웹 애플리케이션용 HTML 출력을 생성합니다. 이 기능은 사용자가 PDF 파일을 다운로드하거나 리더 플러그인을 설치할 필요 없이 웹 브라우저에 PDF 콘텐츠를 표시 해야 할 때 유용합니다.

참고해 주세요참고: 원본 PDF의 모든 대화형 양식 필드는 생성된 HTML 문서에서 더 이상 작동하지 않습니다.

PDF 양식을 다루는 개발자의 경우, 변환 과정에서 양식 필드가 정적 콘텐츠로 표시됩니다. 폼 기능을 유지하려면 변환 전에 IronPDF의 폼 편집 기능을 사용하여 폼 데이터를 추출하는 것을 고려해 보세요.

샘플 PDF는 어떻게 생겼나요?

변환 코드를 어떻게 구현하나요?

:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html.cs
using IronPdf;
using System;

PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);

// Convert PDF to HTML file
pdf.SaveAsHtml("myHtml.html");
$vbLabelText   $csharpLabel

이 코드는 PDF를 HTML로 변환하는 두 가지 주요 방법을 보여줍니다. ToHtmlString 메서드는 HTML 콘텐츠를 프로그래밍 방식으로 처리해야 할 때 작동하며, SaveAsHtml 메서드는 파일을 직접 생성합니다. 여러 개의 PDF 파일이 있는 경우, 유사한 기법을 사용하여 일괄 처리하십시오.

출력되는 HTML은 어떤 모습인가요?

SaveAsHtml 메서드에서 생성된 전체 HTML 출력 내용이 아래 웹사이트에 입력되었습니다.


고급 PDF-HTML 변환 옵션은 어떻게 설정할 수 있나요?

ToHtmlStringSaveAsHtml 메서드 모두 HtmlFormatOptions 클래스를 통해 구성 옵션을 제공합니다. 이 설정 시스템은 생성된 HTML 출력의 모양과 동작을 사용자 정의합니다. 이용 가능한 매물은 다음과 같습니다:

  • BackgroundColor : HTML 출력의 배경색을 설정합니다.
  • PdfPageMargin : 페이지 여백을 픽셀 단위로 설정합니다.

아래 속성은 ToHtmlStringSaveAsHtml 메서드의 'title' 매개변수에 적용됩니다. 그들은 원본 PDF 제목을 수정하지 않고 콘텐츠 시작 부분에 새 제목을 추가합니다.

  • H1Color : 제목 색상을 설정합니다.
  • H1FontSize : 제목 글꼴 크기를 픽셀 단위로 설정합니다.
  • H1TextAlignment : 제목 정렬(왼쪽, 가운데 또는 오른쪽)을 설정합니다.

사용자 지정 용지 크기 또는 특정 페이지 방향을 사용하는 개발자의 경우 이러한 구성 옵션을 통해 HTML 출력이 의도한 시각적 구조를 유지하도록 할 수 있습니다.

사용 가능한 구성 옵션은 무엇입니까?

:path=/static-assets/pdf/content-code-examples/how-to/pdf-to-html-advanced-settings.cs
using IronPdf;
using IronSoftware.Drawing;
using System;

PdfDocument pdf = PdfDocument.FromFile("sample.pdf");

// PDF to HTML configuration options
HtmlFormatOptions htmlformat = new HtmlFormatOptions();
htmlformat.BackgroundColor = Color.White;
htmlformat.PdfPageMargin = 10;
htmlformat.H1Color = Color.Blue;
htmlformat.H1FontSize = 25;
htmlformat.H1TextAlignment = TextAlignment.Center;

// Convert PDF to HTML string
string html = pdf.ToHtmlString();
Console.WriteLine(html);

// Convert PDF to HTML file
pdf.SaveAsHtml("myHtmlConfigured.html", true, "Hello World", htmlFormatOptions: htmlformat);
$vbLabelText   $csharpLabel

이 예제는 사용자 지정 스타일을 적용하여 세련된 HTML 출력을 생성하는 방법을 보여줍니다. 구성 옵션은 IronPDF의 렌더링 엔진 과 연동하여 시각적 완성도를 유지하는 고품질 HTML을 생성합니다.

설정된 출력 결과는 어떻게 다른가요?

SaveAsHtml 메서드에서 생성된 전체 HTML 출력 내용이 아래 웹사이트에 입력되었습니다.

HTML 출력에 SVG 태그가 사용되는 이유는 무엇인가요?

이러한 방법들은 CSS가 인라인으로 포함된 HTML 문자열을 생성합니다. 출력되는 HTML은 표준 HTML 태그 대신 SVG 태그를 사용합니다. 이러한 차이점에도 불구하고, 웹 브라우저에서 올바르게 렌더링되는 유효한 HTML을 생성합니다. RenderHtmlAsPdf 메서드를 사용하여 렌더링된 PDF 문서를 사용할 때 이 메서드에서 반환되는 HTML 문자열은 HTML 입력과 다를 수 있습니다.

SVG 기반 접근 방식은 정확한 위치 지정, 글꼴 및 그래픽을 포함하여 복잡한 PDF 레이아웃을 정확하게 표현할 수 있도록 보장합니다. 이 방법은 표준 HTML 요소를 사용하여 재현하기 어려운 이미지 , 차트 또는 복잡한 서식이 포함된 PDF에 효과적입니다.

추가 코드 예제: PDF를 HTML로 일괄 변환

여러 PDF 파일을 HTML로 변환하는 예시를 아래에 제시합니다. 이 예시는 PDF 파일이 있는 디렉토리 전체를 처리합니다.

using IronPdf;
using System.IO;

public class BatchPdfToHtmlConverter
{
    public static void ConvertPdfDirectory(string inputDirectory, string outputDirectory)
    {
        // Ensure output directory exists
        Directory.CreateDirectory(outputDirectory);

        // Configure HTML output settings once for consistency
        HtmlFormatOptions formatOptions = new HtmlFormatOptions
        {
            BackgroundColor = Color.WhiteSmoke,
            PdfPageMargin = 15,
            H1FontSize = 28,
            H1TextAlignment = TextAlignment.Left
        };

        // Process all PDF files in the directory
        string[] pdfFiles = Directory.GetFiles(inputDirectory, "*.pdf");

        foreach (string pdfPath in pdfFiles)
        {
            try
            {
                // Load PDF document
                PdfDocument pdf = PdfDocument.FromFile(pdfPath);

                // Generate output filename
                string fileName = Path.GetFileNameWithoutExtension(pdfPath);
                string htmlPath = Path.Combine(outputDirectory, $"{fileName}.html");

                // Convert and save as HTML with consistent formatting
                pdf.SaveAsHtml(htmlPath, true, fileName, htmlFormatOptions: formatOptions);

                Console.WriteLine($"Converted: {fileName}.pdf → {fileName}.html");
            }
            catch (Exception ex)
            {
                Console.WriteLine($"Error converting {pdfPath}: {ex.Message}");
            }
        }
    }
}
using IronPdf;
using System.IO;

public class BatchPdfToHtmlConverter
{
    public static void ConvertPdfDirectory(string inputDirectory, string outputDirectory)
    {
        // Ensure output directory exists
        Directory.CreateDirectory(outputDirectory);

        // Configure HTML output settings once for consistency
        HtmlFormatOptions formatOptions = new HtmlFormatOptions
        {
            BackgroundColor = Color.WhiteSmoke,
            PdfPageMargin = 15,
            H1FontSize = 28,
            H1TextAlignment = TextAlignment.Left
        };

        // Process all PDF files in the directory
        string[] pdfFiles = Directory.GetFiles(inputDirectory, "*.pdf");

        foreach (string pdfPath in pdfFiles)
        {
            try
            {
                // Load PDF document
                PdfDocument pdf = PdfDocument.FromFile(pdfPath);

                // Generate output filename
                string fileName = Path.GetFileNameWithoutExtension(pdfPath);
                string htmlPath = Path.Combine(outputDirectory, $"{fileName}.html");

                // Convert and save as HTML with consistent formatting
                pdf.SaveAsHtml(htmlPath, true, fileName, htmlFormatOptions: formatOptions);

                Console.WriteLine($"Converted: {fileName}.pdf → {fileName}.html");
            }
            catch (Exception ex)
            {
                Console.WriteLine($"Error converting {pdfPath}: {ex.Message}");
            }
        }
    }
}
$vbLabelText   $csharpLabel

이 일괄 변환 예시는 콘텐츠 관리 시스템, 디지털 아카이브 또는 대량의 PDF 콘텐츠를 웹에서 접근 가능하게 만들어야 하는 애플리케이션에 적합합니다. PDF 파일을 프로그래밍 방식으로 다루는 방법에 대한 자세한 내용은 튜토리얼 섹션을 참조하세요.

자주 묻는 질문

C#에서 PDF 파일을 HTML로 변환하는 방법은 무엇인가요?

IronPDF를 사용하면 C#에서 단 한 줄의 코드로 PDF를 HTML로 변환할 수 있습니다. IronPdf.PdfDocument.FromFile("example.pdf").SaveAsHtml("output.html"). 이 메서드는 PDF 문서의 시각적 구조와 레이아웃을 유지하면서 복잡한 변환 과정을 내부적으로 처리합니다.

PDF를 HTML로 변환할 때의 주요 이점은 무엇인가요?

IronPDF의 PDF-HTML 변환은 웹 접근성 향상, 다양한 기기에 최적화된 반응형 디자인, SEO 개선, 원활한 웹 통합, 웹 도구를 통한 간편한 콘텐츠 편집, 크로스 플랫폼 호환성, 동적 요소 지원 등 여러 가지 이점을 제공합니다.

PDF를 HTML로 변환하는 데 사용할 수 있는 방법에는 어떤 것들이 있습니까?

IronPDF는 PDF를 HTML로 변환하는 두 가지 주요 메서드를 제공합니다. 하나는 HTML 요소를 분석하여 HTML을 문자열로 반환하는 ToHtmlString 메서드이고, 다른 하나는 PDF 문서를 HTML 파일로 직접 저장하는 SaveAsHtml 메서드입니다. 두 메서드 모두 PDF 문서의 시각적 레이아웃을 유지합니다.

PDF를 HTML로 변환한 후에도 대화형 양식 필드가 제대로 작동할까요?

아니요, IronPDF의 PDF-HTML 변환 기능을 사용하면 원본 PDF의 모든 대화형 양식 필드는 생성된 HTML 문서에서 더 이상 작동하지 않습니다. 양식 필드는 정적 콘텐츠로 표시됩니다. 양식 기능을 유지하려면 변환 전에 IronPDF의 양식 편집 기능을 사용하여 양식 데이터를 추출해야 합니다.

PDF에서 HTML로 변환할 때 출력 형식을 사용자 지정할 수 있나요?

네, IronPDF는 HtmlFormatOptions 클래스를 사용하여 출력 HTML을 구성할 수 있도록 지원합니다. 이를 통해 HTML 변환 과정의 다양한 측면을 제어하여 특정 요구 사항을 충족하는 출력을 만들 수 있습니다.

커티스 차우
기술 문서 작성자

커티스 차우는 칼턴 대학교에서 컴퓨터 과학 학사 학위를 취득했으며, Node.js, TypeScript, JavaScript, React를 전문으로 하는 프론트엔드 개발자입니다. 직관적이고 미적으로 뛰어난 사용자 인터페이스를 만드는 데 열정을 가진 그는 최신 프레임워크를 활용하고, 잘 구성되고 시각적으로 매력적인 매뉴얼을 제작하는 것을 즐깁니다.

커티스는 개발 분야 외에도 사물 인터넷(IoT)에 깊은 관심을 가지고 있으며, 하드웨어와 소프트웨어를 통합하는 혁신적인 방법을 연구합니다. 여가 시간에는 게임을 즐기거나 디스코드 봇을 만들면서 기술에 대한 애정과 창의성을 결합합니다.

검토자:
제프 프리츠
제프리 T. 프리츠
.NET 커뮤니티 팀의 수석 프로그램 관리자
제프는 .NET 및 Visual Studio 팀의 수석 프로그램 관리자이기도 합니다. 그는 .NET Conf 가상 컨퍼런스 시리즈의 총괄 프로듀서이며, 개발자를 위한 라이브 스트림 'Fritz and Friends'를 주 2회 진행하며 시청자들과 함께 기술에 대해 이야기하고 코드를 작성합니다. 제프는 Microsoft Build, Microsoft Ignite, .NET Conf, Microsoft MVP Summit 등 주요 Microsoft 개발자 행사를 위한 워크숍, 프레젠테이션 및 콘텐츠 기획을 담당합니다.
시작할 준비 되셨나요?
Nuget 다운로드 17,527,568 | 버전: 2026.2 방금 출시되었습니다