Verwendung von UTF-8-Kodierung und internationalen Sprachen in PDFs

This article was translated from English: Does it need improvement?
Translated
View the article in English

IronPDF unterstützt die UTF-8-Kodierung in PDFs, da sie dem Chrome-Standard entspricht. Jedes Zeichen, das in einem Chrome-Browser korrekt dargestellt werden kann, wird von IronPDF unterstützt. Sie können sich darauf verlassen, dass die Schriftzeichen der Fremdsprachen korrekt wiedergegeben werden. In diesem How-To zeigen wir Ihnen, wie Sie UTF-8 in einer PDF-Datei wiedergeben können.

Erste Schritte mit IronPDF

Beginnen Sie noch heute mit der Verwendung von IronPDF in Ihrem Projekt mit einer kostenlosen Testversion.

Erster Schritt:
green arrow pointer




Einfaches Code-Beispiel

Bei der Arbeit mit IronPDF verwenden wir häufig erweiterte Zeichensätze wie die UTF-8-Kodierung.

Hier haben wir ein Beispiel für eine Zeichenkette, die an die Methode "RenderHtmlAsPdf" übergeben wird, die eine HTML-Zeichenkette als Eingabe erwartet:

周態告応立待太記行神正用真最。音日独素円政進任見引際初携食。更火識将回興継時億断保媛全職。
文造画念響竹都務済約記求生街東。天体無適立年保輪動元念足総地作靖権瀬内。
失文意芸野画美暮実刊切心。感変動技実視高療試意写表重車棟性作家薄井。
陸瓶右覧撃稿法真勤振局夘決。任堀記文市物第前兜純響限。囲石整成先尾未展退幹販山令手北結。

أم يذكر النفط قبضتهم على, الصين وفنلندا ما حدى. تم لكل أملاً المنتصر,
٣٠ حدى مارد القوى. شرسة للسيطرة قامفي. حتى أم يطول المحيط,
زهاء وحلفاؤها من فعل. لم قامت الجو الساحلية وتم, ويعزى واقتصار قبل كل.

ภคันทลาพาธสตาร์เซฟตี้ แชมป์ มาร์เก็ตติ้งล้มเหลวโยเกิร์ต แลนด์บาบูนอึมครึม รุสโซ แบรนด์ไคลแม็กซ์ พิซซ่าโมเดลเสือโคร่ง ม็อบโซนรายชื่อ
แอดมิชชั่น ด็อกเตอร์ พะเรอ มาร์คเจไดโมจิราสเบอร์รี เอนทรานซ์ออดิชั่นศิลปวัฒนธรรมเปราะบาง โมจิซีเรียสวอลนัตทริปลีเมอร์ ทิป วาไรตี้บิ๊กเมเปิล

Aus dem obigen Text werden wir die Zeichenketten in `

tags, weil es sich um eine HTML-Zeichenkette handelt. Übergeben Sie die Zeichenfolge an den Chrome PDF Renderer von IronPDF:

:path=/static-assets/pdf/content-code-examples/how-to/utf-8.cs
using IronPdf;

const string html_with_utf_8 =
    @"<p>周態告応立待太記行神正用真最。音日独素円政進任見引際初携食。更火識将回興継時億断保媛全職。
    文造画念響竹都務済約記求生街東。天体無適立年保輪動元念足総地作靖権瀬内。
    失文意芸野画美暮実刊切心。感変動技実視高療試意写表重車棟性作家薄井。
    陸瓶右覧撃稿法真勤振局夘決。任堀記文市物第前兜純響限。囲石整成先尾未展退幹販山令手北結。</p>
    <p>
    أم يذكر النفط قبضتهم على, الصين وفنلندا ما حدى. تم لكل أملاً المنتصر,
    ٣٠ حدى مارد القوى. شرسة للسيطرة قامفي. حتى أم يطول المحيط,
    زهاء وحلفاؤها من فعل. لم قامت الجو الساحلية وتم, ويعزى واقتصار قبل كل.
    </p>
    <p>
    ภคันทลาพาธสตาร์เซฟตี้ แชมป์ มาร์เก็ตติ้งล้มเหลวโยเกิร์ต แลนด์บาบูนอึมครึม รุสโซ แบรนด์ไคลแม็กซ์ พิซซ่าโมเดลเสือโคร่ง ม็อบโซนรายชื่อ
    แอดมิชชั่น ด็อกเตอร์ พะเรอ มาร์คเจไดโมจิราสเบอร์รี เอนทรานซ์ออดิชั่นศิลปวัฒนธรรมเปราะบาง โมจิซีเรียสวอลนัตทริปลีเมอร์ ทิป วาไรตี้บิ๊กเมเปิล
    </p>";

var renderer = new ChromePdfRenderer();
renderer.RenderingOptions.InputEncoding = System.Text.Encoding.UTF8;

var pdf = renderer.RenderHtmlAsPdf(html_with_utf_8);
pdf.SaveAs("Unicode.pdf");
Imports IronPdf

Private Const html_with_utf_8 As String = "<p>周態告応立待太記行神正用真最。音日独素円政進任見引際初携食。更火識将回興継時億断保媛全職。
    文造画念響竹都務済約記求生街東。天体無適立年保輪動元念足総地作靖権瀬内。
    失文意芸野画美暮実刊切心。感変動技実視高療試意写表重車棟性作家薄井。
    陸瓶右覧撃稿法真勤振局夘決。任堀記文市物第前兜純響限。囲石整成先尾未展退幹販山令手北結。</p>
    <p>
    أم يذكر النفط قبضتهم على, الصين وفنلندا ما حدى. تم لكل أملاً المنتصر,
    ٣٠ حدى مارد القوى. شرسة للسيطرة قامفي. حتى أم يطول المحيط,
    زهاء وحلفاؤها من فعل. لم قامت الجو الساحلية وتم, ويعزى واقتصار قبل كل.
    </p>
    <p>
    ภคันทลาพาธสตาร์เซฟตี้ แชมป์ มาร์เก็ตติ้งล้มเหลวโยเกิร์ต แลนด์บาบูนอึมครึม รุสโซ แบรนด์ไคลแม็กซ์ พิซซ่าโมเดลเสือโคร่ง ม็อบโซนรายชื่อ
    แอดมิชชั่น ด็อกเตอร์ พะเรอ มาร์คเจไดโมจิราสเบอร์รี เอนทรานซ์ออดิชั่นศิลปวัฒนธรรมเปราะบาง โมจิซีเรียสวอลนัตทริปลีเมอร์ ทิป วาไรตี้บิ๊กเมเปิล
    </p>"

Private renderer = New ChromePdfRenderer()
renderer.RenderingOptions.InputEncoding = System.Text.Encoding.UTF8

Dim pdf = renderer.RenderHtmlAsPdf(html_with_utf_8)
pdf.SaveAs("Unicode.pdf")
VB   C#

Dies ist die Datei, die der Code erzeugt hat:

Um eine perfekte Kodierung Ihrer HTML-Datei als PDF zu gewährleisten, können Sie an zwei Stellen den gewünschten Zeichensatz angeben.

  • In ChromePdfRenderer.RenderingOptions unter Verwendung von System.Text.Encoding.UTF8
  • In Ihrer HTML-Kopfzeile:
<html>
        <head>
            <meta charset='utf-8'>
        </head>
        <body>
            こんにちは世界
        </body>
</html>
<html>
        <head>
            <meta charset='utf-8'>
        </head>
        <body>
            こんにちは世界
        </body>
</html>
HTML

Mehr über internationale Sprachen

IronPDF unterstützt HTML-To-PDF in Sprachen ohne lateinische Schrift, einschließlich Chinesisch, Japanisch, Arabisch, Hebräisch, Russisch, Thailändisch und alle internationalen Sprachen, die von Unicode unterstützt werden, einschließlich gemischtsprachiger Dokumente.

Bei der Arbeit mit internationalen Sprachen gibt es zwei Dinge zu beachten:

Schriftarten

Eine Schriftart, die Ihren Zeichensatz unterstützt, muss auf Ihrem Server installiert sein. Diese werden normalerweise automatisch auf modernen Webservern installiert, aber ältere Server können mit älteren Versionen einiger Schriftarten wie Arial installiert worden sein, die möglicherweise keine vollständige UTF-8-Unterstützung bieten.

Eine alternative Lösung ist die Angabe einer Webschriftart in Ihrem CSS, wie sie beispielsweise von Google Fonts angeboten wird. Weitere Informationen finden Sie in dem ArtikelWie Sie Google Fonts in Ihrem nächsten Webdesign-Projekt verwenden können.

Eingabe Kodierung

Möglicherweise müssen Sie die Eingabekodierung Ihres Dokuments angeben, damit es korrekt dargestellt wird. Sie können dies auf folgende Weise tun:

Hinzufügen eines HTML "Meta Charset" Tags z.B.

<meta http-equiv="Content-Type" content="text/html;charset=UTF-8"/>
<meta http-equiv="Content-Type" content="text/html;charset=UTF-8"/>
HTML