Przejdź do treści stopki
NARZęDZIA PDF DLA JęZYKA PYTHON

Jak przekonwertować HTML na PDF w języku Python

Jeśli kiedykolwiek znalazłeś się w sytuacji, w której musiałeś przekonwertować plik HTML do formatu PDF, mamy dla Ciebie idealne rozwiązanie.

Dzisiaj przedstawimy Państwu szybką i wydajną metodę wykorzystującą PyHtml2Pdf, która pozwoli zaoszczędzić czas i wysiłek. Po przeczytaniu tego artykułu będziesz w stanie bez wysiłku generować pliki PDF z HTML za pomocą języka Python.

Dlaczego warto wybrać Python

Python to potężny, łatwy do nauczenia się język programowania, który posiada rozbudowaną bibliotekę pakietów i modułów, pomagających w realizacji celów. Konwersja HTML do PDF za pomocą Pythona nie jest wyjątkiem, ponieważ dostępnych jest wiele bibliotek, które sprawiają, że proces ten jest szybki i wydajny. Dzięki Pythonowi można zautomatyzować proces konwersji, co sprawia, że jest on idealny do projektów na dużą skalę lub przetwarzania wsadowego.

Przedstawiamy PyHtml2Pdf

Kilka bibliotek języka Python ułatwia konwersję HTML do formatu PDF, w tym ReportLab, xHtml2Pdf i pyhtml2pdf. Każda biblioteka oferuje unikalne funkcje i możliwości, pozwalając programistom wybrać opcję najlepiej odpowiadającą ich konkretnym potrzebom.

PyHTML2PDF to biblioteka open source w języku Python, która w ciągu kilku sekund konwertuje lokalny plik HTML na profesjonalnie sformatowany dokument PDF. PyHTML2PDF jest przeznaczony do szybkiej konwersji HTML na PDF, co czyni go idealnym wyborem dla aplikacji działających w czasie rzeczywistym i usług na żądanie. Szybkie i wydajne przetwarzanie dużych ilości treści. Obsługuje szereg funkcji HTML i CSS, zapewniając zachowanie oryginalnego formatowania i wyglądu plików PDF. Jako projekt open source, PyHTML2PDF korzysta z ciągłego rozwoju i wsparcia społeczności Python. Bądź na bieżąco z najnowszymi funkcjami, ulepszeniami i poprawkami błędów.

Konfiguracja środowiska Python

Instalacja języka Python

Przed rozpoczęciem konwersji HTML do PDF upewnij się, że masz zainstalowany Python w swoim systemie. Odwiedź oficjalną stronę Pythona, aby pobrać i zainstalować najnowszą wersję Pythona dla swojego systemu operacyjnego.

Konfiguracja środowiska Python

Po zainstalowaniu języka Python skonfiguruj środowisko wirtualne, aby odizolować zależności projektu. Wykorzystaj moduł venv do tworzenia wirtualnych środowisk i zarządzania nimi, zapewniając czyste, samodzielne środowisko pracy dla swojego projektu konwersji.

Zainstaluj bibliotekę

Zanim zaczniesz konwertować HTML na PDF, musisz skonfigurować swoje środowisko. Najpierw musisz zainstalować PyHtml2Pdf za pomocą pip:

pip install pyhtml2pdf
pip install pyhtml2pdf
SHELL

Po zakończeniu tych instalacji możesz rozpocząć konwersję HTML do PDF przy użyciu PyHtml2Pdf.

Konwersja HTML do PDF przy użyciu PyHtml2Pdf

Konwersja pliku HTML do formatu PDF za pomocą PyHtml2Pdf jest prosta. Oto przewodnik krok po kroku:

Krok 1: Importuj PyHtml2Pdf

Zacznij od zaimportowania biblioteki PyHtml2Pdf do swojego skryptu w języku Python:

from pyhtml2pdf import converter
from pyhtml2pdf import converter
PYTHON

Krok 2: Konwersja HTML do PDF

Aby przekonwertować plik HTML na PDF, użyj funkcji convert. Jako argumenty należy podać ścieżkę do pliku wejściowego HTML oraz ścieżkę do pliku wyjściowego PDF:

import os
from pyhtml2pdf import converter

# Get the absolute path to the HTML file
path = os.path.abspath('test.html')

# Convert the HTML file to a PDF
converter.convert(f'file:///{path}', 'htmlToPdf.pdf')
import os
from pyhtml2pdf import converter

# Get the absolute path to the HTML file
path = os.path.abspath('test.html')

# Convert the HTML file to a PDF
converter.convert(f'file:///{path}', 'htmlToPdf.pdf')
PYTHON

Aby przekonwertować adres URL strony internetowej na plik PDF, można użyć następującego kodu w języku Python:

from pyhtml2pdf import converter

# Convert the URL to a PDF
converter.convert('https://ironpdf.com/', 'urlToPdf.pdf')
from pyhtml2pdf import converter

# Convert the URL to a PDF
converter.convert('https://ironpdf.com/', 'urlToPdf.pdf')
PYTHON

Krok 3: Uruchom skrypt

Otwórz terminal lub wiersz poleceń na komputerze i przejdź do katalogu, w którym zapisałeś skrypt w języku Python.

Uruchom skrypt, wpisując polecenie python3 htmltopdf.py w terminalu lub wierszu poleceń. Zastąp htmltopdf.py rzeczywistą nazwą pliku skryptu w języku Python.

Poczekaj, aż skrypt zakończy swoje działanie. Po zakończeniu działania skryptu przejdź do wskazanej ścieżki wyjściowej. Powinieneś znaleźć nowo wygenerowany plik PDF o podanej przez Ciebie nazwie.

Jak przekonwertować HTML na PDF w Pythonie: Rysunek 1

IronPDF: Potężna alternatywa dla programistów .NET

Chociaż PyHtml2Pdf jest doskonałym wyborem dla użytkowników Pythona, programiści .NET mogą szukać odpowiedniej alternatywy dla swojej platformy. W tym przypadku IronPDF to potężna i bogata w funkcje biblioteka zaprojektowana do współpracy z aplikacjami w językach Python, Java i .NET. IronPDF umożliwia programistom łatwe generowanie, edytowanie i wyodrębnianie treści z plików PDF.

Najważniejsze cechy IronPDF

IronPDF oferuje mnóstwo funkcji, które sprawiają, że jest to najlepszy wybór dla programistów Pythona:

  • Konwersja HTML do PDF: IronPDF umożliwia konwersję treści HTML, w tym CSS, do plików PDF. Można go używać do konwersji plików HTML, adresów URL, a nawet ciągów znaków HTML bezpośrednio do formatu PDF.
  • Obsługa plików PDF: Dzięki IronPDF możesz nie tylko generować pliki PDF, ale także edytować już istniejące. Można łączyć, dzielić i dodawać znaki wodne do dokumentów PDF, co czyni to narzędzie wszechstronnym narzędziem do obróbki plików PDF.
  • Wypełnianie formularzy: IronPDF umożliwia programowe wypełnianie formularzy PDF. Ta funkcja jest szczególnie przydatna, gdy trzeba zautomatyzować wprowadzanie danych do plików PDF.
  • Wyodrębnianie tekstu z plików PDF: Dzięki IronPDF wyodrębnianie tekstu z plików PDF jest dziecinnie proste. Możesz użyć tej funkcji do analizowania danych z dokumentów PDF, co ułatwia analizę i przetwarzanie wyodrębnionych informacji.

Konwersja HTML do PDF za pomocą IronPDF

Zainstaluj IronPDF: Uruchom następujące polecenie w terminalu, aby zainstalować IronPDF:

pip install ironpdf  # Assuming the package manager route for IronPDF
pip install ironpdf  # Assuming the package manager route for IronPDF
SHELL

Użyj tego fragmentu kodu, aby przekonwertować przykładowy plik HTML do formatu PDF.

from IronPdf import *
from IronPdf.Engines.Chrome import *

# Create an instance of the ChromePdfRenderer
renderer = ChromePdfRenderer()

# Render the HTML file as a PDF
htmlToPdf = renderer.RenderHtmlFileAsPdf("test.html")

# Save the PDF file
htmlToPdf.SaveAs("output.pdf")
from IronPdf import *
from IronPdf.Engines.Chrome import *

# Create an instance of the ChromePdfRenderer
renderer = ChromePdfRenderer()

# Render the HTML file as a PDF
htmlToPdf = renderer.RenderHtmlFileAsPdf("test.html")

# Save the PDF file
htmlToPdf.SaveAs("output.pdf")
PYTHON

Ten kod tworzy nową instancję ChromePdfRenderer, renderuje plik "test.html" jako dokument PDF, a następnie zapisuje dokument PDF jako "output.pdf" w katalogu wyjściowym. Pamiętaj, aby zastąpić "test.html" ścieżką do pliku HTML, a "output.pdf" ścieżką do pliku PDF, który chcesz uzyskać.

Wnioski

W tym artykule omówiliśmy, jak konwertować HTML na PDF za pomocą PyHtml2Pdf. Omówiliśmy zalety konwersji HTML do PDF, przedstawiliśmy PyHtml2Pdf jako potężne rozwiązanie oraz pokazaliśmy, jak skonfigurować Srodowisko i konwertować pliki HTML do formatu PDF. Omówiliśmy również dostosowywanie wyników do konkretnych wymagań.

IronPDF oferuje obszerną bezpłatną wersję próbną, która pozwala w pełni zapoznać się z jego funkcjami i możliwościami przed podjęciem decyzji o zakupie. Gdy już przekonasz się o możliwościach IronPDF i uznasz, że to idealne rozwiązanie dla Twojego projektu, ceny licencji zaczynają się od $799.

Curtis Chau
Autor tekstów technicznych

Curtis Chau posiada tytuł licencjata z informatyki (Uniwersytet Carleton) i specjalizuje się w front-endowym rozwoju, z ekspertką w Node.js, TypeScript, JavaScript i React. Pasjonuje się tworzeniem intuicyjnych i estetycznie przyjemnych interfejsów użytkownika, Curtis cieszy się pracą z nowoczesnymi frameworkami i tworzeniem dobrze zorganizowanych, atrakcyjnych wizualnie podrę...

Czytaj więcej

Zespol wsparcia Iron

Jestesmy online 24 godziny, 5 dni w tygodniu.
Czat
Email
Zadzwon do mnie