POMOC DOTYCZąCA JęZYKA PYTHON

XGBoost Python (Jak działa: Przewodnik dla programistów)

Name: IronPDF
Brand: Iron Software
Availability: InStock
Rating: 4.87 (307 reviews)

Zaktualizowano:26 października, 2025

XGBoost to skrót od eXtreme Gradient Boosting, potężnego i dokładnego algorytmu uczenia maszynowego. Zostało ono zastosowane przede wszystkim w analizie regresji, klasyfikacji i problemach związanych z rankingiem. Obejmuje to takie funkcje, jak regulacja, która pomaga uniknąć nadmiernego dopasowania, równoległość oraz przetwarzanie brakujących danych.

IronPDF to biblioteka w języku Python służąca do tworzenia, modyfikowania i odczytywania plików PDF. Ułatwia konwersję HTML, obrazów lub tekstu do formatu PDF, a także umożliwia dodawanie nagłówków, stopek i znaków wodnych. Chociaż skupiamy się przede wszystkim na wykorzystaniu w Pythonie, warto zauważyć, że narzędzie .NET można zaimplementować w tym języku programowania przy pomocy narzędzi interoperacyjnych, takich jak Python.NET.

Połączenie XGBoost i IronPDF zapewnia szersze możliwości zastosowania. Dzięki IronPDF wyniki prognozowania można połączyć z tworzeniem interaktywnych dokumentów PDF. To połączenie jest szczególnie pomocne w tworzeniu precyzyjnych dokumentów korporacyjnych i wykresów oraz wyników uzyskanych z zastosowanych modeli predykcyjnych.

Czym jest XGBoost Python?

XGBoost to potężna biblioteka uczenia maszynowego dla języka Python oparta na uczeniu zespołowym, która jest wysoce wydajna i elastyczna. XGBoost to implementacja algorytmu gradientowego wzmacniania autorstwa Tianqi Chen, zawierająca dodatkowe optymalizacje. Skuteczność została potwierdzona w wielu dziedzinach zastosowań, w których można rozwiązać odpowiednie zadania za pomocą tej metody, takie jak klasyfikacja, regresja, rankingi itp. XGBoost ma kilka unikalnych cech: brak wartości brakujących nie stanowi dla niego problemu; istnieje możliwość wykorzystania norm L1 i L2 w celu przeciwdziałania nadmiernemu dopasowaniu;

Szkolenie odbywa się równolegle, co znacznie przyspiesza proces szkolenia. W XGBoost przycinanie drzewa odbywa się również metodą głębokościową, co pomaga zarządzać pojemnością modelu. Jedną z jego funkcji jest walidacja krzyżowa hiperparametrów i wbudowanych funkcji służących do oceny wydajności modelu. Biblioteka dobrze współdziała z innymi narzędziami do analizy danych zbudowanymi w środowisku Python, takimi jak NumPy, SciPy i scikit-learn, co umożliwia włączenie jej do sprawdzonego środowiska. Jednak dzięki swojej szybkości, prostocie i wysokiej wydajności XGBoost stał się niezbędnym narzędziem w "arsenale" wielu analityków danych, specjalistów ds. uczenia maszynowego oraz początkujących naukowców zajmujących się sieciami neuronowymi.

Funkcje XGBoost w języku Python

XGBoost słynie z wielu funkcji, które sprawiają, że jest on korzystny w różnych zadaniach uczenia maszynowego i algorytmach uczenia maszynowego, a także sprawiają, że jest łatwiejszy do wdrożenia. Oto kluczowe funkcje XGBoost w języku Python:

Regularizacja:

Stosuje techniki regularyzacji L1 i L2 w celu ograniczenia nadmiernego dopasowania i zwiększenia wydajności modelu.

Przetwarzanie równoległe

Model wstępnie wyszkolony wykorzystuje wszystkie rdzenie procesora podczas szkolenia, co znacznie poprawia jakość szkolenia modeli.

Postępowanie w przypadku brakujących danych

Algorytm, który po wyszkoleniu modelu automatycznie decyduje o najlepszym sposobie postępowania z brakującymi wartościami.

Przycinanie drzewa

W przypadku przycinania drzew algorytm przeszukiwania w głąb drzewa jest realizowany za pomocą parametru "max_depth", co ogranicza nadmierne dopasowanie.

Wbudowana walidacja krzyżowa

Zawiera wbudowane metody walidacji krzyżowej do oceny modeli i optymalizacji hiperparametrów, a ponieważ natywnie obsługuje i wykonuje walidację krzyżową, implementacja jest mniej skomplikowana.

Skalowalność

Jest zoptymalizowany pod kątem skalowalności; dzięki czemu może analizować duże zbiory danych i odpowiednio przetwarzać dane przestrzeni cech.

Obsługa wielu języków

XGBoost został pierwotnie opracowany w języku Python; Jednakże, aby poszerzyć zakres działania, obsługuje również języki R, Julia i Java.

Obliczenia rozproszone

Pakiet jest przeznaczony do dystrybucji, co oznacza, że może być uruchamiany na wielu komputerach w celu przetwarzania dużych ilości danych.

Niestandardowe funkcje celów i oceny

Umożliwia to użytkownikom konfigurację funkcji celowych i pomiarów wydajności zgodnie z ich konkretnymi wymaganiami. Ponadto obsługuje zarówno klasyfikację binarną, jak i wieloklasową.

Znaczenie funkcji

Pomaga to zidentyfikować wartość różnych funkcji, może pomóc w wyborze funkcji dla danego zestawu danych oraz zapewnia interpretacje wielu modeli.

Sparse Aware

Działa dobrze z formatami danych o małej gęstości, co jest bardzo przydatne podczas pracy z danymi zawierającymi wiele wartości NULL lub zer.

Integracja z innymi bibliotekami

Stanowi uzupełnienie popularnych bibliotek do analizy danych, takich jak NumPy, SciPy i scikit-learn, które można łatwo zintegrować z procesami analizy danych.

Tworzenie i konfiguracja XGBoost w języku Python

W języku Python tworzenie i konfiguracja modelu XGBoost obejmuje wiele procesów: gromadzenie i wstępne przetwarzanie danych, tworzenie modelu, zarządzanie modelem oraz jego ocenę. Poniżej znajduje się szczegółowy przewodnik, który pomoże Ci rozpocząć pracę:

Zainstaluj XGBoost

Najpierw sprawdź, czy pakiet XGBoost znajduje się w Twoim systemie. Możesz zainstalować go na swoim komputerze za pomocą pip:

pip install xgboost

pip install xgboost

SHELL

Importuj biblioteki

import xgboost as xgb
import numpy as np
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error

import xgboost as xgb
import numpy as np
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error

PYTHON

Przygotuj dane

W tym przykładzie wykorzystamy zbiór danych dotyczących rynku mieszkaniowego w Bostonie:

# Load the Boston housing dataset
boston = load_boston()
# Load data and target values
X = boston.data
y = boston.target
# Split the dataset into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Load the Boston housing dataset
boston = load_boston()
# Load data and target values
X = boston.data
y = boston.target
# Split the dataset into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

PYTHON

Utwórz DMatrix

XGBoost wykorzystuje do uczenia się samodzielnie zdefiniowaną strukturę danych o nazwie DMatrix.

# Create DMatrix for training and testing sets
dtrain = xgb.DMatrix(X_train, label=y_train)
dtest = xgb.DMatrix(X_test, label=y_test)

# Create DMatrix for training and testing sets
dtrain = xgb.DMatrix(X_train, label=y_train)
dtest = xgb.DMatrix(X_test, label=y_test)

PYTHON

Ustaw parametry

Skonfiguruj parametry modelu. Przykładowa konfiguracja wygląda następująco:

# Set parameters
params = {
    'objective': 'reg:squarederror',  # Objective function for regression
    'max_depth': 4,  # Maximum depth of a tree
    'eta': 0.1,  # Learning rate
    'subsample': 0.8,  # Subsample ratio of the training instances
    'colsample_bytree': 0.8,  # Subsample ratio of columns when constructing each tree
    'seed': 42  # Random seed for reproducibility
}

# Set parameters
params = {
    'objective': 'reg:squarederror',  # Objective function for regression
    'max_depth': 4,  # Maximum depth of a tree
    'eta': 0.1,  # Learning rate
    'subsample': 0.8,  # Subsample ratio of the training instances
    'colsample_bytree': 0.8,  # Subsample ratio of columns when constructing each tree
    'seed': 42  # Random seed for reproducibility
}

PYTHON

Wyszkol model

Użyj metody train, aby wytrenować model XGBoost.

# Number of boosting rounds
num_round = 100
# Train the model
bst = xgb.train(params, dtrain, num_round)

# Number of boosting rounds
num_round = 100
# Train the model
bst = xgb.train(params, dtrain, num_round)

PYTHON

Twórz prognozy

Teraz użyj tego wyszkolonego modelu i dokonaj prognoz na zbiorze testowym.

# Make predictions
preds = bst.predict(dtest)

# Make predictions
preds = bst.predict(dtest)

PYTHON

Oceń model

Sprawdź wydajność modelu uczenia maszynowego za pomocą odpowiedniego wskaźnika — na przykład średniego błędu kwadratowego:

# Calculate mean squared error
mse = mean_squared_error(y_test, preds)
print(f"Mean Squared Error: {mse}")

# Calculate mean squared error
mse = mean_squared_error(y_test, preds)
print(f"Mean Squared Error: {mse}")

PYTHON

Zapisywanie i wczytywanie modelu

Wyszkolony model można zapisać w pliku i w razie potrzeby załadować go później:

# Save the model
bst.save_model('xgboost_model.json')
# Load the model 
bst_loaded = xgb.Booster()
bst_loaded.load_model('xgboost_model.json')

# Save the model
bst.save_model('xgboost_model.json')
# Load the model 
bst_loaded = xgb.Booster()
bst_loaded.load_model('xgboost_model.json')

PYTHON

Pierwsze kroki

Poniżej znajduje się podstawowa instalacja obu bibliotek wraz z przykładem, jak rozpocząć korzystanie z XGBoost do analizy danych oraz IronPDF do generowania raportów PDF.

Czym jest IronPDF?

Skorzystaj z potężnego pakietu IronPDF for Python, aby generować, edytować i odczytywać pliki PDF. Umożliwia to programistom wykonywanie wielu operacji programistycznych na plikach PDF, takich jak praca z istniejącymi plikami PDF oraz konwersja HTML na pliki PDF. IronPDF to wydajne rozwiązanie dla aplikacji wymagających dynamicznego generowania i przetwarzania plików PDF, ponieważ zapewnia elastyczny i przyjazny sposób tworzenia wysokiej jakości dokumentów PDF.

Konwersja HTML do PDF

IronPDF może tworzyć dokumenty PDF z dowolnej treści HTML, zarówno nowej, jak i istniejącej. Umożliwia tworzenie pięknych, artystycznych publikacji w formacie PDF na podstawie treści internetowych, które w pełni wykorzystują możliwości nowoczesnych technologii HTML5, CSS3 i JavaScript we wszystkich ich formach.

Tworzenie/edycja plików PDF

Może dodawać tekst, zdjęcia, tabele i inne treści do nowych dokumentów PDF generowanych programowo. Za pomocą IronPDF można otwierać i edytować istniejące dokumenty PDF w celu ich dalszej modyfikacji. W pliku PDF można edytować/dodawać treści oraz usuwać określone fragmenty dokumentu zgodnie z potrzebami.

Złożony układ i stylizacja

Wykorzystuje CSS do stylizacji treści w plikach PDF. Obsługuje złożone układy, czcionki, kolory i wszystkie te elementy projektu. Ponadto sposoby renderowania materiałów HTML, które mogą być używane z JavaScriptem, umożliwiają dynamiczne tworzenie treści w plikach PDF.

Zainstaluj IronPDF

IronPDF można zainstalować za pomocą pip. Aby to zrobić, użyj następującego polecenia:

pip install ironpdf

Połącz XGBoost Python z IronPDF

Zaimportuj wszystkie odpowiednie biblioteki i załaduj swój zbiór danych. W naszym przypadku wykorzystamy zbiór danych dotyczących rynku mieszkaniowego w Bostonie:

import xgboost as xgb
import numpy as np
from ironpdf import *     
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error

# Load data
boston = load_boston()
X = boston.data
y = boston.target

# Split data
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Create DMatrix
dtrain = xgb.DMatrix(X_train, label=y_train)
dtest = xgb.DMatrix(X_test, label=y_test)

# Set parameters
params = {
    'objective': 'reg:squarederror',
    'max_depth': 4,
    'eta': 0.1,
    'subsample': 0.8,
    'colsample_bytree': 0.8,
    'seed': 42
}

# Train model
num_round = 100
bst = xgb.train(params, dtrain, num_round)

# Make predictions
preds = bst.predict(dtest)
mse = mean_squared_error(y_test, preds)

# Create a PDF document using IronPDF
iron_pdf = ChromePdfRenderer()

# Create HTML content
html_content = f"""
<html>
<head>
    <title>XGBoost Model Report</title>
</head>
<body>
    <h1>XGBoost Model Report</h1>
    <p>Mean Squared Error: {mse}</p>
    <h2>Predictions</h2>
    <ul>
        {''.join([f'<li>{pred}</li>' for pred in preds])}
    </ul>
</body>
</html>
"""

pdf = iron_pdf.RenderHtmlAsPdf(html_content)

# Save the PDF document
pdf.SaveAs("XGBoost_Report.pdf")
print("PDF document generated successfully.")

import xgboost as xgb
import numpy as np
from ironpdf import *     
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error

# Load data
boston = load_boston()
X = boston.data
y = boston.target

# Split data
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Create DMatrix
dtrain = xgb.DMatrix(X_train, label=y_train)
dtest = xgb.DMatrix(X_test, label=y_test)

# Set parameters
params = {
    'objective': 'reg:squarederror',
    'max_depth': 4,
    'eta': 0.1,
    'subsample': 0.8,
    'colsample_bytree': 0.8,
    'seed': 42
}

# Train model
num_round = 100
bst = xgb.train(params, dtrain, num_round)

# Make predictions
preds = bst.predict(dtest)
mse = mean_squared_error(y_test, preds)

# Create a PDF document using IronPDF
iron_pdf = ChromePdfRenderer()

# Create HTML content
html_content = f"""
<html>
<head>
    <title>XGBoost Model Report</title>
</head>
<body>
    <h1>XGBoost Model Report</h1>
    <p>Mean Squared Error: {mse}</p>
    <h2>Predictions</h2>
    <ul>
        {''.join([f'<li>{pred}</li>' for pred in preds])}
    </ul>
</body>
</html>
"""

pdf = iron_pdf.RenderHtmlAsPdf(html_content)

# Save the PDF document
pdf.SaveAs("XGBoost_Report.pdf")
print("PDF document generated successfully.")

PYTHON

Teraz utworzysz obiekty klasy DMatrix w celu efektywnego przetwarzania danych, a następnie skonfigurujesz parametry modelu dotyczące funkcji celu i hiperparametrów. Po wytrenowaniu modelu XGBoost należy przeprowadzić prognozowanie na zbiorze testowym; Do oceny wyników można użyć wskaźnika błędu średniokwadratowego (Mean Squared Error) lub podobnych metryk. Następnie użyj IronPDF, aby utworzyć plik PDF zawierający wszystkie wyniki.

Tworzysz reprezentację HTML zawierającą wszystkie wyniki; Następnie użyjesz klasy ChromePdfRenderer biblioteki IronPDF, aby przekształcić tę zawartość HTML w dokument PDF. Na koniec możesz zapisać wygenerowany raport w formacie PDF w wybranej lokalizacji. Ta integracja umożliwi automatyczne tworzenie bardzo rozbudowanych, profesjonalnych raportów, w których zawarte są wnioski uzyskane z modeli uczenia maszynowego.

Wnioski

Podsumowując, XGBoost i IronPDF są zintegrowane w celu zaawansowanej analizy danych i profesjonalnego generowania raportów. Wydajność i skalowalność XGBoost zapewniają najlepsze rozwiązanie w zakresie przetwarzania strumieniowego w złożonych zadaniach uczenia maszynowego dzięki solidnym możliwościom prognostycznym i doskonałym narzędziom do optymalizacji modeli. Można je płynnie połączyć w Pythonie z IronPDF, przekształcając bogate spostrzeżenia uzyskane dzięki XGBoost w bardzo szczegółowe raporty PDF.

Dzięki tym integracjom możliwe będzie tworzenie atrakcyjnych i bogatych w informacje dokumentów dotyczących wyników, które będą mogły być przekazywane interesariuszom lub wykorzystywane do dalszej analizy. Analiza biznesowa, badania naukowe lub dowolny projekt oparty na danych odniosłyby ogromne korzyści dzięki wbudowanej synergii między XGBoost a IronPDF, umożliwiającej wydajne przetwarzanie danych i łatwe przekazywanie wyników.

Zintegruj IronPDF i inne produkty Iron Software, aby zapewnić swoim klientom i użytkownikom końcowym bogate w funkcje, wysokiej jakości rozwiązania programowe. Pomoże to również zoptymalizować Państwa projekty i procesy.

Kompleksowa dokumentacja, aktywna społeczność i częste aktualizacje — wszystko to idzie w parze z funkcjonalnością IronPDF. Iron Software to nazwa godnego zaufania partnera w nowoczesnych projektach programistycznych. Wszyscy programiści mogą skorzystać z bezpłatnej wersji próbnej IronPDF. Mogą wypróbować wszystkie jego funkcje. Dostępne są stawki licencyjne $799, które pozwalają w pełni wykorzystać możliwości tego produktu.

Curtis Chau

Czat z zespołem inżynierów teraz

Autor tekstów technicznych

Curtis Chau posiada tytuł licencjata z informatyki (Uniwersytet Carleton) i specjalizuje się w front-endowym rozwoju, z ekspertką w Node.js, TypeScript, JavaScript i React. Pasjonuje się tworzeniem intuicyjnych i estetycznie przyjemnych interfejsów użytkownika, Curtis cieszy się pracą z nowoczesnymi frameworkami i tworzeniem dobrze zorganizowanych, atrakcyjnych wizualnie podrę...

Czytaj więcej

hashlib Python (Jak działa: Przewodnik dla programistów)

Py2neo (jak to działa dla programi...

Zwyciestwo klienta:

Podkreslaj programiste:

SEMINARIA INTERNETOWE:

Rozpocznij darmowy 30-dniowy okres próbny

XGBoost Python (Jak działa: Przewodnik dla programistów)

Czym jest XGBoost Python?

Funkcje XGBoost w języku Python

Regularizacja:

Przetwarzanie równoległe

Postępowanie w przypadku brakujących danych

Przycinanie drzewa

Wbudowana walidacja krzyżowa

Skalowalność

Obsługa wielu języków

Obliczenia rozproszone

Niestandardowe funkcje celów i oceny

Znaczenie funkcji

Sparse Aware

Integracja z innymi bibliotekami

Tworzenie i konfiguracja XGBoost w języku Python

Zainstaluj XGBoost

Importuj biblioteki

Przygotuj dane

Utwórz DMatrix

Ustaw parametry

Wyszkol model

Twórz prognozy

Oceń model

Zapisywanie i wczytywanie modelu

Pierwsze kroki

Czym jest IronPDF?

Konwersja HTML do PDF

Tworzenie/edycja plików PDF

Złożony układ i stylizacja

Zainstaluj IronPDF

Połącz XGBoost Python z IronPDF

Wnioski

Zespol wsparcia Iron

Rozpocznij darmowy 30-dniowy okres próbny

XGBoost Python (Jak działa: Przewodnik dla programistów)

Czym jest XGBoost Python?

Funkcje XGBoost w języku Python

Regularizacja:

Przetwarzanie równoległe

Postępowanie w przypadku brakujących danych

Przycinanie drzewa

Wbudowana walidacja krzyżowa

Skalowalność

Obsługa wielu języków

Obliczenia rozproszone

Niestandardowe funkcje celów i oceny

Znaczenie funkcji

Sparse Aware

Integracja z innymi bibliotekami

Tworzenie i konfiguracja XGBoost w języku Python

Zainstaluj XGBoost

Importuj biblioteki

Przygotuj dane

Utwórz DMatrix

Ustaw parametry

Wyszkol model

Twórz prognozy

Oceń model

Zapisywanie i wczytywanie modelu

Pierwsze kroki

Czym jest IronPDF?

Konwersja HTML do PDF

Tworzenie/edycja plików PDF

Złożony układ i stylizacja

Zainstaluj IronPDF

Połącz XGBoost Python z IronPDF

Wnioski

Powiązane artykuły

deepstream io (Jak to działa dla programistów)

imageio python (Jak to działa dla programistów)

igraph python (Jak to działa dla programistów)

Następny krok: Rozpocznij darmową 30-dniową wersję próbną

Następny krok: Rozpocznij darmową 30-dniową wersję próbną

Want to deploy IronSuite to a live project for FREE?

What’s included?

Zaufane przez miliony inżynierów na całym świecie

Zespol wsparcia Iron