Test in einer Live-Umgebung
Test in der Produktion ohne Wasserzeichen.
Funktioniert überall, wo Sie es brauchen.
*Fast-Parkett ist eine Python-Bibliothek zur Verarbeitung des Parquet-Dateiformats, das häufig in Big-Data-Workflows verwendet wird. Es lässt sich gut mit anderen Python-basierten Datenverarbeitungstools wie Dask und Pandas integrieren. Schauen wir uns die Funktionen an und sehen wir uns einige Codebeispiele an. Später in diesem Artikel werden wir auch etwas überIronPDFeine Bibliothek zur PDF-Erzeugung vonIron Software.
*Fast-Parkett ist effizient und unterstützt eine breite Palette von Parkettfunktionen. Einige der wichtigsten Merkmale sind:
Einfaches Lesen von und Schreiben in Parkettdateien und anderen Datendateien.
Nahtlose Zusammenarbeit mit Pandas DataFrames und Dask für parallele Verarbeitung.
Unterstützt verschiedene Kompressionsalgorithmen wie gzip, snappy, brotli, lz4 und zstandard in Datendateien.
Optimiert für die Speicherung und den Abruf großer Datensätze oder Datendateien unter Verwendung des kolumnaren Parquet-Dateiformats und einer auf die Datei verweisenden Metadaten-Datei.
Sie können Folgendes installierenschnelles Parkett mit pip:
pip install fastparquet
Oder mit conda:
conda install -c conda-forge fastparquet
Hier ist ein einfaches Beispiel, um Ihnen den Einstieg in fastparquet zu erleichtern.
Sie können einen Pandas DataFrame in eine Parquet-Datei schreiben:
import pandas as pd
import fastparquet
# Create a sample DataFrame
df = {
'name': ['Alice', 'Bob', 'Charlie'],
'age': [25, 30, 35],
'city': ['New York', 'Los Angeles', 'Chicago']
}
# Write the DataFrame to single output file using single file path
df.to_parquet('example.parquet', engine='fastparquet')
# Display message
print("DataFrame successfully written to 'example.parquet'.")
Sie können eine Parquet-Datei in einen Pandas DataFrame einlesen:
import pandas as pd
import fastparquet
# Read a Parquet file
df = pd.read_parquet('example.parquet', engine='fastparquet')
# Display the DataFrame
print(df.head())
import fastparquet as fp
# Reading metadata from Parquet file
meta = fp.ParquetFile('example.parquet').metadata
print("Parquet file metadata:")
print(meta)
fastparquet python integriert sich gut mitDask für die parallele Verarbeitung großer Datenmengen:
import dask.dataframe as dd
# Read a Parquet file into a Dask DataFrame
ddf = dd.read_parquet('example.parquet', engine='fastparquet')
# Perform operations on the Dask DataFrame
result = ddf.groupby('name').mean().compute()
# Display the result for simple data types
print(result)
Sie können beim Schreiben von Parkettdateien verschiedene Komprimierungsalgorithmen angeben:
import pandas as pd
import fastparquet
# Create a sample DataFrame
df = pd.DataFrame({
'name': ['Alice', 'Bob', 'Charlie'],
'age': [25, 30, 35]
})
# Write the DataFrame to a Parquet file with gzip compression
df.to_parquet('example.parquet', engine='fastparquet', compression='gzip')
IronPDF ist eine robuste Python-Bibliothek zum Erzeugen, Ändern und digitalen Signieren von PDF-Dokumenten, die aus HTML, CSS, Bildern und JavaScript abgeleitet sind. Es zeichnet sich durch hohe Leistung bei minimalem Speicherbedarf aus. Hier sind seine wichtigsten Merkmale:
Konvertieren Sie mit IronPDF HTML-Dateien, HTML-Strings und URLs in PDF-Dokumente. Zum Beispiel, müheloswebseiten in PDFs umwandeln mit dem PDF-Renderer von Chrome.
Kompatibel mit Python 3+ unter Windows, Mac, Linux und verschiedenen Cloud-Plattformen. IronPDF ist auch für .NET-, Java-, Python- und Node.js-Umgebungen verfügbar.
Ändern Sie Dokumenteigenschaften, verbessern Sie die Sicherheit mitpasswortschutz und Berechtigungenund integrierendigitale Signaturen in Ihre PDFs mit IronPDF.
Maßgeschneiderte PDFs mit benutzerdefiniertenkopfzeilen, Fußzeilen, seitenzahlenund einstellbare Ränder. Es unterstützt responsive Layouts und passt sich benutzerdefinierten Papierformaten an.
Entspricht den PDF-Standards wie PDF/A und PDF/UA. Es beherrscht die UTF-8-Zeichenkodierung und verwaltet Assets wie Bilder, CSS-Stylesheets und Schriftarten effektiv.
IronPDF setzt auf .NET 6.0 als Basistechnologie. Bitte vergewissern Sie sich daher.NET 6.0-Laufzeit auf Ihrem System installiert ist.
Python 3.0+: Stellen Sie sicher, dass Sie Python Version 3 oder höher installiert haben.
# install latest version of the libraries
pip install fastparquet
pip install pandas
pip install ironpdf
Das folgende Codebeispiel demonstriert die Verwendung von fastparquet und IronPDF zusammen in Python:
import pandas as pd
import fastparquet as fp
from ironpdf import *
# Apply your license key
License.LicenseKey = "your Key"
# Sample DataFrame
data = {
'name': ['Alice', 'Bob', 'Charlie'],
'age': [25, 30, 35],
'city': ['New York', 'Los Angeles', 'Chicago']
}
df = pd.DataFrame(data)
# Writing DataFrame to a Parquet file
fp.write('example.parquet', df)
# Reading from Parquet file into DataFrame
df_read = fp.ParquetFile('example.parquet').to_pandas()
# Displaying the read DataFrame
print("Original DataFrame:")
print(df)
print("\nDataFrame read from Parquet file:")
print(df_read)
renderer = ChromePdfRenderer()
# Create a PDF from a HTML string using Python
content = "<h1>Awesome Iron PDF with FastParquet</h1>"
content += "<p> Original DataFrame:"+"</p>"
content += "<p>"+f"{str(df)}"+"</p>"
content += "<p> DataFrame read from Parquet file:"+"</p>"
content += "<p>"+f"{str(df_read)}"+"</p>"
pdf = renderer.RenderHtmlAsPdf(content)
# Export to a file or Stream
pdf.SaveAs("Demo-FastParquet.pdf")
Dieses Codeschnipsel demonstriert, wie mehrere Python-Bibliotheken verwendet werden können, um Daten zu manipulieren und ein PDF-Dokument aus HTML-Inhalten zu erzeugen.
Imports und Setup: fastparquet import- und IronPDF import-Anweisungen zur Datenmanipulation, zum Lesen und Schreiben von Parquet-Dateien bzw. zur PDF-Erzeugung.
Einstellen des Lizenzschlüssels: Legen Sie den Lizenzschlüssel für IronPDF fest, um dessen Funktionen zu aktivieren.
Erstellen eines Muster-DataFrames: Definieren Sie einen Beispiel-DataFrame(`df`) die Informationen über Personen enthalten(name, Alter, Stadt).
DataFrame in Parquet schreiben: Schreiben des DataFrame `df` in eine Parquet-Datei mit dem Namen `Beispiel.parquet`.
Lesen aus Parquet-Datei: Lesen von Daten aus der Parquet-Datei(\"Beispiel-Parkett) zurück in einen DataFrame(`df_read`).
Erzeugen von PDF aus HTML: Initialisieren Sie eine ChromePdfRenderer-Instanz mit IronPDF.
HTML-Zeichenkette: Konstruieren Sie einen HTML-String(\"Inhalt) die eine Überschrift enthält(`
`) anzeige des ursprünglichen DataFrame(`df`) und der aus der Parquet-Datei gelesene DataFrame(`df_read`).
`pdf = renderer.RenderHtmlAsPdf(inhalt)`: Rendert den HTML-Inhalt(\"Inhalt) als PDF-Dokument mit IronPDF.
pdf.SaveAs("Demo-SchnellParkett.pdf")`: Speichert das erzeugte PDF-Dokument als "Demo-FastParquet.pdf".
Code demonstriert einen Beispielcode für FastParquet, und dann integriert es nahtlos Datenverarbeitungsfunktionen mit PDF-Generierung, so dass es nützlich für die Erstellung von Berichten oder Dokumenten auf der Grundlage von Daten in Parkett-Dateien gespeichert.
IronPDF seite.
Setzen Sie den Lizenzschlüssel an den Anfang des Skripts, bevor SieIronPDF-Paket:
from ironpdf import *
# Apply your license key
License.LicenseKey = "key"
*Fast-Parkett ist eine leistungsfähige und effiziente Bibliothek für die Arbeit mit Parkettdateien in Python. Seine Integration mit Pandas und Dask macht es zu einer guten Wahl für die Verarbeitung großer Datenmengen in einem Python-basierten Big-Data-Workflow. IronPDF ist eine robuste Python-Bibliothek, die die Erstellung, Bearbeitung und Darstellung von PDF-Dokumenten direkt aus Python-Anwendungen ermöglicht. Es vereinfacht Aufgaben wie die Umwandlung von HTML-Inhalten in PDF-Dokumente, die Erstellung interaktiver Formulare und die Durchführung verschiedener PDF-Manipulationen wie das Zusammenführen von Dateien oder das Hinzufügen von Wasserzeichen. IronPDF lässt sich nahtlos in bestehende Python-Frameworks und -Umgebungen integrieren und bietet Entwicklern eine vielseitige Lösung für die dynamische Erstellung und Anpassung von PDF-Dokumenten. Zusammen mit fastparquet und IronPDF können die Daten im Parkettformat und die PDF-Erzeugung nahtlos verarbeitet werden.
IronPDF bietet eine umfassende Dokumentation und Code-Beispiele, um Entwicklern zu helfen, das Beste aus seinen Funktionen zu machen. Weitere Informationen finden Sie in derdokumentation undcode-Beispiel seiten.
9 .NET API-Produkte für Ihre Bürodokumente