Questions et réponses pour le parquet :

Apache Parquet est un format de stockage en colonnes pour Hadoop.

6
votes
J'écris un fichier parquet à partir d'un Spark DataFrame de la manière suivante: import pandas as pd df = pd.read_parquet("path/myfile.parquet", engine="pyarrow") ...

6
votes
Je souhaite stocker la trame de données pandas suivante dans un fichier parquet en utilisant PyArrow: Traceback (most recent call last): File "<stdin>", line 1, in <module&g ...

2
votes
J'espère que quelqu'un pourra m'aider à résoudre ce problème. Je travaille actuellement sur un projet de pipeline de données, mon dilemme actuel est de savoir s' ...

0
votes
J'ai un fichier de parquet contenant deux colonnes (ID, fonctionnalité) .file est composé de 14348 rangées. ...