Questions et réponses pour le dask :

Dask est une bibliothèque parallèle de calcul et d'analyse de données pour Python. Il prend en charge la planification dynamique des tâches optimisée pour le calcul ainsi que pour les grandes collectes de données.

6
votes
En commençant par cet exemple de données ... 1 2 3 4 0 1 0 0 0 1 0 1 0 0 2 0 0 1 0 3 0 0 0 1 4 1 0 0 0 Point de départ:person_i ...

3
votes
Je ne peux charger les données que si je change le paramètre "anon" sur True après avoir rendu le fichier public. df = dd.read_csv('s3://mybucket/some-big.csv', storage_ ...

1
votes
J'utilise la fonction Pandas pivot_table sur un grand ensemble de données (10 millions de lignes, 6 colonnes). Le temps d'exécution étant primordial, j'essaie d ...

12
votes
J'ai besoin de créer une colonne basée sur une condition sur Dask Dataframe. En Pandas, il est assez simple: xxx tandis que dans Dask, je dois faire l ...