Questions et réponses pour le dask-distributed :

Dask.distributed est une bibliothèque légère pour le calcul distribué en Python. Il étend à la fois les API concurrent.futures et dask aux clusters de taille moyenne.

3
votes
Je ne peux charger les données que si je change le paramètre "anon" sur True après avoir rendu le fichier public. df = dd.read_csv('s3://mybucket/some-big.csv', storage_ ...