Dask.distributed est une bibliothèque légère pour le calcul distribué en Python. Il étend à la fois les API concurrent.futures et dask aux clusters de taille moyenne.
Je ne peux charger les données que si je change le paramètre "anon" sur True après avoir rendu le fichier public. df = dd.read_csv('s3://mybucket/some-big.csv', storage_ ...