Amazon Elastic MapReduce (Amazon EMR) est un service Web qui permet aux entreprises, chercheurs, analystes de données et développeurs de traiter facilement et à moindre coût de grandes quantités de données. Il utilise un cadre Hadoop hébergé s'exécutant sur l'infrastructure à l'échelle Web d'Amazon Elastic Compute Cloud (Amazon EC2) et d'Amazon Simple Storage Service (Amazon S3).
Je crée un cluster EMR et j'utilise le notebook jupyter pour exécuter certaines tâches Spark.
Mes tâches meurent après environ 1 heure d'exécution, et l'err ...
Je crée une application sur AWS EMR en utilisant la version YARN (et Dask) Hadoop 2.7.3-amzn-1. J'essaie de tester divers scénarios de défaillance et je souhaite simuler une d ...