Questions et réponses pour le amazon-emr :

Amazon Elastic MapReduce (Amazon EMR) est un service Web qui permet aux entreprises, chercheurs, analystes de données et développeurs de traiter facilement et à moindre coût de grandes quantités de données. Il utilise un cadre Hadoop hébergé s'exécutant sur l'infrastructure à l'échelle Web d'Amazon Elastic Compute Cloud (Amazon EC2) et d'Amazon Simple Storage Service (Amazon S3).

9
votes
Je crée un cluster EMR et j'utilise le notebook jupyter pour exécuter certaines tâches Spark. Mes tâches meurent après environ 1 heure d'exécution, et l'err ...

8
votes
J'utilise le fichier de configuration conformément aux guides Configurer Spark ...

4
votes
J'ai deux règles de Scale-out: Scale-out-rule-1: ajoutez une instance 1 si YARNMemoryAvailablePercentage est inférieur à 15 pen ...

2
votes
Je crée une application sur AWS EMR en utilisant la version YARN (et Dask) Hadoop 2.7.3-amzn-1. J'essaie de tester divers scénarios de défaillance et je souhaite simuler une d ...