Questions et réponses pour le hadoop :

Hadoop is an Apache open-source project that provides software for reliable and scalable distributed computing. The core consists of a distributed file system (HDFS) and a resource manager (YARN). Various other open-source projects, such as Apache Hive use Apache Hadoop as persistence layer.

7
votes
Lorsque je soumette une ruche SQL à l'aide de tez comme ci-dessous: hive (default)> select count(*) from simple_data; ...

7
votes
J'ai un projet où des capteurs physiques envoient des données sur le serveur. Les données sont envoyées irrégulièrement - après quelque chose activ ...

7
votes
Nous avons un cluster 8 noeuds à l'aide de CDH3U2 configuré à l'aide de Cloudera Manager. Nous avons un nœud maître dédié à exécuter no ...

7
votes
Quand je définis mapreduce.task.io.sort.mb = 100000. Je reçois une exception suivante. XXX Quelle est la valeur maximale de MapReduce.Task.io.sort.mb? ...