Questions et réponses pour le hadoop :

Hadoop is an Apache open-source project that provides software for reliable and scalable distributed computing. The core consists of a distributed file system (HDFS) and a resource manager (YARN). Various other open-source projects, such as Apache Hive use Apache Hadoop as persistence layer.

11
votes
J'ai un problème avec Hadoop produisant trop de fichiers journaux en $ hadoop_log_dir / userlogs (le système de fichiers ext3 ne permet que 32 000 sous-répertoires) qui ressem ...

11
votes
Je suis actuellement un utilisateur très décontracté de Apache Mahout , et je envisage d'acheter le livre ...

11
votes
J'ai le code suivant et je n'ai pas compris pourquoi get () est utilisé dans la ligne en surbrillance. Si je supprimais que get () méthode, il me jett ...

11
votes
mon cas d'utilisation comme mentionné ci-dessous. Lire les données d'entrée du système de fichiers local à l'aide de SparkContext.TextFile (chem ...