Questions et réponses pour le hadoop :

Hadoop is an Apache open-source project that provides software for reliable and scalable distributed computing. The core consists of a distributed file system (HDFS) and a resource manager (YARN). Various other open-source projects, such as Apache Hive use Apache Hadoop as persistence layer.

6
votes
J'ai essayé d'installer Hadoop sur un seul cluster de noeud (mon propre labTop-Ubuntu 12.04). J'ai suivi ce tutoriel et j'ai vérifié la ligne de la ligne deux fois. ...

6
votes
Utiliser Apache Cochon et le texte extrctd = FOREACH fltr GENERATE FLATTEN(EXTRACT(txt,'(my brother just .*\\p{Punct})')) as (txt:chararray); ...

6
votes
est-il possible d'obtenir des lectures distribuées du cluster HDSF à l'aide d'un client HDFS sur une machine? J'ai effectué une expérience avec un cluster compos&ea ...

6
votes
Je jouais avec Mahout et je constatais que le FileDatamodel accepte des données dans le format xxx J'ai quelques données qui est du format ...