Questions et réponses pour le apache-pig :

Apache COB est une plate-forme d'analyse de grands ensembles de données consistant en une langue de haut niveau pour exprimer des programmes d'analyse de données, associée à une infrastructure pour évaluer ces programmes. La propriété saillante des programmes de porc est que leur structure est susceptible d'être une parallélisation substantielle qui leur permet de gérer de très grands ensembles de données.

10
votes
Y a-t-il un moyen facile d'utiliser Hadoop autre qu'avec la ligne de commande? Quels outils utilisez-vous et lequel est le meilleur? ...

8
votes
à partir de ceci: xxx ... Comment pourrions-nous générer ceci? xxx ... et comment pourrait-on gén& ...

7
votes
Lorsque je soumette une ruche SQL à l'aide de tez comme ci-dessous: hive (default)> select count(*) from simple_data; ...

6
votes
Utiliser Apache Cochon et le texte extrctd = FOREACH fltr GENERATE FLATTEN(EXTRACT(txt,'(my brother just .*\\p{Punct})')) as (txt:chararray); ...