Hive est une base de données construite sur Hadoop et facilite la synthèse des données, les requêtes ad hoc et l'analyse de grands ensembles de données stockés dans un système de fichiers distribué compatible Hadoop. Hive fournit un mécanisme pour projeter la structure sur ces données et interroger les données à l'aide d'un langage de type SQL appelé HiveQL.
Actuellement, j'ai trois tables que je rejoins. J'ai des données émigrées d'un système (ancien) à un autre système (nouveau). J'ai besoin de comparer ces ...
Je viens de commencer sur Apache Hive, et j'utilise ma boîte à Ubuntu locale 12.04, avec la ruche 0.10.0 et Hadoop 1.1.2. Suivre le fonctionnaire " ...