Le système de fichiers distribués Hadoop (HDFS) est le système de stockage de fichiers par défaut utilisé par Apache Hadoop. HDFS crée plusieurs répliques de blocs de données et les distribue sur des nœuds de données dans un cluster pour permettre un calcul fiable et une énorme quantité de données sur du matériel de base.
J'essaie d'utiliser le ci-dessous pour répertorier mes DIRS dans HDFS: 127.0.0.1 ubuntu localhost
#127.0.1.1 ubuntu
# The following lines are desirable for IPv6 capable hos ...
Il est possible d'exporter des données de HDFS sur la table des RDBMs à l'aide de SQOP.
Mais il semble que nous ayons besoin d'avoir une table existante.
y a-t-il ...