0
votes

Hive Rejoignez entre deux tables

C'est le problème: J'ai cette table de transfert: xxx

et cette table cible: xxx

Je veux obtenir cette sortie: XXX

Dans le champ horodatage, je souhaite l'enregistrement le plus mis à jour lorsque Key0, Key1 et Partition_Key. De plus, je veux déjà des enregistrements existants dans la table cible, mais cela n'existe pas dans la table d'intermédiaire

J'ai essayé d'abord avec cette requête: xxx


0 commentaires

3 Réponses :


1
votes

Vous avez besoin Joindre complet : xxx


0 commentaires

1
votes

Je pense que vous voulez juste que vous voulez juste un rejoindre et coalesce () : xxx

pour chaque enregistrement dans Target_Table , cette recherche d'un enregistrement dans stadification_table qui a le même (key0, clé1, partition_key ). Si un tel enregistrement est disponible, nous prenons utilise son horodatage à la place de l'horodatage à partir du cible_table .


0 commentaires

3
votes

Ceci ressemble à une requête de hiérarchisation - prenez tout de la mise en scène puis des rangées inégales de la cible. Je vais recommander Union tout : xxx

Cela suppose que la mise en scène a les lignes les plus récentes - qui est vraie dans vos échantillons de données. Sinon, je voudrais souligner cela comme suit: xxx


0 commentaires