0
votes

SQL HIVE | Dupliquer les lignes dans le tableau

J'ai une table comme celle-ci où les clés sont [C_1, C_2, C_3], je veux des non-doublons dans ma table.

entrée: p> xxx pré>

Sortie: P>

C1    C2    C3   C4   C5
A1    D1    V1   X1   F3         
A2    D1    V1   X2   F2               
A4    D1    V2   X1   F3         


1 commentaires

Sélectionnez Distinct * à partir de votre carte


4 Réponses :


0
votes

Essayez ci-dessous:

insert overwrite table yourtable select distinct * from yourtable;


0 commentaires

0
votes

Vous pouvez sélectionner les données non dupliquées par xxx

puis vous pouvez tronquer la table et insérer le résultat ci-dessus à la table.


0 commentaires

0
votes

Vous pouvez utiliser row_number () Fonction de fenêtre: xxx

Vous pouvez supprimer commander par c4, C5 si vous n'êtes pas intéressé à la 1ère rangée de cet ordre.


0 commentaires

0
votes

L'agrégation fait-elle ce que vous voulez? XXX

Ceci ne garantit pas que C4 et C5 viennent de la même rangée, mais Il garantit que le triple c1 / c2 / c3 n'apparaît qu'une seule fois.


0 commentaires