0
votes

Supprimer des lignes en double qui ont des valeurs comme celle de l'en-tête de colonne

Mes données ressemblent quelque peu à ceci: xxx

Les noms de mes en-têtes de colonne sont répétés dans la ligne n ° 3 et 5. Comment puis-je supprimer les rangées n ° 3 et 5 en utilisant r et conserver L'en-tête de colonne telle qu'elle est de sorte que ma sortie ressemble à ceci: xxx

supposant que mes données d'origine ont trop de lignes, je ne veux pas simplement sélectionner les numéros de ligne et supprimer en utilisant les données de commande [-C (3, 5),]

r duplicates rows columnheader

1 commentaires

Veuillez fournir un exemple de travail minimal. Mais vous problème est assez simple, utilisez simplement GREP ou d'autres fonctions telles que toutes les lignes correspondant aux colnames.

3 Réponses :

0
votes

Utilisez str_detect () avec filtre pour supprimer ces lignes.

df_2 <- df[-grep("[Aa-zZ]",df$salary),]
df_2

0 commentaires

0
votes

Voici une solution simple xxx

0 commentaires

0
votes

En supposant, salaire code> est un champ numérique, vous pouvez simplement le faire -

# assuming df is your dataframe

clean_df <- df[!is.na(as.numeric(df$salary)), ]

0 commentaires