df_train = pd.read_csv('../xyz.csv')
headers = df_train.columns
I want to filter out those columns in headers which have _pct in their substring.
3 Réponses :
comme df.columns code> renvoie une liste des noms de colonne, vous pouvez utiliser la compréhension de la liste et créer votre nouvelle liste avec une condition simple:
Le filtre doit être omet - Imprimer (df [[[i pour i dans df.columns si '_pct' non in i]]) code>
Utilisation:
df[df.columns.difference(df.filter(like='_pct').columns).tolist()] df.drop(df.filter(like='_pct').columns, axis=1)
La solution avec filtre est triviale: df.filter (comme = '_ pct') code>
@Ians - pas, car inversé
Que voulez-vous dire inversé?
@Ians - df.filter (pas comme = '_ pct') code>
désolé, je l'ai eu! Donc, j'ai une autre solution (inséréle): df [df.columns.difefence (df.filter (similaire = '_ pct'). colonnes) .tol ist ()] code>;)
ou plus sérieusement: df.drop (df.filter (comme = '_ pct'). Colonnes, axe = 1) code>