0
votes

Comment nommer les données de données en fonction de la première occurrence dans un groupe

Comment boucler sur une trame de données et créer de nouveaux dataframes, nommés d'après un motif et y compris ce modèle uniquement.

Par exemple, pour un fichier de données comme celui-ci: P>

  df_hi:
           X    Y
       0   hi   4
       1   hi   9
       2   hi   0

  df_hello:
           X       Y
       0   hello   1
       1   hello   3
       2   hello   4

  df_salut:
           X       Y
       0   salut   2
       1   salut   3


1 commentaires

Généralement, je les stockerais comme un dictionnaire: {k: v pour k, v dans df.groupby ('x')} .


3 Réponses :


1
votes

au lieu de créer de nouveaux dataframes, vous pouvez filtrer l'un existant.

df[df['X'] == 'hello']


0 commentaires

0
votes

Je recommanderais d'utiliser groupby () code> et stocker vos résultats dans un dictionnaire où les clés sont les valeurs uniques de votre colonne x code> et que les valeurs sont les fichiers Dataframes ( et conserve les indices d'origine), comme: xxx pré>

puis, pour extraire votre Dataframe correspondant à Bonjour code>, vous pouvez simplement effectuer: p>

       X  Y
0  hello  1
2  hello  3
6  hello  4


0 commentaires

1
votes

Vous pouvez essayer ce xxx

pour une efficacité, vous souhaitez peut-être modifier pour l'étiquette dans df.x dans pour l'étiquette dans la liste (définir (df.x.values)) .


0 commentaires