-1
votes

Comment créer une liste séparée par des virgules comme nouvelle colonne dans Pandas Dataframe

J'ai dataframe (DF) comme ci-dessous.

Je veux aussi ignorer les valeurs NULL Valeurs de valeurs NULL SIZ. P>

STRAND> INPUT PRE>

 A            B              C             Merged
a@gmail.com   y@yahoo.com    g@mail.com    a@gmail.com,y@yahoo.com,g@mail.com
b@gmail.com                                b@gmail.com
c@gmail.com   g@gmail.com    d@gmail.com   c@gmail.com,g@gmail.com,d@gmail.com
d@gmail.com                  t@gmail.com   d@gmail.com,t@gmail.com
               r@gmail.com   y@gmail.com   r@gmail.com,y@gmail.com


1 commentaires

@ r.ook, je veux ignorer les valeurs nulles tout en créant la colonne


5 Réponses :


1
votes
             A            B            C                               Merged
0  a@gmail.com  y@yahoo.com   g@mail.com   a@gmail.com,y@yahoo.com,g@mail.com
1  b@gmail.com         None         None                          b@gmail.com
2  c@gmail.com  g@gmail.com  d@gmail.com  c@gmail.com,g@gmail.com,d@gmail.com
3  d@gmail.com  t@gmail.com         None              d@gmail.com,t@gmail.com
4  r@gmail.com  y@gmail.com         None              r@gmail.com,y@gmail.com

0 commentaires

3
votes

EDIT: Comme indiqué par Scott Boston, cette solution laisse la double virgule dans la colonne fusionnée dans le cas de la 4ème ligne.

Vous pouvez essayer: P>

df['merged'] = df.A.str.cat([df.B, df.C], sep=',', na_rep='').str.strip(',')


2 commentaires

Y a-t-il une double virgule sur l'index rangée 3?


Vous avez raison d'avoir manqué celui-là, pas facile à résoudre en utilisant cette approche. Votre solution serait préférée.



0
votes

Vous pouvez le faire par mentionné ci-dessous xxx

sortie:

 Entrez la description de l'image ici


0 commentaires

3
votes

Utilisation (mise à jour pour gérer '' 'vs nan): xxx pré>

sortie: p> xxx pré>

comme, p>

             A            B            C                                 merged
0  a@gmail.com  y@yahoo.com   g@mail.com   a@gmail.com, y@yahoo.com, g@mail.com
1  b@gmail.com          NaN          NaN                            b@gmail.com
2  c@gmail.com  g@gmail.com  d@gmail.com  c@gmail.com, g@gmail.com, d@gmail.com
3  d@gmail.com          NaN  t@gmail.com               d@gmail.com, t@gmail.com
4          NaN  r@gmail.com  y@gmail.com               r@gmail.com, y@gmail.com


4 commentaires

Cela crée des valeurs comme , a@gmail.com. Quand nous n'avons pas de valoriser les deux autres colonnes


Pouvez-vous ajouter du code pour créer votre Dataframe dans votre question. Vous pouvez remplacer le «Aucun» avec NP.NAN.


Sa venant de la feuille Excel. Je n'ai pas créé


@LDF_VARUM_ELLAM_SHERIAAVUM Mise à jour.



2
votes

Une autre méthode est une autre méthode pile , puis rejoindre le regroupement au niveau = 0 (lignes): xxx

ou: xxx


xxx

0 commentaires