J'ai dataframe (DF) comme ci-dessous.
Je veux aussi ignorer les valeurs NULL Valeurs de valeurs NULL SIZ. P>
STRAND> INPUT PRE>
A B C Merged a@gmail.com y@yahoo.com g@mail.com a@gmail.com,y@yahoo.com,g@mail.com b@gmail.com b@gmail.com c@gmail.com g@gmail.com d@gmail.com c@gmail.com,g@gmail.com,d@gmail.com d@gmail.com t@gmail.com d@gmail.com,t@gmail.com r@gmail.com y@gmail.com r@gmail.com,y@gmail.com
5 Réponses :
A B C Merged 0 a@gmail.com y@yahoo.com g@mail.com a@gmail.com,y@yahoo.com,g@mail.com 1 b@gmail.com None None b@gmail.com 2 c@gmail.com g@gmail.com d@gmail.com c@gmail.com,g@gmail.com,d@gmail.com 3 d@gmail.com t@gmail.com None d@gmail.com,t@gmail.com 4 r@gmail.com y@gmail.com None r@gmail.com,y@gmail.com
EDIT: Comme indiqué par Scott Boston, cette solution laisse la double virgule dans la colonne fusionnée dans le cas de la 4ème ligne.
Vous pouvez essayer: P>
df['merged'] = df.A.str.cat([df.B, df.C], sep=',', na_rep='').str.strip(',')
Y a-t-il une double virgule sur l'index rangée 3?
Vous avez raison d'avoir manqué celui-là, pas facile à résoudre en utilisant cette approche. Votre solution serait préférée.
Utilisation (mise à jour pour gérer '' 'vs nan): sortie: p> comme, p> A B C merged
0 a@gmail.com y@yahoo.com g@mail.com a@gmail.com, y@yahoo.com, g@mail.com
1 b@gmail.com NaN NaN b@gmail.com
2 c@gmail.com g@gmail.com d@gmail.com c@gmail.com, g@gmail.com, d@gmail.com
3 d@gmail.com NaN t@gmail.com d@gmail.com, t@gmail.com
4 NaN r@gmail.com y@gmail.com r@gmail.com, y@gmail.com
Cela crée des valeurs comme , a@gmail.com. Quand nous n'avons pas de valoriser les deux autres colonnes
Pouvez-vous ajouter du code pour créer votre Dataframe dans votre question. Vous pouvez remplacer le «Aucun» avec NP.NAN.
Sa venant de la feuille Excel. Je n'ai pas créé
@LDF_VARUM_ELLAM_SHERIAAVUM Mise à jour.
Une autre méthode est une autre méthode ou: p> pile code>, puis rejoindre le regroupement au niveau = 0 (lignes):
@ r.ook, je veux ignorer les valeurs nulles tout en créant la colonne