-1
votes

Comment créer une liste séparée par des virgules comme nouvelle colonne dans Pandas Dataframe

J'ai dataframe (DF) comme ci-dessous.

Je veux aussi ignorer les valeurs NULL Valeurs de valeurs NULL SIZ. P>

STRAND> INPUT PRE>

 A            B              C             Merged
a@gmail.com   y@yahoo.com    g@mail.com    a@gmail.com,y@yahoo.com,g@mail.com
b@gmail.com                                b@gmail.com
c@gmail.com   g@gmail.com    d@gmail.com   c@gmail.com,g@gmail.com,d@gmail.com
d@gmail.com                  t@gmail.com   d@gmail.com,t@gmail.com
               r@gmail.com   y@gmail.com   r@gmail.com,y@gmail.com

python pandas dataframe

1 commentaires

@ r.ook, je veux ignorer les valeurs nulles tout en créant la colonne

5 Réponses :

1
votes

             A            B            C                               Merged
0  a@gmail.com  y@yahoo.com   g@mail.com   a@gmail.com,y@yahoo.com,g@mail.com
1  b@gmail.com         None         None                          b@gmail.com
2  c@gmail.com  g@gmail.com  d@gmail.com  c@gmail.com,g@gmail.com,d@gmail.com
3  d@gmail.com  t@gmail.com         None              d@gmail.com,t@gmail.com
4  r@gmail.com  y@gmail.com         None              r@gmail.com,y@gmail.com

0 commentaires

3
votes

EDIT: Comme indiqué par Scott Boston, cette solution laisse la double virgule dans la colonne fusionnée dans le cas de la 4ème ligne.

Vous pouvez essayer: P>

df['merged'] = df.A.str.cat([df.B, df.C], sep=',', na_rep='').str.strip(',')

2 commentaires

Y a-t-il une double virgule sur l'index rangée 3?

Vous avez raison d'avoir manqué celui-là, pas facile à résoudre en utilisant cette approche. Votre solution serait préférée.

0
votes

Vous pouvez le faire par mentionné ci-dessous xxx

sortie:

0 commentaires

3
votes

Utilisation (mise à jour pour gérer '' 'vs nan): xxx pré>

sortie: p> xxx pré>

comme, p>

             A            B            C                                 merged
0  a@gmail.com  y@yahoo.com   g@mail.com   a@gmail.com, y@yahoo.com, g@mail.com
1  b@gmail.com          NaN          NaN                            b@gmail.com
2  c@gmail.com  g@gmail.com  d@gmail.com  c@gmail.com, g@gmail.com, d@gmail.com
3  d@gmail.com          NaN  t@gmail.com               d@gmail.com, t@gmail.com
4          NaN  r@gmail.com  y@gmail.com               r@gmail.com, y@gmail.com

4 commentaires

Cela crée des valeurs comme , a@gmail.com. Quand nous n'avons pas de valoriser les deux autres colonnes

Pouvez-vous ajouter du code pour créer votre Dataframe dans votre question. Vous pouvez remplacer le «Aucun» avec NP.NAN.

Sa venant de la feuille Excel. Je n'ai pas créé

@LDF_VARUM_ELLAM_SHERIAAVUM Mise à jour.

2
votes

Une autre méthode est une autre méthode pile , puis rejoindre le regroupement au niveau = 0 (lignes): xxx

ou: xxx

xxx



                                                                    
                                    
                                    
                                        0 commentaires


            
                
		    
                    Articles qui pourrait vous intéresser :
                                            
                            Python: ConnectionError: HTTPSConnectionPool (hôte = 'api.foursquare-com', port = 443)                        
                        
                                            
                            L'exécution de Flask sous Windows n'exécute pas la commande d'exécution de flask                        
                        
                                            
                            Chatbot installé mais obtention d'une erreur lors de l'importation de ChatBot                        
                        
                                            
                            Administrateur Django: __str__ a renvoyé une non-chaîne (type int)