0
votes

Extraire des noms de la trame de données comme données distinctes dans R

J'ai un exemple de cadre de données avec nom et nom de famille. J'ai besoin d'extraire des noms comme des données distinctes. J'ai eu l'idée de faire celui-ci par un pour chaque nom, mais l'ensemble de données est grand et j'ai besoin d'une manière plus rapide. Pouvez-vous m'aider? XXX

r dataframe regex stringr

2 commentaires

Non, je veux sélectionner toutes les lignes avec le nom donné.

Supposons que j'ai mille personnes, dont cent John et j'ai besoin d'un cadre de données séparé avec tous les John.

3 Réponses :

1
votes

Si vous souhaitez séparer les fichiers DataFrames en fonction de leur nom, nous pouvons d'abord extraire le prénom, puis diviser code> sur eux.

output <- split(df, sub("\\s.*", "", df$name))
output

#$Antonio
#             name telephone
#2 Antonio Gilbert   2342343

#$Christian
#                name telephone
#5 Christian Thompson   5686686

#$John
#          name telephone
#1   John Smith    234324
#4 John Marquez  68656486

#$Rickie
#           name telephone
#3 Rickie Hooley    547547
#6 Rickie Galvan   4664546

3 commentaires

Je ne voulais pas dire ça. J'ai besoin de données séparées pour chaque nom. Par exemple:> DF1%>% filtre (GREPL ("John", nom)),> DF2%>% filtre (GREPL ("Rickie", nom))

@ZIZOU J'ai mis à jour la réponse basée sur cela. Pouvez-vous vérifier maintenant?

C'est exactement ce que je voulais dire.

1
votes

Cela produira une liste de données de données, chacun contenant l'un des différents prénoms. Vous pouvez y accéder avec dfflist $ john etc. xxx



                                                                    
                                    
                                    
                                        0 commentaires


                        
                                            
                            
                                
                                    1
 votes
                                
                            
                            
                                
                                     Nous pouvons utiliser  group_split  à partir de  dplyr   xxx                                  


                                                                    
                                    
                                    
                                        0 commentaires


            
                
		    
                    Articles qui pourrait vous intéresser :
                                            
                            Comment créer une barre de couleur dégradée discrète avec geom_contour_filled?                        
                        
                                            
                            Variable de bande dans R                        
                        
                                            
                            Mélanger le vecteur dans R, mais les éléments identiques doivent avoir une distance minimale                        
                        
                                            
                            Pour imprimer la valeur de l'année bissextile suivante en utilisant la variable dans la programmation R