J'ai un exemple de cadre de données avec nom et nom de famille. J'ai besoin d'extraire des noms comme des données distinctes. J'ai eu l'idée de faire celui-ci par un pour chaque nom, mais l'ensemble de données est grand et j'ai besoin d'une manière plus rapide. Pouvez-vous m'aider?
3 Réponses :
Si vous souhaitez séparer les fichiers DataFrames en fonction de leur nom, nous pouvons d'abord extraire le prénom, puis diviser code> sur eux.
output <- split(df, sub("\\s.*", "", df$name))
output
#$Antonio
# name telephone
#2 Antonio Gilbert 2342343
#$Christian
# name telephone
#5 Christian Thompson 5686686
#$John
# name telephone
#1 John Smith 234324
#4 John Marquez 68656486
#$Rickie
# name telephone
#3 Rickie Hooley 547547
#6 Rickie Galvan 4664546
Je ne voulais pas dire ça. J'ai besoin de données séparées pour chaque nom. Par exemple:> DF1%>% filtre (GREPL ("John", nom)),> DF2%>% filtre (GREPL ("Rickie", nom))
@ZIZOU J'ai mis à jour la réponse basée sur cela. Pouvez-vous vérifier maintenant?
C'est exactement ce que je voulais dire.
Cela produira une liste de données de données, chacun contenant l'un des différents prénoms. Vous pouvez y accéder avec dfflist $ john code> etc.
Nous pouvons utiliser group_split code> à partir de
dplyr code>
Non, je veux sélectionner toutes les lignes avec le nom donné.
Supposons que j'ai mille personnes, dont cent John et j'ai besoin d'un cadre de données séparé avec tous les John.