J'ai une trame de données avec une colonne de révision et de texte avec plusieurs rangées. J'ai aussi une liste contenant des mots. Je souhaite une boucle pour examiner chaque ligne du cadre de données pour résumer le nombre de mots trouvés dans la liste. Je veux garder chaque rangée de chaque rangée séparée par la ligne et placer les résultats dans un nouveau cadre de données de résultat.
#Data Frame Review Text 1 I like to run and play. 2 I eat cookies. 3 I went to swim in the pool. 4 I like to sleep. 5 I like to run, play, swim, and eat. #List Words Run Play Eat Swim #Result Data Frame Review Count 1 2 2 1 3 1 4 0 5 4
3 Réponses :
Nous pouvons utiliser stringr :: str_count code> après avoir collé les mots
code> ensemble comme un motif.
df <- structure(list(Review = 1:5, Text = structure(c(2L, 1L, 5L, 4L,
3L), .Label = c("I eat cookies.", "I like to run and play.",
"I like to run, play, swim, and eat.", "I like to sleep.",
"I went to swim in the pool."), class = "factor")), class =
"data.frame", row.names = c(NA, -5L))
words <- c("Run","Play","Eat","Swim")
Existe-t-il un moyen de créer une boucle pour boucle via le cadre de données et la liste? La trame de données et la liste des mots ci-dessus sont un exemple. Le cadre de données que je travaille avec contient 600 critiques et la liste contient environ 40 mots.
@Jaylonaaron Ça ne devrait pas avoir d'importance. Cela devrait toujours fonctionner. Comment votre liste de mots est-elle stockée?
Je l'ai eu pour travailler. Je devais d'abord constater les mots dans la liste, puis l'exécuter. Merci pour ton aide!
@Jaylonaaron N'hésitez pas à Acceptez la réponse en cliquant sur Cochez la case à côté du bouton de vote si vous estimez que cela vous a été utile. :-) Vous pouvez accepter une seule réponse par message.
BASE R SOLUTION (REMARQUE Cette solution est intentionnellement insensible à la casse): données: p>
Voici une solution pour donné le motif ci-dessous p> puis les comptes ajoutés à la trame de données peuvent être effectués via: p> tel que P> base r code>, où
GREGEXPR code> est utilisé pour compter les occurrences.