0
votes

Comment compter le nombre de mots d'une liste mentionnée dans un cadre de données dans R

J'ai une trame de données avec une colonne de révision et de texte avec plusieurs rangées. J'ai aussi une liste contenant des mots. Je souhaite une boucle pour examiner chaque ligne du cadre de données pour résumer le nombre de mots trouvés dans la liste. Je veux garder chaque rangée de chaque rangée séparée par la ligne et placer les résultats dans un nouveau cadre de données de résultat.

#Data Frame
Review           Text
1           I like to run and play.
2           I eat cookies.
3           I went to swim in the pool.
4           I like to sleep.
5           I like to run, play, swim, and eat.

#List Words
Run
Play
Eat
Swim

#Result Data Frame
Review      Count
1            2
2            1
3            1
4            0
5            4


0 commentaires

3 Réponses :


0
votes

Nous pouvons utiliser stringr :: str_count code> après avoir collé les mots code> ensemble comme un motif.

df <- structure(list(Review = 1:5, Text = structure(c(2L, 1L, 5L, 4L, 
3L), .Label = c("I eat cookies.", "I like to run and play.", 
"I like to run, play, swim, and eat.", "I like to sleep.", 
"I went to swim in the pool."), class = "factor")), class = 
"data.frame", row.names = c(NA, -5L))
words <- c("Run","Play","Eat","Swim")


4 commentaires

Existe-t-il un moyen de créer une boucle pour boucle via le cadre de données et la liste? La trame de données et la liste des mots ci-dessus sont un exemple. Le cadre de données que je travaille avec contient 600 critiques et la liste contient environ 40 mots.


@Jaylonaaron Ça ne devrait pas avoir d'importance. Cela devrait toujours fonctionner. Comment votre liste de mots est-elle stockée?


Je l'ai eu pour travailler. Je devais d'abord constater les mots dans la liste, puis l'exécuter. Merci pour ton aide!


@Jaylonaaron N'hésitez pas à Acceptez la réponse en cliquant sur Cochez la case à côté du bouton de vote si vous estimez que cela vous a été utile. :-) Vous pouvez accepter une seule réponse par message.



0
votes

BASE R SOLUTION (REMARQUE Cette solution est intentionnellement insensible à la casse): xxx

données: xxx


0 commentaires

1
votes

Voici une solution pour base r , où GREGEXPR est utilisé pour compter les occurrences.

donné le motif ci-dessous xxx < / pré>

puis les comptes ajoutés à la trame de données peuvent être effectués via: xxx

tel que xxx


0 commentaires