0
votes

Texte correspondant exactement avec colonne Dataframe dans R

J'ai un vecteur de mots dans R:

mots = c ("génial", "perte", "bon", "mauvais")

et j'ai le fichier de données suivant dans R: xxx

Ce que je veux faire, c'est que des mots correspondant exactement dans la colonne de réponse doivent être extraits et insérés dans la nouvelle colonne de DataFrame. La sortie finale devrait ressembler à ceci xxx

J'ai utilisé le code suivant:

extraire la liste des mots correspondants xxx

Collez les mots correspondants ensemble xxx

mais il fournit la correspondance, mais pas exactement. S'il vous plaît aider.


0 commentaires

3 Réponses :


0
votes

Si vous utilisez des ancrages dans vos mots code> Vecteur CODE>, vous assurerez des correspondances exactes: ^ affirme que vous êtes au début, $ à la fin d'un mot. Ainsi: xxx pré>

puis utilisez votre code: p>

df$Words[df$Words == ""] <- NA


0 commentaires

0
votes

Nous pouvons utiliser str_extract_all xxx

données xxx


0 commentaires

0
votes

Modifier le premier * Appliquer à une fonction à deux lignes. Si la regex devient "\\ bword \\ b" alors il capture le mot entouré de limites. xxx

exécutez maintenant le second Appliquer Comme indiqué dans la question. xxx

comme pour le na / code> s, je vais utiliser la fonction is.na <- . xxx

données. xxx


0 commentaires