J'ai un vecteur de mots dans R:
mots = c ("génial", "perte", "bon", "mauvais") code> p> blockquote>
et j'ai le fichier de données suivant dans R: p>
xxx pré> Ce que je veux faire, c'est que des mots correspondant exactement dans la colonne de réponse doivent être extraits et insérés dans la nouvelle colonne de DataFrame. La sortie finale devrait ressembler à ceci p>
xxx pré> J'ai utilisé le code suivant: p>
extraire la liste des mots correspondants h2>
xxx Pré> Collez les mots correspondants ensemble h2>
xxx pré> mais il fournit la correspondance, mais pas exactement. S'il vous plaît aider. P> p>
3 Réponses :
Si vous utilisez des ancrages dans vos mots code> Vecteur CODE>, vous assurerez des correspondances exactes: ^ affirme que vous êtes au début, $ à la fin d'un mot. Ainsi: puis utilisez votre code: p> df$Words[df$Words == ""] <- NA
Nous pouvons utiliser str_extract_all code>
données h3>
Modifier le premier exécutez maintenant le second comme pour le données. strong> p> * Appliquer code> à une fonction à deux lignes. Si la regex devient
"\\ bword \\ b" code> alors il capture le mot entouré de limites.
Appliquer code > Comme indiqué dans la question. p>
na / code> s, je vais utiliser la fonction
is.na <- code>. p>