Je tente de trouver toutes les phrases dans un fichier texte dans R qui ont des nombres de tout format en eux et remplacez-le par des hashtags autour d'eux.
Par exemple, prenez l'entrée ci-dessous: p> comme sortie de la fonction, je cherche: p>
3 Réponses :
Les nombres environnants sont tout droit, supposant que tout ce qui avec un nombre, une période, une virgule et un signe dollar sont tous inclus.
grep("\\d", gsub("\\b([-$0-9.,]+)\\b", "#\\1#", ex), value = TRUE) # [1] "I have $#5.78# in my account" # [2] "do you want #1,785# puppies?" # [3] "My favorite numbers are #3#, #14,568#, and #78#"
Nous pouvons utiliser gsub code>
Une autre approche étape par étape consiste à utiliser grep code> pour identifier les éléments de fichier texte contenant le modèle
"[0-9]" " code>, des éléments de texte sous-ensemble avec Entrées numériques à l'aide de
EX [....] code> et utilisez l'opérateur de tuyau
%>%>%>% code> à partir de
bibliothèque (dplyr) code> pour transmettre le sous-ensemble à
gsub code> Puis utilisez la logique @ R2Evans pour placer des hashtags autour des entrées numériques, comme indiqué ci-dessous:
library(dplyr)
ex[do.call(grep,list("[0-9]",ex))] %>% gsub("\\b([-$0-9.,]+)\\b", "#\\1#",.)
[1] "I have $#5.78# in my account" "do you want #1,785# puppies?"
[3] "My favorite numbers are #3#, #14,568#, and #78#"