0
votes

Extraire une certaine chaîne de motif du texte par r

J'ai une colonne de textes ressemblant ci-dessous: xxx

je veux utiliser gsub fonction dans R pour extraire "abcd 123456789" à partir de là. Le nombre peut changer avec différents nombres, mais abcd est une constante. Quelqu'un peut-il connaître la solution avec ça s'il vous plaît? Merci beaucoup!


0 commentaires

3 Réponses :


1
votes

Nous pouvons utiliser str_extract pour sélectionner le mot fixe suivi de l'espace et un ou plusieurs numéros ( \\ d + ) xxx

S'il y a plusieurs instances, utilisez str_extract_all xxx

remarque: l'OP stipule que pour extraire "abcd 123456789" de il


0 commentaires

0
votes

Faites correspondre le début de la chaîne (^) des lettres principales (ABCID), un espace, des chiffres (\ d +) et tout le reste (. *) et remplacez tout cela avec la partie capturée, c'est-à-dire la partie entre parenthèses. Notez que nous voulons utiliser sous code>, pas gsub code>, ici car il n'y a qu'une seule substitution.

sub("^(ABCID \\d+).*", "\\1", str1)
## [1] "ABCID 123456789"


0 commentaires

0
votes

Si le numéro a une longueur constante (9), vous pourriez utiliser LookeDeDeHind : xxx


0 commentaires