3 Réponses :


0
votes

Que diriez-vous de remplacer # \ s + avec # \\\ s +


0 commentaires

11
votes

Utilisez "# \\ s +" code> au lieu de "# \ s +" code>.

str_extract_all("Hello peopllz! My new home is #crazy gr8! #wow", "#\\S+")
# [[1]]
# [1] "#crazy" "#wow"  


3 commentaires

Cela fonctionne, merci! Mais comment puis-je extraire toutes les hashtags d'un tweet? Cela me donnerait le premier hashtag survenant. Toute façon de faire le tour?


x <- GREGEXPR ("# (\\ s +)", "Bonjour! #London est gr8. #wow") donne la position et les longueurs des tweets pouvant être utilisés pour extraire les hashtags, mais aucune façon plus simple de le faire ?


Une bonne réponse, peut vouloir utiliser # \\ w + au lieu de # \\ s + la ponctuation n'est donc pas incluse



3
votes

Juste de chiming. En fonction de la manière dont vous accédez aux données Twitter, ces informations peuvent déjà être analysées pour vous. Par exemple, si vous accédez au flux d'échantillons, le format JSON brut a une entrée qui analyse les références, les balises, etc., en tant que tableau pour vous. Voir Documentation API Twitter ici.


0 commentaires