6
votes

Comment extraire des hashtags des tweets dans R?

EDIT: Je préférerais ne pas youcher le tweet, car: 1. Je ne jette pas les tweets pour le reste de mon programme, 2. Cela deviendrait une étape très coûteuse, je devais l'amplifier pour gérer de grands volumes de tweets.


                            
                                                                    r
                                                                    regex
                                                                    tweets
                                                            
                        
                                                    
                            
                            
                                0 commentaires



                                    
                    3 Réponses :
                    
                                            
                            
                                
                                    0
 votes
                                
                            
                            
                                
                                     Que diriez-vous de remplacer  # \ s +  avec  # \\\ s +                                   


                                                                    
                                    
                                    
                                        0 commentaires
                                        
                                                                                    
                                    
                                                            

                        

                        
                                            
                            
                                
                                    11
 votes
                                
                            
                            
                                
                                     Utilisez  "# \\ s +"  code> au lieu de  "# \ s +"  code>. 
str_extract_all("Hello peopllz! My new home is #crazy gr8! #wow", "#\\S+")
# [[1]]
# [1] "#crazy" "#wow" Â 

                                

                                                                    
                                    
                                    
                                        3 commentaires
                                        
                                                                                            
                                                    Cela fonctionne, merci! Mais comment puis-je extraire toutes les hashtags d'un tweet? Cela me donnerait le premier hashtag survenant. Toute façon de faire le tour?                                                
                                                
                                                                                            
                                                    x <- GREGEXPR ("# (\\ s +)", "Bonjour! #London est gr8. #wow") donne la position et les longueurs des tweets pouvant être utilisés pour extraire les hashtags, mais aucune façon plus simple de le faire ?                                                
                                                
                                                                                            
                                                    Une bonne réponse, peut vouloir utiliser  # \\ w +  au lieu de  # \\ s +  la ponctuation n'est donc pas incluse                                                

                                                
                                                                                    

                                    

                                                            

                        

                        
                                            
                            
                                
                                    3
 votes
                                
                            
                            
                                
                                     Juste de chiming. En fonction de la manière dont vous accédez aux données Twitter, ces informations peuvent déjà être analysées pour vous. Par exemple, si vous accédez au flux d'échantillons, le format JSON brut a une entrée qui analyse les références, les balises, etc., en tant que tableau pour vous. Voir  Documentation API Twitter  ici.                                 

                                                                    
                                    
                                    
                                        0 commentaires


            
                
		    
                    Articles qui pourrait vous intéresser :
                                            
                            Comment créer une barre de couleur dégradée discrète avec geom_contour_filled?                        
                        
                                            
                            Variable de bande dans R                        
                        
                                            
                            Mélanger le vecteur dans R, mais les éléments identiques doivent avoir une distance minimale                        
                        
                                            
                            Pour imprimer la valeur de l'année bissextile suivante en utilisant la variable dans la programmation R