0
votes

Comment utiliser l'ANOVA pour trouver les différences entre trois groupes dans un jeu de données

J'essaie d'utiliser une ANOVA pour trouver les différences entre les moyens de 'Groupe1', "Groupe2" et "Groupe5" dans le jeu de données ci-dessous.

tab_csv$number[tab_csv$label == "group1"])
tab_csv$number[tab_csv$label == "group2"])
tab_csv$number[tab_csv$label == "group5"])

r anova

0 commentaires

3 Réponses :

2
votes

vous pouvez faire:

Groupes <-C ("Groupe1", "Groupe2", "Groupe5")

new.df <-TAB_CSV [qui (Niveaux (échelons tab_csv $)% en% groupes,] M1 <-AOV (NEW.DF $ Numéro ~ New.DF $ étiquette) Résumé (M1)

ou vous pouvez tirer à partir des données d'origine et exécuter ce qui suit:

m2 <-aov (tab_csv $ Numéro [qui (orm_csv $ étiquette% in% in %%)] ~ tab_csv $ étiquette [qui (onglet_csv $ étiquette% in% en% de groupe)])] Résumé (M2)

Probablement plus jolie façons de le faire ...



                                                                    
                                    
                                    
                                        1 commentaires
                                        
                                                                                            
                                                    Merci beaucoup @noobr!


                        
                                            
                            
                                
                                    3
 votes
                                
                            
                            
                                
                                     Cela devrait être ce que vous recherchez?  XXX                                  

                                                                    
                                    
                                    
                                        5 commentaires
                                        
                                                                                            
                                                    Lorsque j'essaie votre code @hanselpalencia, je reçois l'erreur `objet 'étiquette' non trouvée. Pouvez-vous aider? :)                                                
                                                
                                                                                            
                                                    C'est probablement parce que votre colonne de groupe n'est pas appelée l'étiquette? Je viens d'utiliser votre cadre de données et je n'ai pas pu reproduire votre erreur. Le code ci-dessus est correct et devrait fonctionner si tout est là où il est censé être.                                                
                                                
                                                                                            
                                                    J'appelais DF au lieu de tab_csv mon mauvais mais merci quand même :)                                                
                                                
                                                                                            
                                                    J'ai couru votre code à nouveau @hanselpalencia. Cependant, maintenant je reçois l'erreur  objet 'label' non trouvé . Peux-tu aider s'il te plait?                                                

                                                
                                                                                            
                                                    Quel est votre nom de colonne pour vos groupes?                                                
                                                
                                                                                    

                                    

                                                            

                        

                        
                                            
                            
                                
                                    2
 votes
                                
                            
                            
                                
                                     Vous pouvez également utiliser  sous-ensemble  code> pour sélectionner votre groupe dans votre DataFrame: 
# 1st - generating your dataframe
group = c(rep("group1",5),rep("group2",5),rep("group3",5),rep("group4",5),rep("group5",5))
value = c(120,105,105,84,32,820,922,823,945,849,1990,29,40,21,900,220,70,109,19,18,55,40,35,30,20)
df = data.frame(group = group,value = value)


# performing anova
> summary(aov(value ~ group, data = subset(df, group == "group1" | group =="group2" | group == "group5")))
            Df  Sum Sq Mean Sq F value  Pr(>F)    
group        2 2189758 1094879   695.9 3.9e-13 ***
Residuals   12   18880    1573                    
---
Signif. codes:  0 â€˜***â€™ 0.001 â€˜**â€™ 0.01 â€˜*â€™ 0.05 â€˜.â€™ 0.1 â€˜ â€™ 1

                                

                                                                    
                                    
                                    
                                        1 commentaires
                                        
                                                                                            
                                                    Merci beaucoup @ dc37!


            
                
		    
                    Articles qui pourrait vous intéresser :
                                            
                            Comment créer une barre de couleur dégradée discrète avec geom_contour_filled?                        
                        
                                            
                            Variable de bande dans R                        
                        
                                            
                            Mélanger le vecteur dans R, mais les éléments identiques doivent avoir une distance minimale                        
                        
                                            
                            Pour imprimer la valeur de l'année bissextile suivante en utilisant la variable dans la programmation R