0
votes

Comment utiliser l'ANOVA pour trouver les différences entre trois groupes dans un jeu de données

J'essaie d'utiliser une ANOVA pour trouver les différences entre les moyens de 'Groupe1', "Groupe2" et "Groupe5" dans le jeu de données ci-dessous.

tab_csv$number[tab_csv$label == "group1"])
tab_csv$number[tab_csv$label == "group2"])
tab_csv$number[tab_csv$label == "group5"])


0 commentaires

3 Réponses :


2
votes

vous pouvez faire:

Groupes <-C ("Groupe1", "Groupe2", "Groupe5")

new.df <-TAB_CSV [qui (Niveaux (échelons tab_csv $)% en% groupes,] M1 <-AOV (NEW.DF $ Numéro ~ New.DF $ étiquette) Résumé (M1)

ou vous pouvez tirer à partir des données d'origine et exécuter ce qui suit:

m2 <-aov (tab_csv $ Numéro [qui (orm_csv $ étiquette% in% in %%)] ~ tab_csv $ étiquette [qui (onglet_csv $ étiquette% in% en% de groupe)])] Résumé (M2)

Probablement plus jolie façons de le faire ...


1 commentaires

Merci beaucoup @noobr!



3
votes

Cela devrait être ce que vous recherchez? XXX


5 commentaires

Lorsque j'essaie votre code @hanselpalencia, je reçois l'erreur `objet 'étiquette' non trouvée. Pouvez-vous aider? :)


C'est probablement parce que votre colonne de groupe n'est pas appelée l'étiquette? Je viens d'utiliser votre cadre de données et je n'ai pas pu reproduire votre erreur. Le code ci-dessus est correct et devrait fonctionner si tout est là où il est censé être.


J'appelais DF au lieu de tab_csv mon mauvais mais merci quand même :)


J'ai couru votre code à nouveau @hanselpalencia. Cependant, maintenant je reçois l'erreur objet 'label' non trouvé . Peux-tu aider s'il te plait?


Quel est votre nom de colonne pour vos groupes?



2
votes

Vous pouvez également utiliser sous-ensemble code> pour sélectionner votre groupe dans votre DataFrame:

# 1st - generating your dataframe
group = c(rep("group1",5),rep("group2",5),rep("group3",5),rep("group4",5),rep("group5",5))
value = c(120,105,105,84,32,820,922,823,945,849,1990,29,40,21,900,220,70,109,19,18,55,40,35,30,20)
df = data.frame(group = group,value = value)


# performing anova
> summary(aov(value ~ group, data = subset(df, group == "group1" | group =="group2" | group == "group5")))
            Df  Sum Sq Mean Sq F value  Pr(>F)    
group        2 2189758 1094879   695.9 3.9e-13 ***
Residuals   12   18880    1573                    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1


1 commentaires

Merci beaucoup @ dc37!