Imaginons un éleveur qui souhaite acheter de nouvelles vaches pour sa production laitière. Il possède trois races différentes de vaches et se pose donc la question de savoir si la race est importante pour son choix. Il possède comme informations la race de chacune de ses bêtes (c’est la variable explicative discrète ou facteur de variabilité, qui peut prendre 3 valeurs différentes) et leurs productions de lait journalières (c’est la variable à expliquer continue, qui correspond au volume de lait en litre).
Dans notre exemple, l’hypothèse nulle revient à considérer que toutes les vaches produisent la même quantité de lait journalière (au facteur aléatoire près) quelle que soit la race. L’hypothèse alternative revient à considérer qu’une des races produit significativement plus ou moins de lait que les autres.
Supposons que les productions soient :
- Pour la race A : 20,1 ; 19,8 ; 21,3 et 20,7
- Pour la race B : 22,6 ; 24,1 ; 23,8 ; 22,5 ; 23,4 ; 24,5 et 22,9
- Pour la race C : 31,2 ; 31,6 ; 31,0 ; 32,1 et 31,4
| Race | Taille | Moyenne | Variance |
|---|---|---|---|
| A | 4 | 20,475 | 0,443 |
| B | 7 | 23,4 | 0,59333 |
| C | 5 | 31,46 | 0,178 |
| Total | 16 | 25,1875 | 20,90117 |
Table d’ANOVA :
| Source de la variance | Sommes des carrés des écarts | Degrés de liberté | Variance | F | p-value |
|---|---|---|---|---|---|
| Inter-classes | 307,918 | 2 | 153,959 | 357,44 | 4,338 e-12 |
| Intra-classe | 5,6 | 13 | 0,431 |
