• Keine Ergebnisse gefunden

Les analyses de variance : Anova, Manova, Ancova et Mancova

CHAPITRE IV : LES METHODES D’ANALYSES DE

IV. 1.2.2.2. Mesure du degré d’association entre deux variables qualitatives

IV.1.7. Les analyses de variance : Anova, Manova, Ancova et Mancova

Les analyses de variances (de covariances) sont généralement des analyses qui mettent en relation une variable quantitative avec des variables qualitatives. Dans ce contexte, les variables qualitatives sont souvent qualifiée de facteurs (ou variables d’expérimentation) ; les variables quantitatives sont, elles, des variables de résultat.

Par exemple, on souhaite évaluer l’effet de la saison sur la performance des athlètes en lancer de poids. Pour cela, on mesure les performances de 100 athlètes en lancer de poids (m) mesurées à deux moments de la saison (l’hiver et l’été). La variable de résultat ici est la distance atteinte par le poids lancé par l’athlète (variable quantitative) et le facteur est la saison (variable qualitative à deux modalités hiver et été). La saison représente ici le facteur. Ce facteur peut être de nature diverse et est fixé par l’expérimentateur. Par exemple les patients qui ont suivi un certain traitement, les clients qui ont été ciblés par une campagne marketing donnée, etc..

Dans chacun des cas, il s’agit d’analyser la différence en termes de résultats entre les individus qui ont reçu un traitement particulier comparativement et ceux qui n’ont pas reçu. Méthodologiquement, il s’agit de mettre en œuvre une Analyse de Variance (ANOVA) ou une analyse de covariance ANCOVA. Dans le cas où l’on dispose de

plusieurs variables de résultats à analyser simultanément, il s’agira d’un MANOVA ou d’une MANCOVA. Nous dirons quelques mots sur chacune des analyses et dans quel cas faut-il les utiliser.

IV.1.7.1. ANOVA

La méthode ANOVA est une méthode dans laquelle on compare la moyenne d’une variable quantitative selon les modalités d’une variable qualitatives. C’est un test de comparaison de moyenne qui permet de généraliser le test de Student lorsque le nombre de groupes est supérieur à deux. Contrairement au test de Student, l’ANOVA est fondée sur l’hypothèse que la variable dépendante quantitative est distribuée selon une loi normale. Par conséquent, elle n’est plus valide lorsque l’hypothèse de normalité n’est pas vérifiée. Il faut alors penser à des tests non paramétriques (Kruskal–Wallis, Wilcoxon, Mann-Whitney). L’exemple ci-dessous illustre la mise en place de l’ANOVA sous SAS.

PROC ANOVA DATA = MYTABLE;

CLASS GROUPVAR;

MODEL DEPVAR = GROUPVAR;

MEANS GROUPVAR / BON /* ou encore hovtest welch */;

RUN;

QUIT;

GROUPVAR est la variable qui représente les groupes d’analyse tandis que DEPVAR est la variable de résultat qu’on souhaite comparer. L’estimation est réalisée en utilisant l’instruction MODEL. On peut aussi ajouter des options supplémentaires par exemple MEANS qui propose une estimation des moyennes selon différentes méthodes d’ajustement.

L’exemple présenté ci-dessus est appelé ANOVA à un seul facteur.

Une ANOVA à deux facteurs est une ANOVA où il y a deux variables expérimentales ou deux facteurs. Par exemple, pour estimer une ANOVA à deux facteurs on fait : PROC ANOVA DATA = MYTABLE;

CLASS GROUPVAR1 GROUPVAR2;

MODEL DEPVAR = GROUPVAR1 GROUPVAR2;

RUN;

Il ne faut pas oublier qu’à partir du moment où le modèle contient deux variables explicatives, on peut examiner les effets d’interaction entre ces variables. Par exemple, on peut faire:

PROC ANOVA DATA = MYTABLE;

CLASS GROUPVAR1 GROUPVAR2;

MODEL DEPVAR = GROUPVAR1 GROUPVAR2 GROUPVAR1*GROUPVAR2;

RUN;

QUIT;

Lorsque cette interaction est significative, elle doit être gardée dans le modèle pour la suite de l’analyse.

IV.1.7.2. MANOVA

Lorsqu’on veut comparer simultanément plusieurs variables de résultats (quantitatives) selon les modalités d’une variable expérimentale (qualitative), on utilise MANOVA. Celle-ci permet de prendre en compte les différentes corrélations qui peuvent exister entre les différentes variables de résultats. Pour mettre en œuvre cette démarche sous SAS, on peut utiliser PROC GLM telle que décrite ci-dessous : PROC GLM DATA= MYTABLE;

CLASS GROUPVAR;

MODEL DEPVAR1 DEPVAR DEPVAR3= GROUPVAR / SS3;

MANOVA H=_ALL_;

RUN;

Tout comme pour l’ANOVA à deux facteurs, on peut aussi avoir une MANOVA à deux facteurs. Ces facteurs doivent alors déclarés dans l’instruction CLASS avant de les inclure dans l’instruction MODEL. On peut aussi penser à créer des interactions entre les facteurs. Exemple :

PROC GLM DATA= MYTABLE;

CLASS GROUPVAR1 GROUPVAR2 ;

MODEL DEPVAR1 DEPVAR DEPVAR3= GROUPVAR1 GROUPVAR2 GROUPVAR1*GROUPVAR2 / SS3;

MANOVA H=_ALL_;

RUN;

IV.1.7.3 ANCOVA

Une ANCOVA est une ANOVA en prenant en compte l’effet d’autres variables quantitatives. Il s’agit alors de comparer la moyenne de la variable de résultat selon

les modalité de la variable d’expérience après avoir contrôlé l’effet d’autres caractéristiques de nature quantitative. L’exemple ci-dessous illustre l’estimation d’une ANCOVA sous SAS :

PROC GLM DATA=MYTABLE;

CLASS GROUPVAR;

MODEL DEPVAR = GROUPVAR INDEPVAR1 INDEPVAR2 … / SOLUTION;

RUN; QUIT;

Tout comme dans les précédents cas, on peut aussi avoir une ANCOVA à deux ou plusieurs facteurs. Il suffit alors de les indiquer dans l’instruction CLASS avant de les spécifier dans l’instruction MODEL. De plus, il faut penser à créer des effets d’interaction en ajoutant des termes multiplicatifs.

IV.1.7.4 MANCOVA

Une MANCOVA est une ANCOVA réalisée sur plusieurs variables de résultat pris simultanément afin de contrôler d’éventuelles corrélations. Son estimation sous SAS se présente comme suit :

PROC GLM DATA=MYTABLE;

CLASS GROUPVAR;

MODEL DEPVAR1 DEPVAR2 DEPVAR3 = GROUPVAR INDEPVAR1 INDEPVAR2 … / SOLUTION;

RUN; QUIT;

On peut aussi avoir une MANCOVA à deux ou plusieurs facteurs. Dans ce cas il faut les indiquer dans l’instruction CLASS avant de les spécifier dans l’instruction MODEL.

Penser aussi à créer des effets d’interaction en ajoutant des termes multiplicatifs pour observer leur significativité.