Test de Wilcoxon
Qu’est-ce que le test Wilcoxon?
Le test de Wilcoxon, qui peut faire référence au test Rank Sum ou à la version du test Signed Rank, est un test statistique non paramétrique qui compare deux groupes appariés. Les tests calculent essentiellement la différence entre les ensembles de paires et analysent ces différences pour déterminer si elles sont statistiquement significativement différentes les unes des autres.
Points clés à retenir
- Le test de Wilcoxon est un test statistique non paramétrique qui compare deux groupes appariés et se décline en deux versions: le test Rank Sum ou le test Signed Rank.
- Le but du test est de déterminer si deux ou plusieurs ensembles de paires sont différents les uns des autres d’une manière statistiquement significative.
- Les deux versions du modèle supposent que les paires dans les données proviennent de populations dépendantes, c’est-à-dire suivant la même personne ou le même prix de l’action à travers le temps ou le lieu.
Les bases du test de Wilcoxon
Les tests Somme Rang et signé Rang ont tous deux été proposés par statisticien américain Frank Wilcoxon dans un document de recherche révolutionnaire publiée en 1945. Les essais ont jeté les bases pour les tests d’hypothèses de statistiques non paramétriques, qui sont utilisées pour les données de population qui peuvent être classés mais n’ont pas des valeurs numériques, telles que la satisfaction des clients ou les critiques de musique. Les distributions non paramétriques n’ont pas de paramètres et ne peuvent pas être définies par une équation comme le peuvent les distributions paramétriques.
Les types de questions auxquelles le test Wilcoxon peut nous aider à répondre incluent des éléments tels que:
- Les résultats des tests sont-ils différents de la 5e à la 5e année pour les mêmes élèves?
- Un médicament particulier a-t-il un effet sur la santé lorsqu’il est testé sur les mêmes personnes?
Ces modèles supposent que les données proviennent de deux populations appariées ou dépendantes, suivant la même personne ou le même stock à travers le temps ou le lieu. Les données sont également supposées être continues plutôt que discrètes. Puisqu’il s’agit d’un test non paramétrique, il ne nécessite pas de distribution de probabilité particulière de la variable dépendante dans l’analyse.
Versions du test Wilcoxon
- Le test de Wilcoxon Rank Sum peut être utilisé pour tester l’ hypothèse nulle selon laquelle deux populations ont la même distribution continue. Les hypothèses de base nécessaires pour utiliser cette méthode de test sont que les données proviennent de la même population et sont appariées, les données peuvent être mesurées sur au moins une échelle d’intervalle et les données ont été choisies au hasard et indépendamment.
- Le test de Wilcoxon Signed Rank suppose qu’il existe des informations sur l’ampleur et les signes des différences entre les observations appariées. En tant qu’équivalent non paramétrique du test t de l’étudiant apparié, le rang signé peut être utilisé comme alternative au test t lorsque les données de population ne suivent pas une distribution normale.
Calcul d’une statistique de test de Wilcoxon
Les étapes pour arriver à une statistique de test Wilcoxon Signed-Ranks, W, sont les suivantes:
- Pour chaque élément d’un échantillon de n éléments, obtenez un score de différence D i entre deux mesures (c’est-à-dire soustrayez l’une de l’autre).
- Négliger alors les signes positifs ou négatifs et obtenir un ensemble de n différences absolues | D i |.
- Omettez les scores de différence de zéro, ce qui vous donne un ensemble de n scores de différence absolue non nuls, où n ‘≤ n. Ainsi, n ‘ devient la taille réelle de l’échantillon.
- Ensuite, attribuez les rangs R i de 1 à n à chacun des | D i | de telle sorte que le plus petit score de différence absolue obtient le rang 1 et le plus grand obtient le rang n. Si deux ou plus | D i | sont égaux, on leur attribue à chacun le rang moyen des rangs qui leur auraient été attribués individuellement s’il n’y avait pas eu d’égalité dans les données.
- Maintenant, réaffectez le symbole «+» ou «-» à chacun des n rangs R i, selon que Di était à l’origine positif ou négatif.
- La statistique W du test de Wilcoxon est ensuite obtenue comme la somme des rangs positifs.
En pratique, ce test est facilement réalisé à l’aide d’un logiciel d’analyse statistique ou d’un tableur.