Tests d’hypothèses
Qu’est-ce que le test d’hypothèse?
Le test d’hypothèse est un acte statistique par lequel un analyste teste une hypothèse concernant un paramètre de population. La méthodologie employée par l’analyste dépend de la nature des données utilisées et de la raison de l’analyse.
Le test d’hypothèse est utilisé pour évaluer la plausibilité d’une hypothèse à l’aide d’échantillons de données. Ces données peuvent provenir d’une population plus large ou d’un processus de génération de données. Le mot «population» sera utilisé pour ces deux cas dans les descriptions suivantes.
Points clés à retenir
- Le test d’hypothèse est utilisé pour évaluer la plausibilité d’une hypothèse à l’aide d’échantillons de données.
- Le test fournit des preuves concernant la plausibilité de l’hypothèse, compte tenu des données.
- Les analystes statistiques testent une hypothèse en mesurant et en examinant un échantillon aléatoire de la population analysée.
Comment fonctionne le test d’hypothèse
Dans le test d’hypothèse, un analyste teste un échantillon statistique, dans le but de fournir des preuves sur la plausibilité de l’hypothèse nulle.
Les analystes statistiques testent une hypothèse en mesurant et en examinant un échantillon aléatoire de la population analysée. Tous les analystes utilisent un échantillon de population aléatoire pour tester deux hypothèses différentes: l’ hypothèse nulle et l’hypothèse alternative.
L’hypothèse nulle est généralement une hypothèse d’égalité entre les paramètres de population; Par exemple, une hypothèse nulle peut affirmer que le rendement moyen de la population est égal à zéro. L’hypothèse alternative est en fait l’opposé d’une hypothèse nulle (par exemple, le rendement moyen de la population n’est pas égal à zéro). Ainsi, ils sont mutuellement exclusifs, et un seul peut être vrai. Cependant, l’une des deux hypothèses sera toujours vraie.
4 étapes de test d’hypothèse
Toutes les hypothèses sont testées selon un processus en quatre étapes:
- La première étape consiste pour l’analyste à énoncer les deux hypothèses afin qu’une seule puisse avoir raison.
- L’étape suivante consiste à formuler un plan d’analyse, qui décrit comment les données seront évaluées.
- La troisième étape consiste à exécuter le plan et à analyser physiquement les données de l’échantillon.
- La quatrième et dernière étape consiste à analyser les résultats et soit rejeter l’hypothèse nulle, soit déclarer que l’hypothèse nulle est plausible, compte tenu des données.
Exemple réel de test d’hypothèse
Si, par exemple, une personne veut tester qu’un sou a exactement 50% de chances d’atterrir sur la tête, l’hypothèse nulle serait que 50% est correct, et l’hypothèse alternative serait que 50% n’est pas correcte.
Mathématiquement, l’hypothèse nulle serait représentée par Ho: P = 0,5. L’hypothèse alternative serait notée « Ha » et serait identique à l’hypothèse nulle, sauf avec le signe égal barré, ce qui signifie qu’il n’est pas égal à 50%.
Un échantillon aléatoire de 100 jetons de pièces est prélevé, et l’hypothèse nulle est ensuite testée. S’il s’avère que les 100 lancers de pièces ont été distribués en 40 têtes et 60 queues, l’analyste supposerait qu’un sou n’a pas 50% de chances d’atterrir sur des têtes et rejetterait l’hypothèse nulle et accepterait l’hypothèse alternative.
Si, en revanche, il y avait 48 têtes et 52 queues, alors il est plausible que la pièce puisse être juste et produire encore un tel résultat. Dans des cas comme celui-ci où l’hypothèse nulle est «acceptée», l’analyste déclare que la différence entre les résultats attendus (50 têtes et 50 queues) et les résultats observés (48 têtes et 52 queues) est «explicable par le hasard seul».