Hypothèse nulle
Qu’est-ce qu’une hypothèse nulle?
Une hypothèse nulle est un type d’hypothèse utilisé dans les statistiques qui propose qu’il n’y a pas de différence entre certaines caractéristiques d’une population (ou processus de génération de données).
Par exemple, un joueur peut être intéressé à savoir si un jeu de hasard est équitable. Si c’est juste, alors les gains attendus par jeu s’élèvent à 0 pour les deux joueurs. Si le jeu n’est pas juste, les gains attendus sont positifs pour un joueur et négatifs pour l’autre. Pour tester si le jeu est juste, le joueur recueille des données de gains à partir de nombreuses répétitions du jeu, calcule les gains moyens à partir de ces données, puis teste l’hypothèse nulle que les gains attendus ne sont pas différents de zéro.
Si les gains moyens des données de l’échantillon sont suffisamment éloignés de zéro, alors le joueur rejettera l’hypothèse nulle et conclura l’hypothèse alternative, à savoir que les gains attendus par jeu sont différents de zéro. Si les gains moyens des données de l’ échantillon sont proches de zéro, le joueur ne rejettera pas l’hypothèse nulle, concluant à la place que la différence entre la moyenne des données et 0 est explicable par le hasard seul.
Points clés à retenir
- Une hypothèse nulle est un type de conjecture utilisée dans les statistiques qui propose qu’il n’y a pas de différence entre certaines caractéristiques d’une population ou d’un processus de génération de données.
- L’hypothèse alternative propose qu’il y ait une différence.
- Le test d’hypothèse fournit une méthode pour rejeter une hypothèse nulle dans un certain niveau de confiance. (Les hypothèses nulles ne peuvent cependant pas être prouvées.)
Comment fonctionne une hypothèse nulle
L’hypothèse nulle, également connue sous le nom de conjecture, suppose que tout type de différence entre les caractéristiques choisies que vous voyez dans un ensemble de données est dû au hasard. Par exemple, si les gains attendus pour le jeu de hasard sont vraiment égaux à 0, alors toute différence entre les gains moyens dans les données et 0 est due au hasard.
Les hypothèses statistiques sont testées à l’aide d’un processus en quatre étapes. La première étape consiste pour l’analyste à énoncer les deux hypothèses afin qu’une seule puisse avoir raison. L’étape suivante consiste à formuler un plan d’analyse, qui décrit comment les données seront évaluées. La troisième étape consiste à exécuter le plan et à analyser physiquement les données de l’échantillon. La quatrième et dernière étape consiste à analyser les résultats et soit rejeter l’hypothèse nulle, soit affirmer que les différences observées sont explicables par le hasard seul.
Les analystes cherchent à rejeter l’hypothèse nulle car cela est une conclusion solide. Cela nécessite des preuves solides sous la forme d’une différence observée qui est trop importante pour être expliquée uniquement par hasard. Le fait de ne pas rejeter l’hypothèse nulle – que les résultats sont explicables par le hasard seul – est une conclusion faible car elle permet que des facteurs autres que le hasard puissent être à l’œuvre mais peuvent ne pas être suffisamment forts pour être détectables par le test statistique utilisé.
Important
Les analystes cherchent à rejeter l’hypothèse nulle pour exclure le hasard seul comme une explication des phénomènes d’intérêt.
Exemples d’hypothèse nulle
Voici un exemple simple. Un directeur d’école affirme que les élèves de son école obtiennent en moyenne 7 sur 10 aux examens. L’hypothèse nulle est que la moyenne de la population est de 7,0. Pour tester cette hypothèse nulle, nous enregistrons les notes de, disons, 30 élèves (échantillon) de l’ensemble de la population étudiante de l’école (disons 300) et calculons la moyenne de cet échantillon. Nous pouvons alors comparer la moyenne de l’échantillon (calculée) à la moyenne de population (hypothétique) de 7,0 et tenter de rejeter l’hypothèse nulle. (L’hypothèse nulle ici – que la moyenne de la population est de 7,0 – ne peut pas être prouvée à l’aide des données de l’échantillon; elle ne peut être que rejetée.)
Prenons un autre exemple: le rendement annuel d’un fonds commun de placement donné serait de 8%. Supposons qu’un fonds commun de placement existe depuis 20 ans. L’hypothèse nulle est que le rendement moyen est de 8% pour le fonds commun de placement. Nous prenons un échantillon aléatoire des rendements annuels du fonds commun de placement pendant, disons, cinq ans (échantillon) et calculons la moyenne de l’échantillon. Nous comparons ensuite la moyenne de l’échantillon (calculée) à la moyenne de la population (revendiquée) (8%) pour tester l’hypothèse nulle.
Pour les exemples ci-dessus, les hypothèses nulles sont:
- Exemple A: Les élèves de l’école obtiennent en moyenne 7 sur 10 aux examens.
- Exemple B: Le rendement annuel moyen du fonds commun de placement est de 8% par an.
Pour déterminer s’il faut rejeter l’hypothèse nulle, l’hypothèse nulle (abrégée H 0 ) est supposée, pour des raisons d’argumentation, vraie. Ensuite, la plage probable des valeurs possibles de la statistique calculée (par exemple, le score moyen aux tests de 30 élèves) est déterminée sous cette présomption (par exemple, la plage des moyennes plausibles pourrait varier de 6,2 à 7,8 si la moyenne de la population est de 7,0). Ensuite, si la moyenne de l’échantillon est en dehors de cette plage, l’hypothèse nulle est rejetée. Sinon, on dit que la différence est «explicable par le hasard seul», étant dans la fourchette qui est déterminée par le hasard seul.
Un point important à noter est que nous testons l’hypothèse nulle car il y a un élément de doute sur sa validité. Toutes les informations qui sont contre l’hypothèse nulle énoncée sont capturées dans l’hypothèse alternative (H 1 ). Pour les exemples ci-dessus, l’hypothèse alternative serait:
- Les élèves obtiennent une moyenne qui n’est pas égale à 7.
- Le rendement annuel moyen du fonds commun de placement n’est pas égal à 8% par an.
En d’autres termes, l’hypothèse alternative est une contradiction directe de l’hypothèse nulle.
Test d’hypothèse pour les investissements
À titre d’exemple lié aux marchés financiers, supposons qu’Alice voit que sa stratégie d’investissement produit des rendements moyens plus élevés que le simple achat et la détention d’ actions. L’hypothèse nulle stipule qu’il n’y a pas de différence entre les deux rendements moyens, et Alice est encline à le croire jusqu’à ce qu’elle prouve le contraire. Pour réfuter l’hypothèse nulle, il faudrait montrer la signification statistique, qui peut être trouvée à l’aide de divers tests. L’hypothèse alternative indiquerait que la stratégie d’investissement a un rendement moyen plus élevé qu’une stratégie d’achat et de conservation traditionnelle.
Un outil qui peut être utilisé pour déterminer la signification statistique des résultats est la valeur p. Une valeur p représente la probabilité qu’une différence aussi grande ou plus grande que la différence observée entre les deux rendements moyens puisse se produire uniquement par hasard.
Une valeur p inférieure ou égale à 0,05 est souvent utilisée pour indiquer s’il existe des preuves contre l’hypothèse nulle. Si Alice effectue l’un de ces tests, comme un test utilisant le modèle normal, et prouve que la différence entre ses rendements et les rendements d’achat et de conservation est significative (la valeur p est inférieure ou égale à 0,05), elle peut alors rejeter l’hypothèse nulle et conclure l’hypothèse alternative.