Valeur P
Qu’est-ce que la valeur P?
En statistique, la valeur p est la probabilité d’obtenir des résultats au moins aussi extrêmes que les résultats observés d’un test d’hypothèse statistique , en supposant que l’hypothèse nulle est correcte. La valeur p est utilisée comme alternative aux points de rejet pour fournir le plus petit niveau de signification auquel l’ hypothèse nulle serait rejetée. Une valeur p plus petite signifie qu’il existe des preuves plus solides en faveur de l’hypothèse alternative.
Points clés à retenir
- Une valeur p est une mesure de la probabilité qu’une différence observée ait pu se produire simplement par hasard.
- Plus la valeur p est faible, plus la signification statistique de la différence observée est grande.
- La valeur p peut être utilisée comme alternative ou en plus des niveaux de confiance présélectionnés pour le test d’hypothèse.
Comment la valeur P est-elle calculée?
Les valeurs p sont généralement trouvées à l’aide de tableaux de valeurs p ou de feuilles de calcul / logiciels statistiques. Ces calculs sont basés sur la distribution de probabilité supposée ou connue de la statistique spécifique testée. Les valeurs p sont calculées à partir de l’écart entre la valeur observée et une valeur de référence choisie, compte tenu de la distribution de probabilité de la statistique, avec une plus grande différence entre les deux valeurs correspondant à une valeur p inférieure.
Mathématiquement, la valeur p est calculée à l’aide du calcul intégral de la zone sous la courbe de distribution de probabilité pour toutes les valeurs de statistiques qui sont au moins aussi éloignées de la valeur de référence que la valeur observée, par rapport à la surface totale sous la courbe de distribution de probabilité.. En un mot, plus la différence entre deux valeurs observées est grande, moins il est probable que la différence soit due à un simple hasard aléatoire, ce qui se traduit par une valeur p inférieure.
Approche de la valeur P pour les tests d’hypothèses
L’approche de la valeur p pour le test d’hypothèse utilise la probabilité calculée pour déterminer s’il existe des preuves pour rejeter l’hypothèse nulle. L’hypothèse nulle, également connue sous le nom de conjecture, est l’affirmation initiale concernant une population (ou un processus de génération de données). L’hypothèse alternative indique si le paramètre de population diffère de la valeur du paramètre de population énoncée dans la conjecture.
En pratique, le niveau de signification est indiqué à l’avance pour déterminer la petite valeur de p pour rejeter l’hypothèse nulle. Étant donné que différents chercheurs utilisent différents niveaux de signification lors de l’examen d’une question, un lecteur peut parfois avoir des difficultés à comparer les résultats de deux tests différents. Les valeurs P fournissent une solution à ce problème.
Par exemple, supposons qu’une étude comparant les rendements de deux actifs particuliers ait été entreprise par différents chercheurs qui ont utilisé les mêmes données mais des niveaux de signification différents. Les chercheurs pourraient arriver à des conclusions opposées quant à savoir si les actifs diffèrent. Si un chercheur utilisait un niveau de confiance de 90% et l’autre exigeait un niveau de confiance de 95% pour rejeter l’hypothèse nulle et que la valeur p de la différence observée entre les deux retours était de 0,08 (correspondant à un niveau de confiance de 92%), alors le premier chercheur trouverait que les deux actifs ont une différence statistiquement significative, tandis que le second ne trouverait aucune différence statistiquement significative entre les rendements.
Pour éviter ce problème, les chercheurs pourraient rapporter la valeur p du test d’hypothèse et permettre au lecteur d’interpréter lui-même la signification statistique . C’est ce qu’on appelle une approche de la valeur p du test d’hypothèse. Un observateur indépendant pourrait noter la valeur p et décider par lui-même si cela représente une différence statistiquement significative ou non.
Exemple réel de valeur P
Supposons qu’un investisseur affirme que la performance de son portefeuille d’investissement est équivalente à celle de l’indice Standard & Poor’s (S&P) 500. Pour le déterminer, l’investisseur effectue un test bilatéral. L’hypothèse nulle stipule que les rendements du portefeuille sont équivalents aux rendements du S&P 500 sur une période spécifiée, tandis que l’hypothèse alternative indique que les rendements du portefeuille et les rendements du S&P 500 ne sont pas équivalents. (Si l’investisseur effectuait un test unilatéral, l’hypothèse alternative indiquerait que les rendements du portefeuille sont inférieurs ou supérieurs aux rendements du S&P 500.)
Le test d’hypothèse de la valeur P n’utilise pas nécessairement un niveau de confiance présélectionné auquel l’investisseur devrait réinitialiser l’hypothèse nulle selon laquelle les rendements sont équivalents. Au lieu de cela, il fournit une mesure de la quantité de preuves disponibles pour rejeter l’hypothèse nulle. Plus la valeur p est petite, plus la preuve contre l’hypothèse nulle est grande. Ainsi, si l’investisseur constate que la valeur p est de 0,001, il existe des preuves solides contre l’hypothèse nulle, et l’investisseur peut conclure avec confiance que les rendements du portefeuille et les rendements du S&P 500 ne sont pas équivalents.
Bien que cela ne fournisse pas de seuil exact quant au moment où l’investisseur devrait accepter ou rejeter l’hypothèse nulle, cela présente un autre avantage très pratique. Le test d’hypothèse de la valeur P offre un moyen direct de comparer la confiance relative que l’investisseur peut avoir lorsqu’il choisit parmi plusieurs types d’investissements ou de portefeuilles différents, par rapport à un indice de référence tel que le S&P 500.
Par exemple, pour deux portefeuilles, A et B, dont la performance diffère de celle du S&P 500 avec des valeurs p de 0,10 et 0,01 respectivement, l’investisseur peut être beaucoup plus confiant que le portefeuille B, avec une valeur p inférieure, affichera en fait une différence constante. résultats.