18 avril 2021 12:51

Signification statistique

Quelle est la signification statistique?

La signification statistique fait référence à l’affirmation selon laquelle un résultat de données générées par des tests ou des expérimentations n’est pas susceptible de se produire au hasard ou par hasard, mais est plutôt susceptible d’être attribuable à une cause spécifique. Avoir une signification statistique est important pour les disciplines universitaires ou les praticiens qui dépendent fortement de l’analyse des données et de la recherche, telles que l’économie, la finance, l’ investissement, la médecine, la physique et la biologie.

La signification statistique peut être considérée comme forte ou faible. Lors de l’analyse d’un ensemble de données et de la réalisation des tests nécessaires pour discerner si une ou plusieurs variables ont un effet sur un résultat, une forte signification statistique permet de confirmer que les résultats sont réels et non dus au hasard ou au hasard. En termes simples, si une valeur p est petite, le résultat est considéré comme plus fiable.

Des problèmes surviennent dans les tests de signification statistique parce que les chercheurs travaillent généralement avec des échantillons de populations plus importantes et non avec les populations elles-mêmes. Par conséquent, les échantillons doivent être représentatifs de la population, de sorte que les données contenues dans l’échantillon ne doivent en aucun cas être biaisées. Dans la plupart des sciences, y compris l’économie, la signification statistique est pertinente si une affirmation peut être faite à un niveau de 95% (ou parfois 99%).

Comprendre la signification statistique

Le calcul de la signification statistique (test de signification) est sujet à un certain degré d’erreur. Le chercheur doit définir à l’avance la probabilité d’une erreur d’échantillonnage, qui existe dans tout test qui n’inclut pas l’ensemble de la population.

La taille de l’échantillon est un élément important de signification statistique dans la mesure où les échantillons plus grands sont moins sujets aux douves. Seuls des échantillons aléatoires et représentatifs doivent être utilisés dans les tests de signification. Le niveau auquel on peut accepter si un événement est statistiquement significatif est appelé niveau de signification.

Les chercheurs utilisent une statistique de test connue sous le nom de valeur p pour déterminer la signification statistique: si la valeur p tombe en dessous du niveau de signification, le résultat est statistiquement significatif. La valeur p est fonction des moyennes et des écarts types des échantillons de données.

La valeur p indique la probabilité sous laquelle le résultat statistique donné s’est produit, en supposant que seul le hasard est responsable du résultat. Si cette probabilité est faible, alors le chercheur peut juger en toute sécurité notre chance en tant que cause. La valeur p doit être inférieure au niveau de signification pour que les résultats soient au moins considérés comme statistiquement significatifs.

L’opposé du niveau de signification, calculé comme 1 moins le niveau de signification, est le niveau de confiance. Il indique le degré de confiance que le résultat statistique ne s’est pas produit par hasard ou par erreur d’échantillonnage. Le niveau de confiance habituel dans de nombreux tests statistiques est de 95%, ce qui conduit à un niveau de signification habituel ou valeur p de 5%.

Points clés à retenir

  • La signification statistique fait référence à l’affirmation selon laquelle un résultat de données générées par des tests ou des expérimentations est susceptible d’être attribuable à une cause spécifique.
  • Si une statistique a une signification élevée, elle est considérée comme plus fiable.
  • Le calcul de la signification statistique est sujet à un certain degré d’erreur.
  • La signification statistique peut être mal interprétée lorsque les chercheurs n’utilisent pas le langage avec prudence pour rendre compte de leurs résultats.
  • Plusieurs types de tests de signification sont utilisés en fonction de la recherche menée

Considérations particulières

La signification statistique n’indique pas toujours une signification pratique, ce qui signifie que les résultats ne peuvent pas être appliqués à des situations commerciales réelles. De plus, la signification statistique peut être mal interprétée lorsque les chercheurs n’utilisent pas le langage avec prudence pour rendre compte de leurs résultats. Parce qu’un résultat est statistiquement significatif, cela n’implique pas qu’il n’est pas  aléatoire, mais simplement que la probabilité qu’il soit aléatoire est considérablement réduite.

Le simple fait que deux séries de données aient une forte corrélation entre elles n’implique pas de causalité. Par exemple, le nombre de films dans lesquels l’acteur Nicolas Cage joue une année donnée est très fortement corrélé au nombre de noyades accidentelles dans les piscines. Mais cette corrélation est fausse car il n’y a pas de prétention causale théorique qui puisse être faite.

Un autre problème qui peut survenir avec la signification statistique est que les données passées et les résultats de ces données, qu’ils soient statistiquement significatifs ou non, peuvent ne pas refléter les conditions actuelles ou futures. En investissant, cela peut se manifester par un modèle de tarification qui s’effondre en période de crise financière, car les corrélations changent et les variables n’interagissent pas comme d’habitude. L’importance statistique peut également aider un investisseur à discerner si un modèle d’évaluation des actifs est meilleur qu’un autre.

Types de tests de signification statistique

Plusieurs types de tests de signification sont utilisés en fonction de la recherche menée. Par exemple, des tests peuvent être utilisés pour un, deux ou plusieurs échantillons de données de différentes tailles pour des moyennes, des variances, des proportions, des données appariées ou non appariées ou des distributions de données différentes.

L’hypothèse nulle

Tous ces facteurs ont ce qu’on appelle des hypothèses nulles, et la signification est souvent le but des tests d’hypothèses en statistique. L’hypothèse nulle la plus courante est que le paramètre en question est égal à zéro (indiquant généralement qu’une variable a un effet nul sur le résultat d’intérêt). Si vous pouvez rejeter l’hypothèse nulle avec une confiance de 95% ou mieux, les chercheurs peuvent invoquer la signification statistique. Des hypothèses nulles peuvent également être testées pour l’égalité (plutôt qu’égale à zéro) d’effet pour deux ou plusieurs traitements alternatifs – par exemple, entre un médicament et un placebo dans un essai clinique.

Le rejet de l’hypothèse nulle, même si un très haut degré de signification statistique ne peut jamais prouver quelque chose, ne peut que renforcer une hypothèse existante. En revanche, le fait de ne pas rejeter une hypothèse nulle est souvent un motif de rejet d’une hypothèse.

Un test de signification statistique partage en grande partie les mêmes mathématiques que celui du calcul d’un intervalle de confiance. Dans des situations courantes, une façon d’interpréter la signification statistique est que l’intervalle de confiance correspondant à 95% ne contient pas la valeur zéro. Même si une variable s’avère statistiquement significative, elle doit toujours avoir un sens dans le monde réel.

De plus, un effet peut être statistiquement significatif mais n’avoir qu’un très faible impact. Par exemple, il peut être très improbable en raison du hasard que les entreprises qui utilisent du papier toilette à deux épaisseurs dans leurs salles de bain aient des employés plus productifs, mais l’amélioration de la productivité absolue de chaque travailleur est susceptible d’être minime.