Intervalle de confiance
Qu’est-ce qu’un intervalle de confiance?
Un intervalle de confiance, en statistique, fait référence à la probabilité qu’un paramètre de population se situe entre un ensemble de valeurs pendant une certaine proportion de fois. Les intervalles de confiance mesurent le degré d’incertitude ou de certitude d’une méthode d’ échantillonnage. Ils peuvent prendre n’importe quel nombre de limites de probabilité, la plus courante étant un niveau de confiance de 95% ou 99%.
Les intervalles de confiance sont effectués à l’aide de méthodes statistiques, comme un test t.
Points clés à retenir
- Un intervalle de confiance affiche la probabilité qu’un paramètre se situe entre une paire de valeurs autour de la moyenne.
- Les intervalles de confiance mesurent le degré d’incertitude ou de certitude d’une méthode d’échantillonnage.
- Ils sont le plus souvent construits en utilisant des niveaux de confiance de 95% ou 99%.
Comprendre un intervalle de confiance
Les statisticiens utilisent des intervalles de confiance pour mesurer l’incertitude d’une variable d’échantillon. Par exemple, un chercheur sélectionne différents échantillons au hasard dans la même population et calcule un intervalle de confiance pour chaque échantillon pour voir comment il peut représenter la vraie valeur de la variable de population. Les ensembles de données résultants sont tous différents; certains intervalles incluent le vrai paramètre de population et d’autres non.
Un intervalle de confiance est une plage de valeurs, délimitées au-dessus et au-dessous de la moyenne de la statistique, qui contiendrait probablement un paramètre de population inconnu. Le niveau de confiance fait référence au pourcentage de probabilité, ou de certitude, que l’intervalle de confiance contiendrait le vrai paramètre de population lorsque vous tirez plusieurs fois un échantillon aléatoire. Ou, dans la langue vernaculaire, «nous sommes sûrs à 99% ( niveau de confiance) que la plupart de ces échantillons (intervalles de confiance) contiennent le vrai paramètre de population».
L’ intervalle de confiance et le niveau de confiance sont interdépendants mais ne sont pas exactement les mêmes.
Calcul d’un intervalle de confiance
Supposons qu’un groupe de chercheurs étudie les hauteurs des basketteurs du secondaire. Les chercheurs prélèvent un échantillon aléatoire de la population et établissent une hauteur moyenne de 74 pouces.
La moyenne de 74 pouces est une estimation ponctuelle de la moyenne de la population. Une estimation ponctuelle en elle-même est d’une utilité limitée car elle ne révèle pas l’incertitude associée à l’estimation; vous n’avez pas une bonne idée de la distance entre cette moyenne d’échantillon de 74 pouces et la moyenne de la population. Ce qui manque, c’est le degré d’incertitude de cet échantillon unique.
Les intervalles de confiance fournissent plus d’informations que les estimations ponctuelles. En établissant un intervalle de confiance de 95% en utilisant la moyenne et l’ écart type de l’échantillon, et en supposant une distribution normale représentée par la courbe en cloche, les chercheurs arrivent à une limite supérieure et inférieure qui contient la vraie moyenne 95% du temps.
Supposons que l’intervalle soit compris entre 72 pouces et 76 pouces. Si les chercheurs prélèvent 100 échantillons aléatoires de la population de basketteurs du secondaire dans son ensemble, la moyenne devrait se situer entre 72 et 76 pouces dans 95 de ces échantillons.
Exemples d’intervalle de confiance
Si les chercheurs veulent une confiance encore plus grande, ils peuvent étendre l’intervalle à 99% de confiance. Cela crée invariablement une gamme plus large, car cela laisse de la place à un plus grand nombre de moyens d’échantillonnage. S’ils établissent que l’intervalle de confiance de 99% est compris entre 70 pouces et 78 pouces, ils peuvent s’attendre à ce que 99 des 100 échantillons évalués contiennent une valeur moyenne entre ces nombres.
Un niveau de confiance de 90%, par contre, implique que nous nous attendrions à ce que 90% des estimations d’intervalle incluent le paramètre de population, et ainsi de suite.
Considérations particulières
La plus grande idée fausse concernant les intervalles de confiance est qu’ils représentent le pourcentage de données d’un échantillon donné qui se situe entre les limites supérieure et inférieure.
Par exemple, on pourrait interpréter à tort l’intervalle de confiance de 99% susmentionné de 70 à 78 pouces comme indiquant que 99% des données d’un échantillon aléatoire se situent entre ces nombres. Ceci est incorrect, bien qu’une méthode distincte d’analyse statistique existe pour effectuer une telle détermination. Pour ce faire, il faut identifier la moyenne et l’écart type de l’échantillon et tracer ces chiffres sur une courbe en cloche.