Définition statistique du chi carré (χ2)
Qu’est-ce qu’une statistique du chi carré?
Une statistique du chi carré ( χ 2 ) est un test qui mesure la façon dont un modèle se compare aux données réelles observées. Les données utilisées pour calculer une statistique du chi carré doivent être aléatoires, brutes, mutuellement exclusives, tirées de variables indépendantes et tirées d’un échantillon suffisamment grand. Par exemple, les résultats de lancer une pièce équitable répondent à ces critères.
Les tests du chi carré sont souvent utilisés dans les tests d’hypothèse. La statistique du chi carré compare la taille des écarts entre les résultats attendus et les résultats réels, compte tenu de la taille de l’échantillon et du nombre de variables dans la relation. Pour ces tests, des degrés de liberté sont utilisés pour déterminer si une certaine hypothèse nulle peut être rejetée en fonction du nombre total de variables et d’échantillons dans l’expérience. Comme pour toute statistique, plus la taille de l’échantillon est grande, plus les résultats sont fiables.
Points clés à retenir
- Une statistique du chi carré ( χ 2 ) est une mesure de la différence entre les fréquences observées et attendues des résultats d’un ensemble d’événements ou de variables.
- χ 2 dépend de la taille de la différence entre les valeurs réelles et observées, les degrés de liberté et la taille des échantillons.
- χ 2 peut être utilisé pour tester si deux variables sont liées ou indépendantes l’une de l’autre ou pour tester la qualité d’ajustement entre une distribution observée et une distribution théorique de fréquences.
La formule du chi carré est
Que vous dit une statistique du chi carré?
Il existe deux types principaux de tests du chi carré: le test d’indépendance, qui pose une question de relation, telle que «Y a-t-il une relation entre le sexe de l’élève et le choix du cours? et le test de qualité d’ajustement, qui demande quelque chose comme « Dans quelle mesure la pièce dans ma main correspond-elle à une pièce théoriquement juste? »
Indépendance
Lors de l’examen du sexe de l’élève et du choix du cours, un test χ 2 d’indépendance pourrait être utilisé. Pour faire ce test, le chercheur recueillerait des données sur les deux variables choisies (sexe et cours choisis) puis comparait les fréquences auxquelles les étudiants et étudiantes choisissaient parmi les classes proposées en utilisant la formule donnée ci-dessus et un tableau statistique χ 2.
S’il n’y a pas de relation entre le sexe et le choix des cours (c’est-à-dire s’ils sont indépendants), alors les fréquences réelles auxquelles les étudiants et étudiantes choisissent chaque cours offert devraient être approximativement égales, ou inversement, la proportion d’hommes et de femmes. les étudiantes de tout cours sélectionné devraient être à peu près égales à la proportion d’étudiants et d’étudiants de sexe féminin dans l’échantillon. Un test d’indépendance χ 2 peut nous dire dans quelle mesure il est probable que le hasard puisse expliquer toute différence observée entre les fréquences réelles dans les données et ces attentes théoriques.
Qualité de l’ajustement
χ 2 fournit un moyen de tester dans quelle mesure un échantillon de données correspond aux caractéristiques (connues ou supposées) de la population plus large que l’échantillon est censé représenter. Si les données de l’échantillon ne correspondent pas aux propriétés attendues de la population qui nous intéresse, nous ne voudrions pas utiliser cet échantillon pour tirer des conclusions sur l’ensemble de la population.
Par exemple, considérez une pièce imaginaire avec exactement 50/50 de chances d’atterrir face ou face et une vraie pièce que vous lancez 100 fois. Si cette vraie pièce a un est juste, alors elle aura également une probabilité égale d’atterrir de chaque côté, et le résultat attendu de lancer la pièce 100 fois est que les têtes remonteront 50 fois et les queues 50 fois. Dans ce cas, χ 2 peut nous dire dans quelle mesure les résultats réels de 100 lancers de pièces se comparent au modèle théorique selon lequel une pièce équitable donnera des résultats 50/50. Le tirage au sort réel pourrait monter 50/50, ou 60/40, ou même 90/10. Plus les résultats réels des 100 lancers sont éloignés de 50/50, moins l’ajustement de cet ensemble de lancers est bon par rapport à l’attente théorique de 50/50 et plus nous pourrions conclure que cette pièce n’est pas réellement une juste pièce de monnaie.