Quartile
Qu’est-ce qu’un quartile?
Un quartile est un terme statistique qui décrit une division des observations en quatre intervalles définis en fonction des valeurs des données et de la manière dont elles se comparent à l’ensemble des observations.
Comprendre les quartiles
Pour comprendre le quartile, il est important de comprendre la médiane comme une mesure de la tendance centrale. La médiane des statistiques est la valeur médiane d’un ensemble de nombres. C’est le point auquel exactement la moitié des données se situe en dessous et au-dessus de la valeur centrale.
Donc, étant donné un ensemble de 13 nombres, la médiane serait le septième nombre. Les six nombres précédant cette valeur sont les nombres les plus bas dans les données, et les six nombres après la médiane sont les nombres les plus élevés dans l’ensemble de données donné. Étant donné que la médiane n’est pas affectée par les valeurs extrêmes ou les valeurs aberrantes de la distribution, elle est parfois préférée à la moyenne.
La médiane est un estimateur robuste de l’emplacement, mais ne dit rien sur la façon dont les données de chaque côté de sa valeur sont réparties ou dispersées. C’est là que le quartile intervient. Le quartile mesure la dispersion des valeurs au-dessus et au-dessous de la moyenne en divisant la distribution en quatre groupes.
Points clés à retenir
- Le quartile mesure la dispersion des valeurs au-dessus et au-dessous de la moyenne en divisant la distribution en quatre groupes.
- Un quartile divise les données en trois points (un quartile inférieur, médian et supérieur) pour former quatre groupes de l’ensemble de données.
- Les quartiles sont utilisés pour calculer l’intervalle interquartile, qui est une mesure de la variabilité autour de la médiane.
Comment fonctionnent les quartiles
Tout comme la médiane divise les données en deux de sorte que 50% de la mesure se trouve en dessous de la médiane et 50% au-dessus, le quartile décompose les données en quarts de sorte que 25% des mesures sont inférieures au quartile inférieur, 50 % sont inférieurs à la médiane et 75% sont inférieurs au quartile supérieur.
Un quartile divise les données en trois points (un quartile inférieur, médian et supérieur) pour former quatre groupes de l’ensemble de données. Le quartile inférieur, ou premier quartile, est désigné par Q1 et est le nombre du milieu qui se situe entre la plus petite valeur de l’ensemble de données et la médiane. Le deuxième quartile, Q2, est également la médiane. Le quartile supérieur ou troisième, noté Q3, est le point central qui se situe entre la médiane et le nombre le plus élevé de la distribution.
Maintenant, nous pouvons cartographier les quatre groupes formés à partir des quartiles. Le premier groupe de valeurs contient le plus petit nombre jusqu’à Q1; le deuxième groupe comprend Q1 à la médiane; le troisième ensemble est la médiane de Q3; la quatrième catégorie comprend Q3 jusqu’au point de données le plus élevé de l’ensemble entier.
Chaque quartile contient 25% du total des observations. En règle générale, les données sont classées du plus petit au plus grand:
- Premier quartile: les 25% les plus bas des nombres
- Deuxième quartile : entre 25,1% et 50% (jusqu’à la médiane)
- Troisième quartile: 50,1% à 75% (au-dessus de la médiane)
- Quatrième quartile: les 25% les plus élevés des nombres
Exemple de quartile
Supposons que la distribution des scores en mathématiques dans une classe de 19 élèves par ordre croissant soit:
59, 60, 65, 65, 68, 69, 70, 72, 75, 75, 76, 77, 81, 82, 84, 87, 90, 95, 98
Tout d’abord, notez la médiane, Q2, qui dans ce cas est la 10 e valeur: 75.
Q1 est le point central entre le plus petit score et la médiane. Dans ce cas, Q1 se situe entre le premier et le cinquième score: 68. [Notez que la médiane peut également être incluse lors du calcul de Q1 ou Q3 pour un ensemble impair de valeurs. Si nous devions inclure la médiane de chaque côté du point milieu, puis Q1 sera la valeur moyenne entre la première et 10 e partition, ce qui correspond à la moyenne de la cinquième et sixième Score- (cinquième + sixième) / 2 = ( 68 + 69) / 2 = 68,5].
Q3 est la valeur médiane entre Q2 et le score le plus élevé: 84. [Ou si vous incluez la médiane, Q3 = (82 + 84) / 2 = 83].
Maintenant que nous avons nos quartiles, interprétons leurs nombres. Un score de 68 (Q1) représente le premier quartile et le 25 e centile. 68 est la médiane de la moitié inférieure du score établi dans les données disponibles, c’est-à-dire la médiane des scores de 59 à 75.
Q1 nous dit que 25% des scores sont inférieurs à 68 et 75% des scores de classe sont supérieurs. Q2 (la médiane) est le 50 e centile et montre que 50% des scores sont inférieurs à 75, et 50% des scores sont supérieurs à 75. Enfin, Q3, le 75 e centile, révèle que 25% des scores sont supérieur et 75% sont inférieurs à 84.
Considérations particulières
Si le point de données pour Q1 est plus éloigné de la médiane que Q3 ne l’est de la médiane, alors nous pouvons dire qu’il y a une plus grande dispersion entre les plus petites valeurs de l’ensemble de données que parmi les plus grandes valeurs. La même logique s’applique si Q3 est plus éloigné de Q2 que Q1 ne l’est de la médiane.
Sinon, s’il y a un nombre pair de points de données, la médiane sera la moyenne des deux nombres du milieu. Dans notre exemple ci-dessus, si nous avions 20 élèves au lieu de 19, la médiane de leurs scores sera la moyenne arithmétique des 10 e et 11 e nombres.
Les quartiles sont utilisés pour calculer l’intervalle interquartile, qui est une mesure de la variabilité autour de la médiane. L’intervalle interquartile est simplement calculé comme la différence entre le premier et le troisième quartile: Q3 – Q1. En effet, c’est la plage de la moitié médiane des données qui montre à quel point les données sont réparties.
Pour les grands ensembles de données, Microsoft Excel dispose d’une fonction QUARTILE pour calculer les quartiles.