Fonctionnement de l'échantillonnage aléatoire stratifié - KamilTaylan.blog
18 avril 2021 15:36

Fonctionnement de l’échantillonnage aléatoire stratifié

L’échantillonnage aléatoire stratifié  est une méthode d’échantillonnage qui consiste à diviser une population en groupes plus petits, appelés strates. Les groupes ou strates sont organisés en fonction des caractéristiques ou attributs partagés des membres du groupe. Le processus de classification de la population en groupes est appelé stratification.

L’échantillonnage aléatoire stratifié est également appelé échantillonnage aléatoire par quota et échantillonnage aléatoire proportionnel. L’échantillonnage aléatoire stratifié présente de nombreuses applications et avantages, tels que l’étude de la démographie de la population et de l’espérance de vie.

Points clés à retenir

  • L’échantillonnage aléatoire stratifié est une méthode d’échantillonnage qui consiste à prélever des échantillons d’une population subdivisée en petits groupes appelés strates.
  • L’échantillonnage aléatoire stratifié consiste à prélever des échantillons aléatoires dans des groupes stratifiés, proportionnellement à la population.
  • L’échantillonnage aléatoire stratifié est une métrique plus précise car c’est une meilleure représentation de la population globale.

Comprendre l’échantillonnage aléatoire stratifié

L’échantillonnage aléatoire stratifié divise une population en sous-groupes. Des échantillons aléatoires sont prélevés dans la même proportion par rapport à la population de chacun des groupes ou strates. Les membres de chaque strate (au singulier pour les strates) formés ont des attributs et des caractéristiques similaires.

L’échantillonnage aléatoire stratifié est une méthode d’échantillonnage, c’est-à-dire lorsqu’un chercheur sélectionne un petit groupe comme taille d’échantillon pour l’étude. Ce sous-ensemble représente la population la plus large. Organiser une population en groupes ayant des caractéristiques similaires permet aux chercheurs d’économiser du temps et de l’argent lorsque la population étudiée est trop importante pour être analysée individuellement. L’échantillonnage aléatoire stratifié permet aux chercheurs d’organiser les groupes en fonction de caractéristiques similaires, moyennant quoi un échantillon aléatoire est ensuite prélevé dans chaque strate ou groupe.

L’échantillonnage aléatoire stratifié peut être utilisé, par exemple, pour étudier le sondage des élections, les personnes qui font des heures supplémentaires, l’espérance de vie, le revenu de différentes populations et le revenu pour différents emplois dans un pays.

Échantillonnage aléatoire stratifié ou simplifié

Un échantillon aléatoire simple est un échantillon d’individus qui existent dans une population où les individus sont choisis au hasard dans la population et placés dans l’échantillon. Cette méthode de sélection aléatoire d’individus cherche à sélectionner une taille d’échantillon qui est une représentation non biaisée de la population. Cependant, un simple échantillon aléatoire n’est pas avantageux lorsque les échantillons de la population varient considérablement.

À l’inverse, l’échantillonnage aléatoire stratifié divise la population en sous-groupes et les organise selon des traits, des caractéristiques et des comportements similaires. En conséquence, l’échantillonnage aléatoire stratifié est plus avantageux lorsque la population varie considérablement car il permet de mieux organiser les échantillons à étudier.

Cependant, un simple échantillon aléatoire est plus avantageux lorsque la population ne peut pas être organisée en sous-groupes parce qu’il y a trop de différences au sein de la population. En outre, les échantillons aléatoires simples sont les meilleurs lorsqu’il y a peu ou pas d’informations sur la population, ce qui empêche la population d’être divisée en sous-ensembles en fonction de caractéristiques ou de traits.

Exemple d’échantillonnage aléatoire stratifié

Une équipe de recherche a décidé de mener une étude pour analyser les moyennes ou GPA des 21 millions d’étudiants aux États-Unis. Les chercheurs décident d’obtenir un échantillon aléatoire de 4 000 étudiants au sein d’une population de 21 millions d’habitants. L’équipe souhaite passer en revue les différentes majeures et les GPA subséquentes pour les étudiants ou les échantillons de participants.

Sur les 4000 participants, la répartition des majors est la suivante:

  • Anglais: 560
  • Sciences: 1135
  • Informatique: 800
  • Ingénierie: 1090
  • Mathématiques: 415

Les chercheurs ont leurs cinq strates issues du processus d’échantillonnage aléatoire stratifié. Ensuite, les chercheurs étudient les données de la population pour déterminer le pourcentage des 21 millions d’étudiants qui se spécialisent dans les sujets de leur échantillon. Les résultats montrent ce qui suit:

  • 12% majeure en anglais
  • 28% majeure en sciences
  • 24% majeure en informatique
  • 21% majeure en ingénierie
  • 15% majeure en mathématiques

L’équipe décide d’employer un échantillon aléatoire stratifié proportionnel dans lequel ils veulent déterminer si les majeures pour les étudiants de l’échantillon représentent la même proportion que la population.

Cependant, les proportions de l’échantillon ne sont pas égales aux pourcentages de la population. Par exemple, 12% de la population étudiante sont des majors anglaises, tandis que 14% des étudiants de l’échantillon sont des majors anglaises (ou 560 majors anglais / 4 000).

En conséquence, les chercheurs décident de rééchantillonner les étudiants pour correspondre au pourcentage de majeures dans la population. Sur les 4000 étudiants de leur échantillon, ils décident de sélectionner au hasard les éléments suivants:

  • 480 majors anglaises (12% de 4000)
  • 1120 majeures scientifiques (28% de 4000)
  • 960 majeures en informatique (24% de 4000)
  • 840 majors d’ingénierie (21% de 4000)
  • 600 majeures mathématiques (15% de 4000)

Les chercheurs disposent désormais d’un échantillon aléatoire stratifié proportionnel d’étudiants et de leurs majeures respectives, qui reflète plus précisément les majors pour l’ensemble de la population étudiante. À partir de là, les chercheurs peuvent analyser les GPA de chaque strate ainsi que leurs caractéristiques pour avoir une meilleure idée de la performance de l’ensemble de la population étudiante.