Goûter
Qu’est-ce qu’un échantillon?
Un échantillon fait référence à une version plus petite et gérable d’un groupe plus large. C’est un sous-ensemble contenant les caractéristiques d’une population plus large. Les échantillons sont utilisés dans les tests statistiques lorsque la taille de la population est trop grande pour que le test comprenne tous les membres ou observations possibles. Un échantillon doit représenter la population dans son ensemble et ne refléter aucun biais en faveur d’un attribut spécifique.
Points clés à retenir
- Un échantillon fait référence à une version plus petite et gérable d’un groupe plus important ou d’un sous-ensemble d’une population plus importante.
- L’utilisation d’échantillons permet aux chercheurs de mener leurs études facilement et en temps opportun.
- Afin d’obtenir un échantillon non biaisé, la sélection doit être aléatoire afin que tous les membres de la population aient une chance égale et probable d’être ajouté au groupe échantillon.
- Dans l’échantillonnage aléatoire simple, chaque entité de la population est identique, tandis que l’échantillonnage aléatoire stratifié divise la population globale en groupes plus petits.
Comprendre les échantillons
Un échantillon est un nombre non biaisé d’observations provenant d’une population. En termes de base, une population est le nombre total d’individus, d’animaux, d’articles, d’observations, de données, etc. d’un sujet donné. Ainsi, l’échantillon, en d’autres termes, est une partie, une partie ou une fraction de l’ensemble du groupe et agit comme un sous-ensemble de la population. Les échantillons sont utilisés dans divers contextes où la recherche est menée. Les scientifiques, les spécialistes du marketing, les agences gouvernementales, les économistes et les groupes de recherche font partie de ceux qui utilisent des échantillons pour leurs études et leurs mesures.
Utiliser des populations entières pour la recherche comporte des défis, c’est pourquoi des échantillons sont utilisés. Les chercheurs peuvent avoir des difficultés à accéder facilement à des populations entières. Et en raison de la nature de certaines études, les chercheurs peuvent avoir des difficultés à obtenir les résultats dont ils ont besoin en temps opportun. C’est pourquoi les personnes qui mènent des études utilisent des échantillons. Utiliser un plus petit nombre de personnes représentant l’ensemble de la population peut encore produire des résultats valides tout en réduisant le temps et les ressources.
Les échantillons utilisés par les chercheurs doivent ressembler étroitement à la population. Tous les participants de l’échantillon doivent partager les mêmes caractéristiques et qualités. Ainsi, si l’étude porte sur des hommes de première année à l’université, l’échantillon doit être un petit pourcentage d’hommes qui correspondent à cette description. De même, si un groupe de recherche mène une étude sur les habitudes de sommeil des femmes célibataires de plus de 50 ans, l’échantillon ne devrait inclure que les femmes de ce groupe démographique.
Pensez à une équipe de chercheurs universitaires qui veulent savoir combien d’étudiants ont étudié pendant moins de 40 heures pour l’ examen CFA et ont quand même réussi. Étant donné que plus de 200 000 personnes passent l’examen chaque année dans le monde, il peut être extrêmement fastidieux et chronophage de contacter chaque participant à l’examen.
En fait, au moment où les données de la population ont été recueillies et analysées, quelques années se seraient écoulées, rendant l’analyse sans valeur puisqu’une nouvelle population aurait émergé. Ce que les chercheurs peuvent faire à la place, c’est prélever un échantillon de la population et obtenir des données à partir de cet échantillon.
Pour obtenir un échantillon non biaisé, la sélection doit être aléatoire afin que tous les membres de la population aient une chance égale d’être ajoutés au groupe.
Afin d’obtenir un échantillon non biaisé, la sélection doit être aléatoire afin que tous les membres de la population aient une chance égale et probable d’être ajouté au groupe échantillon. Ceci est similaire à un tirage au sort et constitue la base d’ un échantillonnage aléatoire simple.
Types d’échantillonnage
Échantillonnage aléatoire simple
L’échantillonnage aléatoire simple est idéal si chaque entité de la population est identique. Si les chercheurs ne se soucient pas de savoir si les sujets de leur échantillon sont tous des hommes ou des femmes ou une combinaison des deux sexes sous une forme ou une autre, le simple échantillonnage aléatoire peut être une bonne technique de sélection.
Disons qu’il y avait 200000 candidats qui se sont présentés à l’examen CFA en 2016, dont 40% étaient des femmes et 60% étaient des hommes. L’échantillon aléatoire tiré de la population devrait donc comprendre 400 femmes et 600 hommes pour un total de 1 000 candidats.
Mais qu’en est-il des cas où il est important de connaître le ratio hommes / femmes qui ont réussi un test après avoir étudié pendant moins de 40 heures? Ici, un échantillon aléatoire stratifié serait préférable à un échantillon aléatoire simple.
Échantillonnage aléatoire stratifié
Ce type d’échantillonnage, également appelé échantillonnage aléatoire proportionnel ou échantillonnage aléatoire par quota, divise la population globale en groupes plus petits. Celles-ci sont appelées strates. Les personnes au sein des strates partagent des caractéristiques similaires.
Et si l’âge était un facteur important que les chercheurs aimeraient inclure dans leurs données? En utilisant la technique d’échantillonnage aléatoire stratifié, ils pourraient créer des couches ou des strates pour chaque groupe d’âge. La sélection de chaque strate devrait être aléatoire pour que tout le monde dans la tranche ait une chance probable d’être inclus dans l’échantillon. Par exemple, deux participants, Alex et David, ont respectivement 22 et 24 ans. La sélection de l’échantillon ne peut pas choisir l’un sur l’autre sur la base d’un mécanisme préférentiel. Ils devraient tous deux avoir une chance égale d’être sélectionnés dans leur groupe d’âge. Les strates pourraient ressembler à ceci:
D’après le tableau, la population a été divisée en groupes d’âge. Par exemple, 30 000 personnes âgées de 20 à 24 ans ont passé l’examen CFA en 2016. En utilisant cette même proportion, le groupe échantillon aura (30 000 ÷ 200 000) x 1 000 = 150 candidats faisant partie de ce groupe. Alex ou David – ou les deux ou aucun des deux – peuvent être inclus parmi les 150 participants aux examens aléatoires de l’échantillon.
Il existe de nombreuses autres strates qui pourraient être compilées lors du choix de la taille de l’échantillon. Certains chercheurs peuvent renseigner les fonctions professionnelles, les pays, l’état matrimonial, etc. des candidats au test lorsqu’ils décident de la manière de créer l’échantillon.
Exemples d’échantillons
En 2017, la population mondiale était de 7,5 milliards d’habitants, dont 49,6% de femmes et 50,4% d’hommes. Le nombre total de personnes dans un pays donné peut également être une taille de population. Le nombre total d’étudiants dans une ville peut être considéré comme une population, et le nombre total de chiens dans une ville est également une taille de population. Des échantillons peuvent être prélevés sur ces populations à des fins de recherche.
En suivant notre exemple d’examen CFA, les chercheurs pourraient prélever un échantillon de 1 000 participants au CFA parmi les 200 000 candidats au test – la population – et exécuter les données requises sur ce nombre. La moyenne de cet échantillon serait prise pour estimer la moyenne des candidats au CFA qui ont réussi même s’ils n’ont étudié que moins de 40 heures.
Le groupe échantillon prélevé ne doit pas être biaisé. Cela signifie que si la moyenne de l’échantillon des 1000 participants à l’examen CFA est de 50, la moyenne de la population des 200000 candidats devrait également être d’environ 50.