De quel pourcentage de la population avez-vous besoin dans un échantillon représentatif?
Techniquement, un échantillon représentatif ne nécessite que le pourcentage de la population statistique nécessaire pour reproduire le plus fidèlement possible la qualité ou la caractéristique étudiée ou analysée. Par exemple, dans une population de 1000 personnes composée de 600 hommes et 400 femmes utilisé dans une analyse des tendances d’achat par sexe, un échantillon représentatif peut être composé de seulement cinq membres, trois hommes et deux femmes, ou 0,5 pour cent des population. Cependant, bien que cet échantillon soit nominalement représentatif de la population plus large, il est susceptible d’entraîner un degré élevé d’ erreur d’échantillonnage lors des inférences concernant la population plus large, car elle est si petite.
L’erreur d’échantillonnage est une conséquence inévitable de l’utilisation d’échantillons pour analyser un plus grand groupe. L’obtention de données auprès d’eux est un processus limité et incomplet de par sa nature même. Mais parce que cela est si souvent nécessaire compte tenu de la disponibilité limitée des ressources, les analystes économiques utilisent des méthodes qui peuvent réduire l’erreur d’échantillonnage à des niveaux statistiquement négligeables. Si l’échantillonnage représentatif est l’une des méthodes les plus efficaces utilisées pour réduire les erreurs, il ne suffit souvent pas de le faire de manière suffisamment autonome.
Une stratégie utilisée en combinaison avec un échantillonnage représentatif consiste à s’assurer que l’échantillon est suffisamment grand pour réduire les erreurs de manière optimale. Et si, en général, plus le sous-groupe est grand, plus l’erreur est réduite, à un certain moment, la réduction devient si minime qu’elle ne justifie pas les dépenses supplémentaires nécessaires pour agrandir l’échantillon.
Tout comme l’utilisation d’un échantillon techniquement représentatif mais minuscule ne suffit pas à réduire l’erreur d’échantillonnage à elle seule, le simple choix d’un grand groupe sans tenir compte de la représentation peut conduire à des résultats encore plus erronés que l’utilisation du petit échantillon représentatif. Pour revenir à l’exemple ci-dessus, un groupe de 600 hommes est statistiquement inutile à lui seul lors de l’analyse des différences entre les sexes dans les tendances d’achat.
Étonnamment, la fraction d’échantillonnage a très peu à voir avec l’erreur des résultats lorsque l’échantillonnage aléatoire est utilisé. Le principal déterminant de l’erreur est la taille absolue de l’échantillon, et non la taille de l’échantillon par rapport à la taille de la population.