18 avril 2021 11:44

Négligence de la taille de l’échantillon

Qu’est-ce que la négligence de la taille de l’échantillon?

La négligence de la taille de l’échantillon est un Daniel Kahneman. Cela se produit lorsque les utilisateurs d’informations statistiques tirent de fausses conclusions en ne tenant pas compte de la taille de l’ échantillon des données en question.

La cause sous-jacente de la négligence de la taille de l’échantillon est que les gens ne comprennent souvent pas que des niveaux élevés de variance sont plus susceptibles de se produire dans de petits échantillons. Par conséquent, il est essentiel de déterminer si la taille de l’échantillon utilisée pour produire une statistique donnée est suffisamment grande pour permettre des conclusions significatives.

Savoir quand la taille d’un échantillon est suffisamment grande peut être difficile pour ceux qui n’ont pas une bonne compréhension des méthodes statistiques.

Points clés à retenir

  • La négligence de la taille de l’échantillon est un biais cognitif étudié par Amos Tversky et Daniel Kahneman.
  • Il consiste à tirer de fausses conclusions à partir d’informations statistiques, du fait de ne pas avoir pris en compte les effets de la taille de l’échantillon.
  • Ceux qui souhaitent réduire le risque de négligence de la taille de l’échantillon doivent se rappeler que des échantillons de plus petite taille sont associés à des résultats statistiques plus volatils, et vice-versa.

Comprendre la négligence de la taille de l’échantillon

Lorsqu’une taille d’échantillon est trop petite, des conclusions précises et fiables ne peuvent être tirées. Dans le contexte de la finance, cela peut induire les investisseurs en erreur de diverses manières.

Par exemple, un investisseur peut voir une publicité pour un nouveau fonds d’investissement, se vantant d’avoir généré 15% de rendements annualisés depuis sa création. L’investisseur pourrait être prompt à inclure que ce fonds est leur ticket pour la création rapide de richesses. Cependant, cette conclusion pourrait être dangereusement erronée si le fonds n’investit pas depuis très longtemps. Dans ce cas, les résultats pourraient être dus à des anomalies à court terme et avoir peu à voir avec la méthodologie d’investissement réelle du fonds.

La négligence de la taille de l’échantillon est souvent confondue avec la négligence du taux de base, qui est un biais cognitif distinct. Alors que la négligence de la taille de l’échantillon fait référence au fait de ne pas tenir compte du rôle de la taille des échantillons dans la détermination de la fiabilité des déclarations statistiques, la négligence du taux de base se rapporte à la tendance des gens à négliger les connaissances existantes sur un phénomène lors de l’évaluation de nouvelles informations.

Exemple concret de négligence de la taille de l’échantillon

Pour mieux comprendre la négligence de la taille de l’échantillon, considérons l’exemple suivant, tiré des recherches d’Amos Tversky et Daniel Kahneman:

On demande à une personne de dessiner à partir d’un échantillon de cinq balles et constate que quatre sont rouges et une verte.

Une personne tire sur un échantillon de 20 balles et constate que 12 sont rouges et 8 vertes.

Quel échantillon fournit une meilleure preuve que les boules sont majoritairement rouges?

La plupart des gens disent que le premier échantillon, plus petit, fournit des preuves beaucoup plus solides parce que le rapport du rouge au vert est beaucoup plus élevé que celui du plus grand échantillon. Cependant, en réalité, le ratio plus élevé est compensé par la taille réduite de l’échantillon. L’échantillon de 20 fournit en fait des preuves beaucoup plus solides.

Un autre exemple d’Amos Tversky et Daniel Kahneman est le suivant:

Une ville est desservie par deux hôpitaux. Dans le plus grand hôpital, en moyenne 45 bébés naissent chaque jour, et dans le plus petit hôpital, environ 15 bébés naissent chaque jour. Bien que 50% de tous les bébés soient des garçons, le pourcentage exact varie d’un jour à l’autre.

Pendant un an, chaque hôpital a enregistré les jours où plus de 60% des bébés étaient des garçons. Quel hôpital a enregistré le plus de jours de ce genre?

Lorsqu’on leur a posé cette question, 22% des répondants ont dit que le plus grand hôpital rapporterait plus de ces jours, tandis que 56% ont dit que les résultats seraient les mêmes pour les deux hôpitaux. En fait, la bonne réponse est que le petit hôpital enregistrerait plus de jours de ce type, car sa petite taille entraînerait une plus grande variabilité.

Comme nous l’avons noté précédemment, la racine de la négligence de la taille de l’échantillon est que les gens ne comprennent souvent pas que des niveaux élevés de variance sont plus susceptibles de se produire dans de petits échantillons. En investissant, cela peut s’avérer très coûteux.