18 avril 2021 12:44

Corrélation fausse

Qu’est-ce qu’une corrélation fallacieuse

Dans les statistiques, une corrélation fausse, ou fausse identité, fait référence à un lien entre deux variables qui semble causal mais ne l’est pas. Les fausses relations ont souvent l’apparence d’une variable affectant une autre. Cette fausse corrélation est souvent causée par un troisième facteur qui n’est pas apparent au moment de l’examen, parfois appelé facteur de confusion.

Points clés à retenir

  • La fausse corrélation, ou faux, se produit lorsque deux facteurs semblent liés de manière nonchalante mais ne le sont pas.
  • L’apparition d’une relation causale est souvent due à un mouvement similaire sur un graphique qui s’avère être une coïncidence ou provoqué par un troisième facteur «confondant».
  • Une corrélation erronée peut souvent être causée par des échantillons de petite taille ou des critères de jugement arbitraires.

Comment fonctionne la fausse corrélation

Lorsque deux variables aléatoires se suivent de près sur un graphique, il est facile de soupçonner une corrélation, ou une relation entre les deux facteurs, où un changement affecte l’autre. Mis à part la «causalité», autre sujet, cette observation peut amener le lecteur du graphique à croire que le mouvement de la variable A est lié au mouvement de la variable B ou vice versa. mais parfois, après un examen statistique plus approfondi, les mouvements alignés sont une coïncidence ou sont causés par un troisième facteur qui affecte les deux premiers. C’est une corrélation fallacieuse. Les recherches effectuées avec des échantillons de petite taille ou des critères de jugement arbitraires sont des particularités susceptibles d’être faussées.

Exemple de fausses corrélations

Il n’est pas trop difficile de découvrir des corrélations intéressantes. Beaucoup s’avéreront cependant faux. Pour les espèces mâles de Wall Street, deux fausses corrélations populaires impliquent les femmes et le sport. La théorie de la longueur de la jupe est née dans les années 1920, selon laquelle les longueurs de jupe et la direction du marché boursier sont corrélées. Si les longueurs de jupe sont longues, cela signifie que le marché boursier est en baisse; s’ils sont courts, le marché est à la hausse. Vers la fin janvier, on parle du soi-disant indicateur du Super Bowl, ce qui suggère qu’une victoire de l’équipe AFC signifie probablement que le marché boursier baissera dans l’année à venir, alors qu’une victoire de l’équipe NFC laisse présager une hausse de la marché. Depuis 1966, l’indicateur a un taux d’exactitude de 80%. C’est un sujet de conversation amusant, mais probablement pas quelque chose qu’un conseiller financier sérieux recommanderait comme stratégie d’investissement pour les clients.

Voici quelques exemples supplémentaires de corrélations parasites courantes:

  • Les noyades augmentent lorsque les ventes de crème glacée augmentent. Il peut sembler que l’augmentation des ventes de crème glacée cause plus de noyades, mais en réalité, la chaleur croissante peut amener plus de gens à nager et à acheter plus de crème glacée.
  • Le taux de meurtre aux États-Unis de 2006 à 2011 a chuté au même rythme que l’utilisation de Microsoft Internet Explorer.
  • Les cadres qui disent s’il vous plaît et merci apprécient plus souvent de meilleures performances de partage.
  • Les personnes qui portent l’équipement de l’équipe des Oakland Raiders sont plus susceptibles de commettre des crimes.

Comment repérer les fausses corrélations

Les statisticiens et autres scientifiques qui analysent les données doivent être constamment à l’affût de fausses relations. Il existe de nombreuses méthodes qu’ils utilisent, notamment:

  • Assurer un échantillon représentatif approprié.
  • Obtenir une taille d’échantillon adéquate.
  • Méfiez-vous des points de terminaison arbitraires.
  • Contrôler autant de variables externes que possible.
  • Utilisation d’une hypothèse nulle et vérification d’une valeur p forte.