18 avril 2021 7:00

Corrélation inverse

Qu’est-ce qu’une corrélation inverse?

Une corrélation inverse, également connue sous le nom de corrélation négative, est une relation contraire entre deux variables de telle sorte que lorsque la valeur d’une variable est élevée, la valeur de l’autre variable est probablement faible.

Par exemple, avec les variables A et B, comme A a une valeur élevée, B a une valeur faible, et comme A a une valeur faible, B a une valeur élevée. Dans la terminologie statistique, une corrélation inverse est souvent désignée par le coefficient de corrélation « r » ayant une valeur comprise entre -1 et 0, avec r = -1 indiquant une corrélation inverse parfaite.

Points clés à retenir

  • La corrélation inverse (ou négative) se produit lorsque deux variables d’un ensemble de données sont liées de telle sorte que lorsque l’une est élevée, l’autre est faible.
  • Même si deux variables peuvent avoir une forte corrélation négative, cela n’implique pas nécessairement que le comportement de l’une a une influence causale sur l’autre.
  • La relation entre deux variables peut changer avec le temps et peut également avoir des périodes de corrélation positive.

Représentation graphique de la corrélation inverse

Deux ensembles de points de données peuvent être tracés sur un graphique sur un axe x et y pour vérifier la corrélation. C’est ce qu’on appelle un diagramme de dispersion et il représente un moyen visuel de vérifier une corrélation positive ou négative. Le graphique ci-dessous illustre une forte corrélation inverse entre deux ensembles de points de données tracés sur le graphique.

Exemple de calcul de la corrélation inverse

La corrélation peut être calculée entre les variables d’un ensemble de données pour arriver à un résultat numérique, dont le plus courant est le r de Pearson. Lorsque r est inférieur à 0, cela indique une corrélation inverse. Voici un exemple de calcul arithmétique du r de Pearson, avec un résultat qui montre une corrélation inverse entre deux variables.

Supposons qu’un analyste ait besoin de calculer le degré de corrélation entre X et Y dans l’ensemble de données suivant avec sept observations sur les deux variables:

  • X: 55, 37, 100, 40, 23, 66, 88
  • Y: 91, 60, 70, 83, 75, 76, 30

Il y a trois étapes impliquées dans la recherche de la corrélation. Tout d’abord, additionnez toutes les valeurs X pour trouver SUM (X), additionnez toutes les valeurs Y pour trouver SUM (Y) et multipliez chaque valeur X par sa valeur Y correspondante et additionnez-les pour trouver SUM (X, Y):

SUM(Oui)=91+60+70+83+75+76+30=485\ begin {aligné} \ text {SUM} (Y) & = 91 + 60 + 70 + 83 + 75 + 76 + 30 \\ & = 485 \\ \ end {aligné}SOMME (Y)​=91+60+70+83+75+76+30=485​

L’étape suivante consiste à prendre chaque valeur X, à la mettre au carré et à additionner toutes ces valeurs pour trouver SOMME (x 2 ). La même chose doit être faite pour les valeurs Y:

SUM(X2)=(552)+(372)+(1002)+…+(882)=28,623\ text {SUM} (X ^ 2) = (55 ^ 2) + (37 ^ 2) + (100 ^ 2) + \ dotso + (88 ^ 2) = 28 623SOMME (X2)=(552)+(372)+(1002)+…+(882)=28,623

En notant qu’il y a sept observations, n, la formule suivante peut être utilisée pour trouver le coefficient de corrélation, r:

r=[n