Multicollinéarité
Qu’est-ce que la multicollinéarité?
La multicolinéarité est l’occurrence d’intercorrélations élevées entre deux ou plusieurs variables indépendantes dans un modèle de régression multiple. La multicolinéarité peut conduire à des résultats biaisés ou trompeurs lorsqu’un chercheur ou un analyste tente de déterminer dans quelle mesure chaque variable indépendante peut être utilisée le plus efficacement pour prédire ou comprendre la variable dépendante dans un modèle statistique.
En général, la multicolinéarité peut conduire à des intervalles de confiance plus larges qui produisent des probabilités moins fiables en termes d’effet de variables indépendantes dans un modèle. Autrement dit, les inférences statistiques d’un modèle à multicolinéarité peuvent ne pas être fiables.
Points clés à retenir
- La multicollinéarité est un concept statistique dans lequel les variables indépendantes d’un modèle sont corrélées.
- La multicolinéarité entre les variables indépendantes se traduira par des inférences statistiques moins fiables.
- Il est préférable d’utiliser des variables indépendantes qui ne sont ni corrélées ni répétitives lors de la création de modèles de régression multiples qui utilisent au moins deux variables.
Comprendre la multicolinéarité
Les analystes statistiques utilisent plusieurs modèles de régression pour prédire la valeur d’une variable dépendante spécifiée en fonction des valeurs d’au moins deux variables indépendantes. La variable dépendante est parfois appelée variable de résultat, cible ou critère.
Un exemple est un modèle de régression multivariée qui tente d’anticiper les rendements des actions en fonction d’éléments tels que les ratios cours / bénéfices ( ratios P / E), la capitalisation boursière, les performances passées ou d’autres données. Le rendement boursier est la variable dépendante et les différents bits de données financières sont les variables indépendantes.
La multicolinéarité dans un modèle de régression multiple indique que les variables indépendantes colinéaires sont liées d’une certaine façon, bien que la relation puisse ou non être occasionnelle. Par exemple, les performances passées peuvent être liées à la capitalisation boursière, car les actions qui ont bien performé dans le passé auront des valeurs de marché croissantes. En d’autres termes, la multicolinéarité peut exister lorsque deux variables indépendantes sont fortement corrélées. Cela peut également se produire si une variable indépendante est calculée à partir d’autres variables de l’ensemble de données ou si deux variables indépendantes fournissent des résultats similaires et répétitifs.
L’un des moyens les plus courants d’éliminer le problème de la multicolinéarité est d’abord d’identifier les variables indépendantes colinéaires, puis de les supprimer toutes sauf une. Il est également possible d’éliminer la multicolinéarité en combinant deux ou plusieurs variables colinéaires en une seule variable. Une analyse statistique peut ensuite être menée pour étudier la relation entre la variable dépendante spécifiée et une seule variable indépendante.
Exemple de multicollinéarité
Pour l’investissement, la multicolinéarité est une considération courante lors de l’analyse technique pour prédire les mouvements futurs probables des prix d’un titre, comme une action ou un futur sur matières premières.
Les analystes de marché veulent éviter d’utiliser des indicateurs techniques colinéaires en ce sens qu’ils sont basés sur des données très similaires ou liées; ils tendent à révéler des prédictions similaires concernant la variable dépendante du mouvement des prix. Au lieu de cela, l’analyse de marché doit être basée sur des variables indépendantes nettement différentes pour s’assurer qu’elles analysent le marché à partir de différents points de vue analytiques indépendants.
Un exemple de problème potentiel de multicolinéarité consiste à effectuer une analyse technique en utilisant uniquement plusieurs indicateurs similaires.
Le célèbre analyste technique John Bollinger, créateur de l’ indicateur des bandes de Bollinger, note que « une règle cardinale pour une utilisation réussie de l’analyse technique nécessite d’éviter la multicolinéarité parmi les indicateurs ». Pour résoudre le problème, les analystes évitent d’utiliser deux ou plusieurs indicateurs techniques du même type. Au lieu de cela, ils analysent un titre en utilisant un type d’indicateur, tel qu’un indicateur de momentum, puis effectuent une analyse séparée en utilisant un type d’indicateur différent, tel qu’un indicateur de tendance.
Par exemple, la stochastique, l’ indice de force relative (RSI) et Williams% R sont tous des indicateurs de momentum qui reposent sur des entrées similaires et sont susceptibles de produire des résultats similaires. Dans ce cas, il est préférable de supprimer tous les indicateurs sauf un ou de trouver un moyen de fusionner plusieurs d’entre eux en un seul indicateur, tout en ajoutant également un indicateur de tendance qui n’est pas susceptible d’être fortement corrélé à l’indicateur de momentum.