Principes de base de la régression pour l’analyse commerciale
Table des matières
Développer
- Variables
- Covariance
- Coefficient de corrélation
- Équation de régression
- Régressions dans Excel
- Interprétation
- La ligne de fond
Si vous vous êtes déjà demandé comment deux ou plusieurs données sont liées les unes aux autres (par exemple, comment le PIB est affecté par les changements du chômage et de l’inflation), ou si votre patron vous a déjà demandé de créer une prévision ou d’analyser des sur les relations entre les variables, alors l’apprentissage de l’ analyse de régression vaudrait bien votre temps.
Dans cet article, vous apprendrez les bases de la régression linéaire simple, parfois appelée «moindres carrés ordinaires» ou régression OLS, un outil couramment utilisé dans les prévisions et l’analyse financière. Nous commencerons par apprendre les principes de base de la régression, tout d’abord sur la covariance et la corrélation, puis nous passerons à la construction et à l’interprétation d’une sortie de régression. Les logiciels d’entreprise populaires tels que Microsoft Excel peuvent effectuer tous les calculs de régression et les sorties pour vous, mais il est toujours important d’apprendre les mécanismes sous-jacents.
Points clés à retenir
- La régression linéaire simple est couramment utilisée dans les prévisions et l’analyse financière – pour une entreprise pour dire comment une variation du PIB pourrait affecter les ventes, par exemple.
- Microsoft Excel et d’autres logiciels peuvent faire tous les calculs, mais il est bon de savoir comment fonctionne la mécanique de la régression linéaire simple.
Variables
Au cœur d’un modèle de régression se trouve la relation entre deux variables différentes, appelées les variables dépendantes et indépendantes. Par exemple, supposons que vous souhaitiez prévoir les ventes de votre entreprise et que vous ayez conclu que les ventes de votre entreprise augmentent et diminuent en fonction des variations du PIB.
Les ventes que vous prévoyez seraient la variable dépendante parce que leur valeur «dépend» de la valeur du PIB et le PIB serait la variable indépendante. Vous devrez ensuite déterminer la force de la relation entre ces deux variables afin de prévoir les ventes. Si le PIB augmente / diminue de 1%, de combien vos ventes augmenteront-elles ou diminueront-elles?
Covariance
La formule pour calculer la relation entre deux variables est appelée covariance. Ce calcul vous montre la direction de la relation. Si une variable augmente et que l’autre a également tendance à augmenter, la covariance serait positive. Si une variable augmente et l’autre a tendance à baisser, la covariance serait alors négative.
Le nombre réel que vous obtenez en calculant cela peut être difficile à interpréter car il n’est pas normalisé. Une covariance de cinq, par exemple, peut être interprétée comme une relation positive, mais on ne peut dire que la force de la relation est plus forte que si le nombre était de quatre ou plus faible que si le nombre était de six.
Coefficient de corrélation
Correlunetjeon=ρXy=CovXysXsy\ begin {aligné} & Correlation = \ rho_ {xy} = \ frac {Cov_ {xy}} {s_x s_y} \\ \ end {aligné}Correlation=ρxy=sXsy
Nous devons normaliser la covariance afin de nous permettre de mieux l’interpréter et de l’utiliser dans les prévisions, et le résultat est le calcul de corrélation. Le calcul de corrélation prend simplement la covariance et la divise par le produit de l’ écart type des deux variables. Cela liera la corrélation entre une valeur de -1 et +1.
Une corrélation de +1 peut être interprétée comme suggérant que les deux variables se déplacent parfaitement positivement l’une avec l’autre et un -1 implique qu’elles sont parfaitement corrélées négativement. Dans notre exemple précédent, si la corrélation est de +1 et que le PIB augmente de 1%, les ventes augmenteraient de 1%. Si la corrélation est de -1, une augmentation de 1% du PIB entraînerait une diminution de 1% des ventes – c’est exactement le contraire.
Équation de régression
Maintenant que nous savons comment la relation relative entre les deux variables est calculée, nous pouvons développer une équation de régression pour prévoir ou prédire la variable que nous désirons. Voici la formule pour une régression linéaire simple. Le « y » est la valeur que nous essayons de prévoir, le « b » est la pente de la droite de régression, le « x » est la valeur de notre valeur indépendante et le « a » représente l’ordonnée à l’origine. L’équation de régression décrit simplement la relation entre la variable dépendante (y) et la variable indépendante (x).
L’ordonnée à l’origine, ou «a», est la valeur de y (variable dépendante) si la valeur de x (variable indépendante) est zéro, et est donc parfois simplement appelée «constante». Donc, s’il n’y avait pas de changement dans le PIB, votre entreprise réaliserait quand même des ventes. Cette valeur, lorsque la variation du PIB est nulle, est l’interception. Jetez un œil au graphique ci-dessous pour voir une représentation graphique d’une équation de régression. Dans ce graphique, il n’y a que cinq points de données représentés par les cinq points sur le graphique. La régression linéaire tente d’estimer une ligne qui correspond le mieux aux données (une ligne de meilleur ajustement ) et l’équation de cette ligne aboutit à l’équation de régression.
Régressions dans Excel
Maintenant que vous comprenez une partie de l’arrière-plan d’une analyse de régression, faisons un exemple simple à l’aide des outils de régression d’Excel. Nous allons nous inspirer de l’exemple précédent d’essayer de prévoir les ventes de l’année prochaine en fonction des variations du PIB. Le tableau suivant répertorie certains points de données artificiels, mais ces chiffres peuvent être facilement accessibles dans la vie réelle.
En regardant simplement le tableau, vous pouvez voir qu’il y aura une corrélation positive entre les ventes et le PIB. Les deux ont tendance à monter ensemble. En utilisant Excel, tout ce que vous avez à faire est de cliquer sur le menu déroulant Outils, sélectionnez Analyse des données et à partir de là, choisissez Régression. La boîte contextuelle est facile à remplir à partir de là; votre plage d’entrée Y est votre colonne «Ventes» et votre plage d’entrée X est le changement dans la colonne du PIB; choisissez la plage de sortie pour laquelle vous souhaitez que les données apparaissent sur votre feuille de calcul et appuyez sur OK. Vous devriez voir quelque chose de similaire à ce qui est indiqué dans le tableau ci-dessous:
Coefficients des statistiques de régression
Interprétation
Les principaux résultats dont vous devez vous préoccuper pour une régression linéaire simple sont le R-carré, l’interception (constante) et le coefficient bêta (b) du PIB. Le nombre R au carré dans cet exemple est de 68,7%. Cela montre à quel point notre modèle prédit ou prévoit les ventes futures, suggérant que les variables explicatives du modèle prédisaient 68,7% de la variation de la variable dépendante. Ensuite, nous avons une interception de 34,58, ce qui nous indique que si la variation du PIB était prévue de zéro, nos ventes seraient d’environ 35 unités. Et enfin, le bêta du PIB ou coefficient de corrélation de 88,15 nous indique que si le PIB augmente de 1%, les ventes augmenteront probablement d’environ 88 unités.
La ligne de fond
Alors, comment utiliseriez-vous ce modèle simple dans votre entreprise? Eh bien, si votre recherche vous porte à croire que la prochaine variation du PIB sera d’un certain pourcentage, vous pouvez brancher ce pourcentage dans le modèle et générer une prévision de ventes. Cela peut vous aider à élaborer un plan et un budget plus objectifs pour l’année à venir.
Bien sûr, il ne s’agit que d’une simple régression et il existe des régressions linéaires multiples. Mais les régressions linéaires multiples sont plus compliquées et présentent plusieurs problèmes qui nécessiteraient un autre article pour en discuter.