18 avril 2021 11:16

Somme résiduelle des carrés (RSS)

Quelle est la somme résiduelle des carrés (RSS)?

Une somme résiduelle des carrés (RSS) est une technique statistique utilisée pour mesurer la quantité de variance dans un ensemble de données qui n’est pas expliquée par un modèle de régression lui-même. Au lieu de cela, il estime la variance des résidus, ou terme d’erreur.

La régression linéaire est une mesure qui aide à déterminer la force de la relation entre une variable dépendante et un ou plusieurs autres facteurs, appelés variables indépendantes ou explicatives.

Points clés à retenir

  • Une somme des carrés résiduelle (RSS) mesure le niveau de variance du terme d’erreur, ou des résidus, d’un modèle de régression.
  • Idéalement, la somme des carrés des résidus devrait être une valeur inférieure ou inférieure à la somme des carrés des entrées du modèle de régression.
  • Le RSS est utilisé par les analystes financiers pour estimer la validité de leurs modèles économétriques.

La formule du RSS est

ESS =

n
i = 1 (
y i
f (
x i ))
2

où:

  • y i = la i ème valeur de la variable à prédire
  • f (x i ) = valeur prédite de y i
  • n = limite supérieure de sommation
  • y i = la i ème valeur de la variable à prédire
  • f (x i ) = valeur prédite de y i
  • n = limite supérieure de sommation

Comprendre la somme résiduelle des carrés (RSS)

En termes généraux, la somme des carrés est une technique statistique utilisée dans l’analyse de régression pour déterminer la dispersion des points de données. Dans une  analyse de régression, l’objectif est de déterminer dans quelle mesure une série de données peut être ajustée à une fonction qui pourrait aider à expliquer comment la série de données a été générée. La somme des carrés est utilisée comme un moyen mathématique de trouver la fonction qui  correspond le mieux  (varie le moins) à partir des données.

Le RSS mesure la quantité d’erreur restante entre la fonction de régression et l’ensemble de données après l’exécution du modèle. Une somme de carrés résiduelle plus petite représente une fonction de régression.

Le RSS – également connu sous le nom de somme des carrés des résidus – détermine essentiellement dans quelle mesure un modèle de régression explique ou représente les données dans le modèle.

RSS contre RSE

Erreur standard résiduelle * RSE) est un autre terme statistique utilisé pour décrire la différence entre  les écarts-types  des valeurs observées par rapport aux valeurs prédites, comme indiqué par des points dans une  qualité d’ajustement  qui peut être utilisée pour analyser dans quelle mesure un ensemble de points de données s’accorde avec le modèle réel.

RSE est calculé en divisant le RSS par le nombre d’observations dans l’échantillon moins 2 puis en prenant la racine carrée: RSE = [RSS / (n-2)] 1/2

RSS, finance et économétrie

Les marchés financiers sont de plus en plus orientés quantitativement; à ce titre, à la recherche d’un avantage, de nombreux investisseurs utilisent des techniques statistiques avancées pour les aider dans leurs décisions. Les applications de mégadonnées, d’apprentissage automatique et d’intelligence artificielle nécessitent en outre l’utilisation de propriétés statistiques pour guider les stratégies d’investissement contemporaines. La somme résiduelle des carrés – ou statistiques RSS – est l’une des nombreuses propriétés statistiques qui connaissent une renaissance.

Les modèles statistiques sont utilisés par les investisseurs et les gestionnaires de portefeuille pour suivre le prix d’un investissement et utiliser ces données pour prédire les mouvements futurs. L’étude – appelée analyse de régression – pourrait impliquer l’analyse de la relation dans les mouvements de prix entre un produit et les actions des entreprises engagées dans la production du produit.

Tout modèle peut avoir des écarts entre les valeurs prévues et les résultats réels. Bien que les variances puissent être expliquées par l’analyse de régression, la somme résiduelle des carrés représente les variances ou erreurs qui ne sont pas expliquées.

Puisqu’une fonction de régression suffisamment complexe peut être faite pour s’adapter étroitement à pratiquement n’importe quel ensemble de données, une étude plus approfondie est nécessaire pour déterminer si la fonction de régression est en fait utile pour expliquer la variance de l’ensemble de données. En règle générale, cependant, une valeur plus petite ou plus basse pour la somme résiduelle des carrés est idéale dans n’importe quel modèle, car cela signifie qu’il y a moins de variation dans l’ensemble de données. En d’autres termes, plus la somme des carrés des résidus est faible, meilleur est le modèle de régression pour expliquer les données.