18 avril 2021 9:41

Surapprentissage

Qu’est-ce que le surajustement?

Le surajustement est une erreur de modélisation qui se produit lorsqu’une fonction est trop étroitement ajustée à un ensemble limité de points de données. Le surajustement du modèle consiste généralement à créer un modèle trop complexe pour expliquer les particularités des données étudiées.

En réalité, les données souvent étudiées comportent un certain degré d’erreur ou de bruit aléatoire. Ainsi, tenter de rendre le modèle trop conforme à des données légèrement inexactes peut infecter le modèle avec des erreurs substantielles et réduire son pouvoir prédictif.

Points clés à retenir

  • Le surajustement est une erreur de modélisation qui se produit lorsqu’une fonction est trop étroitement ajustée à un ensemble limité de points de données.
  • Les professionnels de la finance doivent toujours être conscients des dangers de surajustement d’un modèle basé sur des données limitées.

Comprendre le surajustement

Par exemple, un problème courant consiste à utiliser des algorithmes informatiques pour rechercher des bases de données étendues de données historiques de marché afin de trouver des modèles. Avec suffisamment d’études, il est souvent possible de développer des théorèmes élaborés qui semblent prédire des choses telles que les rendements du marché boursier avec une précision proche.

Cependant, lorsqu’ils sont appliqués à des données en dehors de l’échantillon, de tels théorèmes peuvent vraisemblablement s’avérer être simplement le surajustement d’un modèle à ce qui n’était en réalité que des événements fortuits. Dans tous les cas, il est important de tester un modèle par rapport à des données extérieures à l’échantillon utilisé pour le développer.



Les professionnels de la finance doivent toujours être conscients des dangers de surajustement d’un modèle basé sur des données limitées.