18 avril 2021 9:15

Définition de la régression non linéaire

La régression non linéaire est une forme d’analyse de régression dans laquelle les données sont ajustées à un modèle puis exprimées sous forme de fonction mathématique. La régression linéaire  simple  relie deux variables (X et Y) avec une ligne droite (y = mx + b), tandis que la régression non linéaire relie les deux variables dans une relation non linéaire (courbe).

Le but du modèle est de rendre la  somme des carrés  aussi petite que possible. La somme des carrés est une mesure qui suit dans quelle mesure les observations Y varient de la fonction non linéaire (courbe) utilisée pour prédire Y.

Il est calculé en trouvant d’abord la différence entre la fonction non linéaire ajustée et chaque point Y de données dans l’ensemble. Ensuite, chacune de ces différences est mise au carré. Enfin, tous les chiffres au carré sont additionnés. Plus la somme de ces chiffres au carré est petite, plus la fonction s’adapte aux points de données de l’ensemble. La régression non linéaire utilise des fonctions logarithmiques, des fonctions trigonométriques, des fonctions exponentielles, des fonctions de puissance, des courbes de Lorenz, des fonctions gaussiennes et d’autres méthodes d’ajustement.

Points clés à retenir

  • Les régressions linéaires et non linéaires prédisent les réponses Y à partir d’une variable X (ou de variables).
  • La régression non linéaire est une fonction courbe d’une variable X (ou de variables) utilisée pour prédire une variable Y
  • La régression non linéaire peut montrer une prédiction de la croissance démographique au fil du temps.

La modélisation de régression non linéaire est similaire à la modélisation de régression linéaire dans la mesure où les deux cherchent à suivre graphiquement une réponse particulière à partir d’un ensemble de variables. Les modèles non linéaires sont plus compliqués que les modèles linéaires à développer car la fonction est créée par une série d’approximations (itérations) qui peuvent provenir d’essais et d’erreurs. Les mathématiciens utilisent plusieurs méthodes établies, telles que la méthode Gauss-Newton et la méthode Levenberg-Marquardt.

Souvent, les modèles de régression qui semblent non linéaires à première vue sont en fait linéaires. La procédure d’estimation de courbe peut être utilisée pour identifier la nature des relations fonctionnelles en jeu dans vos données, afin que vous puissiez choisir le bon modèle de régression, qu’il soit linéaire ou non linéaire. Les modèles de régression linéaire, bien qu’ils forment généralement une ligne droite, peuvent également former des courbes, selon la forme de l’équation de régression linéaire. De même, il est possible d’utiliser l’algèbre pour transformer une équation non linéaire afin qu’elle imite une équation linéaire – une telle équation non linéaire est appelée «intrinsèquement linéaire».



La régression linéaire relie deux variables avec une ligne droite; la régression non linéaire relie les variables à l’aide d’une courbe.

Exemple de régression non linéaire

Un exemple de la façon dont la régression non linéaire peut être utilisée est de prédire la croissance démographique au fil du temps. Un diagramme de dispersion des données démographiques changeantes au fil du temps montre qu’il semble y avoir une relation entre le temps et la croissance démographique, mais qu’il s’agit d’une relation non linéaire, nécessitant l’utilisation d’un modèle de régression non linéaire. Un modèle de croissance démographique logistique peut fournir des estimations de la population pour des périodes qui n’ont pas été mesurées et des prévisions de la croissance future de la population.

Les variables indépendantes et dépendantes utilisées dans la régression non linéaire doivent être quantitatives. Les variables catégorielles, comme la région de résidence ou la religion, doivent être codées comme des variables binaires ou d’autres types de variables quantitatives.

Afin d’obtenir des résultats précis du modèle de régression non linéaire, vous devez vous assurer que la fonction que vous spécifiez décrit avec précision la relation entre les variables indépendantes et dépendantes. De bonnes valeurs de départ sont également nécessaires. De mauvaises valeurs de départ peuvent entraîner un modèle qui ne parvient pas à converger, ou une solution qui n’est optimale que localement, plutôt que globalement, même si vous avez spécifié la bonne forme fonctionnelle pour le modèle.