Règle empirique - KamilTaylan.blog
17 avril 2021 21:24

Règle empirique

Quelle est la règle empirique?

La règle empirique, également appelée règle des trois sigma ou règle 68-95-99.7, est une règle statistique qui stipule que pour une distribution normale, presque toutes les données observées tomberont dans les trois écarts types (notés par σ) du moyenne ou moyenne (notée µ).

En particulier, la règle empirique prédit que 68% des observations se situent dans le premier écart-type (µ ± σ), 95% dans les deux premiers écarts-types (µ ± 2σ) et 99,7% dans les trois premiers écarts-types (µ ± 3σ).

Points clés à retenir

  • La règle empirique stipule que 99,7% des données observées suivant une distribution normale se situent à moins de 3 écarts-types de la moyenne.
  • En vertu de cette règle, 68% des données se situent dans un écart-type, 95% pour cent dans deux écarts-types et 99,7% dans trois écarts-types de la moyenne.
  • Les limites à trois sigma qui suivent la règle empirique sont utilisées pour définir les limites de contrôle supérieures et inférieures dans les graphiques de contrôle de qualité statistique et dans l’analyse des risques comme la VaR.

Comprendre la règle empirique

La règle empirique est souvent utilisée dans les statistiques pour prévoir les résultats finaux. Après avoir calculé l’ écart type et avant de collecter des données exactes, cette règle peut être utilisée comme une estimation approximative du résultat des données imminentes à collecter et à analyser.

Cette distribution de probabilité peut donc être utilisée comme une heuristique provisoire car la collecte des données appropriées peut prendre du temps, voire impossible dans certains cas. De telles considérations entrent en jeu lorsqu’une entreprise examine ses mesures de contrôle de la qualité ou évalue son exposition au risque. Par exemple, l’outil de risque couramment utilisé connu sous le nom de Value-at-Risk (VaR) suppose que la probabilité d’événements de risque suit une distribution normale.

La règle empirique est également utilisée comme un moyen approximatif de tester la «normalité» d’une distribution. Si trop de points de données se situent en dehors des trois limites de l’écart type, cela suggère que la distribution n’est pas normale et peut plutôt être biaisée ou suivre une autre distribution.

Les règles empiriques sont également connues sous le nom de règle des trois sigma, car «trois sigma» se réfère à une distribution statistique des données à moins de trois écarts-types par rapport à la moyenne sur une distribution normale ( courbe en cloche ), comme indiqué par la figure ci-dessous.

Exemples de la règle empirique

Supposons qu’une population d’animaux dans un zoo est connue pour être distribuée normalement. Chaque animal vit jusqu’à 13,1 ans en moyenne (moyenne) et l’écart type de la durée de vie est de 1,5 an. Si quelqu’un veut connaître la probabilité qu’un animal vivra plus de 14,6 ans, il pourrait utiliser la règle empirique. Sachant que la moyenne de la distribution est de 13,1 ans, les tranches d’âge suivantes se présentent pour chaque écart type:

  • Un écart type (µ ± σ): (13,1 – 1,5) à (13,1 + 1,5) ou 11,6 à 14,6
  • Deux écarts types (µ ± 2σ): 13,1 – (2 x 1,5) à 13,1 + (2 x 1,5) ou 10,1 à 16,1
  • Trois écarts types (µ ± 3σ): 13,1 – (3 x 1,5) à 13,1 + (3 x 1,5), ou 8,6 à 17,6

La personne qui résout ce problème doit calculer la probabilité totale que l’animal vive 14,6 ans ou plus. La règle empirique montre que 68% de la distribution se situe dans un écart-type, dans ce cas, de 11,6 à 14,6 ans. Ainsi, les 32% restants de la distribution se situent en dehors de cette fourchette. La moitié se situe au-dessus de 14,6 et l’autre en dessous de 11,6. Ainsi, la probabilité que l’animal vive plus de 14,6% est de 16% (calculée comme 32% divisé par deux).

Comme autre exemple, supposons plutôt qu’un animal du zoo vit en moyenne jusqu’à 10 ans, avec un écart type de 1,4 an. Supposons que le gardien de zoo tente de déterminer la probabilité qu’un animal vive plus de 7,2 ans. Cette distribution se présente comme suit:

  • Un écart type (µ ± σ): 8,6 à 11,4 ans
  • Deux écarts types (µ ± 2σ): 7,2 à 12,8 ans
  • Trois écarts types ((µ ± 3σ): 5,8 à 14,2 ans

La règle empirique stipule que 95% de la distribution se situe à l’intérieur de deux écarts types. Ainsi, 5% se situe en dehors de deux écarts types; la moitié au-dessus de 12,8 ans et la moitié au-dessous de 7,2 ans. Ainsi, la probabilité de vivre plus de 7,2 ans est:

95% + (5% / 2) = 97,5%

Questions fréquemment posées

Quelle est la règle empirique?

En statistique, la règle empirique stipule que 99,7% des données se produisent à moins de trois écarts-types de la moyenne dans une distribution normale. À cette fin, 68% des données observées se produiront dans le premier écart-type, 95% dans le deuxième écart et 97,5% dans le troisième écart-type. La règle empirique prédit la distribution de probabilité pour un ensemble de résultats.

Comment la règle empirique est-elle utilisée?

La règle empirique est appliquée pour anticiper les résultats probables dans une distribution normale. Par exemple, un statisticien utiliserait cela pour estimer le pourcentage de cas qui tombent dans chaque écart type. Considérez que l’écart-type est de 3,1 et la moyenne égale à 10. Dans ce cas, le premier écart-type se situerait entre (10 + 3,2) = 13,2 et (10-3,2) = 6,8. Le deuxième écart serait compris entre 10 + (2 X 3,2) = 16,4 et 10 – (2 X 3,2) = 3,6, et ainsi de suite.

Quels sont les avantages de la règle empirique?

La règle empirique est bénéfique car elle sert de moyen de prévision des données. Cela est particulièrement vrai lorsqu’il s’agit de grands ensembles de données et de ceux dont les variables sont inconnues. En finance en particulier, la règle empirique est pertinente pour les prix des actions, les indices de prix et les valeurs logarithmiques des taux de change, qui ont tous tendance à tomber sur une courbe en cloche ou une distribution normale.