18 avril 2021 9:17

Le tableau de distribution normale

Quelle est la distribution normale?

La formule de distribution normale est basée sur deux paramètres simples – moyenne et écart type – qui quantifient les caractéristiques d’un ensemble de données donné. Alors que la moyenne indique la valeur «centrale» ou moyenne de l’ensemble de données, l’écart type indique la «dispersion» ou la variation des points de données autour de cette valeur moyenne.

Exemple

Considérez les 2 ensembles de données suivants:

  1. Ensemble de données 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}
  2. Ensemble de données 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}

Pour Dataset1, moyenne = 10 et écart type (stddev) = 0

Pour Dataset2, moyenne = 10 et écart type (stddev) = 2,83

Tracons ces valeurs pour DataSet1:

De même pour DataSet2:

La ligne horizontale rouge dans les deux graphiques ci-dessus indique la «moyenne» ou la valeur moyenne de chaque ensemble de données (10 dans les deux cas). Les flèches roses dans le deuxième graphique indiquent la dispersion ou la variation des valeurs de données par rapport à la valeur moyenne. Ceci est représenté par une valeur d’écart type de 2,83 dans le cas de DataSet2. Étant donné que DataSet1 a toutes les valeurs identiques (10 chacune) et aucune variation, la valeur stddev est zéro, et par conséquent aucune flèche rose n’est applicable.

La valeur stddev a quelques caractéristiques importantes et utiles qui sont extrêmement utiles dans l’analyse des données. Pour une distribution normale, les valeurs des données sont distribuées symétriquement de chaque côté de la moyenne. Pour tout jeu de données normalement distribué, tracer un graphique avec stddev sur l’axe horizontal et no. des valeurs de données sur l’axe vertical, le graphique suivant est obtenu.

Propriétés d’une distribution normale

  1. La courbe normale est symétrique par rapport à la moyenne;
  2. La moyenne est au milieu et divise la zone en deux moitiés;
  3. L’aire totale sous la courbe est égale à 1 pour moyenne = 0 et stdev = 1;
  4. La distribution est complètement décrite par sa moyenne et son stddev

Comme le montre le graphique ci-dessus, stddev représente ce qui suit:

  • 68,3%  des valeurs de données se situent à moins d’ un écart-type de la moyenne (-1 à +1)
  • 95,4%  des valeurs de données se situent à moins de  2 écarts-types  de la moyenne (-2 à +2)
  • 99,7%  des valeurs de données se situent à moins de  3 écarts-types  de la moyenne (-3 à +3)

L’aire sous la courbe en forme de cloche, lorsqu’elle est mesurée, indique la probabilité souhaitée d’une plage donnée:

  • inférieure à X: – par exemple, probabilité que les valeurs des données soient inférieures à 70
  • supérieur à X – p . ex. probabilité que les valeurs des données soient supérieures à 95
  • entre X 1 et X 2  – par exemple probabilité de valeurs de données comprises entre 65 et 85

où X est une valeur d’intérêt (exemples ci-dessous).

Le traçage et le calcul de la zone ne sont pas toujours pratiques, car différents ensembles de données auront des valeurs moyennes et stddev différentes. Pour faciliter une méthode standard uniforme pour des calculs faciles et une applicabilité aux problèmes du monde réel, la conversion standard en valeurs Z a été introduite, qui font partie du tableau de distribution normale.

Z = (X – moyenne) / stddev, où X est la variable aléatoire.

Fondamentalement, cette conversion force la moyenne et le stddev à être normalisés à 0 et 1 respectivement, ce qui permet d’utiliser un ensemble standard défini de valeurs Z (à partir du tableau de distribution normale ) pour des calculs faciles. Voici un aperçu de la table de valeurs z standard contenant des valeurs de probabilité:

Pour trouver la probabilité liée à la valeur z de 0,239865, arrondissez-la d’abord à 2 décimales (c’est-à-dire 0,24). Vérifiez ensuite les 2 premiers chiffres significatifs (0,2) dans les lignes et le chiffre le moins significatif (0,04 restant) dans la colonne. Cela conduira à une valeur de 0,09483.

La table de distribution normale complète, avec une précision allant jusqu’à 5 décimales pour les valeurs de probabilité (y compris celles pour les valeurs négatives), peut être trouvée ici.

Voyons quelques exemples réels. La taille des individus dans un grand groupe suit un modèle de distribution normal. Supposons que nous ayons un ensemble de 100 individus dont les hauteurs sont enregistrées et la moyenne et le stddev sont calculés à 66 et 6 pouces respectivement.

Voici quelques exemples de questions auxquelles il est facile de répondre à l’aide du tableau des valeurs z:

  • Quelle est la probabilité qu’une personne du groupe mesure 70 pouces ou moins?

La question est de trouver la valeur cumulée de P (X <= 70) c’est-à-dire dans l’ensemble de données de 100, combien de valeurs seront comprises entre 0 et 70.

Commençons par convertir la valeur X de 70 en valeur Z équivalente.

Z = (X – moyenne) / stddev = (70-66) / 6 = 4/6 = 0,66667 = 0,67 (arrondir à 2 décimales)

Nous devons maintenant trouver P (Z <= 0,67) = 0. 24857 (à partir du tableau z ci-dessus)

c’est-à-dire qu’il y a une probabilité de 24,857% qu’un individu du groupe soit inférieur ou égal à 70 pouces.

Mais attendez – ce qui précède est incomplet. N’oubliez pas que nous recherchons la probabilité de toutes les hauteurs possibles jusqu’à 70, c’est-à-dire de 0 à 70. Ce qui précède vous donne simplement la partie de la valeur moyenne à la valeur souhaitée (c’est-à-dire 66 à 70). Nous devons inclure l’autre moitié – de 0 à 66 – pour arriver à la bonne réponse.

Puisque 0 à 66 représente la moitié (c’est-à-dire une moyenne extrême à moyenne), sa probabilité est simplement de 0,5.

D’où la probabilité correcte qu’une personne mesure 70 pouces ou moins = 0,24857 + 0,5 = 0,74857 = 74,857%

Graphiquement (en calculant la surface), ce sont les deux régions additionnées représentant la solution:

  • Quelle est la probabilité qu’une personne mesure 75 pouces ou plus?

c’est-à-dire trouver P cumulatif complémentaire  (X> = 75).

Z = (X – moyenne) / stddev = (75-66) / 6 = 9/6 = 1,5

P (Z> = 1,5) = 1-P (Z <= 1,5) = 1 – (0,5 + 0,43319) = 0,06681 = 6,681%

  • Quelle est la probabilité qu’une personne se situe entre 52 pouces et 67 pouces?

Trouvez P (52 <= X <= 67).

P (52 <= X <= 67) = P [(52-66) / 6 <= Z <= (67-66) / 6] = P (-2,33 <= Z <= 0,17)

= P (Z <= 0,17) –P (Z <= -0,233) = (0,5 + 0,56749) – (0,40905) =

Cette table de distribution normale (et les valeurs z) est couramment utilisée pour tout calcul de probabilité sur les mouvements de prix attendus sur le marché boursier pour les actions et les indices. Ils sont utilisés dans le trading basé sur une fourchette, identifiant une tendance haussière ou baissière, indicateurs techniques basés sur des concepts de distribution normale de moyenne et d’écart type.