18 avril 2021 4:46

Qualité de l’ajustement

Table des matières

Développer

Qu’est-ce que Goodness-Of-Fit?

Le test de qualité d’ajustement est un test d’hypothèse statistique pour voir dans quelle mesure les données d’échantillon correspondent à une distribution d’une population avec une distribution normale. En d’autres termes, ce test montre si vos exemples de données représentent les données que vous vous attendez à trouver dans la population réelle ou si elles sont en quelque sorte biaisées. La qualité d’ajustement établit l’écart entre les valeurs observées et celles que l’on attendrait du modèle dans un cas de distribution normale.

Il existe plusieurs méthodes pour déterminer la qualité de l’ajustement. Certaines des méthodes les plus populaires utilisées dans les statistiques comprennent le chi carré, le test de Kolmogorov-Smirnov, le test d’Anderson-Darling et le test de Shipiro-Wilk.

Points clés à retenir

  • Les tests de qualité d’ajustement sont des tests statistiques visant à déterminer si un ensemble de valeurs observées correspond à celles attendues dans le modèle applicable.
  • Il existe plusieurs types de tests d’ajustement, mais le plus courant est le test du chi carré.
  • Le chi carré détermine s’il existe une relation entre les données catégorielles.
  • Le test de Kolmogorov-Smirnov – utilisé pour les grands échantillons – détermine si un échantillon provient d’une distribution spécifique d’une population.
  • Les tests de qualité d’ajustement peuvent vous montrer si vos données d’échantillon correspondent à un ensemble attendu de données d’une population avec une distribution normale.

Comprendre la qualité de l’ajustement

Les tests de qualité d’ajustement sont des méthodes statistiques souvent utilisées pour faire des inférences sur les valeurs observées. Ces tests déterminent la relation entre les valeurs réelles et les valeurs prédites dans un modèle et, lorsqu’ils sont utilisés dans la prise de décision, les tests de qualité d’ajustement peuvent aider à prédire les tendances et les modèles futurs.

Le test de qualité d’ajustement le plus courant est le test du chi carré, généralement utilisé pour les distributions discrètes. Le test du chi carré est utilisé exclusivement pour les données placées dans des classes (bacs) et nécessite une taille d’échantillon suffisante pour produire des résultats précis.



Les tests de qualité d’ajustement sont couramment utilisés pour tester la normalité des résidus ou pour déterminer si deux échantillons sont collectés à partir de distributions identiques.

Types de tests de qualité d’ajustement

Test du chi carré

Le test du chi carré, également connu sous le nom de test du chi carré pour l’indépendance, est une méthode statistique inférentielle qui teste la validité d’une affirmation faite sur une population basée sur un échantillon aléatoire. Cependant, il n’indique pas le type ou l’intensité de la relation. Par exemple, il ne conclut pas si la relation est positive ou négative.



Pour se qualifier pour le test du chi carré d’indépendance, les variables doivent être mutuellement exclusives.

Pour calculer la qualité de l’ajustement du chi carré, il est nécessaire de définir le niveau de signification alpha souhaité (par exemple, si votre niveau de confiance est de 95% ou 0,95, alors l’alpha est de 0,05), identifiez les variables catégorielles à tester et définir des énoncés d’hypothèses sur les relations entre eux. L’ hypothèse nulle affirme qu’aucune relation n’existe entre les variables, et l’hypothèse alternative suppose qu’une relation existe. La fréquence des valeurs observées est mesurée puis utilisée avec les valeurs attendues et les degrés de liberté pour calculer le chi carré. Si le résultat est inférieur à alpha, l’hypothèse nulle n’est pas valide, indiquant qu’il existe une relation entre les variables.

Test de Kolmogorov-Smirnov

Nommé d’après les mathématiciens russes Andrey Kolmogorov et Nikolai Smirnov, le test Kolmogorov-Smirnov (également connu sous le nom de test KS) est une méthode statistique qui détermine si un échantillon provient d’une distribution spécifique au sein d’une population. Le test de Kolmogorov-Smirnov – recommandé pour les grands échantillons (par exemple, plus de 2000) – n’est pas paramétrique, ce qui signifie qu’il ne repose sur aucune distribution pour être valide. Il focalise Le but est de prouver l’hypothèse nulle, qui est l’échantillon de la distribution normale.

Contrairement au test du chi carré, le test de Kolmogorov-Smirnov s’applique aux distributions continues. Comme le chi carré, il utilise une hypothèse nulle et alternative et un niveau alpha de signification. Null indique que les données suivent une distribution spécifique au sein de la population, et alternative indique que les données n’ont pas suivi une distribution spécifique au sein de la population. L’alpha est utilisé pour déterminer la valeur critique utilisée dans le test.

La statistique de test calculée, souvent notée D, détermine si l’hypothèse nulle est acceptée ou rejetée. Si D est supérieur à la valeur critique à alpha, l’hypothèse nulle est rejetée. Si D est inférieur à la valeur critique, l’hypothèse nulle est acceptée, indiquant

Test de Shipiro-Wilk

Le test de Shipiro-Wilk détermine si un échantillon suit une distribution normale. En utilisant un échantillon avec une variable de données continues, le test de Shipiro-Wilk vérifie uniquement la normalité. Il est recommandé pour des échantillons de petite taille jusqu’à 2000. Comme les autres, il utilise alpha et forme deux hypothèses: nulle et alternative. L’hypothèse nulle stipule que l’échantillon provient de la distribution normale, tandis que l’hypothèse alternative stipule que l’échantillon ne provient pas de la distribution normale.

Le test de Shipiro-Wilk utilise un diagramme de probabilité appelé diagramme QQ. Ce nuage de points affiche visuellement deux ensembles de quantiles sur l’axe y, disposés du plus petit au plus grand. Si chaque quantile provient de la même distribution, le nuage de points affichera une série linéaire de graphiques. Le test de Shipiro-Wilk utilise le diagramme QQ pour estimer la variance. En utilisant la variance QQ Plot avec la variance estimée de la population, on peut déterminer si l’échantillon appartient à une distribution normale. Si le quotient des deux variances est égal ou proche de 1, alors l’hypothèse nulle peut être acceptée. S’il est considérablement inférieur à 1, il peut être rejeté.

Exemple de test de qualité d’ajustement

Par exemple, un petit gymnase communautaire pourrait fonctionner en supposant qu’il a sa fréquentation la plus élevée les lundis, mardis et samedis, la fréquentation moyenne les mercredis et jeudis et la plus faible fréquentation les vendredis et dimanches. Sur la base de ces hypothèses, le gymnase emploie chaque jour un certain nombre de membres du personnel pour enregistrer les membres, nettoyer les installations, offrir des services de formation et donner des cours.

Cependant, le gymnase ne fonctionne pas bien financièrement et le propriétaire veut savoir si ces hypothèses de présence et les niveaux d’effectifs sont corrects. Le propriétaire décide de compter le nombre de participants au gymnase chaque jour pendant six semaines. Il peut ensuite comparer la fréquentation présumée du gymnase avec sa fréquentation observée en utilisant un test de qualité d’ajustement du chi carré par exemple. Avec les nouvelles données, il peut déterminer la meilleure façon de gérer le gymnase et d’améliorer la rentabilité.

FAQ sur la qualité de l’ajustement

Que signifie la qualité de l’ajustement?

La qualité d’ajustement est un test d’hypothèse statistique utilisé pour voir dans quelle mesure les données observées reflètent les données attendues. Les tests de qualité d’ajustement peuvent aider à déterminer si un échantillon suit une distribution normale, si des variables catégorielles sont liées ou si des échantillons aléatoires proviennent de la même distribution.

Pourquoi la qualité de l’ajustement est-elle importante?

Les tests de qualité d’ajustement aident à déterminer si les données observées correspondent à ce qui est attendu. Les décisions peuvent être prises en fonction du résultat du test d’hypothèse effectué. Par exemple, un détaillant veut savoir quel produit offre séduit les jeunes. Le détaillant interroge un échantillon aléatoire de personnes âgées et de jeunes pour identifier quel produit est préféré. En utilisant le chi carré, ils identifient qu’avec 95% de confiance, une relation existe entre le produit A et les jeunes. Sur la base de ces résultats, il a pu être déterminé que cet échantillon représente la population de jeunes adultes. Les spécialistes du marketing de détail peuvent l’utiliser pour réformer leurs campagnes.

Qu’est-ce que la qualité d’ajustement dans le test du chi carré?

Le chi carré teste s’il existe des relations entre les variables catégorielles et si l’échantillon représente le tout. Il estime dans quelle mesure les données observées reflètent les données attendues ou dans quelle mesure elles correspondent.

Comment faites-vous le test de qualité d’ajustement?

Le test Goodness-of-FIt comprend différentes méthodes de test. Le but du test aidera à déterminer la méthode à utiliser. Par exemple, si l’objectif est de tester la normalité sur un échantillon relativement petit, le test de Shipiro-Wilk peut convenir. Si vous souhaitez déterminer si un échantillon provient d’une distribution spécifique au sein d’une population, le test de Kolmogorov-Smirnov sera utilisé. Chaque test utilise sa propre formule unique. Cependant, ils ont des points communs, tels qu’une hypothèse nulle et un niveau de signification.

La ligne de fond

Les tests de qualité d’ajustement déterminent dans quelle mesure les données d’échantillon correspondent à ce que l’on attend d’une population. À partir des données d’échantillon, une valeur observée est recueillie et comparée à la valeur attendue calculée à l’aide d’une mesure de divergence. Il existe différents tests d’hypothèse d’ajustement disponibles en fonction du résultat que vous recherchez.

Le choix du bon test d’ajustement dépend en grande partie de ce que vous voulez savoir sur un échantillon et de sa taille. Par exemple, si vous souhaitez savoir si les valeurs observées pour les données catégorielles correspondent aux valeurs attendues pour les données catégorielles, utilisez le chi carré. Si vous voulez savoir si un petit échantillon suit une distribution normale, le test de Shipiro-Wilk peut être avantageux. Il existe de nombreux tests disponibles pour déterminer la qualité de l’ajustement.