Statistiques
Que sont les statistiques?
La statistique est une branche des mathématiques appliquées qui implique la collecte, la description, l’analyse et l’inférence de conclusions à partir de données quantitatives. Les théories mathématiques derrière les statistiques reposent fortement sur le calcul différentiel et intégral, l’algèbre linéaire et la théorie des probabilités. Les statisticiens, les personnes qui font des statistiques, sont particulièrement soucieux de déterminer comment tirer des conclusions fiables sur les grands groupes et les phénomènes généraux à partir des caractéristiques observables de petits échantillons qui ne représentent qu’une petite partie du grand groupe ou un nombre limité d’exemples d’un phénomène général..
Les deux principaux domaines de la statistique sont appelés statistiques descriptives, qui décrivent les propriétés des données d’échantillon et de population, et statistiques inférentielles, qui utilisent ces propriétés pour tester des hypothèses et tirer des conclusions.
Certains outils et procédures statistiques courants sont les suivants:
- Descriptif
- Moyenne (moyenne)
- Variance
- Asymétrie
- Kurtosis
- Inférentiel
- Analyse de régression de doublure
- Analyse de variance ( ANOVA )
- Modèles Logit / Probit
- Test d’hypothèse nulle
Points clés à retenir
- Les statistiques sont l’étude et la manipulation des données, y compris les moyens de recueillir, d’examiner, d’analyser et de tirer des conclusions à partir des données.
- Les deux principaux domaines de la statistique sont les statistiques descriptives et inférentielles.
- Les statistiques peuvent être utilisées pour prendre des décisions d’affaires et d’investissement mieux informées.
Comprendre les statistiques
Les statistiques sont utilisées dans pratiquement toutes les disciplines scientifiques telles que les sciences physiques et sociales, ainsi que dans les affaires, les sciences humaines, le gouvernement et la fabrication. La statistique est fondamentalement une branche des mathématiques appliquées qui s’est développée à partir de l’application d’outils mathématiques, y compris le calcul et l’algèbre linéaire, à la théorie des probabilités.
En pratique, les statistiques sont l’idée que nous pouvons apprendre sur les propriétés de grands ensembles d’objets ou d’événements (une population ) en étudiant les caractéristiques d’un plus petit nombre d’objets ou d’événements similaires (un échantillon ). Parce que dans de nombreux cas, la collecte de données complètes sur une population entière est trop coûteuse, difficile ou carrément impossible, les statistiques commencent avec un échantillon qui peut être observé de manière pratique ou abordable.
Deux types de méthodes statistiques sont utilisées pour analyser les données: les statistiques descriptives et les statistiques inférentielles. Les statisticiens mesurent et rassemblent des données sur les individus ou les éléments d’un échantillon, puis analysent ces données pour générer des statistiques descriptives. Ils peuvent ensuite utiliser ces caractéristiques observées des données de l’échantillon, qui sont proprement appelées «statistiques», pour faire des inférences ou des suppositions éclairées sur les caractéristiques non mesurées (ou non mesurées) de la population en général, appelées paramètres.
Statistiques descriptives
Les statistiques descriptives se concentrent principalement sur la tendance centrale, la variabilité et la distribution des données d’échantillonnage. La tendance centrale signifie l’estimation des caractéristiques, un élément typique d’un échantillon ou d’une population, et comprend des statistiques descriptives telles que la moyenne, la médiane et le mode. La variabilité fait référence à un ensemble de statistiques qui montrent la différence entre les éléments d’un échantillon ou d’une population le long des caractéristiques mesurées, et comprend des mesures telles que la plage, la variance et l’ écart type.
La distribution fait référence à la «forme» globale des données, qui peut être représentée sur un graphique tel qu’un histogramme ou un diagramme à points, et comprend des propriétés telles que la fonction de distribution de probabilité, l’asymétrie et l’aplatissement. Les statistiques descriptives peuvent également décrire les différences entre les caractéristiques observées des éléments d’un ensemble de données. Les statistiques descriptives nous aident à comprendre les propriétés collectives des éléments d’un échantillon de données et constituent la base pour tester des hypothèses et faire des prédictions à l’aide de statistiques inférentielles.
Statistiques déductives
Les statistiques inférentielles sont des outils que les statisticiens utilisent pour tirer des conclusions sur les caractéristiques d’une population à partir des caractéristiques d’un échantillon et pour décider dans quelle mesure ils peuvent être certains de la fiabilité de ces conclusions. Sur la base de la taille de l’échantillon et de la distribution des données de l’échantillon, les statisticiens peuvent calculer la probabilité que les statistiques, qui mesurent la tendance centrale, la variabilité, la distribution et les relations entre les caractéristiques d’un échantillon de données, fournissent une image précise des paramètres correspondants de l’ensemble de la population d’où provient l’échantillon.
Les statistiques inférentielles sont utilisées pour faire des généralisations sur les grands groupes, telles que l’estimation de la demande moyenne pour un produit en sondant un échantillon des habitudes d’achat des consommateurs, ou pour tenter de prédire des événements futurs, comme la projection du rendement futur d’un titre ou d’une classe d’actifs en fonction. sur les retours dans une période d’échantillonnage.
L’ analyse de régression est une méthode courante d’inférence statistique qui tente de déterminer la force et le caractère de la relation (ou corrélation ) entre une variable dépendante (généralement désignée par Y) et une série d’autres variables (appelées variables indépendantes). La sortie d’un modèle de régression peut être analysée pour la signification statistique, ce qui fait référence à l’affirmation selon laquelle un résultat de constatations générées par des tests ou des expérimentations n’est pas susceptible de s’être produit au hasard ou par hasard, mais est plutôt susceptible d’être attribuable à une cause spécifique élucidée. par les données. Avoir une signification statistique est important pour les disciplines universitaires ou les praticiens qui dépendent fortement de l’analyse des données et de la recherche.
Questions fréquemment posées
Quelle est la différence entre les statistiques descriptives et inférentielles?
Les statistiques descriptives sont utilisées pour décrire ou résumer les caractéristiques d’un échantillon ou d’un ensemble de données, telles que la moyenne, l’écart type ou la fréquence d’une variable. Les statistiques inférentielles, en revanche, emploient n’importe quel nombre de techniques pour relier les variables d’un ensemble de données les unes aux autres, par exemple en utilisant une analyse de corrélation ou de régression. Ceux-ci peuvent ensuite être utilisés pour estimer les prévisions ou en déduire la causalité.
Qui utilise les statistiques?
Les statistiques sont largement utilisées dans un large éventail d’applications et de professions. À chaque fois que des données sont collectées et analysées, des statistiques sont établies. Cela peut aller des agences gouvernementales à la recherche universitaire en passant par l’analyse des investissements.
Comment les statistiques sont-elles utilisées en économie et en finance?
Les économistes recueillent et examinent toutes sortes de données, allant des dépenses de consommation aux mises en chantier en passant par l’inflation et la croissance du PIB. En finance, les analystes et les investisseurs collectent des données sur les entreprises, les industries, le sentiment et les données de marché sur les prix et le volume. Ensemble, l’utilisation de statistiques inférentielles dans ces domaines est connue sous le nom d’ économétrie. Plusieurs modèles financiers importants, du CAPM à la théorie moderne du portefeuille (MPT) et au modèle de tarification des options de Black-Scholes, reposent sur l’inférence statistique.