====== Différences ====== Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
statistiques_descriptives [2014/02/15 22:17] Léo Dumont [Les valeurs centrales] |
statistiques_descriptives [2016/09/03 15:36] (Version actuelle) |
||
---|---|---|---|
Ligne 6: | Ligne 6: | ||
Les valeurs centrales (mode, médiane, moyenne) sont des indicateurs statistiques simples d'emploi que l'on retrouve au cœur de toute exploration de données historiques. Elles permettent notamment de définir une norme à partir de laquelle il devient possible de comparer les différents individus de la population étudiée. Il est donc important de les connaître et savoir laquelle choisir. | Les valeurs centrales (mode, médiane, moyenne) sont des indicateurs statistiques simples d'emploi que l'on retrouve au cœur de toute exploration de données historiques. Elles permettent notamment de définir une norme à partir de laquelle il devient possible de comparer les différents individus de la population étudiée. Il est donc important de les connaître et savoir laquelle choisir. | ||
+ | |||
+ | === Les propriétés de Yule === | ||
Le statisticien George Udny Yule a défini six propriétés souhaitables pour les valeurs centrales : | Le statisticien George Udny Yule a défini six propriétés souhaitables pour les valeurs centrales : | ||
Ligne 15: | Ligne 17: | ||
- **Être peu sensibles aux fluctuations d'échantillonage** : cette propriété définit la robustesse de la mesure face à des erreurs qui peuvent apparaître (données mal codées, valeurs aberrantes/extrêmes). La moyenne "explose" en présence d'une valeur extrême alors que la médiane est très robuste. Le mode est en situation intermédiaire. | - **Être peu sensibles aux fluctuations d'échantillonage** : cette propriété définit la robustesse de la mesure face à des erreurs qui peuvent apparaître (données mal codées, valeurs aberrantes/extrêmes). La moyenne "explose" en présence d'une valeur extrême alors que la médiane est très robuste. Le mode est en situation intermédiaire. | ||
- **Se prêter au calcul algébrique** : la moyenne se prête au calcul algébrique, ce qui n'est pas le cas du mode et de la médiane. | - **Se prêter au calcul algébrique** : la moyenne se prête au calcul algébrique, ce qui n'est pas le cas du mode et de la médiane. | ||
+ | |||
+ | ^ Propriétés de Yule ^ Mode ^ Médiane ^ Moyenne ^ | ||
+ | | Être définie de façon objective | - | + | + | | ||
+ | | Dépendre de toutes les observations | - | - | + | | ||
+ | | Avoir une signification concrète | + | + | - | | ||
+ | | Être simple à calculer | + | + | + | | ||
+ | | Être peu sensibles aux fluctuations d'échantillonage | - | + | + | | ||
+ | | Se prêter au calcul algébrique | - | - | + | | ||
+ | |||
+ | En suivant ces différents critères il n'y a donc pas de valeur centrale parfaite, mais alors comment faire un choix ? Tout dépend de la forme de la distribution étudiée. | ||
+ | |||
+ | === Valeurs centrales et formes de distribution === | ||
+ | |||
+ | == Distribution normale == | ||
+ | |||
+ | {{ :distribution_normale.png?350 |}} | ||
+ | |||
+ | Quand la distribution est //symétrique//, elle se rapproche d'une //loi normale//. Les trois valeurs centrales sont alors les mêmes et peuvent être utilisées indistinctement, mais on préfère souvent utiliser la **moyenne**. | ||
+ | |||
+ | == Distribution assymétrique (à droite ou à gauche) == | ||
+ | |||
+ | {{ :distribution_droite.png?350 |}} | ||
+ | |||
+ | {{ :distribution_gauche.png?350 |}} | ||
+ | |||
+ | Lorsque la distribution est //assymétrique// quelques individus aux valeurs extrêmes contribuent à étaler la courbe vers la droite ou la gauche. Dans ce type de situation il faut utiliser la **médiane**. | ||
+ | |||
+ | == Distribution multimodale == | ||
+ | |||
+ | {{ :distribution_multimodale.png?350 |}} | ||
+ | |||
+ | Lorsqu'il y a plusieurs zones de concentration principales des valeurs, alors la distribution est dite //multimodale//. On utilise alors les différents **modes** pour résumer l'information. | ||
==== La discrétisation ==== | ==== La discrétisation ==== | ||
==== Bibliographie ==== | ==== Bibliographie ==== |