====== Différences ====== Ci-dessous, les différences entre deux révisions de la page.
| Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
|
statistiques_descriptives [2014/02/15 22:17] Léo Dumont [Les valeurs centrales] |
statistiques_descriptives [2016/09/03 15:36] (Version actuelle) |
||
|---|---|---|---|
| Ligne 6: | Ligne 6: | ||
| Les valeurs centrales (mode, médiane, moyenne) sont des indicateurs statistiques simples d'emploi que l'on retrouve au cœur de toute exploration de données historiques. Elles permettent notamment de définir une norme à partir de laquelle il devient possible de comparer les différents individus de la population étudiée. Il est donc important de les connaître et savoir laquelle choisir. | Les valeurs centrales (mode, médiane, moyenne) sont des indicateurs statistiques simples d'emploi que l'on retrouve au cœur de toute exploration de données historiques. Elles permettent notamment de définir une norme à partir de laquelle il devient possible de comparer les différents individus de la population étudiée. Il est donc important de les connaître et savoir laquelle choisir. | ||
| + | |||
| + | === Les propriétés de Yule === | ||
| Le statisticien George Udny Yule a défini six propriétés souhaitables pour les valeurs centrales : | Le statisticien George Udny Yule a défini six propriétés souhaitables pour les valeurs centrales : | ||
| Ligne 15: | Ligne 17: | ||
| - **Être peu sensibles aux fluctuations d'échantillonage** : cette propriété définit la robustesse de la mesure face à des erreurs qui peuvent apparaître (données mal codées, valeurs aberrantes/extrêmes). La moyenne "explose" en présence d'une valeur extrême alors que la médiane est très robuste. Le mode est en situation intermédiaire. | - **Être peu sensibles aux fluctuations d'échantillonage** : cette propriété définit la robustesse de la mesure face à des erreurs qui peuvent apparaître (données mal codées, valeurs aberrantes/extrêmes). La moyenne "explose" en présence d'une valeur extrême alors que la médiane est très robuste. Le mode est en situation intermédiaire. | ||
| - **Se prêter au calcul algébrique** : la moyenne se prête au calcul algébrique, ce qui n'est pas le cas du mode et de la médiane. | - **Se prêter au calcul algébrique** : la moyenne se prête au calcul algébrique, ce qui n'est pas le cas du mode et de la médiane. | ||
| + | |||
| + | ^ Propriétés de Yule ^ Mode ^ Médiane ^ Moyenne ^ | ||
| + | | Être définie de façon objective | - | + | + | | ||
| + | | Dépendre de toutes les observations | - | - | + | | ||
| + | | Avoir une signification concrète | + | + | - | | ||
| + | | Être simple à calculer | + | + | + | | ||
| + | | Être peu sensibles aux fluctuations d'échantillonage | - | + | + | | ||
| + | | Se prêter au calcul algébrique | - | - | + | | ||
| + | |||
| + | En suivant ces différents critères il n'y a donc pas de valeur centrale parfaite, mais alors comment faire un choix ? Tout dépend de la forme de la distribution étudiée. | ||
| + | |||
| + | === Valeurs centrales et formes de distribution === | ||
| + | |||
| + | == Distribution normale == | ||
| + | |||
| + | {{ :distribution_normale.png?350 |}} | ||
| + | |||
| + | Quand la distribution est //symétrique//, elle se rapproche d'une //loi normale//. Les trois valeurs centrales sont alors les mêmes et peuvent être utilisées indistinctement, mais on préfère souvent utiliser la **moyenne**. | ||
| + | |||
| + | == Distribution assymétrique (à droite ou à gauche) == | ||
| + | |||
| + | {{ :distribution_droite.png?350 |}} | ||
| + | |||
| + | {{ :distribution_gauche.png?350 |}} | ||
| + | |||
| + | Lorsque la distribution est //assymétrique// quelques individus aux valeurs extrêmes contribuent à étaler la courbe vers la droite ou la gauche. Dans ce type de situation il faut utiliser la **médiane**. | ||
| + | |||
| + | == Distribution multimodale == | ||
| + | |||
| + | {{ :distribution_multimodale.png?350 |}} | ||
| + | |||
| + | Lorsqu'il y a plusieurs zones de concentration principales des valeurs, alors la distribution est dite //multimodale//. On utilise alors les différents **modes** pour résumer l'information. | ||
| ==== La discrétisation ==== | ==== La discrétisation ==== | ||
| ==== Bibliographie ==== | ==== Bibliographie ==== | ||