====== Différences ====== Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
statistiques_descriptives [2014/02/15 22:20] Léo Dumont [Les valeurs centrales] |
statistiques_descriptives [2016/09/03 15:36] (Version actuelle) |
||
---|---|---|---|
Ligne 6: | Ligne 6: | ||
Les valeurs centrales (mode, médiane, moyenne) sont des indicateurs statistiques simples d'emploi que l'on retrouve au cœur de toute exploration de données historiques. Elles permettent notamment de définir une norme à partir de laquelle il devient possible de comparer les différents individus de la population étudiée. Il est donc important de les connaître et savoir laquelle choisir. | Les valeurs centrales (mode, médiane, moyenne) sont des indicateurs statistiques simples d'emploi que l'on retrouve au cœur de toute exploration de données historiques. Elles permettent notamment de définir une norme à partir de laquelle il devient possible de comparer les différents individus de la population étudiée. Il est donc important de les connaître et savoir laquelle choisir. | ||
+ | |||
+ | === Les propriétés de Yule === | ||
Le statisticien George Udny Yule a défini six propriétés souhaitables pour les valeurs centrales : | Le statisticien George Udny Yule a défini six propriétés souhaitables pour les valeurs centrales : | ||
Ligne 17: | Ligne 19: | ||
^ Propriétés de Yule ^ Mode ^ Médiane ^ Moyenne ^ | ^ Propriétés de Yule ^ Mode ^ Médiane ^ Moyenne ^ | ||
- | | Être définie de façon objective | Row 1 Col 2 | Row 1 Col 3 | | | + | | Être définie de façon objective | - | + | + | |
- | | Dépendre de toutes les observations | Row 1 Col 2 | Row 1 Col 3 | | | + | | Dépendre de toutes les observations | - | - | + | |
- | | Avoir une signification concrète | Row 1 Col 2 | Row 1 Col 3 | | | + | | Avoir une signification concrète | + | + | - | |
- | | Être simple à calculer | Row 1 Col 2 | Row 1 Col 3 | | | + | | Être simple à calculer | + | + | + | |
- | | Être peu sensibles aux fluctuations d'échantillonage | Row 1 Col 2 | Row 1 Col 3 | | | + | | Être peu sensibles aux fluctuations d'échantillonage | - | + | + | |
- | | Se prêter au calcul algébrique | Row 1 Col 2 | Row 1 Col 3 | | | + | | Se prêter au calcul algébrique | - | - | + | |
+ | |||
+ | En suivant ces différents critères il n'y a donc pas de valeur centrale parfaite, mais alors comment faire un choix ? Tout dépend de la forme de la distribution étudiée. | ||
+ | |||
+ | === Valeurs centrales et formes de distribution === | ||
+ | |||
+ | == Distribution normale == | ||
+ | |||
+ | {{ :distribution_normale.png?350 |}} | ||
+ | |||
+ | Quand la distribution est //symétrique//, elle se rapproche d'une //loi normale//. Les trois valeurs centrales sont alors les mêmes et peuvent être utilisées indistinctement, mais on préfère souvent utiliser la **moyenne**. | ||
+ | |||
+ | == Distribution assymétrique (à droite ou à gauche) == | ||
+ | |||
+ | {{ :distribution_droite.png?350 |}} | ||
+ | |||
+ | {{ :distribution_gauche.png?350 |}} | ||
+ | |||
+ | Lorsque la distribution est //assymétrique// quelques individus aux valeurs extrêmes contribuent à étaler la courbe vers la droite ou la gauche. Dans ce type de situation il faut utiliser la **médiane**. | ||
+ | |||
+ | == Distribution multimodale == | ||
+ | |||
+ | {{ :distribution_multimodale.png?350 |}} | ||
+ | |||
+ | Lorsqu'il y a plusieurs zones de concentration principales des valeurs, alors la distribution est dite //multimodale//. On utilise alors les différents **modes** pour résumer l'information. | ||
==== La discrétisation ==== | ==== La discrétisation ==== | ||
==== Bibliographie ==== | ==== Bibliographie ==== |