====== Différences ====== Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
statistiques_descriptives [2014/02/15 20:14] Léo Dumont [Les valeurs centrales] |
statistiques_descriptives [2016/09/03 15:36] (Version actuelle) |
||
---|---|---|---|
Ligne 6: | Ligne 6: | ||
Les valeurs centrales (mode, médiane, moyenne) sont des indicateurs statistiques simples d'emploi que l'on retrouve au cœur de toute exploration de données historiques. Elles permettent notamment de définir une norme à partir de laquelle il devient possible de comparer les différents individus de la population étudiée. Il est donc important de les connaître et savoir laquelle choisir. | Les valeurs centrales (mode, médiane, moyenne) sont des indicateurs statistiques simples d'emploi que l'on retrouve au cœur de toute exploration de données historiques. Elles permettent notamment de définir une norme à partir de laquelle il devient possible de comparer les différents individus de la population étudiée. Il est donc important de les connaître et savoir laquelle choisir. | ||
+ | |||
+ | === Les propriétés de Yule === | ||
Le statisticien George Udny Yule a défini six propriétés souhaitables pour les valeurs centrales : | Le statisticien George Udny Yule a défini six propriétés souhaitables pour les valeurs centrales : | ||
- | - **Être définie de façon objective** : | + | - **Être définie de façon objective** : deux personnes différentes traitant la même information doivent trouver le même résultat en ce qui concerne le calcul des valeurs centrales. Ceci est vrai pour la moyenne et la médiane mais pas pour le mode qui dépend du choix de l’amplitude de la classe adoptée. |
- | - **Dépendre de toutes les observations** : | + | - **Dépendre de toutes les observations** : la modification d'une seule observation doit entraîner une modification de la valeur centrale. Ceci est le cas de la moyenne mais pas du mode et de la médiane. |
- | - **Avoir une signification concrète** : | + | - **Avoir une signification concrète** : bien que la moyenne paraisse "naturelle" elle est en fait très abstraite alors que le mode peut être défini comme la situation la "plus fréquente" et la médiane comme celle "qui divise en deux la distribution" (un individu sur deux a une valeur inférieure ou supérieure à celle-ci). |
- | - **Être simple à calculer** : | + | - **Être simple à calculer** : toutes les valeurs centrales sont simples à calculer. |
- | - **Être peu sensibles aux fluctuations d'échantillonage** : | + | - **Être peu sensibles aux fluctuations d'échantillonage** : cette propriété définit la robustesse de la mesure face à des erreurs qui peuvent apparaître (données mal codées, valeurs aberrantes/extrêmes). La moyenne "explose" en présence d'une valeur extrême alors que la médiane est très robuste. Le mode est en situation intermédiaire. |
- | - **Se prêter au calcul algébrique** : | + | - **Se prêter au calcul algébrique** : la moyenne se prête au calcul algébrique, ce qui n'est pas le cas du mode et de la médiane. |
+ | |||
+ | ^ Propriétés de Yule ^ Mode ^ Médiane ^ Moyenne ^ | ||
+ | | Être définie de façon objective | - | + | + | | ||
+ | | Dépendre de toutes les observations | - | - | + | | ||
+ | | Avoir une signification concrète | + | + | - | | ||
+ | | Être simple à calculer | + | + | + | | ||
+ | | Être peu sensibles aux fluctuations d'échantillonage | - | + | + | | ||
+ | | Se prêter au calcul algébrique | - | - | + | | ||
+ | |||
+ | En suivant ces différents critères il n'y a donc pas de valeur centrale parfaite, mais alors comment faire un choix ? Tout dépend de la forme de la distribution étudiée. | ||
+ | |||
+ | === Valeurs centrales et formes de distribution === | ||
+ | |||
+ | == Distribution normale == | ||
+ | |||
+ | {{ :distribution_normale.png?350 |}} | ||
+ | |||
+ | Quand la distribution est //symétrique//, elle se rapproche d'une //loi normale//. Les trois valeurs centrales sont alors les mêmes et peuvent être utilisées indistinctement, mais on préfère souvent utiliser la **moyenne**. | ||
+ | |||
+ | == Distribution assymétrique (à droite ou à gauche) == | ||
+ | |||
+ | {{ :distribution_droite.png?350 |}} | ||
+ | |||
+ | {{ :distribution_gauche.png?350 |}} | ||
+ | |||
+ | Lorsque la distribution est //assymétrique// quelques individus aux valeurs extrêmes contribuent à étaler la courbe vers la droite ou la gauche. Dans ce type de situation il faut utiliser la **médiane**. | ||
+ | |||
+ | == Distribution multimodale == | ||
+ | |||
+ | {{ :distribution_multimodale.png?350 |}} | ||
+ | |||
+ | Lorsqu'il y a plusieurs zones de concentration principales des valeurs, alors la distribution est dite //multimodale//. On utilise alors les différents **modes** pour résumer l'information. | ||
+ | |||
+ | ==== La discrétisation ==== | ||
==== Bibliographie ==== | ==== Bibliographie ==== |