Wiki PIREH

Des ressources pour utiliser le numérique en histoire

Outils pour utilisateurs

Outils du site


statistiques_descriptives

====== Différences ====== Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
statistiques_descriptives [2014/02/15 22:17]
Léo Dumont [Les valeurs centrales]
statistiques_descriptives [2016/09/03 15:36] (Version actuelle)
Ligne 6: Ligne 6:
  
 Les valeurs centrales (mode, médiane, moyenne) sont des indicateurs statistiques simples d'​emploi que l'on retrouve au cœur de toute exploration de données historiques. Elles permettent notamment de définir une norme à partir de laquelle il devient possible de comparer les différents individus de la population étudiée. Il est donc important de les connaître et savoir laquelle choisir. Les valeurs centrales (mode, médiane, moyenne) sont des indicateurs statistiques simples d'​emploi que l'on retrouve au cœur de toute exploration de données historiques. Elles permettent notamment de définir une norme à partir de laquelle il devient possible de comparer les différents individus de la population étudiée. Il est donc important de les connaître et savoir laquelle choisir.
 +
 +=== Les propriétés de Yule ===
  
 Le statisticien George Udny Yule a défini six propriétés souhaitables pour les valeurs centrales : Le statisticien George Udny Yule a défini six propriétés souhaitables pour les valeurs centrales :
Ligne 15: Ligne 17:
   - **Être peu sensibles aux fluctuations d'​échantillonage** :  cette propriété définit la robustesse de la mesure face à des erreurs qui peuvent apparaître (données mal codées, valeurs aberrantes/​extrêmes). La moyenne "​explose"​ en présence d'une valeur extrême alors que la médiane est très robuste. Le mode est en situation intermédiaire.   - **Être peu sensibles aux fluctuations d'​échantillonage** :  cette propriété définit la robustesse de la mesure face à des erreurs qui peuvent apparaître (données mal codées, valeurs aberrantes/​extrêmes). La moyenne "​explose"​ en présence d'une valeur extrême alors que la médiane est très robuste. Le mode est en situation intermédiaire.
   - **Se prêter au calcul algébrique** :  la moyenne se prête au calcul algébrique,​ ce qui n'est pas le cas du mode et de la médiane.   - **Se prêter au calcul algébrique** :  la moyenne se prête au calcul algébrique,​ ce qui n'est pas le cas du mode et de la médiane.
 +
 +^ Propriétés de Yule      ^ Mode       ^ Médiane ​         ^ Moyenne ^
 +| Être définie de façon objective ​   |  -     ​| ​ +       ​| ​ +  |
 +| Dépendre de toutes les observations ​   |  -     ​| ​ -        |  +  |
 +| Avoir une signification concrète ​   |  +     ​| ​ +       ​| ​ -  |
 +| Être simple à calculer ​  ​| ​ +     ​| ​ +        |  +  |
 +| Être peu sensibles aux fluctuations d'​échantillonage ​   |  -     ​| ​ +       ​| ​ +  |
 +| Se prêter au calcul algébrique ​  ​| ​  ​- ​    ​| ​ -        |  +  |
 +
 +En suivant ces différents critères il n'y a donc pas de valeur centrale parfaite, mais alors comment faire un choix ? Tout dépend de la forme de la distribution étudiée.
 +
 +=== Valeurs centrales et formes de distribution ===
 +
 +== Distribution normale ==
 +
 +{{ :​distribution_normale.png?​350 |}}
 +
 +Quand la distribution est //​symétrique//,​ elle se rapproche d'une //loi normale//. Les trois valeurs centrales sont alors les mêmes et peuvent être utilisées indistinctement,​ mais on préfère souvent utiliser la **moyenne**.
 +
 +== Distribution assymétrique (à droite ou à gauche) ==
 +
 +{{ :​distribution_droite.png?​350 |}}
 +
 +{{ :​distribution_gauche.png?​350 |}}
 +
 +Lorsque la distribution est //​assymétrique//​ quelques individus aux valeurs extrêmes contribuent à étaler la courbe vers la droite ou la gauche. Dans ce type de situation il faut utiliser la **médiane**.
 +
 +== Distribution multimodale ==
 +
 +{{ :​distribution_multimodale.png?​350 |}}
 +
 +Lorsqu'​il y a plusieurs zones de concentration principales des valeurs, alors la distribution est dite //​multimodale//​. On utilise alors les différents **modes** pour résumer l'​information.
  
 ==== La discrétisation ==== ==== La discrétisation ====
  
 ==== Bibliographie ==== ==== Bibliographie ====
statistiques_descriptives.1392499079.txt.gz · Dernière modification: 2016/09/03 15:37 (modification externe)