Wiki PIREH

Des ressources pour utiliser le numérique en histoire

Outils pour utilisateurs

Outils du site


statistiques_descriptives

Statistiques descriptives

Introduction

Les valeurs centrales

Les valeurs centrales (mode, médiane, moyenne) sont des indicateurs statistiques simples d'emploi que l'on retrouve au cœur de toute exploration de données historiques. Elles permettent notamment de définir une norme à partir de laquelle il devient possible de comparer les différents individus de la population étudiée. Il est donc important de les connaître et savoir laquelle choisir.

Les propriétés de Yule

Le statisticien George Udny Yule a défini six propriétés souhaitables pour les valeurs centrales :

  1. Être définie de façon objective : deux personnes différentes traitant la même information doivent trouver le même résultat en ce qui concerne le calcul des valeurs centrales. Ceci est vrai pour la moyenne et la médiane mais pas pour le mode qui dépend du choix de l’amplitude de la classe adoptée.
  2. Dépendre de toutes les observations : la modification d'une seule observation doit entraîner une modification de la valeur centrale. Ceci est le cas de la moyenne mais pas du mode et de la médiane.
  3. Avoir une signification concrète : bien que la moyenne paraisse “naturelle” elle est en fait très abstraite alors que le mode peut être défini comme la situation la “plus fréquente” et la médiane comme celle “qui divise en deux la distribution” (un individu sur deux a une valeur inférieure ou supérieure à celle-ci).
  4. Être simple à calculer : toutes les valeurs centrales sont simples à calculer.
  5. Être peu sensibles aux fluctuations d'échantillonage : cette propriété définit la robustesse de la mesure face à des erreurs qui peuvent apparaître (données mal codées, valeurs aberrantes/extrêmes). La moyenne “explose” en présence d'une valeur extrême alors que la médiane est très robuste. Le mode est en situation intermédiaire.
  6. Se prêter au calcul algébrique : la moyenne se prête au calcul algébrique, ce qui n'est pas le cas du mode et de la médiane.
Propriétés de Yule Mode Médiane Moyenne
Être définie de façon objective - + +
Dépendre de toutes les observations - - +
Avoir une signification concrète + + -
Être simple à calculer + + +
Être peu sensibles aux fluctuations d'échantillonage - + +
Se prêter au calcul algébrique - - +

En suivant ces différents critères il n'y a donc pas de valeur centrale parfaite, mais alors comment faire un choix ? Tout dépend de la forme de la distribution étudiée.

Valeurs centrales et formes de distribution

Distribution normale

Quand la distribution est symétrique, elle se rapproche d'une loi normale. Les trois valeurs centrales sont alors les mêmes et peuvent être utilisées indistinctement, mais on préfère souvent utiliser la moyenne.

Distribution assymétrique (à droite ou à gauche)

Lorsque la distribution est assymétrique quelques individus aux valeurs extrêmes contribuent à étaler la courbe vers la droite ou la gauche. Dans ce type de situation il faut utiliser la médiane.

Distribution multimodale

Lorsqu'il y a plusieurs zones de concentration principales des valeurs, alors la distribution est dite multimodale. On utilise alors les différents modes pour résumer l'information.

La discrétisation

Bibliographie

statistiques_descriptives.txt · Dernière modification: 2016/09/03 15:36 (modification externe)