mercredi 11 août 2010

Mensonges statistiques (I)

Dans un article de la libre d'aujourd'hui on nous annonce fièrement:

"L'important patrimoine des familles belges n'est pas tellement imputable aux placements à succès mais au comportement enthousiaste des Belges pour l'épargne. Une famille belge moyenne possède 156.000 euros d'épargne et de placements."

En moyenne une famille belge possède 156.000 euros.

Vraiment ?
Dans un tel cas de figure la moyenne est sans doute le plus mauvais indicateur car elle a tendance à être influencée par les valeurs extrêmes. Evidemment comme dans tout article se référant aux stats nous n'avons pas la distribution. D'où difficulté d'analyser, toutefois voyons cela via un exemple.

Quelqu'un décide d'entrer dans une entreprise de dix personnes et l'on clamme que le salaire moyen est de 3700 euros brut. Heureux notre nouvel employé travail avec zèle et lors de son premier salaire il touche 1000 euros, stuppeur et tremblements...
Notre jeune ami s'est retrouvé floué pour la simple raison que si la distribution des salaires est la suivante:
1000,1000,1000,1000,1000,1000,1000,10000,10000,10000.
Soit 7 employés gagnent 1000 euros
3 managers (CEO,PDG,actionnaire) gagnent 10000 euros soit dix fois plus que les autres.
Alors, la moyenne salariale est bien de 3700 euros, toutefois elle est fortement influencée par les 3 gros salaires des managers. Donc, son salaire sera assez éloigné de 3700 euros.

Dans un tel cas de figure pour être honnête il vaut mieux utiliser la médianne (valeur de l'effectif à la moitié de la distribution ordonnée) et là nous aurions bien trouvé 1000 euros. Notez quand dans le cas d'une distribution normale ça ne pose pas vraiment de problème puisque la moyenne est égale à la médiane.

Dans le cas de l'épargne ci dessus, ce sera semblable car je doute personnellement que la distribution soit normale. La moyenne sera probablement influencée par les gros épargnants qui sont loin de représenter la grosse majorité. Quelqu'un d'honnête aurait donc donné la médiane plus proche de l'épargne réelle plutôt qu'une épargne moyenne fantasmée et certainement surévaluée...

2 commentaires:

  1. Vraiment très parlant comme exemple.
    Jyce, je me demandais si l'écart type n'aiderais pas a se faire une idée représentative de la fiabilité de la valeur moyenne?

    RépondreSupprimer
  2. Oui, l'écart type représente la dispersion autours de la moyenne et est utilisé pour déterminer l'intervalle de confiance autours de la moyenne. Cela donne la plage d'incertitude (l'erreur) autours de la moyenne.
    Plus l'écart type est élevé (ce qui sera le cas ici) plus l'intervalle de confiance sera élévé et moins ta moyenne sera précise. Ici si je ne me suis pas planté avec Excel ;-) l'écart type devrait être de 4347.413 ce qui est assez élevé.

    RépondreSupprimer