dimanche 11 mars 2012

Au pays des Gnous bleus


« Ce n'est pas normal », « Ils ne sont pas normaux », « C'est devenu la norme », (de manger avec les doigts / de regarder des dessins animés de poney passé l'âge de dix ans / de parler de ce qui est normal et de ce qui l'est pas partout)

La normale est un terme qui m'escagasse au même titre que dire « X est dans l'ADN d'une société/sous-culture/parti politique ». De la novlangue à côté de la plaque que tout le monde utilise hors de son contexte sans savoir ce que ça veut dire.

Alors aujourd'hui nous allons voir ce qui se cache derrière le mot « normal » parce qu'après avoir enduré la journée de la femme et que tout le monde y aille de son avis pour dire ce qui est normal ou pas, fallait que ça sorte. Puis ça fait un bon prétexte pour utiliser un logiciel de statistique dénommé R et j'avais envie de l'utiliser un peu, ça tombe bien.

Reprenons depuis le début : Carl Friedrich Gauss est un mathématicien allemand qui vécu de 1777 à 1855 et qui était, c'est peu de le dire, particulièrement balèze. C'était à la fois un mathématicien, un physicien et un astronome. Il est impossible d'étudier l'un des trois domaines sans retomber sur lui à un moment ou un autre. Et la loi normale, c'est son œuvre, enfin, d'autres personnes ont participé à sa conception mais c'est surtout de son nom dont on se souvient.

Voilà, c'est dit : la norme est une loi mathématique. Comme pour tout ce qui associe « loi » et « mathématique » dans la même phrase, on a envie de se dire « abandonnez tout espoir en entrant ici, pauvres pêcheurs », (citation peu ou prou gravée à l'entrée des Enfers selon la Divine Comédie de Dante et Devil May Cry de Capcom).

Détendez-vous, il s'agit juste d'une loi de probabilité, et sa compréhension est très intuitive (Cependant, je ne vais pas indiquer les formules qui lui sont associées pour éviter de vous faire peur).

Exemple : Prenons un troupeau de gnous et demandant donc à Babette l'une des gnous, de nous parler de son troupeau. Comme il y a deux espèces de gnous et que le dimorphisme sexuel est assez marqué chez eux, nous ne nous occuperont que des gnous bleus femelles.
«  - Bonjour Babette.
-Yo.
- Aujourd'hui, je voudrais parler aux gens qui s'égarent ici du poids des femelles gnous bleus.
- Alors c'est simple : mes congénères de sexe féminin font généralement entre 120 et 180kg.
- Ce qu'on doit pouvoir reformuler sans dire de bêtise, avec une moyenne estimée à 150kg, avec un écart-type 30 kg ?
- Exactement.
- Est ce que cela veut dire que tout les individus font entre 120 et 180 kg ?
- Eh bien non, car il y a toujours quelques individus rachitiques ou très costaud qui se trouver hors de ses bornes. Ces valeurs mesurées sont des généralités et non des obligations ! »

Remercions ici Babette et laissons-la brouter dans la savane. Je vais maintenant utiliser R pour faire une petite simulation (et oui, je suis une femme qui simule des troupeaux de gnous, c'est comme ça).
Je commande donc 2000 gnous bleues avec une moyenne de 150kg avec un écart-type de 30kg (je mets les formules de R à destination des malheureux qui voudraient vérifier que je n'invente pas n'importe quoi):
GBF=pnorm(2000,150,30)
R a attaché derrière le sigle « GBF » 2000 poids de Gnous Bleus Femelles. Je vous épargne la liste des valeurs, c'est ennuyeux et ça prends de la place pour rien.
Et j'en fais un joli graphique représentant les individus regroupés selon leur poids.

hist(GBF,freq=FALSE,main="Distribution du poids de 2000 GBF et la courbe associée",xlab="poids des gnous",yaxt="n",ylab="nombre de Gnous concernés par tranche de poids")
lines(N,dnorm(N,150,30),col="red")

Ce qui nous donne :


Il y a deux choses sur ce graphique : d'abord la répartition des gnous théoriques selon leurs poids (les rectangles) et la courbe de probabilité (un pourcentage entre 0 et 1) de tomber sur un individu faisant ce poids si on en choisi un au hasard. C'est pour ça que je n'ai pas mis d'échelle d'ordonnée, y a deux trucs différents ici.

Comme prévu, la majorité des GBF se rapprochent peu ou prou des 150kg. Mais on peut aller plus loin.
Imaginons que Babette décide de peser une congénère, au hasard (situation certes improbable car Babette a d'autres lions à fouetter), ou pour un documentariste de filmer la première gnou qui arrive devant son objectif.
La loi normale permet de dire qu'à partir de cette distribution, la probabilité de tomber sur une gnou bleue de 150 kg est de …
>dnorm(150,150,30) #probabilité de trouver une gnou de 150kg si on a une moyenne de 150kg à 30kg près.
Ce qui nous donne... 1,3% !
Mais que s'est-il passé ?
C'est simple : nous avons là la probabilité que la gnou fasse pile 150kg, et pas 149,9 ou 150,1kg. Le poids est une donnée continue après tout (contrairement au nombre de petits que peut avoir une Gnou, qui aura du mal à avoir 1,5 petits dans sa vie). Comme si vous alliez choisir un pixel sur la courbe rouge (correspondant à la ligne verticale bleue du graphique ci-dessous).



Car en statistique, il faut opposer les machins continus (poids, taille, âge exact du capitaine) des machins pas continus, dits discrets (nombre de doigts, petits par portées, faces d'un dé, etc). Essayer de prendre un point précis sur une série de valeurs continues (notre poids des gnous), forcément ça ne donne rien.

Reprenons avec un intervalle pour avoir des résultats qui correspondent à une situation crédible: entre 145 et 155 kg (toutes les gnous qui se trouvent entre les deux barres bleues sur le nouveau graphique).


Je calcule ça comme ça:
Poids des gnous entre 145 et 155kg: 
> pnorm(155,150,30)-pnorm(120,145,30) #Ce qui veut dire "prenons la probabilité qu'un individu fasse entre 0 et 155 et enlevons lui la probabilité qu'il fasse entre 0 et 145kg, il restera juste la proba qu'il fasse entre 145 et 155kg.
La surface occupé par le graphique et donc la probabilité passe à 36%, ce qui est déjà plus concret. Deuxième essais entre 120 et 180kg ? 68% des gnous et des poussières. En plus ça tombe bien, 68% des gnous c'est pile la valeur qu'on devait retrouver dans un intervalle de [moyenne- écart-type ; moyenne + écart-type]. Le monde est bien fait je vous jure. Et sans faire le moindre calcul, je peux vous dire qu'avec l'intervalle Gnouesque [moyenne-1,96*écart-type ; moyenne+1,96 *écart-type] j'aurais pile-poil 95% des poids de gnous. C'est beau les statistiques.

Maintenant, une autre question très importante :
 est ce que c'est bien, pour une gnou bleue femelle, de peser entre 120 et 180 kg ?

Ça dépend. Une gnou de petit poids aura moins besoin de manger, qui est un avantage indéniable en cas de famine. Mais elle sera aussi plus vulnérable face aux prédateurs. Inversement, une gnou de 250 kg sera un individu balèze dans la savane, et les lions choisiront sûrement une proie plus maigrichonne et plus facile à attraper, mais devra manger beaucoup plus.
En l'état actuel de la savane, peser entre 120 et 180 kg est donc un compromis imposé par la génétique et les ressources disponibles (c'est bien beau d'avoir des gènes permettant d'atteindre les 500 kg mais s'il n'y a rien à se mettre sous la dent, l'animal n'ira pas loin).
Mais si les conditions changent, alors les individus hors-norme se retrouvent beaucoup plus avantagés. Et via la sélection naturelle, la norme va changer et ce qui était hors-norme sera la norme. Mais ce phénomène prendra un certain temps et l'ancienne « norme » persistera quelques temps (années ? Décennies ?) avant de disparaître.

Les Gnous ont de la chance : ils n'ont à se préoccuper que de la sélection naturelle (t'es pas adapté = tu meurs sans te reproduire) (et être adapté à une situation ne veut pas dire être dans la norme, puisque l'adaptation optimale change au fil du temps).
Les humains eux, adorent surveiller leurs semblables pour qu'ils soient dans la norme. Pourquoi ? Vaste question. Pour se tenir chaud ? On n'est pas des manchots empereurs entrain de couver. Pour survivre ? Pour réduire une menace ? Bof. Pour qu'une minorité puisse exercer sa domination sur une majorité ? Genre que ce qui était pas normal le devienne ? Ça ne nous dit pas pourquoi cette minorité voudrait être dans la norme à tout bout de champs. On pourrait très bien se foutre d'être dans la norme. Mais la plupart des individus n'y arrivent pas. Un reste d'instinct qui, privé de son contexte d'application, ne sert plus à rien et nous enquiquine plus qu'autre chose ? Peut-être.

8 commentaires:

  1. Vaste question qui touche tellement de domaines.
    To be or not to be in the flow?
    Qui fixe les normes, sinon l'habitude, la vie, la survie.
    L'analyse combinatoire tente de mettre tout cela en musique. L'écart-type maxi donne l'écart vis-à-vis d'une moyenne.
    Il est variable en fonction de l'environnement. Le même animal mis en dehors du sien, se retrouvera avec une courbe de Gauss différente.
    Les courbes des âges pour les hommes se différencient ainsi. Tirer des tendances, des extrapolations sous forme de graphique semble logique. L’homogénéité est-elle normale?
    Si c'était le cas, plus besoin de travailler. On gagnerait en Bourse sans problème.
    Mandelbrote a bien compris le problèmes des "exceptions" qui changent tout.
    Pourtant les sondages répondent souvent correctement à une situation avec un écart-type, une erreur de pourcentage.
    Tout n'est que chaos dans la nature. C'est l'homme qui croit pouvoir mettre tout en équation et ordonner sa vie avec l'entropie comme explication.

    RépondreSupprimer
    Réponses
    1. C'est pourquoi la courbe de Gauss n'est pas la seule loi de probabilité qui existe :) Il y a la loi de Poisson, la loi binomiale et bien d'autres encore. Les fractales ont été conçu à partir d'une loi de probabilité aussi par exemple.

      Et surtout, il ne faut pas oublier qu'il s'agit justement de probabilités et non de fait absolu. Et donc qu'on ne peut pas tomber toujours dans la norme. Comme dirait le sage Terry Pratchet "il est bien connu que la chance sur un million est la seule à se réaliser 9 fois sur 10"

      Supprimer
  2. prévenu au milieu d'un problème que sa femme était en train de mourir et Gauss aurait répondu : "Dites-lui d'attendre un moment que j'aie fini".
    Il attendait de mettre cela en formules... :-)

    RépondreSupprimer
  3. Tout à fait. Les effets collatéraux entrent aussi dans les statistiques.
    Le crash dans le tunnel suisse, x% de "chance"...
    Pour celui qui était dans le car, c'était 100% de... malchance.
    On veut tout expliquer, tout contrôler.
    Alors que tout n'est que chaos dans la nature.
    A lire de Christophe André "Méditer jour après jour"

    RépondreSupprimer
  4. C'est vrai que le désir d'être dans la norme s'enracine profondément dans notre culture. Culture, d'ailleurs, ou nature? Pas évident: les enfants sont littéralement obsédés par le besoin d'être comme les autres. Même adultes on n'échappe pas à la tyrannie de la moyenne pour nos goûts. Par exemple deux visages qu'on "moyenne" par morphing seront plus beaux que leurs modèles de départ (cf cet article à ce sujet). Certes les TRES beaux visages s'écartent de la moyenne... mais ils restent l'exception.

    RépondreSupprimer
  5. Je me demande si on pourrait faire une expérience d'éthologie pour confirmer. (Et encore, vu qu'on considère de plus en plus les grands singes comme étant doué d'une forme de culture, bonjour pour dire que c'est bien la nature).

    RépondreSupprimer
  6. Le Science et Avenir de cette semaine contient un article qui prend l'avis du statisticien Gilbert Saporta.
    Les moyennes, les médianes les déciles en font partie.

    RépondreSupprimer
  7. Postuler que le poids des gnous bleu femelles suive une loi normale me semble assez peu crédible. En effet, il existe des contraintes biologiques qui rendent les poids faibles moins probables, et, en pratique, quand on mesure la population humaine (taille, poids, etc.) on observe une courbe "en cloche" asymétrique, avec une pente forte au dessous de la moyenne, et une pente douce au delà de la moyenne.

    RépondreSupprimer