Ce problème d'écart par rapport à la gaussienne sur les valeurs extrêmes, on l'a systématiquement. Ce n'est pas un problème de modèle. L'aléa inhérent à tout échantillon a un poids croissant lorsqu'on va vers des scores extrêmes. Si P est une probabilité proche de 1, (1-P) est proche de 0. Pour une variation assez mineure de P, on aura une variation considérable de (1-P) "en proportion".ils utilisent un modèle théorique fondé sur une répartition gaussienne (ils le disent et le reconnaissent, c'est approximatif mais cela leur simplifie la vie pour leurs calculs) qui n'est valable que pour prédire ce qui se passe autour de la moyenne... personnellement je vois pas trop l'intérêt de prendre l'hypothèse d'un modèle pour une population qui ne marche pas pour l'ensemble de la population.
C'est vrai pour la mesure de l'intelligence humaine autant que pour la longueur d'une cote sur une pièce produite industriellement. Je reprends un exemple sorti de l'industrie.
Si tu produits 100 pièces, que 95 sont bonnes, tu as 5% de rebuts. Si tu améliores ta chaine de production et que 99 pièces sont bonnes, tu as 1% de rebuts... 5 fois moins! Dit comme ça, ça a un effet waouh. Mais au final, tu n'as réussi à "gagner" que 4 pièces. Tu veux vendre les pièces bonnes en amortissant le coût de toute ta production. Tu veux récupérer 1 euro par pièce produite.
- dans les cas d'une production fiable à 95%, il faut que tu vendes tes 95 pièces à 1,05 euro
- dans les cas d'une production fiable à 99%, il faut que tu vendes tes 99 pièces à 1,01 euro
Tu as beau avoir divisé le nombre de rebuts par 5, l'impact sur le prix final est dérisoire (4 centimes).
Maintenant une autre situation: tu produits 100 pièces, tu as 50% de rebuts. Chaque pièce doit être vendue 2 euros pour amortir la production. Tu améliores ta chaine et tu divises les rebuts par 2, soit 25 désormais. 75 pièces sur 100 sont bonnes. Le nouveau prix de tes pièces est de 1,33 euros. Le prix unitaire a considérablement varié.
La morale de l'histoire, c'est que se focaliser sur la proportion au delà d'un seuil quand ce seuil est très proche de 100%, c'est complètement trompeur. Diviser un taux de rebut par 5 quand tu as un seuil de 95%, c'est rien. Diviser un taux de rebut par "seulement" 2 quand tu as un seuil à 50%, c'est énorme.
Quant à la représentativité de toute la population, ben l'outil est fiable pour 95 ou 98% de la population. L''améliorer pour seulement 2% de plus n'est pas une priorité absolue. Franchement, les surdoués ne sont pas le centre de l'univers, c'est pas bien grave si l'outil est peu précis pour 2% de la population, d'autant plus si ce sont 2% les plus intelligents. Binet, lors de la création de son outil, ne s'était même pas intéressé à la moitié haute de la population. Il ne cherchait à diagnostiquer que les gens en difficultés.