Limites des tests

Les tests sont loin d’être des instruments de mesure fiable. Ce ne sont pas des thermomètres.
En premier lieu, les tests les plus utilisés en France, les échelles de Wechsler, possèdent des qualités psychométriques piètres pour les personnes à haut potentiel. En second lieu, les personnes à haut potentiel présentent des profils très hétérogènes au sein même de ces échelles (différences intra-individuelles), ce qui rend illégitime le calcul d’un Q.I. total. Ensuite, il existe d’importantes différences inter-individuelles issues notamment du milieu socio-professionnel, socioculturel ainsi que de l’éducation qui fournit des différences inter-genre. En dernier lieu, il existe plusieurs autres variables qui peuvent perturber les résultats au test.

 

1. Les échelles de Wechsler : des qualités psychométriques non valables pour les HP

 

Pour être accepté par la communauté des scientifiques mais aussi des praticiens,  un test doit répondre à certaines qualités psychométriques telles que la validité, la sensibilité  et la fidélité  (voir La théorie des tests). Les échelles de Wechsler possèdent de bonnes qualités psychométriques pour les personnes « tout-venant »,  mais qu’en est-il de ces qualités pour les personnes à haut potentiel ?

 

1.1 Sensibilité des échelles de Wechsler

La sensibilité d’un test est sa qualité à bien différencier les individus entre eux.


a) Effet plafond

Il est fréquent de constater que les personnes à haut potentiel « réussissent » tous les items d’un ou de plusieurs subtests. C’est ce que l’on appelle l’effet plafond.

En fait, l’étalonnage tel qu’il a été construit, ne fournit pas une étendue des scores suffisante pour mesurer correctement le niveau intellectuel des personnes présentant des compétences extrêmes.

A l’origine de cet effet, on trouve des contraintes psychométriques imposées lors de la construction du test :

-    L’étalonnage est construit de manière à représenter la population, c’est-à-dire des personnes “tout-venant”. Autrement dit, il est construit de manière à ce que les sujets se répartissent selon le modèle théorique de la loi normale (voir la courbe ici). Et d’après cette loi normale, il y a peu de sujets extrêmes. Il y aurait ainsi au sein de l’échantillon d’étalonnage moins de 3 enfants par tranche d’âge qui ont un QI > 130 (selon Virgnaud, 2002, cité par Caroff, à propos du WISC III). Donc, lorsqu’un enfant à haut potentiel passe un test, il est comparé aux performances de seulement 3 enfants à haut potentiel du même âge. Ainsi son QI peut passer par exemple de 140 à 157 avec très peu de différences de performance.

-    Les items des différents subtests sont construits de manière à différencier la majorité de la population. Ils doivent donc être ni trop faciles, ni trop difficiles. Or, l’estimation de la difficulté d’un item dépend des caractéristiques de la population sur laquelle elle a été calculée (Caroff, 2006), ici donc sur des sujets “tout venant”. Il est donc logique que les items revêtent un caractère plutôt facile pour les personnes à haut potentiel.

 

b) Effet Flynn
Cet effet désigne une augmentation régulière du QI à travers les générations.

Flynn (1984) a remarqué qu’en faisant passer deux versions d’un même test à des sujets (versions étalonnées à deux périodes différentes), les sujets avaient de meilleures notes pour la version du test dont l’étalonnage était le plus ancien. Le gain de QI correspondait à 1/3 de point par année pour des sujets américains “tout-venant”.

Larrabee et Holroyd (1976) ont également retrouvé cet effet chez les enfants à haut potentiel à HP. Ils ont constaté que le QI global au WISC première version était supérieur de plus de 10 points à celui obtenu au WISC-R (deuxième version du test).

C’est en partie pour cette raison que les étalonnages sont régulièrement remis à jour sous peine de devenir obsolètes.

Par ailleurs, il est important de préciser que l’augmentation du Q.I. total ne concerne pas tous les subests mais ceux liés à l’Indice de Raisonnement Perceptif, alors que les subtests liés à l’Indice de Compréhension Verbale ont tendance à voir leurs performances baisser. Ceci est dû à l’exposition progressive au siècle dernier de la population aux images abstraites avec l’arrivée de la télévision puis des nouvelles technologies (notamment, des jeux comme Tetris ont permis de développer certaines capacités visuo-spatiales).

1.2. Fidélité

Pour vérifier si un test est fidèle, on réplique la mesure dans les mêmes conditions de passation (technique du test-retest) mais avec un temps suffisamment long pour éviter tout effet apprentissage, et on analyse les corrélations entre les deux résultats. Le test est d’autant plus fidèle si cette corrélation tend vers 1 (voir La théorie des tests).

Ellsey et Karnes (1990) ont fait passer à des enfants à haut potentiel deux fois la version révisée du WISC (le WISC-R) à 1 ou 2 ans d’intervalle. Les résultats montrent que les QI corrèlent assez peu entre ces deux mesures : les corrélations sont de 0,49 pour le QIT, 0,33 pour le QI verbal et 0,57 pour le QI performance, alors qu’elles sont de 0,90 pour les enfants “tout-venant”. Ceci signifie que si on fait passer le test une seconde fois à un enfant « tout venant », il obtiendra à peu près les mêmes résultats alors que les résultats d’un enfant à haut potentiel varieront énormément entre les deux passations.

L’auteur  de ce site a observé jusqu’à maximum 50 points d’écart entre de passation de WISC réalisé à un intervalle de 5 ans : la première évaluation fut pratiquée par une autre psychologue, la seconde par elle-même.

Le manuel de la WAIS IV  fournit les coefficients de fidélité  pour  des groupes spécifiques  comme le groupe Haut potentiel,  retard mental,  trouble de la lecture , du calcul, trouble de l’attention,  trouble autistique,  trouble dépressif  ou encore probable démence Alzheimer, comparés au coefficient de fidélité  du groupe tout-venant.  On observe que le groupe haut potentiel possède  le coefficient  de fidélité le plus faible  de tous les groupes  spécifiques et qu’il est inférieur à la moyenne .

 

Il est alors légitime de se poser deux questions :

1/ N’y aurait-il pas « autre chose » qui puisse expliquer l’absence de stabilité des performances ? « autre chose » pouvant être quelque chose de cognitif, d’émotionnel, de relationnel etc…

2/ Est-ce que les tests mesurent bien ce qu’ils sont sensés mesurer ? C’est là le but des études de validité des tests :

1.3. Validité

La validité est la capacité d’un outil à mesurer ce qu’il est sensé mesurer, selon l’utilisation que l’on veut en faire. Il existe plusieurs types de validité.

En ce qui concerne les enfants à haut potentiel, il a été démontré que (Caroff et al., 2006) :

-    L’Indice de Compréhension Verbale et l’Indice de Raisonnement Perceptif mesurent la même chose que pour les enfants “tout-venant”, mais pas l’Indice de Mémoire de Travail ni l’Indice de Vitesse de Traitement. Il semblerait alors que d’autres choses entrent en ligne de compte pour ces deux derniers indices. De plus, tous les subtests comportant une limite de temps ne sont pas valides pour le diagnostic des enfants haut potentiel, notamment parce que vitesse de traitement neuronale n’implique pas forcément une vitesse psychomotrice.

-    Les performances des enfants à haut potentiel aux différents tests d’intelligence (WISC, Matrices Progressives de Raven et le Standford-Binet) sensés tous mesurer le facteur g ne sont pas corrélées, alors que les corrélations sont généralement comprises entre 0,40 et 0,75 pour les enfants “tout-venant”. En d’autres termes, si on test un enfant « tout venant » avec le WISC, les Matrices de Raven ou le Standford-Binet, ses résultats, c’est-à-dire son classement par rapport aux autres enfants seront équivalents. Par contre, les résultats d’un enfant à haut potentiel à l’ensemble de ces tests ne sont pas identiques et varient énormément. Il n’y aurait donc pas, pour ces enfants, de point commun (en l’occurrence le facteur g) entre ce qui est mesuré à travers tous ces tests,  ou tout autre du mois, ce point commun ne serait pas mis en valeur dans le test.

 

1.4. Alors, facteur g ou pas facteur g ?

Liratni (2009) propose de remettre en cause la notion théorique du facteur g, « non pas dans les zones normales, mais plutôt dans les zones extrêmes ». En effet, Detterman & Daniel (1989) ont mis en évidence que les corrélations avec le facteur g étaient plus fortes chez les personnes dont le QI est < 70 (chez les déficients intellectuels). Ils en concluent qu’étant donné que le poids du facteur g n’est pas identique selon les niveaux intellectuels, son existence en tant qu’entité unique ne peut être pertinente. Ainsi, le facteur g serait davantage représentatif du déficit intellectuel que de l’intelligence dite normale. Liratni (2009) cite Facon (2003, 2004) qui s’appuie sur la « loi des rendements décroissants » de Spearman pour expliquer ce phénomène. Selon Facon, plus le QI est élevé, plus le poids du facteur g diminue, alors que le poids des facteurs spécifiques augmente.

 

Il apparaît donc que les échelles de Wechsler possèdent d’excellentes qualités psychométriques – sensibilité, fidélité et validité – pour une population “tout-venant” mais de piètres qualités psychométriques pour les personnes à Haut Potentiel.

De plus,  l’homogénéité entre les indices pour une personne à haut potentiel est assez rare , ce qui rend le Q.I. total non significatif  et rend ce  nombre réducteur.

 

2. Différences intra-individuelles : Hétérogénéité des profils hauts potentiels dans le QI

 

Il est temps de regarder de plus près le profil des personnes surdouées car l’on croit souvent à tort que ces personnes réussissent de manière significative tous les tests et leurs subtests. Or, il existe de nombreuses différences, que celles-ci soient intra-individuelles ou inter-individuelles.

 

2.1. La Dyssynchonie existe-t-elle ?

Terrassier (1981) a pointé le décalage que l’on peut parfois observer chez les enfants à haut potentiel entre la rapidité du développement de leur intelligence, et le développement des capacités psychomotrices et socio-affectives. Ce décalage crée un contraste que Terrassier a nommé dyssynchronie (cette notion existait bien avant aux États-Unis sous le terme d’« asynchronie »).

La dyssynchronie intelligence/psychomotricité se traduit par des crispations musculaires, une hypertonie au niveau de la motricité fine, notamment dans les activités d’écriture car la main ne va pas aussi vite que la pensée. Cette difficulté peut amener l’enfant à réaliser des fautes car toute son attention est focalisée sur la tâche d’écriture au détriment de la grammaire.

Selon Vaivre-Douret, qui a étudié des cohortes de nouveau-nés jusqu’à leur scolarité puis jusqu’à ce qu’un test fut réalisé a ainsi pu étudier de manière longitudinale le développement cognitif et psychomoteur de tout type d’enfants, notamment des enfants qui se sont révélés lors des tests être à haut potentiel. Ces derniers présentaient certes une avance cognitive telle qu’un langage précoce mais également un développement psychomoteur en avance des autres enfants du même âge. Cette avance au niveau psychomoteur se perdrait par la suite, principalement à l’entrée dans la scolarité. Selon l’auteur, c’est l’école qui produit une frustration et qui crée ce décalage. L’auteur évoque également une seconde source de ralentissement du développement psychomoteur qui sont les parents qui parfois, maladroitement, mettent en avant le côté intellectuel de l’enfant au détriment du côté psychomoteur.

Ce décalage entre intelligence et psychomotricité serait donc constitutif et non intrinsèque.

 

Revenons maintenant au fameux test de QI et analysons les résultats des personnes à haut potentiel à ce test. En effet, et contrairement à ce que l’on peut croire, les personnes à haut potentiel ne réussissent pas à tous les subtests du WISC ou de la WAIS et un certain profil type bien caractéristique se dessine.

2.2 Différences entre les indices

Silver & Clampit (1990) ont comparé à partir du WISC-R la fréquence d’observation d’écarts significatifs (ie. plus de 12 points d’écart entre les QI verbal et performance) au sein d’un échantillon de plus de 2200 enfants américains. Ils ont observé chez les enfants précoces (QIT > 130) une fréquence d’écarts 4 fois plus élevée entre les QI verbal et performance que chez les enfants dont le QI est moyen. Cette fréquence était même jusqu’à 5 fois plus élevée chez les enfants dont le QI était supérieur à 140. Les auteurs en concluent que la différence intra-individuelle n’est pas rare chez les personnes Haut Potentiel et qu’elle ne doit pas être considérée comme provenant d’un trouble cognitif.

Hollinger & Kosek (1986) précisent que pour 34% des enfants à Haut Potentiel, il existe un écart significatif entre les deux échelles du WISC-R. Dans 15% des cas, le QI verbal est supérieur au QI performance, et dans 19% des cas, le QI performance est supérieur au QI verbal. Cependant on regrette que leur échantillon soit très faible (n = 26 enfants).

 

Plus récemment, deux études se sont attachées à analyser le profil psychométrique des enfants à Haut-Potentiel au WISC III, en comparaison avec celle parue dans le manuel d’interprétation du WISC III et dont le nombre de sujets reste par définition faible  (cf. la loi normale) c’est-à-dire ici n= 80. Ces deux études sont celle de Bessou et al. (2005) dont le nombre de sujets est 245 et celle de Morin (2011) dont le nombre de sujets est 273. Concernant cette dernière étude, et contrairement aux autres études, les critères d’inclusion ne correspondent pas à un seuil de QIT 130, ni de QIT 125 comme le suggère Terrassier, mais un seuil de 125 à au moins un des indices, afin, selon l’auteur « de ne pas risquer de laisser de côté les enfants surdoués les plus en difficulté en raison de profils hétérogènes et de tester les différents seuils comme déterminant du surdouement ».

comparatif des QIV, QIP et QIT au WISC III via trois grandes études (manuel WISC, Bessou et Morin)

Source : Pierre Morin (acis-pm.org)

 

Dans chacune des 3 études, on remarque que les courbes présentent le même profil : une échelle Verbale haute au détriment de l’échelle Performance, plus faible. L’auteur souligne qu’avec des critères d’inclusion différents (seuil à 125 à l’un des trois QI seulement), la courbe des performances présente la même forme, avec une baisse logique des valeurs. Le fait que le QIP soit plus bas – donc moins stable –  dans l’étude de Bessou alors que le seuil d’inclusion est pourtant supérieur ne signifie pas, selon l’auteur, que ces compétences sont moins efficaces chez les enfants à Haut Potentiel, mais qu’elles représentent une « fragilité d’expression des aptitudes en raison des pressions normalisatrices, notamment du milieu scolaire ».

 

2.3. Différences au niveau des subtests

Revenons un instant à l’étude de Hollinger & Kosek (1986) sur le WISC-R. Les auteurs ont observé que pour 86,4% des enfants de l’étude, les performances à certains subtests étaient soit significativement supérieures soit significativement inférieures aux performances moyennes. C’est ainsi qu’ils ont mis en évidence que les subtests suscitant le moins de variabilité intra-individuelle font tous appel au raisonnement, alors que les subtests dont la variabilité intra-individuelle est la plus importante font partie de l’échelle Performance et font appel à la mémoire visuelle, à la motricité fine et à l’aptitude à traiter visuellement des stimuli abstraits.

 

Subtests

Pourcentage de sujets qui ont un score plus bas que le score moyen

Pourcentage de sujets qui ont un score plus haut que le score moyen

Pourcentage total

Cubes

19

27

46

Code

23

12

35

Complètement d’images

19

4

23

Assemblage d’objets

0

15

15

Arrangement d’images

4

4

8

Arithmétique

12

0

12

Vocabulaire

4

8

12

Similitudes

0

8

8

Compréhension

4

4

8

Information

12

4

16

Pourcentage de sujets dont le score est significativement plus élevé ou plus faible que le score moyen selon les différents subtests du WISC-R (Hollinger & Kosek (1986))

Pour Kaufman (1992), cette hétérogénéité s’explique par le système de cotation basé sur l’attribution de points bonus en fonction de la vitesse de réponse. Selon lui, les enfants à Haut Potentiel seraient sous-évalués dans ces subtests, non pas en raison d’un niveau de performance moindre, mais parce que la vitesse de réponse n’est pas importante pour ces enfants, ce que suggère d’ailleurs Morin dans son étude.

Ce dernier met en évidence dans son étude comparative (Morin, 2011) l’existence d’un profil identique, caractéristique des surdoués, qui est bien différent de celui des personnes dont le QI est dans la norme (courbe grise et a tendance plate ci-dessous). Certains subtests sont particulièrement bien réussis (Similitudes, Compréhension, Vocabulaire), alors que d’autres sont moins réussis, voire « justes » dans la norme (Arithmétique et Code).

Comparatif des subtests au WISC III via 3 grandes études

Source : Pierre Morin (acis-pm.org)

 

Si l’on analyse ces résultats en fonction du QIT, on observe que les courbes présentent une forme similaire du QIT 110 au QIT 160 (rappelons que le seuil fixé ici est de 125 à au moins un des trois QI – QIV, QIP ou QIT – et que dans ce cas, le QIT peut être égal à 110), seul le niveau baisse.

comparatif_notes_santard_par_QIT

Source : Pierre Morin (acis-pm.org)

 

L’auteur conclue que si cette courbe est bien significative du surdouement, il y a lieu de s’interroger sur l’utilisation du seul QIT comme technique d’identification, tout comme les seuils à 130 ou à 125. Il propose alors, pour les QIT n’atteignant pas les 130 fatidiques, d’étudier de manière plus précise le profil de la courbe des notes standard.

 

Les différences et décalages que peuvent présenter les  personnes surdouées n’apparaissent pas seulement au niveau des résultats aux tests, c’est-à-dire de façon intra-individuelle ; elles peuvent également apparaître à un niveau inter-individuelle  et résulter de l’influence de l’environnement sur celui de l’inné.

 

3. Différences inter-individuelles : influence de l’inné et de l’acquis

3.1.Héritabilité et Influence du milieu socio-culturel

L’intelligence est une entité qui est généralement considérée comme possédant une grande part d’inné. Cependant, il est admis que dans tout processus psychologique, l’environnement joue un certain rôle. Pour tenter de comprendre l’interaction entre l’inné et l’acquis dans le développement, deux principales méthodes sont utilisées : la méthode des jumeaux et la méthode des adoptions.

La méthode des jumeaux consiste à comparer des jumeaux monozygotes (MZ) ou “vrais jumeaux” à des jumeaux dizygotes (DZ) ou “faux jumeaux”. Puisque les jumeaux monozygotes partagent 100% des gènes, et les dizygotes ne partagent les gènes que de simples frères ou sœurs, on peut mesurer l’impact de la ressemblance génétique (donc de l’inné) sur l’intelligence.
Dans une revue de la littérature, Loehlin (1989) indique que la corrélation obtenue entre la mesure de l’intelligence chez des jumeaux monozygotes est de 0,86, alors que celle obtenue chez des jumeaux dizygotes n’est que de 0,60 (la corrélation parfaite étant de 1). En d’autres termes, les performances de jumeaux monozygotes se ressemblent davantage que celles de jumeaux dizygotes, et donc, il y aurait bien une part génétique dans l’intelligence.

La méthode des adoptions, quant à elle, consiste à étudier l’impact du changement d’environnement chez des enfants adoptés. De nombreuses recherches comme celles de Scarr et Weinberg (1979) aux Etats-Unis ont montré que les enfants qui étaient élevés dans un milieu socio-éducatif plus élevé que le milieu biologique avaient de meilleures performances aux tests d’intelligence que le groupe d’origine. De leur côté, Schiff et al. (1978) ont montré en France que des enfants nés dans un milieu socialement défavorisés et élevés dans un milieu social favorisé réussissaient davantage les tests d’intelligence que leurs frères et sœurs restés dans le milieu d’origine, et que cette différence était de 12 points de QI.
De manière plus précise, Duyme et al. (1999) ont suivi 67 enfants provenant de milieux particulièrement défavorisés dont le QI était médiocre (QI moyen = 77) et qui avaient été adoptés entre 4 et 6 ans (adoption tardive). Quelques années plus tard (entre 5 et 10 ans plus tard), tous ces enfants avaient augmenté leur QI, mais de manière plus ou moins importante selon les caractéristiques des familles adoptantes : ainsi, le gain de QI était de 19 points si l’enfant avait été adopté par une famille de niveau socio-économique élevé, et de 8 points si l’adoption avait été faite par une famille de niveau socio-économique plus faible.
D’autres études ont cherché à mettre en évidence ces différences sans pour autant utiliser la méthode des adoptions, mais ont utilisé une cohorte de sujets beaucoup plus importante, représentatifs de la population générale. Les résultats indiquent que le QI moyen d’enfants d’ouvriers agricoles est de 93,5 alors que celui d’enfants de cadres supérieurs est de 111,5, soit une différence de 18 points (Vallot, 1973). L’étude de Tuma et al. (1978) a mis en évidence l’étendue des valeurs du QIT chez des enfants selon la provenance de leur classe sociale. Ainsi, le QIT des enfants défavorisés varie de 67 à 118, alors que celui des classes sociales favorisées varie de 108 à 152. De plus, il est apparu que c’est l’échelle verbale qui est le plus sensible à la classe sociale : les chercheurs ont observé une différence de 30 points pour l’échelle verbale et de 20 points pour l’échelle de performance. Cette tendance a été observée dans plusieurs recherches.

Plus récemment, le manuel d’interprétation du WISC IV, cité par Grégoire (2009) indique les résultats suivants :

Q.I. total moyen au WISC IV en fonction de l’origine socio-professionnelle des parents
Catégories socio-professionnelles Nombre de sujets QIT moyen
1 : agriculteurs exploitants 32 98,47
2 : artisans, commerçants, chefs d’entreprise 90

101,78

3 : cadres et professions intellectuelles supérieures 159

101,16

4 : professions intermédiaires 220

102,44

5 : employés 160

97,65

6 : ouvriers 379

96,16

7 : retraités 15

92,20

8 : autres sans activité 48

93,25

Total 1103

99,96

 

Si l’intelligence est en partie inscrite dans les gènes, il apparait que l’environnement intervient dans l’expression de celle-ci. A ce propos, Tazouti (2007) rappelle que de nombreux facteurs interagissent dans le développement et l’expression de l’intelligence. Il y aurait ainsi :

-          des facteurs individuels (biologiques, cognitifs, mais aussi conatifs, c’est-à-dire de personnalité) ;

-          des facteurs familiaux (appartenance sociale, pratiques éducatives, valeurs familiales…) ;

-          des facteurs institutionnels (pratiques pédagogiques, « effets-maîtres » et « effets établissements »…).

Néanmoins, il ne faut pas oublier qu’il n’y a aucun déterminisme, qu’il soit génétique ou sociologique dans le développement de l’intelligence, seulement une tendance observée ; et qu’une corrélation ne signifie pas qu’il y ait un lien de causalité entre deux variables.

 

3.2. Différences inter-groupes

a) Différences inter-genre

Certaines études étasuniennes – citées par Pereira-Fradin (2006) -  indiquent que les filles surdouées sont plus nombreuses à l’école que les garçons, mais cela proviendrait du fait que les filles sont plus facilement repérées dans la petite enfance. Puis au collège, les filles ne représentent plus que 30% et ce pourcentage est encore plus faible au lycée.

D’après Grégoire (2009), les versions antérieures du WISC ont mis en évidence une légère supériorité du QI Total chez les garçons.  Ainsi, cette supériorité était de l’ordre de 2,7 points  au WISC-R (Grégoire, 1992), de 2,09 au WISC III (Grégoire, 2000). Avec la dernière version du WISC (version IV), les résultats sont inversés et ce sont les filles qui obtiennent un meilleur score au QIT qui s’élève à 1,57 points de plus que les garçons. L’auteur explique cette évolution par l’uniformisation progressive de l’éducation des filles depuis les années 60. Une autre explication se base sur le remaniement de la composition du QIT entre le WISC-R et le WISC IV qui ne favorise plus les compétences reconnues pour être principalement réussies par les garçons.

Lorsque l’on analyse les différences inter-genre en fonction des performances aux tests, de nombreuses études – soutenues par les livres grand-public de type «Pourquoi les femmes ne savent pas lire les cartes routières », « pourquoi les hommes… » et Cie –   ont fait état d’un potentiel spatial plus développé chez les hommes et de meilleures capacités verbales chez les femmes. Cependant, la supériorité des hommes dans le domaine spatial ne concernerait que la rotation dans l’espace en trois dimensions ; les femmes se repérant très bien dans l’espace environnemental, i.e. en deux dimensions. Quant au langage, les femmes sont plus compétentes dans l’aisance verbale que dans l’étendue du vocabulaire (cité par Fournier, 2007).

D’autres études ont mis en évidence que la supériorité des hommes dans le domaine des mathématiques ne concernait que le raisonnement ; les filles étant meilleures en calcul. Ainsi, à l’épreuve du DAT (Differential Aptitude Test), les garçons obtiennent de meilleures performances que les filles aux épreuves de raisonnement mathématique et mécanique, alors que les filles réussissent mieux les épreuves de calcul ou d’arithmétique (Lubinsky & Benbow, 1992). D’un point de vue développemental, les évaluations nationales françaises réalisées en CE2 et en 6ème montrent qu’à 6 ans , les filles sont meilleures que les garçons en mathématiques, alors que la tendance s’inverse à partir de 15 ans (3ème).

Les neurosciences ont permis d’expliquer cette différence et notamment le rôle de l’éducation  et donc de la culture (voir cette vidéo  sur les performances  entre les filles et les garçons, Catherine  Vidal). C’est donc pour cela  que  ces différences ne se retrouvent pas dans tous les pays.

 

b) Différences inter-culturelles

Ces différences ont surtout été observées au niveau des réussites scolaires, d’une part parce que les tests étant adaptés à la culture de chaque pays, il est difficile de comparer les performances entre les différentes versions des tests, d’autre part parce que la notion d’intelligence varie selon les cultures et donc sa mesure aussi.

Comme on l’a vu ci-dessus, en France et dans les pays occidentaux ayant le même système éducatif, plusieurs enquêtes ont observé que les garçons ont de meilleurs résultats que les filles en mathématiques et en physiques, alors que les filles sont plus douées pour le français et les langues vivantes. Cependant, il a été mis en avant que les filles à haut potentiel possèdent une faible estime de soi dans le domaine des mathématiques (Pajares, 1996) et un niveau d’anxiété supérieur à celui des garçons dans ce même domaine (Catsambis, 1994).

En Israël ces mêmes différences entre les filles et les garçons étaient observées jusqu’à l’immigration massive de russes dans les années 1990 où les différences se sont équilibrées (Zohar & Sela, 2003). Par la suite, les différences fluctuaient en fonction de l’origine des immigrants.

Dans une étude américaine portant sur les différences filles/garçons à une épreuve de mathématiques, les chercheurs ont observé une sur-représentation des garçons par rapport aux filles dans les performances extrêmes. Mais en isolant les élèves selon leur origine, les auteurs se sont aperçus que la proportion des filles d’origine asiatique était supérieure à celle des garçons dans les performances extrêmes. Ainsi, cette différence en faveur des garçons était de 13 garçons pour 1 fille sans distinction ethnique, alors qu’elle était de 1 garçon pour 4 filles chez les asiatiques vivants aux États-Unis (Lubinski & Benbow, 1992).
La littérature en psychologie sociale a mis en évidence les effets des stéréotypes sociaux sur les réussites scolaires, professionnelles et dans les choix de vie. Nous vous invitons à regarder cette conférence de Jacques Lautrey.

 

4. Les autres variables qui peuvent influer le QI

 

Quelle sont les différentes variables qui peuvent influer sur les performances aux tests et donc à tout type de tâche.

4.1. Le système cognitif, comment ça marche ?


a) Quelques définitions pour se mettre au diapason


Savoir
 : donnée, concept, méthode théorisés à partir du réel ; il existe en dehors du sujet.

Connaissance : transformation du savoir par un individu ; expérience personnelle et subjective du savoir en fonction de l’expérience de chacun.

Mémorisation : processus d’acquisition de savoirs.

Apprentissage : processus de remodelage d’un comportement afin d’utiliser un savoir dans des contextes variés.

Cognition : ce qui rend possible l’acquisition de savoirs, la transformation en connaissances et leurs utilisations.

Fonctions cognitives : fonctions mentales supérieures permettant la cognition et l’interaction avec notre environnement.

b) Les étapes de l’interaction avec l’environnement
La notion d’interaction avec l’environnement est très importante car elle est à la base de tout processus d’adaptation.

Dans un premier temps, nous percevons des stimuli par nos sens. Ces stimuli peuvent être des objets, des personnes de l’environnement – via la perception visuelle, auditive, olfactive, gustative, tactile – ou des sensations provenant de notre propre corps -  proprioception, interoception, pensées… Ces stimuli bénéficient ensuite d’un traitement de l’information complexe et qui est dévolu aux fonctions cognitives. Enfin, nous produisons une réponse élaborée. Cette réponse peut être motrice, verbale, émotionnelle…

Dans les tâches quotidiennes et a fortiori lorsque nous passons un test de QI, il faut bien comprendre que toutes ces étapes sont importantes, et que la performance n’est pas une copie exacte de la qualité des fonctions cognitives.

Il convient donc de prendre en compte les 3 étapes ci-dessus : 1/ l’entrée (la perception) ; 2/ le traitement de l’information et 3/ la sortie (la réponse élaborée). Si l’une de ces 3 étapes ne fonctionne pas correctement, les performances vont s’en trouver ternies. Ainsi, si un sujet perçoit mal l’environnement (concernant la perception visuelle, elle ne se réduit pas à l’acuité visuelle, mais aussi à l’oculomotricité…), il ne pourra pas bien le traiter. De même, si un sujet a des difficultés pour émettre une réponse (dys ou a-phasie, dyspraxie, handicap moteur, crispation musculaire…) alors qu’il a bien traité l’information, les performances vont aussi en pâtir. Cela semble aller de soi, et pourtant… Le handicap n’est pas toujours visible.

c) Le traitement de l’information : les fonctions cognitives
Essayons maintenant d’ouvrir cette boite noire que représentent les fonctions cognitives.

-          Le système perceptif appartient bel et bien aux fonctions cognitives car il s’agit du décodage de ce qui est perçu par nos sens. Ainsi, il existe 4, voire 5 aires visuelles dans notre cerveau et plusieurs réseaux de neurones qui décodent une propriété bien spécifique de ce qui a été perçu (forme, couleur, mouvement…).

-          Le système mnésique est divisé en plusieurs sous-parties selon le sens sollicité (mémoire visuelle, auditive, kinesthésique… – d’où l’importance des entrées sensorielles évoquées plus haut), la durée de rétention de l’information (mémoire à long terme, à court terme…), la catégorie de l’information (mémoire sémantique, épisodique, procédurale…). Une petite précision ici : la mémorisation est un processus en 3 étapes : encodage – consolidation – récupération. Un défaut de mémorisation peut être dû à un dysfonctionnement de l’une ou plusieurs de ces 3 étapes.

-          Le système exécutif est un ensemble de fonctions cognitives qui permettent de nous adapter à des situations nouvelles et/ou complexes qui n’ont pas été automatisées. Pour beaucoup de personnes – en tous cas, les buveurs de café –  faire le café le matin est un exercice que l’on fait sans y réfléchir, comme mis sur pilotage automatique, tout comme la conduite d’un véhicule, quand celle-ci a été bien automatisée. Par contre, dès que l’on se retrouve face à une situation nouvelle, il nous faut 1/ analyser la situation ; 2/ élaborer une stratégie, planifier une action ; 3/ exécuter cette action selon les procédures mises en place à l’étape précédente et 4/ arrêter son action, la vérifier et la confronter avec la stratégie choisie. Les fonctions exécutives concernent donc entre autres le raisonnement, la planification, le processus d’induction et de déduction de règles opératoires, la prise de décision, les processus inhibiteurs, la flexibilité mentale, la mise à jour des informations, le contrôle de la qualité et de l’efficacité de ses actes.

-          Le système attentionnel est le chef d’orchestre de toutes les fonctions cognitives. Il intervient dans la disponibilité des ressources pour toutes les autres fonctions ainsi qu’un rôle de filtre (ne pas se faire happer par un bruit de l’environnement ou par ses propres pensées).
Le langage, le calcul, les capacités visuo-spatiales ne sont pas des fonctions cognitives en elles-mêmes mais elles se basent sur l’interaction de l’ensemble des fonctions cognitives décrites.

 

4.2. Les variables perturbatrices

En dehors de tout trouble cognitif, l’efficacité des fonctions cognitives peut être entravée par d’autres variables comme l’émotion, la santé, l’étayage environnemental, la motivation, la compréhension de la consigne, les stéréotypes…

 

a) L’émotion

L’émotion est une variable très importante. Pour expliquer son rôle dans le fonctionnement cognitif, il convient de parler de la théorie du cerveau triune.

Cette théorie repose sur le fait que, dans l’évolution de l’espèce, le cerveau humain s’est construit en plusieurs étapes. La structure la plus ancienne serait le cerveau reptilien. Elle est enfouie profondément dans notre cerveau. Le cerveau reptilien assure les fonctions vitales de l’organisme. La structure s’étant ensuite développée serait le système limbique. Le système limbique est dévolu aux comportements instinctifs et à la mémoire dépendante d’un contexte, donc liée aux émotions. De manière générale, le système limbique est le réservoir de nos émotions. Enfin, la structure la plus récente, qui est située en périphérie, est le néocortex. Celui-ci est très développé chez l’homme et lui permet de raisonner, de communiquer, d’anticiper…

 cerveau_reptiliencerveau_limbiquecerveau_neocortex

Source : http://lecerveau.mcgill.ca/

Ces 3 cerveaux ne sont pas indépendants et ils communiquent entre eux de manière non unilatérale. Cependant, une des principales voies est celle qui part du cerveau reptilien, qui passe par le système limbique pour arriver au néocortex (voie ascendante). De cette manière, les informations provenant de l’environnement qui sont chargées d’émotions peuvent parasiter de manière non négligeable l’activité du néocortex, siège des fonctions mentales supérieures (fonctions cognitives). De même, certaines pensées nées du néocortex « redescendront » vers le système limbique pour se charger d’émotions avant de retourner dans le cortex et ainsi entraver les performances d’une tâche. C’est le cas notamment du stress, des pensées négatives lors d’une dépression, des idées phobiques, du manque d’estime de soi…


b) La forme physique

Le fonctionnement de ces 3 types de cerveau explique aussi pourquoi lorsqu’on n’est pas en pleine forme (maladie, fatigue, manque de sommeil ou même prise de médicaments), nos capacités intellectuelles sont amoindries. C’est ici le cerveau reptilien qui souffre et entrave l’activité du cortex.

 cerveau-triurne

Source : A. Adda et H. Catroux, in L’enfant doué, l’intelligence réconciliée.

 

c) La motivation

La motivation joue également un rôle principal. Si l’adulte qui vient passer un test est consentant puisque le test est généralement à sa demande, il n’en est pas systématiquement de même avec les enfants. Certains ont été « obligés » de passer le test ou le font « pour faire plaisir ». Dans ce cas, l’enfant ne donnera pas le meilleur de lui-même, et ses performances ne refléteront pas la réalité.

De plus, la motivation est en lien avec l’intérêt pour certains subtests. Si la personne (enfant ou adulte mais surtout enfant) ne perçoit pas l’intérêt dans la tâche, elle ne va pas y investir.

À partir de 101 théories de la motivation, Fenouillet (2012) a mis au point un schéma intégratif permettant de rendre compte de ces 101 théories.
En effet, il n’y a pas deux types de motivation : intrinsèque et extrinsèque, et la motivation ne se résume pas en une force intérieure. Elle prend son origine dans des motifs primaires et secondaires tout en faisant des prédictions de résultats, car sans ces prédictions, c’est-à-dire sans projection que l’on va y arriver, la motivation est difficile à mettre en place. À partir de là, on prend une décision d’agir. C’est ce qu’on appelle la volition. On élabore alors des stratégies pour produire le comportement qui nous amènera à des résultats. De nombreuses boucles de rétroaction existent afin de réguler et d’autoalimenter la motivation via les motifs primaires et secondaires.

modele_integratif-motivations

Source : Fenouillet

 

d) La compréhension de la consigne

 

La compréhension de la consigne est également un élément important. Dans le milieu scolaire, les enfants ont souvent une mauvaise note non pas parce qu’ils n’ont pas compris la leçon, mais parce qu’ils n’ont pas compris la consigne. De même, lors d’un test de QI, un sujet peut ne pas appréhender correctement ce qu’on lui demande, et il n’osera pas demander de reformuler. Cela arrive bien plus souvent qu’on ne le pense ! Il peut aussi ne pas prendre en compte l’intégralité de ce qu’implique la tâche : nous pensons ici notamment aux subtests chronométrés où certains sujets n’ont pas intégré qu’il fallait aller vite, et prennent leur temps ; ils perdent ainsi des points.


e) Les variables sociales et éducatives

Nous avons parlé précédemment de l’influence du milieu socio-culturel et du poids des stéréotypes. L’étayage environnemental est une variable éducative qui est liée au milieu socio-culturel.

 

f) Les biais culturels

Un dernier point représente les biais méthodologiques dus au test lui-même, et principalement les biais culturels.

Grégoire (2009) met en avant le fait que l’évaluation peut être biaisée en fonction des caractéristiques culturelles d’une personne. L’auteur précise qu’ « une évaluation est considérée comme biaisée lorsqu’elle ne rend pas justice à la personne examinée et qu’elle donne une image faussée de ses caractéristiques et de ses potentialités du fait de son appartenance à un groupe culturel donné » (p 124). Le psychologue se doit alors de prendre en considération les différentes variables culturelles susceptibles d’interagir avec les performances (langue maternelle, religion, éducation…). Grégoire présente alors une typologie des biais qui peuvent entacher la validité des évaluations psychologiques :

 

- Différences d’opportunités d’assimilation des contenus du test.- Echantillonnage insuffisant des comportements à mesurer.Méthodologique- Différence de désirabilité sociale.- Différence de style de réponse.- Différence de familiarité avec les stimuli.- Absence d’échantillon(s) comparable(s).- Différences dans les conditions matérielles d’administration. (ndlr : par exemple un bruit présent lors du test peut nuire aux performances)- Différences de familiarité avec les procédures de réponse.- Influence de la relation entre l’examinateur et le sujet testé. (ndlr : si la relation avec le psychologue est mauvaise, le sujet sera stressé ou ne donnera pas le meilleur de lui-même)- Problèmes de communication entre l’examinateur et le sujet testé.Item- Traduction incorrect de l’item.- Formulation verbale inappropriée de l’item.- Item faisant appel à des caractéristiques personnelles non visées par le sujet.- Différences d’opportunité d’assimilation du contenu de l’item.

Types de biais culturels

Source

Conceptuel - Recouvrement incomplet des définitions du concept dans les différentes cultures.– Différences d’opportunités d’assimilation des contenus du test.
– Echantillonnage insuffisant des comportements à mesurer.
 Méthodologique – Différences de désirabilité sociale.
– Différence de style de réponse.– Différences de familiarité avec les stimuli.
– Absence d’échantillon(s) comparable(s).
– Différences dans les conditions matérielles d’administration (NDLR : par exemple un bruit présent lors du test peut nuire aux performances).
– Différences de familiarité avec les procédures de réponse.
– Influence de la relation entre l’examinateur et le sujet testé (NDLR : si la relation avec le psychologue est mauvaise, le sujet sera stressé ne donnera pas le meilleur de lui-même).
– Problèmes de communication entre l’examinateur et le sujet testé.
 Item  – Traduction incorrecte de l’item.– Formulation verbale inappropriée de l’item.
– Item faisant appel à des caractéristiques personnelles non visées par le sujet.
– Différences d’opportunités d’assimilation du contenu de l’item.

 

Il y aurait d’autres variables interférentes, mais celles présentées ici sont les principales.

Il faut garder en tête que ces variables sont plutôt ponctuelles et non liées intrinsèquement à la personne. Elles peuvent donc disparaître et laisser entrevoir un autre potentiel dans les tests. Ainsi, et c’est là le point le plus important, les performances ne sont qu’une photographie à un instant T, photographie plus ou moins fidèle des compétences, plus ou moins ressemblante, parfois plus, parfois moins. Si, sur cette photo, nous faisons une grimace, cela ne signifie pas que notre visage présente cette expression en permanence.

 

 

Sources

Adda, A. & Catroux, H. (2003). L’enfant doué ; l’intelligence réconciliée. Paris : Ed. Odile Jacob.

Bessou, A., Montlahuc, C., Louis, J., Fourneret, P., & Revol, O. (2005). Profil psychométrique de 245 enfants intellectuellement précoces au WISC-III. A.N.A.E., 81, 23-28.

Caroff X., Guignard J-H., & Jilinska M. (2006) in Lubart T. (dir.), Enfants exceptionnels : précocité intellectuelle, haut potentiel et talent, Editions Bréal collection « Amphi Psychologie », Paris, 2006.

Catsambis, S. (1994). The path of math : Gender and racial-ethnic differences in mathematics participation form the middle school to high school. Sociology of Education, 67, 199-215.

Detterman, D.K., & Daniel, M.H. (1989). Correlations of mental tests with each other and with cognitive variables are highest for low IQ groups. Intelligence, 13, 349-359.

Duyme, M. et al. “How can we boost IQs of « dull children » ? A late adoption study”, Proceedings of National Academy of Sciences, vol. 96, 1999.

Ellsey J.T. & Karnes F.A. (1990). Test-Retest stability of the WISC-R IQs among young gifted students. Psychological Reports, 66, 1023-1026.

Facon, B. (2003). Sur la loi des rendements décroissants. Efficience intellectuelle et facteur général. L’année Psychologique, 103, 81-102.

Facon, B. (2004). Are correlations between cognitive abilities highest in low-IQ groups during childhood ?. Intelligence, 32, 391-401.

Fenouillet F. (2012). Les théories de la motivation. Ed Dunod.

Flynn, J.R. (1984). The mean IQ of Americans: A massive gains 1932 to 1978. Psychological Bulletin, 95, 29-51.

Fournier, M. (2007). L’intelligence a-t-elle un sexe ? In M. Duru-Bellat & M. Fournier (Eds.), L’intelligence de l’enfant – l’empreinte du social. Auxerre : Editions Sciences Humaines.

Grégoire, J. (2009). L’examen clinique de l’intelligence de l’enfant ; fondements et pratique du WISC-IV.  Belgique : Ed. Mardaga.

Grégoire, J. (1992) Evaluer l’intelligence de l’enfant. Liège : Ed. Mardaga.

Grégoire, J. (2000). L’évaluation clinique de l’intelligence de l’enfant. Sprimont : Ed. Mardaga.

Hollinger, C.L., Kosek S., (1986) – Beyond the use of full scale IQ scores – Gifted Child Quaterly, 30 (2).

Kaufman, A.S. (1992). Evaluation of the WISC III and the WPPSI-R for gifted children. Roeper Review, 14 (3), 154-158.

Larrabee D. & Holroyd R.G. (1976). Comparison of WISC and WISC-R using a sample of highly intellectual children. Psychological Report, 38, 1071-1074.

Lautrey, J. (2007). Pour l’abandon du QI : les raisons du succès d’un concept dépassé. In M. Duru-Bellat & M. Fournier (Eds.), L’intelligence de l’enfant – l’empreinte du social. Auxerre : Editions Sciences Humaines.

Liratni M. (2009). Enfants à haut potentiel intellectuel : Aspects cognitifs et socio-adaptatifs. Thèse de doctorat. Université de Montpellier III.

Loehlin, J.C. (1989). Partitioning environmental and genetic contributions to behavioral development. American Psychologist, 44(10), 1285-1292.

Lubinsky, D. & Benbow, C. (1992). Gender differences in abilities and preferences among the gifted : implications for the math-science pipeline. Current Directions in Psychological Science, 1(2), 61-66.

Morin, P. (2011). Étude du profil psychométrique de 273 enfants surdoués. http://www.acsis-pm.org/132n273.html

Pajares, F. (1996). Self-efficacy beliefs and mathematical problem-solving of gifted students. Contemporary Educational Psychology, 21, 325-344.

Pereira-Fradin, M. (2006). Les différences individuelles chez les enfants à haut potentiel in Lubart T. (dir.), Enfants exceptionnels : précocité intellectuelle, haut potentiel et talent, Editions Bréal collection « Amphi Psychologie », Paris.

Scarr, S. & Weinberg, R.A. (1979). Nature and Nurture strike (out) again. Intelligence, 3, 321-339.

Schiff, M., Duyme, M., Dumaret, A., Stewart, J., Tomkiewicz, S. & Feingold, J. (1978). Intellectual status of working class children adopted early in upper-class families. Science, 200, 1503-1504.

Silver S.J., Clampit M.K., (1990) – WISC-R profiles of high ability children : interpretation of verbal-performance discrepancies – Gifted Child Quaterly, 34 (2).

Terrassier, J-C. (1981). Les enfants surdoués ou la précocité embarrassante. Editions ESF.

Tazouti, Y. (2007). Environnement familial et développement cognitif. In M. Duru-Bellat & M. Fournier (Eds.), L’intelligence de l’enfant – l’empreinte du social. Auxerre : Editions Sciences Humaines.

Tuma, J.M., Appelbaum, A.S., & Bee, D.E. (1978). Comparability of the WISC and the WISC-R in normal children of divergent socioeconomic backgrounds. Psychology in the Schools, 15 (3), 339-346.

Vallot, F (1973); Enquête nationale sur le niveau intellectuel des enfants d’âge scolaire. Travaux et Documents, Cahier n° 64, Paris, PUF.

Vaivre-Douret L. (2004). Les caractéristiques développementales d’un échantillon d’enfants tout venant « à hautes potentialités » (surdoués) : suivi prophylactique. Neuropsychiatrie de l’enfance et de l’adolescence 52. 129–141

Vrignaud, P. (2002). L’identification des surdoués : chimère psychométrique ou réalité psychologique ? Communication présentée aux 15èmes Journées de Psychologie Différentielle, 10-13 septembre, Rouen.

Zohar, A. & Sela, D. (2003). Her physics, his physics : gender issues in Israeli advanced placement physics classes, International Journal of Science Education, 25, 245-268.