Een blik op de geschiedenis van IQ-testen
Voor wie niet vertrouwd is met de geschiedenis van de IQ-testen, raad ik zeker de toegankelijk geschreven boeken van Carl Zimmer (2019) en Stuart Ritchie (2015) aan die onder deze tekst te vinden zijn. Kort geschetst - en dus op het gevaar af te simplificeren - komen IQ-testen voort uit een zeer humane doelstelling, met name het identificeren van kinderen die extra aandacht verdienden in het onderwijs. Nobele doelstellingen, zoals het trachten weg te werken van leerachterstand, zijn helaas geen verzekering tegen onbedoelde en zelfs onwenselijke neveneffecten. De Britse empiricus Francis Galton (1822-1911) stelde zich in de 19de eeuw, geheel in de lijn van de toenmalige vroeg-positivistische traditie, de vraag of IQ gemeten zou kunnen worden in het belang van een natie. Indien dat zou kunnen, dan konden ook landen gerangschikt worden op diverse parameters (niet enkel IQ), maar ook de proportie veroordeelden in een land, waardoor - zo dacht men - de intellectuele en morele stand van zaken van een staat blootgelegd kon worden. Zeker het vroege werk van de psycholoog Henry Goddard (1866-1957) over zwakzinnigheid, waar de nu controversiële termen ‘imbecile’, ‘moron’, en ‘idiot’ nog vlijtig gebruikt werden om individuen te categoriseren in groepen op basis van hun IQ-scores, roept vandaag nog steeds de huiver op van het eugenetisch gedachtegoed dat zo kenmerkend was voor de 19de-eeuwse denkers. De gestandaardiseerde test van de Franse psycholoog Alfred Binet (1857-1911) werd
al snel gebruikt om inwijkelingen in de VS te screenen. Lage scores op IQ-testen konden worden gebruikt als rechtvaardiging voor wanpraktijken, die al bestonden voor de komst van de IQ test, zoals de sterilisatie of opsluiting van minder begaafden in sanatoria.
De vroege antropometrie werd beoefend door wetenschappers die nog sterk door een eurocentrische blik keken. De vroegste IQ-testen konden daarom terecht bekritiseerd worden op basis van de inhoud ervan.
Q-onderzoek behoorde tot de antropometrie, de beschrijvende wetenschap die de mens op allerlei kenmerken (van uiterlijke kenmerken zoals lichaamsbouw tot psychologische kenmerken) beschreef op basis van statistische indicatoren. De vroege antropometrie werd beoefend door wetenschappers die nog sterk met een eurocentrische blik keken. De vroegste IQ-testen konden daarom terecht bekritiseerd worden op basis van de inhoud ervan: een zekere mate van culturele vooringenomenheid was zeker aanwezig, en dat besef groeide pas later.
Een genetische component?
Francis Galton, die schreef over ‘nature and nurture’, was ervan overtuigd dat er een genetische component van het IQ bestond, en tweelingstudies (en later ook adoptiestudies) toonden inderdaad een heritabiliteit (erfelijkheid) aan. De term heritabiliteit zorgt echter vaak voor verwarring. Het betreft een louter statistische maat die weergeeft in welke mate verschillen binnen groepen een genetische component hebben. Dit wil zeggen dat individuele verschillen in IQ-testscores voor een deel door genen statistisch verklaard kunnen worden. Dit zegt ook niks over welke genen. De Britse statisticus Charles Spearman (1863-1945), een pionier op gebied van enkele statistische maten1 opperde de idee dat er zoiets bestond als een algemene onderliggende factor, de ‘g-factor’ genaamd. Deze onderliggende factor zou de verklaring vormen voor het feit dat er tussen de verschillende dimensies van IQ-testen een samenhang bestond: volgens Spearman was een ‘algemene intelligentie’ de verklaring voor de geobserveerde samenhangen tussen dimensies van intelligentie. De scepsis hiertegenover was een tijdlang bijzonder hoog. Tegenstanders vonden dat men appels en peren met bananen op een hoop gooide. Sommigen bedachten doodleuk dat de verschillende dimensies van IQ niet noodzakelijk dienden samen te gaan. Dat is vooral gebaseerd op casuïstiek. Inderdaad, individuen kunnen extreme waarden aannemen op een dimensie en minder extreme posities op een andere dimensie. Dit neemt echter niet weg dat er een trend bestaat: hoge scores op een dimensie van intelligentie hangen zo sterk samen met hoge scores op een andere dimensie, dat het aannemelijk lijkt dat hier een algemeen achterliggend mechanisme achter schuilgaat. De subdimensies van IQ (redeneervermogen, werkgeheugen, kennis, informatieverwerkingssnelheid, ruimtelijke inzichten) correleren sterk, zoals blijkt uit heel veel studies. Zoals de Schotse psycholoog en intelligentieonderzoeker Stuart Ritchie2 opmerkt: empirisch bewijs voor het feit dat ‘geen achterliggend construct als algemene intelligentie’ zou bestaan is niet gevonden, behalve in het hoofd van de bedenkers van de kritiek op de g-factor. Nog steeds blijft dit riedeltje populair en wordt het te pas en te onpas gebruikt om hedendaags IQ-onderzoek zonder meer als pseudowetenschappelijk te bestempelen. Het empirisch bestaan van een g-factor roept natuurlijk wel vele nieuwe en belangrijke wetenschappelijke vragen op, zoals: welke elementen in het brein zijn verantwoordelijk voor deze samenhang tussen subdimensies? Het is daarom niet te verwonderen dat hedendaags intelligentieonderzoek aansluiting zoekt met de neurowetenschappen.
Stigma’s uit het verleden
Intelligentieonderzoekers kampen vandaag nog steeds met de stigma’s uit het verleden. Zoals hierboven kort aangehaald: IQ-onderzoek behoorde tot de antropometrie en werd in de beginjaren beoefend door wetenschappers die nog sterk met een eurocentrische blik keken. De link naar het zo mogelijk nog controversiëlere onderzoek naar verschillen tussen groepen mensen onderling (lees: het oude pseudowetenschappelijke rassenonderzoek) was nooit ver weg, en ook de meest ernstige wetenschappers uit die tijd lieten soms wel eens een ongenuanceerde boodschap vallen.
Het is dan ook niet verwonderlijk dat IQ-onderzoek na de tweede wereldoorlog een tijdlang van de agenda verdween, maar de wetenschappelijke vraag bleef toch psychologen en sociale wetenschappers boeien. De controverse rond intelligentieonderzoek kreeg een ‘sequel’ met de publicatie van ‘The Bell Curve’, door psycholoog Richard Herrnstein (1930-1994) en politicoloog Charles Murray (°1943). Hun boek uit 1994 bevat de neerslag van een studie over IQ, geslacht en sociaal-economische status. Dit werk werd een klassieker, die zowel verguisd als verheerlijkt werd. Veel intelligentieonderzoekers waren enthousiast over het boek, omdat het een nieuwe impuls gaf aan intelligentiestudies, zelfs al waren ze het niet eens met sommige verregaande conclusies omtrent de relatie met variabelen zoals het controversiële (en overigens zeer slecht ‘gemeten’) begrip ras en sociaal-economische status. Meerdere leerlingen van de achteraf als fraudeur ontmaskerde persoonlijkheidspsycholoog, Hans Jürgen Eysenck (1916-1997), waren niet te beroerd om zich verder te verdiepen in raciale kwesties rond persoonlijkheid en intelligentie. Met name de werken van Philippe Rushton (1943-2012) en Arthur Jensen (1923-2012) waren berucht om hun raciale pseudowetenschappelijke ondertoon. Herrnstein en Murray verwezen gretig naar deze auteurs, omdat ze aantoonden dat ‘race’ (als categorisch kenmerk een compleet achterhaald beeld voor een sociale constructie en biologisch een onbruikbaar begrip) een sterke voorspeller was voor IQ, net als sociale klasse. De Amerikaanse paleontoloog en evolutiebioloog Stephen Jay Gould (1941-2002) toonde zich als felle tegenstander van alle pogingen tot het kwantificeren van IQ en bevocht daarom het meten van IQ in zijn bestseller ‘The Mismeasure of Man’ uit 1996. Goulds kritiek is niet onbesproken en ook sterk door een politieke (Marxistische) agenda bepaald. Zijn heranalyses van oude IQ-studies bleken ook verre van waterdicht te zijn.
Een misschien minder gekende, maar ook belangrijke methodologisch zwarte bladzijde aan sommige IQ-studies, is het feit dat landelijke gemiddelden voor IQ-scores met kenmerken van landen werden gecorreleerd, in afwezigheid van gegevens op individueel niveau. Hier loert het gevaar van ‘de ecologische fout’. Dat betekent het foutief doortrekken van conclusies uit studies op landenniveau naar andere niveaus, zoals het individueel niveau. William S. Robinson was de eerste om op dit statistisch probleem te wijzen in een studie van het analfabetismeniveau en de het percentage immigranten op niveau van de deelstaten van de Verenigde Staten. Robinson waarschuwde dat verbanden op hogere aggregatieniveaus niet noodzakelijk mogen doorgetrokken worden op individueel niveau. Toegepast op intelligentieonderzoek betekent dit dat sterke correlaties tussen het IQ-niveau van een land en het criminaliteitsniveau van een land niet noodzakelijk een sterke correlatie op individueel niveau impliceren. Dit soort van methodologische slordigheden heeft zeker bijgedragen tot het herbevestigen van de pseudowetenschappelijke reputatie van IQ-onderzoek.
De hierboven kort aangehaalde knelpunten geven misschien de indruk dat IQ-onderzoek pseudowetenschap is, maar de hedendaagse gedrags- en moleculaire genetische IQ-studies met genoomwijde associatiestudies worden niet door charlatans uitgevoerd.
Omgevingsinvloeden
De voorspellende kracht van IQ-scores, gemeten tijdens de kindertijd, en welzijnsindicatoren gemeten op latere leeftijd, tonen aan dat IQ-scores veel positieve effecten laten zien op latere tewerkstelling, gezondheid, lagere kansen op veroordelingen, … Maar er is natuurlijk ook de sociale milieucomponent, die absoluut niet te verwaarlozen is. De Amerikaanse psycholoog en ‘paus’ van het hedendaagse gedragsgenetisch onderzoek, Robert Plomin (°1948), staat gekend voor zijn jarenlange inzet in dat domein en zijn studies, net als die van zovele anderen, laten zien dat de variabiliteit in IQ-scores een genetische component heeft, dat de gedeelde omgevingsinvloeden (opvoeding door ouders) eerder klein tot verwaarloosbaar zijn en dat de unieke omgevingscomponenten wel een significante bijdrage leveren tot het verklaren van verschillen tussen één en twee-eiige tweelingen. Dat betekent niet dat ouders geen verschil kunnen maken, het relativeert enkel de langetermijnimpact van opvoeding. Dat laatste is volgens mij niet controversieel, want op lange termijn wordt men door zoveel andere omgevingen beïnvloed, dat het nogal vreemd zou zijn om vast te stellen dat die unieke ervaringen hun sporen niet nalaten. Gedragsgenetisch onderzoek naar IQ daarom pseudowetenschap noemen zou afbreuk doen aan het geleverde werk.
Er zijn natuurlijk wel gedragsgenetici die, ongehinderd door temperament en enthousiasme, aan overinterpretatie zijn gaan doen. Typerend is hier weer de raciale component, waarmee we verwijzen naar het berekenen van heritabiliteitscoëfficiënten tussen bevolkingsgroepen en het ongeoorloofd vergelijken van die heritabiliteitscoëfficiënten tussen groepen. Het is in dat licht dat ik het kritische betoog van de Amerikaanse wetenschapsfilosoof Aaron Panofsky tegenover gedragsgenetica plaats. Aaron Panofsky viseert onder meer gedragsgenetisch IQ-onderzoek en spreekt over ‘science behaving badly’, of is het ‘scientists behaving badly’? Aaron Panofsky heeft echter de neiging zelf te pessimistisch te staan tegenover bijvoorbeeld genetisch onderzoek, biosociaal onderzoek en evolutionaire psychologie. Hij ziet er te veel een politieke agenda in. Verblind door angst voor een terugkeer van de eugenetica en misbruik door de politiek, lijkt hij moeite te hebben wetenschap en ideologie door een afzonderlijke bril te bekijken.3 Dat is althans mijn aanvoelen bij het lezen van zijn betoog.
Genoombrede associatiestudies
Vandaag de dag wordt intelligentie ook bestudeerd vanuit de zogenaamde genoom brede associatiestudies. Deze studies zijn nog verkennend van aard, maar laten toe uitkomsten (zoals IQ-scores) te correleren met specifieke genvarianten. Deze studies laten bovendien zien dat veel meer genen betrokken zijn bij het verklaren van individuele verschillen in IQ-scores, en dat de bijdrage van afzonderlijke allelen (genvarianten) verwaarloosbaar klein is. Echter, men kan ook de optelsom maken van de diverse risico-allelen die met IQ correleren. Doet men dat, dan spreekt men over polygene risicoscores. Hiermee belandt het IQ-onderzoek in een nieuw tijdperk. Polygene risicoscores kunnen, in tegenstelling tot individuele genen, veel meer van de individuele verschillen in IQ verklaren. Gedragsgenetici zoals Robert Plomin verwachten nogal veel van de polygenische risicoscores, maar ook daar is het laatste nog niet over gezegd. Momenteel zijn deze studies niet theoriegebaseerd, over de intermediaire mechanismen tast men nog in het duister, dus er is nog veel werk aan de winkel.
Hiermee belandt het IQ-onderzoek in een nieuw tijdperk. Polygene risicoscores kunnen, in tegenstelling tot individuele genen, veel meer van de individuele verschillen in IQ verklaren.
GWAS studies nopen daarom tot voorzichtigheid, maar doemscenario’s van ‘genetisch determinisme’ en ‘brave new world’ getuigen volgens mij van gebrekkige kennis van de werking van genen. Een andere pertinente uitdaging voor genoombrede associatiestudies is dat zij in hoofdzaak gebaseerd zijn op Europese populaties. Het is geweten dat extrapolatie naar andere populaties risicovol is. Daarom is het belangrijk een pleidooi te houden voor het opentrekken van dergelijk onderzoek naar niet-Westerse populaties. Er zijn dus nog vele stappen te gaan in het 21ste eeuwse IQ-onderzoek, maar de obscure en onfrisse rassen wetenschappers blijken toch een leven in de marge te leiden. Het valt me op dat deze superioriteitsdenkers steeds minder moeite doen om het hedendaags genetische vakgebied te volgen, mogelijks in de overtuiging dat de vroege studies door wetenschappelijke ‘elites’ verketterd zijn via officiële terugtrekkingen van de publicaties van onder de eerder vernoemde Philippe Rushton en illustere collega’s zoals Richard Lynn (°1930), waarvan zijn titel als professor in de differentiële psychologie aan de Universiteit van Ulster in 2018 ingetrokken werd omwille van studies van bedenkelijk allooi naar raciale verschillen in IQ en vooral de daling van het IQ onder immigrantenpopulaties. Deze kleine ‘inner circle’ verwijst voortdurend naar het onderzoek binnen de eigen club, begeeft zich op het domein van Spencer’s sociaal darwinisme en komt openlijk tot heel fascistoïde conclusies. Dergelijke kromme raciale redeneringen passen wel bij het complotdenken dat kenmerkend is voor sommige extremistische groeperingen.
Daarom is het belangrijk een pleidooi te houden voor het opentrekken van dergelijk onderzoek naar niet-Westerse populaties.
De rode draad doorheen het verhaal van deze kleine club is de ondergang of het verval van de witte middenklasse in het Westen en de Verenigde Staten, een verhaal dat wat voorzichtiger gebracht wordt door Charles Murray in zijn ‘Coming apart: The state of White America, 1960-2010’ uit 2012. De radicalere versie is een ontvolkingstheorie (onder meer via groepsselectie). Helaas moet vastgesteld worden dat op het moment van schrijven in onze contreien een gelijkaardig geval opgedoken is, met name het geval Michael Woodley, voormalig lid van het centrum Leo Apostel (VUB) die via zijn referenties zijn bewondering voor die foute club (Lynn-Rushton-Nyborg, allen discipelen van Eysenck) niet wegsteekt. De samenwerking met de VUB werd opgeschort (zie De Morgen van 1 juni 2022). Blijkt dat de 18-jarige extreemrechtse terrorist die toesloeg in een supermarkt in Buffalo (New York) op 14 mei 2022 in zijn manifest verwees naar het werk van Woodley en consoorten.
Te mooi om waar te zijn
Dit alles stemt natuurlijk niet tot feestvreugde. Is IQ-onderzoek dan echt niet immuun voor pseudowetenschappelijke praktijken en geraakt dit onderzoek het racistische stigma niet kwijt? Enkelingen kunnen inderdaad een vakgebied veel reputatieschade toebrengen. Helaas gebeuren er nog andere duistere zaken in de marge. Rond het, voor het overgrootste deel, serieuze onderzoeksprogramma, hangt ook een zwerm van charlatans, die programma’s aanbieden om het IQ mits training te verhogen. Want hoe aanlokkelijk is het niet, als een subtiele verhoging de kans op positieve uitkomsten later in het leven belooft. Echter, is het te mooi om waar te zijn, dan is dat meestal zo. De eerder vermelde Stuart Ritchie beschrijft enkele van deze pseudowetenschappelijke fratsen in detail, van het luisteren naar Mozart tot het uitvoeren van bepaalde testjes of computergames die zogenaamd wondermiddelen zijn. Deze praktijken doorstaan geen wetenschappelijke tests, maar ze bestaan, surfen als parasieten mee op wetenschappelijk onderzoek en beloven successen die ze niet kunnen waarmaken.
Waakzaamheid is nodig
Tot slot sluit ik af met een positieve noot. De honger naar kennis is eigen aan de mens en het overgrote merendeel van de intelligentieonderzoekers nemen hun vak serieus en houden zich niet bezig met pseudowetenschappelijke praktijken. Ik verwacht dus niet dat IQ-onderzoek (intussen ook uitgebreid tot onderzoek naar emotionele intelligentie) zal ophouden te bestaan. Zolang er kritische denkers zijn, die zich ook bewust zijn van de ethische gevolgen van het misbruiken van de resultaten van dit onderzoek, zie ik daar weinig graten in. Maar waakzaamheid is nodig. IQ-onderzoek vormt hiermee geen uitzondering op de vaststelling dat alle wetenschap potentieel misbruikt kan worden voor zowel malafide ideologische, religieus extremistische als zuiver monetaire redenen.
Lieven Pauwels (UGent, vakgroep Criminologie, strafrecht en sociaal recht)
1. Zo bedacht Charles Spearman een eigen correlatiecoëfficiënt (de rangcorrelatie) voor ordinale kenmerken en voerde hij pionierend werk uit op gebied van de factoranalyse, een methode om de verborgen structuur (relaties tussen variabelen) te beschrijven.
2. Stuart Ritchie is overigens een uitstekend wetenschapscommunicator en schreef een lovenswaardig werk over wanpraktijken in de wetenschappen, eerder besproken (Wonder en is gheen Wonder 2, 25-06-2021).
3. Ik beweer hier natuurlijk niet dat volledige en naïeve waardenvrijheid bestaat in sociaalwetenschappelijk onderzoek, maar dat is iets anders dan plat relativisme, dat wetenschap en cafépraat op gelijke voet plaatst
REFERENTIES
Fuentes, A. (2012). Race, monogamy, and other lies they told you. University of California Press.
Harden, K. P. (2021). The genetic lottery: why DNA matters for social equality. Princeton University Press.
Plomin, R. (2019). Blueprint, with a new afterword: How DNA makes us who we are. Mit Press.
Ritchie, S. (2015). Intelligence: All that matters. John Murray.
Zimmer, C. (2019). She Has Her Mother’s Laugh: The Powers, Perversions, and Potential of Heredity. Penguin.