IN NOVEMBER 1984 ontving James Flynn, een socioloog aan de University of Otago in Nieuw-Zeeland, een groot postpakket. Het kwam van een collega uit Utrecht en bevatte de resultaten van IQ-tests, afgenomen bij twee generaties Nederlandse achttienjarigen. Toen Flynn de gegevens bekeek, ontdekte hij iets eigenaardigs. De Nederlandse achttienjarigen uit de jaren tachtig scoorden beter dan degenen die dezelfde tests hadden gedaan in de jaren vijftig. En niet zomaar een beetje beter: veel beter.
Flynn was nieuwsgierig en verstuurde een paar brieven. Hij verzamelde resultaten van intelligentietests uit Europa, Noord-Amerika, Azië en ontwikkelingslanden, totdat hij de gegevens van bijna dertig landen had. In alle gevallen kwam het verhaal op hetzelfde neer. IQ’s over de hele wereld leken met 0,3 punten per jaar te stijgen, of 3 punten per decennium, zolang de tests waren afgenomen. Om de een of andere reden leken mensen slimmer te worden.
Flynn schrijft al bijna 25 jaar over de implicaties van zijn ontdekking die nu bekendstaat als het Flynn-effect. Zijn boeken bestaan uit een reeks duidelijk geformuleerde statistische observaties ter ondersteuning van bedrieglijk bescheiden conclusies. Het bewijs van zijn oorspronkelijke observatie is nu zo overweldigend dat het Flynn-effect geen theorie meer is, maar een feit. Wat onzeker blijft, is hoe we het Flynn-effect moeten verklaren. Als een Amerikaan die in de jaren dertig is geboren, een IQ van 100 heeft, zullen zijn kinderen volgens het Flynn-effect een IQ van 108 hebben en zijn kleinkinderen een IQ in de buurt van 120: meer dan een standaarddeviatie hoger. Omgekeerd zou de typische puber van vandaag, met een IQ van 100, grootouders moeten hebben met een gemiddeld IQ van 82, dus onder de drempel die nodig is voor een middelbareschooldiploma. En als we nog verder teruggaan, zou volgens het Flynn-effect het gemiddelde IQ van schoolkinderen in 1900 rond de 70 liggen, wat bizar genoeg zou suggereren dat de Verenigde Staten een eeuw geleden werden bevolkt door mensen die we tegenwoordig als geestelijk gehandicapt zouden beschouwen.
Er zijn bijna net zo lang IQ-fundamentalisten geweest als er IQ-tests zijn. H.H. Goddard vestigde in de vroege jaren van de vorige eeuw het idee dat intelligentie kon worden gemeten langs een enkele, lineaire schaal. Een van zijn speciale bijdragen was het uitvinden van het woord moron (debiel). ‘Mensen die het lopendebandwerk doen, zitten meestal op de juiste plek’, schreef hij. Goddard werd in de jaren twintig gevolgd door Lewis Terman, die kinderen in Californië met de hoogste IQ’s verzamelde en in vertrouwen voorspelde dat zij aan de top van alle beroepen terecht zouden komen. In 1969 beweerde de psychometricus Arthur Jensen dat programma’s als Head Start, waarmee werd geprobeerd de leerprestaties van kinderen uit minderheidsgroepen op te schroeven, tot mislukken waren gedoemd omdat het IQ zo sterk genetisch bepaald was; en in 1994 publiceerden Richard Herrnstein en Charles Murray hun bestseller The Bell Curve, de beknopte handleiding over erfelijkheid, waarin werd gesteld dat zwarten qua intelligentie van nature inferieur waren ten opzichte van blanken. Voor de IQ-fundamentalist staan twee dingen vast: ten eerste dat IQ-tests een harde, identificeerbare eigenschap meten die de kwaliteit van ons denken voorspelt, en ten tweede dat het IQ wordt bepaald door onze genen en nauwelijks wordt beïnvloed door omgevingsfactoren.
Dit was wat James Watson, de medeontdekker van het DNA, bedoelde toen hij onlangs aan een Engelse krant vertelde dat hij ‘inherent pessimistisch’ was over de vooruitzichten van Afrika. Vanuit het perspectief van een IQ-fundamentalist suggereert het feit dat Afrikanen in IQ-tests lager scoren dan Europeanen een onuitroeibare cognitieve handicap. In de daaropvolgende controverse werd Watson verdedigd door de journalist William Saletan in een driedelige serie voor het onlinetijdschrift Slate. Onder uitvoerige verwijzing naar het werk van J. Philippe Rushton, een psycholoog die is gespecialiseerd in vergelijkingen tussen wat hij het ‘negroïde’ brein en de ‘negroïde’ penis noemt, werkte Saletan de fundamentalistische positie uit tot aan de logische conclusie. Als we het verschil tussen zwarten en blanken zouden willen opheffen, schreef Saletan, zou er een sterke vermenging tussen beide rassen nodig zijn, of een soort corrigerende genetische manipulatie die gericht was op het verbeteren van het Afrikaanse volk. ‘Economische en culturele theorieën hebben het grootste deel van het patroon niet kunnen verklaren’, beweerde Saletan, die claimde dat hij diep in alle berekeningen en argumenten van beide zijden was gedoken. Maar Saletan had duidelijk nooit een duik genomen in het argument van Flynn, want wat Flynn in zijn postbus aantrof, haalde alle zekerheden onderuit waarop het IQ-fundamentalisme berust. Als datgene wat IQ-tests meten (wat dat dan ook mag zijn), binnen een generatie zo sterk kan stijgen, kan het niet zo heel onveranderlijk zijn en ziet het er ook niet erg aangeboren uit.
Het feit op zich dat het gemiddelde IQ in de loop van de tijd verandert, zou al ernstig te denken moeten geven, schrijft Flynn in What Is Intelligence?, zijn recentste poging om de implicaties van zijn ontdekking te achterhalen. ‘Hoe kunnen zulke enorme stijgingen nu stijgingen van de intelligentie zijn? Ofwel de kinderen van vandaag zijn veel slimmer dan hun ouders, ofwel IQ-tests zijn (in elk geval onder bepaalde omstandigheden) geen goede maatstaf voor intelligentie.’

DE BESTE MANIER om te begrijpen waarom het IQ stijgt, zegt Flynn, is te kijken naar een van de meest gebruikte IQ-tests, de zogeheten Wechsler Intelligence Scale for Children (WISC). De WISC bestaat uit tien subtests die elk een ander aspect van het IQ meten. Flynn wijst erop dat scores in bepaalde categorieën, bijvoorbeeld die van algemene kennis, of vocabulaire, of het vermogen om basale rekenkundige handelingen te verrichten, in de loop van de tijd maar beperkt zijn gestegen. De grote winst in de WISC ligt vooral in de categorie die we ‘gelijkenissen’ noemen, waar je vragen krijgt als: ‘In welk opzicht lijken honden en konijnen op elkaar?’ Tegenwoordig geven we meestal het antwoord dat in het kader van een IQ-test het juiste antwoord is: het zijn allebei zoogdieren. Een negentiende-eeuwse Amerikaan zou hebben gezegd dat we honden gebruiken om op konijnen te jagen.
‘Als de wereld van alledag je cognitieve thuis is, is het niet natuurlijk om abstracties en logica en het hypothetische los te maken van hun concrete referenten’, schrijft Flynn. Onze overgrootouders waren misschien heel intelligent. Maar ze zouden slecht presteren in IQ-tests omdat ze niet hebben deelgenomen aan de grote cognitieve revolutie van de twintigste eeuw, waarin we hebben geleerd onze ervaringen te ordenen volgens een nieuwe reeks abstracte categorieën. Zoals Flynn het uitdrukt, hebben we nu een ‘wetenschappelijke bril’ op waardoor we iets kunnen aanvangen met de WISC-vragen over gelijkenissen. Als we zeggen dat de Nederlandse IQ-scores aanzienlijk zijn gestegen tussen 1952 en 1982, is dat gewoon een andere manier om te zeggen dat Nederland in 1982, in elk geval in bepaalde opzichten, veel meer cognitieve eisen stelt dan Nederland in 1952. Anders gezegd: een IQ meet niet zozeer hoe slim we zijn, als wel hoe modern we zijn.
Dit is een fundamenteel onderscheid. Toen bijvoorbeeld vroeg in de vorige eeuw de kinderen van Zuid-Italiaanse immigranten IQ-tests kregen, vielen hun mediaanscores tussen eind zeventig en begin tachtig een hele standaardafwijking lager dan hun Amerikaanse en westerse tegenhangers. Zuid-Italianen deden het bij IQ-tests net zo slecht als Latijns-Amerikanen en zwarten. U begrijpt dat er in die tijd veel werd gepraat over de genetische inferioriteit van Italianen en dat het onverstandig was om zoveel tweederangs immigranten binnen te laten in de Verenigde Staten, en over de ellende die wel endemisch leek in Italiaanse stadswijken. Klinkt dat bekend? Als tegenwoordig wordt gesproken over de veronderstelde genetische verschillen in intelligentie tussen bepaalde rassen, hoor je niets meer over Zuid-Italianen. ‘Begonnen hun genen ergens in de jaren dertig te veranderen?’ vragen de psychologen Seymour Sarason en John Doris in hun overzicht van de Italiaanse kwestie. ‘Of is het mogelijk dat de socioculturele ontwikkeling van Italo-Amerikanen zich ergens in de jaren twintig, of nog eerder, afsplitste van die van de zwarte en Spaanse Amerikanen, waardoor ze zich konden assimileren aan de algemene, ongedifferentieerde menigte Amerikanen?’
De psycholoog Michael Cole en een paar collega’s namen ooit bij leden van de Kpelle-stam in Liberia een versie van de WISC-test over gelijkenissen af: ze namen een mand met voedsel, werktuigen, bakken en kleding en vroegen de stamleden om die in de juiste categorieën te sorteren. Tot frustratie van de onderzoekers kozen de Kpelle functionele combinaties. Ze legden een aardappel en een mes bij elkaar omdat een mes wordt gebruikt om een aardappel te snijden. ‘Een verstandig man zou het alleen op die manier doen’, legden ze uit. Ten slotte vroegen de onderzoekers: ‘En hoe zou een dwaas het doen?’ De stamleden sorteerden de items direct opnieuw, nu in de ‘juiste’ categorieën. Je zou kunnen beweren dat taxonomische categorieën een vooruitgang in de ontwikkeling zijn, en dat de Kpelle zich in technologisch en wetenschappelijk opzicht waarschijnlijk verder zouden ontwikkelen als ze de wereld op die manier begonnen te zien. Maar als je ze minder intelligent noemt dan westerlingen op basis van hun prestaties bij die test, betekent dat alleen maar dat ze andere cognitieve voorkeuren en gewoonten hebben. En als het IQ verandert met mentale gewoonten, die in een generatie kunnen worden aangenomen en afgewend, waar hebben we het dan eigenlijk over?
Toen ik jong was, speelden we met ons gezin soms ‘Twintig vragen’ tijdens lange autoritten. Mijn vader was een van die mensen die volhouden dat de standaardcategorieën van dieren, planten en mineralen moet worden aangevuld met een vierde categorie: ‘abstract’. Abstract was dan zoiets als ‘datgene dat mij door het hoofd ging toen we tachtig kilometer geleden langs de watertoren reden’. Die abstracte categorie klinkt waanzinnig moeilijk, maar dat is niet zo: je hoeft alleen maar een iets andere reeks vragen te stellen en een iets andere reeks conventies te begrijpen, en na twee of drie ronden oefenen wordt het net zo makkelijk te raden als ‘Winston Churchill’. (Er is één uitzondering. Dat was de rit waarbij mijn oude kamergenoot Tom Connell als abstractie de ‘Onbekende Soldaat’ koos, waardoor hij volkomen legitiem en zeer monter op bijna elke vraag ‘Ik weet het niet’ kon antwoorden. We speelden met ons vieren en na een uur gaven we het op.) Flynn zou zeggen dat mijn vader zijn drie zonen leerde om een wetenschappelijke bril op te zetten, en dat die extra oefening waarschijnlijk al onze IQ’s een paar punten omhoog gooide. Maar laten we duidelijk zijn over wat dat betekent. Er is een wereld van verschil tussen een genetisch IQ-voordeel en een IQ-voordeel dat afhankelijk is van lange autotochten met Graham Gladwell.
FLYNN IS EEN voorzichtige en zorgvuldige schrijver. In tegenstelling tot vele anderen in de IQ-discussies onthoudt hij zich van grote theorieën. Hij komt steeds weer terug op het feit dat IQ-scores worden gegenereerd door papier-en-potloodtests; en het interpreteren van deze scores, zegt hij, is een warrige en gecompliceerde aangelegenheid waarvoor je eerder de vaardigheden van een accountant nodig hebt dan die van een filosoof.
Flynn laat bijvoorbeeld zien wat er gebeurt als we erkennen dat het IQ geen onafhankelijk getal is, maar een waarde die hoort bij een bepaalde tijd en een bepaalde test. Als er een IQ-test wordt gemaakt, wordt die gekalibreerd of genormeerd, zodat degenen met een testscore in het vijftigste percentiel (dus precies op de mediaan) een score van 100 toegewezen krijgen. Maar aangezien IQ’s aldoor blijven stijgen, kun je dat markeringspunt van honderd punten alleen handhaven door de tests regelmatig moeilijker te maken: door ze opnieuw te normeren. De oorspronkelijke WISC werd genormeerd aan het eind van de jaren veertig. Hij werd vroeg in de jaren zeventig opnieuw genormeerd als de WISC-R, voor de derde keer aan het eind van de jaren tachtig als de WISC-III, en een paar jaar geleden weer als de WISC-IV; en elke versie was een klein beetje moeilijker dan zijn voorganger. Het idee dat iedereen een IQ ‘heeft’ van een bepaalde hoogte, betekent dus alleen iets als je weet welke WISC-test iemand heeft gedaan en wanneer, aangezien er een aanzienlijk verschil is tussen een score van 130 voor de WISC-IV en een score van 130 voor de veel makkelijkere WISC.
Dit is niet triviaal. IQ-tests worden gebruikt om mensen te diagnosticeren als verstandelijk gehandicapt, waarbij een score van 70 meestal de grens vormt. U begrijpt wel dat het Flynn-effect dit systeem flink in de war gooit. In de jaren zeventig en tachtig gebruikten de meeste staten de WISC-R om vast te stellen wie verstandelijk gehandicapt was. Maar aangezien kinderen (zelfs kinderen met handicaps) elk jaar een beetje hoger scoren, daalde het aantal kinderen van onder de 70 geleidelijk tot aan het eind van de jaren tachtig. Toen werd in 1991 de WISC-III geïntroduceerd en plotseling ging het percentage kinderen met het etiket ‘verstandelijk gehandicapt’ weer omhoog.
De psychologen Tomoe Kanaya, Matthew Scullin en Stephen Ceci schatten dat als alle staten onmiddellijk op de WISC-III waren overgestapt, het aantal Amerikanen met het etiket ‘verstandelijk gehandicapt’ zou zijn verdubbeld.
Dat is een buitengewoon aantal. De diagnose ‘verstandelijk gehandicapt’ is een van de meest stigmatiserende van alle classificaties in het onderwijs en in de beroepen; en toch is de kans dat een kind met dit etiket wordt belast in niet geringe mate afhankelijk van het exacte tijdstip in de levenscyclus van de WISC waarop het kind toevallig wordt beoordeeld. ‘Voor zover ik kan vaststellen, hebben klinisch psychologen of schoolpsychologen die tijdens de relevante 25 jaar de WISC hebben gebruikt, nooit gemerkt dat het criterium voor verstandelijke handicaps in de loop van de tijd minder streng is geworden’, schreef Flynn in een artikel in 2000. ‘Toch heeft niemand de voor de hand liggende conclusie over deze psychologen getrokken, namelijk dat ze geen systematische beoordeling hebben toegepast op het IQ-criterium voor verstandelijke handicaps.’
Flynn praat met dezelfde precisie over de vraag of Aziaten een genetisch IQ-voordeel hebben, een mogelijkheid die onder IQ-fundamentalisten de laatste jaren tot grote opwinding heeft geleid. Gegevens waaruit bleek dat Japanners een hoger IQ hadden dan mensen van Europese afkomst brachten bijvoorbeeld de Britse psychometricus en eugeneticus Richard Lynn ertoe om een uitgebreide evolutionaire verklaring op te stellen waarin de Himalaya, een echt koud klimaat, premoderne jagerspraktijken, hersenomvang en gespecialiseerde klinkers een rol speelden. Omdat de IQ’s van Chinees-Amerikanen ook hoger leken te zijn, poneerden IQ-fundamentalisten het bestaan van een internationale IQ-piramide met Aziaten aan de top, Europese blanken daarna, en Latijns-Amerikanen en zwarten onderaan.
Dit was een perfecte test voor James Flynns boekhoudkundige vaardigheden. Hij bekeek eerst de gegevens van Lynn en besefte dat de vergelijking mank ging. Lynn vergeleek schattingen van Amerikaanse IQ’s op basis van een representatieve steekproef van schoolkinderen met schattingen van Japanse IQ’s op basis van stedelingen met een hoog inkomen. Toen hij de berekening opnieuw uitvoerde, kwam het Japanse gemiddelde niet op 106,6, maar op 99,2. Toen bekeek Flynn de schattingen voor de Chinees-Amerikanen. Die bleken te zijn gebaseerd op een onderzoek uit 1975 in het Chinatown van San Francisco, aan de hand van de zogenaamde Lorge-Thorndike Intelligence Test. Maar de Lorge-Thorndike-test was genormeerd in de jaren vijftig. Die zou voor kinderen in de jaren zeventig geen kunst zijn. Toen de Chinees-Amerikaanse scores opnieuw werden beoordeeld met actuele intelligentieberekeningen, bleken ze scores te hebben van 97 voor verbale intelligentie en 100 voor non-verbale intelligentie. Chinees-Amerikanen hadden een iets lager IQ dan blanke Amerikanen.
Het Aziatisch-Amerikaanse succesverhaal was plotseling op zijn kop gezet. De getallen suggereerden nu, zei Flynn, dat ze niet geslaagd waren vanwege hun hogere IQ, maar ondanks hun lagere IQ. Aziaten presteerden boven verwachting. Met een scherpzinnige statistische analyse werkte Flynn vervolgens uit hoe ver ze precies boven de verwachting presteerden. Onder blanken heeft vrijwel iedereen die een hogere opleiding heeft of in het management of de techniek zit, een IQ van 97 of hoger. Onder Chinees-Amerikanen is die drempel 90. Een Chinees-Amerikaan met een IQ van 90 doet daar blijkbaar net zoveel mee als een blanke Amerikaan met een IQ van 97.
De Aziatische prestaties zijn niet zo’n groot raadsel. Het heeft te maken met hard werken en veel belang hechten aan een hogere opleiding, en met een cultuur die de nadruk legt op succes op het werk. Maar Flynn merkt nog een ander ding op. De kinderen van die eerste succesvolle golf van Aziatisch-Amerikanen hadden wel degelijk IQ’s die hoger waren dan die van alle anderen, namelijk rond de 103. Aziatisch-Amerikaanse ouders die zich een weg hebben gebaand naar de hogere regionen van de arbeidsmarkt en hebben gezien hoe belangrijk abstract denken in deze beroepen is, hebben er duidelijk voor gezorgd dat hun eigen kinderen een wetenschappelijke bril droegen. ‘Chinees-Amerikanen zijn een etnische groep waarvoor hoog presteren vooraf ging aan een hoog IQ in plaats van andersom’, concludeert Flynn, waarmee hij ons eraan herinnert dat wij in onze discussies over de relatie tussen IQ en succes vaak oorzaak en gevolg verwarren. ‘Het is niet eenvoudig om de geschiedenis van hun prestaties zonder emotie te overzien’, schrijft hij. En zo is het precies. Wie het succes van Aziaten toeschrijft aan een abstract getalletje, is bezig het te bagatelliseren.

TWEE WEKEN GELEDEN kwam Flynn naar Manhattan om met Charles Murray te discussiëren in een forum dat werd gesponsord door het Manhattan Institute. Het onderwerp was de IQ-kloof tussen zwart en blank in Amerika. Tijdens de 25 jaar na de Tweede Wereldoorlog is die kloof aanzienlijk kleiner geworden. De IQ’s van blanke Amerikanen stegen als onderdeel van het algemene wereldwijde Flynn-effect, maar de IQ’s van zwarte Amerikanen stegen sneller. Daarna stagneerde deze trend gedurende een periode van 25 jaar, en de vraag was waarom.
Murray toonde een reeks powerpointdia’s, elk met een andere statistische formulering van de IQ-kloof. Hij leek pessimistisch over de mogelijkheid dat het raciale verschil in de toekomst kleiner zou worden. ‘Tegen de jaren zeventig hadden ze wel alles uit de omgevingsfactor gehaald dat eruit te halen viel’, zei hij. Hij scheen te denken dat deze kloof een inherent verschil tussen de rassen aangaf. ‘Om het cru te zeggen: vanaf de jaren zeventig werden er relatief meer zwarte kinderen geboren uit echt domme moeders’, zei hij. Toen de discussievoorzitter Jane Waldfogel hem vertelde dat de kloof volgens de recentste gegevens weer bezig was kleiner te worden, leek Murray niet onder de indruk, alsof hij zich niet kon voorstellen dat zwarten ooit nog verdere vooruitgang zouden kunnen boeken.
Flynn pakte het anders aan. Hij wees erop dat de kloof tussen zwart en blank aanzienlijk verschilt per leeftijd. Hij merkte op dat volgens de tests voor het meten van het cognitief functioneren van kleine kinderen, al zijn die inderdaad nog rudimentair, de rassen vrijwel hetzelfde zijn. Rond het vierde jaar is het gemiddelde zwarte IQ 95,4, slechts vierenhalve punt achter het gemiddelde blanke IQ. Daarna treedt de echte kloof pas op: tussen de vier en 24 jaar verliezen zwarten 0,6 procent per jaar totdat hun scores zich stabiliseren op 83,4.
Deze geleidelijke daling weerspiegelt niet het gebruikelijke patroon van genetische invloeden, zei Flynn. In plaats daarvan is het precies wat je zou verwachten op grond van de ongelijke cognitieve omgevingen waarmee blanken en zwarten worden geconfronteerd naarmate ze ouder worden. Zwarte kinderen groeien vaker op in één-oudergezinnen dan blanke kinderen, en één-oudergezinnen zijn cognitief minder complex dan twee-oudergezinnen. Het gemiddelde IQ in groep 3 op scholen waar zwarten naartoe gaan, is 95, wat betekent dat ‘kinderen die bovengemiddeld willen zijn, minder hoog hoeven te mikken’. Er zijn mogelijk ook ongunstige verschillen tussen de zwarte en de blanke tienercultuur, en een enorm groot aantal jonge zwarte mannen zit in de gevangenis: nauwelijks het soort omgeving waarin iemand leert een wetenschappelijke bril op te zetten.
Flynn had het vervolgens over wat we hebben geleerd uit onderzoeken naar adoptie en kinderen van gemengd ras, en dat bewijsmateriaal paste ook niet bij een genetisch model. Als IQ is aangeboren, zou het geen verschil moeten maken of bij een kind van gemengd ras de moeder of de vader zwart is. Maar dat doet het wel: kinderen met een blanke moeder en een zwarte vader hebben een IQ-voordeel van acht punten ten opzichte van kinderen met een zwarte moeder en een blanke vader. En het zou ook weinig verschil moeten maken waar een kind van gemengd ras wordt geboren. Maar ook dat is niet zo: kinderen van zwarte Amerikaanse soldaten in het naoorlogse Duitsland die zijn grootgebracht door hun Duitse moeders, hebben hetzelfde IQ als de kinderen van blanke Amerikaanse soldaten en Duitse moeders. In dat geval was het verschil niet dat de kinderen zwart waren, zoals een fundamentalist zou zeggen. Het ging erom dat ze Duits waren, dat ze werden grootgebracht in een andere cultuur en onder andere omstandigheden. ‘De geest lijkt veel meer op een spier dan we ons ooit hebben gerealiseerd’, zei Flynn. ‘Hij heeft cognitieve oefening nodig. Het is geen stuk klei waarop je een onuitwisbare indruk maakt.’ De les uit de verschillen tussen zwart en blank was dezelfde als de les uit Nederland van jaren geleden: het IQ meet niet alleen de kwaliteit van iemands geest, maar ook de kwaliteit van de wereld waarin deze persoon leeft.

Vertaling Judith Dijs

Malcolm Gladwell, Wat de hond zag en andere avonturen. Vertaald door Judith Dijs en Tom Kerkhove, € 19,95 (verschijnt eind oktober)

Malcolm Gladwell, What the Dog Saw. Vertaald door Judith Dijs en Tom Kerkhove, € 18,35