Wow, ik herken maar liefst 97% van de Nederlandse woorden. Van de lijst woorden die me in de test van het Groot Nationaal Onderzoek zijn voorgeschoteld, heb ik er maar twee ten onrechte afgedaan als ‘Nee, dit woord bestaat niet’. Bovendien ben ik niet in de valkuil getrapt dat ik nepwoorden voor echte heb aangezien*. Je kunt wèl zien dat ik heb nagedacht: mijn reactietijden per woord verschillen nogal en inderdaad heb ik getwijfeld over ijsventer (bestaat) en berkraaien (nep).
Het Taalonderzoek is een initiatief van NTR, VPRO en de Nederlandse Organisatie voor Wetenschappelijk Onderzoek. Onderzoekers van de vakgroep experimentele psychologie in Gent hebben een test ontwikkeld om te meten hoeveel woorden iemand kent. Vooraf wordt gevraagd naar je hoogste opleidingsniveau en in welke provincie of welk land je bent opgegroeid.
Interessant is niet zo zeer welke woorden bij wie bekend zijn, maar vooral of dit verklaarbaar is. Als speler/proefpersoon beschik je natuurlijk niet over de schat aan data die de onderzoekers opbouwen, maar je kunt wel kijken naar je eigen testgedrag. In de grafiek hieronder staan 68 van de 70 bestaande woorden die ik moest beoordelen; over de ontbrekende twee zo meteen meer. De aanname dat korte woorden sneller herkend worden, klopt in mijn lijstje in elk geval niet. Dit is te zien aan de rode en de blauwe lijnen, die weinig verband houden. De blauwe dropjes geven de reactietijd aan (vermenigvuldigd met vijf om visueel in de grafiek te passen; laag = snelle reactie). De rode vierkantjes staan voor het aantal letters (laag = weinig letters). Het lange woord concretiseren ging ongeveer even snel als het kortere stembus, terwijl stembus maar een derde kostte van de tijd die ik voor ijseend nodig had.
Psycholinguisten wisten al dat woordlengte weinig invloed heeft op de reactietijd. Bepalender voor “vertrouwdheid” en daarmee voor een korte reactietijd is de leeftijd waarop we woorden hebben geleerd: wat we als klein kind geleerd hebben, herkennen we het snelst. Nu weet ik alleen niet voor welke woorden in de lijst dit geldt; er is weinig kinderjargon bij. Als benadering kun je misschien gebruik maken van woordfrequenties: woorden die veel voorkomen in grote tekstverzamelingen zullen wel vertrouwder zijn en zouden ‘dus’ sneller herkend moeten worden. Daarom heb ik mijn 70 woorden opgezocht in SUBTLEX-NL, een online-database met woordfrequenties die gebaseerd zijn op 44 miljoen woorden uit ondertitels. Bij de 38 woorden uit mijn testlijst die ook in SUBTLEX-NL staan, toont een groen driehoekje hoe vaak ze voorkomen op de miljoen woorden. In de tabel scoren voorlopig en deuken het hoogst met bijna 30 keer. In werkelijkheid komen meestal en tijdens nog vaker voor, namelijk respectievelijk 62 en 135 keer per miljoen; die uitschieters moet u zich maar een flink eind boven de grafiek voorstellen. Hoe dan ook, in deze zeer beperkte gegevens valt weinig verband tussen frequentie (groen) en reactietijd (rood) te bespeuren. Des te belangrijker – en leuker – om mee te doen met de echte test: woordentest.ugent.be.
* Ps – Toen ik de test binnen het uur een tweede keer deed, was mijn score 84%, bij de derde keer nog maar 73% en bij de vierde weer 93%. Tja. Daar weet de psychologie vast ook iets over te zeggen: stoppen we bij de dalende lijn, of proberen we die weer te laten stijgen?