Taaltechnologie is een mooi vak. Ik waardeer de inspanningen van taaltechnologen om ons leven te vereenvoudigen. Denk aan automatische spellingcontrole. Onlangs heeft de universiteit van Tilburg valkuil.net gelanceerd: een website die spelling controleert door woorden in hun context te bekijken en bijvoorbeeld voor “Hij zij dat het regende.” voorstelt om “zij” door “zei” te vervangen. De naam “valkuil” alleen al suggereert dat de makers plezier beleven aan taal (denk aan massagebed en kwartslagen). Mooi strak logo, dat meedraait zolang de spellingcorrectie draait “Het bijzondere aan valkuil.net is dat de automatische spellingcorrectie is gebaseerd op grote hoeveelheden Nederlandse tekst, en niet op taalkundige kennis of een vaste woordenlijst.”
Het persbericht stelt dat Valkuil nog niet perfect is. Dat wil ik natuurlijk graag zelf constateren, dus ik tik “De rapporten zeggen niets over de verhouding van de plannen tot het lokale beleid in 2015. Een woordvoerder van het Witte Huis gaf gisteravond verder geen toelichting op het gesprek.” en stel de zekerheid bij de correctie van fouten maximaal in. Valkuil weet dus erg zeker dat “niets” en “geen” fout zijn: ik moet ze vervangen door “iets”, respectievelijk “een”. Weet Valkuil niet dat hierdoor de betekenis drastisch verandert? Nee. Hij vindt bovendien dat 2015 “20u15” moet zijn. (2014 laat Valkuil ongemoeid.)
Nu voel ik me nog meer uitgedaagd. Sommige onjuiste spaties worden wel gesignaleerd – “verpleeg kundige”, “in het zelfde huis” – maar lang niet alle. Juist doordat de context zo belangrijk is, leiden wisselende contexten tot wisselende oordelen: Valkuil protesteert tegen “dat gebeurd vaker”, maar niet tegen “daarom gebeurd dat vaker”; volgorde van onderwerp en persoonsvorm? Wat in de onderliggende teksten rechtvaardigt “Zijn” met een hoofdletter in “Een granaatscherf heeft een van zijn longen doorboord”? (Bij “zijn aderen” zwijgt Valkuil.)
Tot slot heb ik de onderstaande – toegegeven, nogal perverse – tekst ingevoerd: Karel en zijn zuster woonde tot haar dood in het zelfde huis als zijn moeder. (Hij woonden dus in hetzelfde huis.) Boven aan de trap was zijn kamer. Karel had al lang niet auto gereden. Hij gaat er op uit op de fiets daar en tegen. Van ongelukken houdt je ten slotte niet, waar bij ik er van uit ga dat hij van te voren zijn rij school zondermeer er op had zitten. Ten slotte wil een Tweede Kamer lid dat aan autoexport doet geen autoongelukken als je al autoimmuun bent.
Valkuil corrigeert terecht “het zelfde”, “boven aan”, “waar bij”, “te voren” en “autoongelukken”. Dat laatste heet een woordenlijstfout; gebruikt het programma dan toch een (de) woordenlijst? Waarom dan geen alarm bij “autoexport”, “auto gereden” en “autoimmuun”? Valkuil mist de getalsfouten in “woonde(n)” en de d/t-fout. Nogal wat onjuiste spaties blijven staan, maar “Kamer lid” gaat goed (nu nog een woordje verder kijken…). Over “allang” valt te twisten en dat “ten slotte” slechts eenmaal wordt bekritiseerd, zal wel aan de zinsbouw liggen. Heel verrassend ten slotte is het voorstel om “zijn moeder” in de eerste zin te veranderen in “mijn moeder”. Op de overzichtelijke en uitnodigende webpagina is nog best plaats voor een meldknop. En nog een suggestie: het is al handig dat je fouten meteen kunt corrigeren, maar nog handiger wordt het als Valkuil het resultaat dan opnieuw beoordeelt. Nu stelt het programma voor de passage “waar bij ik” twee correcties voor, namelijk “waarbij” en “mij” (“bij mij” is immers stukken beter dan “bij ik”). Zodra ik de eerste suggestie overneem, zou de tweede moeten vervallen.