Promotie Steven de Rooij: "Wiskunde helpt beste model te kiezen"

Wetenschappers willen de werkelijkheid vangen in modellen.

Wetenschappers willen de werkelijkheid vangen in modellen.

Maar welk model is het beste? Steven de Rooij van het Centrum Wiskunde & Informatica (CWI) in Amsterdam onderzocht modelselectie met wiskundige technieken in zijn proefschrift 'Minimum Description Length Model Selection - Problems and Extensions'. Hij promoveert woensdag 10 september aan de Universiteit van Amsterdam. Resultaten zijn mogelijk toepasbaar op het voorspellen van beurskoersen, het filteren van ongewenste e-mail, datacompressie, economische modellen en onderzoek naar klimaatverandering.

Een model kan worden opgevat als een theorie over, of beknopte beschrijving van de werkelijkheid. Het kan een wetenschappelijke hypothese vertegenwoordigen ('E = ½ mv²'), maar ook tekst die een spraakherkenningsprogramma verstaat (de gebruiker zei: "schoonmaken") of indrukken van de buitenwereld ("Volgens mij vindt hij/zij me leuk!"). Het probleem met dergelijke modellen is dat er vaak verschillende alternatieven voorhanden zijn (hier bijvoorbeeld: 'E = mc²', "schoenmaker" en "kwal"). Het is niet meteen duidelijk hoe je het beste model moet kiezen.

Als modellen exact zijn gespecificeerd, levert het Minimum Description Length principe een goede manier om te kiezen, op basis van observaties. Tot nu toe werd daarbij echter geen rekening gehouden met het verschijnsel dat vaak in de loop van de tijd verandert welk model het meest bruikbaar is. Dat komt doordat de omstandigheden veranderen, of de modellen zichzelf anders gaan gedragen als er meer observaties zijn. De Rooij ontwierp een manier om de bestaande methodes dynamisch te maken. Zo kan ook bij veranderende omstandigheden het beste model gekozen worden.