Hoe herkent een computer een koe?

De wintertrui is versleten en u wilt een nieuwe, liefst dezelfde, maar die is niet meer te krijgen. Gelukkig heeft een winkelketen op Internet een uitgebreid assortiment beschikbaar. 'Laat me maar alles zien wat een beetje op mijn trui lijkt,' wilt u tegen de computer zeggen, maar dat is eenvoudiger gezegd dan gedaan.

Publication date: 15-03-2001

De wintertrui is versleten en u wilt een nieuwe, liefst dezelfde, maar die is niet meer te krijgen. Gelukkig heeft een winkelketen op Internet een uitgebreid assortiment beschikbaar. 'Laat me maar alles zien wat een beetje op mijn trui lijkt,' wilt u tegen de computer zeggen, maar dat is eenvoudiger gezegd dan gedaan. Op het Centrum voor Wiskunde en Informatica (CWI) in Amsterdam is een visueel systeem ontwikkeld waarin een klant begint op goed geluk een paar plaatjes te bekijken, de computer meedeelt wat hij ervan vindt, en die vervolgens laat meedenken om snel tot het gewenste resultaat te komen. Het systeem heeft grote mogelijkheden voor bijvoorbeeld het winkelen op Internet, waar de beeldcultuur onstuitbaar oprukt.

Beeldend kunstenaar, wiskundige en ondernemer Ben Schouten promoveert op vrijdag 23 maart op dit onderwerp. Het door Schouten en andere onderzoekers op het CWI ontwikkelde systeem berust op het beschrijven van beelden met behulp van fractale meetkunde. Naast het onderzoek is deze promotie opmerkelijk om twee redenen. Het proefschrift is alleen beschikbaar in de vorm van een CD-ROM, tot stand gekomen met medewerking van de Hogeschool voor de Kunsten in Utrecht. Verder is Rick van der Ploeg, staatssecretaris van Cultuur, en zelf van exacte komaf, lid van de promotiecommissie, waarmee het interculturele aspect van deze promotie wordt onderstreept.

'Lijkt op' koe
Wie eenmaal een koe heeft gezien, herkent ze overal. Wij vinden het als mens niets bijzonders dat ons brein in dat opzicht zo fantastisch werkt. Voor de computer is dat nog altijd veel te hoog gegrepen. Als die aan de hand van een voorbeeld-koe gaat zoeken in een grote database naar plaatjes met een koe erop, komt er nog maar al te vaak onzin uit. 'Daar heb ik helemaal niet om gevraagd', is een bekende klacht. Het probleem is om van een koe een zodanige omschrijving te geven dat de computer er mee uit de voeten kan. De omschrijvingsmethode moet natuurlijk niet alleen toepasbaar zijn op koeien. In de eerste systemen voor visuele informatie-ontsluiting kreeg ieder plaatje een aantal sleutelwoorden mee, zoals dat al lang gebruikelijk was met databases bestaande uit tekstdocumenten. Een koe laat zich echter niet zo maar vangen in een aantal woorden. De volgende fase was dan ook te proberen plaatjes te omschrijven met behulp van visuele kenmerken zoals kleur, vorm en textuur, terwijl ook begrippen als 'koe' visueel werden vastgelegd. Bij dat laatste komt de subjectiviteit om de hoek kijken. De database kan bijvoorbeeld een abstract schilderij van een koe bevatten, waarvan de een zegt dat het helemaal nergens op lijkt, en de ander dat het wel wat koeiigs heeft. Natuurlijk moet de gebruiker zelf kunnen bepalen wat hij koeiig vindt. Daarbij is het begrip 'lijkt op' een onmisbaar instrument, waarvoor een wiskundige afstandsmaat moet worden gevonden. De vraag is hoe je het best een beeld kunt beschrijven, of 'coderen', zodat de computer effectief inzetbaar wordt voor het beantwoorden van vragen als: toon mij alle foto's met een mooie zonsondergang.

Fractals
De menselijke waarneming blijkt mede daardoor zo efficiënt omdat zij sterk werkt met gelijkenissen. Het ligt dus voor de hand het te zoeken in wiskundige methoden die dat ook doen. Schouten heeft daarom beeldcodering met behulp van 'fractals' onderzocht. Fractals zijn zelfgelijkende meetkundige figuren, opgebouwd door herhaalde transformatie (iteratie) van een eenvoudig basispatroon, dat zich daardoor op steeds kleinereschalen vertakt. Op elk niveau van detaillering lijkt een fractal op zichzelf (Droste-effect). Met fractals kan men vrij eenvoudig bedrieglijk echte natuurvoorstellingen maken. Fractale beeldcodering gaat ervan uit dat het omgekeerde ook geldt: een beeld effectief opslaan in de vorm van de basispatronen van een klein aantal fractals, samen met het voorschrift hoe het oorspronkelijke beeld daaruit te reconstrueren. Het op het CWI in samenwerking met onderzoekers uit Leuven ontwikkelde systeem is mede gebaseerd op deze methode. De database van beelden wordt op het scherm weergegeven als een verzameling aanklikbare punten. Dicht bij elkaar liggende punten representeren op elkaar gelijkende beelden. In een geheel visueel vraag- en antwoordspel geeft de gebruiker steeds met voorbeelden uit de database zelf aan waar hij heen wil (bijvoorbeeld wat hij 'mooi' vindt). Na elke stap vindt een hergroepering van de punten plaats. Het systeem blijkt vooral effectief bij het beschrijven van structuur. Toepassingen van visuele systemen voor beeldontsluiting zijn er legio: opsporen van weeffouten in textiel, winkelen op Internet, scannen van TV-programma's (auteursrechten), foto's zoeken bij een compositietekening (criminaliteit), etc. Schouten heeft naast fractals ook andere op zelfgelijkenis gebaseerde methoden onderzocht, zoals wavelets.

Schouten studeerde af aan de Rietveld Academie voor beeldende kunst in Amsterdam. Naast een loopbaan als kunstenaar studeerde hij wiskunde en kwam in 1996 op het CWI werken aan zijn promotie-onderzoek. Tezelfdertijd richtte hij Desk.nl op, een bedrijf gericht op innovatieve oplossingen voor problemen gerelateerd aan Internet.