Wetenschap, zaterdag 26 april 2003 (NRC-Handelsblad)
De afstand tussen Händel en Hendrix
AMSTERDAMSE WISKUNDIGEN MAKEN VAN ELKE COMPUTER EEN MUZIEKKENNER
Rob van den Berg
Met een doodgewoon compressieprogramma, dat standaard op elke PC aanwezig
is, kan een computer voortaan onderscheid maken tussen klassieke muziek en
pop, en ook het werk van verschillende componisten uit elkaar houden. Het
idee om muziek automatisch te classificeren is afkomstig van drie
Amsterdamse wiskundigen: Rudi Cilibrasi, Paul Vitanyi en Ronald de Wolf.
Hun methode is ook toebasbaar bij het toeschrijven van anonieme
muziekstukken.
Vorig jaar lukte het drie Italiaanse wiskundigen om op soortgelijke wijze
onbekende teksten te analyseren en toe te schrijven aan een bepaalde
auteur, of automatisch de taal te detecteren waarin ze geschreven zijn.
Volgens Ronald de Wolf van het Centrum voor Wiskunde en Informatica
gebruiken de Italianen inderdaad ongeveer dezelfde methoden. De Wolf:
``Als twee teksten iets met elkaar gemeen hebben, bijvoorbeeld dat ze in
dezelfde taal geschreven zijn, is het mogelijk de tweede tekst efficiënter
te comprimeren als je dat bij de eerste al gedaan hebt. Wanneer je echter
een Engelse tekst aan een Italiaanse vastplakt en de combinatie
comprimeert, dan zal dat minder efficiënt gaan dan wanneer je die Engelse
tekst aan een andere Engelse tekst zou hebben vastgeplakt.''
De Amsterdammers doen het iets anders door meer wiskundig te werk te gaan.
De Wolf: ``Er zijn vele manieren waarop twee muziekstukken of teksten op
elkaar kunnen lijken. Voor elk van die overeenkomsten kun je een bepaalde
maat definiëren die de afstand tussen beide aangeeft. Wij hebben een
universele afstandsmaat gevonden die alle mogelijke manieren waarop twee
stukken op elkaar lijken in zich verenigt.''
Die universele maat is gebaseerd op de Kolmogorov-complexiteit van de twee
stukken: de lengte van het kortste computerprogramma dat de desbetreffende
tekst of muziekstuk in zijn geheel weergeeft. De Wolf: ``Helaas bestaat er
geen computer die de Kolmogorov-complexiteit van een willekeurig stuk kan
uitrekenen. Daarom proberen we de universele maat voor de afstand tussen
twee stukken in de praktijk te benaderen met behulp van een standaard
compressieprogramma, te weten Bzip2.''
Om hun methode te testen haalden De Wolf en zijn collega's zo'n
honderdtwintig muziekstukken in MIDI-format van het web, van Beethoven via
Miles Davis tot Jimi Hendrix. De Wolf: ``Voor alle instrumenten zijn de
noten weergegeven en verder staat er informatie op over de maker, titel,
componist, etc. Dat alles hebben we eerst weggehaald, waarna er een soort
digitale notenbalk overbleef in de vorm van een reeks enen en nullen. Die
klinkt overigens nog steeds als het origineel.''
boomstructuur
In een eerste test moest de computer twaalf stukken klassieke muziek
onderscheiden van evenveel stukken jazz of rock. Voor elke combinatie van
steeds twee stukken werd, met behulp van datacompressie, de onderlinge
afstand berekend. Gegeven die afstanden werd een boomstructuur bepaald,
een visualisatie van de mate waarin de stukken op elkaar lijken. Dat pakte
heel aardig uit: de computer onderscheidde de stukken in de drie
verschillende genres, al waren er een paar opvallende afwijkingen. Zoals
een combinatie van een prelude uit het Wohltemperierte Klavier van Bach
met Summertime van George Gershwin. Dit lijkt verkeerd maar, met wat
Amsterdamse branie, speculeren De Wolf en zijn collega's dat een analyse
door een musicoloog misschien wel onvermoede overeenkomsten tussen de twee
aan het licht zou kunnen brengen. In een verdere, uitgebreidere test met
twee-en-dertig klassieke pianostukken werd elke componist keurig in een
apart cluster gerangschikt, al waren ook hier een paar afwijkingen:
helemaal volmaakt is de methode dus nog niet.
franz süssmayr
De Wolf en zijn collega's zien mogelijkheden om via hun aanpak een
onbekende componist van een muziekstuk te achterhalen. Zo kregen ze de
suggestie van een Engelse musicoloog eens te kijken naar het Requiem van
Mozart, dat na diens dood is afgemaakt door de componist Franz Süssmayr.
Het is tot nu toe onbekend in hoeverre hij zich heeft gehouden aan de
aanwijzingen van Mozart. Het programma van De Wolf en zijn collega's zou
wat dat betreft uitkomst kunnen bieden door te analyseren of de tweede
helft van het requiem inderdaad past in het werk van Mozart, of eerder als
een Süssmayr-compositie moet worden beschouwd. De Wolf: ``Helaas is de
hoeveelheid beschikbare muziek in MIDI-format beperkt. De twee kleine
stukken van Süssmayr die we hebben weten te achterhalen zijn onvoldoende
om uitsluitsel te bieden. En andere digitale muziekformaten, zoals MP3,
zijn weer minder geschikt voor het soort compressie dat wij toepassen.''
Copyright: Berg, R. van den