Optica om te rekenen met de snelheid van het licht

Wat als we AI op licht in computerchips zouden kunnen draaien in plaats van op elektriciteit? Dit zou enorme voordelen hebben. Ten eerste zou de berekening efficiënter zijn, omdat licht minder energie vereist dan het verplaatsen van elektronen door draden. Ten tweede zou de berekening sneller zijn, omdat deze met de snelheid van het licht zou plaatsvinden. Onderzoekers van CWI, ARCNL en Photosynthetic startten een proefproject van drie maanden om de uitdagingen en mogelijkheden te onderzoeken.

Allereerst moet een aantal belangrijke wiskundige en experimentele uitdagingen worden overwonnen. Om deze uitdagingen te onderzoeken, zijn CWI, ARCNL en Photosynthetic een kort proefproject van drie maanden gestart, gefinancierd met een valorisatiesubsidie van CWI. De kracht van deze multidisciplinaire samenwerking was dat alle benodigde expertise werd gebundeld: wiskunde, optica en de productie van refractieve elementen.

Enige technische achtergrond: optisch versus digitaal computergebruik

Tegenwoordig kunnen computers worden getraind om bijvoorbeeld afbeeldingen van katten of honden te herkennen, of om een tumor op een CT-scan te lokaliseren. Dit gebeurt door een convolutional neural network (CNN) te trainen. Een CNN is een complex algoritme met vele lagen filters dat wordt ‘getraind’ met behulp van enorme hoeveelheden gegevens. Wanneer het een afbeelding ziet, voert het deze afbeelding door al deze filters. Elke laag wordt beter in het herkennen van bepaalde kenmerken (lijnen, randen, oren, snorharen, enz.) totdat het uiteindelijk kan zeggen: “Dat is een kat”. De manier waarop het een digitaal beeld verwerkt en de output produceert, wordt weergegeven in figuur 1. Dergelijke digitale neurale netwerken zijn zeer krachtig en veelzijdig gebleken, maar ze verbruiken veel energie en worden bovendien beperkt door de verwerkingssnelheid van de computer waarop ze worden uitgevoerd.

Schematische weergave van een convolutionaal neuraal netwerk dat een afbeelding van een kat classificeert
Figuur 1: Schematische weergave van een convolutionaal neuraal netwerk (CNN) dat een afbeelding van een kat classificeert

En daar komen optische neurale netwerken (ONN's) om de hoek kijken. In plaats van een neuraal netwerk in software te simuleren, wordt een ONN rechtstreeks opgebouwd uit optische componenten zoals lenzen, spiegels en fasemodulatoren. De vormen en posities van deze optische elementen vormen het netwerk en de berekeningen vinden plaats terwijl het licht door de opstelling stroomt. Het concept is niet nieuw, maar heeft recentelijk nieuwe aandacht gekregen. In principe vereisen berekeningen die op deze manier worden uitgevoerd minder energie en zijn ze veel sneller – ze werken met de snelheid van het licht in plaats van de klokfrequentie van een digitale computer.

Het idee is dat de optische elementen zo kunnen worden ontworpen dat ze het beeld dat ze zien herkennen. Stel dat we een foto van een kat of een hond door een optisch neuraal netwerk schijnen. Voor een ONN is een foto een raster van pixelintensiteiten, een uniek golffront vol kleine variaties (helderheid, ruimtelijke structuren, frequenties en randen). Door de manier waarop de optische elementen zijn ontworpen, zal het licht uiteindelijk op een bepaalde plek focussen. Als de afbeelding bijvoorbeeld een kat is, focust het licht op een punt aan de linkerkant. Als het een hond is, focust het licht op een punt aan de rechterkant, zoals geïllustreerd in figuur 2.

Schematische weergave van een optisch neuraal netwerk dat een afbeelding van een kat classificeert
Figuur 2: Schematische weergave van een optisch neuraal netwerk (ONN) dat een afbeelding van een kat classificeert

Een uitdaging voor natuurkundigen en wiskundigen

De uitdaging bij het ontwerpen van ONN's is dat de ontwerpbeperkingen aanzienlijk verschillen van die van hun digitale tegenhangers. In tegenstelling tot digitale neurale netwerken kunnen optische netwerken niet veel lagen van verwerkingsstappen stapelen.

“Een optische ‘laag’ is een fysiek object”, legt ARCNL-groepsleider Lyuba Amitonova uit, “en aangezien licht zich meestal lineair gedraagt, voegt het stapelen van meer optische lagen zonder sterke niet-lineaire elementen ertussen geen extra intelligentie toe.” En omdat een ONN dat op een computer is ontworpen uiteindelijk in de echte wereld moet worden gebouwd, kunnen zelfs kleine onvolkomenheden de theoretische prestaties ervan verminderen. Een aantrekkelijk alternatief is om het ONN fysiek te trainen, met echt licht in plaats van simulaties. Maar dit is moeilijk. Optische systemen kunnen niet gemakkelijk het ‘backpropagation-algoritme’ implementeren, de methode die digitale netwerken gebruiken om van hun fouten te leren en daarmee de hoeksteen van machine learning. En het toevoegen van schakelende optische elementen om stapsgewijze verwerking te creëren, leidt tot nog meer verlies en complexiteit. Daarom moest het antwoord worden gevonden in veel eenvoudigere neurale netwerken, met slechts één enkele laag.

Een proefproject?

Dit brengt ons bij het gezamenlijke project van CWI, ARCNL en Photosynthetic. Het proefproject bracht de wiskundige en computationele kennis van Tristan van Leeuwen en Vladyslav Andriiashen van CWI samen met de expertise op het gebied van optische fysica van Lyuba Amitonova, Jacob Kraciuk en Maximillian Lipp van ARCNL en de microfabricagemogelijkheden van Alexander Kostenko van Photosynthetic. Zoals CWI-postdoctoraal onderzoeker Vlad zei, terwijl hij naar het scherm wees: “Soms heb je alleen maar vier punten nodig.” Het resultaat van dit drie maanden durende rollercoasterproject was een fysieke proof-of-principle ONN. Het team trainde eerst een CNN met één laag digitaal in een simulatie van de optische opstelling en bouwde vervolgens de optische tegenhanger met behulp van een ruimtelijke lichtmodulator (SLM). Na zorgvuldige afstemming kon de opstelling cijfers classificeren. De vier stippen op het scherm gaven aan dat de optische ‘lens’ het cijfer 3 betrouwbaar kon onderscheiden van andere cijfers. Er werden stippen boven en onder weergegeven als de invoer een ‘3’ was en stippen links en rechts als het een ander cijfer was.

Veel waardevoller dan de 4 stippen was echter dat het project een glimp liet zien van de toekomst, waarin de grenzen tussen hardware en berekeningen, en natuurkunde en wiskunde vervagen... zoals 4 stippen die één samenhangend beeld vormen. Stel je voor wat grootschalige ONN's in de toekomst zouden kunnen betekenen: datacenters die AI sneller en met een fractie van de elektriciteit draaien, slimme apparaten die taken uitvoeren zonder energieverslindende chips en autonome voertuigen en drones die onmiddellijke beslissingen nemen met behulp van razendsnelle berekeningen. Om deze visie te realiseren is echter meer onderzoek nodig. En daarvoor is een team van experts uit alle vier de vakgebieden nodig: wiskunde, natuurkunde, informatica en productie.