Big Data at High Performance

Publication date: 30-04-2015

Computer hardwaresystemen hebben zich ontwikkeld van monolithische machines met een component voor elke taak, tot complexe hardware systemen met een breed scala aan heterogene componenten zoals spinning discs, SSD’s, RAM, CPU. Wanneer deze verschillende geheugencomponenten samenwerken om een bepaalde taak te volbrengen verloopt die samenwerking echter verre van efficiënt.

In zijn proefschrift onderzoekt Holger Pirk, promovendus aan het Centrum Wiskunde & Informatica (CWI) in Amsterdam, het beheer van relationele data in dergelijke moderne computersystemen. Hierbij richt hij zich op de vraag hoe prestaties van dataverwerking kunnen worden verbeterd. De resultaten van zijn proefschrift zijn relevant voor bedrijven die een beroep doen op snelle data-analyse voor hun services zoals internetbedrijven en creditcardmaatschappijen.

Pirk legt in zijn onderzoek  een relatie tussen de asymmetrische  eigenschappen van de geheugen componenten (zoals snel & klein versus langzaam & groot) en de asymmetrie in toegang tot data (opeenvolgend versus random) en onderzoekt  verschillende strategieën om de asymmetrie in datamanagement applicaties en in de componenten van het geheugente identificeren en te matchen. Deze strategieën kunnen uiteindelijk worden toegepast om de prestaties van hardware systemen te verbeteren.  

Daarnaast richt Pirk zich op de samenhang tussen data-opslag en queryverwerking. Gebaseerd op Just-in-time compilatie als query processing model, ontwikkelde hij een nieuw verwerkingsmodel dat efficiënt gebruik maakt van de asymmetrie in de onderliggende data en de componenten van het geheugen.

Het onderzoek levert een belangrijke bijdrage aan nieuwe oplossingen voor een snellere verwerking en analyse van grote datasets. Pirk verdedigt zijn proefschrift "Waste not, want not!`- Managing Relational data in Asymmetric Memories”,  1 mei 2015, aan de Universiteit van Amsterdam. Promotoren zijn Prof.dr. Martin Kersten en Prof. Dr. Stefan Manegold.