Nieuws
0

Supercomputers naderen de exaschaal

Christian Jongeneel

Tegen het jaar 2020 komen de eerste supercomputers op de markt die één exaflops (1018 berekeningen per seconde) halen. Er staat niet alleen technologisch kunnen op het spel, maar ook nationale prestige. Europa werkt aan het inhalen van zijn achterstand.

Technisch is het nu al mogelijk om een computer te bouwen die één exaflops op de teller zet. Dat apparaat trekt dan wel een vermogen van 500 MW. Bij een kilowattuurprijs van € 0,07 kost het dan € 35.000 om hem een uur te laten draaien; dat heeft niemand ervoor over. De energiekosten zullen met zeker een factor tien omlaag moeten, wil de exacomputer daadwerkelijk het daglicht zien.

De huidige nummer één in de internationale Top 500 van supercomputers, de Sunway TaihuLight van het National Supercomputing Centre in Wuxi (China), verbruikt 15,3 MW bij 93 petaflops (één petaflops: 1015 berekeningen per seconde). De nummer twee, de iets oudere Tianhe-2 te Guangszou (ook China), verbruikt overigens 17,8 MW voor 34 petaflops. Dat geeft al aan hoe belangrijk beheersing van de energiekosten is bij het ontwerpen en ontwikkelen van steeds krachtiger computers.

Zeker zo opvallend is dat de sterkste computer een kloksnelheid (hoe vaak per seconde een computer een signaal kan lezen, schrijven, of verwerken) heeft van 1,45 GHz, terwijl de nummer twee bij 2,20 GHz draait. Hoe hoger de kloksnelheid, hoe hoger namelijk het energieverbruik per rekenstap. Vanuit energetisch oogpunt is het beter om meer rekenkernen parallel te laten draaien dan het aantal rekenstappen per rekenkern te maximaliseren. Vanuit software-oogpunt maak je het met die insteek echter ingewikkelder.

Toen de Chinezen de macht grepen in supercomputerland, verbaasden ze niet alleen door de prestaties zelf, maar ook door de manier waarop ze die behaalden. De TaihuLight bevat in totaal ruim tien miljoen rekenkernen, verspreid over 40.960 Sunway-processoren, die geheel van Chinese makelij zijn (mede vanwege een Amerikaans exportverbod voor Intels beste processoren, uit angst dat de Chinezen hun supercomputer voor nucleaire berekeningen inzetten; zie de analyse in TW 6, 2017). Het parallellisme is ongekend.

‘Er zit een grote uitdaging in het parallelliseren van de software’, vertelt Walter Lioen, unit manager compute services bij SURFsara in Amsterdam, en in die rol onder meer verantwoordelijk voor de nationale supercomputer Cartesius. ‘Al valt maar één procent van de code niet te parallelliseren, dan is dat al een bottleneck voor de complete berekening. Eigenlijk is de bereikte parallellisering het meest knappe aan die Chinese machine.’

Nu zijn er berekeningen, zoals weer- en klimaatmodellen, die inherent parallel zijn. Meer rekenkernen betekent dat je het model in een hogere resolutie kunt uitrekenen. Echter, ook in dat geval werken de kernen niet volledig geïsoleerd van elkaar. Ze moeten regelmatig elkaars tussenresultaten kennen. Een deel van de tijd steken de kernen in onderlinge uitwisseling van data. Lioen: ‘De kunst zit in de juiste balans tussen rekenen en communiceren.’

Voor Nederland, met een in internationaal opzicht bescheiden budget, ligt de nadruk dan ook op bruikbaarheid. Toen Cartesius in 2013 in bedrijf ging, was de rekenkracht geënt op de toenmalige behoefte van wetenschappers en de mogelijkheden van de software. Sindsdien heeft de supercomputer twee substantiële updates gehad, waarvan de laatste afgelopen december. In de loop van dit jaar begint het aanbestedingstraject voor een nieuwe supercomputer, die eind 2018 operationeel zal moeten zijn. Dan wordt ook duidelijk waar de Nederlandse ambities liggen.

De bruikbaarheid zal mede getoetst moeten worden aan een nieuwe klasse van toepassingen. Traditioneel ligt de nadruk op wetenschappelijk rekenwerk. Door de opmars van big data groeit de behoefte aan razendsnelle analyses van immense hoeveelheden gegevens. Dat vergt een andere benadering van de software en daarmee ook van de hardware waarop deze software efficiënt moet draaien.

De internationale nadruk licht wel degelijk op de exaflop. Het is een relatief eenvoudig meetbare eenheid, waarvoor een erkende standaard bestaat. Dus is hij ook bruikbaar als inzet voor een prestigestrijd. Er zijn vier partijen in de race: China, de VS, Japan en Europa. Doel is niet zozeer om als eerste over de finish te gaan, maar om liefst voor langere tijd een technologische toppositie vast te houden.

De Chinezen openbaarden hun plannen afgelopen najaar, niet lang nadat de TaihuLight operationeel werd. Eind dit jaar moet een prototype van zijn opvolger klaar zijn. Die moet ruim tien keer zo snel zijn als de 93 petaflops van de TaihuLight om de exaflop te halen, en liefst ook nog eens minder energie verbruiken. Het apparaat zou in 2020 operationeel moeten zijn. Of liever gezegd: de apparaten. Want China heeft maar liefst drie projecten tegelijkertijd opgestart om de mijlpaal te behalen.

Ook de Amerikanen gokken niet op één architectuur om de exaschaal te bereiken. De race winnen zit er niet in, want het tijdschema wijst nu op zijn vroegst op 2023. Het is zelfs mogelijk dat het bij gebrek aan financiering helemaal niet doorgaat. De nieuwe president Donald Trump heeft geen grote belangstelling voor wetenschap en zelfs een weerzin tegen klimaatwetenschappers die een drijvende kracht zijn achter de parallelle rekenbehoefte waarin supercomputers voorzien. De snelste computers van de VS staan allemaal bij laboratoria van het Department of Energy, dat onder leiding komt te staan van Rick Perry, die het hele ministerie wilde opheffen toen hij vier jaar geleden zelf president probeerde te worden.

Japan is een serieuzere kandidaat om de Chinezen te overtroeven. Fujitsu heeft momenteel twee computers in de top tien staan en heeft een overheidsopdracht in de zak om een exacomputer te bouwen voor het nationale onderzoeksinstituut RIKEN. Fujitsu beschikt nu al over de technologie om 100 petaflops te halen en niemand twijfelt eraan dat het plan om in 2020 op een exaflops te zitten haalbaar is voor de Japanners.

De Europeanen vormen de grote verrassing in de race. Het Franse Atos heeft een roadmap vastgesteld die zijn Bull Sequana-computers in 2020 bij de exaflops moet brengen. De eerste Sequana werd in december operationeel door de update van Cartesius bij SURFsara en bereikt 1,8 petaflops; onvoldoende om de huidige top 50 te halen. In de Green 500, die het energieverbruik per rekenstap bijhoudt, doet Atos het gemiddeld beter – niet onbelangrijk gegeven de grote rol van energieverbruik in de betaalbaarheid van het apparaat.

‘Bovendien wordt koeling een uitdaging’, vult Hugo Meiland van Atos aan. ‘We zitten nu aan het maximum dat we met lucht kunnen koelen, zo’n 10 kW per kast. Wanneer we naar 100 kW per kast gaan, is volledige waterkoeling noodzakelijk. Daarmee zijn we een eind op weg.’

Naast energieverbruik en koelingsbehoefte is de interconnect, ofwel de verbinding tussen de processoren, de grootste technische uitdaging, geeft Meiland aan. Atos heeft zijn eigen interconnect-technologie ontwikkeld. Voor processoren is het afhankelijk van externe leveranciers (momenteel vooral Intel). ‘Wij maken in de eerste plaats de technologie klaar’, aldus Meiland. ‘Daarna is het aan de gebruikers – al werken we vanzelfsprekend nauw met hen samen bij het aanpassen van de software.‘

‘De Europese Commissie wil dat de industrie zich ontwikkelt en heeft in april 2016 besloten € 4,7 miljard extra uit te trekken voor het European Cloud Initiative’, zegt Anwar Osseyran, directeur van SURFsara en voorzitter van Prace, het samenwerkingsverband van Europese supercomputercentra. ‘De positie in de top 500 is een uitdaging voor leveranciers, maar het gaat ook om het prestige van landen. Het was voor de Amerikanen echt een schok dat ze door China werden weggeblazen.’

Expliciet onderdeel van het European Cloud Initiative is de ambitie om in 2020 tenminste één supercomputer in de top drie van krachtigste apparaten ter wereld te hebben. China hoeft dus niet per se afgetroefd te worden, maar de VS in elk geval voorbijgestoken, zegt de EU daarmee. Atos heeft vooralsnog geen plannen een eigen processor te ontwerpen, maar inwisselen van het Amerikaanse Intel voor het Britse ARM behoort wel tot de mogelijkheden. Europa wil in elk geval niet afhankelijk zijn van één externe leverancier.

De experts verwachten dat China of Japan de eerste exacomputer zal bouwen, maar vermoeden ook dat de race niet zal leiden tot de meest efficiënte architectuur. Er zal genoeg reden zijn om door te willen marcheren naar de zettaflops (1021 berekeningen per seconde).

Volgens het meest recente overzicht (november 2016) waar iedereen in het vakgebied naar kijkt, ziet de top 5 van supercomputers er momenteel zo uit:

Meer relevante berichten

Nieuwsbrief
Relevante berichten