NCSA lanceert DeltaAI, een geavanceerd systeem voor onderzoek naar kunstmatige intelligentie en high-performance computing.

Het National Center for Supercomputing Applications (NCSA) van de University of Illinois in Urbana-Champaign heeft officieel de lancering van DeltaAI aangekondigd, hun nieuwe en geavanceerde computersysteem ontworpen om onderzoek naar kunstmatige intelligentie (AI) en high-performance computing (HPC) te versterken. DeltaAI, gefinancierd met bijna 30 miljoen dollar door de National Science Foundation (NSF), is gepresenteerd als een sleutelbron die de onderzoek naar AI en HPC in de Verenigde Staten transformeert.

Een aanvulling op de supercomputer Delta

DeltaAI wordt gepositioneerd als een complementair systeem aan de supercomputer Delta, een installatie gebaseerd op HPE Cray die het NCSA in 2021 implementeerde. Terwijl Delta een mijlpaal bereikte met zijn 338 nodes en Nvidia A100 GPU’s, brengt DeltaAI deze capaciteiten naar het volgende niveau, door het integreren van cutting-edge technologie zoals de Nvidia H100 Hopper GPU’s en de superchips GH200 Grace Hopper. Dit systeem verdubbelt niet alleen de prestaties van zijn voorganger, maar is specifiek geoptimaliseerd voor werkbelasting van AI, machine learning en de nieuwste generatie taalmodellen.

Bill Gropp, directeur van het NCSA, benadrukte dat het ontwerp van DeltaAI beantwoordt aan de groeiende vraag naar GPU-gebaseerde bronnen, een trend die snel ontstond na de implementatie van het Delta-systeem. “AI is exponentieel gegroeid, en daarmee de behoefte aan bronnen met een groter geheugencapaciteit en prestaties,” zei Gropp tijdens een interview op de SC2024-conferentie in Atlanta.

Prestaties geoptimaliseerd voor AI en HPC

DeltaAI biedt een indrukwekkende prestatie van 633 petaflops in half-precisie (FP16), speciaal ontworpen voor AI-taken, en petaflops in dubbele precisie (FP64) voor wetenschappelijke toepassingen die hoge numerieke precisie vereisen, zoals klimaatmodellering en vloeistofdynamica. Elk systeemnode is uitgerust met 320 Nvidia Grace Hopper GPU’s, elk met 96 GB geheugen, resulterend in een totaal van 384 GB per node. Ook beschikt het over een opslagsysteem van 14 PB dat tot 1 TB/seconde kan verwerken en een zeer schaalbare interconnectie.

Dit ontwerp verbetert niet alleen de prestaties van de huidige toepassingen, maar maakt het ook mogelijk om grootschalige taalmodellen en meer complexe inferentietaken aan te pakken. Gropp merkte op dat het systeem belangrijk onderzoek zal ondersteunen op gebieden zoals verklaarbare kunstmatige intelligentie (XAI), gericht op het ontrafelen van de interne werking van AI-modellen en het verbeteren van hun betrouwbaarheid.

Bevordering van toegankelijkheid en samenwerking

DeltaAI zal beschikbaar zijn voor onderzoekers uit het hele land via het NSF ACCESS-programma en het pilotinitiatief van het National Artificial Intelligence Research Resource (NAIRR). Deze brede toegankelijkheid streeft ernaar om onderzoek naar AI en HPC te democratiseren, door meer gebruikers in staat te stellen om te profiteren van de capaciteiten van dit state-of-the-art systeem.

“Het idee is om de collaboratieve impact te maximaliseren,” legde Gropp uit. “We willen dat meer gebruikers onze cutting-edge GPU’s benutten en samenwerken met andere groepen om bronnen en kennis te delen.”

Het systeem is ook ontworpen om veelzijdig te zijn, zowel voor specifieke AI-behoeften als voor traditionele HPC-toepassingen, zoals moleculaire dynamica, vloeistofmechanica en structurele mechanica. Zijn architectuur, gebaseerd op multi-GPU nodes en verenigd geheugen, biedt oplossingen voor veelvoorkomende beperkingen, zoals de bandbreedte van geheugen, wat de prestaties bij rekenintensieve taken aanzienlijk verbetert.

Klaar voor de toekomst

DeltaAI maakt deel uit van een ontwerpbenadering van infrastructuur die zijn capaciteiten naadloos integreert met die van Delta, met gebruik making van hetzelfde Slingshot-netwerk en het gedeelde bestandssysteem. Dit ontwerp zorgt niet alleen voor efficiëntie bij het gebruik van middelen maar legt ook een fundament voor toekomstige uitbreidingen. Sterker nog, het NCSA heeft al plannen om in de komende jaren nieuwe systemen toe te voegen, een model aannemend van voortdurende upgrades in plaats van het wachten tot de huidige hardware verouderd is.

Gropp benadrukte ook het belang van het afwegen van enthousiasme voor AI met praktische wetenschappelijke vooruitgang. “AI heeft enorm veel potentieel, maar er zijn dingen die het nooit zal kunnen doen met huidige technologieën,” waarschuwde hij. “DeltaAI stelt ons in staat om zowel wetenschappelijke nieuwsgierigheid als praktische toepassingen die het leven van mensen verbeteren, vooruit te helpen.”

Een stap richting leiderschap in AI en HPC

Met DeltaAI versterkt het NCSA zijn toewijding aan leiderschap in onderzoek naar kunstmatige intelligentie en high-performance computing, door het leveren van een bron dat kracht, veelzijdigheid en toegankelijkheid combineert. Dit systeem belooft niet alleen een katalysator te zijn voor nieuwe wetenschappelijke en technologische toepassingen, maar bevestigt ook de rol van samenwerking en transparantie in de voortgang van kennis.

DeltaAI vertegenwoordigt een voorbeeld van hoe technologie kan worden ingezet om fundamentele vragen aan te pakken, de betrouwbaarheid van AI te verbeteren en deze vooruitgangen te vertalen in tastbare voordelen voor de samenleving.

Technische samenvatting: Hardware en netwerk van DeltaAI

DeltaAI is ontworpen met state-of-the-art technologie om te voldoen aan de groeiende behoeften van onderzoek naar AI en high-performance computing. Het systeem omvat:

  • 456 NVIDIA H100 GPU’s, geoptimaliseerd voor machine learning taken en AI-werkbelasting.
  • HPE Slingshot netwerk met 200 Gb/s, dat een high-performance, lage-latentie interconnectie tussen nodes biedt.
  • Gedeelde Lustre-bestandssystemen met de supercomputer Delta:
    • Een systeem gebaseerd op HDD voor grootschalige data-opslag.
    • Een ander gebaseerd op NVME voor het hanteren van kleine bestanden en snelle I/O-operaties.
  • Toegang tot het Taiga-bestandssysteem voor centrale niveau projecten, gebaseerd op Lustre.
  • Persoonlijke directories opgeslagen op Harbor, een systeem gebaseerd op VAST voor betrouwbare opslag.

CPU-GPU nodes van hoge prestaties

DeltaAI beschikt over 114 CPU-GPU nodes, elk uitgerust met:

  • 4 Grace Hopper GH200 superchips per node, elk met:
    • 1 NVIDIA H100 GPU met 96 GB HBM3-geheugen.
    • 1 Grace ARM CPU van 72 kernen met 120 GB LPDDR5X-geheugen.
  • 4 Slingshot11 netwerkverbindingen, één per superchip, om de communicatie-efficiëntie te maximaliseren.
  • 1 NVME-eenheid van 3,5 TB per node, waardoor een snelle en lokale opslag beschikbaar is.

Deze hardwareconfiguratie maakt ongeëvenaarde prestaties voor AI-modellen mogelijk, met een infrastructuur die zowel kracht als efficiëntie prioriteert. DeltaAI is een sleutelhulpmiddel voor onderzoekers die complexe problemen willen aanpakken en hun wetenschappelijke en technologische toepassingen willen opschalen.

via: HPCwire en NCSA Delta

Scroll naar boven