Elon Musk en NVIDIA verdubbelen de kracht van de supercomputer Colossus met 100.000 extra GPU’s voor AI-training

Elon Musk heeft zijn inzet op kunstmatige intelligentie verdubbeld met de aankoop van nog eens 100.000 GPU’s NVIDIA Hopper H100 voor zijn supercomputer Colossus. Met deze toename zal de machine een totaal van 200.000 eenheden bereiken, waardoor het het krachtigste AI-trainingsysteem ter wereld wordt. De installatie van deze kolossale uitrusting vindt plaats in Memphis, Tennessee, met een uitrol die het record van 19 dagen, dat in de eerste installatiefase is gevestigd, wil overtreffen.

Colossus: de krachtigste en meest geavanceerde AI-cluster ter wereld

Ontworpen om de taalmodellen van xAI te trainen, vertegenwoordigt de supercomputer Colossus een ongekende vooruitgang in de ontwikkeling van kunstmatige intelligentie. Uitgerust met de H100 GPU’s gebaseerd op de Hopper-architectuur en het NVIDIA Spectrum-X Ethernet-netwerkplatform, is Colossus in staat om enorme hoeveelheden gegevens te verwerken en te analyseren met uitzonderlijke efficiëntie. Dankzij de congestiebeheertechnologie van Spectrum-X heeft het systeem een netwerkprestatie van 95% kunnen handhaven zonder latentie of pakketverlies, waarmee een mijlpaal in het gebied van hogesnelheidsgegevensverwerking is bereikt.

Het gebruik van het NVIDIA Spectrum-X Ethernet-netwerk, dat snelheden tot 800Gb/s ondersteunt via zijn SN5600-schakelaar, is cruciaal geweest om stabiliteit en prestaties te behouden in een configuratie van zo’n groot volume. Deze technologie heeft xAI in staat gesteld om het AI-modeltrainingsproces tot het uiterste te drijven, waardoor een geoptimaliseerde infrastructuur gebaseerd op Ethernet is gecreëerd, en anticipeert op de mogelijkheid om dit type platformen aan te bieden als grootschalige AI-diensten voor andere klanten in de toekomst.

Een recordbrekend project in tijd en technologie

De eerste fase van Colossus, waarbij 100.000 GPU’s in een recordtijd van 19 dagen werden geïnstalleerd, toonde reeds de logistieke en technische capaciteit van het team van xAI en NVIDIA. In deze tweede overeenkomst hebben Musk en Jensen Huang, CEO van NVIDIA, hun toewijding aan snelheid en efficiëntie bij de ontwikkeling van AI-infrastructuren bevestigd. De initiële installatie van Colossus werd in 122 dagen voltooid, een aanzienlijk kortere termijn in vergelijking met andere, vergelijkbare projecten, die meestal enkele maanden of zelfs jaren in beslag nemen.

Elon Musk zelf, in een korte opmerking, prees de gezamenlijke inspanning: “Colossus is het krachtigste trainingssysteem ter wereld. Goed werk van het team van xAI, NVIDIA en onze vele partners en leveranciers.”

Een strategische stap voor xAI in de AI-race

De uitbreiding van Colossus is een reactie op de urgentie van Musk om te concurreren op hetzelfde niveau als technologiegiganten zoals Google en OpenAI, leiders in de ontwikkeling van grootschalige AI. De nieuwe infrastructuur is ontworpen om de creatie en verbetering van de taalmodellen van xAI, zoals het Grok-model, te ondersteunen, waarmee het bedrijf hoopt gebruikers naar haar platform te trekken en geavanceerde functies aan te bieden aan haar X Premium-abonnees.

“xAI heeft ’s werelds grootste en krachtigste supercomputer gebouwd”, zei een woordvoerder van xAI. “De Hopper GPU’s en de Spectrum-X technologie van NVIDIA stellen ons in staat om de grenzen te verleggen van grootschalige AI-modeltraining, waardoor een zeer versnelde, geoptimaliseerde AI-fabriek wordt gecreëerd.”

AI, een kritische missie voor de toekomst

Vanuit NVIDIA zei Gilad Shainer, senior vicepresident netwerken, dat kunstmatige intelligentie “een kritische missie” is die hoge prestatieniveaus, veiligheid en schaalbaarheid vereist. “Het NVIDIA Spectrum-X Ethernet-netwerkplatform is ontworpen om vernieuwers zoals xAI snellere verwerking, analyse en uitvoering van AI-werklasten te bieden, waardoor de ontwikkeling en commercialisering van AI-oplossingen wordt versneld.”

Dit Colossus-project symboliseert het engagement van beide bedrijven met de vooruitgang van AI en benadrukt hun rol bij de ontwikkeling van massale infrastructuur van hoge prestaties die de toekomst van technologie zullen bepalen.

via: Nvidia

Scroll naar boven