China neemt het voortouw in de wedloop naar kunstmatige intelligentie met indrukwekkende systeemarchitectuur en eigen Ascend 910C-chips
Te midden van een wereldwijde GPU-schaarste, waarbij de VS de ontwikkeling van kunstmatige intelligentie aanvoert met NVIDIA-systemen, heeft China tegenaanvallen ingezet met een verrassend krachtige propositie. Huawei heeft CloudMatrix 384 gepresenteerd, een AI-supercomputingarchitectuur die, hoewel gebaseerd op minder krachtige individuele chips, de Amerikaanse systemen overtreft door zijn infrastructuur op grote schaal en efficiëntie te schalen.
Meer GPU’s, meer prestaties, maar met hogere energiekosten
De CloudMatrix 384 is opgebouwd uit 384 Ascend 910C GPU’s, die met een ‘all-to-all’ topologie zijn verbonden. Dit stelt directe en parallelle communicatie tussen elk van de versnellers mogelijk. Hoewel deze chips slechts een fractie van de prestaties per eenheid bieden in vergelijking met de NVIDIA GB200 (gebruikt in het NVL72-systeem), slaagt het ontwerp van Huawei erin om zijn rivaal te overtreffen in de totale systeemprestaties:
- 300 PFLOPS prestatie in BF16-nauwkeurigheid (tegenover 180 PFLOPS van NVL72).
- 3,6 keer meer HBM-geheugen beschikbaar.
- 2,1 keer breder geheugengebandbreedte.
Het systeem is verdeeld over 16 rekken, waarvan er 12 met GPU’s zijn uitgerust en 4 tussenliggende rekken zijn gewijd aan schaalbare netwerkschakelaars, verbonden door meer dan 6.900 optische 400G-transceivers. Deze massale schaal doet denken aan de NVL256 "Ranger"-platform van NVIDIA, dat uiteindelijk werd afgewezen vanwege de hoge kosten en het energieverbruik.
Huawei wint in schaal, maar verliest in efficiëntie
Op het gebied van energie-efficiëntie behoudt NVIDIA de voorsprong:
- 2,3 keer meer vermogen per FLOP dan Huawei.
- Lager verbruik per TB/s bandbreedte en per TB HBM-geheugen.
Dit punt is echter minder kritisch voor China, waar er geen significante beperkingen op elektriciteitsverbruik in datacenters voor AI zijn, in tegenstelling tot de VS of Europa. In feite heeft het Aziatische land het afgelopen decennium een energiecapaciteit toegevoegd die gelijk staat aan het volledige Amerikaanse elektriciteitsnet, deels dankzij massale investeringen in energiebronnen zoals nucleair en kolen.
Technologische afhankelijkheid en productielimieten
Hoewel het ontwerp van de Ascend 910C-chip volledig Chinees is, blijft de productie afhankelijk van internationale spelers. De meeste eenheden zijn tot nu toe geproduceerd met behulp van 7 nm lithografie van TSMC. Huawei heeft enkele sancties weten te omzeilen via derden zoals Sophgo. Bovendien heeft het bedrijf toegang tot HBM-geheugen van Samsung, dat zelfs na exportcontroles is blijven binnenkomen via integraties met minder krachtige logische chips.
Toch is China vooruitgang aan het boeken op het gebied van binnenlandse productiecapaciteit, met fabrieken zoals SMIC en CXMT die hun operaties uitbreiden. Als het lukt om deze productie lokaal op te schalen, kan Huawei het aantal beschikbare chips voor toekomstige CloudMatrix-systemen exponentieel verhogen.
AI zonder grenzen: meer schaal en minder barrières
De aanpak van Huawei is duidelijk: wanneer je chip per chip niet kunt concurreren, doe het dan systeem per systeem. De CloudMatrix 384 is een strategisch antwoord dat aantoont hoe kunstmatige intelligentie niet alleen wordt gewonnen met de meest geavanceerde architectuur, maar ook met het vermogen om operaties op grote schaal te integreren, schalen en te ondersteunen zonder energie- of regelgevingsbeperkingen.
Samenvattend heeft Huawei een manier gevonden om te concurreren met de Amerikaanse giganten in AI, niet vanuit individuele efficiëntie, maar vanuit de gezamenlijke brute kracht. Hoewel de energiekosten hoog zijn, is het systeem functioneel en kan het de ambitieuze plannen van China op het gebied van kunstmatige intelligentie voeden, waarmee het zijn vastberadenheid bevestigt om niet achterop te raken in deze nieuwe mondiale technologische race.