Huawei Versnelt de Strijd om AI met Nieuwe Ascend 920C Accelerator van 900 TFLOPS en HBM3 Geheugen

Huawei Bereidt de Lancering van de Ascend 920C voor: Een Nieuwe Concurrent voor NVIDIA in AI Supercomputing

Huawei zet weer een belangrijke stap in zijn ambitie om een sleutelspeler te worden in de kunstmatige intelligentiesector. Volgens informatie van DigiTimes bereidt de Chinese technologiegigant de lancering voor van de nieuwe Ascend 920C, een AI-accelerator die deel zal uitmaken van de Ascend 920-familie. Deze nieuwe chip belooft een brute kracht van meer dan 900 TeraFLOPS bij BF16-precisie en is ontworpen voor het trainen van omvangrijke modellen.

De Ascend 920C zal geproduceerd worden met een 6-nanometerproces van SMIC, wat een aanzienlijke verbetering is ten opzichte van de huidige Ascend 910C, die een piek van 780 TeraFLOPS haalt. Wat geheugen betreft, zal het nieuwe model HBM3-modules bevatten met een bandbreedte van 4.000 GB/s, een upgrade ten opzichte van de 3.200 GB/s van de acht HBM2E-stacks van de 910C.

Focus op Prestatie en Schaalbaarheid

De Ascend 920C behoudt de chiplet-architectuur, maar introduceert verbeteringen in de acceleratiemotoren voor Transformer-modellen en Mixture-of-Experts. Interne projecten van Huawei schatten een verbetering van 30% tot 40% in de efficiëntie van training in vergelijking met zijn voorganger. Bovendien wordt een verminderde afstand tot de prestaties per watt van directe concurrenten zoals NVIDIA verwacht.

Een opmerkelijke innovatie is de compatibiliteit met PCIe 5.0 en toekomstige interconnectieprotocollen, die ontworpen zijn om de latentie te verminderen en de synchronisatie tussen nodes in grote AI-implementaties te verbeteren. Hoewel Huawei nog geen officiële lanceringdatum heeft aangekondigd, bevestigen bronnen dat de Ascend 920C mogelijk in de tweede helft van 2025 in massaproductie gaat.

CloudMatrix 384: Een Supernode die NVIDIA al Overtreft in Schaal

Deze aankondiging volgt kort nadat Huawei de resultaten van zijn CloudMatrix 384-systeem onthulde, een trainingssupernode die gebruikmaakt van 384 Ascend 910C-accelerators en dat in staat is om het totale rendement van het NVIDIA GB200 NVL72-systeem te overtreffen. Ondanks dat de prestaties per chip lager zijn dan die van NVIDIA (900 tegenover 2.500 TeraFLOPS in BF16), compenseert Huawei dit met schaalbaarheid, wat resulteert in een 1,7 keer beter globale prestatie en 3,6 keer de totale HBM-geheugencapaciteit.

Echter, deze capaciteit heeft ook een energiekosten: het systeem van Huawei verbruikt ongeveer 560 kW, in vergelijking met 145 kW voor NVIDIA. De strategie van Huawei lijkt gericht op het maximaliseren van de prestaties in grootschalige implementaties, terwijl NVIDIA de leiding behoudt als het gaat om efficiëntie per chip.

Een Toekomstgericht Model Gebaseerd op Capaciteit en Autonomie

De sleutel tot het succes van Huawei ligt in zijn all-to-all interconnectiearchitectuur en zijn streven om complete AI-oplossingen te bouwen zonder afhankelijk te zijn van buitenlandse leveranciers, in lijn met zijn strategische doel van technologische autonomie.

De Ascend 920C markeert een belangrijke stap in deze richting. Als SMIC erin slaagt om vooruitgang te boeken in geavanceerdere fabricageprocessen, zoals 5 of 3 nm, kan Huawei de kloof met de sectorleiders in termen van energie-efficiëntie en rekendichtheid nog verder verkleinen.

In een context waarin het trainen van fundamentele modellen zoals GPT of Gemini steeds meer rekenkracht vereist, zouden oplossingen zoals de Ascend 920C en de integratie in systemen zoals CloudMatrix bepalend kunnen zijn voor concurrentie op de wereldwijde markt voor op grote schaal kunstmatige intelligentie.

De strijd tussen de giganten is aan de gang, en Huawei lijkt niet van plan achter te blijven.

Scroll naar boven