De los ASIC's versnellen in AI en bedreigen de absolute dominantie van GPU's - Cloud News

X (Twitter) Facebook LinkedIn Email WhatsApp

In de afgelopen drie jaar is de ontwikkeling van kunstmatige intelligentie vooral gekenmerkt door één woord: GPU. NVIDIA groeide uit tot de meest invloedrijke speler in de sector doordat haar versnellers de snelste en meest beschikbare manier waren om steeds grotere modellen te trainen en uit te voeren. Echter, de markt begint nu met meer belangstelling te kijken naar een andere familie chips: ASICs, op maat gemaakte-processors ontworpen voor specifieke taken.

Johnny Shen, voorzitter van Alchip Technologies, denkt dat ASICs nog enige tijd nodig zullen hebben om de GPU’s qua marktaandeel te overtreffen, maar dat hun groei in de komende jaren sneller kan gaan. Deze gedachte sluit aan bij een duidelijke tendens onder grote cloudproviders: het verminderen van afhankelijkheid van standaardchips en het ontwikkelen van eigen silicium dat beter aansluit bij hun behoeften op het gebied van kosten, energieverbruik, prestaties en integratie.

Het gaat niet om het verdwijnen van GPU’s. Ze blijven een cruciaal onderdeel van het trainen van modellen, de ontwikkeling van AI en vele andere toepassingen met gemengde werklasten. Maar de volgende fase van de markt kan mogelijk niet meer worden gedomineerd door het meest flexibele chip, maar door het meest efficiënte voor een specifieke taak. Hierin hebben ASICs vanzelfsprekend een natuurlijke voorsprong.

Waarom hyperscalers hun eigen chips op maat willen

GPU’s zijn succesvol door hun veelzijdigheid. Ze worden ingezet voor training, inferentie, onderzoek, simulaties, grafische toepassingen, datascience en vele parallelle werklasten. Deze flexibiliteit was perfect in een tijd waarin AI snel veranderde en niemand zich wilde vastleggen aan een te gesloten architectuur.

Maar zodra een werklast gestabiliseerd is en op grote schaal wordt uitgevoerd, verandert de afweging. Een hyperscaler die miljoenen inferentie-aanvragen behandelt, modellen traint of AI-services ontwerpt voor interne producten, heeft niet altijd behoefte aan maximale flexibiliteit. Wat wel cruciaal is, zijn efficiëntie, kostenbeheersing, gegarandeerde toelevering en prestaties per watt. Een ASIC kan precies voor deze behoefte worden ontworpen.

Google gebruikt al jaren TPUs. Amazon promoot Trainium en Inferentia. Microsoft heeft eigen silicium en werkt samen met derden. Meta ontwikkelde haar eigen accelerators, MTIA. Broadcom is een belangrijke partner voor maatwerkchips voor grote klanten. Alchip neemt daarbij een andere positie in: niet als merk van GPU’s, maar als leverancier van ontwerpdiensten en productie voor bedrijven die hun eigen ASICs willen ontwikkelen met geavanceerde technologieën.

Volgens TrendForce meldde Alchip tijdens haar laatste resultatenverband dat het ontwerp van een belangrijke klant in mei in massaproductie ging, wat naar verwachting de omzetgroei dit jaar en volgend jaar zal stimuleren. Daarnaast wijst dezelfde bron erop dat een AI-versneller op 3 nm voor een Noord-Amerikaanse klant vanaf het derde kwartaal belangrijke volumes gaat opleveren, terwijl projecten op 2 nm vorderen met het oog op tape-out richting eind van het jaar.

Technologie	Belangrijkste voordeel	Beperkingen
GPU	Flexibiliteit, volwassen ecosysteem, brede softwareondersteuning	Hoge kosten, hoog energieverbruik en afhankelijkheid van dominante leveranciers
ASIC	Prestaties per watt, geoptimaliseerde kosten en maatwerkontwerp	Minder flexibel en duurder in ontwerp aan het begin
TPU / eigen cloud-accelerators	Verticale integratie in grote platformen	Meestal gekoppeld aan een specifieke provider
Chiplets + 2.5D/3DIC	Meer schaalbaarheid, betere combinaties van nodes en geavanceerde pakketten	Meer ontwerpcomplexiteit, testen en productie-uitdagingen

De economische druk is enorm. Alchip stelt, op basis van marktbronnen, dat ASICs een totale kostenvoordeel van tussen de 40% en 65% kunnen bieden ten opzichte van standaard siliciumalternatieven bij grote implementaties over meerdere jaren. Ook wordt verwacht dat de markt voor AI-ASICs in 2024 ongeveer 13 miljard dollar bedraagt en kan groeien tot meer dan 150 miljard dollar in 2030, met een gemiddelde jaarlijkse groeiratio van bijna 50%. Deze cijfers zijn ambitieus en moeten als inschattingen van belanghebbenden worden gelezen, maar geven goed het marktpotentieel weer.

AI wordt nu op systeemniveau ontworpen

De veranderingen zijn niet alleen economisch, maar ook technisch. De nieuwe AI-versnellers kunnen niet meer worden opgevat als één geïsoleerde chip. Het prestatieverbeteringsproces hangt af van de manier waarop compute dies, HBM-geheugen, interconnects, chiplets, voeding, geavanceerd pakkettechnologie en koeling worden gecombineerd.

Alchip benadrukt dit met haar 3DIC-platform. Het bedrijf beweert dat het ontwerp van AI-processors zich nu op systeemniveau beweegt: het is niet meer voldoende om meer transistors op hetzelfde chip te plaatsen. Men moet bepalen welke onderdelen in een geavanceerde node worden vervaardigd, welke blokken op meer volwassen nodes kunnen worden gemaakt, hoe chiplets worden verbonden, hoe ze worden gevoed en hoe de warmte wordt dissipeert.

Hun 3.5D-platform maakt het mogelijk om grote SoC’s op te splitsen in geoptimaliseerde chiplets in verschillende processnoden. Compute dies kunnen worden gemaakt in geavanceerde nodes, terwijl I/O- en geheugencapaciteiten in goedkopere nodes blijven. Alchip zegt dat deze architectuur horizontale schaalbaarheid biedt via chiplet-technologie, gecombineerd met verticale stapeling en pakkettechnologieën zoals CoWoS-S, CoWoS-R, CoWoS-L en TSMC-SoIC-X.

Het doel is om de beperkingen van monolithische chips te verminderen. Naarmate ontwerpen complexer worden, ontstaan problemen zoals reticlebeperkingen, verminderde fabricageprestaties, duurdere maskers, hoger energieverbruik en moeilijkheden bij datatransfer. Geavanceerde pakketten maken het mogelijk grotere systemen te bouwen zonder te hoeven vertrouwen op één enorm chip.

Alchip beweert dat haar platform een ding tot 5 keer grotere interconnectiedichtheid biedt, met 30-40% minder energieverbruik per bit en een latencyvermindering van tot 35%. Dit zijn communicatiecijfers van het bedrijf; ze geven geen universeel vergelijkend beeld, maar onderstrepen dat in AI het verplaatsen van data net zo belangrijk wordt als het rekenen zelf.

De strijd verschuift naar TSMC en geavanceerd pakkettechnologie

De mogelijke opkomst van ASICs betekent niet dat knelpunten volledig verdwijnen. Ze verschuiven alleen. Als meer hyperscalers hun eigen chips ontwerpen op 3 nm, 2 nm en met geavanceerde pakketten, zal de druk op TSMC, CoWoS, substrates, OSAT, HBM en testcapaciteit toenemen.

Johnny Shen wijst op de extreme schaarste aan 3 nm-capaciteit en denkt dat dit zelfs zorgelijker kan zijn dan de geheugenprijzen. Voor een bedrijf als Alchip is nauwe samenwerking met TSMC niet slechts een operationele keuze, maar een wezenlijk onderdeel van de bedrijfsstrategie. Ontwerp only is niet voldoende als er geen voldoende wafers, verpakkingscapaciteit en supply chain klaarstaan voor massaproductie.

Alchip versterkt deze positie actief. In maart kondigde het bedrijf vooruitgang aan met haar 2 nm-platform, met lopende ontwerpen, verschillende tape-outs en eerste siliconetests met succesvol resultaat. De platform ondersteunt het combineren van 2 nm compute dies met 3 nm of 5 nm chiplets, wat praktisch is zolang volledige 2 nm I/O- en geheugenchiplets nog niet beschikbaar zijn.

Deze aanpak anticipeert op de toekomst van AI-accelerators. Chips worden minder als één stuk ontworpen, maar meer opgebouwd uit gespecialiseerde blokken in complexe pakketten. De waarde ligt niet alleen in het ontwerpen van logica, maar ook in het fysiek coördineren, assembleren, supply chain, productie, validatie en thermisch beheer.

Kritische factor	Waarom het belangrijk is voor AI-ASICs
Geavanceerde nodes	Verhogen dichtheid en efficiëntie van compute dies
Chiplets	Mixen van nodes en verkleinen risico op gigantische chips
HBM	Breedband voor training en inferentie
CoWoS / 3DIC	Integreert geheugen, compute en interconnect in één geavanceerd pakket
Productie in volume	Bepaalt of het ontwerp tijdig en kosteneffectief op de markt komt
Software	Kan de adoptie beperken als het ecosysteem niet rijpt

Het beheer van productie wordt steeds strategischer. Alchip benadrukt dat bij grote volumes het controleren van WIP, voorraad, prestaties, doorlooptijden, logistiek en capaciteit net zo belangrijk is als het ontwerp zelf. Een vertraging van maanden in een AI-chip kan de cloud-roadmap verstoren, een platform duurder maken of een klant langer afhankelijk houden van duurdere GPU’s.

Een meer gefragmenteerde markt, niet noodzakelijk minder dominant

De groei van ASICs betekent niet dat NVIDIA plotsklaps haar positie verliest. Haar voorsprong in software, CUDA, bibliotheken, complete systemen, AI-netwerken en klantrelaties blijft groot. Bovendien blijven GPU’s zeer geschikt voor onderzoek, veranderlijke werklasten en deployments waar flexibiliteit belangrijker is dan maximale efficiëntie.

Wat wel kan veranderen, is de samenstelling van de groei. Als de training van state-of-the-art modellen zich blijft richten op GPU’s, maar inference op grote schaal deels overgaat op ASICs, wordt de markt gefragmenteerd. Er zullen meer eigen chips komen, meer semi-gepersonaliseerde ontwerpen en meer samenwerkingen tussen hyperscalers, ASIC-ontwerpers, foundries en verpakkingsspecialisten.

GUC, een andere Taiwanese speler, verdedigde vergelijkbare ideeën: bij toepassing van AI voor eindgebruikers worden ASICs aanzienlijk efficiënter in energieverbruik tijdens inferentie ten opzichte van dure algemene GPU’s. MediaTek heeft haar prognoses voor inkomsten uit AI-ASICs verdubbeld, van 1 miljard dollar naar 2 miljard dollar voor dit jaar, aldus TrendForce.

Deze beweging heeft belangrijke industriële implicaties. AI begon met een race om modellen en GPU’s. Nu evolueert het naar een race waarin complete ketens deelnemen: ontwerp, IP, assemblage, geheugen, productie, software, datacenters en energie. Alchip wil een belangrijke plek bemachtigen in dat tussenstation, waarin grote klanten hun eigen chips willen, zonder alles zelf te hoeven ontwerpen en produceren.

De AI-markt zal niet van GPU naar ASIC overschakelen als een schakelaar. Het wordt waarschijnlijk een langdurige coexistentiële situatie. GPU’s blijven dominant voor veel toepassingen, terwijl ASICs terrein winnen bij grote volumes die een eigen ontwerp rechtvaardigen. Voor hyperscalers biedt deze mix mogelijk een manier om de kosten beter te beheersen, en voor leveranciers als Alchip is het een kans om zichtbaar te worden in de onzichtbare infrastructuur van AI.

Veelgestelde vragen

Wat is een AI-ASIC?
Een chip die op maat is gemaakt voor specifieke AI-taken, zoals training of inferentie, met betere efficiëntie voor die specifieke toepassing dan een algemene processor.

Zullen ASICs GPU’s vervangen?
Niet onmiddellijk. Waarschijnlijk zullen ze naast elkaar blijven bestaan. GPU’s blijven belangrijk vanwege hun flexibiliteit en ecosysteem, terwijl ASICs terrein kunnen winnen bij zeer repetitieve en grootschalige werklasten.

Waarom investeren hyperscalers in ASIC’s?
Omdat ze afhankelijkheid van externe leveranciers kunnen verminderen, prestaties per watt kunnen verbeteren, kosten kunnen beheersen en het silicium kunnen afstemmen op hun eigen modellen en datacenters.

Wat doet Alchip in deze markt?
Alchip biedt ontwerp- en verpakkingsdiensten en productiebeheer voor bedrijven die complexe AI-, HPC- en datacenter-ASICs ontwikkelen.

X (Twitter) Facebook LinkedIn Email WhatsApp