Qualcomm brengt Dragonfly naar datacenters om te concurreren in uitgebreide AI

Qualcomm wil dat de komende grote fase niet meer afhankelijk is van de smartphone. Het bedrijf heeft een uitgebreide routekaart gepresenteerd voor datacenters onder de merknaam Dragonfly, inclusief een eigen CPU, inferentie-accelerators, een nieuwe geheugenbenaderingstechnologie, hogesnelheidsconnectiviteit en op maat gemaakte siliciumoplossingen voor grote klanten. Het doel is om een rol te spelen in de AI-infrastructuur just wanneer inferentie en agents een steeds groter deel van het budget van hyperscalers gaan uitmaken.

De aanbieding wordt ondersteund door belangrijke commerciële signalen. Qualcomm heeft een multigenerationeel akkoord aangekondigd met Meta voor de levering van datacenter-CPU’s. Volgens marktinformatie behoort Microsoft tot de klanten die van de nieuwe High Bandwidth Compute-technologie (HBC) gebruik zullen maken. Ook zijn er overeenkomsten met twee nog niet nader geïdentificeerde hyperscalers voor op maat gemaakte siliciumoplossingen. Qualcomm presenteert dus niet alleen een chipfamilie, maar probeert aan te tonen dat het al klanten heeft om zijn terugkeer naar datacenters te rechtvaardigen.

De kerngedachte is eenvoudig. AI-agenten zullen het aantal tokens, queries, tools, tussenliggende calls en chained tasks exponentieel doen toenemen. In dat scenario zijn kosten per token en prestaties per watt even belangrijk als de brute kracht. Als inferentie de overhand krijgt, moet de infrastructuur efficiënter, modularer en minder afhankelijk van architecturen die vooral voor grootschalige training zijn ontworpen.

Dragonfly C1000: een ARM-CPU voor AI-servers

Het opvallendste onderdeel van de routekaart is Qualcomm Dragonfly C1000, een datacenter-CPU ontworpen voor schaalbare workloads, agent-orchestratie, algemene toepassingen en AI-infrastructuur. Het product zal gebaseerd zijn op gepersonaliseerde Oryon-kernen, met snelheden boven de 5 GHz, meer dan 250 chiplet-cores en PCIe Gen 7-connectiviteit met meer dan 2 TB/s, naast ondersteuning voor CXL.

Qualcomm beweert dat de CPU meer dan twee keer betere prestaties per watt zal leveren ten opzichte van competitieve serverreferenties, op basis van specificaties. Het is belangrijk deze voorspelling te lezen als een ontwerpbelofte, niet als een vast resultaat in productie. De commerciële beschikbaarheid wordt verwacht in 2028.

De meerwaarde van de C1000 ligt niet in het vervangen van GPUs, maar in de aanvullende componenten. Grote AI-clusters hebben CPU’s nodig om accelerators te coördineren, data te verplaatsen, beheerservices uit te voeren, geheugen te beheren, webverkeer te ondersteunen, agents te bedienen en infrastructuurknelpunten te verminderen. Als een CPU minder verbruikt en goed presteert per kern, kan dat de totale systeemkosten verbeteren.

ProductVoorgestelde rolKalender
Dragonfly C1000CPU voor servers, agents, head nodes en AI-infrastructuur2028
Dragonfly AI200Eerste generatie inferentie-accelerator2026
Dragonfly AI250Accelerator met HBC Gen 1Voornamelijk medio 2027 in proefproductie
Dragonfly AI300Inferentiegaccelerator met HBC Gen 2Voornamelijk 2028 in proefproductie
HBCNabij-geheugen computing om de “memory wall” te verkleinenMeerdere generaties
Op maat gemaakte siliciumoplossingenASICs voor grootschalige klantenEerste inkomsten vóór eind 2026, volgens Reuters

De CPU dient ook om de geloofwaardigheid van een volledige platform te versterken. Qualcomm wil geen losse kaart verkopen, maar een rack-architectuur met computing, geheugen, connectiviteit, software en maatwerkopties. Deze benadering is vergelijkbaar met die in grote AI-datacenters: de uiteindelijke prestaties hangen af van het gehele systeem, niet alleen van de chip.

HBC: het proberen te doorbreken van de geheugenmuur

Het meest technische deel van de aankondiging is Qualcomm High Bandwidth Compute, of HBC. Het bedrijf beschrijft het als een nabije-geheugen computing-architectuur die computing en geheugen met hoog breedte-bandaam combineert in een 3D-gestapelde oplossing. Het doel is een van de kernproblemen van de huidige AI aan te pakken: datamovements kosten energie, tijd en geld.

De “memory wall” is niet nieuw, maar AI heeft het tot het uiterste gedreven. Grote modellen moeten continu enorme hoeveelheden parameters, context, tussengeheugen en data benaderen. Bij inferentie, vooral met agents die langer nadenken of tools aanroepen, kunnen bandbreedte en geheugenefficiëntie de kosten per token bepalen.

Qualcomm gelooft dat HBC Gen 1, geïntegreerd in AI250, 133 TB/s per kaart kan bieden en een vermenigvuldiging van 18 keer in effectieve bandbreedte ten opzichte van AI200 met LPDDR5X. Met HBC Gen 2, zou AI300 nog een sprong maken, met een verbeteringsfactor van 54 keer ten opzichte van AI200. Ook claimt het bedrijf zes keer meer bandbreedte per watt in vergelijking met HBM en 200 keer meer capaciteit per watt dan SRAM, op basis van genormaliseerde specificaties per kaart of rack.

TechnologieWeloverwogen belofte van Qualcomm
HBC Gen 1 in AI250133 TB/s per kaart en 18x ten opzichte van AI200
HBC Gen 2 in AI30054x ten opzichte van AI200
Vergelijking met HBM6x meer bandbreedte per watt
Vergelijking met SRAM200x meer capaciteit per watt op rackniveau
DoelLagere energieverbruik per token en betere kosten voor inferentie

Dit is een van de meest interessante strategische inzetten van Qualcomm. Terwijl NVIDIA domineert met HBM in AI-GPU’s en andere partijen verkennen geheugen SRAM of gespecialiseerde architecturen, probeert Qualcomm te profiteren van haar ervaring met laag verbruik, LPDDR, systeemintegratie en geavanceerd packaging om een alternatief te bieden. De vraag is of deze voorsprong houdbaar is in de praktijk, met echte modellen en volwassen software.

Dragonfly AI300 en een jaarlijkse serie voor inferentie

Dragonfly AI300 wordt de derde generatie in de routekaart voor inferentie-accelerators, na AI200 en AI250. Qualcomm streeft naar een jaarlijkse cadence, wat gebruikelijk is bij AI-GPU’s, maar minder gebruikelijk voor een nieuwe speler die weer de datacentermarkt betreedt.

AI300 wordt voorgesteld als een rack-platform voor inferentie, met directe lucht- en vloeistofkoeling, HBC Gen 2, gedistribueerde deployment en ondersteuning voor grote taalmodellen en multimodale modellen. Het bedrijf verwacht vier- tot achtvoudige verbetering in prestaties per watt ten opzichte van bestaande GPU-architecturen, gemeten op basis van geheugenbandbreedte per watt en per kaart. Daarnaast wordt genoemd dat het schaalbaar is via UALink en ESUN, en dat bekabeling en glasvezel gebruikt worden voor scale-out.

De keuze om Dragonfly vooral op inferentie te richten, is geen toeval. Het trainen van grensmodellen zal waarschijnlijk overgelaten worden aan marktleiders zoals NVIDIA, Google TPU’s, Amazon Trainium en grote labs. Maar inferentie groeit snel met elke gebruiker, agent en zakelijke toepassing. Als Qualcomm erin slaagt kosten en verbruik te beperken in dat segment, kan het een marktniche vinden, ook al leidt het niet het trainingssegment.

Meta, Microsoft en de hyperscalers geven context aan de aankondiging

De overeenkomst met Meta is het meest zichtbare commerciële signaal. Qualcomm Dragonfly C1000 wordt gepland om deel uit te maken van Meta’s toekomstige servervloot, vanaf de tweede helft van 2028. Mark Zuckerberg koppelde de samenwerking aan de infrastructuur die nodig is om “persoonlijke superintelligentie” op wereldschaal te brengen. Het is een ambitieuze, maar duidelijke verklaring voor de grote investeringen van Meta in AI.

Reuters meldde ook dat Microsoft chips van Qualcomm met HBC wil gebruiken voor AI-taken, en dat het bedrijf twee niet nader genoemde hyperscalers heeft voor op maat gemaakte silicium. Qualcomm verwacht in het fiscale jaar 2027 5 miljard dollar omzet uit datacenterproducten en in 2029 15 miljard dollar, aldus die berichtgeving. Voor een bedrijf dat nog altijd sterk verbonden is met smartphones, verklaren deze cijfers waarom de datacenterstrategie een strategische prioriteit is geworden.

Partner of klantStrategisch belang
MetaValideert Dragonfly C1000 als datacenter-CPU
MicrosoftIntegratie van HBC voor AI workloads, meldt Reuters
Niet nader genoemde hyperscalersVersterken op maat gemaakte siliciummarkt
Hugging FaceKoppelt open modellen en ontwikkelaars aan Qualcomm-platforms
ModularVersterkt software, draagbaarheid en implementatie van AI
Meer dan 35 partnersVeelbelovende steun van fabrikanten, geheugen, netwerken, servers en cloudproviders

De steun van meer dan 35 bedrijven uit de sector, waaronder namen verbonden aan servers, geheugen, netwerken, opslag en productie, bouwt aan een platformverhaal. In datacenters wint niemand alleen; er is hardware, geheugen, racks, koeling, validatie, netwerk, opslag, integrators en klanten nodig om in volume uit te rollen.

De uitdaging: concurreren met sterk gevestigde ecosystemen

Qualcomm betreedt geen markt zonder concurrentie. NVIDIA beschikt over GPU’s, Grace, netwerken, CUDA, NVLink, complete systemen en een grote community. AMD concurreert met EPYC en Instinct. Intel houdt vast aan Xeon en eigen accelerators. Amazon, Google en Microsoft ontwikkelen intern CPU’s en accelerators. Broadcom en Marvell winnen terrein met op maat gemaakte ASIC’s. Cerebras, SambaNova, Groq en anderen zoeken niches.

De kracht van Qualcomm ligt mogelijk in efficiëntie, integratie en kosten. Haar ervaring met mobiele apparaten heeft haar decennia lang gedwongen te denken in energiezuinigheid, efficiënt geheugen en systeemontwerp. Maar dat datacenter een andere schaal verlangt: betrouwbaarheid, bedrijfszekerheid, lange validatietrajecten, softwareondersteuning, compatibiliteit, beveiliging en observatie. Een soepele uitvoering over meerdere jaren is cruciaal.

De overname van Modular en de uitbreiding van samenwerkingen met Hugging Face helpen die zwaktes aan te pakken. Qualcomm weet dat hardware alleen niet genoeg is. Als ontwikkelaars modellen niet makkelijk kunnen inzetten, als frameworks niet goed presteren of het verplaatsen van workloads van gevestigde GPU’s te veel werk kost, zal adoptie beperkt blijven.

Waarom deze stap belangrijk is

Het aankondigen van Dragonfly laat zien dat AI-infrastructuur zich aan het ontwikkelen is van een GPU-centrisch verhaal naar een meer heterogeen systeemlandschap. Inference, agenten en hybride deployments vereisen efficiënte CPU’s, veel geheugen, snelle netwerken, gespecialiseerde accelerators en software die belastingen goed verdeelt. AI-datacenters worden complexer en diverser.

Voor hyperscalers maakt die heterogeniteit het aantrekkelijk omdat het afhankelijkheid vermindert, hardware kan worden afgestemd op specifieke workloads en het kostenplaatje per operatie verbetert. Voor Qualcomm is dit een kans om inkomsten te diversifiëren en minder afhankelijk te zijn van de mobiele markt. Voor NVIDIA en andere grote spelers is het een signaal dat de concurrentie verschuift naar complete systemen in plaats van alleen chips.

Het schema vereist echter voorzichtigheid. C1000 wordt pas in 2028 verwacht. AI300 eveneens voor 2028. HBC Gen 1 zal vanaf 2027 in proefproductie gaan. Het zal dus eerst op onafhankelijke prestaties, daadwerkelijke beschikbaarheid, stabiele software, klantendepployment en totale kosten in productie aankomen voordat de markt ingrijpend verandert.

Qualcomm heeft een ambitieuze routekaart gepresenteerd, met grote klanten en een duidelijke stelling: AI-agents worden bepaald door tokens per watt. Als het daarin slaagt in echte racks te bewijzen, kan Dragonfly meer worden dan enkel een hernoemde datacenteroplossing. Het kan de meest serieuze entree van Qualcomm in een infrastructuur vormen die tot nu toe ver weg leek.

Veelgestelde vragen

Wat is Qualcomm Dragonfly?
Het is de nieuwe familie oplossingen van Qualcomm voor AI-datacenters, inclusief CPU’s, inferentie-accelerators, HBC-technologie, connectiviteit en op maat gemaakte siliciumproducten.

Wat levert Dragonfly C1000?
Een datacenter-CPU gebaseerd op Oryon-kernen, met meer dan 250 cores, chiplet-ontwerp, PCIe Gen 7, CXL en gericht op efficiëntie voor AI-loads en agents.

Wat is High Bandwidth Compute of HBC?
Een technologie van Qualcomm die computing en nabijgeheugen combineert in een 3D-gestapelde architectuur om datamovement te beperken en de efficiëntie per token te verbeteren.

Wanneer worden deze producten verwacht?
HBC Gen 1 met AI250 wordt voorzien van proefproductie vanaf medio 2027. De C1000 en AI300 worden verwacht in 2028, volgens de aangekondigde routekaart.

Vía: Qualcomm

Scroll naar boven