NVIDIA Vera: de CPU waarmee je het datacenter wilt bestormen - Cloud News

X (Twitter) Facebook LinkedIn Email WhatsApp

NVIDIA wil niet langer alleen de toonaangevende leverancier van GPU’s voor kunstmatige intelligentie zijn. Met Vera, haar eerste op maat gemaakte CPU voor datacenters, betreedt het bedrijf een markt die traditioneel door Intel en AMD wordt gedomineerd. Deze stap is van groot belang: volgens de recente resultaten ziet NVIDIA in Vera een marktpotentieel van 200 miljard dollar en verwacht dit jaar ongeveer 20 miljard dollar aan inkomsten uit CPU-verkopen.

Het cijfer is indrukwekkend, zelfs voor een bedrijf dat gewend is aan enorme getallen. NVIDIA sloot haar eerste fiscale kwartaal van 2027 af met een recordomzet van 81,6 miljard dollar, een stijging van 85% ten opzichte van hetzelfde kwartaal een jaar eerder, terwijl haar datacenter-divisie een omzet behaalde van 75,2 miljard dollar. Voor het tweede kwartaal wordt een omzet van 91 miljard dollar verwacht, wat aangeeft dat de investeringscyclus in AI-infrastructuur nog altijd versnelt.

Waarom heeft AI met agenten behoefte aan een andere CPU?

De kern van NVIDIA’s visie is duidelijk: AI-agenten draaien niet uitsluitend binnen GPU’s. Een agentieel systeem moet code uitvoeren, tools aanroepen, geheugen beheren, databases raadplegen, context verschuiven, geïsoleerde omgevingen openen, meerdere stappen coördineren en voortdurend data naar GPU’s sturen. Veel van deze taken worden door de CPU gedaan.

Tot nu toe was de meeste aandacht in AI gericht op het trainen van modellen en GPU-versnelde inferentie. Maar de volgende fase, gekenmerkt door agenten die handelen, langer redeneren en integreren met bedrijfsstructuren, vereist een andere architectuur. Hier komt Vera in beeld.

NVIDIA definieert Vera als een CPU ontworpen voor het tijdperk van agentiële AI. Het bevat 88 eigen Olympus-kernen, ondersteunt Armv9.2, beschikt over 176 threads door Spatial Multithreading, tot 1,2 TB/s geheugenbandbreedte met LPDDR5X en ondersteunt tot 1,5 TB geheugen. Daarnaast is er de tweede generatie NVLink-C2C met een coherente bandbreedte van 1,8 TB/s, voor gebruik samen met de toekomstige GPU Rubin.

Kenmerk NVIDIA Vera	Gerealiseerd datapunt
Architectuur	Armv9.2
Kernen	88 Olympus
Threads	176 via Spatial Multithreading
Geheugenbandbreedte	Tot 1,2 TB/s
Ondersteund geheugen	Tot 1,5 TB
Interconnectie	NVLink-C2C van 1,8 TB/s
Hoofdgebruik	Agent-gebaseerde AI, reinforcement learning, analytiek, sandboxes, orkestratie
Aanpassing	Tot 50% snellere prestaties per kern onder belasting

Deze aanpak verandert de manier waarop we naar CPU’s kijken. In traditionele servers werd de waarde vaak gemeten aan de hand van het aantal kernen, consolidatie en resource-verhuur. Jensen Huang vat het simpel samen: agenten “huren” geen kernen; ze willen dat het werk snel gedaan wordt. NVIDIA probeert daarom een CPU te bouwen die hoge prestaties per kern levert, met veel geheugen en een nauwe integratie in haar ecosysteem van GPU’s, netwerken en software.

Van GPU naar compleet systeem

Vera staat niet op zichzelf. Het maakt deel uit van de Vera Rubin-architectuur, NVIDIA’s volgende grote platform voor rack-scale AI. In Vera Rubin NVL72 fungeert de CPU als host voor de Rubin-GPU’s en integreert het met BlueField-4, Spectrum-X, MGX en NVIDIA’s onderlinge netwerk. Het doel is dat datacenters steeds meer worden verkocht en geëxploiteerd als één geheel, in plaats van losse componenten.

Dit is de strategische kern: NVIDIA verkoopt niet alleen chips, maar een volledige AI-fabriek. GPU’s, CPU’s, netwerken, DPU’s, software, libraries, rack systemen, workload management en agent-tools. Hoe meer de AI-infrastructuur geïntegreerd is, hoe moeilijker het wordt voor klanten om zomaar een onderdeel te vervangen zonder de rest aan te passen.

Het eerste systeem met Vera is inmiddels geleverd aan grote laboratoria en cloudproviders. NVIDIA meldt dat de eerste systemen zijn aangekomen bij Anthropic, OpenAI, SpaceXAI en Oracle Cloud Infrastructure (OCI). OCI heeft zelfs aangekondigd honderden duizenden Vera-CPU’s uit te rollen vanaf 2026 voor grootschalige agentgerichte AI-workloads.

Gebruik van Vera	Rol in de strategie
Individuele CPU	Concurreren in high-performance servers voor AI en analytiek
Host CPU in Vera Rubin	Beheren en coördineren van Rubin-GPU’s binnen AI-racks
Vera met ConnectX-9	Versnellen opslag, beveiliging en isolatie
Vera voor cloud	Uitvoeren van agent-gebaseerde workloads, sandboxes en parallelle omgevingen
Vera voor bedrijven	Privé AI en inferentie binnen eigen infrastructuur

Voor Intel en AMD is het duidelijk: NVIDIA betreedt de CPU-markt niet via de algemene servers, maar op het moment dat de markt het hardst groeit: AI. Het richt zich niet primair op alle datacenters, maar op de meest waardevolle workloads waar het ecosysteem al dominant is.

Een enorme markt, maar met knelpunten

Het enthousiasme van NVIDIA brengt ook risico’s met zich mee, die het bedrijf zelf onderkent. Huang geeft toe dat er waarschijnlijk tekorten zullen blijven bestaan aan de levering van Vera-onderdelen. Vooral de high-performance LPDDR5X-geheugenmodules, die geavanceerde packaging vergen en afhankelijk zijn van een complexe supply chain, staan onder druk door de toenemende vraag naar AI.

Geheugen zal een van de grootste knelpunten vormen. Vera heeft grote capaciteit en breedte nodig om duizenden parallelle software-omgevingen te ondersteunen, context te beheren en GPU’s continu te voorzien van data. Tegelijkertijd ervaart de industrie wereldwijd een sterke druk op DRAM, HBM en andere geavanceerde geheugentechnologieën door de groei van AI-datacenters.

Daarnaast is er concurrentie van grote techbedrijven. Google, Amazon, Microsoft en andere hyperscalers ontwikkelen eigen accelerators en chips om kosten te verlagen en afhankelijkheid te verminderen. AMD promoot haar EPYC-servers en GPU’s van de serie Instinct. Intel probeert terrein terug te winnen in datacenters. Andere spelers zoals Groq richten zich op nichemarkten met innovatieve architecturen voor inferentie.

NVIDIA stelt dat oplossingen gebaseerd op veel SRAM en gericht op lage latentie en hoge token-rate, zoals die voor specifieke inferentie-toepassingen, voorlopig nicheproducten blijven. Veel agenten moeten grote contexten kunnen verwerken, modelgrootte uitbreiden en verschillende pipelines ondersteunen, niet alleen snelle token-generatie.

De CPU keert terug in de spotlight

Jarenlang leek de CPU in de AI-narratief naar de achtergrond verdreven. GPU’s waren de hoofdrolspelers. Vera laat zien dat dit verhaal complexer wordt. Wanneer AI niet alleen vragen beantwoordt, maar ook taken uitvoert, wordt de CPU weer belangrijk. Niet als vervanger van de GPU, maar als systeemcoördinator.

Voor klanten wordt de praktische vraag: hoe veel verbetert Vera de kosten per voltooide taak? Het gaat niet alleen om hogere prestaties per kern of beter energieverbruik. Grote cloudbedrijven en hyperscalers zullen meten of hun agenten sneller klaar zijn, GPU’s minder lang wachten, sandboxes beter draaien, data sneller worden opgehaald en de totale infrastructuurkosten daadwerkelijk dalen.

Als NVIDIA haar voorspellingen waarmaakt, kan Vera een van de meest baanbrekende serverlanceringen worden in jaren. Niet doordat het meteen alle andere spelers uit de markt drijft, maar omdat het de meest strategische segmenten, zoals AI-datacenters, fundamenteel zal herdefiniëren.

Dit versterkt ook een steeds herhaaldere gedachte: AI wordt niet alleen gebouwd uit modellen. Het wordt opgebouwd uit CPU, GPU, geheugen, netwerk, koeling, energie, software en een architectuur die miljoenen gelijktijdige taken aankan. NVIDIA beheerde al veel van die keten, en met Vera probeert het nu een essentieel onderdeel te bemachtigen dat voorheen buiten haar directe controle lag.

Veelgestelde vragen

Wat is NVIDIA Vera?
NVIDIA Vera is de eerste op maat gemaakte CPU van NVIDIA voor datacenters, ontworpen voor agentiële AI, reinforcement learning, analytiek, orkestratie, tool-calling en contextbeheer.

Waarom betreedt NVIDIA nu de CPU-markt?
Omdat AI-agenten grote CPU-capaciteit nodig hebben om tools te coördineren, code uit te voeren, data te verplaatsen, geheugen te beheren en GPU’s te voeden. NVIDIA wil deze infrastructuurregels zelf in handen krijgen.

Hoeveel verwacht NVIDIA te verdienen met Vera?
Volgens haar eigen uitspraken ziet NVIDIA een marktpotentieel van 200 miljard dollar voor Vera en verwacht ze dit jaar ongeveer 20 miljard dollar aan CPU-inkomsten.

Vervangt Vera GPU’s?
Nee. Vera is bedoeld om samen met GPU’s te werken. Het coördineert en ondersteunt de workloads en controlestromen binnen de toekomstige AI-fabrieken.

X (Twitter) Facebook LinkedIn Email WhatsApp