NVIDIA Vera komt bij OpenAI, Anthropic en Oracle: de CPU voor het tijdperk van agenten - Cloud News

X (Twitter) Facebook LinkedIn Email WhatsApp

NVIDIA is begonnen met het leveren van de eerste systemen op basis van Vera, haar nieuwe CPU ontworpen voor agent-achtige kunstmatige intelligentielasten. Het bedrijf bevestigt dat de eerste units inmiddels zijn aangekomen bij Anthropic, OpenAI, SpaceXAI en Oracle Cloud Infrastructure—een belangrijke stap die Vera van een technische aankondiging naar eigendom door strategische klanten brengt. Dit is geen alledaagse CPU in het datacentercatalogus: NVIDIA wil Vera positioneren als het centrale onderdeel van de zogenaamde AI-factories, infrastructuren waar grootschalige AI-modellen worden getraind, uitgevoerd en gecoördineerd.

Het nieuws komt op een moment dat de aandacht wederom sterk op GPU’s gericht is, maar dat agent-achtige AI zich aan het ontwikkelen is tot een gamechanger binnen datacenters. Een agent stopt niet na het genereren van een antwoord; hij kan informatie opzoeken, tools aanroepen, code uitvoeren, databases raadplegen, geïsoleerde omgevingen openen, documenten analyseren, verschillende stappen coördineren en context behouden over lange sessies. Een groot deel van deze taken vindt niet binnen de GPU plaats, maar er rondomheen. Hier wil NVIDIA Vera positioneren.

Waarom een CPU opnieuw strategisch wordt in AI

De afgelopen jaren is AI-discours gevormd rondom GPU’s. NVIDIA domineert die markt met zijn versnellers, software en ontwikkelaars-ecosysteem. Maar zodra AI-modellen meer als agents gaan functioneren, ligt de bottleneck niet alleen in matrixberekeningen. Ook orchestratie, geheugentoegang, tool-aanroepen, code-uitvoering, sandbox-omgevingen, informatieophaling en datatransfer tussen processen worden kritische factoren.

Vera is ontworpen voor dat soort lasten. Volgens NVIDIA bevat hij 88 Olympus-kernen, zelf ontwikkeld, 1,2 TB/s geheugentoegangsbanaan en tot 50% betere prestaties per kern onder belasting. De CPU ondersteunt Armv9.2 en 176 threads via NVIDIA’s Spatial Multithreading, een techniek die fysieke middelen van de kern verdeelt i.p.v. snel af te wisselen tussen threads.

Het bedrijf benadrukt ook de ondersteuning voor tot 1,5 TB LPDDR5X geheugen, de tweede-generatie NVLink-C2C-connectiviteit met 1,8 TB/s coherente bandbreedte en mogelijkheden voor Confidential Computing. In de praktijk streeft NVIDIA ernaar Vera niet alleen te gebruiken als hostprocessor voor GPU’s, maar als een CPU die duizenden gelijktijdige software-omgevingen kan ondersteunen en datastromen in versnellersystemen efficiënt blijft voeden.

Kenmerk van NVIDIA Vera	Gerapporteerde specificatie
Nooijen	88 Olympus
Threads	176 met Spatial Multithreading
Architectuur	Armv9.2
Geheugencapaciteit	Tot 1,5 TB
Geheugensnelheid	Tot 1,2 TB/s
NVLink-C2C	Tot 1,8 TB/s
Prestatiewinst per kern	Tot 50% onder belasting
Compatibiliteit	Standalone systemen, Vera Rubin NVL72 en HGX-platforms

Voor bedrijven is het helder. Als agents meer oproepen, code en datavragen genereren, wordt de CPU veel meer dan een secundair onderdeel. In veel agent-gerichte workloads versnelt de GPU het model, maar de CPU organiseert het werk dat nodig is om dat model effectief te laten functioneren.

Leveringen aan AI-laboratoria en cloud

De eerste distributie heeft een symbolische betekenis. NVIDIA heeft nog geen wereldwijde massale release aangekondigd, maar richt zich op belangrijke marktspelers in AI: Anthropic, OpenAI, SpaceXAI en Oracle Cloud Infrastructure. Ian Buck, vice-president van Hyperscale en High-Performance Computing bij NVIDIA, leverde persoonlijk de eerste systemen, aldus het officiële bedrijfsblog.

Bij Anthropic wordt Vera gepresenteerd als een veelbelovende component voor agent-achtige workloads. OpenAI koppelt de levering aan de behoefte om nieuwe workloads aan te boren. SpaceXAI onderzoekt Vera voor reinforcement learning en agent-gestuurde simulatiepijplijnen. Oracle Cloud Infrastructure wil vanaf 2026 honderden duizenden NVIDIA Vera-CPU’s inzetten om grootschalige productieve agent- en AI-infrastructuur te bieden.

Dit onderstreept dat Vera niet alleen in laboratoria van onderzoek of ontwikkeling gebruikt wordt, maar ook in de cloud. Als OCI haar plannen waarmaakt, zou NVIDIA’s CPU kunnen uitgroeien tot een nieuwe optie voor bedrijven die agenten willen testen, complexe reasoning-taken willen uitvoeren of AI-services willen uitrollen met een architectuur die geschikt is voor lange termijn, intensief gebruik van tools en data.

NVIDIA positioneert Vera binnen een bredere co-ontwerpstrategie, samen met Rubin GPU’s, BlueField-4 DPU, Spectrum-X en de MGX-architectuur. Naast de zelfstandige CPU-functie fungeert Vera als hostprocessor in systemen zoals Vera Rubin NVL72, waar hij via NVLink-C2C verbonden wordt met Rubin GPU’s en andere componenten. In die systemen wordt een gedeeld geheugenmodel toegepast voor optimaal gebruik van versnelde computing.

Agent-achtige AI vereist andere infrastructuur

Vera bevestigt een trend die al zichtbaar was in recente aankondigingen van NVIDIA en Dell: zakelijke AI wordt niet langer alleen gemeten aan het aantal GPU’s. Het werkelijke prestatieniveau hangt af van de coördinatie tussen CPU, GPU, geheugen, netwerk, opslag, beveiliging en software-orkestratie. Een agent die code maakt, test, documentatie opvraagt en meerdere initiaties doorloopt, vereist een andere infrastructuur dan een eenvoudige chatbot.

Hier ligt de reden dat NVIDIA zich richt op taken zoals tool-calling, sandboxing, lange-termijn contextherinnering, analytics, KV-cachebeheer en reinforcement learning. Zulke taken lijken minder spectaculair dan het trainen van grote modellen, maar bepalen de efficiëntie van een AI-factory. Als de GPU wacht op dataverwerking, ondersteuning, tools of geheugentransfers, gaat de totale kosten per output omhoog.

Ook speelt energieverbruik een rol. NVIDIA beweert dat Vera de orkestratie, datamovement en controle kan uitvoeren met twee keer zoveel energie-efficiëntie vergeleken met traditionele infrastructuren. Hoewel benchmarking nog nodig is, adresseert dit een kernprobleem: AI wordt steeds energievoller, en verbeteringen in efficiëntie kunnen de operationele kosten verminderen en de druk op datacenters verlichten.

Voor hyperscalers kan deze CPU ideaal zijn voor beheerde AI-diensten, agent-platforms, reinforcement learning, datagedreven analyses en hybride modellen waarin verschillende systemen en tools samenwerken. Voor bedrijven is de vraag of Vera straks in niet-ML-servers, racks en clouds te vinden zal zijn, tegen prijs en beschikbaarheid die passen bij bedrijfsbehoeften.

Ook de concurrentiepositie is relevant: NVIDIA wil verder gaan dan alleen accelerators door met Vera ook de datacenter-CPU-markt te betreden — een terrein dat traditioneel door Intel en AMD wordt gedomineerd. Dit gebeurt niet via algemene gegevensverwerking, maar vanuit een duidelijke focus op AI-agents. Deze specialisatie kan een voordeel zijn bij massale adoptie van agenten, maar het vereist wel dat pilots uiteindelijk tot productie leiden.

Vera versterkt de integratie tussen componenten. De CPU ondersteunt, coördineert en voedt; GPU’s versnellen; netwerken verbinden; opslag levert data; en beveiligingslagen beschermen modellen en data. Het datacenter ontwikkelt zich zo meer naar een geïntegreerde intelligente machine dan een louter som van onderdelen.

De eerste systemen voor OpenAI, Anthropic, SpaceXAI en Oracle geven inzicht in de richting waarin NVIDIA zich beweegt: van een focus op GPU-producten naar een platform dat volledig gericht is op AI-factories en agentgerichte workloads. In deze nieuwe tijd geldt: de processor die het werk organiseert, kan net zo belangrijk worden als de processor die het voert.

Veelgestelde vragen

Wat is NVIDIA Vera?
NVIDIA Vera is de eerste op maat gemaakte CPU van NVIDIA, specifiek ontworpen voor agent-achtige AI, reinforcement learning, tool-orkestratie, sandboxing, analytics en datastromen in AI-factories.

Waarom is Vera belangrijk als AI vooral op GPU’s draait?
Omdat agent-achtige AI niet alleen afhankelijk is van modelberekeningen. Ze voeren code uit, roepen tools aan, beheren context, verplaatsen data en coördineren workflows waar de CPU een essentiële rol speelt.

Welke bedrijven hebben de eerste Vera-systemen ontvangen?
Volgens NVIDIA zijn dat Anthropic, OpenAI, SpaceXAI en Oracle Cloud Infrastructure.

Vervangt Vera GPU’s van NVIDIA?
Nee. Vera is aanvullend. Hij kan als zelfstandige CPU werken of als host processor binnen systemen zoals Vera Rubin NVL72, waar hij samenwerkt met GPU’s van de Rubin-serie en andere componenten.

via: blogs.nvidia

X (Twitter) Facebook LinkedIn Email WhatsApp