NVIDIA Rubin CPX: De Nieuwe GPU die het Tijdperk van Massale Context-Inferentie Inluidt - Cloud News

X (Twitter) Facebook LinkedIn Email WhatsApp

De Nieuwe NVIDIA Rubin CPX: Een Revolutie in Kunstmatige Intelligentie Hardware

NVIDIA blijft de grenzen van kunstmatige intelligentie verleggen met de onthulling van de gloednieuwe Rubin CPX GPU. Deze innovatieve chip is meer dan een upgrade; het markeert de geboorte van een geheel nieuwe categorie binnen het CUDA-ecosysteem: processors voor grootschalige contextinference.

Met de Rubin CPX, een GPU die tot een miljoen tokens aan contextinformatie aankan, biedt NVIDIA een oplossing die ondenkbaar was slechts twee jaar geleden. Deze ontwikkeling zal vooral invloed hebben op twee snelgroeiende sectoren: programmeringsassistentie en multimodale video-generatie.

Een Nieuwe Categorie in AI-Hardware

NVIDIA beschrijft de Rubin CPX als de eerste CUDA-GPU die is ontworpen voor grootschalige contexten. Dit betekent dat modellen nu niet meer met enkele duizenden, maar met honderden duizenden of zelfs miljoenen eenheden informatie kunnen werken. Hierdoor kunnen programmeringscopiloten niet alleen codefragmenten genereren, maar ook volledige projecten begrijpen, inclusief complete repositories en documentatie.

Naast programmatoepassingen zullen videoproducties profiteren van de mogelijkheid om tot een uur aan content in één enkele context te verwerken, een taak die een miljoen tokens vereist.

Om dit te realiseren, is de Rubin CPX uitgerust met langeafstandsaandachtsversnellers, video-codecs, en een efficiënt silicondesign dat zowel energiezuinig als hoogwaardig is. NVIDIA claimt dat de nieuwe GPU tot 30 petaflops in NVFP4-precisie kan leveren, met 128 GB GDDR7-geheugen dat geoptimaliseerd is voor kosten en een drievoudige toename in attentiecapaciteit ten opzichte van eerdere systemen.

Vera Rubin NVL144 CPX: Een Rack met 8 Exaflops

Maar het gaat niet alleen om de GPU. De Rubin CPX komt binnen de NVIDIA Vera Rubin NVL144 CPX-platform, dat CPUs, GPUs en de nieuwe CPX-processors combineert, met een capaciteit van maar liefst 8 exaflops aan AI in één rack. Dit systeem beschikt over 100 TB aan snelle opslag en een geheugenbandbreedte van 1,7 petabyte per seconde, wat een prestatieverbetering van 7,5 keer vertegenwoordigt ten opzichte van voorgaande generaties.

Voor bestaande NVL144-gebruikers biedt NVIDIA een CPX-computing tray aan, waarmee ze hun capaciteiten kunnen uitbreiden zonder hun gehele infrastructuur te vervangen.

Jensen Huang: “Grootschalige AI is de Volgende Grens”

NVIDIA’s CEO Jensen Huang vergeleek de lancering van de Rubin CPX met andere mijlpalen in de technologische vooruitgang van het bedrijf. “Net zoals RTX de graphics en de fysieke AI revolutioneerde, is Rubin CPX de eerste CUDA-GPU die is ontworpen voor grootschalige contextuele AI,” zei hij.

De strategische focus is noodzakelijk in een markt die snel beweegt richting contextvensters van zes of zeven cijfers, zowel voor taalmodellen als voor multimodale toepassingen.

Economische Implicaties: “Inkomen per Token”

Naast technische specificaties roept NVIDIA ook economische overwegingen aan. Het bedrijf schat dat systemen gebouwd rond de Rubin CPX kunnen leiden tot 5 miljard dollar aan inkomsten per 100 miljoen dollar investeringen in infrastructuur. Deze cijfers zijn afhankelijk van de tokenprijzen en het type model, maar ze geven een duidelijke boodschap: hardware kan fungeren als een directe multiplier van de bedrijfsvoering op AI-platforms die hun inkomsten baseren op verwerkte tokens.

Voorbeeldtoepassingen: Software, Film en Autonome Agents

Verschillende bedrijven hebben al aangegeven hoe de Rubin CPX hun producten zal transformeren. Cursor, een AI-gedreven code-editor, beweert dat de Rubin CPX hen zal in staat stellen om ultra-snelle codegeneratie te bieden. Runway, gespecialiseerd in generatieve video-AI, ziet kansen voor langere formaten en agentgestuurde workflows. Magic, een bedrijf dat agenten voor software-engineering ontwikkelt, verwacht dat hun systemen met de Rubin CPX toegang hebben tot jaren aan historische interacties zonder opnieuw te hoeven trainen.

Software-Ecosysteem: Dynamo, Nemotron en NIM

NVIDIA ondersteunt de lancering met een softwarestack die de adoptie vergemakkelijkt. De platforms omvatten NVIDIA Dynamo, dat is gericht op schaalbare inference, en de Nemotron™-modellen voor geavanceerd redeneren in bedrijfsagentschappen.

Beschikbaarheid en Toekomstige Plannen

De Rubin CPX is gepland voor lancering eind 2026, wat bedrijven de tijd geeft om hun datastructuren en strategieën aan te passen. In de tussentijd zal NVIDIA de Rubin-familie blijven uitbreiden en de integratie met netwerktechnologieën verbeteren.

Implicaties voor de Industrie

Het aankondigen van de Rubin CPX heeft gevolgen voor zowel technologische als economische aspecten in de markt. De focus verschuift van het verhogen van parameters naar het uitbreiden van contexten die in realtime verwerkt kunnen worden.

Conclusie

Met de Rubin CPX positioneert NVIDIA zich niet alleen als pionier in GPU-technologie, maar ook in het veranderen van hoe we prestaties meten van FLOPS naar verwerkte tokens binnen enorme contexten. Dit komt op een moment dat de vraag naar kunstmatige intelligentie wereldwijd exponentieel groeit.

Veelgestelde Vragen (FAQ)

Wat is NVIDIA Rubin CPX?
Het is een nieuwe GPU ontworpen voor grootschalige contextinference, met capaciteit voor miljoenen tokens.

Welke technische specificaties zijn opvallend?
De Rubin CPX kan tot 30 petaflops NVFP4 bieden en is uitgerust met 128 GB GDDR7-geheugen.

Welke toepassingen profiteren het meest?
Programmeringsassistenten, generatieve video en autonome agents.

Wanneer is Rubin CPX beschikbaar?
NVIDIA verwacht de GPU beschikbaar te stellen eind 2026.

Bron: nvidianews.nvidia

X (Twitter) Facebook LinkedIn Email WhatsApp