GB10 en DGX Spark van NVIDIA: Mini-supercomputers Blackwell voor de kracht van datacenters op uw bureau

NVIDIA onthult GB10 Grace Blackwell SoC en DGX Spark tijdens Hot Chips 2025

Madrid — Tijdens het Hot Chips 2025-congres heeft NVIDIA gedetailleerde informatie gedeeld over de SoC GB10 Grace Blackwell en het systeem DGX Spark. Veel analisten beschouwen deze aankondiging als een nieuwe fase in NVIDIA’s strategie voor kunstmatige intelligentie (AI), gericht op het dichter bij gebruikers brengen van datacenterkracht naar persoonlijke werkruimtes.

Deze nieuwe producten beloven uitzonderlijke prestaties in compactere formats, wat het mogelijk maakt om AI-modellen te prototypen, fine-tunen en uit te voeren met capaciteiten die voorheen alleen beschikbaar waren voor grote servers.

Belangrijkste technische kenmerken van de GB10 SoC en DGX Spark

Op basis van de gedeelde specificaties:

  • GB10 is een multi-dielet SoC dat een Arm CPU combineert met een GPU gebaseerd op de Blackwell-architectuur van NVIDIA.
  • Fabricage: zowel de CPU- als de GPU-dies zijn vervaardigd met behulp van een 3 nm proces van TSMC, waarbij ze zijn verpakt via een 2,5D-interposer om de componenten met elkaar te verbinden.
  • CPU: 20 Arm v9.2-kernen, verdeeld over twee clusters van elk 10 kernen.
  • GPU: alle belangrijke functies van Blackwell, inclusief ondersteuning voor FP4 (lage precisie die meer bewerkingen per watt mogelijk maakt).
  • Gecoherente, unificerende geheugen: 128 GB systeemgeheugen (LPDDR5X) met een aanzienlijke bandbreedte (≈ 301 GB/s), en tot 4 TB NVMe-opslag op sommige systemen.
  • Theoretische prestaties: tot 1 petaFLOP in FP4 en ongeveer 31 teraflops in FP32.
  • Vermogen (TDP): ongeveer 140 watt voor de chip in normale operationele omstandigheden.

De DGX Spark is het systeem dat de GB10 zal huisvesten en zal fungeren als een “persoonlijke supercomputer” (desktop AI supercomputer). NVIDIA heeft samengewerkt met OEM’s zoals ASUS, Dell, Lenovo, en HP om varianten in dit formaat te fabriceren.

Wat DGX Spark met GB10 mogelijk maakt

Hier zijn enkele praktische toepassingen en duidelijke voordelen:

  1. Prototyping en fine-tuning van grote modellen lokaal: met 128 GB coherente geheugen is het haalbaar om modellen met tientallen miljarden parameters te trainen voordat ze naar de productieomgeving worden overgebracht.

  2. Energie-efficiënte inferentie: dankzij de Blackwell-architectuur en FP4-ondersteuning kunnen inferenties met een lager verbruik worden uitgevoerd, wat het nuttig maakt voor onderzoekers en kleine teams die niet op een groot datacenter kunnen vertrouwen.

  3. Lokale ontwikkeling met flexibele uitrol: de op DGX Spark ontwikkelde modellen kunnen eenvoudig worden uitgerold naar DGX Cloud of andere door NVIDIA versnelde infrastructuren zonder significante codewijzigingen.

  4. Connectiviteit en uitbreiding: met netwerken zoals ConnectX-7/-C2C (chip-to-chip) kunnen meerdere eenheden worden aangesloten voor het werken met nog grotere modellen.

Beperkingen en openstaande vragen

Hoewel deze producten veelbelovend zijn, zijn er ook belangrijke overwegingen:

  • Prijs en beschikbaarheid: hoewel DGX Spark al in de pre-order fase is, zijn de startsprijzen nog niet openbaar bevestigd en kunnen ze variëren per markt.

  • Warmte en geluid: 140 watt is niet weinig voor een desktop. Een goed koel systeem zal noodzakelijk zijn, wat het geluidsniveau kan verhogen.

  • Grootte van reële modellen vs. theorie: hoewel er gesproken wordt over modellen met tientallen of honderden miljarden parameters, vereisen veel gevallen aanpassingen die de precisie verminderen om de hardware efficiënt te benutten.

  • Concurrentie met cloudalternatieven: voor degenen die al gebruik maken van cloud-infrastructuren, kan de meerwaarde van een lokaal apparaat, afhankelijk van ruimte, elektriciteit en lokale ondersteuning, minder aantrekkelijk zijn.

  • Software-ecosysteem en compatibiliteit: hoewel NVIDIA een sterke platform (DGX OS, CUDA-bibliotheken, etc.) biedt, zijn er altijd uitdagingen om AI-bibliotheken en nieuwe modellen aan te passen.

Strategische implicaties

De introductie van de GB10 en DGX Spark wijst op verschillende interessante strategische bewegingen van NVIDIA:

  • Diversificatie van hardware: niet alles draait om grote datacenters; het brengen van datacenterkracht naar desktop- en laboratoriumomgevingen vergroot de basis van AI-ontwikkelaars.

  • Uitgebreider Blackwell-ecosysteem: Blackwell is niet alleen voor mega-GPU-servers, maar vormt een schaalbare familie die zich uitstrekt van SoCs zoals de GB10 tot chips voor volledige datacenters.

  • Democratisering van toegang tot krachtige AI: het mogelijk maken voor onderzoekers, startups en middelgrote bedrijven om lokaal toegang te hebben tot krachtige hardware vermindert de afhankelijkheid van cloud, verbetert de latentie en verlaagt de operationele kosten.

  • Concurrentiedruk: andere fabrikanten (zoals AMD, Intel, etc.) zullen moeten reageren met hun eigen SoC/mini-servers/lokale AI-pc’s om relevant te blijven in de onderzoeks- en edge/desktop AI-markt.

Conclusie

De GB10 superchip en het DGX Spark-systeem vertegenwoordigen een significante stap in hoe NVIDIA wil dat AI niet alleen in datacenters leeft, maar ook op desktops, in laboratoria en ontwikkelstudios. Met de capaciteiten van Blackwell, een krachtige CPU, unificerend geheugen en schaling voor netwerken, bevinden ze zich tussen wat ooit als “infrastructuur” werd beschouwd en wat nu alledaagse hardware voor AI-ontwikkelaars kan zijn.

Voor degenen die werken aan AI-modellen, biedt dit reële mogelijkheden voor lokale prototyping. De toekomst zal moeten uitwijzen wanneer prijzen verlagen, beschikbaarheid verbetert en ondersteuningsdetails verder worden uitgewerkt.

Veelgestelde vragen

Wat is de GB10 SoC van NVIDIA?
Het is een superchip die een Arm-gebaseerde CPU (20 kernen) en een Blackwell GPU combineert, vervaardigd in een 3 nm-proces van TSMC, bedoeld om datacenterkracht naar desktop- of workstationformaat te brengen.

Wat is DGX Spark en waarvoor dient het?
DGX Spark is een systeem van NVIDIA dat de GB10 monteert, ontworpen als “persoonlijke AI-supercomputer” voor onderzoekers, ontwikkelaars en lokale prototyping van AI-modellen, met 128 GB unificerend geheugen.

Hoeveel parameters van AI-modellen kan het lokaal aan?
Met de 128 GB unificerend geheugen kan de DGX Spark naar schatting modellen tot ongeveer 70 miljard parameters fine-tunen, en inferenties met zelfs grotere modellen uitvoeren, vooral met behulp van verlaagde precisie zoals FP4.

Hoe verhoudt de FP4-prestatie zich tot alternatieven?
De aangekondigde prestaties: tot 1 petaFLOP in FP4 plaatst het op een zeer hoog niveau voor desktopapparatuur, in de buurt van de prestaties van high-end discrete GPU’s, hoewel de werkelijke prestaties zullen afhangen van factoren zoals koeling, software en specifieke werkbelastingen.

Scroll naar boven