NVIDIA’s Blackwell Ultra: De Nieuwe Mijlpaal in Kunstmatige Intelligentie
NVIDIA heeft opnieuw een grote stap gezet in de technologie-race die kunstmatige intelligentie (AI) op grote schaal definieert. De nieuwe chip, Blackwell Ultra, is niet alleen een evolutie ten opzichte van eerdere generaties; het vormt de kern van wat het bedrijf zelf de periode van AI-fabrieken noemt. Deze infrastructuren zijn in staat multimodale modellen met triljoenen parameters te trainen en uit te voeren, en bieden realtime diensten aan miljarden gebruikers.
Innovaties in Silicium en Geheugen
De officiële presentatie, beschikbaar op de ontwikkelaarswebsite van NVIDIA, benadrukt hoe innovaties in silicium, geheugen en interconnectie samenkomen om ongekende niveaus van prestatie en efficiëntie te bieden.
Een Dual-Grid Ontwerp
De Blackwell Ultra introduceert een dual-grid ontwerp: twee chips van maximaal fotolithografiegrootte, verbonden via NV-HBI, een op maat gemaakte interconnectie van 10 TB/s. Dit zorgt ervoor dat de chip fungeert als een enkele programmeerbare accelerator met CUDA, wat de compatibiliteit met het software-ecosysteem dat NVIDIA in twee decennia heeft verfijnd, behoudt.
Met 208 miljard transistors, 2,6 keer meer dan de Hopper-architectuur, is het resultaat een enkele logische chip.
Vijfde Generatie Tensor Cores
De kern van elke GPU bestaat uit 160 streaming multiprocessors (SMs), georganiseerd in acht clusters. Elke SM bevat:
- 128 traditionele CUDA Cores.
- 4 vijfde generatie Tensor Cores met de tweede iteratie van de Transformer Engine, geoptimaliseerd voor lage precisie formaten zoals FP8, FP6 en het nieuwe NVFP4.
- 256 KB Tensor Memory, ontworpen om het verkeer naar extern geheugen te verminderen.
Het nieuwe NVFP4-formaat combineert blokschaling in FP8 met tensoriale precisie in FP32, waardoor een evenwicht tussen efficiëntie en precisie wordt bereikt, vergelijkbaar met FP8, maar met tot 3,5x minder geheugengebruik.
Dit vertaalt zich naar 15 PetaFLOPS van dichte kracht in NVFP4, wat 1,5x meer is dan de standaard Blackwell en 7,5 keer meer dan een Hopper H100/H200.
Versnelde Softmax
Een van de grootste knelpunten in transformer-modellen is de berekening van softmax in de aandachtlagen. NVIDIA heeft de prestatie van speciale wiskundige eenheden (SFUs) voor deze operaties verdubbeld, wat resulteert in 10,7 teraexponenciais per seconde.
Dit betekent in de praktijk:
- Versnelling van de tijd naar het eerste token in conversatiemodellen.
- Hogere energie-efficiëntie door het verminderen van computercycli per verzoek.
Geheugen voor Triljoenen Parameters
Blackwell Ultra beschikt over 288 GB HBM3e-geheugen per GPU, dat is 50% meer dan Blackwell en 3,6 keer meer dan Hopper. Met een bandbreedte van 8 TB/s kunnen modellen van meer dan 300 miljard parameters worden gehost zonder gebruik te maken van offloading-technieken.
Interconnectie: de Zenuwbanen van de AI-Fabriek
De chip ondersteunt NVLink 5, met 1,8 TB/s bidirectionele bandbreedte per GPU, wat de capaciteit van Hopper verdubbelt. Dit stelt gebruikers in staat om topologieën van tot 576 GPUs zonder blokkering op te zetten.
Verbeterde Beveiliging en Betrouwbaarheid
Zekerheden zoals Multi-Instance GPU (MIG), die een GPU in maximaal 7 instanties kan partitioneren, en Confidential Computing en TEE-I/O, dragen bij aan de veiligheid en betrouwbaarheid, wat cruciaal is voor zakelijke toepassingen.
Verwerking van Multimodale Gegevens
Naast traditionele berekeningen omvat de chip gespecialiseerde engines voor video, afbeeldingen en gegevenscompressie, waardoor de algehele prestaties verder worden verbeterd.
Van Chip naar AI-Fabriek
NVIDIA integreert Blackwell Ultra in verschillende configuraties, met als hoogtepunten de Grace Blackwell Ultra Superchip, die 1 TB aan unificeerde geheugen en tot 40 PetaFLOPS in NVFP4 levert.
Economische Impact van AI
De gegevens wijzen erop dat Blackwell Ultra de economische haalbaarheid van generatieve AI verbetert. Met 50% lagere energiekosten per token in vergelijking met Hopper, kan dit bepalend zijn voor massale adoptie in sectoren zoals:
- Gezondheidszorg (medische beeldanalyse, geneesmiddelenonderzoek).
- Automobilisme (geavanceerde autonome rijsystemen).
- Financiën (risicomodellering en realtime voorspelling).
- Entertainment (rendering en contentgeneratie).
Conclusie
Met Blackwell Ultra verstevigt NVIDIA niet alleen zijn leidende positie, maar stelt het ook de technische en economische standaard voor het komende decennium van kunstmatige intelligentie.