NVIDIA en Dell brengen bedrijfsgerichte intelligente AI naar het datacenter

Jensen Huang gebruikt opnieuw een krachtige metafoor om het huidige moment van bedrijfsmatige kunstmatige intelligentie (AI) te beschrijven. Tijdens Dell Technologies World verzekerde de CEO van NVIDIA dat de vraag “parabolisch” is geworden, een samenvatting van wat Dell en NVIDIA aan de markt willen aanbieden: AI bevindt zich niet langer slechts in testfasen, maar wordt nu geïmplementeerd in echte productieomgevingen, met autonome agents, grootschalige inferentie en modellen die binnen het bedrijf zelf draaien.

De kernboodschap is duidelijk: bedrijven zijn geëvolueerd van experimenteren met chatbots en pilotprojecten naar het integreren van AI-agents in interne processen, databases, code, documentatie, industriële operaties en kritieke workflows. Hier ligt het grote debat: welke delen van AI moeten in de publieke cloud draaien en welke infrastructuur is beter on-premises, colocation, aan de edge of op geavanceerde werkstations onder te brengen?

Dell AI Factory met NVIDIA: van pilot naar productie

De keynote van Michael Dell en Jensen Huang draaide om de Dell AI Factory met NVIDIA, een oplossing die servers, netwerken, opslag, software, diensten en modellen combineert om end-to-end bedrijfs-AI uit te rollen. NVIDIA presenteert een platform voor autonome agents dat zich uitstrekt van werkstations tot volledige datacenterracks. Dell benadrukt dat bedrijfs-AI beveiliging, governance en voorspelbare kosten vereist, in tegenstelling tot een strategie die zich uitsluitend op cloud APIs baseert.

De gepresenteerde cijfers geven inzicht in de omvang van de spreiding. Volgens Dell zou de wereldwijde investering in AI-infrastructuur tussen de 3 en 4 biljoen dollar kunnen liggen tegen 2030, terwijl het tokenverbruik in diezelfde periode met 3400% zou toenemen. Hoewel deze prognoses van belanghebbenden komen, wijzen ze op een nieuwe realiteit: zodra AI van demo naar productie gaat, worden inference-kosten, data beschikbaarheid en infrastructuur efficiëntie even belangrijk als het gekozen model.

Door Dell en NVIDIA aangekondigde gegevensGetal
Aantal bedrijven dat AI-ladingen gebruikt binnen Dell AI Factories met NVIDIA5.000
Geschatte wereldwijde uitgaven aan AI-infrastructuur tot 20303-4 biljoen dollar
Projected groei in tokenverbruik tot 20303400%
Aanbiedingen van AI-ladingen buiten de cloud volgens Dell-enquête67%
Bedrijven met minimaal één on-premise AI-lading88%
Geschatte besparingen met Dell Deskside Agentic AI versus cloud-API’s in twee jaartot 87%
Geschatte break-even point versus publieke cloud-API’svanaf 3 maanden

Het is belangrijk deze cijfers met enige voorzichtigheid te interpreteren. De besparingen ten opzichte van de cloud hangen af van gebruiksvolume, modeltype, energieverbruik, technisch personeel, hardware-afschrijving en beschikbaarheidsbehoeften. Desalniettemin wordt het argument steeds meer begrijpelijk voor veel bedrijven: als AI-agents continu interne gegevens raadplegen, code uitvoeren, vertrouwelijke documentatie verwerken en tokens genereren, wordt een volledig cloudmodel moeilijk beheersbaar.

Vera Rubin, PowerEdge en de strijd om token-kosten

De meest opvallende aankondiging betreft de nieuwe generatie versnelde infrastructuur. Dell introduceert de PowerEdge XE9812, gebaseerd op NVIDIA Vera Rubin NVL72, een platform dat volgens NVIDIA de kosten per token tot tien keer kan verlagen ten opzichte van Blackwell, vooral bij grootschalige inferentie. Daarnaast worden nieuwe servers aangekondigd, zoals de PowerEdge XE9880L, XE9885L en XE9882L, gebaseerd op NVIDIA HGX Rubin NVL8, met ondersteuning voor tot 144 GPU’s per rack en geavanceerde watergekoelde compute-nodes.

De focus ligt niet alleen meer op het trainen van steeds grotere modellen, maar vooral op het efficiënt en kosteneffectief bedienen van inferentie op grote schaal. AI-agents reageren niet slechts op één vraag en stoppen, maar kunnen tools raadplegen, taken verdelen, code genereren en controleren, databases raadplegen, documenten ophalen, antwoorden valideren en processen herhalen. Dit verhoogt het tokengebruik en legt meer druk op CPU’s, GPU’s, geheugen, netwerken en opslag.

De NVIDIA Vera CPU speelt hierin een belangrijke rol. Dell integreert Vera in de PowerEdge M9822- en R9822-servers. Volgens NVIDIA biedt Vera 1,2 TB/s geheugenbandbreedte en voert het grootschalige agentgerichte workloads ongeveer 50% sneller uit dan traditionele x86-processors. Daarnaast worden verbeteringen gemeld in grote SQL-analyses met Starburst over Vera CPU, tot wel driemaal zo snel.

Product of technologieRol in de strategie
Dell PowerEdge XE9812 met NVIDIA Vera Rubin NVL72Grootschalige inferentie en kostenreductie per token
PowerEdge XE9880L, XE9885L en XE9882L met HGX Rubin NVL8Watergekoelde servers voor hoge GPU-dichtheid
NVIDIA Vera CPUSequentiële agent workloads, analytiek, datastromen en sandboxes
Dell PowerSwitch met Quantum-X800 en Spectrum-6High-performance netwerk voor AI-clusters
Dell PowerRackGeïntegreerd systeem voor compute, netwerken en opslag voor AI en HPC
Dell AI Data Platform met NVIDIAVoorbereiding, zoekfuncties, analytiek en dataconnectiviteit binnen bedrijven

Ook de rack-infrastructuur wordt belangrijker. Dell PowerRack wordt gepresenteerd als een geïntegreerd systeem waarin compute, netwerken, opslag, koeling, energiebeheer en software als één geheel ontworpen zijn. De kernboodschap: bij grootschalige AI draait het niet alleen om GPUs, maar vooral om de totale prestatie, inclusief netwerkkoppelingen, vloeistofkoeling, stroomvoorziening, opslag en operationele integratie.

Locatiegebonden agents, beschermde gegevens en beheerde modellen

Een belangrijk terugkerend thema op het evenement is het belang van het dichterbij brengen van AI naar de data. Dell Deskside Agentic AI biedt de mogelijkheid om agents op lokale werkstations te draaien met NVIDIA NemoClaw, OpenShell en Nemotron-modellen, naast systemen zoals Dell Pro Max met GB10 en GB300 en Dell Pro Precision werkstations met RTX PRO Blackwell GPU’s. Deze aanpak ondersteunt modellen van 30 miljard tot 1 biljoen parameters, afhankelijk van de configuratie.

Deze aanpak is vooral logisch voor afdelingen zoals engineering, onderzoek, design, financiën, overheidsinstanties of gereguleerde sectoren. Een agent die werkt met broncode, intellectueel eigendom, medische gegevens, juridische documenten of industriële informatie kan niet altijd afhankelijk zijn van externe APIs. Dell en NVIDIA pleiten voor lokale uitvoering, dichtbij de data, en schaalvergroting naar het bedrijfsdatacenter wanneer de use case volwassen wordt.

Veiligheid wordt onderbouwd door NVIDIA OpenShell, een open-source runtime voor het ontwikkelen en uitrollen van agents met privacycontroles en bedrijfsbeleid. NVIDIA Confidential Computing speelt hier ook een rol, met samenwerkingen met Fortanix, Google en Red Hat om modellen en data te beschermen tijdens gebruik. Zo kunnen geavanceerde modellen binnen het bedrijfsnetwerk draaien zonder dat controle over het modelgewicht of vertrouwelijke data wordt verloren.

Het model- en partnerschapaanbod groeit verder. NVIDIA noemt Nemotron als open-modeloptie voor bedrijven die zelf gewichten willen aanpassen op hun domein. Dell en NVIDIA verwijzen ook naar reflection, MiniMax, DeepSeek, GLM, Kimi, Mistral, Gemma en andere modellen die via Dell Enterprise Hub op Hugging Face beschikbaar zijn. OpenAI Codex zal worden geïntegreerd met Dell AI Data Platform om te linken met interne bedrijfsdata, codebases en systemen.

Voor CIO’s en infrastructuurverantwoordelijken is de boodschap duidelijk: grootschalige AI-agents worden niet alleen een SaaS-applicatie, maar vereisen vaak een eigen architectuur met data governance, modelbeheer, activiteitendocumentatie, isolatie, geheimhouding en een netwerk dat intensieve communicatie tussen agents, tools en interne systemen kan ondersteunen.

Economisch gezien kunnen de kosten voor API-gebruik stijgen naarmate meer tokens worden gegenereerd en meer achtergrondtaken worden uitgevoerd. Infrastructuur in eigen beheer biedt meer controle bij stabiel en intensief gebruik, hoewel dat niet altijd goedkoper is. Voor incidenteel gebruik blijft cloud voordelig, maar voor dagelijkse, bedrijfsbrede taken beginnen de kostenmodellen te verschuiven.

De samenwerking tussen Dell en NVIDIA onderstreept de evolutie in de markt: van abstracte discussies over “AI gebruiken” naar de praktijk van racks, vloeistofkoeling, gespecialiseerde CPUs, interne gegevens, beveiliging, kosten per token en echte implementaties. Bedrijfs-AI bevindt zich niet langer in de eerste schijnwerpers, maar in de kritieke fase waarin pilots vertaald worden naar werkende systemen die elke dag operationeel zijn.

Veelgestelde vragen

Wat kondigde NVIDIA samen met Dell aan op Dell Technologies World?
NVIDIA en Dell presenteerden nieuwe onderdelen van Dell AI Factory with NVIDIA, waaronder systemen met Vera Rubin, PowerEdge-servers, Dell PowerRack, Dell Deskside Agentic AI, NVIDIA OpenShell en nieuwe integraties van modellen en partners.

Waarom zegt Jensen Huang dat de vraag naar AI “parabolisch” is?
Omdat bedrijven van experimenten en kleinschalige testen overstappen op grootschalige inferentie en productie van AI-agenten. Dit leidt tot een sterke toename in tokengebruik, rekenbehoefte en infrastructuurdruk.

Wat is Dell Deskside Agentic AI?
Een aanpak waarmee AI-agents op lokale werkstations kunnen draaien, met open modellen, NVIDIA NemoClaw en OpenShell, ontworpen voor situaties waarin met gevoelige data gewerkt wordt zonder afhankelijkheid van de cloud.

Gaat bedrijfs-AI naar de cloud?
Niet volledig. De meest waarschijnlijke setting is een hybride aanpak. Sommige workloads blijven in de cloud, maar voor gevoelige data, persistente agents en maatwerkmodellen wordt on-premises, colocation, aan de edge of op lokale werkstations gebruikt.

vía: blogs.nvidia

Scroll naar boven