Lagraadige liquid cooling: de verborgen keten van AI-datacenters

Liquide koeling is niet langer een zeldzaamheid die voorbehouden is aan supercomputers en laboratoria. De opkomst van racks met tientallen GPU’s, kunstmatige intelligentie (AI)-versnellers en steeds dichtere servers dwingt tot een herontwerp van delen van het datacenter dat jarenlang werkte volgens een meer traditionele logica: lucht bewegen, koude en warme gangen beheersen, en de efficiëntie geleidelijk verbeteren.

Dit model verdwijnt niet volledig, maar volstaat niet meer in alle situaties. Nieuwe AI-platforms verhogen de vermogensdichtheid per rack, concentreren warmte op specifieke chips en maken het noodzakelijk om de thermische energie directer af te voeren. Daar komt een breder scala aan leveranciers bij kijken: fabrikanten van CDUs, racks ontworpen voor vloeistofkoeling, cold plates, pompen, kleppen, leidingen, dielectische vloeistoffen, warmtewisselaars, lekdetectors, automatisering en integratiediensten.

Van lucht naar vloeistof: waarom verandert het datacenter

Jarenlang was luchtkoeling voldoende voor de meeste zakelijke workloads. Ook nu is dat nog steeds het geval in veel virtualisatie-omgevingen, opslag, private clouds, conventionele databases en bedrijfsapplicaties. De omslag komt wanneer een ruimte begint te zitten met hoogdichte racks met AI-versnellers, waarbij de warmte van CPU’s, GPU’s, HBM-geheugen en interne switches snel kan toenemen tot niveaus die een traditioneel ontwerp niet efficiënt kan afvoeren.

Liquide koeling is geen eenduidige technologie. Het kan verschillende vormen aannemen. De meest gangbare in nieuwe AI-platforms is directe chipkoeling, waarbij een cold plate op de CPU, GPU of andere hete componenten wordt geplaatst, en een vloeistofcircuit de warmte afvoert. Ook bestaan er immersiekoeling, waarbij servers of componenten ondergedompeld worden in dielektrische vloeistoffen, en hybride oplossingen die lucht en vloeistof combineren afhankelijk van de belasting.

De gedeelde leveranciersinformatie illustreert die complexiteit. In een modern systeem volstaat het niet om simpelweg een ‘liquid-ready’ server aan te schaffen. Er is een volledige thermische architectuur nodig. De distributie-eenheden voor het koelsysteem, bekend als CDUs, regelen debiet, druk en thermische overdracht tussen het IT-circuit en het installatiecircuit. Manifolds en leidingen verdelen de vloeistof naar de racks. Pompen, kleppen en controle-systemen handhaven de stroming. Warmtewisselaars en dry coolers voeren de warmte af. Lekdetectie en monitoring minimaliseren operationele risico’s.

In elke laag opereren verschillende specialisten. Vertiv, STULZ, Schneider Electric, nVent, Danfoss, Submer, LiquidStack en ASUS ESC4000 zijn actief in het domein van CDUs. Dell Technologies, HPE, Lenovo, Supermicro en Wiwynn bieden racks en kant-en-klare oplossingen voor vloeistofkoeling. CoolIT Systems, Asetek, Mitsubishi Electric, Rittal en Koolance zijn prominent in cold plates en modules. Voor vloeistoffen zijn namen als 3M, Shell, Castrol, ExxonMobil, Chemours en DuPont bekend. Dit is geen volledig overzicht, maar het geeft inzicht in een markt die niet afhankelijk is van één enkele leverancier, maar opereert via een gespecialiseerde keten van fabrikanten en leveranciers.

AI dwingt tot rackgerichte ontwerpen, niet enkel ruimtegericht

Het verschil tussen een conventioneel datacenter en een datacenter dat is voorbereid op AI ligt niet alleen in het aantal megawatt. Het zit hem ook in de verdeling van de capaciteit. Een gebouw kan veel elektrische kracht hebben, maar zonder de juiste distributie, passende koeling, leidingen, redundantie, sensoren, waterbehandeling en integratie met beheersystemen, is het niet klaar voor hoogdichte racks.

NVIDIA’s GB200 NVL72 is een voorbeeld van deze nieuwe fase. Het platform bevat 36 CPU’s Grace en 72 GPU’s Blackwell in één rack dat gekoeld wordt door vloeistof. Deze architectuur brengt AI-berekeningen op rackniveau in plaats van enkel serverniveau, en vereist dat energiebeheer, netwerken en koeling als één geheel worden aangepakt. Het rack wordt hiermee een volledige thermische en elektrische eenheid, niet slechts een kast voor tientallen servers.

Voor operators betekent dit een verandering in basale beslissingen. Liquide koeling kan de efficiëntie verbeteren, de dichtheid verhogen en de afhankelijkheid van grote volumina zwaardere ventilatorlucht verminderen. Tegelijkertijd ontstaan nieuwe vragen: materiaalcompatibiliteit, onderhoud, lekbeheer, vloeistofkwaliteit, snelle connecties, personeelsopleiding, reserveonderdelen, monitoring en coördinatie tussen serverfabrikanten en datacenterinfrastructuur.

Daarbij spelen CDUs een cruciale rol, omdat ze de grens vormen tussen de IT-wereld en de facilitaire infrastructuur. Vaak is het zo dat het vloeistof dat direct in contact komt met de server anders is dan het systeem dat door de algemene installatie circuleert. Die scheiding maakt controle over druk, temperatuur, chemische samenstelling en veiligheid mogelijk. Bovendien voorkomt het dat één circuitstoringen de hele installatie beïnvloeden.

Lekdetectiesystemen zijn eveneens van groot belang. In een omgeving met vloeistof nabij kritieke apparatuur hangen operationele betrouwbaarheid en veiligheid af van sensoren, alarmen, kleppen, procedures en preventief ontwerp. Vertiv, Raritan, Schneider Electric, nVent, Emerson, Honeywell, Sensaphone en Uptime Intelligence spelen hier een rol. Liquide koeling krijgt alleen breed draagvlak als operationele teams het als beheersbaar zien en niet als een voortdurende bron van risico.

Een industriële kans, maar geen universele oplossing

De commerciële druk is duidelijk. Elke nieuwe AI-cluster vereist meer dichtheid, meer koeling en betere integratie. Dit opent kansen voor engineeringbedrijven, componentfabrikanten, integrators, datacenteroperators en onderhoudsbedrijven. Ook wordt de samenwerking tussen serverfabrikanten, chipproducenten, koelingsspecialisten en cloud-aanbieders intensiever.

Maar er moet niet overdreven worden. Liquide koeling zal niet op korte termijn alle luchtkoeling vervangen. Het Uptime Institute wijst erop dat de adoptie geleidelijk verloopt en dat veel voorzieningen nog steeds conventionele systemen gebruiken voor de meeste apparatuur. De drijvende kracht achter de verandering is de hogere dichtheid per rack, niet een trend die op alle workloads van toepassing is.

Praktisch betekent dat datacenters gebieden kunnen reserveren voor luchtgekoelde conventionele workloads en aparte zones voor vloeistofgekoelde racks met AI, HPC of zeer dichte servers. Deze combinatie wordt de norm in de komende jaren. Veel bedrijven hoeven niet meteen hun hele zaal aan te passen, maar kunnen tijdelijke aparte zones of clusters inrichten.

De integratie met de gebouwinstallaties bepaalt ook het succes. Warmtewisselaars, dry coolers, chillers, waterinstallaties, automatisering en facility-services bepalen of een ontwerp efficiënt en onderhoudsvriendelijk is. Voorbeelden van aanbieders hiervan zijn Kelvion, Alfa Laval, Modine, GPX Cooling, Güntner, Carrier, Trane en Johnson Controls, gekoppeld aan grote infrastructuuraanbieders zoals Schneider Electric, Vertiv, STULZ, Eaton en Danfoss.

Duurzaamheid speelt hierbij een belangrijke rol. Liquide koeling kan het energieverbruik van ventilatoren verkleinen en hogere bedrijfstemperaturen mogelijk maken, maar lost de energieconsumptie van AI niet volledig op. Het gebruik van water, de samenstelling van vloeistoffen, onderhoud, warmte-terugwinning en milieuvriendelijkheid vereisen aandacht. De werkelijke efficiëntie wordt bepaald door het totale systeemontwerp, niet door een label.

De opkomst van AI maakt thermisch beheer een strategische keuze. Koeling wordt niet meer enkel als een onzichtbare infrastructuur beschouwd, maar als een kritieke factor die bepaalt welke servers geplaatst kunnen worden, hoeveel GPU’s per rack passen, wat de energieprijs wordt van een cluster, en hoe snel nieuw vermogen operationeel is.

Kortom, liquiedkoeling is niet alleen een kwestie van leidingen. Het is een volledige keten van ontwerp, levering, operatie en servicemanagement. Datacenters die de volgende generatie AI willen ondersteunen, moeten verder kijken dan chips en opslag: ze moeten ook rekening houden met debieten, warmtewisselaars, sensoren, vloeistoffen en technisch personeel dat deze nieuwe omgeving veilig en betrouwbaar kan bedienen.

Veelgestelde vragen

Wat is een CDU in vloeistofkoeling?

Een CDU, of Coolant Distribution Unit, regelt de thermische overdracht, het debiet en de druk van het koelmiddel tussen de IT-racks en het koelsysteem van het datacenter.

Zal vloeistofkoeling alle luchtkoeling vervangen?

Niet op korte termijn. Vermoedelijk zullen ze naast elkaar bestaan: luchtkoeling voor conventionele workloads en vloeistofkoeling voor hoogdichte racks, AI, HPC en GPU-intensieve systemen.

Wat is het verschil tussen direct-to-chip en immersiekoeling?

Bij direct-to-chip wordt koelvloeistof via cold plates direct op chips aangebracht. Bij immersiekoeling onderdompelt men hele systemen of componenten in een dielektrische vloeistof die de warmte absorbeert.

Waarom heeft AI meer vloeistofkoeling nodig?

Omdat AI-versnellers veel kracht bundelen in een relatief kleine ruimte, waardoor de thermische dichtheid toeneemt. Dit maakt het afvoeren van warmte met alleen lucht moeilijk, en vloeistofkoeling efficiënter.

vía: LinkedIn

Scroll naar boven