TensorWave Lanceert Grootste AMD GPU Clustervan Noord-Amerika voor AI Training met 8.192 MI325X Accelerator en Directe Vloeistofkoeling

TensorWave versterkt inzet voor AMD-alternatief in grootschalige kunstmatige intelligentie

In een opvallende zet heeft de infrastructuurstartup voor kunstmatige intelligentie, TensorWave, het grootste AMD GPU-trainingscluster in heel Noord-Amerika uitgerold. Het cluster bestaat uit maar liefst 8.192 Instinct MI325X versnellingskaarten en is uitgerust met een directe vloeiboekkoeling – een primeur op deze schaal. Dit systeem vertegenwoordigt niet alleen een technische mijlpaal, maar dient ook als een krachtig bewijs voor het AMD-ecosysteem in een markt die vrijwel uitsluitend door NVIDIA wordt gedomineerd.

TensorWave deelde beelden van het cluster via het sociale netwerk X (voorheen Twitter), waar de hoge dichtheid van rekken en de feloranje koelingslussen duidelijk zichtbaar zijn. Het systeem is al volledig operationeel en biedt on-demand cloud-trainingscapaciteit aan zakelijke klanten.

MI325X-architectuur: ongekende kracht en bandbreedte

De AMD Instinct MI325X, die eind 2024 werd gepresenteerd, markeert de meest ambitieuze poging van AMD om de AI-versnellingsmarkt te betreden. Dit model werd in juni 2025 opgevolgd door de MI350X en MI355X. Elke MI325X is uitgerust met 256 GB HBM3e-geheugen, heeft een bandbreedte van 6 TB/s en kan tot 2,6 PFLOPS berekeningen in FP8 uitvoeren dankzij het chiplet-ontwerp met 19.456 streamkernen op een snelheid van 2,10 GHz.

Hoewel de GPU van AMD niet de schaal kan evenaren van NVIDIA’s oplossingen zoals de H100 of H200 (met slechts 8 GPU’s per node in vergelijking met 72 van de concurrentie), heeft TensorWave gekozen voor een andere benadering: thermische dichtheid en efficiëntie per rek.

Het volledige cluster genereert meer dan 2 PB/s aan aggregaatbandbreedte en kan een theoretische piekprestaties van 21 exaFLOPS in FP8 bereiken, met de werkelijke prestaties die zullen afhangen van de efficiëntie van modelparallelisme en de architectuur van de interconnectie.

Directe vloeiboekkoeling: sleutel tot schaalvergroting naar 1.000W per GPU

Elke MI325X GPU verbruikt ongeveer 1.000 watt, wat het onhaalbaar maakt om op grote schaal luchtkoeling te gebruiken. Daarom heeft TensorWave een directe vloeiboekkoeling oplossing geïmplementeerd, met koudeplaten die direct op elke versneller zijn aangesloten en op maat gemaakte koelvloeistoflussen.

Dit maakt het mogelijk om optimale temperaturen te handhaven zonder de gebruikelijke 16-pins connectors of enorme ventilatiesystemen. Bovendien bereidt dit de weg voor de toekomstige inzet van GPUs zoals de MI350X, die naar verwachting een TDP van tot 1.400 watt per eenheid zal bereiken, dankzij de verbeteringen aangebracht door de CDNA 4-architectuur.

Strategische ondersteuning en lange termijn visie

Deze uitrol vindt plaats slechts twee maanden nadat TensorWave een Serie A-financiering van 100 miljoen dollar heeft afgerond, geleid door AMD Ventures en het Magnetar Capital-fonds. In tegenstelling tot de meeste cloudaanbieders die bouwen op NVIDIA-hardware, heeft TensorWave ingezet op AMD vanwege niet alleen kostenoverwegingen, maar ook omdat ze geloven dat het ROCm (Radeon Open Compute) ecosysteem nu voldoende volwassen is voor grootschalige training.

Toch blijft NVIDIA de markt domineren met zijn CUDA-ecosysteem, dat aanwezig is bij giganten als AWS, CoreWeave en Microsoft Azure. Maar het initiële succes van TensorWave markeert een kantelpunt in de diversificatie van opties voor hyper-schaal AI-training.

De toekomst: MI350X, FP4 en de consolidatie van AMD

TensorWave heeft duidelijk gemaakt dat dit slechts de eerste fase van hun uitrol is. In de tweede helft van 2025 verwachten ze de MI350X GPU’s te integreren, die ondersteuning bieden voor nieuwe precisies FP4 en FP6, met hogere bandbreedtes en thermische eisen die alleen kunnen worden voldaan met vloeiboekkoeling.

Met meer dan 8.000 AMD GPU’s die daadwerkelijk in gebruik zijn onder trainingsbelasting, positioneert het bedrijf zich als een referentie voor klanten die op zoek zijn naar concurrerende alternatieven voor NVIDIA, zowel qua kosten als qua thermische efficiëntie. Bovendien kan dit project als voorbeeld dienen voor andere spelers die geïnteresseerd zijn in duurzame en schaalbare AI-oplossingen.

Bron: tomshardware

Scroll naar boven