Niet Alles Is Rubin: Positron AI Belegt de Voordelen van Air-Cooled voor AI met 2–5× Meer Efficiëntie dan NVIDIA bij Inferentie

Positron AI Uitdagingen de Dominantie van NVIDIA in de AI-Hardware Markt

Amsterdam, 2023 – Terwijl NVIDIA de leiding heeft over de AI-hardware met zijn nieuwe generatie platforms, waaronder Blackwell en Rubin, komt Positron AI met een ander geluid. CEO Mitesh Agarwal beweert dat er ruimte is voor goedkopere en efficiëntere alternatieven, met een focus op inferentie voor luchtgekoelde datacenters, in tegenstelling tot de vloeistofkoeling die de nieuwste NVIDIA GPU’s vereisen.

Duurzaamheid en Kostenefficiëntie

Positron AI heeft zijn nummers met de accelerators Atlas en Asimov, die volgens Agarwal tot vijf keer minder energie verbruiken dan NVIDIA GPU’s voor inferentietaken. “95% van de huidige capaciteit draait op luchtkoeling. Rubin en Blackwell vragen om nieuwe infrastructuur; wij bevestigen waar al gebouwd is,” zegt Agarwal. De boodschap is gericht op hyperscalers en cloudproviders die al hun datacenters willen optimaliseren zonder aanzienlijke investeringen.

De Voordelen van Luchtkoeling

Agarwal stelt dat momenteel de kosten voor het bouwen van een vloeistofgekoeld datacenter 40-50% hoger liggen en aanzienlijke tijd vergen om te realiseren. Voor stedelijke gebieden met beperkte stroomcapaciteit, zoals in de VS en Europa, biedt luchtkoeling een veel snellere oplossing: “Als de accelerator binnen een luchtgekoeld systeem past en goed presteert, kunnen we nu voldoen aan de vraag zonder te wachten op goedkeuringen of nieuwe elektriciteitsinfrastructuur.”

Technische Beweerbaarheid

Positron’s technische claims zijn eenvoudig in te prenten:

  • Energieverbruik per chip: < 200 W in basisontwerpen en ~ 400 W in superieure configuraties.
  • Efficiëntie: 2-5 keer beter dan een NVIDIA GPU in inferentie.
  • Kosten-effectiviteit: ≈ 3,5× in vergelijking met NVIDIA’s Hopper, tot 5× bij geheugenintensieve taken.
  • ROI: Terugverdientijden van 15-16 maanden voor Atlas, met nog betere cijfers voor de Asimov.

Vermijden van Beperkingen

Agarwal geeft ook aan dat een aanzienlijk deel van de bottleneck in de industrie ligt bij geavanceerde verpakkingen en HBM-geheugen. Positron heeft een eigen geheugenarchitectuur ontwikkeld waarmee ze minder afhankelijk zijn van de productiecapaciteit van concurrenten als NVIDIA en AMD. Dit moet hun mogelijkheden om te schalen optimaliseren.

Concurrentie van NVIDIA en Ander Bedrijven

Met de introductie van NVIDIA’s Rubin CPX, dat gericht is op prefill (tokeninvoer), vraagt men zich af hoe dit het terrein van Positron beïnvloedt. Agarwal is echter niet bezorgd: “Decoding — het omzetten van code, video en lange generaties — is waar de kosten liggen, en daar optimaliseren we.”

Gebruikstoepassingen

Positron richt zich op bestaande datacenters die extra rekencapaciteit nodig hebben zonder aanzienlijke investeringen in nieuwe infrastructuur. Klanten zoals Cloudflare, die beperkt zijn in de vraag naar meer energie van stedelijke netwerken, zouden baat hebben bij de oplossingen van Positron.

Waakzaam Blijven

Er zijn echter enkele voorbehouden. De cijfers voor Rubin en de capaciteit van Asimov zijn nog niet bevestigd door de betreffende bedrijven. Ook zal de vraag naar vloeistofkoeling waarschijnlijk blijven toenemen.

Conclusie

In een markt die steeds meer neigt naar vloeistofkoeling en hogere efficiëntie, pakt Positron AI de uitdaging aan door te focussen op bestaande infrastructuur. Met beloftes van snellere terugverdientijden en goede prestaties in inferentie, mikt het bedrijf op een niche die door concurrenten mogelijk wordt over het hoofd gezien. Positron beweegt zich in de schaduw van de grote spelers, maar met hun benadering zouden ze wel eens een flinke impact kunnen maken.

Scroll naar boven