Etched verkoopt zich anoniem met 800 miljoen en een inferentiechip om te concurreren in AI

Etched heeft de sluimerstand achter zich gelaten met een van de meest agressieve marktbenaderingen in hardware voor kunstmatige intelligentie: 800 miljoen dollar aan financiering, meer dan 1 miljard dollar aan klantcontracten en een werkende chip vervaardigd met het N4P-proces van TSMC. De opstart uit San José wil niet alleen een versneller verkopen, maar complete inferentie-clusters bouwen, ontworpen vanaf het siliconen tot de rack, software, koeling en productie.

Het bedrijf komt op een moment dat AI een nieuwe knelpuntfase ingaat. Het trainen van enorme modellen blijft duur, maar de druk verschuift nu sterk richting inferentie: het uitvoeren van deze modellen miljoenen keren per dag, met lage latency, goede kosten per token en acceptabel stroomverbruik. Elke agent, copiloot, chatbot, bedrijfszoekmachine of toepassing met taalmodellen maakt inferentie tot een continu te verbeteren infrastructuurprobleem.

Etched stelt dat hun eerste siliconen, de A0, al terugkwam van TSMC in N4P en dat ze hun eerste rack-schaalproduct valideren met klanten, waarmee meer dan 1 miljard dollar aan contracteisen worden uitgerold. Ze beloven dat de eerste racks deze zomer verzonden zullen worden en dat de productie reeds gestart is.

Een startup die clusteren wil verkopen, niet alleen chips

Het aankondigen van Etched is belangrijk omdat het afwijkt van de traditionele boodschap: “Wij hebben een snellere ASIC”. Het bedrijf spreekt over frontier inference clusters, een categorie waarin de prestaties afhankelijk zijn van meerdere componenten tegelijk: chip, package, geheugen, printplaat, connectiviteit, koeling, serving software, simulatie, testen en fabricagecapaciteit.

Volgens de informatie die door het bedrijf zelf is gedeeld, beschikt Etched over meer dan 400 ingenieurs afkomstig van bedrijven zoals NVIDIA, Google TPUs, Broadcom, SK Hynix en TSMC. Ze hebben 800 miljoen dollar opgehaald in vier niet-gehypete financieringsrondes, waaronder strategische investering van VentureTech Alliance, een entiteit verbonden aan TSMC.

De laatste financieringsronde was een serie van 500 miljoen dollar, wat de waardering na financiering op 5 miljard dollar bracht, aldus Data Center Dynamics. Onder de investeerders en supporters bevinden zich grote namen uit financiën en technologie, zoals Jane Street, Hudson River Trading, Stripes, Radical Ventures, Primary VC, Peter Thiel, Geoffrey Hinton en Andrej Karpathy.

Gepubliceerde gegevensDetails
Totale financiering800 miljoen dollar
Laatste ronde500 miljoen dollar
Post-money waardering5 miljard dollar
KlantencontractenMeer dan 1 miljard dollar
FabricageprocesTSMC N4P
TeamMeer dan 400 ingenieurs
FocusRack-schaal inferentie-clusters

Etched meldt ook dat ze een fabriek in Taiwan hebben opgebouwd en een 2 MW datacenter, een testcentrum en een prototype laboratorium in Californië hebben gerealiseerd. Details over deze faciliteiten zijn beperkt, maar de boodschap is duidelijk: ze willen meer controle over de overgang van ontwerp naar productie.

Low Voltage Inference en geheugen op clusterniveau

De technische kern van de aankondiging draait om twee ideeën. Het eerste is Low Voltage Inference (LVI). Etched beweert dat veel AI-chips niet hun theoretisch maximale FLOPs kunnen benutten omdat de stroomconsumptie bij hogere belasting toeneemt en thermisch throttling optreedt. Hun architectuur streeft ernaar om mathematische blokken onder de helft van het gebruikelijke spanningsniveau uit te voeren, zodat aggregaatdichtheid en continuously prestaties versterkt worden zonder thermisch limiet.

Volgens Etched kunnen ze MoE-verdeelde modellen met biljoenen parameters uitvoeren met meer dan 80% van de piek FLOPs zonder thermal throttling. Hoewel dit een veelbelovende claim is, moet het nog door onafhankelijke validaties en vergelijkbare publieke gegevens worden bevestigd. Van Etched wordt verwacht dat ze deze zomer meer details over prestaties en roadmap delen.

Het tweede idee is Cluster Scale Memory (CSM). Etched ontwikkelt een gedeeld, lage-latentie geheugen op clusterniveau, ondersteund door een eigen zeer lage latentie en hoge bandbreedte interconnectie. Ze streven naar een hybride ontwerp van HBM en SRAM dat twee problemen tegelijk oplost: geheugen capaciteit en latentie in geheugenketens.

Dit richt zich direct op de hedendaagse inferentiekwesties. Bij grote modellen hangt de performantie niet alleen af van de rekenkracht, maar ook van datatransfertijd, optimalisatie van pre-fill en decode– transacties, langgerekte contexten en het behoud van lage kosten bij interactieve modellgebruik.

Waarom inferentie de grote business wordt

De kernboodschap van Etched is dat de huidige infrastructuur niet optimaal is voor het duurzaam en kosteneffectief bedienen van grensmodelletjes. Gavin Uberti, medeoprichter en CEO, stelt dat AI snel geïntegreerd wordt in diverse industrieën en toepassingen, waardoor de behoefte aan geavanceerde inferentie-infrastructuur toeneemt.

Het logic volgt. Training krijgt de meeste media-aandacht omdat het enorme clusterecosystemen en miljardenbudgets vereist. Maar inferentie is de kern van dagelijkse toepassingen. Een model dat reageert op gebruikers, agents of interne systemen kost elke keer dat het wordt uitgevoerd. Hoge latency verslechtert de gebruikerservaring, hoge kosten per token verkleinen de marges en niet-schalen op hardwareniveau beperkt de groeipotentie.

Daarom ontstaan er meer gespecialiseerde voorstellen. Sommige richten zich op eenvoudige, efficiënte chips voor een specifieke modelfamilie. Andere focussen op geheugen dat dicht bij de compute ligt. Weer anderen proberen afhankelijkheid van algemene GPU’s te verminderen. Etched onderscheidt zich door een volledige systeembenadering: geïntegreerd ontwerp van chip, rack, software en productie.

De uitdaging is dat concurreren met NVIDIA meer inhoudt dan een chip. Het gaat om CUDA, networking, HGX/DGX-systemen, libraries, cloudproviders, integrators, support en een grote ontwikkelaarsgemeenschap. Etched lijkt dat te doorzien, want zij positioneren zich niet als een chipfabrikant, maar als een infrastructuurbedrijf.

Productie als kernproduct

Een van de meest intrigerende uitspraken komt van Rob Wachen, medeoprichter van Etched: “Productie is het product”. Deze uitspraak vat de marktstand van nu goed samen. In AI is een briljante architectuur weinig waard als het niet op grote schaal kan worden ontwikkeld, getest, geïmplementeerd en geëxploiteerd.

Dat is het terrein waar veel chip-startups uitdagingen ondervinden. Een succesvolle tape-out is complex, het yielden, verpakken, rack-validatie, supply chain afronden, cloudklanten aantrekken, software onderhouden en planning nakomen maken het nog moeilijker.

Etched beweert samen te werken met klanten, cloudproviders en hyperscalers op co-design-vlakken en racks te hebben getest in datacenters, met gebruik van simulators die enorme verkeerspatronen nabootsen. Hoewel deze claims veelbelovend zijn, zal de markt wachten op concrete resultaten, publieke benchmarks en echte implementaties voordat de werkelijke voorsprong zichtbaar wordt.

De intrede van Etched verhoogt de druk op een zeer snel evoluerende markt. De eerste fase van generatieve AI werd gedomineerd door GPU’s. De volgende fase wordt mogelijk gekenmerkt door wie de kosten voor het dienen van grote modellen kan reduceren zonder in te boeten op latency en schaalbaarheid.

Etched brengt geld, contracten, een functionerende chip en toptechnisch talent. Het moet echter nog aantonen dat het op grote schaal kan produceren, presteren en betrouwbaar opereren. Desalniettemin bevestigt de komst dat inferentie niet meer als een secundair onderdeel van AI wordt gezien, maar als een zelfstandige infrastructuurcategorie, ontwikkeld met chips, racks en architecturen die specifiek bedoeld zijn voor massaal gebruik van geavanceerde modellen.

Veelgestelde vragen

Wat heeft Etched aangekondigd?
Etched heeft de sluimerstand verlaten met 800 miljoen dollar opgehaald, meer dan 1 miljard dollar aan klantcontracten en een werkbare chip gemaakt met TSMC N4P.

Wat voor soort product ontwikkelt het?
Het bedrijf bouwt niet alleen chips, maar complete inferentie-clusters voor AI, waarbij siliconen, racks, software, geheugen, koeling en interconnectie worden geïntegreerd.

Wat is Low Voltage Inference?
Een architectuur die probeert om rekenblokken te laten werken onder minder dan de helft van de gebruikelijke spanning om zo meer prestaties te halen zonder thermisch throttling.

Wat is Cluster Scale Memory?
Een aanpak voor gedeeld geheugen met lage latentie op clusterniveau, met HBM en SRAM gecombineerd via een eigen zeer lage latentie en breedte-bandbreedte interconnectie.

Kan Etched concurreren met NVIDIA?
Het is nog te vroeg om dat te zeggen. Ze beschikken over financiering, talent en contracten, maar moeten nog prestaties en productie aantonen en grote, echte implementaties realiseren tegen een sterk gevestigde NVIDIA-omgeving.

Scroll naar boven