Intel Crescent Island: een AI-GPU met tot 480 GB LPDDR5X om schaarste van HBM te ontwijken

Intel presenteert meer details over Crescent Island, zijn komende GPU voor datacenters gerichte op AI-inferentie. Wat vooral opvalt, staat niet in de teraflops of de productie-node, maar in het geheugen: tot 480 GB LPDDR5X op een PCIe-kaart, gekoeld door lucht en verbruikkend 350 W.

Het is een opvallend voorstel omdat het afwijkt van de gangbare route bij high-end AI-versnellers. Terwijl NVIDIA en AMD inzetten op snel, duur en schaars HBM-geheugen, kiest Intel hier voor een andere marktbenadering: voor veel inferentietaken, vooral bij grote modellen en contextintensieve agenten, kunnen geheugencapaciteit en energie-efficiëntie belangrijker zijn dan extreme bandbreedte.

Een GPU ontworpen voor inferentie, niet voor de trainingsoorlog

Crescent Island moet niet worden gezien als een direct alternatief voor de krachtigste accelerators voor grootschalige modeltraining. Intel presenteert het als een datacenter-GPU voor inferentie en agentgebaseerde systemen, waarin het doel is om modellen te bedienen, veel tokens te verwerken, een breed contextvenster te behouden en dat alles te doen met een redelijke kosten-, verbruik- en capaciteitsverhouding.

De gekozen architectuur is Xe 3P, een evolutie van Intel’s grafische aanpak, aangepast aan moderne AI-belastingen. Het bedrijf verzekert dat Crescent Island een breed scala aan datavormen ondersteunt, van FP4 en MXFP4 tot FP64, waarmee zowel zeer geoptimaliseerde inferentie als meer veeleisende computationele en onderzoeksbelastingen kunnen worden afgedekt.

De vermelding van 480 GB LPDDR5X illustreert de kern van het product. Officiële informatie van Intel maakte eerst melding van 160 GB, maar tijdens Computex 2026 werd de maximale capaciteit verhoogd tot 480 GB. In een server met acht kaarten die maximaal geconfigureerd zijn, betekent dat 3,8 TB lokale GPU-geheugen, een zeer aantrekkelijke optie voor grote modellen of meerdere agenten in één chassis.

KenmerkIntel Crescent Island
SegmentDatacenter GPU voor AI
FocusInferentie en agent-gebaseerde workloads
ArchitectuurXe 3P
GeheugenTot 480 GB LPDDR5X
FormaatPCIe-kaart
KoelingLucht
Vermogensvraagspecificatie350 W
Ondersteunde formatenVan FP4/MXFP4 tot FP64
DoelgroepCapaciteit, efficiëntie en totale kosten

Waarom LPDDR5X zinvol kan zijn voor AI

De keuze voor LPDDR5X is een strategisch slimme zet. Deze geheugenvariant wordt vooral gebruikt in laptops, mobiele apparaten en compacte systemen, niet in high-performance AI-versnellers. Het heeft minder bandbreedte dan HBM, maar kan meer capaciteit bieden met een lager kostenplaatje en minder energieverbruik bij bepaalde ontwerpen.

Intel lijkt deze uitwisseling te accepteren. Voor het trainen van grote modellen blijft HBM de natuurlijke keuze vanwege de enorme bandbreedte en de nabijheid van het chipvlak. Maar bij inferentie, waar veel belastingen grote modellen in geheugen plaatsen, brede contextvensters nodig zijn en efficiëntie in verzoekafhandeling belangrijk is, kan het ontbreken van geheugen een groter probleem zijn dan het maximale bandbreedtepotentieel.

De beperkte beschikbaarheid van HBM verklaart wellicht de focus op LPDDR5X. De vraag van NVIDIA, AMD en grote AI-hyper schaalbedrijven onder drukt de hele geheugenketen. Fabrikanten als SK hynix, Samsung en Micron beschikken over beperkte capaciteit voor de nieuwste HBM, en een groot deel van de productie is al gereserveerd voor grote klanten. Door te kiezen voor LPDDR5X kan Intel eenvoudiger te produceren hardware ontwikkelen, die mogelijk toegankelijker is voor bedrijven die geen high-end systemen willen of kunnen aanschaffen.

Dit is met name relevant voor inferentieaanbieders, bedrijven met on-premise implementaties, middelgrote datacenters en organisaties die modellen willen draaien zonder de hoge kosten van topgereed apparatuur. Een PCIe-kaart van 350 W, gekoeld door lucht, past beter in traditionele 4U of 5U servers dan in duurdere, vloeistofgekoelde AI-apparaten met hoge densiteit.

Geheugen is nu net zo belangrijk als de chip zelf

Crescent Island verschijnt op een moment dat de industrie erkent dat AI niet louter schaalbaar is door meer rekenkracht. Grote modellen vereisen geheugen, bandbreedte, snelle netwerken, opslag, CPU’s die workloads kunnen orchestreren en slimme software. Als een onderdeel faalt, vermindert de echte prestaties, ongeacht hoe krachtig de chip op papier is.

Intel onderstreept juist die systeemgerichte aanpak. Naast Crescent Island heeft het bedrijf Xeon 6+ gepresenteerd met tot 288 efficiënte cores, gebaseerd op Intel 18A-technologie, en nieuwe Ethernet-oplossingen E835 tot 200 GbE. De kernboodschap is dat in agentgebaseerde AI de CPU weer een belangrijke rol speelt als besturingsplan, dat het netwerk knelpunten vermindert en dat de GPU efficiënt en met voldoende geheugen inferentie moet uitvoeren.

Dit verduidelijkt ook de positionering van Crescent Island binnen Intel’s assortiment. Het bedrijf richt zich niet op het domineren van de markt voor AI-accelerators, waar NVIDIA de markt domineert en AMD druk uitoefent. Gaudi was een interessante kosteneffectieve en efficiënte optie, maar wist de CUDA-ecosysteem niet substantieel te verdrijven. Crescent Island probeert het op een andere manier: niet enkel door brute kracht te bieden, maar door een combinatie van groot geheugen, eenvoudiger formaat, matig verbruik en open softwarestack.

Intel belooft dat haar AI-stack programmeerbaar, open en laagdrempelig is voor implementatie. Daarnaast wordt genoemd dat de Arc Pro-familie als ontwikkelplatform kan dienen om workloads te valideren en te prepareren op basis van Xe voordat ze naar Crescent Island worden gebracht. Softwarecompatibiliteit blijft hierbij een sleutel tot succes, want zonder goed ontwikkelde software heeft krachtige hardware weinig waarde in AI-toepassingen.

Een alternatief voor bedrijven die niet voor het “top” NVIDIA-model willen gaan

De grootste uitdaging voor Intel ligt niet in het overtuigen dat meer geheugen nodig is — dat is duidelijk — maar in het aantonen dat Crescent Island in staat is om echte modellen met goede prestaties uit te voeren, te integreren in bestaande frameworks, stabiel te blijven in productie en competitief te zijn tegenover NVIDIA, AMD en gespecialiseerde acceleratoren.

NVIDIA’s voordeel ligt nog steeds in CUDA, bibliotheken, tools, optimalisaties, cloudintegraties en de enorme ontwikkelaarsgemeenschap. AMD ontwikkelt voort met Instinct en ROCm, vooral bij grote klanten die willen diversifiëren. Intel moet snel haar geloofwaardigheid in AI-acceleratie herwinnen na jaren van strategiewisselingen, productvervalsing en uitgestelde producten.

Crescent Island kan een marktnis invullen, nu de markt zich meer onderscheidt tussen extreem trainen en efficiënte inferentie. Niet alle bedrijven moeten grote modellen trainen; velen willen bestaand getrainde modellen uitvoeren, workloads aanpassen, agenten hosten, gebruikers bedienen en kosten binnen de perken houden. Voor die toepassingen kan een GPU met veel geheugen, PCIe, gekoeld door lucht en 350 W aantrekkelijk zijn.

Ook speelt lokale deployment en soevereiniteit een rol. Organisaties willen niet altijd afhankelijk zijn van externe API’s of publieke cloud voor gevoelige workloads. Het draaien van modellen op eigen servers vereist hardware met voldoende geheugen en een beheersbaar energieverbruik. Als Crescent Island een goede prijs, beschikbaarheid en support biedt, kan het een oplossing zijn voor bedrijfsinfrastructuren die AI intern willen draaien zonder een supercomputer te bouwen.

De belangrijkste vraag blijft het prestatieniveau. Intel heeft nog geen volledige metriek of gedetailleerde beschikbaarheid gepubliceerd, afgezien van de roadmap. De indrukwekkende capaciteit in geheugen zal wachten op data over tokens per seconde, echte efficiëntie, latentie, modelondersteuning, frameworkcompatibiliteit en kosten per inferentie.

Crescent Island is waarschijnlijk niet bedoeld om NVIDIA te verslaan in de topcategorie. Haar ambitie lijkt realistischer: een andere invuurlijn te bieden voor AI-inferentie, met veel geheugen en minder afhankelijkheid van HBM. In een markt waar geheugen een schaars goed wordt, kan die strategie meer zoden aan de dijk zetten dan men enkele jaren geleden zou verwachten.

Veelgestelde vragen

Wat is Intel Crescent Island?
Crescent Island is een datacenter-GPU van Intel voor AI-inferentie en agent-gebaseerde workloads, gebaseerd op de Xe 3P architectuur.

Waarom gebruikt het LPDDR5X in plaats van HBM?
LPDDR5X biedt minder bandbreedte dan HBM, maar kan veel capaciteit, lager energieverbruik en lagere kosten bieden. Intel gebruikt dit voor inferentietaken waar geheugen groot belang heeft.

Hoeveel geheugen kan Crescent Island hebben?
Intel heeft aangekondigd dat Crescent Island tot 480 GB LPDDR5X kan bevatten, tegen de eerder genoemde 160 GB.

Gaat het rechtstreeks concurreren met de krachtigste NVIDIA-GPU’s?
Niet direct voor massale training. Het richt zich vooral op inferentie, efficiëntie, geheugen en zakelijke deploys met luchtkoeling.

Scroll naar boven