Op de Hot Chips 2024 conferentie, gehouden in Palo Alto, Californië, heeft IBM zijn nieuwe Spyre-versnellerchip onthuld, ontworpen om de kunstmatige-intelligentiecapaciteiten (AI) in zijn IBM Z-systemen te verbeteren. Deze baanbrekende technologie, ontwikkeld in samenwerking met IBM Research, belooft de verwerking van AI-workloads in zakelijke omgevingen te revolutioneren door een ongekende prestatie te leveren.
Een Kwantum Sprong in AI-Architectuur
De Spyre is de evolutie van de AI-chip die IBM in 2022 introduceerde met de IBM z16, die de Telum-microprocessor bevatte, een geïntegreerde AI-versneller voor inferenties in real-time. De nieuwe Spyre-chip brengt deze technologie naar het volgende niveau door 32 versnellingskernen en een geavanceerde architectuur met 25,6 miljard transistors te integreren.
De Spyre maakt gebruik van een 5 nm-procestechnologie en is gemonteerd op een PCIe-kaart. Dit ontwerp maakt het mogelijk om kaarten te clusteren, wat betekent dat een enkele IBM Z-machine kan worden uitgerust met clusters van Spyre-kaarten om tot 256 extra versnellingskernen toe te voegen.
Optimalisatie en Schaalbaarheid voor Bedrijven
Met ongeveer 70% van de wereldwijde transactiewaarde die wordt beheerd door IBM-mainframes, heeft de Spyre het potentieel om generatieve AI naar deze kritieke systemen te brengen. Deze chip is ontworpen om bedrijven te helpen hun AI-capaciteiten op te schalen zoals nodig, waardoor het mogelijk wordt om AI-modellen en programma’s met grotere kracht en efficiëntie te implementeren.
De Spyre verbetert niet alleen de prestaties ten opzichte van standaard CPU’s, maar maakt ook gebruik van een chipontwerp dat is geoptimaliseerd voor AI-taken. In tegenstelling tot traditionele architecturen, die constant gegevens overdragen tussen de verwerkingseenheid en het geheugen, stelt de Spyre in staat om gegevens rechtstreeks over te dragen tussen rekeneenheden, wat resulteert in energiebesparing en grotere efficiëntie.
Toepassingen en Toekomstige Mogelijkheden
De Spyre zal nieuwe mogelijkheden openen voor het gebruik van AI in IBM Z-systemen. Naast fraude detectie in transacties, zou een systeem uitgerust met een cluster van Spyre meer complexe AI-modellen kunnen gebruiken om ingewikkelde fraudepatronen te identificeren die door minder geavanceerde modellen over het hoofd zouden kunnen worden gezien.
Daarnaast zal de Spyre een diepere integratie mogelijk maken met producten zoals Watsonx, het AI- en gegevensplatform van IBM. Bijvoorbeeld, het maakt het mogelijk om Watsonx Code Assistant uit te voeren om mainframe-codebases met een veel grotere efficiëntie te moderniseren, waardoor het begrijpen en updaten van de code van applicaties vergemakkelijkt wordt.
Een Veelbelovende Toekomst voor AI in Mainframes
Deze ontwikkeling markeert slechts het begin van wat IBM Research voorziet voor AI in IBM Z. Het onderzoeksteam werkt eraan om de huidige grenzen van inferentie te overschrijden en effectieve manieren te verkennen voor het finetunen en zelfs trainen van modellen direct op de mainframes. De visie is om organisaties in staat te stellen modellen te trainen en te implementeren op platforms zoals Watsonx binnen hun eigen faciliteiten, terwijl alle data veilig en op zijn plaats worden gehouden.
Met de Spyre opent IBM een nieuw hoofdstuk in de verwerking van AI voor bedrijven en biedt het krachtige oplossingen om complexe uitdagingen aan te gaan en te verzekeren dat AI-capaciteiten binnen het bereik liggen van organisaties die maximale beveiliging en prestaties vereisen.
Bron: IBM
