IBM en Intel: Versnelling van Generatieve AI voor Bedrijven
In een strategische zet die het landschap van de bedrijfsintelegentie herschrijft, heeft IBM Cloud aangekondigd toegang te bieden tot de AI-versnellers Intel® Gaudi® 3. Dit maakt IBM de eerste cloudprovider die deze nieuwe generatie hardware implementeert. De lancering, die aanvankelijk beschikbaar is in de cloudregio’s Frankfurt, Washington D.C. en Dallas, markeert een belangrijke commerciële toepassing van Gaudi 3 en opent nieuwe mogelijkheden voor bedrijven die generatieve AI willen benutten zonder de hoge kosten van traditionele GPU-oplossingen.
Meer Prestaties, Lagere Kosten: Een Nieuwe Rekening voor AI
De grote belofte van Intel Gaudi 3 is om de economische drempel voor geavanceerde AI te doorbreken zonder in te boeten op prestaties. Volgens benchmarks van Signal65, in opdracht van Intel, biedt Gaudi 3 tot 92% meer kostenefficiëntie per prestatie bij het uitvoeren van modellen zoals Llama-3.1-405B-Instruct-FP8 in vergelijking met andere concurrerende platforms. Dit voordeel vergemakkelijkt niet alleen de toegang tot AI voor meer bedrijven, maar versnel ook de training, inferentie en fine-tuning van multimodale modellen en LLM’s, inclusief taken met grote contexten en RAG-architecturen (Retrieval-Augmented Generation).
“Door Intel Gaudi 3 in IBM Cloud te integreren, stellen we bedrijven in staat om hun generatieve AI-werkbelastingen te schalen met optimale prestaties voor zowel inferentie als fine-tuning,” aldus Saurabh Kulkarni, vice-president van AI-strategie bij Intel’s datacenters.
Data ondersteunen deze claim: in modellen zoals IBM Granite-3.1-8B-Instruct heeft Gaudi 3 aangetoond 43% meer tokens per seconde te verwerken in kleine workloads en 36% meer met brede contexten, wat resulteert in snellere uitkomsten en lagere operationele kosten.
AI voor Kritieke Sectoren en Gereguleerde Omgevingen
IBM Cloud is bekend om zijn focus op hoog gereguleerde sectoren zoals de banksector, verzekeringen, gezondheidszorg en overheidsinstanties. Nu, met Gaudi 3 als onderdeel van hun infrastructuur, kunnen deze sectoren profiteren van een efficiëntere, schaalbare en veilige AI-platform. Dit wordt ondersteund door technologieën zoals Red Hat OpenShift en de watsonx suite van IBM, waarvan de compatibiliteit deze kwartaal wordt verwacht.
Enkele veelvoorkomende toepassingen zijn onder andere:
- Fraudedetectie in financiële diensten.
- AI-ondersteunde diagnostiek en geneesmiddelontdekking in de gezondheidszorg.
- Automatisering van inventaris en personalisatie in de detailhandel.
- Modernisering van legacy toepassingen met geavanceerde veiligheidsstandaarden.
“Intel Gaudi 3 biedt onze klanten meer opties, meer vrijheid en een kosteneffectiever AI-platform,” verklaarde Satinder Sethi, algemeen directeur van IBM Cloud Infrastructure Services.
Beschikbaarheid en Flexibel Ontwerp
Klanten kunnen toegang krijgen tot Gaudi 3 via IBM Cloud Virtual Servers in VPC-omgevingen, met plannen om uit te breiden naar meerdere architecturen in de tweede helft van 2025. Dit model vergemakkelijkt een flexibele implementatie voor diegenen die AI-modellen willen uitproberen, schalen en fijn afstemmen in een veilige, private omgeving met hoge controle-niveaus.
Bovendien speelt deze strategie van IBM in op de explosieve groei die wordt verwacht voor generatieve AI: volgens Gartner zal de wereldwijde uitgave aan GenAI naar verwachting 644 miljard dollar bedragen in 2025, met een jaar-op-jaar groei van 76,4% vergeleken met 2024.
De implementatie van Intel Gaudi 3 in IBM Cloud is een belangrijke stap voorwaarts in het zakelijke toegang tot next-generation kunstmatige intelligentie. In een tijd waarin de vraag naar AI exponentieel groeit, wordt het verminderen van kosten, het verhogen van prestaties en het behouden van technologische soevereiniteit een topprioriteit. De samenwerking tussen IBM en Intel biedt bedrijven een reëel platform om te innoveren, experimenteren en hun digitale toekomst te transformeren.
Bron: Intel
