Amazon Web Services (AWS), een bedrijf van Amazon.com (NASDAQ: AMZN), en NVIDIA (NASDAQ: NVDA) hebben vandaag de toevoeging van het nieuwe NVIDIA Blackwell GPU-platform aan AWS aangekondigd. Dit initiatief biedt de NVIDIA GB200 Grace Blackwell Superchip en de B100 Tensor Core GPU’s, en verlengt de langdurige strategische samenwerking tussen de bedrijven om de meest geavanceerde en veilige infrastructuur, software en diensten te bieden, en helpt klanten nieuwe generatieve kunstmatige intelligentie (AI) mogelijkheden te ontgrendelen.
NVIDIA en AWS combineren het beste van hun technologieën, inclusief de nieuwste multi-node systemen van NVIDIA gebaseerd op het NVIDIA Blackwell-platform en AI-software, het Nitro-systeem van AWS en de geavanceerde key management service AWS KMS, het petabit-schaal Elastic Fabric Adapter (EFA)-netwerk en de hyperscale clusteropschaling van Amazon Elastic Compute Cloud (Amazon EC2) UltraCluster. Samen bieden ze de infrastructuur en hulpmiddelen die klanten in staat stellen om real-time inferentie op grote taalmodellen (LLMs) met multitriljoenen parameters sneller, op grotere schaal en tegen lagere kosten te bouwen en uit te voeren dan met de vorige generatie NVIDIA GPU’s op Amazon EC2.
“De hechte samenwerking tussen onze twee organisaties gaat meer dan 13 jaar terug, toen we samen ’s werelds eerste GPU cloud-instantie op AWS lanceerden, en vandaag bieden we het breedste scala aan NVIDIA GPU-oplossingen aan klanten”, zei Adam Selipsky, CEO van AWS. “De Grace Blackwell processor van de volgende generatie van NVIDIA markeert een belangrijke stap vooruit in generatieve AI en GPU-computing. In combinatie met het krachtige Elastic Fabric Adapter-netwerk van AWS, de hyperscale clustering van Amazon EC2 UltraClusters en onze geavanceerde virtualisatie- en beveiligingsmogelijkheden van het Nitro-systeem, maken we het mogelijk voor klanten om multitriljoenen parameter grote taalmodellen sneller, op een grotere schaal en veiliger te bouwen en uit te voeren dan ergens anders. Samen blijven we innoveren om van AWS de beste plek te maken om NVIDIA GPU’s in de cloud te draaien.”
“AI drijft vooruitgang aan op een ongekend tempo, wat leidt tot nieuwe toepassingen, bedrijfsmodellen en innovaties in alle industrieën”, zei Jensen Huang, oprichter en CEO van NVIDIA. “Onze samenwerking met AWS versnelt nieuwe generatieve AI-mogelijkheden en biedt klanten een ongeziene rekenkracht om de grenzen van het mogelijke te verleggen.”
AWS zal het NVIDIA Blackwell-platform aanbieden, dat de GB200 NVL72 bevat met 72 Blackwell GPU’s en 36 Grace CPU’s die verbonden zijn via NVIDIA’s vijfde generatie NVLink. Verbonden met het krachtige Amazon-netwerk (EFA) en ondersteund door geavanceerde virtualisatie (AWS’s Nitro-systeem) en hyperscale clustering (Amazon EC2 UltraClusters), kunnen klanten opschalen naar duizenden GB200 Superchips. NVIDIA Blackwell op AWS biedt een enorme vooruitgang in de versnelling van inferentiewerklasten voor intensieve, multitriljoenen parameter taalmodellen.
Gebaseerd op het succes van de EC2 P5-instanties aangedreven door NVIDIA H100 die beschikbaar zijn voor klanten via Amazon EC2-capaciteitsblokken voor ML, plant AWS om EC2-instanties met de nieuwe B100 GPU’s aan te bieden die ingezet worden in EC2 UltraClusters om generatieve AI-training en -inferentie op grote schaal te versnellen. De GB200 zal ook beschikbaar zijn op NVIDIA DGXâ„¢ Cloud, een AI-platform dat samen met AWS is ontwikkeld, dat zakelijke ontwikkelaars toegewijde toegang biedt tot de infrastructuur en software die nodig zijn om geavanceerde generatieve AI-modellen te bouwen en te implementeren. De door Blackwell aangedreven DGX Cloud-instanties op AWS zullen de ontwikkeling van toonaangevende generatieve AI en grote taalmodellen die meer dan 1 biljoen parameters kunnen bereiken, versnellen.
Dit project bevestigt het commitment van AWS en NVIDIA om de ontwikkeling van generatieve AI-toepassingen te versnellen en gebruiksscenario’s in de gezondheidszorg en life sciences te bevorderen, en verbetert de AI-veiligheid met het AWS Nitro-systeem, AWS KMS, versleutelde EFA en Blackwell-versleuteling. Met Project Ceiba streven NVIDIA en AWS ernaar de innovatie van generatieve AI te bevorderen door het bouwen van een van ’s werelds snelste AI-supercomputers, exclusief gehost op AWS. Deze ongekende supercomputer, beschikbaar voor onderzoek en ontwikkeling door NVIDIA, zal de GB200 NVL72-systeem gebruiken, met 20.736 B200 GPU’s gekoppeld aan 10.368 NVIDIA Grace CPU’s, verbonden via het vierde generatie EFA-netwerk, dat tot 800 Gbps per Superchip van lage-latentie, hoge-bandbreedte netwerk biedt — in staat om een massieve 414 exaflopsEen exaflop is een meeteenheid in supercomputing die … aan AI te verwerken—, een prestatieverbetering die zes keer groter is dan eerdere plannen om Ceiba te bouwen op de Hopper-architectuur. De onderzoeks- en ontwikkelingsteams van NVIDIA zullen Ceiba gebruiken om AI voor grote taalmodellen, graphics (beeld-/video-/3D-generatie) en simulatie, digitale biologie, robotica, zelfrijdende auto’s, klimaatvoorspellingsmodellen NVIDIA Earth-2 en meer te bevorderen, om NVIDIA te helpen toekomstige innovaties in generatieve AI te stimuleren.
Bovendien werken AWS en NVIDIA samen aan het versnellen van de ontwikkeling van generatieve AI-toepassingen en bevorderen van gebruiksscenario’s in de gezondheidszorg en life sciences. Ze bundelen hun krachten om high-performance, lage-kosten infrastructuur voor generatieve AI-inferentie aan te bieden met de integratie van Amazon SageMaker met de NVIDIA NIMâ„¢ inferentiemicroservices, beschikbaar met NVIDIA AI Enterprise. Klanten kunnen deze combinatie gebruiken om snel Foundation Models (FMs) vooraf te compileren en te optimaliseren om uit te voeren op NVIDIA GPU’s in SageMaker, waardoor de time-to-market voor generatieve AI-toepassingen wordt verkort.
AWS en NVIDIA hebben ook samengewerkt om de ontdekking van door computers ondersteunde geneesmiddelen uit te breiden met nieuwe NVIDIA BioNeMoâ„¢ FMs voor generatieve chemie, voorspelling van eiwitstructuren en begrip van hoe geneesmiddelen interageren met doelwitten. Deze nieuwe modellen zullen binnenkort beschikbaar zijn op AWS HealthOmics, een specifiek ontworpen service die zorg- en levenswetenschappelijke organisaties helpt genomics, transcriptomics en andere omics-gegevens op te slaan, te bevragen en te analyseren.
De teams van AWS HealthOmics en NVIDIA Healthcare werken ook samen om generatieve AI-microservices te lanceren om de ontdekking van geneesmiddelen, medtech en digitale gezondheid te bevorderen, door een nieuwe catalogus van door GPU’s versnelde cloud-eindpunten voor biologie, chemie, beeldvorming en gezondheidsgegevens te bieden, zodat zorgbedrijven kunnen profiteren van de nieuwste ontwikkelingen in generatieve AI op AWS.