AMD heeft de lancering aangekondigd van ROCm 6.3, de nieuwste versie van hun open source softwareplatform ontworpen om kunstmatige intelligentie (AI) en high-performance computing (HPC) workloads te optimaliseren. Deze update bevat een reeks geavanceerde tools en verbeteringen die beloven de prestaties, schaalbaarheid en efficiëntie te verhogen voor ontwikkelaars en bedrijven die werken in concurrerende sectoren.
Uitgelichte nieuwigheden in ROCm 6.3
SGLang: Snellere inferentie voor generatieve modellen
ROCm 6.3 introduceert SGLang, een omgeving specifiek ontworpen om de inferentie van generatieve AI modellen, zoals grote taalmodellen (LLM) en visueel-linguïstische modellen (VLM), te optimaliseren op AMD Instinct GPU’s. Volgens interne tests bereikt SGLang tot 6 keer hogere prestaties bij de inferentie van LLM, wat het een cruciaal hulpmiddel maakt voor bedrijven die interactieve assistenten en cloudworkflows implementeren.
FlashAttention-2: Superieur rendement in transformerende modellen
FlashAttention-2, nu geoptimaliseerd voor ROCm 6.3, verbetert de geheugencapaciteit en het computergebruik van transformerende modellen aanzienlijk, en bereikt tot drie keer meer snelheid in inferentie en training vergeleken met eerdere versies. Dit verkort de time-to-market voor zakelijke AI-oplossingen.
AMD Fortran-compiler: De HPC-erfenis kracht bijzetten
ROCm 6.3 introduceert een Fortran-compiler die bedoeld is om de versnelling van bestaande HPC-applicaties op GPU’s te vereenvoudigen. Deze tool maakt directe offloading naar de GPU mogelijk, garandeert compatibiliteit met bestaande code en elimineert de noodzaak voor ingrijpende wijzigingen, wat voordelen biedt aan sectoren zoals farmaceutica, luchtvaart en klimaatmodellering.
Multi-node FFT in rocFFT: Revolutie in HPC-efficiëntie
De nieuwe multi-node FFT-functionaliteit in rocFFT maakt high-performance gedistribueerde berekeningen op grote datasets mogelijk. Dit is vooral nuttig in sectoren zoals olie, gas en klimaatmodellering, omdat het schaalbaarheid vereenvoudigt en de gegevensverwerking optimaliseert.
Verbeterde bibliotheken voor computer vision
ROCm 6.3 omvat verbeteringen in bibliotheken zoals AV1 en rocJPEG, waardoor ontwikkelaars het eenvoudiger vinden om te werken met taken betreffende videobeeldanalyse en de uitbreiding van datasets. Deze capaciteiten bevorderen geavanceerde oplossingen in sectoren zoals media, entertainment en autonome systemen.
Impact op ontwikkelaars en bedrijven
Met deze update versterkt AMD zijn toewijding aan de open-sourcegemeenschap en ontwikkelaars door tools te bieden die ontworpen zijn om de implementatie van applicaties te vereenvoudigen en de prestaties te maximaliseren. Bovendien versterkt ROCm 6.3 zijn positie als toonaangevend platform in sectoren zoals generatieve AI, geavanceerde visualisaties en gedistribueerde computerwerking.
Beschikbaarheid en bronnen
Ontwikkelaars die geïnteresseerd zijn, kunnen toegang krijgen tot ROCm 6.3 en de documentatie verkennen via het officiële AMD ROCm platform. Ook wordt aanbevolen om gedetailleerde gidsen en bijgewerkte bibliotheken te raadplegen om deze hulpmiddelen te integreren in bestaande workflows.
AMD blijft leidend in technologische innovatie op het gebied van AI en HPC en biedt bedrijven de noodzakelijke tools om de huidige en toekomstige uitdagingen het hoofd te bieden. Met ROCm 6.3 stelt het bedrijf een nieuwe standaard in de prestaties en schaalbaarheid van computeroplossingen.
via: AMD