AMD Overtreft Nvidia: Nieuwe AI-prestaties van RDNA 3 Grafische Kaarten
Nieuw onderzoek toont aan dat AMD’s RDNA 3 grafische kaarten met 48 GB VRAM superieur zijn aan Nvidia’s RTX 4090
AMD heeft recentelijk indrukwekkende nieuwe prestaties gepresenteerd op het gebied van kunstmatige intelligentie, waarbij hun professionele RDNA 3 grafische kaarten met 48 GB VRAM de RTX 4090 van Nvidia overtreffen. Tests uitgevoerd met DeepSeek R1 tonen aan dat zowel de Radeon Pro W7900 als de Radeon Pro W7800, beide uitgerust met 48 GB VRAM, tot maar liefst 7,3 keer meer prestaties kunnen leveren dan de RTX 4090 in specifieke scenario’s van inferentie van taalmodellen.
Testresultaten met DeepSeek R1
David McAfee, vicepresident en algemeen directeur van Ryzen CPU’s en Radeon Graphics bij AMD, deelde op X (voorheen Twitter) een reeks tests uitgevoerd met LM Studio 0.3.12 en Llama.cpp runtime 1.18. In deze tests werd de prestatie van de GPU’s in vier verschillende configuraties vergeleken:
| Test | RTX 4090 | Pro W7800 48GB | Pro W7900 48GB |
|---|---|---|---|
| Distill Qwen 32B 8-bit | 2,7 tokens/s | 19,1 tokens/s | 19,8 tokens/s |
| Distill Llama 70B 4-bit | 2,3 tokens/s | 12,8 tokens/s | 12,7 tokens/s |
| Distill Qwen 32B 8-bit (variant) | 2,5 tokens/s | 15,7 tokens/s | 16,2 tokens/s |
| Distill Llama 70B 4-bit (variant) | 2,0 tokens/s | 10,1 tokens/s | 10,4 tokens/s |
In vergelijking met de RTX 4090 beweert AMD dat hun RDNA 3 GPU’s met 48 GB VRAM:
- 7,3 keer sneller zijn in Distill Qwen 32B 8-bit.
- 6,5 keer sneller zijn in een andere variant van Distill Qwen 32B 8-bit.
- 5,5 keer sneller zijn in Distill Llama 70B 4-bit.
- 5,2 keer sneller zijn in een andere variant van Distill Llama 70B 4-bit.
De Impact van VRAM op AI-modellen
Een van de sleutelcomponenten in de prestaties van deze kunstmatige intelligentiemodellen is de hoeveel VRAM die beschikbaar is. Bij inferentietaken met uitgebreide taalmodellen (LLM) worden de parameters direct in het geheugen van de GPU opgeslagen. AMD stelt dat hun modellen met 48 GB VRAM in staat zijn om de grootste modellen van DeepSeek R1 te verwerken zonder dat de belasting over verschillende GPU’s hoeft te worden verdeeld.
Echter, deze voordelen komen met een hoge prijs. De Radeon Pro W7900 met 48 GB kost $3.500, wat $1.500 meer is dan de basisprijs van de RTX 5090 ($2.000) en $2.000 meer dan de RTX 4090 ($1.500 bij lancering). Ondanks dit is het nog steeds goedkoper dan de RTX A6000 Ada met 48 GB, de dichtstbijzijnde optie van Nvidia op het gebied van VRAM-capaciteit.
Nvidia’s Tegenaanval
Hoewel deze resultaten AMD’s positie als een competitieve optie voor AI-werkbelastingen versterken, heeft het bedrijf ervoor gekozen om zijn GPU’s niet te vergelijken met de nieuwe RTX 5090, Nvidia’s nieuwste vlaggenschipmodel. Eerder, toen AMD vergelijkbare benchmarks over de RX 7900 XTX publiceerde, reageerde Nvidia met eigen gegevens, waaruit bleek dat hun GPU die van AMD overtrof in DeepSeek R1 onder vergelijkbare configuraties.
Het is waarschijnlijk dat Nvidia een tegenaanval zal doen met nieuwe benchmarks om de prestaties van hun meest recente modellen in vergelijking met de RDNA 3 GPU’s met 48 GB aan te tonen, vooral gezien het feit dat de RTX 5090 slechts 32 GB GDDR7 heeft tegenover de 48 GB van de kaarten van AMD.
Het landschap van GPU’s voor kunstmatige intelligentie blijft zich ontwikkelen, en hoewel AMD voordelen toont in VRAM-geheugen en prestaties in bepaalde tests, is de strijd om de suprematie in AI tussen Nvidia en AMD nog lang niet beslist.
