Qwen2.5-Max: Een op grote schaal ontwikkeld kunstmatig intelligentiemodel dat een keerpunt betekent.

Het Qwen-team heeft zijn laatste creatie gepresenteerd, het model Qwen2.5-Max, een kunstmatige intelligentie-systeem gebaseerd op de Mixture of Experts (MoE) architectuur. Dit model, dat is getraind met meer dan 20 biljoen tokens, heeft als doel om nieuwe normen te stellen op het gebied van grootschalige kunstmatige intelligentie (AI). Met de lancering positioneert Qwen2.5-Max zich als een concurrerende alternatief voor andere toonaangevende modellen op de markt, zoals GPT-4o, DeepSeek V3 en Claude-3.5-Sonnet.

Een kwalitatieve sprong in het trainen van modellen

De sleutel tot het succes van Qwen2.5-Max ligt in de innovatieve aanpak bij het schalen van gegevens en modellen. Volgens het team achter deze ontwikkeling maakt het vergroten van zowel de hoeveelheid gegevens als het model significante verbeteringen in de intelligentie van de AI mogelijk. Echter, het schalen van extreem grote modellen, of ze nu dicht of op MoE gebaseerd zijn, is een uitdaging die diepgaande kennis en nauwkeurige controle over de details vereist.

Dit proces is mogelijk gemaakt dankzij de laatste onthullingen rondom de technieken die zijn gebruikt in de ontwikkeling van DeepSeek V3, een model dat de basis heeft gelegd voor de vooruitgang van Qwen2.5-Max. Bovendien is het model onderworpen aan aanvullende training met behulp van Supervised Fine-Tuning (SFT) en Reinforcement Learning with Human Feedback (RLHF), wat heeft geholpen om de capaciteiten te optimaliseren.

Prestaties in benchmarks

De prestaties van Qwen2.5-Max zijn geëvalueerd in een reeks referentietests die de capaciteiten van modellen meten op gebieden zoals probleemoplossing op universitair niveau, coderingsvaardigheden, algemene capaciteiten en menselijke voorkeuren. Onder de opmerkelijke tests zijn MMLU-Pro, LiveCodeBench, LiveBench en Arena-Hard.

In vergelijking met DeepSeek V3 heeft Qwen2.5-Max een superieure prestatie aangetoond in tests zoals Arena-Hard, LiveBench, LiveCodeBench en GPQA-Diamond. Daarnaast heeft het competitieve resultaten laten zien in andere evaluaties, waaronder MMLU-Pro, waardoor het zich positioneert als een state-of-the-art model op het gebied van AI.

Beschikbaarheid en gebruik

Qwen2.5-Max is al beschikbaar op Qwen Chat, een platform waarmee gebruikers direct met het model kunnen interactie hebben, zoeken en de functionaliteiten kunnen verkennen. Bovendien is de API, die compatibel is met de APIs van OpenAI, toegankelijk via Alibaba Cloud. Om deze te gebruiken, moeten gebruikers zich registreren bij Alibaba Cloud, de service Alibaba Cloud Model Studio activeren en een API-sleutel genereren.

Het team heeft een voorbeeld van code in Python gedeeld dat laat zien hoe Qwen2.5-Max kan worden gebruikt om eenvoudige vragen op te lossen, zoals bepalen welk getal groter is tussen 9,11 en 9,8. Deze gebruiksvriendelijkheid opent een scala aan mogelijkheden voor ontwikkelaars en bedrijven die geavanceerde AI in hun toepassingen willen integreren.

via: Nieuws Sociale Media

Scroll naar boven