Vooruitgang in Multimodale AI op Mobiele Apparaten met Arm en Alibaba

Samenwerking tussen Arm en Alibaba Verhoogt de Multimodale Kunstmatige Intelligentie op Mobiele Apparaten

De samenwerking tussen Arm en Alibaba heeft de multimodale kunstmatige intelligentie naar een nieuw niveau gebracht voor mobiele apparaten. Dankzij de integratie van Arm KleidiAI in het deep learning-framework MNN, ontwikkeld door Alibaba, zijn verbeteringen tot wel 57% in de verwerking van multimodale AI-taken aan de rand gerealiseerd. Dit resulteert in snellere en efficiëntere ervaringen in applicaties zoals chatbots en visuele zoekfunctionaliteit in e-commerce.

Optimalisatie van AI aan de Rand met KleidiAI

Multimodale AI-toepassingen worden steeds gebruikelijker doordat ze tekst, afbeeldingen, audio en video combineren om nauwkeurigere en contextuele antwoorden te bieden. Het uitvoeren van deze toepassingen op mobiele apparaten vormt echter een uitdaging vanwege de beperkingen in kracht en geheugen.

Om deze problemen het hoofd te bieden, biedt KleidiAI optimalisaties die de inferentie van AI-modellen op Arm-CPU’s versnellen zonder dat ontwikkelaars extra aanpassingen hoeven te doen. Deze technologie is al geïntegreerd in populaire frameworks zoals ExecuTorch, Llama.cpp, LiteRT en MediaPipe, en nu ook in MNN van Alibaba.

De optimalisatie stelt het model Qwen2-VL-2B-Instruct, een model met 2.000 miljoen parameters dat is ontworpen voor beeldbegrip en multimodale generatie in verschillende talen, in staat om efficiënt te functioneren op mobiele apparaten.

Verbeteringen in Snelheid en Efficiëntie

De integratie van KleidiAI in MNN heeft geresulteerd in:

✅ 57% verbetering in pre-fill – Optimalisatie van het verwerken van meerdere invoeren voordat een antwoord wordt gegenereerd.
✅ 28% verbetering in decodering – Vermindering van de tijd die nodig is om tekst te genereren op basis van de verwerkte invoer.
✅ Lagere rekencapaciteit – Vermindering van het verbruik van resources op apparaten met beperkte hardware.

Deze verbeteringen zorgen voor een soepelere gebruikerservaring in chatbots, virtuele assistenten en productzoektoepassingen via afbeeldingen.

Demonstratie op MWC 2025

Tijdens het Mobile World Congress 2025 zullen Arm en Alibaba deze verbeteringen presenteren bij de stand van Arm (Haal 2, Stand I60). De demonstratie toont hoe het model Qwen2-VL-2B-Instruct tekst en afbeeldingen interpreteert en in real-time antwoorden genereert, werkend op smartphones met de MediaTek Dimensity 9400 chip.

Een Stap Vooruit in Mobiele AI

De integratie van KleidiAI in MNN vertegenwoordigt een belangrijke vooruitgang in de ontwikkeling van AI aan de rand, waardoor complexe modellen kunnen functioneren op apparaten met beperkte kracht.

Met deze optimalisaties kunnen miljoenen ontwikkelaars efficiëntere multimodale AI-applicaties creëren, waardoor geavanceerde kunstmatige intelligentie dichter bij mobiele gebruikers komt en de weg effent voor de volgende generatie van intelligente computing.

Bron: ARM

Scroll naar boven