Huawei Cloud heeft in Shanghai een nieuwe generatie producten voor agentgerichte kunstmatige intelligentie (AI) gepresenteerd, gebaseerd op een heldere kernboodschap: bedrijven hebben niet alleen krachtigere modellen nodig, maar ook een infrastructuur die agents veilig, continu en efficiënt kan uitvoeren. De aankondiging vond plaats tijdens Huawei Cloud INSPIRE 2026, gehouden in het West Bund International Convention & Exhibition Center, waar het bedrijf het concept van Agentic Infra introduceerde, samen met een reeks services gericht op training, inferentie, geheugen, beveiliging, governance en industriële deployment van agents.
Deze ontwikkeling komt op een moment dat de markt de fase van geïsoleerde tests met generatieve modellen achter zich laat. De volgende stap ligt in productie: agents die redeneren, data opvragen, taken uitvoeren, context behouden over langere tijd en opereren in sectoren zoals gezondheidszorg, fabricage, energie, robotica, wetenschappelijk onderzoek en beheer. Voor Huawei Cloud vereist deze sprong een andere architectuur dan traditionele cloud, met een nauwere afstemming tussen hardware, software, opslag, netwerken, beveiliging en ontwikkelplatforms.
Agentic Infra: een tokenfabriek voor algemene workloads en AI
Het centrale punt van de aankondiging is Agentic Infra, een nieuwe geïntegreerde infrastructuur voor algemene workloads en AI. Huawei Cloud definieert het op basis van vier kernideeën: een efficiënte “tokenfabriek”, continue learning, een geïntegreerde planning voor algemene en AI-workloads, en veilige autonomie. Deze termen klinken ambitieus, maar richten zich op een concreet probleem: schaalbare agents uitvoeren vereist meer dan alleen beschikbaarheid van GPUs of NPUs, het gaat om de coördinatie van computationeel vermogen, geheugen, netwerken, inferentie en isolatie met zeer lage latency.
Een van de belangrijkste producten is AI Cluster Service (AICS), gebouwd op het netwerk UnifiedBus. Volgens Huawei Cloud ondersteunt deze service clusters van meer dan 100.000 kaarten, met een totale capaciteit tot 200 EFLOPS. Het bedrijf beweert dat de token-generatielatentie onder de 10 milliseconden ligt en dat een prestatie van 5 miljoen tokens per seconde wordt gehaald op 1.000 kaarten, met een online beschikbaarheid van 99,95 %.
AICS wordt gepresenteerd als een essentieel onderdeel voor het operationeel maken van grote inferentie- en trainingsladingen, met name in scenario’s waar volumineuze aanvragen en lage latentie cruciaal zijn. Huawei streeft ernaar om haar infrastructuur te positioneren als een alternatief voor bedrijven en industrieën die grootschalige AI-implementaties willen doen zonder te vertrouwen op een versnipperde verzameling van diensten.
| Product of Dienst | Belangrijkste Functie | Bekende Aankondiging |
|---|---|---|
| AI Cluster Service (AICS) | AI-clusters voor training en inferentie | Meer dan 100.000 kaarten en tot 200 EFLOPS |
| Agentic Memory Storage (AMS) | Persistente en schaalbare geheugenopslag voor agents | PB-schaal ruimte en KV-cache pooling per niveau |
| CCE VolcanoNext | Geïntegreerde planning voor algemene workloads en AI | Meer dan 30% verbetering in resourcegebruik |
| AgentSphere | Veilige en flexibele runtime voor agents | Inbedrijfstelling onder 100 ms |
| ModelArtsNext | Platform voor training en inferentie | Model routing en bedrijfs-RLaaS |
| AgentArts | Bedrijfsplatform voor agents | Langdurige taken, beveiliging, sector-knowhow, observability |
| openJiuwen | Open source editie van AgentArts | Deel meer dan 90% van de kernel met AgentArts Enterprise |
| CloudRobo | Cloudplatform voor robots | Migratie naar de cloud in uren en model deployment in minuten |
Een andere belangrijke component is Agentic Memory Storage (AMS), gericht op het doorbreken van de geheugengrens van agents. Huawei Cloud legt uit dat AMS NPU passthrough combineert met Context Memory Storage om een petabyte-schaal geheugenruimte te creëren. Het ondersteunt ook KV-cache pooling per niveau, een belangrijke techniek om inferentiekosten te verlagen en langdurige taken mogelijk te maken.
Deze functie is essentieel omdat agents niet alleen rekenkracht verbruiken. Ze moeten context behouden, geheugen ophalen, uren of dagen werken en tussenstadia beheren. Zonder een efficiënte geheugenlaag worden de kosten en de complexiteit van agents explosief verhoogd.
CCE VolcanoNext fungeert als een motor voor geïntegreerde planning van zowel algemene workloads als AI. Huawei Cloud stelt dat door gedeeld training- en inferentiepooling en consolidatie van fragmentatie, het resourcegebruik met meer dan 30% kan toenemen. In bedrijfsomgevingen kan die efficiëntie aanzienlijke kostenbesparingen opleveren omdat veel AI-projecten falen niet door gebrek aan modellen, maar door onhoudbare infrastructuurkosten.
ModelArtsNext en AgentArts: van model tot bedrijfsagent
Huawei Cloud introduceerde ook ModelArtsNext, een nieuwe platform voor training en inferentie van modellen. De vier hoofdcapaciteiten zijn Reinforcement Learning as a Service, vertrouwelijke inferentie, modelrouting en een modelmatrix. Het modelrouting systeem (MaaS) kan drie beleidsopties toepassen: prioriteit voor ervaring, prioriteit voor efficiëntie of een gebalanceerde modus. Het platform bepaalt dynamisch welk model elke aanvraag behandelt op basis van kenmerken.
Volgens Huawei Cloud biedt het nu meer dan 15 geavanceerde modellen, met een planningsnauwkeurigheid boven de 95% en een gemiddelde kostenbesparing van 20%. Het onderstreept daarmee een duidelijke trend: organisaties willen niet afhankelijk zijn van één enkel model, maar elke taak door het meest geschikte model laten afhandelen op basis van kosten, prestaties, precisie, latency of compliance.
De zakelijke RLaaS (Reinforcement Learning as a Service) is een andere strategische focus. Huawei Cloud wil reinforcement learning toegankelijk maken voor organisaties die modellen op maat willen afstemmen. Het bedrijf beweert dat gebruikers binnen een minuut taken kunnen creëren, end-to-end visualisatie kunnen gebruiken en consistentie kunnen bewaren tussen training en inferentie.
AgentArts vormt de aanvulling op de platformlaag. Het is een bedrijfsoplossing voor het creëren en inzetten van AI-agents, met vier kerncapaciteiten: langdurige taken in productie, enterprise-beveiliging, diepgaande sector-knowhow en end-to-end observability. Huawei Cloud spreekt van “harness engineering”, dat wil zeggen engineering die het gebruik, de tools, data, geheugen, modellen en processen van agents organiseert en regelt.
Daarnaast introduceerde Huawei openJiuwen, een open source versie van AgentArts die meer dan 90% van de kernfunctionaliteit deelt met de bedrijfsversie. Met deze stap hoopt het bedrijf ontwikkelaars en partners aan te trekken, hoewel de toegevoegde waarde vooral ligt in de integratie met infrastructuur, ondersteuning, governance en cloudservices van Huawei.
AgentArts Orchard fungeert als een portaal dat cloudgebaseerde agentdiensten, agents, modellen en applicaties verenigt. Het doel is het automatiseren van het volledige proces: van het begrijpen van intenties en het ontwikkelen van functies tot het toewijzen van resources en het uitrollen van applicaties. Huawei streeft ernaar dat de agents zelf betrokken worden bij het creëren en beheren van nieuwe diensten.
Beveiliging, hybride cloud en industrie als kernpijlers
Beveiliging speelde een centrale rol in de aankondiging. Huawei Cloud presenteerde een end-to-end oplossing die het volledige levenscyclus van AI beschermt, inclusief agents, modellen en de agentgerichte infrastructuur. Nieuwe features omvatten een databeveiligingszone met dedicated hardware encryptie, Hold Your Own Key-technologie, datapockets en multidimensionale isolatie voor de agent-infrastructuur. Het doel is duidelijk: inspelen op zorgen over soevereiniteit, vertrouwelijkheid en controle over data in gereguleerde sectoren.
Ook werd een vertrouwelijke computing-oplossing voor AI aangekondigd, met vertrouwelijke virtuele machines, remote attestation in de cloud, key management, vertrouwelijke inferentiegateways en NPU passthrough op basis van PCIPC. Deze technologie richt zich op vertrouwelijke inferentie, vertrouwelijk pretraining en federated learning, scenario’s waarin data of modellen van hoog waarde zijn en niet zonder waarborgen gedeeld kunnen worden.
Huawei Cloud presenteerde tevens de whitepaper “Building Agent-Oriented Hybrid Cloud for Enterprises”. Daarin wordt ingegaan op de evolutie van hybride cloud in een agent-gerichte wereld. Het bedrijf benadrukt dat haar hybride cloud al meer dan 5.500 klanten wereldwijd bedient en een sterke positie heeft in financiële hybride cloud en dedicated cloud. Het document behandelt het bouwen van AI-data lakes, coördinatie tussen stabiele online modellen en snellere offline iteraties, en het creëren van veilige ontwikkel- en uitvoeringsomgevingen voor agents.
Op sectorniveau kondigde Huawei Cloud vier zones aan binnen haar Industry AI Foundry: Smart Healthcare Zone, Embodied AI Zone, Smart Manufacturing Zone en Scientific Computing Zone. De eerste wordt versterkt met een AI-platform voor gezondheidszorg dat op 30 juni open bèta gaat en met een slimme pathologieloes die al in verschillende Chinese ziekenhuizen wordt ingezet. Meer dan 20 ziekenhuizen zijn betrokken bij deze zone.
De Embodied AI Zone richt zich op fysieke AI en robotica. Huawei Cloud presenteerde CloudRobo, een platform voor slimme robotontwikkeling dat data op petabyteschaal, ontwikkelpijplijnen, een cloud-native motor voor robotmodellen en een Real-Sim-systeem voor datageneratie en evaluatie combineert. Huawei beweert dat robots in uren naar de cloud gemigreerd kunnen worden en modellen binnen minuten uitgerold, met een open bèta gepland op 30 juni.
De Smart Manufacturing Zone ondersteunt de implementatie van industriële agents, terwijl de Scientific Computing Zone zich richt op AI4S (AI voor wetenschap), met modellen en agents die onderzoek versnellen.
Daarnaast werd het AI Model Partner Program aangekondigd, met meer dan 20 modelleveranciers zoals Zhipu AI, DeepSeek, MiniMax, Kimi, StepFun, Baidu, iFLYTEK Spark, Meituan, AIsphere en Shengshu Technology. Het doel is het creëren van een divers ecosysteem voor modellen, verbonden met Huawei’s cloudservices.
Huawei Cloud presenteert hiermee een uitgebreide strategie: niet alleen modellen of infrastructuur, maar een complete stack voor het agentgerichte tijdperk. Clusters, geheugen, modelrouting, veilige runtimes, agentplatforms, hybride cloud, security, industrieën en het ecosysteem van modellen vormen samen een verhaal dat zich uitstrekt. Het wordt de uitdaging om te bewijzen dat deze integratie concurrerend kan zijn, ook buiten China, in een markt die steeds meer wordt gekenmerkt door regelgeving, digitale soevereiniteit, sancties, compatibiliteit en vertrouwen.
Veelgestelde vragen
Wat is Agentic Infra van Huawei Cloud?
Agentic Infra is de nieuwe infrastructuuroplossing van Huawei Cloud voor het uitvoeren van algemene workloads en agentgerichte AI. Het integreert compute, geheugen, planning, beveiliging en runtime voor bedrijfsagents.
Wat levert Agentic Memory Storage op?
Agentic Memory Storage (AMS) creëert een petabyte-schaal geheugenruimte en ondersteunt KV-cache pooling per niveau om inferentiekosten te verlagen en langdurige agent-taken mogelijk te maken.
Wat is AgentArts?
AgentArts is Huawei Cloud’s enterprise platform voor het creëren, uitrollen en beheren van AI-agents in productie, met functies voor langdurige taken, beveiliging, sector-kennis en end-to-end observability.
Welke sectoren prioriteert Huawei Cloud?
Huawei Cloud heeft speciale zones aangekondigd voor slimme gezondheidszorg, fysieke AI en robotica, slimme fabricage en wetenschappelijke computing, daarnaast een partnerschap met modelleveranciers zoals DeepSeek, MiniMax, Kimi en Zhipu AI.
via: huawei
