Bedrijfs-AI komt in zijn ongemakkelijke fase: iemand moet de tokens betalen - Cloud News

X (Twitter) Facebook LinkedIn Email WhatsApp

De eerste fase van generatieve kunstmatige intelligentie binnen bedrijven werd gepresenteerd als een onvermijdelijke productiviteitsverhoging. Meer code, meer documenten, automatisering en minder tijd verloren aan repetitieve taken. De tweede fase verloopt veel minder episch: facturen nakijken, bestedingslimieten instellen en aan de financiële afdeling uitleggen waarom een tool die op een SaaS-licentie leek, zich nu gedraagt als een variabele consumptie-infrastructuur.

Het probleem is niet dat AI niet werkt; dat zou een te eenvoudige conclusie zijn. Het probleem is dat, wanneer het wel werkt, het veel meer wordt gebruikt dan voorzien. En wanneer het intensief wordt ingezet, komt een waarheid aan het licht die de markt twee jaar lang heeft proberen uit te stellen: het uitvoeren van geavanceerde modellen op grote schaal kost enorm veel geld. Het is niet genoeg om slechts per gebruiker te betalen; onderliggend zijn er lange sessies, agents die volledige repositories doorzoeken, enorme contexten, uitgebreide antwoorden en meerdere modellen die in keten werken.

De platte tarifering was een marktaantrekkingsfase

In de initiële fase werden veel AI-tools gefinancierd volgens een strategie vergelijkbaar met andere technologische markten: snel groeien, gebruikers winnen, gewoonte creëren en ervan uitgaan dat de kosten in de loop der tijd zouden dalen. Die aanpak is logisch bij lage of neigende naar nul marginale kosten. Bij generatieve AI verdwijnt die marginale kost niet; elke interactie verbruikt inferentie, energie, geheugen, netwerk en GPU-capaciteit. Elke agent die op de achtergrond werkt, transformeert de belofte van goedkope software in een echte operationele last.

GitHub heeft deze verandering benoemd. Vanaf 1 juni 2026 gaat Copilot gebruik maken van GitHub AI Credits in alle abonnementen. Het bedrijf behoudt de basiskosten, maar het gebruik wordt nu berekend op tokens voor input, output en cache, afhankelijk van het gebruikte model. De officiële verklaring is duidelijk: Copilot is niet langer slechts een assistent binnen de editor, maar een agentgerichte platform dat lange en meerstaps sessies kan uitvoeren op volledige repositories. Dat gebruik vereist veel meer rekenkracht en inferentie dan een snelle vraag in een chat.

De documentatie voor bedrijven versterkt die boodschap. GitHub definieert AI Credits als factureringseenheid, waarbij 1 credit gelijk staat aan $0,01, en biedt de mogelijkheid om budgetten te beheren per organisatie, bedrijf, kostenplaats of gebruiker. Het wordt ook duidelijk gemaakt dat een lange sessie met een programmeeragent die een grensmodel gebruikt, meer kost vanwege de extra werkbelasting.

De zakelijke les is duidelijk: de kosten van AI zijn niet langer verborgen in een licentie en lijken meer op cloudkosten. Niemand zou nog zonder budget, limieten, observatie en waarschuwingen infrastructuur uitrollen. Toch hebben veel bedrijven AI geïmplementeerd alsof het gewoon een kantoortool is. Die fase loopt op zijn einde.

Microsoft, Uber en de financiële wake-up call van AI

Het voorbeeld van Microsoft is bijzonder symbolisch. The Verge meldde dat het bedrijf van plan is de meeste interne licenties van Claude Code in zijn Experiences + Devices-afdeling te stoppen en veel ontwikkelaars te migreren naar GitHub Copilot CLI. Intern heeft Microsoft verklaard dat deze beslissing gericht is op het centraliseren van Copilot CLI als de belangrijkste agentgerichte interface, hoewel bronnen ook wijzen op financiële overwegingen en het afsluiten van het fiscale jaar.

Het is belangrijk om het niet te simplificeren. Microsoft zegt niet dat Claude niet meer nuttig is. In feite wordt bevestigd dat Anthropic-modellen nog beschikbaar blijven via Copilot CLI en dat Microsoft Claude in verschillende producten blijft gebruiken. Wat wel relevant is, is dat zelfs een grote speler zoals Microsoft, met een sterke positie in cloud en modellen, het interne toegang tot AI-tools aan het rationaliseren is wanneer het gebruik de bedrijfsresultaten begint te beïnvloeden.

Uber geeft een andere aanwijzing voor dezelfde trend. AI Magazine rapporteerde dat het bedrijf zijn AI-budget voor 2026 in slechts vier maanden had verbruikt, grotendeels door intensief gebruik van programmeerhulpmiddelen. Hoewel deze informatie uit secundaire bronnen komt en met voorzichtigheid moet worden geïnterpreteerd, past het in het patroon dat veel bedrijven nu zien: de daadwerkelijke adoptie kan veel meer verbruik genereren dan de initiële pilots die de aanschaf rechtvaardigden.

Anthropic moest ook haar openbare schattingen over Claude Code aanpassen. Business Insider meldde dat het gemiddelde kostenper ontwikkelaar per dag in enterprise-implementaties omhoog ging van $6 naar $13, met maandelijkse schattingen tussen $150 en $250 per ontwikkelaar. Het bedrijf vertelt dat dit geen prijsverhoging is, maar een update die verband houdt met het gebruik van geavanceerdere modellen en andere consumptiepatronen.

Die nuance is belangrijk. De officiële prijs blijft hetzelfde, maar de werkelijke kosten wel: als een tool beter wordt, gebruiken medewerkers hem meer; als agents complexere taken kunnen afhandelen, verbruiken ze meer context; en automatische workflows voor reviews, testen, documentatie en incidentanalyse laten de factuur groeien, ook al zijn tokens goedkoper dan een jaar geleden.

Signaal uit de markt	Wat het echt betekent	Impact voor bedrijven
Copilot wordt AI Credits	De pure platte tarieven dekken geen intensief agentisch gebruik	Budgetteren en limieten voor teams noodzakelijk
Microsoft beperkt interne Claude Licenties	Keuzes in tools worden ook financiële beslissingen	Meer consolidatie van leveranciers
Claude code schat kosten hoger in	Capaciteit van modellen verandert consumptiepatronen	Vooruitzien op jaarbudget wordt onbruikbaar
Uber verbruikt al zijn AI-budget	Massale adoptie kan de initiële voorspellingen overtreffen	FinOps voor AI wordt noodzakelijk
Code-agents met miljoenen facturen	Continu automatiseren verhoogt verbruik aanzienlijk	Moet er beslist worden welke taken met topmodellen worden afgehandeld

Productiviteit is niet genoeg zonder kostencontrole

De gebruikelijke verdediging van deze tools is dat toenemende productiviteit de kosten rechtvaardigt. Dat kan kloppen, maar die redenering is niet meer vol te houden. Een bedrijf moet weten welke productiviteitswinst wordt geboekt, in welke teams, met welke modellen en tegen welke kosten. Zonder die meting wordt AI een expansieve budgetpost die groeit door enthousiasme, niet door rendement.

Het extreme voorbeeld van OpenClaw illustreert dit, al is het niet representatief voor een gemiddeld bedrijf. Tom’s Hardware meldt dat Peter Steinberger in 30 dagen een verbruik van meer dan $1,3 miljoen aan tokens van OpenAI had, met 603 miljard tokens en 7,6 miljoen verzoeken via ongeveer 100 Codex-instanties. De kosten werden door OpenAI zelf gedragen en het geval wordt beschreven als een ontwikkel-laboratorium zonder budgetbeperkingen. Maar het visualiseert wat er gebeurt als er geen remmen worden toegepast.

Aan de andere kant staat Salesforce. Marc Benioff stelde dat het bedrijf waarschijnlijk 300 miljoen dollar aan Anthropic-tokens zal uitgeven in dat jaar, terwijl hij ook de productiviteitsverbeteringen met programmeeragentschappen verdedigde. Hij pleitte voor een tussenlaag die kan beslissen welke verzoeken naar topmodellen gaan en welke met kleinere modellen kunnen worden afgehandeld.

Zo’n tussenlaag wordt een van de kerncomponenten voor de volgende fase. Bedrijven kunnen niet alles naar de krachtigste modellen sturen, en ze kunnen niet elk gebruik degraderen tot kleine modellen zonder verlies van kwaliteit of betrouwbaarheid. Slim routeren, cachegebruik, limieten per taak, kwaliteitscontrole, monitoring van consumptie en duidelijke beleidsoverwegingen over duur versus waarde worden noodzakelijk.

AI wordt geen vervanging van de cloud, maar een financiële discipline

De belangrijkste les uit deze fase is dat zakelijke AI minder lijkt op traditionele software en meer op een kritieke infrastructuur. Het kent variabele kosten, externe capaciteit, risico’s op overconsumptie, providerverschillen, latencyproblemen, beveiligingsvereisten en architecturale beslissingen. Daarom verschuift het debat meer naar FinOps voor AI, hybride cloud, open source-modellen, eigen inferentie en datagovernance.

Niet elke organisatie hoeft eigen AI-infrastructuur op te bouwen; veel zal API-gebruik blijven vertrouwen. Maar voor stabiele, herhalende, gevoelige of hoge-volume workloads worden andere overwegingen relevant. Wanneer een proces dagelijks miljoenen tokens verbruikt, wordt de vraag of dat altijd bij een externe provider moet gebeuren minder hypothetisch.

De fase van ‘alles uitproberen omdat AI goedkoop is’ maakt plaats voor een meer volwassen strategie: AI inzetten waar het zinvol is, retour meten en architecturen ontwerpen die elke productiviteitswinst niet leiden tot onvoorspelbare kosten. Providers zullen marges willen beschermen; klanten willen kosten onder controle houden. Een harde onderhandeling over prijs, limieten, modellen en daadwerkelijke waarde ligt in het verschiet.

AI is niet duurder geworden omdat het mislukt; juist omdat het echt wordt gebruikt, wordt het meer kostbaar. De ongemakkelijke vraag is: wie legt de waarde van dat gebruik vast? De model-leverancier, het ontwikkelplatform, de cloud voor inferentie, of het bedrijf dat die tokens omzet in meetbare productiviteit?

Veelgestelde vragen

Waarom worden bedrijfs-AI-duurdelijker?
Omdat het gebruik is overgestapt van experimenten naar geïntegreerde tools in het dagelijkse werk, programmeeragentschappen, automatiseringen en lange sessies die veel meer tokens verbruiken.

Wat zijn de AI Credits van GitHub Copilot?
Factureringspunten die het gebruik van AI-modellen in Copilot weergeven. Ze worden berekend op tokens van input, output en cache, afhankelijk van het gebruikte model.

Zullen platte tarieven voor AI-licenties verdwijnen?
Niet per se, maar ze zullen meer limieten, credits, budgetten of extra kosten voor intensief gebruik bevatten. Een onbeperkt tarief zonder controle is moeilijk te houden bij autonome agents.

Wat moeten bedrijven doen?
Gebruik meten per team en gebruiksgeval, budgetteren, modellen selecteren op basis van de taak, cache gebruiken, contracten herzien en AI behandelen als een variabele infrastructuur, niet als een simpele software-licentie.

bron: Nieuws over Kunstmatige Intelligentie

X (Twitter) Facebook LinkedIn Email WhatsApp