De platte AI-tarief begint haar grenzen te tonen - Cloud News

X (Twitter) Facebook LinkedIn Email WhatsApp

De handel in generatieve kunstmatige intelligentie bouwt voort op een zeer aantrekkelijke belofte voor de gebruiker: een maandelijks abonnement betalen en toegang krijgen tot steeds krachtigere modellen, zonder te veel na te denken over tokens, inferentie, contextvensters of werkelijke rekenkosten. Het probleem is dat die commerciële eenvoud begint te botsen met een technische werkelijkheid die bekend is bij iedereen die infrastructuur beheert: elke aanvraag kost geld, en sommige AI-taken verbruiken veel meer dan op het eerste gezicht lijkt.

Een onafhankelijk onderzoek dat door gebruikers op sociale media werd gedeeld, die verschillende abonnementen bij Anthropic en OpenAI kochten, bracht cijfers in beeld van deze spanning. De test bestond uit het uitvoeren van uitgebreide programmeertaken tot de wekelijkse limieten van iedere abonnement waren bereikt, en daarna de kosten daarvan te vergelijken met de equivalente API-kosten. Volgens hun berekeningen zou een Claude Max 20x-abonnement van 200 dollar per maand aansluiten bij een gebruik ter waarde van ongeveer 8.000 dollar per maand wanneer men de API-prijzen zou hanteren. Bij ChatGPT Pro 20x, eveneens 200 dollar per maand, zou het equivalente gebruik ongeveer 14.000 dollar per maand bedragen.

Dit hoeft niet te worden gelezen als een echte factuur. API-prijzen bevatten marges, infrastructuurkosten, beschikbaarheid, commercieel beheer en andere kosten. Bovendien is de interne kostprijs van het bedienen van een enkele aanvraag niet gelijk aan de eindprijs die een API-klant betaalt. Maar deze oefening helpt wel om een dieperliggende vraag te visualiseren: AI-abonnementen kunnen zeer rendabel zijn voor incidentele gebruikers, maar zeer duur voor de aanbieder wanneer er intensieve profielen gebruik van maken, vooral ontwikkelaars die lange programmeertaken uitvoeren, agents inzetten of analyses over volledige repositories laten plaatsvinden.

Het oude abonnementsmodel staat voor de uitdaging van variabele kosten in AI

Het abonnementsmodel is niet nieuw. Sportscholen, streamingplatforms, SaaS-software en clouddiensten werken al jaren met vergelijkbare logica: veel gebruikers betalen voor beschikbaarheid, gemak en toegang, ook al verbruiken ze niet het maximale van wat is afgesproken. De winstgevendheid wordt dan in de gemiddelde benutting gevonden, niet bij elke individuele gebruiker.

Generatieve AI introduceert hier een belangrijke verandering. Het kijken van een serie of het openen van een applicatie brengt marginaal kosten met zich mee, maar een lange sessie met een geavanceerd model kan aanzienlijk veel bronnen verbruiken. Elke prompt, elke reactie, elk uitgebreid contextvenster, elke oproep naar tools en elke iteratie van een programmeeragent genereert rekenbelasting. Wanneer de gebruiker van het stellen van snelle vragen overstapt naar het laten lezen van code, voorstellen doen, testen uitvoeren en fouten corrigeren, begint het abonnement meer te lijken op een gedeelde clouddienst voor computationele kracht dan op een vaste softwareprijs.

OpenAI biedt plannen voor ChatGPT voor particulieren en bedrijven, zoals Plus, Pro, Business en Enterprise, terwijl Anthropic abonnementen zoals Pro en Max aanbiedt, met hogere gebruiksmogelijkheden voor wie meer capaciteit nodig heeft. In beide gevallen wordt officieel benadrukt dat er limieten, gebruiksbeleid en mogelijke prijswijzigingen zijn.

De spanning ontstaat wanneer deze vaste maandprijzen worden vergeleken met de equivalente API-kosten. Anthropic publiceert prijzen per miljoen tokens, afhankelijk van model, invoer, uitvoer en caching. OpenAI hanteert ook een aparte API-prijzenstructuur voor ontwikkelaars, met verschillende modellen, modaliteiten en services.

Geanalyseerde plan	Maandprijs	Maximaal gelijkwaardig gebruik (bij benadering)
Claude Pro	$20	$400/maand
Claude Max 5x	$100	$2.000/maand
Claude Max 20x	$200	$8.000/maand
ChatGPT Plus	$20	$700/maand
ChatGPT Pro 5x	$100	$3.500/maand
ChatGPT Pro 20x	$200	$14.000/maand

Het opvallende is niet alleen het theoretische maximum, maar vooral hoe snel de economische haalbaarheid van de dienst kan veranderen wanneer het gemiddelde gebruik toeneemt. Volgens dezelfde analyse, uitgaande van een bruto-marge van 75%, zouden de hogere capaciteitsplannen al verlies maken bij relatief lage gebruiksniveaus. Bij ChatGPT Pro 20x ligt het break-even punt geschat op ongeveer 5,7% benutting. Bij Claude Max 20x rond de 10%. Kleinere plannen kunnen meer marge houden, zolang de meeste gebruikers niet volledig gebruik maken van de limieten.

Code-agents veranderen de gebruikscurve

De opkomst van programmeer-agents heeft deze discussie versneld. Tot voor kort gebruikte men ChatGPT of Claude vooral voor vragen beantwoorden, samenvatten, mails schrijven, code debuggen of documentatie genereren. Nu worden de taken uitgebreider. Een agent kan werken op een repository, bestanden inspecteren, wijzigingen voorstellen, patches toepassen, tests uitvoeren, fouten bekijken en meerdere pogingen doen.

Dit verandert de economische unit van het product. Een menselijke conversatie heeft pauzes, twijfel en stiltes. Een code-agent kan veel langer actief blijven, context intensief verwerken en veel stappen uitvoeren. OpenAI erkent in de documentatie over Codex dat de gemiddelde kost sterk kan variëren afhankelijk van het gebruikte model, het aantal instanties, automatiseringen en de modus voor snelle verwerking.

Voor een professionele gebruiker kan een abonnement van $100 of $200 nog steeds zeer goedkoop zijn, indien het uren werk vervangt of complexe taken versnelt. Maar de vraag voor het lab dat het model levert is of dat niveau van gebruik haalbaar is zodra duizenden of miljoenen ontwikkelaars taken automatiseren. Het verschil tussen “vragen aan een hulpje” en “delegeren aan een agent” is niet alleen productgericht, maar ook kostenmatig.

Dat verklaart waarom labs kunnen kiezen voor fijnmazigere segmentaties in plaats van een grote prijsstijging. Een plotselinge beperking van een abonnement veroorzaakt onvrede, negatieve publiciteit en het gevoel van verlies. Toegang beperken tot de duurste modellen, extra credits, gescheiden plannen voor intensief gebruik, of betere onderverdeling van abonnementsvormen biedt een minder abrupte route.

De markt ontwikkelt zich in die richting. Eindgebruikers blijven profiteren van abonnementsplannen voor massale adoptie, professionals krijgen plannen voor intensief gebruik, API’s blijven bestaan voor ontwikkelaars, en er ontstaan zakelijke contracten met speciale voorwaarden. Het vaste tarief blijft bestaan, maar zal niet altijd het nieuwste en krachtigste rekenvermogen omvatten.

De druk op AI-startups

Ook start-ups bouwen producten op basis van derde-partij modellen, en worden hierdoor eveneens geconfronteerd met deze kostendynamiek. Veel demonstraties werken doordat de werkelijke kosten tijdens de prototyping niet zichtbaar zijn. Een oprichter kan abonnementen gebruiken om ideeën te verkennen, prompts te testen of productflows te ontwerpen. Maar bij productie en echte gebruikers wordt het kostenplaatje anders.

Dit is een groot risico van de nieuwe AI-applicatielaag. Wat er in een presentatie als rendabel lijkt, kan bij kostenberekeningen drastisch veranderen: kosten per taak, tokens per actieve gebruiker, herhaalde vragen, contextopslag, tool-aanroepen en ondersteuning. Applicaties die niet meer dan de kosten voor inferentie boven het werkelijke toegevoegde waarde uitroepen, zullen het moeilijk krijgen naarmate prijzen en limieten worden aangepast.

De technische oplossing ligt niet alleen in afwachten dat modellen goedkoper worden. Het vereist ook betere ontwerpstrategieën: minder grote modellen gebruiken, caching toepassen, onnodige context vermijden, eenvoudige en complexe taken scheiden, kosten per workflow meten en Agents zonder onredelijke uitgaven beperken. In de eerste fases van generatieve AI wordt rekenkracht vaak als bijna oneindig gezien. De volgende fase wordt meer vergelijkbaar met de volwassen cloud, met zichtbaarheid, budgetten, limieten, optimalisatie en architectuur.

Ook cultuurveranderingen spelen mee. Gebruikers zijn gewend geraakt aan maandelijkse plannen voor zeer geavanceerde functies. Als die limieten straks strenger worden, kan dat tot stevige reacties leiden. Anderzijds, als labs hun krachtigste modellen vrijwel onbeperkt in vaste abonnementen blijven aanbieden, kunnen intensieve gebruikers dat in kostenlast ervaren, wat de houdbaarheid onder druk zet.

De economie van AI is nog in ontwikkeling. Kosten voor inferentie dalen, modellen worden efficiënter en de concurrentie drijft de prijzen omlaag. Tegelijkertijd groeien de ambities: meer context, meer agents, video, code, tools en automatisering. Het vaste abonnement heeft de IA populair gemaakt, maar het blijft nu zichtbaar waar de grenzen liggen.

Veelgestelde vragen

Waarom kan een AI-abonnement duizenden dollars aan API-kosten betekenen?

Omdat intensieve gebruikers veel meer oproepen, tokens en lange taken kunnen uitvoeren dan de maandelijkse prijs doet vermoeden. Het genoemde onderzoek vergelijkt het maximale gebruik dat werd waargenomen bij abonnementen met de kosten als datzelfde verbruik via API zou worden gefactureerd.

Betekent dit dat OpenAI of Anthropic verlies lijdt op alle gebruikers?

Nee. Het abonnementsmodel is gebaseerd op gemiddeld gebruik. Veel gebruikers verbruiken weinig of matig, wat het meer gebruiksprofiel compenseert. Het probleem ontstaat als een te grote proportie gebruikers de limieten uitbengt.

Zullen de prijzen van ChatGPT en Claude stijgen?

Dat is niet zeker. Een waarschijnlijke aanpak is dat de aanbieders meer segmentatie doorvoeren: geavanceerdere modellen, lange agents, uitgebreidere context of professioneel gebruik kunnen naar hogere plannen, extra credits of zakelijke contracten verschuiven.

Wat moeten ontwikkelaars en startups doen?

De werkelijke kosten per taak meten, niet alleen de maandelijkse abonnementsprijs. Ook is het verstandig om kleinere modellen te gebruiken waar mogelijk, caching in te zetten, tokens te beheersen, agents zonder onredelijke uitgaven te vermijden en producten te ontwerpen die voorbereid zijn op prijs- en beschikbaarheidswijzigingen.

Recently, we purchased one of each Anthropic/OpenAI subscription plan and randomly ran long horizon coding tasks until we exhausted the weekly limit. It’s widely believed that a $200/month plan maxes out at ~$2000/month worth of tokens (assuming API pricing). However, we found… pic.twitter.com/1e0zFhbFuo
— SemiAnalysis (@SemiAnalysis_) June 10, 2026

X (Twitter) Facebook LinkedIn Email WhatsApp