OpenAI lanceert GPT-5.4 en verdubbelt zijn inzet op een meer bruikbare Kunstmatige Intelligentie voor werken, programmeren en agenten beheren - Cloud News

X (Twitter) Facebook LinkedIn Email WhatsApp

OpenAI presenteert GPT-5.4 als hun nieuwe referentiemodel voor professioneel werken, programmeren en complexe agentgestuurde workflows. Hiermee geeft het bedrijf duidelijk aan welke richting het opgaat: minder nadruk op eenvoudige conversaties en meer focus op het omzetten van hun modellen in krachtige gereedschappen die taken in de praktijk kunnen uitvoeren met minder frictie, minder herhaling en meer precisie.

De lancering wordt momenteel uitgerold in ChatGPT, via de API en in Codex. In ChatGPT verschijnt het als GPT-5.4 Thinking, terwijl GPT-5.4 Pro gereserveerd is voor gebruikers die maximale prestaties nodig hebben bij uiterst veeleisende taken. De kern van het idee is niet zonder belang: OpenAI wil dat hun nieuwe model niet alleen kan redeneren en coderen, maar ook in staat is om te navigeren tussen tools, documenten te manipuleren, met spreadsheets te werken, presentaties voor te bereiden en de context vast te houden tijdens lange processen. Met andere woorden: het gaat niet alleen om accurate antwoorden, maar om het hele proces van nuttig werk van begin tot eind.

Sprekend over de samenstelling, zegt OpenAI dat GPT-5.4 de beste elementen combineert uit recente ontwikkelingen op het gebied van reasoning, programmeren en agent workflows. Daarnaast omvat het veel van de sterktes van GPT-5.3-Codex, dat meer gericht was op codering, en brengt dit alles samen in een meer generalistisch systeem. Deze convergentie is cruciaal, omdat het verklaart waarom OpenAI het niet slechts als een variant presenteert, maar als het nieuwe zwaartepunt van hun ecosysteem.

Een opvallend aspect van de introductie is OpenAI’s ambitieuze inzet om GPT-5.4 voor te stellen als een model voor gespecialiseerd professioneel werk. In GDPval, een evaluatie die de capaciteit meet van agenten om werkproducten te genereren in 44 beroepen verdeeld over 9 grote industrieën, behaalt GPT-5.4 een score van 83,0 % gewonnen of gelijkspelen, tegenover 70,9 % voor GPT-5.2. Deze sprong is niet gering. Volgens OpenAI kan het model professionals binnen die sectoren evenaren of overtreffen in een groot deel van de taken, wat een sterke indicator is dat AI niet langer alleen assistent is, maar daadwerkelijk betrokken raakt bij arbeidskritische taken.

De verbeteringen zijn ook duidelijk zichtbaar in concrete domeinen. OpenAI meldt dat GPT-5.4 specifiek fijn afgesteld is voor het maken en bewerken van spreadsheets, presentaties en documenten. In een interne test vergelijkbaar met de werkzaamheden van een junior banking analyst behaalt GPT-5.4 bijvoorbeeld een gemiddelde van 87,3 %, versus 68,4 % voor GPT-5.2. Bij presentaties gaven menselijke beoordelaars de voorkeur aan die gegenereerd door GPT-5.4 in 68,0 % van de gevallen vanwege de betere esthetiek, meer visuele variatie en efficiënter gebruik van beeldgeneratie.

Voor OpenAI draait deze evolutie niet alleen om kwaliteit, maar ook om efficiëntie. GPT-5.4 verbruikt minder tokens om problemen op te lossen dan GPT-5.2, wat de totale kosten voor veel workflows kan verlagen, hoewel de prijs per token kan stijgen. In de API kost GPT-5.4 $2,50 per miljoen invoertokens en $15 per miljoen uitgaande tokens bij aanvragen tot 272.000 tokens, terwijl GPT-5.4 Pro respectievelijk $30 en $180 bedraagt. Bij contextlengtes boven de 272.000 tokens stijgen de kosten verder, wat bevestigt dat lange contexten een zeer krachtige, maar niet goedkope, functionaliteit zijn.

Een van de grootste troeven van het nieuwe model is de mogelijkheid tot een contextwindow van maximaal 1 miljoen tokens. Dit maakt analyses van complete codebases, uitgebreide documentcollecties of langdurige workflows mogelijk met meerdere stappen en controles. Dit is geen marketingcijfers, maar praktisch: ontwikkelaars en teams kunnen veel grotere vraagstukken binnen één enkele interactie bespreken, wat vooral relevant is voor agenten, audits, documentanalyse en bedrijfsautomatisering.

GPT-5.4 markeert bovendien een belangrijke stap in het gebruik van computers. OpenAI noemt het hun eerste algemene model dat natively hardware en software kan bedienen. Agents kunnen bijvoorbeeld via schermopnames, toetsenbord en muis omgaan met applicaties, websites en desktopomgevingen, niet alleen om taken uit te voeren, maar ook om te valideren en bij te sturen indien nodig. In OSWorld-Verified, een test die dat gedrag meet, behaalt GPT-5.4 een succespercentage van 75,0 %, waarmee het niet alleen GPT-5.2 overtreft (47,3 %), maar ook de menselijke referentie (72,4 %).

In programmeren toont GPT-5.4 eveneens sterke prestaties. Het evenaart of overtreft GPT-5.3-Codex op SWE-Bench Pro met 57,7 %, en verbetert op verschillende indicators voor toolgebruik en realistische taken ten opzichte van GPT-5.2. Daarnaast wordt duidelijk dat het model uitblinkt in complexe front-end ontwikkeling qua visuele en functionele afwerking. Het is geen toeval dat er gelijktijdig een experimentele Codex-skill werd gelanceerd: “Playwright (Interactive)”, voor visueel debuggen van web- en Electron-apps tijdens het ontwikkelproces.

Een andere belangrijke vooruitgang ligt in zoek- en toolbeheer. GPT-5.4 verbetert het gebruik in ecosystemen met veel functies, connectors of MCP-servers dankzij tool search. Dit systeem beperkt de initiële input van definities en laat het model gericht zoeken naar de juiste tool wanneer dat nodig is. Bij een test met 250 taken en 36 MCP-servers verminderde deze aanpak het totale tokengebruik met 47 %, zonder aan nauwkeurigheid in te boeten. Dit belooft snellere, goedkopere en beter schaalbare agenten in complexe zakelijke omgevingen.

Ook qua betrouwbaarheid zijn duidelijke stappen gezet. OpenAI meldt dat GPT-5.4 het meest precieze model tot nu toe is. In een dataset van prompts met gemarkeerde feitelijke fouten waren de uitspraken van GPT-5.4 33 % minder vaak foutief dan die van GPT-5.2, terwijl de volledige antwoorden 18 % minder fouten bevatten. Alhoewel hallucineringen niet volledig weg zijn, onderstreept het dat OpenAI zich blijft inzetten om een van de hardnekkigste kritiekpunten op grote taalmodellen aan te pakken.

Een opvallende nieuwe feature in ChatGPT is het « reasoning preamble ». GPT-5.4 Thinking kan vanaf het begin een plan of aanpak presenteren voor het oplossen van complexe vragen, zodat gebruikers tijdens de reactie kunnen bijsturen zonder de hele conversatie opnieuw te hoeven starten. OpenAI noemt dit een manier om het model beter beheersbaar en nuttiger te maken bij lange of moeilijke taken. Deze functionaliteit is inmiddels beschikbaar op de website en Android, en binnenkort ook op iOS.

Al met al lijkt GPT-5.4 geen lichte upgrade, maar een strategische verschuiving: van AI die alleen reageert, naar AI die actief werkt. Het is nog afwachten hoe het zich zal gedragen in echte toepassingen buiten de tests en benchmarks, maar de boodschap is duidelijk: de toekomst ligt in agents die beter begrijpen, coderen, tools gebruiken, werken aan echte documenten en de context over langere perioden behouden. GPT-5.4 vormt daarvoor het centrale element.

Veelgestelde vragen

Wat is GPT-5.4 en waarom is het belangrijk voor ontwikkelaars en bedrijven?
GPT-5.4 is het nieuwe referentiemodel van OpenAI voor professioneel werk, programmeren en agenten met toolintegratie. Het combineert reasoning, codegeneratie, lange contexten, computergebruik en verbeterd documentbeheer in één systeem, waardoor het breed inzetbaar en krachtig is.

Wat is het verschil tussen GPT-5.4 Thinking en GPT-5.4 Pro in ChatGPT?
GPT-5.4 Thinking is de versie geïntegreerd in ChatGPT voor Plus, Team en Pro gebruikers. GPT-5.4 Pro is bedoeld voor wie maximale prestaties wil bij zeer complexe taken, en is ook beschikbaar via de API voor zwaardere workloads.

Waarvoor is een contextvenster van 1 miljoen tokens handig in GPT-5.4?
Het stelt je in staat grote codebases, uitgebreide documenten en lange workflows met meerdere stappen te analyseren, zonder info te moeten fragmenteren. Ideaal voor automatisering, audits, documentanalyse, financiën en geavanceerde programmering.

Hoeveel kost het gebruik van GPT-5.4 via de OpenAI API?
Voor contexten tot 272.000 tokens kost GPT-5.4 $2,50 per miljoen invoertokens en $15 per miljoen uitgaande tokens. GPT-5.4 Pro kost respectievelijk $30 en $180 per miljoen tokens. Bij langere contexten worden de tarieven hoger, wat duidelijk maakt dat grote contexten krachtig maar prijzig zijn.

via: Nieuws GPT 5.4

X (Twitter) Facebook LinkedIn Email WhatsApp