Gedurende vele maanden is de discussie over kunstmatige intelligentie vooral gericht geweest op één vraag: welk model is beter. GPT, Claude, Gemini, Llama, Mistral, Qwen, DeepSeek. Meer context, meer redeneervermogen, hogere snelheid, lagere kosten per token. Al deze aspecten zijn belangrijk, maar ze beperken zich tot slechts een deel van het probleem.
De toepassingen van AI die beginnen te leveren, zijn niet langer eenvoudige chats die gekoppeld zijn aan een model. Ze lijken meer op een fabriek. Er is een machine die genereert en redeneert, een ruimte waar informatie wordt voorbereid, een opslag die kennis bewaart, een verantwoordelijke die de volgende stap bepaalt, standaardcontacten om tools aan te sluiten, beveiligingscontroles en kwaliteitscontroles voordat een resultaat wordt goedgekeurd.
Goede AI in 2026 draait niet alleen om het hebben van “het grootste model”. Het gaat erom dat het hele systeem eromheen goed wordt opgezet.
De LLM is de machine, maar niet de hele fabriek
Het taalmodel is het meest zichtbare deel. Het is de machine die schrijft, samenvat, vertaalt, reasoning doet, code uitlegt, ideeën genereert en instructies omzet in outputs. Zonder een goed model produceert de fabriek niet. Maar een geïsoleerd model werkt slechts met wat er in zijn contextvenster past en wat het tijdens de training heeft geleerd. Dit is geschikt voor veel algemene taken, maar niet altijd voor het nauwkeurig beantwoorden van interne data, veranderlijke documenten of bedrijfsprocessen.
Daar komt RAG om de hoek kijken, ofwel het vergroten van generaties door retrieval. Het idee is niet dat het model alles moet herinneren, maar dat het de juiste informatie krijgt voordat het antwoord geeft. Microsoft beschrijft RAG als een patroon om de antwoorden van modellen te baseren op eigen inhoud door middel van retrieval, hybride zoeken en verbonden kennislagen die geïntegreerd zijn met AI-toepassingen.
In de metafoor van de fabriek is RAG de grondstofruimte. Voordat de machine begint te werken, moet iemand het document, contract, ticket, handleiding, stukje code of database-entry vinden dat relevant is voor de context. Zonder dat stuk kan het model overtuigend klinken, maar nog steeds fouten maken.
De vector-databank fungeert als opslag. Ze zet tekst, afbeeldingen of andere data om in wiskundige representaties, de bekende embeddings, waarmee informatie wordt teruggeroepen op basis van betekenis en niet enkel op letterlijke woordovereenkomsten. OpenAI beschrijft embeddings als representaties die de relatie meten tussen tekststrings en gebruikt worden voor zoeken, clustering, aanbevelingen, anomaliedetectie of classificatie.
Dit betekent niet dat vectorsearch voor alles toereikend is. Vaak wordt een goede architectuur gebruikt die semantisch zoeken combineert met traditionele tekstsearch, filters op metadata, permissies, datums, versies en reranking. De opslag is niet alleen bedoeld om veel op te slaan, maar om de juiste informatie op het juiste moment te leveren.
| Deel van de stack | Metafoor fabriek | Wat doet het |
|---|---|---|
| LLM | De machine | Genereert, redeneert, samenvat, legt uit en creëert |
| RAG | Grondstofruimte | Raadt informatie op voor het genereren |
| Vector-database | Opslag | Slaat kennis op die op betekenis gebaseerd kan worden teruggehaald |
| AI-agent | Plantmanager | Bepaalt stappen, gebruikt tools en voltooit taken |
| MCP | Standaardcontact | Verbindt modellen en agents met externe systemen |
| Beveiligingsbarrières | Veiligheidssysteem | Definieert grenzen, permissies en verboden acties |
| Evaluaties | Kwaliteitscontrole | Meet of het resultaat correct, veilig en nuttig is |
Agents maken van AI een proces
De volgende stap komt met agents. Een agent beperkt zich niet tot het beantwoorden van een vraag. Het kan beslissen wat de volgende stap is, een taak opsplitsen, een tool raadplegen, een bestand lezen, een API aanroepen, een draft voorbereiden, menselijke bevestiging vragen en doorgaan. Die capaciteit maakt van het model een onderdeel van een workflow.
Een voorbeeld verduidelijkt dit beter. Een chatbot kan antwoorden op “Hoe maak ik een factuur”. Een agent kan een bestelling bekijken, de klant in ERP raadplegen, een prijsverschil detecteren, de factuur voorbereiden, de financiën informeren en het goedkeuringsproces in gang zetten. Bij de tweede optie gaat het niet alleen om taal; het is operatie.
Maar agents hebben connecties nodig. Daar komt MCP, het Model Context Protocol, om de hoek kijken. Volgens de documentatie is het een open standaard om AI-toepassingen te verbinden met externe systemen zoals lokale bestanden, databases, tools of APIs. Het is vergelijkbaar met een USB-C-poort voor AI: een universele standaard voor vele verbindingen.
MCP vereenvoudigt het chaos van integraties. In plaats van maatwerk te maken tussen ieder model en elke tool, wordt één uniforme manier vastgesteld waarmee AI-toepassingen resources kunnen ontdekken en gebruiken. Anthropic presenteerde het in 2024 als een open standaard voor veilige, tweerichtingsverbindingen tussen datastromen en AI-gestuurde tools.
Het is belangrijk te benadrukken dat verbinding maken niet betekent dat alles zomaar open moet. Een agent met toegang tot te veel tools kan gevaarlijk worden. Het kan acties uitvoeren die niet toegestaan zijn, gegevens lezen die vertrouwelijk zijn, gevoelige informatie lekken of kwaadaardige instructies uitvoeren die verstopt zitten in documenten. Daarom heeft de fabriek beveiligingsbarrières nodig.
Veiligheid en evaluaties: onopvallende, maar essentiële onderdelen
De beveiligingsbarrières vormen een geheel van regels, permissies, filters, validaties en grenzen die bepalen wat de AI mag doen en wat niet. Ze zijn geen bijkomend sectoraal aspect aan het einde van het proces, maar geïntegreerd in het ontwerp.
In praktische toepassingen moeten de barrières bepalen welke data elk agent mag raadplegen, welke tools gebruikt kunnen worden, welke acties menselijke goedkeuring vereisen, welke output geblokkeerd moet worden, hoe om te gaan met vertrouwelijke gegevens en wat er gebeurt als het systeem onvoldoende vertrouwen heeft. Ook moet er onderscheid gemaakt worden tussen intern gebruik en externe communicatie. Het is niet hetzelfde een assistent die documentatie samenvat voor medewerkers, als een agent die betalingen uitvoert of klantgegevens wijzigt.
Het NIST AI Risk Management Framework positioneert risicobeheer als onderdeel van de levenscyclus van AI-systemen, met een focus op de impact op mensen, organisaties en de samenleving. Het is niet genoeg om enkel te meten of het model goed antwoordt; er moeten ook risico’s, gebruikscontext, governance en controles worden geëvalueerd.
Daarna komt de kwaliteitscontrole. Evals, of evaluaties, testen of het systeem doet wat het moet doen. Ze mogen niet beperkt blijven tot een handmatige test vóór een demo. Ze moeten de kwaliteit, veiligheid, kosten, latentie, foutpercentage, hallucineringen, toolgebruik, instructienaleving en de capaciteit om randgevallen op te vangen, meten.
OpenAI beschrijft evaluaties als een proces waarin de taak wordt gedefinieerd, getest met proefinputs en de resultaten worden beoordeeld om het gedrag van de toepassing met modellen te meten. Deze aanpak is essentieel om van een prototype een onderhoudbaar systeem te maken.
Ook moeten de evaluaties met eigen data gebeuren. Een support-systeem moet getest worden met echte of gesimuleerde tickets die representatief zijn voor de praktijk. Een financieel agent moet werken met onvolledige facturen, dubbele leveranciers en uitzonderingen. Een juridische tool moet prestaties meten op het gebied van citaten, nauwkeurigheid en coverage. Een marketingapplicatie moet het tonale, coherent en feitelijk correcte gedrag toetsen. Zonder dat soort controles produceert de fabriek wel, maar wordt er niemand gecontroleerd voordat de goederen de deur uit gaan.
De veelgemaakte fout: stukken bouwen zonder ze te orkestreren
Veel bedrijven kopen een model, bouwen een eenvoudige RAG en creëren een agent. Toch wordt de zaak niet altijd beter voor de bedrijfsdoelen. Vaak ligt de oorzaak in de integratie tussen de onderdelen.
Een slecht ontworpen RAG haalt irrelevante documenten op. Een vector-opslag zonder versiebeheer geeft verouderde handleidingen terug. Een agent zonder duidelijke permissies probeert te veel. Een MCP-server die niet goed is geconfigureerd, opent meer kwetsbaarheid dan nodig is. Een systeem zonder evaluaties lijkt prima te functioneren, totdat het in productie faalt. Een krachtig LLM kan al deze problemen verbergen tijdens een demo omdat het goed reageert, maar het echte probleem toont zich wanneer echte data, echte gebruikers en echte uitzonderingen binnenkomen.
Een AI-fabriek vereist een goede architectuur. Het gaat niet om het verbinden van tools slechts om het verbinden, maar om het ontwerpen van een workflow: wat komt erin, hoe wordt het gevalideerd, welke context wordt opgehaald, wat beslist de agent, welke acties worden uitgevoerd, wat wordt geblokkeerd, wat wordt geregistreerd en hoe wordt gemeten.
Het moderne AI-stacked vereist ook een bredere samenwerking. Het is niet alleen de taak van datawetenschappers. Product, engineering, security, legal, operations, business en eindgebruikers moeten allemaal bijdragen. Iedereen brengt verschillende perspectieven: welke processen hebben waarde, welke data is betrouwbaar, welk risico is acceptabel, welke output is echt nuttig en welke metrics tonen verbetering?
Van de demo naar een goed beheerde fabriek
De metafoor van de fabriek helpt omdat het AI praktisch maakt. Een bedrijf koopt niet zomaar een industriële machine en laat die in een lege loods staan. Het heeft grondstoffen, opslag, operators, elektriciteit, controles, onderhoud, beveiliging en kwaliteitszorg nodig. Bij AI is dat niet anders.
Het model is noodzakelijk, maar niet voldoende. RAG geeft context. Vector-bases helpen kennis op te halen. Agents vertalen antwoorden naar acties. MCP maakt verbindingen mogelijk. Beveiligingsbarrières verminderen risico’s. Evaluaties zorgen dat het systeem niet uitsluitend op intuïtie wordt gebouwd.
Wie dit begrijpt, heeft een praktische voorsprong. Zo kan men AI-systemen bouwen die minder indrukwekkend zijn tijdens de demo, maar veel betrouwbaarder in productie. In bedrijven is dat belangrijker dan een mooi antwoord op een scherm.
De volgende fase van AI wordt niet alleen bepaald door wie de nieuwste modellen gebruikt. Het hangt af van wie in staat is om een fabriek op te zetten die consistente, reproduceerbare en meetbare resultaten oplevert.
Veelgestelde vragen
Wat is de stack van een AI-toepassing?
Het is de set technische onderdelen die samenwerken om resultaten te genereren: model, retrieval, kennisbank, agents, tools, beveiliging en evaluaties.
Waarom is een krachtig LLM niet voldoende?
Omdat het model mogelijk niet over actuele data beschikt of niet de interne context van het bedrijf heeft. Zonder retrieval, permissies, tools en controles kunnen de antwoorden incompleet zijn of moeilijk in productie brengen.
Wat voegt RAG toe?
RAG haalt relevante informatie op voordat het model antwoordt, waardoor de antwoorden onderbouwd kunnen worden met documenten, databases of bedrijfskennis.
Wat is MCP?
MCP maakt het mogelijk om AI-applicaties en agents te verbinden met tools, bestanden, databases en APIs via een open standaard, waardoor integraties minder maatwerk vereisen.
Wat zijn evaluaties in AI?
Ze zijn tests om te beoordelen of een systeem goed reageert, tools correct gebruikt, veilig is, kosten beheersbaar blijven en het doel dat was gesteld, worden bereikt.
