De race om kunstmatige intelligentie verandert het machtskaart binnen de chipindustrie. Jarenlang lag de focus bijna uitsluitend op geavanceerde nodes, waferfabrieken en de capaciteit van bedrijven zoals TSMC, Samsung of Intel om steeds dichtere siliciumchips te produceren. Die knelpunten blijven relevant, maar verklaren niet langer op zichzelf wie tijdig AI-accelerators kan leveren.
De nieuwe bottleneck ligt verder in de toeleveringsketen: in geavanceerde packaging, HBM-geheugen, ABF-substraten, thermische testen, assemblage en eindvalidatie. Kortom, alles wat een verzameling chips, geheugen en materialen omzet tot een functioneel acceleratieapparaat dat in een AI-server kan worden geïnstalleerd.
Daar komen OSAT’s in het verhaal: afkorting van outsourced semiconductor assembly and test, gespecialiseerde bedrijven voor assemblage en testen van halfgeleiders. Hun rol is geëvolueerd van een minder zichtbare schakel in het proces naar een strategisch punt. Volgens DIGITIMES zorgt de cloudvraag naar AI voor bestellingen van packaging tot 2027 en geeft het OSAT’s meer marge om prijzen te verdedigen in een markt die voorheen meer cyclisch was.
De bottleneck verschuift van wafer naar pakket
De reden is zowel technisch als economisch. Modulaire AI-accelerators zijn niet langer simpele monolithische chips. Ze bevatten chiplets, meerdere compute-dies, stacks van HBM, interposers, multi-laag substraten en steeds krachtigere koelsystemen. Het fabricageproces van de die blijft complex, maar de echte uitdaging ligt in het verbinden van al die componenten met hoge prestaties, bandbreedte, energie-efficiëntie en betrouwbaarheid.
Santiago & Company vat het kernachtig samen: de rekenkracht van AI wordt niet meer alleen in waferfabrieken gewonnen, maar in de industriële infrastructuur die silicium omzet in inzetbare systemen. Het onderzoek stelt dat de bottleneck is verschoven naar de “fysieke integratiestack”: geavanceerd packaging, HBM, ABF-systeem, testcapaciteit en koeling.
Het meest opvallende gegeven dat deze verandering illustreert, is dat naar schatting rond 2025 ongeveer 90% van de wereldwijde levering van CoWoS en HBM in handen zou zijn van de grote chipontwerpers, terwijl ze slechts 12% van de geavanceerde logic dieien produceren. Met andere woorden: silicium vormt niet langer de grootste beperking. Wat echt schaars is, is de capaciteit om het te verpakken met hoog-bandbreedte geheugen en het als systeem te laten functioneren.
| Laag in de keten | Vóór | Nu met AI |
|---|---|---|
| Fabricage node | Meest voorkomen gebrek | Blijft kritiek, maar niet voldoende |
| HBM | Specialistisch component | Essentieel voor AI-accelerators |
| Geavanceerd packaging | Integratiefase | Strategische bottleneck |
| ABF-subbstraten | Technisch onzichtbaar materiaal | Factor in kosten en beschikbaarheid |
| Test en burn-in | Laatste controlefase | De daadwerkelijke uitgang van het product |
| OSAT | Externe dienstverlening | Met meer onderhandelingsmacht |
Daarom krijgen OSAT’s meer zeggenschap. Als orders maanden van tevoren worden vastgelegd en de beschikbare capaciteit niet zomaar kan worden uitgebreid, kunnen zij met lijnen voor assemblage, test en validatie in geavanceerde technologieën betere voorwaarden bedingen. Ze verkopen niet alleen “back-end diensten,” maar toegang tot schaars capaciteit.
CoWoS, HBM en ABF: de acroniemen die het probleem verklaren
De druk ligt niet op slechts één technologie. TSMC positioneert CoWoS als een van de belangrijkste platforms voor grote AI-accelerators. Volgens analyses van Santiago & Company mikt TSMC op een interne capaciteit van 127.000 wafers per maand voor eind 2026, terwijl onafhankelijke leveranciers zoals ASE Technology ongeveer 40.000 extra wafer-capaciteit per maand kunnen toevoegen.
Het probleem is dat een groot deel van die capaciteit al is gereserveerd. Volgens dezelfde analyse zou NVIDIA meer dan de helft van de voorziene CoWoS-capaciteit van TSMC hebben gereserveerd voor de cyclus 2026-2027, met een schatting van 800.000 tot 850.000 wafers om de Blackwell Ultra- en Rubin-systemen te ondersteunen. Indien deze inschatting klopt, strijden andere ontwikkelaars van eigen ASIC’s, kleinere cloudbedrijven en klanten om de resterende ruimte.
HBM-geheugen brengt extra druk met zich mee. Accelerators voor AI willen geheugen en compute zo dicht mogelijk bij elkaar brengen om prestatiebeperkingen door bandbreedte te vermijden. Dit vereist integratie van meerdere stacks HBM binnen het die-logboek, in steeds grotere pakketten. IDTechEx benadrukt dat AI- en HPC-systemen meer dies, I/O-dies en stacks HBM vereisen binnen één pakket, wat grotere platformen in 2.5D en 3D stimuleert.
ABF-subbstraten vormen een minder bekende bottleneck. Een geavanceerde accelerator kan tot tien keer meer ABF-materiaal gebruiken dan een standaard PC-processor. De kosten voor multi-laags substraten kunnen tussen de 30% en 40% van de materiaalkosten van het pakket zijn in complexe systemen. Volgens onderzoek van Santiago & Company wordt de markt voor dit soort substraten grotendeels gedomineerd door Unimicron, Ibiden en Shinko Electric, die ongeveer 75% van de globale markt beheersen.
| Onderdeel | Reden voor beperking |
|---|---|
| CoWoS / 2.5D | Integreert logica en HBM via interposer of brug |
| HBM | Bandbreedte, maar levering onder grote druk |
| ABF | Kritisch voor signaalrouting in grote pakketten |
| Hybrid bonding | Verhoogt de dichtheid van interconnect, maar vereist meer procescontrole |
| Panel-level packaging | Kan kosten verlagen, maar roept yield-problemen op |
| Thermisch testen | Verifiëert dat het pakket onder belasting functioneert |
Het resultaat is dat één defect in een enkel onderdeel de hele systeemketen kan vertragen. Het heeft geen zin om GPU’s te ontwerpen zonder HBM. Zonder goede HBM geen goede pakketten. Zonder de juiste substraten geen assemblage. En zonder genoeg test- en validatie-capaciteit geen goed product.
Meer capaciteit, maar niet op tijd voor iedereen
De industrie investeert in uitbreiding. TSMC, OSAT, geheugenleveranciers en substratenfabrikanten werken aan capaciteitsvergroting. Maar nieuwe lijnen komen niet binnen enkele weken. Voor substraten kost uitbreiding doorgaans 18 tot 24 maanden vanwege de planning van apparatuur en cleanrooms. In geavanceerd packaging vereist uitbreiding eveneens geavanceerde machines, beproefde processen, personeel, materialen en voldoende prestaties.
IDTechEx voorspelt dat de groei van geavanceerd packaging voor HPC een samengesteld jaarpercentage van bijna 30% zal behalen tussen 2026 en 2037. Ze verwachten dat pakketten groter worden, dat de adoptie van 2.5D en 3D toeneemt, en dat er meer interesse is in panel-level packaging, glass interposers, glass core substrates, hybrid bonding en co-packaged optics. De boodschap is duidelijk: packaging wordt niet meer een laatste fase, maar een innovatiedoorbraak.
Dit verklaart de prijsmacht van OSAT’s. Als de vraag naar AI de capaciteit tot 2027 volledig opvult, wordt de markt minder tactisch. Klanten kunnen niet meer wachten tot het laatste kwartaal om capaciteit te reserveren. Ze moeten eerder vastleggen, volumes toezeggen, strengere voorwaarden accepteren en in sommige gevallen cofinancieren.
TrendForce verwacht dat de grote tekorten aan 2.5D packaging vanaf 2027 licht kunnen afnemen, mede door de toename van CoWoS-productie door TSMC en de uitputting van orders die daarop aansluiten. “Licht afnemen” betekent niet dat het volledig normaliseert. Het betekent dat de keten meer adem krijgt, maar nog altijd onder druk blijft staan als de AI-vraag blijft groeien.
Het yield-risico: één defect kan de hele pakkeretraal laten stilvallen
Geavanceerd packaging brengt een bijkomend probleem: het yield-percentage wordt multiplicatief. Bij een monolithisch chip beïnvloedt één defect slechts één die. In een heterogeen pakket met logic, HBM, interposer en substraat kan een defect in één onderdeel het geheel onbruikbaar maken. Bij lage yields in vroege lijnen wordt de kosten per functioneel eenheid drastisch verhoogd.
Santiago & Company geeft een helder voorbeeld: in een systeem zoals de Blackwell ter waarde van 40.000 dollar zou een assemblagelijn met een yield van 60% de effectieve kosten per werkende eenheid verhogen tot ongeveer 66.600 dollar. Dit illustreert waarom testen, pre-screening van goede die en thermisch burn-in meerdere dagen geen secundaire fasen zijn, maar het beslissende deurtje dat bepaalt hoeveel accelerators daadwerkelijk klaar zijn voor inzet.
Voor hardware-inkopers betekent dit dat ze anders moeten gaan bestellen. Het is niet voldoende om chips te vragen. Ze moeten capaciteit voor integratie veiligstellen, inzicht hebben in leveranciers op tweede en derde niveau, reservaties voor testen maken, risico’s verdelen via afkeur en clausules opnemen die het volledige yield-risico niet bij de eindintegrator leggen.
Invloed op datacenters en cloud
De directe consequentie voor de cloudmarkt is dat als packaging duurder wordt en capaciteit maanden van tevoren wordt gereserveerd, AI-accelerators later arriveren, meer kosten en minder leveranciers overhouden. Giga-instellingen met grote financiële massa kunnen eerder reserveren. Kleinere leveranciers, eigen ASIC-producenten en bedrijven die infrastructuur buiten het hoofdcircuit willen opzetten, worden benadeeld.
Dit vertaalt zich ook in de prijzen voor clouddiensten, GPU-verhuur, clusterbeschikbaarheid en uitrolschema’s. De kosten van AI hangen niet alleen af van de GPU-prijs, maar van de hele fysieke keten: packaging, geheugen, substraten, testen, koeling, energie en datacentrumvergunningen.
De chipindustrie betreedt daarmee een minder zichtbaar, maar cruciaal stadium. Jarenlang keken we naar ondersteunde nodes: 7 nm, 5 nm, 3 nm, 2 nm. Nu moeten we naar het pakket kijken: hoeveel HBM, welk interposer, welk substraat, wat is de yield, waar wordt getest, wie heeft capaciteit gereserveerd en wie kan het uitvoeren?
AI stimuleert niet alleen de vraag naar GPU’s. Het hertekent ook de economie van halfgeleiders. In deze nieuwe economie is back-end niet meer de laatste fase, maar een cruciaal controlpunt in de keten.
Vragen & antwoorden
Wat is een OSAT?
Een OSAT is een bedrijf dat gespecialiseerd is in de assemblage en test van halfgeleiders. Ze werken in de latere fase van de productie, waarbij ze chips integreren, in pakketten plaatsen en valideren voor gebruik.
Waarom geeft AI prijsdruk aan OSAT’s?
Omdat AI-accelerators geavanceerd packaging, HBM, complexe substraten en strenge testen vereisen. Als die capaciteit tot 2027 vol zit, kunnen OSAT’s betere prijzen en voorwaarden afdwingen.
Wat is CoWoS?
CoWoS is een geavanceerde packaging-technologie van TSMC waarmee chips en HBM-geheugen in hoogpresterende pakketten worden geïntegreerd, veel gebruikt in AI-accelerators.
Waarom zijn ABF-subbstraten belangrijk?
Omdat ze de verbinding vormen tussen het pakker en het systeemboard en signaalrouting in grote pakketten mogelijk maken. Voor grote AI-accelerators vereisen ze veel materiaal en vormen ze een knelpunt.
Wordt het probleem in 2027 opgelost?
Het kan gedeeltelijk verminderen als nieuwe capaciteiten worden toegevoegd, maar het verdwijnt niet automatisch. De vraag naar AI, groei van grotere pakketten en behoefte aan HBM blijven de keten onder druk zetten.
