Samsung Electro-Mechanics heeft begonnen met de massaproductie van FC-BGA substrates voor de Qualcomm AI200, de eerste kunstmatige intelligentie versneller van Qualcomm gericht op datacenters. Dit nieuws, gerapporteerd door ZDNet Korea en samengevat door SamMobile, versterkt een relatie die voorheen vooral gericht was op processors voor mobiele telefoons en pc’s, en brengt het naar een groeimarkt: AI-infrastructuur voor inferentie.
Hoewel het misschien minder spectaculair lijkt dan grote aankondigingen van GPU’s, HBM-geheugen of nieuwe racks van 160 kW, is het dat niet. Geavanceerde encapsulatiedragers zijn uitgegroeid tot een kritieke schakel in de halfgeleiderketen. Zonder deze substrates kunnen chips niet efficiënt op het bord worden aangesloten, wordt de warmte niet goed afgevoerd en kunnen de elektrische snelheden, noodzakelijk voor moderne accelerators, niet worden gehaald. In datacenter-AI wordt de strijd ook onder silicon uit gevoerd.
Wat levert het FC-BGA op voor Qualcomm AI200?
FC-BGA staat voor Flip-Chip Ball Grid Array. Het is een type encapsulatieboard dat de verbinding maakt tussen de chip en het bord via kleine bumps in plaats van traditioneel draadbinden. De voordelen liggen in betere elektrische en thermische eigenschappen, twee essentiële factoren bij werk met high-performance halfgeleiders.
Volgens de beschikbare informatie is Samsung Electro-Mechanics gestart met de productie in hun fabriek in Busan, Zuid-Korea. De FC-BGA voor de Qualcomm AI200 zou tussen de 10 en 15 interne lagen bevatten, wat minder complex is dan de meer dan 20 lagen die in high-end trainingaccelerators worden toegepast. Deze verschillen passen bij de focus van de AI200: niet ontworpen voor zwaar trainingwerk dat concurreert met systemen van NVIDIA of AMD, maar voor AI-inferentie op rack-schaal.
Qualcomm introduceerde officieel de AI200 en AI250 in oktober 2025 als oplossingen geoptimaliseerd voor datacenter-inferentie. De AI200 staat gepland voor 2026, en de AI250 voor 2027. Het bedrijf beweert dat de AI200 beschikt over 768 GB LPDDR-geheugen per kaart, directe vloeistofkoeling, PCIe voor interne schaalbaarheid, Ethernet voor systeem-naar-systeem communicatie, confidential computing en een rack-vermogen van 160 kW. De strategie ligt niet in het gebruik van HBM in deze eerste generatie, maar in een architectuur die gericht is op geheugen capaciteit, energie-efficiëntie en lagere kosten per inferentie.
| Onderdeel | Qualcomm AI200 | Toepassing in datacenters |
|---|---|---|
| Type product | AI-versneller voor inferentie | Gekenmerkt voor het uitvoeren van vooraf getrainde modellen |
| Beschikbaarheid | 2026 | Eerste generatie van Qualcomm’s nieuwe roadmap |
| Geheugen | 768 GB LPDDR per kaart | Grotere capaciteit en lagere kosten dan HBM-gebaseerde alternatieven |
| Encapsulatie | FC-BGA geproduceerd door Samsung Electro-Mechanics | Kritisch voor elektrische verbindingen en thermisch beheer |
| Lagen substrate | 10 tot 15, volgens beschikbare info | Minder complex dan ultra-high-end trainingaccelerators |
| Schaalbaarheid | PCIe en Ethernet | Integratie in systemen en racks voor inferentie |
| Koeling | Directe vloeistofkoeling op rack-niveau | Ontworpen voor hoge dichtheid in datacenters |
| Volgende generatie | Qualcomm AI250 in 2027 | Wordt geheugenarchitectuur gebaseerd op near-memory computing |
Qualcomm zoekt een plek tussen NVIDIA, AMD en eigen chips
De intrede van Qualcomm in AI-versnellers voor datacenters is niet vanaf nul begonnen. Het bedrijf ontwikkelt al jaren NPUs, low-power processors en AI-oplossingen voor apparaten, maar de sprong naar inference-racks brengt het in een andere league. De markt die Qualcomm wil betreden wordt dominantie door NVIDIA bij training en een toenemende concurrentie in inferentie, waar ook AMD, Intel, Broadcom, Marvell, de chips van hyper-skalers en speciale nieuwe spelers actief zijn.
Qualcomm wil zich niet simpelweg als een kopie van HBM + GPU-model profileren. Hun verhaal richt zich op prestatie-per-euro en prestatie-per-watt, geheugencapaciteit met LPDDR, compatibiliteit met AI-frameworks en het inzetten van getrainde taal- en multimodale modellen. Deze differentiatie is zinvol omdat inferentie straks een enorme kostenpost wordt in AI. Het trainen van een model is kostbaar, maar het dagelijks inzetten ervan voor miljoenen gebruikers is dat ook.
Daarom krijgt de encapsulatie een centrale rol. De beschikbaarheid van hoogwaardige FC-BGA kan bepalend zijn voor de capaciteit om geavanceerde chips in grote volumes te produceren. Grote accelerators vereisen substrates met meer lagen, materialen zoals ABF, strakke toleranties en voldoende thermische capaciteit. De keten was al onder druk door CPU’s, GPU’s, ASIC’s en netwerkmiddelen. Dat Samsung Electro-Mechanics als leverancier van het AI200 optreedt, illustreert hoe Koreaanse componentenmakers proberen waarde te creëren in AI-ontwikkeling, los van alleen geheugen.
Voor Samsung Electro-Mechanics is het een strategische groeikans. Het bedrijf investeerde al in het uitbreiden van hun FC-BGA-activiteiten, onder meer met een plan van 850 miljoen dollar aangekondigd in 2021 voor productiecapaciteit in Vietnam, en leverde al substrates voor Qualcomm’s mobiele processors. Nu verschuift de focus naar een markt met productcycli en eisen die meer lijken op die van servers.
Inferentie opent een nieuwe toeleveringsketen
De AI200 helpt ook om een belangrijke verschillen te begrijpen binnen AI. Niet alle infrastructuur is gelijk ontworpen. Accelerators voor zwaar trainen vereisen vaak HBM, zeer dense interconnects, complexere encapsulatie en systemen die grote hoeveelheden data weken of maanden lang kunnen verwerken. Inference daarentegen moet snel antwoorden kunnen leveren, met lage latency, lage kosten en schaling naar vele gebruikers of agenten.
Daarom kan een inferentie-chip kiezen voor een andere architectuur. Het gebruik van LPDDR5 verlaagt de complexiteit ten opzichte van HBM en maakt meer geheugencapaciteit per kaart mogelijk, met een ander bandwidthprofiel. Bij grote taalmodellen, waar kosten per token en rack-verbruik toenemen, kan deze aanpak concurrerend zijn mits de software meewerkt en het systeem goed wordt gebruikt.
Qualcomm verzekert dat AI200 en AI250 deel uitmaken van een jaarlijkse roadmap voor datacenters. De AI250, gepland voor 2027, zal een geheugenarchitectuur bevatten gebaseerd op near-memory computing die een sprong in effectief bandwidth en efficiëntie belooft ten opzichte van de AI200. Het is nog afwachten hoe groot de adoptie zal zijn, maar dat Samsung Electro-Mechanics al productie voor de eerste producten is gestart, wijst op een concreter ontwikkeltraject dan enkel een commerciële lancering.
De mogelijke betrokkenheid van LG Innotek bij de AI200-toeleveringsketen volgend jaar, eveneens gerapporteerd, versterkt deze trend. Geavanceerde substrates worden een strategische markt voor Zuid-Korea, vergelijkbaar met de rol van HBM-geheugen voor SK Hynix, Samsung Electronics en Micron. In AI is de waarde niet langer alleen voor de chipontwerpers, maar wordt ook gedeeld met foundries, geavanceerde encapsulatie, geheugen, substrates, netwerken, koeling en rack-assemblage.
De boodschap voor de cloudmarkt is helder: de expansie van generatieve AI herschikt de hele infrastructuurketen. Qualcomm wil de markt betreden via efficiënte inferentie. Samsung Electro-Mechanics wil dat haar substrates onderdeel worden van deze vraag. En cloud providers zoeken alternatieven die de kosten voor grootschalige modeluitvoering kunnen verlagen, zonder uitsluitend afhankelijk te zijn van de duurste platforms op de markt.
Het succes van de AI200 hangt niet alleen af van de chip zelf. Ook software, beschikbaarheid, kosten, rack-integratie, energieverbruik, geheugen, netwerk en fabricagecapaciteit spelen een rol. Hoewel de start van FC-BGA-productie in Busan belangrijk is, lost het niet alle vraagstukken op, maar geeft het wel een belangrijke indicatie: Qualcomm beweegt haar supply chain voor succesvolle marktintroductie van datacenter-AI.
Veelgestelde vragen
Wat produceert Samsung Electro-Mechanics voor Qualcomm?
Volgens ZDNet Korea en SamMobile is Samsung Electro-Mechanics begonnen met de productie van FC-BGA substrates voor de Qualcomm AI200, de eerste AI-versneller van Qualcomm gericht op datacenters.
Wat is een FC-BGA substrate?
Het is een geavanceerde basis van encapsulatie die de chip via bumps in flip-chip configuratie verbindt met het bord. Hiermee biedt het betere elektrische en thermische eigenschappen dan traditioneel draadbinden, en wordt daarom gebruikt in high-performance halfgeleiders.
Hoe verhoudt de Qualcomm AI200 zich tot GPU’s van NVIDIA voor training?
Niet helemaal hetzelfde. AI200 is geoptimaliseerd voor inferentie—het uitvoeren van al getrainde modellen. Het ontwerp met LPDDR-geheugen richt zich op capaciteit, energie-efficiëntie en lagere operationele kosten, niet op zwaar trainen met HBM.
Wanneer komen de Qualcomm AI200 en AI250 uit?
Qualcomm verwacht de AI200 in 2026 op de markt te brengen en de AI250 in 2027. De AI250 zal een geheugenarchitectuur gebaseerd op near-memory computing bevatten.
vía: sammobile
