Massive voorkomt de “uitstaptarief” van de cloud met bare metal van DataPacket

Massive heeft een infrastructurele beslissing omgezet in een economisch voordeel. Het bedrijf, gespecialiseerd in realtime webtoegang voor AI-agenten, scrapers en datapijplijnen, runt een deel van zijn platform op dedicated bare metal-servers van DataPacket in plaats van te vertrouwen op een traditionele hyperscale-omgeving. Het resultaat dat het casestudy benadrukt, is opvallend: een gemiddelde latency van slechts 2 milliseconden naar grote cloudproviders, piekbelasting van 20 Gbps zonder extra kosten en een geschatte besparing van 2,9 miljoen dollar per jaar ten opzichte van de uitgaande dataverkeerkosten bij grote cloudaanbieders.

Deze keuze is niet alleen technisch. Het is een strategische zet om het bedrijfsmodel te beschermen. Massive biedt toegang tot levende websites, HTML-rendering en gestructureerde zoekresultaten voor klanten die AI-agenten en geautomatiseerde systemen voeden. Elke aanvraag wordt via hun infrastructuur verstuurd, haalt content van het web, en keert terug met gegevens die vervolgens aan de klant worden geleverd. In een cloud met kosten per gigabyte uitgaand verkeer, wordt deze werkwijze een kostenpost bij groei: hoe meer gebruik, hoe hoger de egress-kosten.

De publicatie door DataPacket vat de paradox treffend samen. AI-lasten worden vaak gehost op AWS, Google Cloud of Azure. Maar de webtoegangslaag die hen voedt, kan zich op een andere locatie bevinden. Als die laag ver weg is, betaalt elke oproep in latency. En als die laag zich binnen een provider bevindt die uitgaand verkeer per gigabyte rekent, betaalt men ook voor groei in de factuur. Massive heeft geprobeerd deze problemen aan te pakken door hun infrastructuur dicht bij de grote clouds te plaatsen, maar buiten diens egress-prijzenmodel.

Waarom webtoegang voor AI zo zwaar tilt op uitgaand verkeer

De corebusiness van Massive is puur netwerkrich. Klanten sturen verzoeken naar network.joinmassive.com, en het platform leidt deze via een wereldwijd netwerk van miljoenen vrijwillige, consent-geverende devices in meer dan 195 landen. Het doel is om realtime pagina’s, rendering-inhoud en zoekresultaten van echte locaties te verkrijgen.

In dit soort diensten is bandbreedte geen secundair detail. Het is het product in beweging. Een AI-agent die een website moet raadplegen, data moet extraheren, een gerenderde pagina moet lezen of zoekresultaten moet analyseren, verbruikt niet alleen CPU, maar ook netwerk, latency, stabiliteit en responsiviteit.

DataPacket schetst drie redenen waarom een architectuur gebaseerd op grote clouds problematisch kan zijn voor Massive. Ten eerste de egress-tarieven: elke byte die uitgaat, kost geld. Ten tweede dat veel doelwebsites ook in grote clouds gehost worden, wat kan leiden tot cloud-to-cloud routes met onnodige hops en vertragingen. Ten derde de voorspelbaarheid: een webtoegangsplatform hangt af van een lage latency p99, en gedeelde virtualisatie-omgevingen kunnen variabele prestaties introduceerden.

Casestatistieken MassiveGerapporteerde resultaten
Gemiddelde latency naar grote clouds2 ms
Piek belasting20 Gbps
Geschatte jaarlijkse besparing op egresskosten2,9 miljoen dollar
Landengroepen bediend door Massive-netwerkMeer dan 195
Sucessratio eerste poging99,8%
Gemiddelde responstijdMinder dan 600 ms
Uptime SLA99,9%
Geannualiseerd groeicijfer4-5x per jaar

Het belangrijkste verschil zit in het kostenmodel. In een traditionele cloud kunnen intensieve datastromen leiden tot een opschaling van de uitgaven, omdat je betaalt per gebruikte gigabyte. In een dedicated bare metal-omgeving met vaste bandbreedteplannen, voeg je servers toe en vergroot je capaciteit, zonder dat je per gigabyte extra betaalt. Voor een bedrijf dat jaarlijks 4 tot 5 keer groeit, bepaalt dat of de marges verbeteren of ondermijnd worden.

Bare metal, directe peering en kortere afstand tot de cloud

Massive voert zijn webtoegangs-infrastructuur uit op dedicated bare metal-servers op vier locaties van DataPacket, gekozen vanwege hun directe verbinding met grote cloudproviders. De logica is simpel: aangezien veel Massive-klanten AI-lasten binnen AWS, GCP of Azure draaien, en veel doelwebsites zich in deze clouds bevinden, reduceert het dichterbij zitten de latentie per aanvraag aanzienlijk.

De infrastructuur combineert recente AMD EPYC-servers, NVMe-opslag, DDR5-geheugen, niet-gedeelde 2x25GE-koppelingen per server en regionale traffic pooling voor efficiënter omgaan met pieken. Het bandbreedtemodel is gebaseerd op het 95e percentiel, waarmee het hoogste 5% van verkeer wordt genegeerd, wat gangbaar is bij high-volume netwerkdiensten.

Privé peering met grote clouds is cruciaal. In plaats van al het verkeer via het openbare internet te sturen, kunnen meerdere routes via private verbindingen worden verloopt, korter en voorspelbaarder. Voor een dienst die snelle reacties belooft voor AI-agenten, zijn 2 milliseconden gemiddeld naar grote clouds geen marketingcount, maar onderdeel van de gebruikerservaring.

InfrastructuurlayerFocus bij Massive
ComputingDedicated bare metal servers
ProcessorsAMD EPYC
StorageNVMe
GeheugenDDR5
Netwerk per server2x25GE niet-gedeeld
Traffic facturatiePercentiel 95, geen kosten per GB
Cloud connectiviteitPrivé peering met grote providers
OperatiesOndersteuning door netwerk engineers via Slack

Daarnaast speelt controle een rol. Deployen op bare metal vergt meer voorbereiding en planning dan simpelweg op een hyperscale-omgeving klikken op ‘deploy’. Capaciteit, regio’s, netwerk, monitoring, automatisering en operatie moeten zorgvuldig worden gepland. Als resultaat krijg je hardware die specifiek, voorspelbare routepaden biedt, en minder verrassingen door onvoorspelbaar verkeer.

Drie API’s op dezelfde fysieke infrastructuur

De casestudy identificeert drie hoofdproducten van Massive die dezelfde onderliggende infrastructuur delen. Web Access API biedt proxy-toegang tot het internet via HTTPS, HTTP en SOCKS5, met behulp van het wereldwijde netwerk van devices in meer dan 195 landen. Web Render API levert volledige rendering met JavaScript en kan HTML of Markdown leveren, klaar voor taalmodellen. Web Search API biedt gestructureerde Google SERP-resultaten, inclusief organisch, AI-overzichten, FAQ’s en sitelinks, geografisch gelokaliseerd.

De onderliggende infrastructuur is niet zichtbaar voor eindgebruikers, maar bepaalt of het product schaalbaar en betrouwbaar is. Elke call kost variabel geld als het verkeer niet goed wordt gemanaged, en elke vertraging beïnvloedt de ervaring van AI-agents sterk. Pieken in verkeer die onverwacht kosten veroorzaken, maken de financiële planning fragiel.

Jason Grad, CEO en medeoprichter van Massive, vat het kernpunt samen: het opschalen van webtoegangsaccess met egress-prijzen kan snel kostbaar worden. Met DataPacket krijgt het bedrijf de benodigde throughput en weet het elke maand wat het betaalt. Volgens hem zou de infrastructuurkosten bij hyperscalares even snel toenemen als de business zelf, wat de growth-beperkingen onderstreept.

Deze analyse bewijst waarom dit geval relevant is voor andere bedrijven. Veel AI-ondernemingen ontdekken dat grote clouds ideaal zijn voor snelle start, testing en schaalvergroting, maar dat voor datarijke en latency-gevoelige diensten, een hybride aanpak met dedicated hardware en goede peering veel efficiënter is. Als het draait om datamobiliteit, wordt de datakostenstrategie cruciaal.

Een belangrijke les voor AI-infrastructuur

Het Massive-DataPacket-voorbeeld betekent niet dat bare metal voor alles het beste is. Grote clouds blijven geschikt voor beheerde services, elasticiteit, databases, analytics en grootschalig trainen en deployen. Maar het laat zien dat niet alle lagen binnen hetzelfde cloud-ecosysteem hoeven te blijven.

De webtoegangslaag, proxy, scraping, rendering of zoekfunctie kan profiteren van een dedicated netwerk dat lage, voorspelbare latentie biedt naar de clouds waar de agenten draaien. Het is een hybride patroon: modellen en applicaties kunnen in AWS, GCP of Azure blijven, terwijl een gespecialiseerde netwerklayer in bare metal de communicatie optimaliseert.

Voor bedrijven die regelmatig crawlen, chatbots, pipelines of RAG-systemen bouwen, is deze architectuur het overwegen waard. Het gaat niet alleen om de GPUs, maar vooral om de hoeveelheid dataverkeer, kosten, latency en schaalbaarheid te plannen — voordat je in hardware investeert.

Massive kiest voor een duidelijk pad: investeren in dedicated infrastructure en voorspelbare bandbreedte, in plaats van te rekenen op variabele egress-kosten. In een markt waarin realtime webcontent voor AI wordt verwerkt, is dat geen detail, maar essentieel onderdeel van het product.

Veelgestelde vragen

Welke uitdaging heeft Massive opgelost met DataPacket?
Massive wilde een infrastructuur die grote hoeveelheden webverkeer kan verwerken voor AI-agenten, zonder dat egress-kosten van hyperscale-omgevingen de groei zouden belemmeren.

Wat zijn de voordelen van dedicated bare metal?
Volgens de case: 2 ms gemiddelde latency naar grote clouds, de capaciteit om pieken tot 20 Gbps op te vangen zonder extra kosten en een geschatte jaarlijkse besparing van 2,9 miljoen dollar in vergelijking met cloud-uitgaande kosten.

Waarom is egress zo belangrijk voor AI-diensten?
Omdat veel van deze diensten grote hoeveelheden content moeten lezen, renderen en terugsturen. Als elke gigabyte uitgaande data variabel wordt gefactureerd, wordt groei kostbaar en onvoorspelbaar.

Betekent dit dat bare metal altijd beter is dan de publieke cloud?
Niet per se. Clouds blijven ideaal voor veel toepassingen. Maar voor datarijke, latencykritische diensten met veel verkeer, kan een hybride, dedicated aanpak beter voorspelbaar en kosteneffectief zijn.

Scroll naar boven