Uber heeft besloten zijn samenwerking met Amazon Web Services verder te versterken, in een beweging die verder gaat dan alleen cloudcapaciteit. Het bedrijf is zijn gebruik van AWS-infrastructuur uitgebreid om meer belasting te verwerken van haar realtime matching-systemen op basismodellen met Graviton4. Daarnaast is Uber begonnen met pilottests van het trainen van enkele AI-modellen op Trainium3, de door AWS ontwikkelde chips specifiek ontworpen voor AI-training. Deze ontwikkeling is significant omdat het aantoont hoe Uber haar multicloudstrategie verfijnt, niet alleen op basis van de leverancier, maar ook afhankelijk van het type silicium dat het beste past bij elke workload.
Volgens AWS zal Uber meer Graviton4-instanties inzetten om haar Trip Serving Zones te ondersteunen. Dit is de realtime infrastructuur achter elke rit of levering, waarmee locatiegegevens worden verwerkt en miljoenen voorspellingen in milliseconden worden gegenereerd. Tegelijkertijd is het bedrijf begonnen met testen van Trainium3 om enkele modellen te trainen die helpen bij het toewijzen van chauffeurs en bezorgers, het inschatten van aankomsttijden en het doen van gerichte leveringsadviezen. Kort gezegd, is er een onderscheid tussen de operationele uitvoering en de onderliggende leercapasiteit die deze beslissingen verbetert na verloop van tijd.
Graviton4 wint aan belang in een kritieke bedrijfscomponent
Het meest volwassen onderdeel van de aankondiging betreft Graviton4. AWS legt uit dat Uber al meer belasting verplaatst naar deze architectuur om het energieverbruik te verminderen, snel te kunnen opschalen tijdens vraagpieken en de latentie te verlagen in operations waar enkele milliseconden een directe impact op de gebruikerservaring kunnen hebben. Uber vat het kernachtig samen met de uitspraak: “Milliseconden tellen”. In een business model waarin het platform vraag en aanbod in realtime moet overeenstemmen, is computerefficiëntie geen detail.
Dit sluit aan bij de filosofie van Graviton binnen AWS. De op Arm gebaseerde Graviton-familie is al jaren gepositioneerd als een alternatief met een gunstige verhouding tussen prestatie en efficiëntie voor specifieke cloud workloads. Uber beperkt zich niet tot een volledige herstructurering van haar infrastructuur, maar breidt haar systemen uit op een van de meest gevoelige onderdelen van haar wereldwijde operatie. Dit wijst op een belangrijke strategie: Uber gebruikt AWS niet alleen voor algemene capaciteit, maar als een platform met hardware dat specifieke voordelen biedt voor geoptimaliseerde productie-workloads.
Trainium3 in pilottestfase en versterking van AI-focus
De andere pijler van de samenwerking is meer experimenteel, maar mogelijk strategisch op middellange termijn. Uber is begonnen met het testen van AI-modellen op Trainium3, AWS’ hardwareversneller voor training. AWS beweert dat deze modellen data analyseren van miljarden ritten en leveringen om het matchingproces te optimaliseren, aankomsttijden te berekenen en aanbevelingen te personaliseren. Vooralsnog benadrukt Amazon dat het hier gaat om een pilot, geen grootschalige migratie van de volledige AI-trainingsfase van Uber naar Trainium3.
Die nuance is belangrijk. In de huidige markt voor AI-chips kondigen veel bedrijven tests en pilots aan met alternatieve versnellers, maar zetten ze zelden meteen in op volledige vervanging van hun kernprocessen. Bij Uber lijkt de boodschap voorzichtiger: Trainium3 wordt ingezet als een optie om een technologische basis te creëren voor snellere en efficiëntere predicties en modellen, zonder deze beweging als een breuk met bestaande AI-infrastructuren te presenteren.
Een samenwerking met AWS die de multicloudstrategie niet ondermijnt
De aankondiging is ook interessant omdat ze niet in strijd is met de multicloud-strategie die Uber in 2023 formaliseerde. Dat jaar sloeg het bedrijf twee zevenjarige contracten met Oracle Cloud Infrastructure en Google Cloud af, als onderdeel van haar strategische uitfasering van eigen datacenters. Oracle kondigde officieel een strategisch partnerschap van zeven jaar aan om de cloud-migratie te versnellen, terwijl Google tegelijkertijd haar relatie met Uber uitbreidde om applicaties en data van on-premise datacenters naar Google Cloud te verplaatsen.
De kern is dus niet dat Uber haar multicloud-aanpak op geeft, maar dat die wordt verfijnd. Google en Oracle blijven onderdeel van haar langetermijnarchitectuur, terwijl AWS meer gewicht krijgt in gebieden waar het zich onderscheidt: het combineren van geoptimaliseerde algemene computercapaciteit met Graviton4 en mogelijk AI-trainingsmogelijkheden met Trainium3. Het gaat dus niet om een exclusieve keuze voor één leverancier, maar om een selectieve toewijzing van workloads op basis van kosten, latentie, flexibiliteit en hardwaretype.
Dit sluit ook aan bij Uber’s recente evolutie. Het bedrijf heeft in technische publicaties benadrukt dat haar infrastructuurmodernisering gericht is op meer productiviteit, snellere engineering en kostenoptimalisatie. Het uitbreiden van AWS voor een cruciaal onderdeel van de bedrijfsvoering is daarom geen koerswijziging, maar een verderzetting van een gedistribueerde architectuur waarin elke cloud een specifieke rol vervult.
AWS wint waardevolle referentie met eigen chips
Voor AWS heeft de samenwerking symbolisch en commercieel veel waarde. Uber is geen klein startup of testlab, maar een wereldwijde real-time dienst met miljoenen dagelijkse gebruikers en hoge eisen op het gebied van beschikbaarheid en latency. Dat een dergelijke speler meer workload naar Graviton4 verplaatst en Trainium3 begint te testen, geeft Amazon een krachtige referentie voor haar strategie van eigen silicium. Het draait niet enkel om cloudverkoop, maar om te bewijzen dat haar chips schaalbare, kritieke toepassingen kunnen ondersteunen.
Deze aankondiging benadrukt een groeiende trend in cloudinfrastructuur: de concurrentie wordt niet alleen meer tussen providers uitgevochten, maar ook tussen platforms met verschillend silicium. Uber heeft snelheid, elasticiteit, efficiëntie en een stevige basis nodig om haar modellen continu te verbeteren. AWS biedt met Graviton4 voor operationele taken en Trainium3 voor experimentele doeleinden concrete tools. Hoewel het nog geen volledige transformatie van de stack betekent, wijst het duidelijk in de richting van een cloud waar het onderliggende hardware veelal een bepalende factor wordt voor competitief voordeel.
Veelgestelde vragen
Wat gebruikt Uber precies van AWS in dit nieuwe akkoord?
Uber breidt haar gebruik van AWS Graviton4-instanties uit voor meer belasting in haar Trip Serving Zones en start met pilottests voor training van enkele AI-modellen op AWS Trainium3.
Wat zijn de Trip Serving Zones van Uber?
Dit is de realtime infrastructuur die ritten of leveringen beheert, data over locatie verwerkt en miljoenen voorspellingen in milliseconden doet om gebruikers en chauffeurs of bezorgers te verbinden.
Betekent dit dat Uber Google Cloud of Oracle Cloud verlaat?
Nee. Uber houdt vast aan haar multicloud-strategie. In 2023 sloeg het bedrijf twee zevenjarige contracten met Oracle en Google Cloud af om buiten eigen datacenters te migreren. Dit nieuwe akkoord met AWS wordt meer gezien als een gerichte uitbreiding van workloads, niet als een volledige vervanging van bestaande partnerschappen.
Wordt Trainium3 de basis voor al Uber’s AI?
Nog niet. AWS en Uber praten over een pilottest van enkele AI-modellen op Trainium3. Het is een belangrijke stap, maar nog in proeffase en niet aangesloten als volledige vervanging van de bestaande AI-infrastructuur.
