Onderzoek onthult verborgen prestaties van SSD’s
Een recent onderzoek van de Technische Universiteit München en de Universiteit van Kopenhagen heeft aangetoond dat de specificaties van fabrikanten voor solid state drives (SSD’s) misleidend kunnen zijn. Hoewel veel modellen met vergelijkbare capaciteiten en technologieën als gelijkwaardig worden beschouwd, kunnen ze in de praktijk drastisch verschillend presteren onder echte werklasten.
Dit onderzoek, gepubliceerd in de Proceedings of the VLDB Endowment (PVLDB) onder de titel “SSD-iq: Uncovering the Hidden Side of SSD Performance”, introduceert een nieuwe benchmark – SSD-iq – die is ontworpen om die ‘verborgen gegevens’ bloot te leggen die traditionele tests niet tonen.
De grote vraag: Hoe belangrijk is de keuze van een SSD?
De onderzoekers begonnen met de vraag of het uitmaakt welk SSD-model in een databasesysteem wordt gebruikt. Tot nu toe hebben architecten en beheerders zich geleid door standaardmetingen: sequentiële lees- en schrijfsnelheden, IOPS (input/output operations per second) en soms nominale latentie. Het probleem is dat deze metrics niet de interne fenomenen vastleggen die cruciaal zijn, zoals schrijfversterking (WAF) of latentie onder belasting.
In experiments uitgevoerd met negen SSD’s van topfabrikanten zoals Samsung, SK Hynix, Intel, Micron, Western Digital en Kioxia, ontdekten de onderzoekers verschillen tot 2,5 keer in WAF en latenties die varieerden van microseconden tot milliseconden, zelfs in modellen die op papier bijna identiek waren.
Het zwakke punt: schrijfversterking (WAF)
Een van de belangrijkste bevindingen was de impact van de WAF. Terwijl een traditionele HDD op dezelfde plek kan schrijven, moet een SSD hele blokken wissen en geldige pagina’s verplaatsen, wat extra onzichtbare schrijfopdrachten genereert.
- Alibaba meldde al een WAF van tot 8 in hun cloud-berastingen, en NetApp van meer dan 10 in zakelijke omgevingen.
- In het onderzoek varieerden de gemeten WAF-waarden van 1,9 tot meer dan 6, afhankelijk van het model.
- Dit betekent dat een SSD intern 6 keer meer kan schrijven dan het besturingssysteem aangeeft, wat de levensduur verkort en de vervangingskosten verhoogt.
Bovendien hielpen belastingpatronen, zoals Zipf of Two-Zone, die gebruikelijk zijn in databases, niet om de WAF te verbeteren; in veel modellen verslechterden ze zelfs, wat aangeeft dat de controllers basale garbage collection-algoritmen gebruiken.
Latentie onder belasting: de verborgen face van milliseconden
Latentie onder belasting bleek ook cruciaal te zijn. Volgens de datasheets duurt een lezing ongeveer 75-80 μs en een schrijfactie ongeveer 15 μs. Echter, onder constante belasting:
- Sommige modellen behielden stabiele latentie rond de 20 μs.
- Andere schoten op naar meer dan 10 ms in hogere percentielen (p99.9).
Voor OLTP-toepassingen die afhankelijk zijn van directe bevestigingen, kan deze sprongetje verwoestend zijn.
De benchmark SSD-iq: meten wat echt telt
Om deze ondoorzichtigheid te bestrijden, ontwikkelden de onderzoekers SSD-iq, een open source testset beschikbaar op GitHub. In tegenstelling tot populaire benchmarks die gericht zijn op thuisgebruik, introduceert SSD-iq kritieke metrics voor databases en datacenters:
- Echte WAF: gemeten met de OCP NVMe-interface.
- Latentie onder belasting: inbegrepen in hoge percentielen (p99.9).
- Prestaties bij gespreide toegang: patronen die echte werklasten imiteren.
- Overprovisionering (OP): verborgen ruimte gereserveerd door de fabrikant voor het beheer van garbage collection.
Casestudy’s: Samsung vs Micron
Om het belang van deze bevindingen te illustreren, vergeleek het team twee bijna identieke modellen op specificaties en prijs: de Samsung PM9A3 en de Micron 7450 PRO.
- De Samsung bood betere stabiliteit onder belasting met 20.000 transacties per seconde in TPC-C.
- De Micron toonde een lagere WAF (meer levensduur), maar slechtere prestaties in OLTP-belastingen, met een daling naar 15.000 TPS in steady state.
Implicaties: duurzaamheid en toekomst
De auteurs benadrukken ook de impact op duurzaamheid. Elke SSD die voortijdig wordt vervangen, genereert elektronische afval en kosten die gepaard gaan met de productie. Het verminderen van de WAF met geavanceerdere algoritmen kan niet alleen de levensduur verlengen, maar ook de ecologische voetafdruk van datacenters verlagen.
Conclusie
Het onderzoek van Haas en zijn team weerlegt een hardnekkige mythe: SSD’s zijn niet uitwisselbaar. De specificaties op datasheets alleen zijn niet genoeg, en traditionele benchmarks onthullen meer dan ze tonen. Met SSD-iq kunnen we voor het eerst meten wat echt belangrijk is: latentie onder belasting, schrijfversterking en duurzaamheid.
Als de industrie en reviewers deze benchmark aannemen, kan dit een paradigmaverschuiving betekenen in hoe we opslag evalueren en kiezen in het tijdperk van AI en realtime transacties.
Veelgestelde vragen (FAQ)
Wat is schrijfversterking (WAF) in een SSD?
WAF meet hoeveel interne schrijfacties een SSD uitvoert voor elke logische schrijfactie van het systeem. Een WAF van 4 betekent dat voor elke GB die wordt geschreven, de SSD daadwerkelijk 4 GB schrijft, wat de levensduur drastisch verkort.
Waarom tonen traditionele benchmarks deze verschillen niet aan?
Omdat ze zich richten op eenvoudige testen die niet de complexiteit van echte werklasten in databases of cloud-systemen nabootsen en zowel WAF als extreme latenties onder belasting niet meten.
Welke voordelen biedt SSD-iq ten opzichte van andere tests?
Het introduceert realistische metrics die beter het gedrag in OLTP-omgevingen, cloud en bedrijfsapplicaties weerspiegelen.
Waar kan ik SSD-iq downloaden?
SSD-iq is open source en beschikbaar op GitHub: SSD-iq op GitHub. Het omvat scripts en gegevens om de experimenten te repliceren.