X (Twitter) Facebook LinkedIn Email WhatsApp

Investeringen in Back-up: De Kritieke Nodige Verandering

In de afgelopen jaren heeft de sector een aanzienlijke investering gedaan in back-up oplossingen, zoals deduplicatie en gegevensretentie, vooral na de toename van ransomware-aanvallen. Maar op de cruciale momenten blijken veel bedrijven te falen: ze hebben weliswaar back-ups, maar kunnen deze niet op tijd herstellen. De hersteldoelen (RTO) verschuiven van uren naar dagen, wat resulteert in enorme operationele en financiële gevolgen.

De Blinde Vlek van Back-up Oplossingen

Experts wijzen op een terugkerend probleem: back-up repositories en appliances zijn doorgaans geoptimaliseerd voor het efficiënt opslaan van gegevens, bijvoorbeeld via compressie en deduplicatie, maar niet voor het gelijktijdig herstellen van meerdere gegevenssets. Dit leidt tot overbelasting van CPU’s, volledige schijven en verzadigde IOPS, waardoor herstelprocedures langzamer verlopen dan gewenst. “Als je afhankelijk bent van een systeem dat is afgestemd op deduplicatie maar niet op gelijktijdige leesoperaties, ben je eigenlijk alleen maar opslag aan het kopen, niet continuïteit van de bedrijfsvoering,” legt David Carrero, co-founder van Stackscale, uit.

De ILLUSIE VAN DEDUPLICATIE RATIO’S

Deduplicatie werkt en helpt kosten te besparen, maar het herstelproces kan complex worden. Om een aantal terabytes van “logische” gegevens te reconstrueren, kunnen honderden duizenden willekeurige leesopdrachten nodig zijn. Dit leidt tot een aanzienlijke toename van de latentie en IOPS, vooral als er ook encryptie of compressie op de achtergrond plaatsvindt. “Elke mate van deduplicatie komt met de belofte van I/O op de dag van herstel. De enige relevante metric is niet de ‘ratio’, maar hoeveel TB per uur je kunt herstellen met meerdere gelijktijdige VMs,” waarschuwt Carrero.

Prestatie-indicatoren voor Herstel

Experts adviseren bedrijven om de Index van Herstelprestaties (RPI) als KPI te implementeren, die specifiek focust op het aantal TB dat kan worden hersteld met een bepaald aantal gelijktijdige restoraties. Dit cijfer, en niet de besparingen van deduplicatie, zou moeten aandrijven wat er gekocht wordt en hoe continuïteitsplannen worden opgesteld.

Voorbeeld van Herstel

Bijvoorbeeld, om 50 TB te herstellen met een effectief throughput van 600 MB/s kan dit ongeveer 25 uur duren, exclusief extra tijd voor systeemherstel of validatie. Bij 100 TB kan dit zelfs verdubbelen. “Een serieuze back-upstrategie moet elke kwartaal een RPI rapporteren,” zegt Carrero.

Ontwerpen voor Herstel

Er is een consensus over de noodzaak van een gelaagd ontwerp:

Warme Laag voor Direct Herstel: Snel toegankelijke repositories die het mogelijk maken om VMs direct te herstellen.
Replica’s voor Kritische Applicaties: Snapshots en replica’s voor toepassingen die geen lange stilstand kunnen veroorloven.
Herstelplannen: Orkestreren van een capaciteit waar 200 VMs tegelijk moeten worden hersteld, inclusief netwerk- en licentie-afstemming.
Gegarandeerde Netwerkcapaciteit: Voldoende proxies en netwerkbandbreedte om gelijktijdige restore-requests aan te kunnen.
Beveiliging en Inachtneming: Gebruik van onbruikbare kopieën en een “schone kamer” voor dataverificatie.

Fouten die Incidenten in Crisis Veranderen

Bedrijven moeten opvallende fouten vermijden, zoals het verwarren van testomstandigheden met reële scenario’s, het kopen van oplossingen zonder rekening te houden met de prestaties gedurende piekbelastingen, en het verwaarlozen van een selectie prioriteiten in hun diensten.

Een Actieplan in 90 Dagen

Dag 0-15: Definieer de essentiële diensten en meet de basis RPI.
Dag 16-45: Introduceer een warme laag en schaaf de netwerkcapaciteit bij.
Dag 46-90: Versterk beveiligingsmaatregelen en automatiseer het herstelproces.

Carrero benadrukt: “Als je binnen 90 dagen geen grafieken kunt tonen waarin de RPI stijgt en de RTO daalt, zijn je inspanningen slechts gericht op opslagbeheer en niet op bedrijfscontinuïteit.”

Conclusie

Back-up is geen opslagproject meer; het is een capaciteit voor continuïteit die moet worden gemeten in tijd en service. De meeste recente rampen zijn niet te wijten aan een gebrek aan back-ups, maar aan de onvermogen om deze op het vereiste tempo te leveren. Verandering is nodig: investeer in herstel, meet de RPI en voer reguliere massahersteltests uit om het verschil te maken tussen een goed beheerd incident en een echte crisis.

X (Twitter) Facebook LinkedIn Email WhatsApp