Skip to content

Blog

Waarom OTAP onvoldoende is om dataverlies te voorkomen

  • Home
  • Blog
  • Waarom OTAP onvoldoende is om dataverlies te voorkomen

De toenemende digitalisering zorgt ervoor dat steeds meer data op computers en servers terechtkomt. Om de kans op fouten in software te verkleinen, passen sommige bedrijven Ontwikkel, Test, Acceptatie en Productie (OTAP) toe, maar besteden daarin minder aandacht aan back-ups en het terugzetten daarvan.

Een reden hiervoor zou kunnen zijn dat het toevoegen van nieuwe functionaliteiten en het beschikbaar houden van software voor de klant belangrijker zijn. Echter, kan het gebeuren dat data aangedaan wordt door menselijke en/of technische acties. Het doel van deze blog is om uiteen te zetten waarom OTAP onvoldoende is om dataverlies te voorkomen.

Waarom is OTAP onvoldoende om een dergelijk dataverlies te voorkomen?

OTAP bestaat uit tenminste vier omgevingen, waarop software wordt neergezet en getest. De Ontwikkelomgeving wordt gebruikt om software op te ontwikkelen. Indien de ontwikkeling van iets nieuws is afgerond, kan men de software gaan deployen op een Test systeem. Indien de uitrol in een keer goed gaat en alle testen slagen, kan men doorgaan naar de Acceptatie en vervolgens naar Productie.

Voor de laatste omgeving kan men kiezen voor een handmatige interventie om er zeker van te zijn dat het uitrollen goed verloopt en er geen data verloren gaat.

De eerst drie fasen kunnen en moeten volledig worden geautomatiseerd. Indien de uitrol niet slaagt op een van de omgevingen, dient men terug te gaan naar de vorige omgeving, de fouten op te lossen en na het oplossen daarvan weer door te gaan naar de volgende fase.

Ontwikkel, Test, Acceptatie en Productie

Bovengenoemde werkwijze lijkt de kans op fouten aanzienlijk te verkleinen in vergelijking met het direct ontwikkelen op productie. Waarom is OTAP dan toch onvoldoende om dataverlies te voorkomen? OTAP is onvoldoende aangezien software bouwen verder gaat dan alleen het ontwikkelen daarvan. Software moet namelijk draaien op een systeem of tegenwoordig steeds vaker in containers op een container-orkestratie, zoals Kubernetes of OpenShift. Een dergelijke applicatie kan op zo’n platform neergezet worden door configuratie te deployen. Het kan voorvallen dat een applicatie ook bestanden op een schijf moet opslaan of in een database.

De configuratie van een container-orkestratie is ook essentieel. Aangezien na het doorlopen van OTAP de eerste klanten de software gaan gebruiken wordt het steeds belangrijker om de software draaiende te houden en nieuwe functionaliteit toe te voegen. Het zou namelijk kunnen zijn dat in de toekomst steeds meer klanten het platform  zullen gaan gebruiken, waardoor een back-up en de noodherstel procedure nog minder aandacht kunnen gaan krijgen.

BNOTAP

Dit kan voorkomen worden door bij de start van een nieuw project in plaats van OTAP, BNOTAP toe te passen. In laatst genoemd acroniem, staan B en N respectievelijk voor Back-up en Noodherstel.

Net zoals in OTAP, gaat BNOTAP van links naar rechts. In plaats van dat men direct start met de ontwikkeling van software in de Ontwikkelomgeving, begint men met het nadenken over welke data geback-upt moet gaan worden.

Denk daarbij aan de data die de verschillende applicaties gaan opslaan op schijven en in databases, de configuratie die nodig is om de applicatie op de container-orkestratie te deployen, de configuratie van het platform zelf, de applicaties code en images daarvan, maar ook de frequentie van de back-ups, het terugzetten en het testen daarvan.

BNOTAP kan (lees: “moet”) ook voor bestaande (langlopende) projecten toegepast worden. Het kan zijn dat men nooit eerder genoodzaakt is geweest een bepaalde back-up te herstellen en dat men erachter komt dat data in de back-up ontbreekt indien men wél genoodzaakt is een omgeving te herstellen.

Wat is een back-up?

De meningen over back-ups kunnen uiteenlopen. Sommige denken dat indien zij een database afnemen bij een cloud provider, zoals AWS, Azure of GCP dat de back-up dan automatisch geregeld is. Dit is echter niet waar.

Men moet altijd testen of de data er is. Soms komt men pas achter de kwaliteit van de back-up indien de data kwijt is en men moet gaan restoren. Een replicatie cluster is in ieder geval ook geen back-up aangezien menselijke of softwarefouten in de data “vrolijk” mee repliceren in de replicatie. Soms ontstaat er ook discussie over de duur van de back-up.

Hoe lang moet de data geback-upt worden?

Een week, een maand, een jaar? Wanneer is het lang genoeg? Een back-up is in ieder geval een onveranderlijk iets. Het is een opslag van data op een bepaald tijdstip, bijvoorbeeld een maand geleden om 05.00 uur, dat niet meer verandert. Op deze manier kan men een back-up terugzetten indien de data corrupt is geraakt door menselijke-, technische fouten en/of ransomware.

Het terugzetten van een dergelijke back-up is onderdeel van het Noodherstel proces, dat beschrijft welke stappen doorlopen moeten worden indien dataverlies is opgetreden. Het kan zijn dat deze gedocumenteerde procedure verouderd is binnen jouw organisatie, doordat het software landschap in de loop der tijd is veranderd en de documentatie niet is aangepast en/of verschillende versies bestaan, waardoor niet duidelijk is welke procedure gevolgd moet worden indien er problemen zijn. 

Is het voldoende dat een iemand in het team weet om een dergelijke back-up terug te zetten?

Neen, het kan uiteraard gebeuren dat deze persoon om wat voor reden dan ook niet aanwezig is net op het moment dat een back-up teruggezet moet worden. Daarom is het raadzaam dat ieder teamlid weet hoe de Noodherstel (N) procedure werkt en dat er getraind is om deze procedure uit te voeren. Ieder individu zou maandelijks een testomgeving moeten weggooien, een back-up terugzetten, meten hoe lang de 'N' duurt en testen of de back-up integer is, hetgeen betekent dat er geen dataverlies is.

Kortom, denk niet aan OTAP, maar aan BNOTAP aangezien hiermee voorkomen kan worden dat een incomplete back-up wordt teruggezet wanneer er sprake is van dataverlies en de klant niet kan verder werken.