10 dingen om op te nemen in uw checklist voor rampenherstelplan

A ramp herstelplan (DRP) is een document dat u bij de hand moet houden om onverwachte incidenten af ​​te handelen die de IT-systemen van uw bedrijf zouden kunnen afsluiten en de algehele werking ervan zouden kunnen belemmeren.
Een DRP streeft ernaar zet uw bedrijf op de rails zo snel mogelijk bij een calamiteit of datalek. Met een effectief noodherstel plan, is er minder kans dat u te lang winst misloopt. Er moeten ook back-ups zijn ingesteld om te voorkomen dat gevoelige gegevens (burgerservicenummers of creditcardgegevens) in gevaar komen.

Heeft uw bedrijf een noodherstelplan?

Data verlies, downtime en technische aanslagen zijn enkele van de nieuwe horrorverhalen die zelfs de beste bedrijven tegenwoordig tegenkomen. Telkens wanneer zich een ramp voordoet in een bedrijf, haasten de engineeringteams zich om de schade te herstellen, en aan de andere kant maken PR-teams overuren om het vertrouwen van de klant te herstellen. Vind je het niet een tijdrovende en dure inspanning? Natuurlijk is het! Maar sommige organisaties beheren deze rampen het meest effectief en ook dat met minder nevenschade. Vraagt ​​u zich af hoe? Ze hebben eenvoudig een uitgebreid, gemakkelijk te volgen en regelmatig getest noodherstelplan.

Rampen komen onuitgenodigd met tal van complexe uitdagingen, waar organisaties maanden of jaren over doen om het hoofd te bieden. Cyberaanvallen, tornado's, terroristische aanslagen, orkanen en overstromingen zijn enkele van de rampen die datalekken kunnen veroorzaken. Een rampenplan is een garantie voor de lange termijn dat het bedrijf operationeel is, aangezien het zo is ontworpen dat het bedrijven in staat stelt schade door onvoorziene uitval te verminderen.

Heeft u een noodherstelplan of begint u net met het maken van een plan voor uw organisatie? In beide gevallen helpt de onderstaande checklist voor noodherstelplannen u om alle cruciale componenten aan uw plan toe te voegen.

1. Analyseer mogelijke bedreigingen en mogelijke reacties

Het eerste is om de tijd te nemen en alle mogelijke factoren te analyseren die uw bedrijfsstroom kunnen verstoren. Als u klaar bent met het onderzoek, is het tijd om voor elk van die scenario's een ander herstelplan te maken. Cyberaanvallen komen bijvoorbeeld steeds vaker voor en zullen waarschijnlijk plaatsvinden, en helaas is de gemiddelde firewall niet zo sterk genoeg om tegen de meeste van hen te beschermen.

Kijk dus intensiever naar de mogelijkheid van een cyberaanval dan je zou zeggen een tsunami. U kunt ervoor kiezen om gegevens te versleutelen en hardware te beveiligen. Probeer de kwetsbaarheden in uw systemen te begrijpen, aangezien dit de toegangspunten zijn die een hacker zal gebruiken om toegang te krijgen.

De beste manier is om op de hoogte te blijven van de vele schema's die hackers gebruiken. U kunt de meeste phishing- en malwarebesmettingen voorkomen.

2. Herstel de doelstellingen voor noodherstel

Noodherstel helpt u om uw bedrijf constant en normaal te laten functioneren, dus u moet de IT-services repareren die het meest essentieel zijn voor het runnen van uw organisatie. Ook zijn de Recovery Time Objective (RTO) en Recovery Point Objective (RPO) vereist voor deze services / machines. Maar kent u RTO en RPO?

RPO: de hoeveelheid tijd die nodig is om te herstellen van een ramp na melding van een bedrijfsstoring. In het geval van een ramp, als uw bedrijf niet in staat is om ten minste een uur downtime te weerstaan ​​zonder klanten te verliezen aan uw concurrenten, is dit cruciaal. U hebt een betrouwbaar noodherstelplan nodig dat bestaat uit een duidelijk aangegeven toegestane RTO.

RPO: een tijdvenster waarin gegevens acceptabel zijn. Als uw bedrijf na een ramp slechts vier uur na een volledige werkdag een gegevensverlies kan overleven, kan dit leiden tot een catastrofaal verlies van belangrijke gegevens, dus uw RPO zou vier uur duren.

De RTO en RPO van een organisatie zullen zeker invloed hebben op de herstelstrategie en de bijbehorende kosten. Om de totale kosten van de disaster recovery-strategie te verlagen, is het beter om de applicaties in lagen op te splitsen. Het hoogste niveau dat is gereserveerd voor bedrijfskritische applicaties zou een disaster recovery-technologie vereisen op basis van realtime continue gegevensreplicatie. Het middelste niveau vereist mogelijk een op momentopnames gebaseerde toepassing en tot slot kan het laagste niveau het redden met een eenvoudig back-upsysteem op bestandsniveau.

3. Herken de belanghebbenden in uw noodherstelplan

De volgende en cruciale stap is het identificeren van degenen die op de hoogte moeten worden gehouden zodra een ramp zich voordoet. Ingenieurs, ondersteuning, leidinggevenden, enz. Zullen worden betrokken bij het uitvoeren van het daadwerkelijke noodherstel. Toch moet u ook anderen identificeren, zoals leveranciers, leden van het PR- en marketingteam, externe leveranciers en belangrijke klanten. De meeste bedrijven houden een register bij van belanghebbenden in de documentatie van hun projectbureau om te melden in geval van een ramp.

4. Maak een site voor noodherstel

De kans is groot dat een ramp uw productiecentrum ernstig zal beschadigen, waardoor het voor u onmogelijk wordt om de werkzaamheden op de primaire locatie te hervatten en zo kritieke workloads naar een andere locatie te migreren. Volgens het noodherstelplan is dit de checklist die u nodig hebt om een ​​DR-site te bouwen die u kunt gebruiken in geval van noodverplaatsing van kritieke gegevens, personeel, fysieke middelen en advertentietoepassingen. U moet de site ook uitrusten met voldoende hardware en software om de essentiële taken op zich te nemen.

5. Verzamel volledige infrastructuurdocumentatie

Als er zich een ramp voordoet, gaat alles voor een worp, iedereen staat onder druk. U hebt inderdaad uw technische teams met de vereiste vaardigheden en kennis om procedures voor noodherstel te activeren, maar infrastructuurdocumentatie is verplicht. Zelfs de zeer bekwame ingenieurs die noodherstel uitvoeren, geven er de voorkeur aan om commando voor commando te gaan vanuit de infrastructuurdocumentatie.

Dus waar bestaat deze documentatie uit? De volledige installatie van systemen en hun gebruik (installatie, herstelprocedures, actieve applicaties, besturingssysteem en configuratie), cloud-sjablonen, opslag en databases (hoe en waar de gegevens worden opgeslagen, hoe back-ups worden hersteld, hoe de gegevens worden geverifieerd op juistheid) en al uw in kaart gebrachte netwerkverbindingen (met werkende apparaten en hun configuratie).

6. Kies de precieze technologie

Disaster Recovery as a Service (DRaaS) en on-premise disaster recovery zijn niet alleen de haalbare oplossingen die beschikbaar zijn voor bedrijfscontinuĂŻteit. De volgende optie is om gebruik te maken van cloudgebaseerd disaster recovery om uw disaster recovery-site op een public cloud-achtige Microsoft AzureAWS en Google Cloud binnen enkele minuten met behulp van een geautomatiseerde oplossing voor noodherstel.

Voordat u een oplossing kiest, moet u rekening houden met de totale eigendomskosten, onderhoudsvereisten, schaalbaarheid, herstel naar het vorige tijdstip en testgemak. Er zijn veel keuzes als het gaat om een ​​oplossing voor noodherstel, dus doe je grondig onderzoek en kies verstandig.

7. Start communicatiekanalen

Niemand weet wanneer een ramp uw deur kan kloppen, dus als organisatie moet u een lijst met teams bijhouden (samen met hun rollen en contactgegevens) voor noodherstel. Probeer een alomvattende commandostructuur tot stand te brengen met verantwoordelijke personen uit elk van de technische teams (bijv. Database, systemen, netwerk, opslag) en relevant uitvoerend leiderschap. Stel ook speciale communicatiekanalen en hubs in, of een online tool voor het delen van informatie om te gebruiken voor instant messaging.

8. Geef een overzicht van een incidentresponsprocedure

Als u een noodherstelplan heeft, is een "incidentresponsprocedure" een must. Hierin zullen de bedrijven in detail bepalen welke gebeurtenissen als ramp moeten worden aangemerkt. Als uw systeem bijvoorbeeld uitvalt, beschouwt u dat dan als een ramp? Het plan moet ook aangeven hoe de ramp kan worden geverifieerd en hoe deze zal worden gerapporteerd - door een automatisch controlesysteem, via telefoontjes van SRE-teams (Site Relability Engineering) of gerapporteerd door klanten?

Om te verifiëren dat er echt een ramp plaatsvindt, moet u de status controleren van kritieke netwerkapparaten, toepassingslogboeken, serverhardware of andere kritieke componenten in uw productiesysteem die u proactief bewaakt. Als iets vreemd is of niet werkt, dan heb je zeker een ramp in handen.

9. Geef een overzicht van een actie Reactieprocedure

Zodra het noodlot toeslaat, moet zo snel mogelijk een disaster recovery-omgeving worden geactiveerd. Een actie-responsprocedure beschrijft hoe u met alle vereiste stappen een failover naar de disaster recovery-site kunt uitvoeren. Ongeacht of uw herstelproces DRaaS of een hulpprogramma voor noodherstel gebruikt om uw rampsite automatisch te starten, u moet de actie-reactieprocedure schriftelijk voorbereiden om ervoor te zorgen hoe de benodigde services worden gestart, geverifieerd en beheerd.

Bovendien is het opstarten van productiediensten op een andere locatie niet voldoende, ervoor zorgen dat alle vereiste gegevens aanwezig zijn en dat alle vereiste bedrijfsapplicaties naar behoren werken, is ook even cruciaal.

10. Bereid u voor op failback naar de primaire infrastructuur

Failback is het herstellen van bewerkingen in het primaire productiecentrum nadat ze tijdens de failover zijn overgedragen naar een DR-site. DR-sites zijn niet ontworpen om dagelijkse activiteiten uit te voeren; in plaats daarvan kunnen ze alleen worden gebruikt voor noodgevallen. DR-sites worden gebouwd voor een zeer korte periode (totdat de primaire site is hersteld of totdat er een nieuw productiecentrum wordt gebouwd).

Als de ramp eenmaal voorbij is, is er veel inspanning nodig om het verplaatsen van gegevens en zakelijke services terug naar de primaire locatie te implementeren. Plan een mogelijke gedeeltelijke verstoring van uw bedrijf tijdens het herstelproces. Gelukkig bestaan ​​er noodhersteloplossingen die een uniforme failback naar de primaire locatie bieden, die automatisch of handmatig wordt geactiveerd zodra u de verificatie van de primaire IT-locatie heeft voltooid.

11. Rapporteer het incident aan belanghebbenden

Als zich een ramp voordoet, moet u eerst niet alleen degenen op de hoogte brengen die verantwoordelijk zijn voor het uitvoeren van DR-activiteiten, maar ook de belangrijkste belanghebbenden zoals leveranciers, klanten, leden van het PR- en marketingteam en externe leveranciers. Overweeg ook om elk van deze groepen te informeren en antwoorden te formuleren om hun zorgen weg te nemen. Het is beter om van tevoren een persbericht te schrijven om geen tijd te verliezen tijdens een daadwerkelijke ramp en het klaar te hebben voor publicatie.

12. Doe de uitgebreide tests

Het testen van uw noodherstelplan is verplicht, maar wordt meestal genegeerd. Failover-tests zijn meestal complex en leiden tot gegevensverlies en verstoring van productservices. Daarom testen de meeste bedrijven hun noodherstelplan niet regelmatig.

Om te begrijpen hoe goed uw noodherstelplan werkt, moet u regelmatig failover-tests plannen. Het negeren van de tests van het noodherstelplan kan uw hele bedrijf in gevaar brengen tijdens een ramp, waardoor het uiteindelijk niet meer in staat is om op tijd te herstellen of helemaal geen herstel. Prestatietests helpen u ook om te beoordelen of uw secundaire locatie al dan niet voldoende is om de zakelijke belasting te weerstaan.

13. Houd uw noodherstelplan up-to-date

En last but not least, aangezien het testen van noodherstelplannen verplicht is, moeten alle documenten voor noodherstel bijgewerkt worden. Bekijk aan het einde van elke test wat er is gebeurd, hoe uw teams de test afhandelen en documenteer uw bevindingen.

Aftekenen:

U kunt ervoor kiezen om doe-het-zelf noodherstel uit te voeren (een goedkope maar foutgevoelige optie) of u kunt een goed noodherstelplan bij de hand hebben om uw bedrijf te helpen alle verloren gegevens te herstellen en de terugkeer van uw organisatie naar de normale bedrijfsvoering te bespoedigen. Daarnaast zorgt het ervoor dat een ramp geen negatieve financiële gevolgen en grote bedrijfsonderbrekingen veroorzaakt.

Zorg ervoor dat u rekening houdt met elk aspect van uw organisatie (bijv. Aantal medewerkers, beschikbaar budget, risicofactoren, grootte van IT-infrastructuur, enz.) Om te bepalen wat het beste werkt voor u en uw team.


Ontdek meer onderwerpen