Blog

13 punti da includere nel piano di ripristino di emergenza

UN piano di ripristino di emergenza (DRP) is a document you need to keep handy to handle unexpected incidents that could shut down your company’s IT systems and hinder its overall operation.
A DRP aims to get your business up and running as quickly as possible during a disaster or data breach. With an efficace ripristino di emergenza piano, ci sono meno possibilità di perdere profitti per troppo tempo. Inoltre, dovrebbe disporre di backup impostati per evitare che i dati sensibili (numeri di previdenza sociale o informazioni sulla carta di credito) vengano compromessi.

La tua azienda dispone di un piano di ripristino di emergenza?

Perdita di dati, tempi di inattività e oltraggi tecnologici sono alcune delle nuove storie dell'orrore che anche le migliori aziende incontrano al giorno d'oggi. Ogni volta che si verifica un disastro in un'azienda, i team di ingegneri si affrettano a riparare il danno e, d'altra parte, i team di PR fanno gli straordinari per ripristinare la fiducia dei clienti. Non pensi che sia uno sforzo dispendioso in termini di tempo e denaro? Ovviamente è! Ma alcune organizzazioni gestiscono questi disastri in modo più efficace e anche con meno danni collaterali. Ti chiedi come? Semplici, hanno un piano di ripristino di emergenza completo, facile da seguire e regolarmente testato.

Disasters come uninvited with loads of complex challenges, which organizations might take months or years to overcome. Cyber attacks, tornadoes, terrorist attacks, hurricanes, and floods are some of the disasters that can cause data breaches. A disaster plan is a long-term assurance of business operability as it is designed in such a way that it enables businesses to reduce damages of unpredicted outages.

Hai un piano di ripristino di emergenza o stai appena iniziando il processo di creazione di uno per la tua organizzazione? In entrambi i casi, l'elenco di controllo del piano di ripristino di emergenza riportato di seguito ti aiuterà ad aggiungere tutti i componenti cruciali al tuo piano.

1. Analizza le potenziali minacce e le possibili reazioni

La prima cosa è prendere tempo e analizzare tutti i possibili fattori che possono disturbare il flusso degli affari. Una volta terminata la ricerca, è il momento di creare un piano di ripristino diverso per ciascuno di questi scenari. Ad esempio, gli attacchi informatici stanno diventando sempre più diffusi e probabili e, sfortunatamente, il firewall medio non è abbastanza forte da proteggerli dalla maggior parte di essi.

Quindi considera la possibilità di un attacco informatico più intensamente di quanto faresti, diciamo, uno tsunami. Potresti optare per la crittografia dei dati e la protezione dell'hardware. Cerca di capire le vulnerabilità che si trovano all'interno dei tuoi sistemi, poiché questi sono i punti di ingresso che un hacker utilizzerà per ottenere l'accesso.

Il modo migliore è tenersi aggiornati sui molti schemi utilizzati dagli hacker. Puoi evitare la maggior parte delle infezioni da phishing e malware.

2. Correggere gli obiettivi di ripristino di emergenza

Il ripristino di emergenza ti aiuta a mantenere la tua attività operativa come al solito, costantemente, quindi devi correggere i servizi IT che sono più critici per gestire la tua organizzazione. Inoltre, il Recovery Time Objective (RTO) e il Recovery Point Objective (RPO) richiesti per questi servizi / macchine. Ma sei a conoscenza di RTO e RPO?

RPO: la quantità di tempo necessaria per il ripristino da un disastro dopo la notifica di interruzione dell'attività. In caso di disastro, se la tua azienda non è in grado di sopportare almeno un'ora di inattività senza perdere clienti a vantaggio della concorrenza, è fondamentale. È necessario un piano di ripristino di emergenza affidabile che comprenda un RTO consentito chiaramente indicato.

RPO: una finestra di tempo in cui i dati sono accettabili. Dopo un disastro, se la tua azienda può sopravvivere a una perdita di dati solo per quattro ore dopo un'intera giornata di lavoro, ciò può portare a una perdita catastrofica di dati importanti, quindi il tuo RPO sarebbe di quattro ore.

L'RTO e l'RPO di un'organizzazione influenzeranno sicuramente la strategia di ripristino e le spese associate. Per ridurre il costo totale della strategia di ripristino di emergenza, è preferibile suddividere le applicazioni in livelli. Il livello più alto riservato alle applicazioni mission-critical richiederebbe una tecnologia di ripristino di emergenza basata sulla replica continua dei dati in tempo reale. Il livello medio potrebbe richiedere un'applicazione basata su snapshot e, infine, il livello più basso potrebbe cavarsela con un semplice sistema di backup a livello di file.

3. Riconoscere le parti interessate nel piano di ripristino di emergenza

Il passaggio successivo e cruciale è identificare coloro che devono essere aggiornati una volta che si verifica un disastro. Ingegneri, supporto, dirigenti, ecc. Saranno coinvolti nell'esecuzione dell'effettivo ripristino di emergenza. Tuttavia, è necessario identificare anche altri come fornitori, membri del team di PR e marketing, fornitori di terze parti e clienti chiave. La maggior parte delle aziende mantiene un registro delle parti interessate nella documentazione dell'ufficio progetti da notificare in caso di disastro.

4. Creare un sito di ripristino di emergenza

Ci sono alte probabilità che un disastro danneggi gravemente il tuo centro di produzione, rendendo così impossibile riprendere le operazioni nel sito principale e quindi migrare i carichi di lavoro critici in un'altra posizione. Secondo il piano di ripristino di emergenza, l'elenco di controllo necessario per creare un sito di DR da utilizzare in caso di trasferimento di emergenza di dati critici, personale, risorse fisiche, applicazioni pubblicitarie. Inoltre, dovresti dotare il sito di hardware e software sufficienti per sostenere i carichi di lavoro essenziali.

5. Raccogliere l'intera documentazione dell'infrastruttura

Quando si verifica un disastro tutto va per il verso giusto, tutti sono sotto pressione. In effetti, i tuoi team di ingegneri dispongono delle competenze e delle conoscenze necessarie per attivare le procedure di ripristino di emergenza, ma la documentazione dell'infrastruttura è obbligatoria. Anche gli ingegneri altamente qualificati durante l'esecuzione del ripristino di emergenza preferirebbero passare comando per comando dalla documentazione dell'infrastruttura.

Quindi cosa comprende questa documentazione? L'intera configurazione dei sistemi e il loro utilizzo (installazione, procedure di ripristino, applicazioni in esecuzione, sistema operativo e configurazione), modelli cloud, archiviazione e database (come e dove vengono salvati i dati, come vengono ripristinati i backup, come viene verificata l'accuratezza dei dati) e tutte le connessioni di rete mappate (con i dispositivi funzionanti e la loro configurazione).

6. Scegli la tecnologia Precise

Disaster Recovery as a Service (DRaaS) and on-premise disaster recovery is not just the feasible solutions available for business continuity. The next option is to make use of cloud-based disaster recovery in order to spin up your disaster recovery site on a public cloud-like Microsoft AzureAWS e Google Cloud in minutes using an automated disaster recovery solution.

Prima di scegliere una soluzione, assicurati di considerare il costo totale di proprietà, i requisiti di manutenzione, la scalabilità, il ripristino al momento precedente e la facilità di test. Le scelte sono molte quando si tratta di una soluzione di ripristino di emergenza, quindi fai ricerche approfondite e scegli con saggezza.

7. Avvia i canali di comunicazione

Nessuno sa quando un disastro può bussare alla tua porta, quindi essendo un'organizzazione, devi tenere un elenco di team (insieme ai loro ruoli e alle informazioni di contatto) per il ripristino di emergenza. Cercare di stabilire una catena di comando completa che includa individui responsabili di ciascuno dei team di ingegneri (ad es. Database, sistemi, rete, archiviazione) e la leadership esecutiva pertinente. Inoltre, configurare canali e hub di comunicazione dedicati o uno strumento di condivisione delle informazioni online da utilizzare per la messaggistica istantanea.

8. Delineare una procedura di risposta agli incidenti

Se si dispone di un piano di ripristino di emergenza, è necessaria una "procedura di risposta agli incidenti". Qui le aziende definiranno in dettaglio quali eventi devono essere dichiarati come un disastro. Ad esempio, se il tuo sistema non funziona, lo considererai un disastro? Inoltre, il piano dovrebbe anche indicare come verificare il disastro e come verrà segnalato: da un sistema di monitoraggio automatico, generato dalle chiamate dei team di ingegneria dell'affidabilità del sito (SRE) o segnalato dai clienti?

Per verificare che si stia realmente verificando un disastro, è necessario controllare lo stato dei dispositivi di rete critici, i registri delle applicazioni, l'hardware del server o qualsiasi altro componente critico nel sistema di produzione, da monitorare in modo proattivo. Se qualcosa è strano o non funziona, sicuramente hai un disastro tra le mani.

9. Delineare una procedura di risposta all'azione

Una volta che si verifica un disastro, è necessario attivare un ambiente di ripristino di emergenza il prima possibile. Una procedura di risposta all'azione illustrerà come eseguire il failover sul sito di ripristino di emergenza con tutti i passaggi richiesti. Indipendentemente dal fatto che il processo di ripristino utilizzi DRaaS o uno strumento di ripristino di emergenza per avviare automaticamente il sito di emergenza, è necessario preparare per iscritto la procedura di risposta all'azione per garantire come verranno avviati, verificati e controllati i servizi necessari.

Inoltre, l'avvio di servizi di produzione in un'altra posizione non è sufficiente, poiché è altrettanto fondamentale garantire che tutti i dati richiesti siano presenti e che tutte le applicazioni aziendali richieste funzionino correttamente.

10. Preparati per il failback sull'infrastruttura primaria

Il failback ripristina le operazioni nel centro di produzione principale una volta che sono state trasferite a un sito di DR durante il failover. I siti di ripristino di emergenza non sono progettati per eseguire operazioni quotidiane; possono invece essere utilizzati solo per scopi di emergenza. I siti di DR vengono costruiti per un periodo molto breve (fino al ripristino del sito primario o alla costruzione di un nuovo centro di produzione).

Una volta che il disastro è finito, è necessario un grande impegno per implementare il trasferimento di dati e servizi aziendali nella posizione principale: pianificare una potenziale interruzione parziale dell'attività durante il processo di ripristino. Fortunatamente, esistono soluzioni di ripristino di emergenza che forniscono un failback unificato alla posizione primaria, attivato automaticamente o manualmente una volta completata la verifica della posizione IT primaria.

11. Segnalare l'incidente alle parti interessate

Una volta che si verifica un disastro, informa innanzitutto non solo coloro che sono responsabili dell'esecuzione delle attività di DR, ma anche le parti interessate chiave come fornitori, clienti, membri del team di PR e marketing e fornitori di terze parti. Inoltre, considera l'idea di informare ciascuno di questi gruppi e formulare risposte per affrontare le loro preoccupazioni. È meglio scrivere un comunicato stampa in anticipo per non perdere tempo durante un vero disastro e averlo pronto per la pubblicazione.

12. Eseguire test approfonditi

Il test del piano di ripristino di emergenza è obbligatorio, ma di solito viene trascurato. I test di failover sono generalmente complessi e portano alla perdita di dati e all'interruzione dei servizi del prodotto. Pertanto, la maggior parte delle aziende non verifica regolarmente il proprio piano di ripristino di emergenza.

Per capire come funzionerà il piano di ripristino di emergenza, è necessario pianificare test di failover regolari. Ignorare i test del piano di ripristino di emergenza può mettere a rischio l'intera azienda durante un disastro, risultando incapace di recuperare in tempo o addirittura non ripristinabile. I test delle prestazioni ti aiutano anche a valutare se la tua posizione secondaria è sufficiente per sopportare il carico di lavoro.

13. Mantenere aggiornato il piano di ripristino di emergenza

Ultimo ma non meno importante, poiché il test del piano di ripristino di emergenza è obbligatorio, è necessario mantenere aggiornati tutti i documenti di ripristino di emergenza. Alla fine di ogni test, rivedi cosa è successo, come i tuoi team gestiscono il test e documenta i tuoi risultati.

Firma:

Puoi scegliere di eseguire il ripristino di emergenza fai-da-te (un'opzione economica ma soggetta a errori) o avere un buon piano di ripristino di emergenza a portata di mano per aiutare la tua azienda a recuperare tutti i dati persi e accelerare il ritorno della tua organizzazione alle normali operazioni aziendali. Oltre a ciò, garantirà anche che il disastro non inneschi conseguenze finanziarie negative e gravi interruzioni dell'attività.

Assicurati di prendere in considerazione ogni aspetto della tua organizzazione (ad es. Il numero di dipendenti, il budget disponibile, i fattori di rischio, le dimensioni dell'infrastruttura IT, ecc.) Per determinare cosa funzionerà meglio per te e il tuo team.

lascia un commento

it_ITItalian