Blog

13 pontos para incluir em seu plano de recuperação de desastres

UMA plano de recuperação de desastres (DRP) is a document you need to keep handy to handle unexpected incidents that could shut down your company’s IT systems and hinder its overall operation.
A DRP aims to get your business up and running as quickly as possible during a disaster or data breach. With an recuperação de desastre eficaz plano, há menos chance de você perder lucros por muito tempo. Além disso, deve ter backups definidos para evitar que dados confidenciais (números de previdência social ou informações de cartão de crédito) sejam comprometidos.

Sua empresa possui um plano de recuperação de desastres?

Perda de dados, tempo de inatividade e ultrajes tecnológicos são algumas das novas histórias de terror que até as principais empresas encontram hoje em dia. Sempre que ocorre um desastre em uma empresa, as equipes de engenharia correm para consertar os danos e, por outro lado, as equipes de RP trabalham horas extras para restaurar a confiança do cliente. Você não acha que é um esforço caro e demorado? Claro que é! Mas algumas organizações administram esses desastres de maneira mais eficaz e com menos danos colaterais. Quer saber como? Simples, eles têm um plano de recuperação de desastres abrangente, fácil de seguir e testado regularmente.

Disasters come uninvited with loads of complex challenges, which organizations might take months or years to overcome. Cyber attacks, tornadoes, terrorist attacks, hurricanes, and floods are some of the disasters that can cause data breaches. A disaster plan is a long-term assurance of business operability as it is designed in such a way that it enables businesses to reduce damages of unpredicted outages.

Você tem um plano de recuperação de desastres ou está apenas começando o processo de criação de um para sua organização? Em qualquer um desses casos, a lista de verificação do plano de recuperação de desastres abaixo o ajudará a adicionar todos os componentes cruciais em seu plano.

1. Analisar ameaças potenciais e possíveis reações

A primeira coisa é reservar um tempo e analisar todos os possíveis fatores que podem atrapalhar seu fluxo de negócios. Assim que terminar a pesquisa, é hora de criar um plano de recuperação diferente para cada um desses cenários. Por exemplo, os ataques cibernéticos estão se tornando mais prevalentes e prováveis de ocorrer e, infelizmente, o firewall comum não é forte o suficiente para proteger da maioria deles.

Portanto, observe a possibilidade de um ataque cibernético com mais intensidade do que, digamos, um tsunami. Você pode optar por criptografar dados e proteger o hardware. Tente entender as vulnerabilidades que estão dentro de seus sistemas, pois esses são os pontos de entrada que um hacker usará para obter acesso.

A melhor maneira é manter-se atualizado sobre os vários esquemas que os hackers usam. Você pode evitar a maioria das infecções de phishing e malware.

2. Corrija os objetivos de recuperação de desastres

A recuperação de desastres ajuda a manter seu negócio funcionando normalmente, constantemente, então você precisa corrigir os serviços de TI que são mais críticos para administrar sua organização. Além disso, o Objetivo de tempo de recuperação (RTO) e o Objetivo de ponto de recuperação (RPO) necessários para esses serviços / máquinas. Mas você conhece RTO e RPO?

RPO: A quantidade de tempo necessária para se recuperar de um desastre após a notificação de interrupção dos negócios. Em caso de desastre, se o seu negócio não for capaz de suportar pelo menos uma hora de inatividade sem perder clientes para os concorrentes, então é crucial. Você precisa de um plano de recuperação de desastres confiável que inclua um RTO permitido claramente definido.

RPO: uma janela de tempo em que os dados são aceitáveis. Depois de um desastre, se sua empresa só puder sobreviver a uma perda de dados por quatro horas após um dia inteiro de negócios, isso pode levar a uma perda catastrófica de dados importantes, portanto, seu RPO seria de quatro horas.

O RTO e o RPO de uma organização certamente afetarão sua estratégia de recuperação e despesas associadas. Para reduzir o custo total da estratégia de recuperação de desastres, é melhor dividir os aplicativos em camadas. O nível mais alto reservado para aplicativos de missão crítica exigiria uma tecnologia de recuperação de desastres baseada na replicação contínua de dados em tempo real. A camada de nível médio pode exigir um aplicativo baseado em instantâneo e, finalmente, a camada mais baixa pode sobreviver com um sistema de backup de nível de arquivo simples.

3. Reconhecer as partes interessadas em seu plano de recuperação de desastres

A próxima etapa crucial é identificar aqueles que precisam ser atualizados quando ocorre um desastre. Engenheiros, suporte, executivos, etc. estarão envolvidos na execução da recuperação de desastre real. Ainda assim, você precisa identificar outros também, como fornecedores, membros da equipe de relações públicas e marketing, fornecedores terceirizados e clientes-chave. A maioria das empresas mantém um registro das partes interessadas na documentação do escritório de projetos para notificar em caso de desastre.

4. Crie um site de recuperação de desastres

Há grandes chances de que um desastre danifique gravemente seu centro de produção, tornando impossível para você retomar as operações no site principal e, assim, migrar cargas de trabalho críticas para outro local. De acordo com o plano de recuperação de desastres, a lista de verificação necessária para construir um site de DR para usar em caso de realocação emergencial de dados críticos, equipe, recursos físicos e aplicativos de anúncios. Além disso, você deve equipar o site com hardware e software suficientes para assumir as cargas de trabalho essenciais.

5. Reúna toda a documentação da infraestrutura

Quando ocorre um desastre, tudo dá errado, todos ficam sob pressão. Na verdade, você tem suas equipes de engenharia com as habilidades e conhecimentos necessários para ativar os procedimentos de recuperação de desastres, mas a documentação da infraestrutura é obrigatória. Mesmo os engenheiros altamente proficientes durante a execução da recuperação de desastres preferem ir comando por comando a partir da documentação da infraestrutura.

Então, de que consiste esta documentação? Toda a configuração dos sistemas e seu uso (instalação, procedimentos de recuperação, aplicativos em execução, SO e configuração), modelos de nuvem, armazenamento e bancos de dados (como e onde os dados são salvos, como os backups são restaurados, como os dados são verificados quanto à precisão) e todas as suas conexões de rede mapeadas (com dispositivos em funcionamento e suas configurações).

6. Escolha a tecnologia precisa

Disaster Recovery as a Service (DRaaS) and on-premise disaster recovery is not just the feasible solutions available for business continuity. The next option is to make use of cloud-based disaster recovery in order to spin up your disaster recovery site on a public cloud-like Microsoft AzureAWS e Nuvem do Google in minutes using an automated disaster recovery solution.

Antes de fazer uma escolha de solução, certifique-se de considerar o custo total de propriedade, requisitos de manutenção, escalabilidade, recuperação para o ponto anterior no tempo e facilidade de teste. As opções são muitas quando se trata de solução de recuperação de desastres, portanto, faça uma pesquisa completa e escolha com sabedoria.

7. Lance canais de comunicação

Ninguém sabe quando um desastre pode bater à sua porta, portanto, sendo uma organização, você deve manter uma lista de equipes (junto com suas funções e informações de contato) para recuperação de desastre. Tente estabelecer uma cadeia de comando abrangente que inclua indivíduos responsáveis de cada uma das equipes de engenharia (por exemplo, banco de dados, sistemas, rede, armazenamento) e liderança executiva relevante. Além disso, configure canais e hubs de comunicação dedicados ou uma ferramenta de compartilhamento de informações online para usar em mensagens instantâneas.

8. Descreva um procedimento de resposta a incidentes

Se você tiver um plano de recuperação de desastres, um “procedimento de resposta a incidentes” é essencial. Aqui, as empresas definirão em detalhes quais eventos devem ser declarados como desastres. Por exemplo, se o seu sistema cair, você considerará isso um desastre? Além disso, o plano também deve indicar como verificar o desastre e como ele será relatado - por um sistema de monitoramento automático, gerado por chamadas de equipes de engenharia de confiabilidade do local (SRE) ou relatado por clientes?

Para verificar se um desastre está realmente acontecendo, você precisa verificar o status de dispositivos de rede críticos, logs de aplicativos, hardware de servidor ou quaisquer outros componentes críticos em seu sistema de produção, que você monitora proativamente. Se algo estiver estranho ou não estiver funcionando, com certeza você tem um desastre em suas mãos.

9. Descreva um procedimento de resposta de ação

Assim que ocorre um desastre, um ambiente de recuperação de desastre precisa ser ativado o mais rápido possível. Um procedimento de resposta de ação descreverá como fazer o failover para o site de recuperação de desastre com todas as etapas necessárias. Não importa se seu processo de recuperação está usando DRaaS ou uma ferramenta de recuperação de desastre para iniciar seu site de desastre automaticamente, você precisa preparar o procedimento de resposta de ação por escrito para garantir como os serviços necessários serão iniciados, verificados e controlados.

Além disso, ativar os serviços de produção em outro local não é suficiente, garantindo que todos os dados necessários estejam no lugar e que todos os aplicativos de negócios necessários estejam funcionando corretamente, também é igualmente crítico.

10. Prepare-se para failback para infraestrutura primária

O failback é a restauração das operações no centro de produção principal, uma vez que tenham sido transferidas para um local de DR durante o failover. Os sites de DR não são projetados para executar operações diárias; em vez disso, eles podem ser usados apenas para fins de emergência. Os sites de DR são construídos por um período muito curto (até que o site principal seja restaurado ou até que um novo centro de produção seja construído).

Depois que o desastre acabar, muito esforço é necessário para implementar a movimentação de dados e serviços de negócios de volta ao local principal - planeje uma possível interrupção parcial de seus negócios durante o processo de reversão. Felizmente, existem soluções de recuperação de desastres que fornecem failback unificado para o local principal, ativado automaticamente ou manualmente depois de concluir a verificação do local principal de TI.

11. Relate o incidente às partes interessadas

Assim que ocorrer um desastre, primeiro notifique não apenas aqueles que são responsáveis pela execução das atividades de DR, mas também as principais partes interessadas, como fornecedores, clientes, membros da equipe de relações públicas e marketing e fornecedores terceirizados. Além disso, considere informar cada um desses grupos e formular respostas para abordar suas preocupações. É melhor escrever um comunicado de imprensa com antecedência para não perder tempo durante um desastre real e tê-lo pronto para publicação.

12. Faça os testes extensivos

Testar seu plano de recuperação de desastres é obrigatório, mas geralmente negligenciado. Os testes de failover são geralmente complexos e levam à perda de dados e interrupção dos serviços do produto. Portanto, a maioria das empresas não testa seu plano de recuperação de desastres regularmente.

Para entender como seu plano de recuperação de desastres funcionará, você deve agendar testes de failover regulares. Ignorar os testes do plano de recuperação de desastres pode colocar toda a sua empresa em risco durante uma greve de desastre, terminando ou impossibilitando a recuperação a tempo ou nenhuma recuperação. Os testes de desempenho também ajudam a avaliar se o local secundário é ou não suficiente para suportar a carga de negócios.

13. Mantenha seu plano de recuperação de desastres atualizado

Por último, mas não menos importante, como o teste do plano de recuperação de desastres é obrigatório, manter todos os documentos de recuperação de desastres atualizados também. No final de cada teste, revise o que aconteceu, como suas equipes lidam com o teste e documente suas descobertas.

Assinando:

Você pode optar por realizar a recuperação de desastres do tipo "faça você mesmo" (uma opção barata, mas sujeita a erros) ou ter um bom plano de recuperação de desastres à mão para ajudar sua empresa a recuperar todos os dados perdidos e acelerar o retorno da organização às operações normais de negócios. Além disso, também garantirá que o desastre não acarrete consequências financeiras adversas e grandes interrupções nos negócios.

Certifique-se de levar em consideração todos os aspectos de sua organização (por exemplo, o número de funcionários, orçamento disponível, fatores de risco, tamanho da infraestrutura de TI, etc.) para determinar o que funcionará melhor para você e sua equipe.

Deixe uma resposta

pt_BRPortuguese