Blog

13 puntos para incluir en su plan de recuperación ante desastres

UNA plan de recuperación en un desastre (DRP) is a document you need to keep handy to handle unexpected incidents that could shut down your company’s IT systems and hinder its overall operation.
A DRP aims to get your business up and running as quickly as possible during a disaster or data breach. With an recuperación de desastres efectiva plan, hay menos posibilidades de que pierda beneficios durante demasiado tiempo. Además, debe tener copias de seguridad establecidas para evitar que los datos confidenciales (números de seguridad social o información de tarjetas de crédito) se vean comprometidos.

¿Tiene su empresa un plan de recuperación ante desastres?

Pérdida de datos, el tiempo de inactividad y los atropellos tecnológicos son algunas de las nuevas historias de terror con las que incluso las principales empresas se encuentran hoy en día. Siempre que ocurre un desastre en una empresa, los equipos de ingeniería se apresuran a reparar el daño y, por otro lado, los equipos de relaciones públicas trabajan horas extras para restaurar la confianza del cliente. ¿No cree que es un esfuerzo costoso y que requiere mucho tiempo? ¡Por supuesto que es! Pero algunas organizaciones manejan estos desastres de manera más efectiva y también con menos daños colaterales. ¿Se pregunta cómo? Sencillo, tienen un plan de recuperación ante desastres completo, fácil de seguir y probado con regularidad.

Disasters come uninvited with loads of complex challenges, which organizations might take months or years to overcome. Cyber attacks, tornadoes, terrorist attacks, hurricanes, and floods are some of the disasters that can cause data breaches. A disaster plan is a long-term assurance of business operability as it is designed in such a way that it enables businesses to reduce damages of unpredicted outages.

¿Tiene un plan de recuperación ante desastres o recién está comenzando el proceso de creación de uno para su organización? En cualquiera de estos casos, la lista de verificación del plan de recuperación de desastres a continuación lo ayudará a agregar todos los componentes cruciales en su plan.

1. Analizar amenazas potenciales y posibles reacciones

Lo primero es tomarse el tiempo y analizar todos los posibles factores que pueden perturbar su flujo de negocios. Una vez que haya terminado con la investigación, es hora de crear un plan de recuperación diferente para cada uno de esos escenarios. Por ejemplo, los ataques cibernéticos son cada vez más frecuentes y es probable que ocurran, y desafortunadamente, el firewall promedio no es lo suficientemente fuerte como para proteger de la mayoría de ellos.

Por lo tanto, mire la posibilidad de un ciberataque con más intensidad de lo que lo haría, por ejemplo, un tsunami. Puede optar por cifrar datos y proteger el hardware. Intente comprender las vulnerabilidades que se encuentran dentro de sus sistemas, ya que estos son los puntos de entrada que utilizará un pirata informático para obtener acceso.

La mejor manera es mantenerse actualizado sobre los numerosos esquemas que utilizan los piratas informáticos. Puede evitar la mayoría de las infecciones de phishing y malware.

2. Corrija los objetivos de recuperación ante desastres

La recuperación ante desastres le ayuda a mantener su negocio operando como de costumbre, constantemente, por lo que necesita arreglar los servicios de TI que son más críticos para el funcionamiento de su organización. Además, el objetivo de tiempo de recuperación (RTO) y el objetivo de punto de recuperación (RPO) necesarios para estos servicios / máquinas. Pero, ¿conoce RTO y RPO?

RPO: la cantidad de tiempo necesario para recuperarse de un desastre después de la notificación de la interrupción del negocio. En caso de cualquier desastre, si su empresa no puede soportar al menos una hora de inactividad sin perder clientes frente a sus competidores, entonces es crucial. Necesita un plan de recuperación ante desastres confiable que se componga de un RTO permitido claramente establecido.

RPO: una ventana de tiempo en la que los datos son aceptables. Después de un desastre, si su empresa solo puede sobrevivir a una pérdida de datos durante cuatro horas después de un día completo de trabajo, esto puede provocar una pérdida catastrófica de datos importantes, por lo que su RPO sería de cuatro horas.

El RTO y el RPO de una organización seguramente afectarán su estrategia de recuperación y los gastos asociados. Para reducir el costo total de la estrategia de recuperación ante desastres, es mejor dividir las aplicaciones en niveles. El nivel más alto reservado para aplicaciones de misión crítica requeriría una tecnología de recuperación de desastres basada en la replicación continua de datos en tiempo real. El nivel de nivel medio puede requerir una aplicación basada en instantáneas y, finalmente, el nivel más bajo puede funcionar con un sistema de respaldo de nivel de archivo simple.

3. Reconozca a las partes interesadas en su plan de recuperación ante desastres

El siguiente y crucial paso es identificar a aquellos que deben actualizarse una vez que ocurre un desastre. Ingenieros, soporte, ejecutivos, etc. participarán en la realización de la recuperación ante desastres real. Aún así, también debe identificar a otros como proveedores, miembros del equipo de relaciones públicas y marketing, proveedores externos y clientes clave. La mayoría de las empresas mantienen un registro de partes interesadas en la documentación de la oficina del proyecto para notificar en caso de desastre.

4. Cree un sitio de recuperación ante desastres

Hay muchas posibilidades de que un desastre dañe gravemente su centro de producción, lo que le imposibilita reanudar las operaciones en el sitio principal y, por lo tanto, migrar las cargas de trabajo críticas a otra ubicación. De acuerdo con el plan de recuperación ante desastres, la lista de verificación que necesita para construir un sitio de recuperación ante desastres para usar en caso de reubicación de emergencia de datos críticos, personal, recursos físicos, aplicaciones publicitarias. Además, debe equipar el sitio con suficiente hardware y software para asumir las cargas de trabajo esenciales.

5. Reúna toda la documentación de infraestructura

Cuando ocurre un desastre, todo se echa a perder, todos están bajo presión. De hecho, tiene sus equipos de ingeniería con las habilidades y el conocimiento necesarios para activar los procedimientos de recuperación ante desastres, pero la documentación de la infraestructura es obligatoria. Incluso los ingenieros altamente competentes, mientras realizan la recuperación de desastres, preferirían ir comando por comando desde la documentación de la infraestructura.

Entonces, ¿de qué forma esta documentación? La configuración completa de los sistemas y su uso (instalación, procedimientos de recuperación, aplicaciones en ejecución, sistema operativo y configuración), plantillas en la nube, almacenamiento y bases de datos (cómo y dónde se guardan los datos, cómo se restauran las copias de seguridad, cómo se verifica la precisión de los datos) y todas sus conexiones de red mapeadas (con dispositivos en funcionamiento y su configuración).

6. Elija la tecnología precisa

Disaster Recovery as a Service (DRaaS) and on-premise disaster recovery is not just the feasible solutions available for business continuity. The next option is to make use of cloud-based disaster recovery in order to spin up your disaster recovery site on a public cloud-like Microsoft AzureAWS y Google Cloud in minutes using an automated disaster recovery solution.

Antes de elegir una solución, asegúrese de considerar el costo total de propiedad, los requisitos de mantenimiento, la escalabilidad, la recuperación al punto anterior en el tiempo y la facilidad de las pruebas. Las opciones son muchas cuando se trata de una solución de recuperación ante desastres, por lo tanto, investigue a fondo y elija sabiamente.

7. Lanzar canales de comunicación

Nadie sabe cuándo un desastre puede llamar a su puerta, por lo que, como organización, debe mantener una lista de equipos (junto con sus funciones e información de contacto) para la recuperación de desastres. Trate de establecer una cadena de mando integral que incluya personas responsables de cada uno de los equipos de ingeniería (por ejemplo, base de datos, sistemas, red, almacenamiento) y liderazgo ejecutivo relevante. Además, configure canales y centros de comunicación dedicados, o una herramienta para compartir información en línea para utilizarla en la mensajería instantánea.

8. Esquema de un procedimiento de respuesta a incidentes

Si tiene un plan de recuperación ante desastres, entonces un "procedimiento de respuesta a incidentes" es imprescindible. Aquí las empresas definirán en detalle qué eventos deben declararse como desastre. Por ejemplo, si su sistema falla, ¿lo considerará un desastre? Además, el plan también debe indicar cómo verificar el desastre y cómo se informará: mediante un sistema de monitoreo automático, generado por llamadas de los equipos de ingeniería de confiabilidad del sitio (SRE) o informado por los clientes.

Para verificar que realmente está ocurriendo un desastre, debe verificar el estado de los dispositivos de red críticos, los registros de aplicaciones, el hardware del servidor o cualquier otro componente crítico en su sistema de producción, que monitorea de manera proactiva. Si algo es extraño o no funciona, entonces seguro que tiene un desastre en sus manos.

9. Esquema de un procedimiento de respuesta de acción

Una vez que ocurre un desastre, es necesario activar un entorno de recuperación de desastres lo antes posible. Un procedimiento de respuesta a la acción describirá cómo realizar la conmutación por error al sitio de recuperación ante desastres con todos los pasos necesarios. No importa si su proceso de recuperación está utilizando DRaaS o una herramienta de recuperación de desastres para iniciar su sitio de desastre automáticamente, debe preparar el procedimiento de respuesta a la acción por escrito para asegurarse de cómo se iniciarán, verificarán y controlarán los servicios necesarios.

Además, la puesta en marcha de los servicios de producción en otra ubicación no es suficiente, ya que garantizar que todos los datos necesarios estén en su lugar y que todas las aplicaciones empresariales necesarias funcionen correctamente también es igualmente fundamental.

10. Prepárese para la conmutación por recuperación a la infraestructura primaria

La conmutación por recuperación consiste en restaurar las operaciones en el centro de producción principal una vez que se han transferido a un sitio de recuperación ante desastres durante la conmutación por error. Los sitios de DR no están diseñados para ejecutar operaciones diarias; en cambio, solo se pueden usar para fines de emergencia. Los sitios de DR se construyen por un período muy corto (hasta que se restaura el sitio principal o hasta que se construye un nuevo centro de producción).

Una vez que el desastre ha pasado, se requiere un gran esfuerzo para implementar el traslado de datos y servicios comerciales de regreso a la ubicación principal; planifique una posible interrupción parcial de su negocio durante el proceso de reversión. Afortunadamente, existen soluciones de recuperación ante desastres que brindan conmutación por recuperación unificada a la ubicación principal, que se activa automática o manualmente una vez que completa la verificación de la ubicación de TI principal.

11. Informar el incidente a las partes interesadas

Una vez que ocurre un desastre, primero notifique no solo a los responsables de ejecutar las actividades de recuperación ante desastres, sino también a las partes interesadas clave, como proveedores, clientes, miembros del equipo de relaciones públicas y marketing, y proveedores externos. Además, considere informar a cada uno de estos grupos y formular respuestas para abordar sus inquietudes. Es mejor escribir un comunicado de prensa con anticipación para no perder tiempo durante un desastre real y tenerlo listo para su publicación.

12. Realice las pruebas exhaustivas

Probar su plan de recuperación ante desastres es obligatorio, pero generalmente se descuida. Las pruebas de conmutación por error suelen ser complejas y provocan la pérdida de datos y la interrupción de los servicios del producto. Por lo tanto, la mayoría de las empresas no prueban su plan de recuperación ante desastres de forma regular.

Para comprender qué tan bien funcionará su plan de recuperación ante desastres, debe programar pruebas periódicas de conmutación por error. Ignorar las pruebas del plan de recuperación ante desastres puede poner en riesgo a toda su empresa durante un desastre, ya sea incapaz de recuperarse a tiempo o sin recuperación alguna. Las pruebas de rendimiento también le ayudan a evaluar si su ubicación secundaria es suficiente para soportar la carga empresarial.

13. Mantenga actualizado su plan de recuperación ante desastres

Por último, pero no menos importante, dado que las pruebas del plan de recuperación ante desastres son obligatorias, también lo es mantener actualizados todos los documentos de recuperación ante desastres. Al final de cada prueba, revise lo que sucedió, cómo manejan sus equipos la prueba y documente sus hallazgos.

Firmando:

Puede optar por realizar una recuperación de desastres por su propia cuenta (una opción barata pero propensa a errores) o tener un buen plan de recuperación de desastres a mano para ayudar a su empresa a recuperar todos los datos perdidos y acelerar el regreso de su organización a las operaciones comerciales normales. Además de eso, también garantizará que el desastre no provoque consecuencias financieras adversas ni grandes interrupciones comerciales.

Asegúrese de tener en cuenta todos los aspectos de su organización (por ejemplo, el número de empleados, el presupuesto disponible, los factores de riesgo, el tamaño de la infraestructura de TI, etc.) para determinar qué funcionará mejor para usted y su equipo.

Deja una respuesta

es_ESSpanish