Opanowanie siedmiu poziomów odzyskiwania po awarii — część 1

Wyjaśniono siedem poziomów odzyskiwania po awarii

Omawiając plany ciągłości działania, ważne jest zrozumienie koncepcji wysokiej dostępności (HA) i siedmiu poziomów odzyskiwania po awarii. Wysoka dostępność to zdolność systemu do zachowania odporności na pojedyncze punkty awarii, zapewniając stałą wydajność i czas sprawności. Jednak sam HA nie wystarczy. Organizacje muszą także posiadać solidną strategię odzyskiwania po awarii, aby szybko przywrócić infrastrukturę i dane przy minimalnej utracie danych w przypadku zakłóceń.

Na tym blogu przedstawię przegląd odzyskiwania po awarii i przedstawię siedem poziomów odzyskiwania po awarii, przygotowując grunt pod głębsze eksploracje w przyszłych blogach.

Aby zrozumieć 7 poziomów odzyskiwania po awarii, najpierw musimy zrozumieć podstawową koncepcję odzyskiwania po awarii i dlaczego jest ono potrzebne. Wskoczmy.

Disaster Recovery

odzyskiwanie po awarii to kluczowy aspekt utrzymania lub odbudowy kluczowej infrastruktury i systemów po klęsce żywiołowej lub katastrofie spowodowanej przez człowieka, takiej jak burza lub cyberatak. Jest to niezbędne do utrzymania wszystkich krytycznych aspektów funkcjonowania firmy pomimo znaczących zdarzeń zakłócających. Skuteczne odzyskiwanie po awarii wymaga przemyślanych zasad, procedur i narzędzi zapewniających ciągłość działania.

Pomiar utraty danych i czasu ich odzyskiwania

W przypadku awarii głównym celem organizacji jest szybkie przywrócenie wszystkich systemów przy jednoczesnej minimalizacji utraty danych. Cele te są ilościowo określane jako Docelowy czas regeneracji (RTO) i Cel punktu przywracania (RPO):

  • Cel czasu odzyskiwania (RTO): Jest to czas wymagany do przywrócenia infrastruktury i danych w celu wznowienia działalności biznesowej.
  • Cel punktu odzyskiwania (RPO): reprezentuje akceptowalną wielkość utraty danych, mierzoną w czasie od momentu wystąpienia katastrofy.
Przykład pokazujący dłuższe „rzeczywiste” czasy, które NIE spełniają ani RPO, ani RTO („cele”). Diagram przedstawia schematyczne przedstawienie terminów RPO i RTO.

Potrzeba miejsca dodatkowego

Lokalizacja dodatkowa wyposażona w porównywalną infrastrukturę — ​​taką jak zasoby obliczeniowe, pamięć masowa i sieć — jest konieczna, szczególnie gdy nie można natychmiast odzyskać lokalizacji głównej. Dane przywrócone w tej lokalizacji dodatkowej mają kluczowe znaczenie dla kontynuowania działalności biznesowej.

Stany infrastruktury i warstwy danych

Miejsce dodatkowe może być aktywne lub pasywne. Na przykład, gdy przetwarzanie, sieć i pamięć masowa mogą być aktywne, przywrócenie danych jest konieczne, jeśli w ośrodku brakuje danych (lub stanu) niezbędnych do funkcjonowania jako ośrodek główny. W tym scenariuszu warstwa danych znajduje się w stanie pasywnym, co wpływa na RTO podczas odzyskiwania po awarii.

Uwagi dotyczące planu odzyskiwania po awarii (DRP)

Aby skutecznie ustanowić DRP, firmy muszą omówić swoje potrzeby specyficzne dla domeny, aby określić odpowiednie wymagania RPO i RTO. Na przykład banki zazwyczaj wymagają bardzo niskiego RPO i RTO, dążąc do minimalnych przestojów, podczas gdy uniwersytet lub organizacja badawcza może tolerować utratę części danych i dłuższy okres odzyskiwania.

Od kopii zapasowych do ciągłej replikacji danych: siedem poziomów odzyskiwania po awarii

Osiągnięcie pożądanych celów RPO i RTO wymaga zrozumienia siedmiu poziomów odzyskiwania po awarii, od poziomu 0 do poziomu 6. Każdy poziom zapewnia różną ochronę danych i szybkość odzyskiwania, przy rosnących kosztach i złożoności.

Odzyskiwanie po awarii poziomu 0: brak danych poza siedzibą firmy

Ten pierwszy z siedmiu poziomów odzyskiwania po awarii obejmuje przechowywanie danych wyłącznie w siedzibie firmy, bez tworzenia kopii zapasowych poza siedzibą firmy. Jest to najbardziej opłacalne rozwiązanie, ale wiąże się z najwyższym ryzykiem całkowitej utraty danych w przypadku awarii na miejscu. Idealny do małych, niekrytycznych konfiguracji.

Poziom 1 Disaster Recovery: Taśmy zapasowe poza siedzibą firmy

Wiąże się to z tworzeniem kopii zapasowych danych na taśmach magnetycznych przechowywanych poza siedzibą firmy. Jest to bezpieczniejsza opcja niż poziom 0, ale odzyskiwanie danych może być powolne. Jest odpowiedni dla instytucji, w których szybkość odzyskiwania danych nie jest czynnikiem krytycznym.

Poziom 2 Disaster Recovery: Kopia zapasowa dysku poza siedzibą firmy

Możliwe jest szybsze odzyskiwanie danych, ponieważ kopie zapasowe danych są tworzone poza siedzibą firmy w systemach dyskowych. Jest droższy niż kopie zapasowe na taśmie, ale pozwala na częstsze tworzenie kopii zapasowych. Odpowiedni dla średnich firm, dla których priorytetem jest szybkość odzyskiwania.

Poziom 3 Disaster Recovery: Sklepienie elektroniczne

Czwarty z siedmiu poziomów odzyskiwania po awarii obejmuje wysyłanie danych partiami do lokalizacji zewnętrznej w regularnych odstępach czasu. Zapewnia równowagę pomiędzy częstotliwością tworzenia kopii zapasowych a kosztami, co jest idealne dla organizacji o umiarkowanej szybkości zmiany danych.

Poziom 4 Disaster Recovery: Kopie w określonym momencie

Oferuje częste migawki danych, zapewniając wiele punktów odzyskiwania. Poziom ten wymaga dużej ilości pamięci masowej i jest idealny dla firm charakteryzujących się dużą liczbą transakcji lub obsługujących systemy krytyczne.

Poziom 5 Disaster Recovery: Integralność transakcji

Ten szósty z siedmiu poziomów odzyskiwania po awarii obejmuje przechwytywanie wszystkich transakcji aż do momentu awarii, zapewniając wysoką integralność danych. Jest to technicznie złożone i idealne dla konfiguracji, w których kluczowa jest spójność transakcji, takich jak instytucje finansowe.

Poziom 6 Disaster Recovery: Zero lub prawie zero RPO

Ten ostatni poziom ze wszystkich siedmiu poziomów odzyskiwania danych po awarii obejmuje ciągłą ochronę danych z niemal natychmiastowym odzyskiwaniem i minimalną utratą danych. Jest to najbardziej wyrafinowane i kosztowne rozwiązanie, odpowiednie dla dużych przedsiębiorstw lub krytycznych systemów rządowych.

Siedem poziomów odzyskiwania po awarii: ostrożna równowaga kosztów i możliwości

W planowaniu odzyskiwania po awarii dokładne zdefiniowanie docelowego punktu odzyskiwania (RPO) i docelowego czasu odzyskiwania (RTO) ma kluczowe znaczenie dla odporności biznesowej. Cele te decydują o tym, jak szybko i skutecznie firma może podnieść się po zakłóceniach. Jednak realizacja tych celów poprzez odpowiednie poziomy odzyskiwania po awarii wymaga starannego zrównoważenia kosztów i możliwości. Skuteczny plan odzyskiwania po awarii jest zgodny z tolerancją ryzyka i budżetem organizacji, zapewniając, że poziom inwestycji jest proporcjonalny do potencjalnego ryzyka i skutków. Zasadniczo dobrze opracowany plan odzyskiwania po awarii nie tylko chroni krytyczne funkcje biznesowe, ale także jest zgodny ze strategią finansową organizacji, zapewniając długoterminową stabilność i rozwój.


Przeglądaj więcej tematów