博客

災難恢復計劃中要包括的13點

一個 災難恢復計劃 (DRP) is a document you need to keep handy to handle unexpected incidents that could shut down your company’s IT systems and hinder its overall operation.
A DRP aims to get your business up and running as quickly as possible during a disaster or data breach. With an 有效的災難恢復 計劃,您損失太長時間的利潤損失的機會就更少了。此外,還應設置備份以防止敏感數據(社會安全號碼或信用卡信息)受到破壞。

您的企業有災難恢復計劃嗎?

資料遺失,停機時間和技術暴行是當今甚至頂級公司都遇到的一些新的恐怖故事。每當公司發生災難時,工程團隊都會急於修復損壞,另一方面,公關團隊會加班工作以恢復客戶的信心。您不認為這是一項耗時且昂貴的工作嗎?當然是的!但是某些組織可以最有效地管理這些災難,而且附帶損害也較少。想知道如何?很簡單,他們有一個全面,易於遵循且經過定期測試的災難恢復計劃。

Disasters come uninvited with loads of complex challenges, which organizations might take months or years to overcome. Cyber attacks, tornadoes, terrorist attacks, hurricanes, and floods are some of the disasters that can cause data breaches. A disaster plan is a long-term assurance of business operability as it is designed in such a way that it enables businesses to reduce damages of unpredicted outages.

您是否有災難恢復計劃,還是剛剛開始為組織創建計劃?在這兩種情況下,下面的災難恢復計劃清單都將幫助您在計劃中添加所有關鍵組件。

1.分析潛在威脅和可能的反應

首先是要花時間分析所有可能干擾您的業務流程的因素。完成研究後,就可以為每種情況創建不同的恢復計劃了。例如,網絡攻擊正變得越來越普遍並且可能發生,但是不幸的是,普通防火牆的強度不足以抵禦大多數攻擊。

因此,比起您的海嘯,更強烈地考慮網絡攻擊的可能性。您可能會選擇加密數據並保護硬件。嘗試了解系統中的漏洞,因為這些是黑客用來獲取訪問權限的切入點。

最好的方法是讓自己了解黑客使用的許多方案。您可以避免大多數網絡釣魚和惡意軟件感染。

2.修復災難恢復目標

災難恢復可幫助您保持業務持續正常運行,因此您需要修復對組織運營至關重要的IT服務。此外,這些服務/機器所需的恢復時間目標(RTO)和恢復點目標(RPO)。但是您知道RTO和RPO嗎?

RPO:通知業務中斷後從災難中恢復所需的時間。萬一發生災難,如果您的企業無法承受至少一個小時的停機時間而又不失去競爭對手的客戶,那麼至關重要。您需要一個可靠的災難恢復計劃,其中應包括明確規定的允許的RTO。

RPO:可接受數據的時間範圍。災難發生後,如果您的企業在一天的業務後只能在四個小時內丟失數據,這可能會導致重要數據的災難性損失,因此您的RPO將是四個小時。

組織的RTO和RPO一定會影響其恢復策略和相關費用。為了降低災難恢復策略的總成本,最好將應用程序劃分為多個層。為關鍵任務應用程序保留的最高層將需要基於實時連續數據複製的災難恢復技術。中層可能需要基於快照的應用程序,最後,最低層可能需要一個簡單的文件級備份系統。

3.在災難恢復計劃中識別利益相關者

下一步也是至關重要的一步,就是確定災難發生後需要更新的人員。工程師,支持人員,主管等將參與實際的災難恢復。但是,您還需要確定其他人,例如供應商,公關和營銷團隊的成員,第三方供應商以及主要客戶。大多數公司在其項目辦公室文檔中都有一個利益相關者登記冊,以便在發生災難時進行通知。

4.創建一個災難恢復站點

災難很可能會嚴重破壞您的生產中心,從而使您無法在主站點上恢復操作,從而無法將關鍵的工作負載遷移到另一個位置。根據災難恢復計劃,您需要構建一個災難恢復站點所需的清單,以在緊急遷移關鍵數據,人員,物理資源和廣告應用程序時使用。另外,您應該為站點配備足夠的硬件和軟件來承擔基本的工作負載。

5.收集整個基礎架構文檔

當災難發生時,萬事俱備,每個人都承受著壓力。實際上,您的工程團隊具有激活災難恢復過程所需的技能和知識,但是基礎結構文檔是必需的。即使是在執行災難恢復時精通技術的工程師也希望從基礎結構文檔中逐個命令進行操作。

那麼,該文檔由什麼組成?系統的整體設置及其用法(安裝,恢復過程,正在運行的應用程序,操作系統和配置),雲模板,存儲和數據庫(數據的保存方式和位置,備份的還原方式,數據的準確性驗證)以及所有映射的網絡連接(具有正常運行的設備及其配置)。

6.精挑細選的精確技術

Disaster Recovery as a Service (DRaaS) and on-premise disaster recovery is not just the feasible solutions available for business continuity. The next option is to make use of cloud-based disaster recovery in order to spin up your disaster recovery site on a public cloud-like 微軟AzureAWS 和 谷歌云 in minutes using an automated disaster recovery solution.

在選擇解決方案之前,請確保考慮總擁有成本,維護要求,可伸縮性,恢復到上一個時間點以及易於測試。災難恢復解決方案的選擇很多,因此您需要進行深入研究並明智地選擇。

7.啟動溝通渠道

沒有人知道災難什麼時候可以敲門,因此,作為一個組織,您必須保留一組團隊(及其角色和聯繫信息)以進行災難恢復。嘗試建立一個全面的指揮鏈,其中包括每個工程團隊(例如,數據庫,系統,網絡,存儲)和相關執行領導的負責人員。此外,設置專用的通信渠道和中心,或用於即時消息傳遞的在線信息共享工具。

8.概述事件響應程序

如果您有災難恢復計劃,則必須執行“事件響應程序”。在此,公司將詳細定義哪些事件必須宣佈為災難。例如,如果您的系統出現故障,您會認為這是一場災難?此外,該計劃還應指明如何驗證災難以及如何通過自動監視系統,由站點可靠性工程(SRE)團隊的電話提出或由客戶報告的災難來報告?

為了驗證災難確實正在發生,您需要檢查關鍵網絡設備,應用程序日誌,服務器硬件或生產系統中可以主動監控的其他關鍵組件的狀態。如果有些奇怪或不起作用,那麼請確保您手邊有災難。

9.概述行動響應程序

一旦災難發生,就需要盡快激活災難恢復環境。操作響應過程將概述如何通過所有必需步驟來故障轉移到災難恢復站點。無論您的恢復過程是使用DRaaS還是使用災難恢復工具自動啟動災難站點,您都需要以書面形式準備操作響應過程,以確保如何啟動,驗證和控制必要的服務。

此外,在另一個位置擴展生產服務還不夠,確保所有必需的數據到位以及所有必需的業務應用程序正常運行也同樣重要。

10.準備故障回復到主基礎架構

故障轉移是在故障轉移期間將其轉移到災難恢復站點後,在主生產中心恢復操作。 DR站點並非旨在運行日常操作;相反,它們只能用於緊急目的。建立災難恢復站點的時間很短(直到還原主站點或建立新的生產中心為止)。

災難結束後,需要付出很多努力才能將數據和業務服務移回主位置,併計劃在還原過程中可能會部分中斷業務。幸運的是,存在災難恢復解決方案,它們可提供對主位置的統一故障回复,一旦完成對主IT位置的驗證,即可自動或手動激活。

11.向利益相關者報告事件

一旦發生災難,首先不僅要通知負責執行災難恢復活動的人員,還要通知主要利益相關者,例如供應商,客戶,PR和營銷團隊的成員以及第三方供應商。另外,請考慮告知這些小組中的每一個,並提出解決他們所關注問題的答案。最好事先編寫新聞稿,以免在實際災難中浪費時間準備發布。

12.做廣泛的測試

測試災難恢復計劃是強制性的,但通常被忽略。故障轉移測試通常很複雜,並且會導致數據丟失和產品服務中斷。因此,大多數公司不會定期測試其災難恢復計劃。

為了了解災難恢復計劃的工作效果,您必須安排定期的故障轉移測試。忽略災難恢復計劃測試可能會使整個企業在災難罷工中面臨風險,最終要么無法及時恢復,要么根本無法恢復。性能測試還可以幫助您評估輔助位置是否足以承受業務負荷。

13.保持災難恢復計劃的更新

最後但並非最不重要的一點是,由於災難恢復計劃測試是強制性的,因此保持所有災難恢復文檔都保持更新。在每次測試結束時,回顧發生了什麼,團隊如何處理測試並記錄您的發現。

退出:

您可以選擇執行自行執行的災難恢復(一種廉價的但容易出錯的選項),或者可以使用一個好的災難恢復計劃來幫助您的公司恢復所有丟失的數據並加快組織恢復正常的業務運營。除此之外,它還將確保災難不會觸發不利的財務後果和重大業務中斷。

確保您考慮到組織的各個方面(例如,員工數量,可用預算,風險因素,IT基礎架構的大小等),以確定最適合您和您的團隊的因素。

發表評論

zh_TWChinese