容災備份
兩地三中(zhōng)心概念:
結合近年國内出現的大(dà)範圍自然災害,以同城雙中(zhōng)心加異地災備中(zhōng)心的“兩地三中(zhōng)心”的災備模式也随之出現,這一(yī)方案兼具高可用性和災難備份的能力。
同城雙中(zhōng)心是指在同城或鄰近城市建立兩個可獨立承擔關鍵系統運行的數據中(zhōng)心,雙中(zhōng)心具備基本等同的業務處理能力并通過高速鏈路實時同步數據,日常情況下(xià)可同時分(fēn)擔業務及管理系統的運行,并可切換運行;災難情況下(xià)可在基本不丢失數據的情況下(xià)進行災備應急切換,保持業務連續運行。與異地災備模式相比較,同城雙中(zhōng)心具有投資(zī)成本低、建設速度快、運維管理相對簡單、可靠性更高等優點。
異地災備中(zhōng)心是指在異地的城市建立一(yī)個備份的災備中(zhōng)心,用于雙中(zhōng)心的數據備份,當雙中(zhōng)心出現自然災害等原因而發生(shēng)故障時,異地災備中(zhōng)心可以用備份數據進行業務的恢複。
針對兩地三中(zhōng)心災備建設的需求,華爲賽門鐵克公司利用Symantec軟件的優勢結合自身的存儲開(kāi)發能力,設計了典型的建設方案,方案原理和組網如圖所示。
如圖,同城雙中(zhōng)心的應用切換,采用Symantec Veritas的VCS(Veritas Cluster Server)集群軟件來實現,生(shēng)産中(zhōng)心主機和災備中(zhōng)心主機上都需要安裝VCS。采用VCS監測本地雙機或集群狀态,并通過組件GCO(Global Cluster Option)在本地和遠程的集群之間進行狀态監測。
在網絡層,同城雙中(zhōng)心之間采用光纖連接,保證雙中(zhōng)心之間較大(dà)的帶寬,以響應實時的業務數據需求,同城異地之間采用專網或IP廣域網即可實現,以節約成本。同城雙中(zhōng)心的光纖采用波分(fēn)複用(WDM)技術進行建設,針對兩地隻有1條或2條光纖連接的場景,采用WDM方式,能夠虛拟出多條FC或GE聯絡,滿足兩地之間對業務和數據多重鏈路的需求。WDM技術能充分(fēn)利用光纖的巨大(dà)帶寬資(zī)源,大(dà)幅度提高系統傳輸容量,降低傳輸成本,因此在長途和骨幹網的超大(dà)容量傳輸中(zhōng)得到了廣泛的應用。将WDM技術引入城域網、接入網,整個網絡就會變成無縫連接的整體(tǐ),爲所有不同的業務提供支持和連接,因此城域網中(zhōng)WDM具有很大(dà)優越性。
在數據存儲層,部署虛拟存儲Oceanspace VIS6000或Oceanspace S5000/S6800E磁盤陣列,通過存儲的同步遠程複制功能将數據同步複制到災備站點。确保生(shēng)産中(zhōng)心和災備中(zhōng)心的數據完全一(yī)緻。使用存儲的異步複制功能,将數據通過廣域網複制到遠端的災備站點,并且保證數據的完整性和可用性。遠端站點的作用主要是用來防止地理和自然災難,當同城的雙中(zhōng)心全部故障後,可以确保在異地有一(yī)份完整的數據拷貝,用于後續業務的恢複。
下(xià)面介紹方案具體(tǐ)的數據備份及業務流程:
∙數據備份
同城雙中(zhōng)心的數據采用同步複制,在同城災備中(zhōng)心建立一(yī)個在線更新的數據副本。當有數據下(xià)發到生(shēng)産中(zhōng)心陣列時,陣列間的同步複制都會同時将數據複制一(yī)份到同城災備中(zhōng)心。
同城災備中(zhōng)心與異地災備中(zhōng)心之間采用異步複制方式,定期将數據進行複制備份,異步複制支持增量複制方式,可以節省數據備份的帶寬占用,縮短數據的備份時間。
∙災難檢測
主機上的VCS-Global Cluster通過對資(zī)源組狀态的監控來判斷資(zī)源的可用性,包括數據庫資(zī)源組、網絡資(zī)源組等。資(zī)源組的狀态分(fēn)online/offline/fault三種,正常情況下(xià)生(shēng)産中(zhōng)心在工(gōng)作的時候資(zī)源組的狀态都是online,而災備中(zhōng)心的資(zī)源組是offline狀态。每個資(zī)源組在online和offline的時候均可以指定運行程序或腳本,程序或腳本執行完成後資(zī)源組即完成online或offline的過程。當檢測到生(shēng)産中(zhōng)心有資(zī)源組出現fault狀态時,同城内生(shēng)産中(zhōng)心同災備中(zhōng)心将進行切換,以保證業務的連續性。
∙容災切換
基于應用容災切換包括一(yī)系列的動作:停止災難節點的部件服務、切斷數據複制鏈路、建立數據容災基線、啓動容災節點的部件服務、通知(zhī)前端設備進行業務網絡切換。具體(tǐ)動作可以結合實際情況,通過腳本來定制。
∙恢複回切
回切工(gōng)作流程和切換流程原理是一(yī)樣的,隻是因爲切換的時候是不确定觸發的、可能導緻業務受部分(fēn)影響;而回切的時候通過人工(gōng)确認,選擇最小(xiǎo)影響的情況下(xià)執行操作(比如業務流量非常小(xiǎo)的情況下(xià),甚至暫停業務情況下(xià)),因此回切推薦采用的是手動切換模式。
應用級容災采用的是自動切換還是手動切換,用戶可以在部署時通過修改主機集群軟件的切換配置實現。
∙同城範圍有效保證了數據的安全性和業務連續性;
∙異地複制數據根據災難情形,盡可能降低數據丢失機率;
∙同城雙中(zhōng)心爲同步複制,數據實時同步,RPO=0;
∙異地無距離(lí)限制,保證數據一(yī)緻性,保證了數據的有效保護;
∙異地容災帶寬要求低,先進的複制機制提高帶寬利用率。
災備示意圖