銀行金融監(jiān)管系統(tǒng)的災難備份解決方案
申請免費試用、咨詢電話:400-8352-114
用戶需要災難備份的速度和程度,來設計選擇并實現(xiàn)自己的災難備份計劃。不同層次的災難備份解決方案所帶來的設施投資大小和業(yè)務恢復的程度和速度是不一樣的,具體的災難備份解決方案的業(yè)務恢復情況分析圖如下表所示。
表為: 災難備份解決方案的業(yè)務恢復情況分析圖
對于銀行金融監(jiān)管系統(tǒng)的業(yè)務連續(xù)運行的重要性和災難恢復程度的要求,以及遠程異地兩中心的實際需求,IBM公司建議采用位于Tier6 的GDPS/XRC的遠程災難備份方式,實現(xiàn)異地遠程的最高級別的災難恢復解決方案。
由于并行系統(tǒng)綜合體耦合時鐘的連接不能超過40公里,同時40公里以內的距離對應用響應時間的影響程度較輕,因此在同一個城市內的兩災難備份中心可以采用GDPS/PPRC的方式,而在異地兩個城市之間的災難備份中心之間,一般采用GDPS/XRC的災難恢復解決方案。如下圖所示,
GDPS/XRC的災難恢復解決方案示意圖
如上圖所示,IBM 公司的XRC遠程拷貝是一個基于存儲的解決方案,通過與并行系統(tǒng)綜合體的結合,實現(xiàn)了跨地域的GDPS/XRC災難恢復解決方案,完全能夠滿足銀行金融監(jiān)管系統(tǒng)的災難備份需求。在生產中心發(fā)生事故時,IBM的GDPS/XRC技術能夠提供有效的災難恢復解決方案。由于XRC遠程拷貝技術可以實時地將數據傳遞到遠程中心形成鏡像并保證數據寫更新的串行性,所以XRC遠程拷貝技術提供了易于使用的災難恢復與數據鏡像支持。 系統(tǒng)數據移動部件SDM(system data mover)是災難備份中心的OS/390或z/OS操作系統(tǒng)的一個軟件組成部件,由DFSMS提供其數據管理和拷貝的功能,需要運行在專有的一個邏輯分區(qū)上。系統(tǒng)數據移動部件SDM必須同存儲主卷與備卷相聯(lián)系,當數據更新發(fā)生在主卷的時候,SDM負責將這些更新拷貝到備卷,SDM將確保數據在備卷上的更新順序與在主卷上的更新順序相同。GDPS控制程序K系統(tǒng)是基于Netview和System Automation軟件之上的一套GDPS控制程序,需運行在一個單獨的分區(qū)中,負責GDPS/XRC日常操作和在災難發(fā)生后的一系列的系統(tǒng)恢復處理過程,實現(xiàn)應用的重啟。
遠程拷貝是災難恢復和系統(tǒng)管理方案的一種選擇,遠程拷貝有兩種實現(xiàn)方法,即PPRC 和 XRC,它們既有共同的特點,也有實現(xiàn)方法上的差別,它們都實現(xiàn)了:
保護數據不丟失
在PPRC 方式下, 生產中心和災難備份中心的存盤數據不會丟失。在XRC 方式下, 僅僅正在傳輸的數據可能會發(fā)生丟失現(xiàn)象,這種丟失現(xiàn)象意味著, 當生產中心失效的時候,更新還未在災難備份中心完成,但數據的丟失程度可通過 SDM以及它的參數的設置而減到最小。
同步或異步的實時數據鏡像
PPRC 實現(xiàn)的是同步的遠程拷貝,XRC實現(xiàn)的是異步的遠程拷貝。
應用的無關性
無論是PPRC還是XRC,都是在存儲控制器遠程拷貝的功能下來自動實現(xiàn)存儲數據的鏡像,無論使用數據的應用是什么,鏡像都會發(fā)生,因此不必為不同的應用提供各自的拷貝工具。
支持所有的存儲數據
遠程拷貝是卷一級的數據鏡像, 支持所有的存儲數據,無論是應用數據還是系統(tǒng)數據, 都能被鏡像到災難備份中心。
SMS and non-SMS 支持
遠程拷貝提供了對SMS管理的和非SMS管理的數據的實時拷貝。
獨立的虛擬運行
在數據寫入主存儲器并拷貝到遠程存儲器的過程中,不需要任何應用級用戶的介入。
可以看出,IBM 的XRC遠程拷貝災難恢復解決方案在保證應用響應時間的前提下,確保了最高級別的數據完整性與有效性,同時可用于工作負載移動和數據遷移。它提供了基于存儲的、遠距離的、實時的、異步的、與應用無關的數據鏡像,允許應用在生產中心用通常的方法更新它的數據,直到更新結束后才將更新的數據傳送到災難備份中心。這樣的異步操作使得對生產中心應用系統(tǒng)的性能沖擊減到最小。
根據銀行金融監(jiān)管系統(tǒng)的具體情況和需求,IBM推薦其XRC遠程拷貝技術來實現(xiàn)GDPS/XRC的災難恢復解決方案。
災難備份解決方案的設計和實現(xiàn)
下圖六為銀行金融監(jiān)管系統(tǒng)的總體災難備份解決方案,系統(tǒng)將采用全國一個總生產中心、一個總災難備份中心的方案,即在日常業(yè)務中,全國所有的交易都送往全國總生產中心 - 北京生產中心進行處理,同時北京生產中心的生產數據將通過CNT等通道擴展設備和多條高速通訊線路(E1/E3)實時在ABC災難備份中心進行異步的鏡像,數據的延遲時間將取決于兩地點之間通訊線路的帶寬和傳輸數據量的多少以及遠程拷貝的定義。
網絡將具有北京生產中心和ABC災難備份中心之間的快速切換能力,一旦發(fā)生災難事件導致北京生產中心無法運行,則ABC災難備份中心將接管全國的生產業(yè)務,直到北京生產中心恢復,才切換網絡,恢復北京生產中心的生產地位。
在日常情況下,ABC災難備份中心除了保證數據的實時完整備份外,主要進行大量業(yè)務測試和應用開發(fā)的工作。若ABC中心發(fā)生災難,則北京生產中心的備用測試分區(qū)將臨時接管ABC中心的測試工作,同時等待ABC中心恢復正常。ABC災難備份中心的數據和北京生產中心的數據都將在異地進行數據的互為鏡像,實現(xiàn)異地兩中心的共同工作,且互為備份。
銀行金融監(jiān)管系統(tǒng)的總體災難備份解決方案
在XRC的支持下,我們可通過定義一定的時間間隔或生產數據更新量門限值,來啟動北京和ABC兩地的數據鏡像備份。啟動間隔的長短取決于希望恢復的數據完整性的要求、現(xiàn)實帶寬的條件以及通訊線路投資預算。備份啟動間隔越短,異地備份中心的數據滯后于生產中心的時間就越短,生產中心突發(fā)災難時可能導致的數據丟失就越少,災難備份中心恢復丟失數據所用的時間就越短。對于間隔時間長且流量大的業(yè)務數據進行異地備份,應根據實際情況提前仔細規(guī)劃,準確計算所需帶寬和要求的通訊線路,同時兼顧租用通訊線路的成本。通過仔細的計劃,可以使得北京生產中心和ABC災難備份中心之間的數據同步延遲時間為分鐘級。
當災難發(fā)生時,如果數據還來不及傳送到災難備份中心,則正在傳輸的數據可能會發(fā)生丟失現(xiàn)象,數據的丟失程度可通過 SDM及其參數的設置而減到最小。在災難發(fā)生后,需要有一系列的災難恢復處理過程,保證數據的完整性,保證用戶的通訊線路快速從生產中心切換到災難備份中心,最終實現(xiàn)應用的重啟和整個災難備份中心的生產功能。如果網絡的切換能夠在一小時內完成,有客戶記錄在兩小時內完成其關鍵業(yè)務的恢復。事實上,災難恢復過程的時間長短與用戶的應用和網絡的實際情況有著密切的關系,以上所提到的災難恢復時間僅供參考。下圖為XRC遠程拷貝的實現(xiàn)步驟。
XRC遠程拷貝的實現(xiàn)步驟
上圖中的系統(tǒng)數據移動部件SDM(system data mover)是OS/390或z/OS操作系統(tǒng)的一個軟件組成部件,XRC的操作是在數據要求更新到磁盤時,立即把數據寫到磁盤控制器的快速緩存器,同時發(fā)出指令要求拷貝同樣的數據到遠程的磁盤。但是XRC 不要求異地的磁盤控制器回答完成拷貝的信息,即可以馬上把數據直接寫到本地磁盤,應用的響應時間可以不受影響。
GDPS/XRC所實現(xiàn)的災難恢復遠遠超過了Share78 所定義的7層