銀行金融監(jiān)管系統(tǒng)的災(zāi)難備份解決方案
申請(qǐng)免費(fèi)試用、咨詢電話:400-8352-114
用戶需要災(zāi)難備份的速度和程度,來設(shè)計(jì)選擇并實(shí)現(xiàn)自己的災(zāi)難備份計(jì)劃。不同層次的災(zāi)難備份解決方案所帶來的設(shè)施投資大小和業(yè)務(wù)恢復(fù)的程度和速度是不一樣的,具體的災(zāi)難備份解決方案的業(yè)務(wù)恢復(fù)情況分析圖如下表所示。
表為: 災(zāi)難備份解決方案的業(yè)務(wù)恢復(fù)情況分析圖
對(duì)于銀行金融監(jiān)管系統(tǒng)的業(yè)務(wù)連續(xù)運(yùn)行的重要性和災(zāi)難恢復(fù)程度的要求,以及遠(yuǎn)程異地兩中心的實(shí)際需求,IBM公司建議采用位于Tier6 的GDPS/XRC的遠(yuǎn)程災(zāi)難備份方式,實(shí)現(xiàn)異地遠(yuǎn)程的最高級(jí)別的災(zāi)難恢復(fù)解決方案。
由于并行系統(tǒng)綜合體耦合時(shí)鐘的連接不能超過40公里,同時(shí)40公里以內(nèi)的距離對(duì)應(yīng)用響應(yīng)時(shí)間的影響程度較輕,因此在同一個(gè)城市內(nèi)的兩災(zāi)難備份中心可以采用GDPS/PPRC的方式,而在異地兩個(gè)城市之間的災(zāi)難備份中心之間,一般采用GDPS/XRC的災(zāi)難恢復(fù)解決方案。如下圖所示,
GDPS/XRC的災(zāi)難恢復(fù)解決方案示意圖
如上圖所示,IBM 公司的XRC遠(yuǎn)程拷貝是一個(gè)基于存儲(chǔ)的解決方案,通過與并行系統(tǒng)綜合體的結(jié)合,實(shí)現(xiàn)了跨地域的GDPS/XRC災(zāi)難恢復(fù)解決方案,完全能夠滿足銀行金融監(jiān)管系統(tǒng)的災(zāi)難備份需求。在生產(chǎn)中心發(fā)生事故時(shí),IBM的GDPS/XRC技術(shù)能夠提供有效的災(zāi)難恢復(fù)解決方案。由于XRC遠(yuǎn)程拷貝技術(shù)可以實(shí)時(shí)地將數(shù)據(jù)傳遞到遠(yuǎn)程中心形成鏡像并保證數(shù)據(jù)寫更新的串行性,所以XRC遠(yuǎn)程拷貝技術(shù)提供了易于使用的災(zāi)難恢復(fù)與數(shù)據(jù)鏡像支持?! ∠到y(tǒng)數(shù)據(jù)移動(dòng)部件SDM(system data mover)是災(zāi)難備份中心的OS/390或z/OS操作系統(tǒng)的一個(gè)軟件組成部件,由DFSMS提供其數(shù)據(jù)管理和拷貝的功能,需要運(yùn)行在專有的一個(gè)邏輯分區(qū)上。系統(tǒng)數(shù)據(jù)移動(dòng)部件SDM必須同存儲(chǔ)主卷與備卷相聯(lián)系,當(dāng)數(shù)據(jù)更新發(fā)生在主卷的時(shí)候,SDM負(fù)責(zé)將這些更新拷貝到備卷,SDM將確保數(shù)據(jù)在備卷上的更新順序與在主卷上的更新順序相同。GDPS控制程序K系統(tǒng)是基于Netview和System Automation軟件之上的一套GDPS控制程序,需運(yùn)行在一個(gè)單獨(dú)的分區(qū)中,負(fù)責(zé)GDPS/XRC日常操作和在災(zāi)難發(fā)生后的一系列的系統(tǒng)恢復(fù)處理過程,實(shí)現(xiàn)應(yīng)用的重啟。
遠(yuǎn)程拷貝是災(zāi)難恢復(fù)和系統(tǒng)管理方案的一種選擇,遠(yuǎn)程拷貝有兩種實(shí)現(xiàn)方法,即PPRC 和 XRC,它們既有共同的特點(diǎn),也有實(shí)現(xiàn)方法上的差別,它們都實(shí)現(xiàn)了:
保護(hù)數(shù)據(jù)不丟失
在PPRC 方式下, 生產(chǎn)中心和災(zāi)難備份中心的存盤數(shù)據(jù)不會(huì)丟失。在XRC 方式下, 僅僅正在傳輸?shù)臄?shù)據(jù)可能會(huì)發(fā)生丟失現(xiàn)象,這種丟失現(xiàn)象意味著, 當(dāng)生產(chǎn)中心失效的時(shí)候,更新還未在災(zāi)難備份中心完成,但數(shù)據(jù)的丟失程度可通過 SDM以及它的參數(shù)的設(shè)置而減到最小。
同步或異步的實(shí)時(shí)數(shù)據(jù)鏡像
PPRC 實(shí)現(xiàn)的是同步的遠(yuǎn)程拷貝,XRC實(shí)現(xiàn)的是異步的遠(yuǎn)程拷貝。
應(yīng)用的無關(guān)性
無論是PPRC還是XRC,都是在存儲(chǔ)控制器遠(yuǎn)程拷貝的功能下來自動(dòng)實(shí)現(xiàn)存儲(chǔ)數(shù)據(jù)的鏡像,無論使用數(shù)據(jù)的應(yīng)用是什么,鏡像都會(huì)發(fā)生,因此不必為不同的應(yīng)用提供各自的拷貝工具。
支持所有的存儲(chǔ)數(shù)據(jù)
遠(yuǎn)程拷貝是卷一級(jí)的數(shù)據(jù)鏡像, 支持所有的存儲(chǔ)數(shù)據(jù),無論是應(yīng)用數(shù)據(jù)還是系統(tǒng)數(shù)據(jù), 都能被鏡像到災(zāi)難備份中心。
SMS and non-SMS 支持
遠(yuǎn)程拷貝提供了對(duì)SMS管理的和非SMS管理的數(shù)據(jù)的實(shí)時(shí)拷貝。
獨(dú)立的虛擬運(yùn)行
在數(shù)據(jù)寫入主存儲(chǔ)器并拷貝到遠(yuǎn)程存儲(chǔ)器的過程中,不需要任何應(yīng)用級(jí)用戶的介入。
可以看出,IBM 的XRC遠(yuǎn)程拷貝災(zāi)難恢復(fù)解決方案在保證應(yīng)用響應(yīng)時(shí)間的前提下,確保了最高級(jí)別的數(shù)據(jù)完整性與有效性,同時(shí)可用于工作負(fù)載移動(dòng)和數(shù)據(jù)遷移。它提供了基于存儲(chǔ)的、遠(yuǎn)距離的、實(shí)時(shí)的、異步的、與應(yīng)用無關(guān)的數(shù)據(jù)鏡像,允許應(yīng)用在生產(chǎn)中心用通常的方法更新它的數(shù)據(jù),直到更新結(jié)束后才將更新的數(shù)據(jù)傳送到災(zāi)難備份中心。這樣的異步操作使得對(duì)生產(chǎn)中心應(yīng)用系統(tǒng)的性能沖擊減到最小。
根據(jù)銀行金融監(jiān)管系統(tǒng)的具體情況和需求,IBM推薦其XRC遠(yuǎn)程拷貝技術(shù)來實(shí)現(xiàn)GDPS/XRC的災(zāi)難恢復(fù)解決方案。
災(zāi)難備份解決方案的設(shè)計(jì)和實(shí)現(xiàn)
下圖六為銀行金融監(jiān)管系統(tǒng)的總體災(zāi)難備份解決方案,系統(tǒng)將采用全國一個(gè)總生產(chǎn)中心、一個(gè)總災(zāi)難備份中心的方案,即在日常業(yè)務(wù)中,全國所有的交易都送往全國總生產(chǎn)中心 - 北京生產(chǎn)中心進(jìn)行處理,同時(shí)北京生產(chǎn)中心的生產(chǎn)數(shù)據(jù)將通過CNT等通道擴(kuò)展設(shè)備和多條高速通訊線路(E1/E3)實(shí)時(shí)在ABC災(zāi)難備份中心進(jìn)行異步的鏡像,數(shù)據(jù)的延遲時(shí)間將取決于兩地點(diǎn)之間通訊線路的帶寬和傳輸數(shù)據(jù)量的多少以及遠(yuǎn)程拷貝的定義。
網(wǎng)絡(luò)將具有北京生產(chǎn)中心和ABC災(zāi)難備份中心之間的快速切換能力,一旦發(fā)生災(zāi)難事件導(dǎo)致北京生產(chǎn)中心無法運(yùn)行,則ABC災(zāi)難備份中心將接管全國的生產(chǎn)業(yè)務(wù),直到北京生產(chǎn)中心恢復(fù),才切換網(wǎng)絡(luò),恢復(fù)北京生產(chǎn)中心的生產(chǎn)地位。
在日常情況下,ABC災(zāi)難備份中心除了保證數(shù)據(jù)的實(shí)時(shí)完整備份外,主要進(jìn)行大量業(yè)務(wù)測(cè)試和應(yīng)用開發(fā)的工作。若ABC中心發(fā)生災(zāi)難,則北京生產(chǎn)中心的備用測(cè)試分區(qū)將臨時(shí)接管ABC中心的測(cè)試工作,同時(shí)等待ABC中心恢復(fù)正常。ABC災(zāi)難備份中心的數(shù)據(jù)和北京生產(chǎn)中心的數(shù)據(jù)都將在異地進(jìn)行數(shù)據(jù)的互為鏡像,實(shí)現(xiàn)異地兩中心的共同工作,且互為備份。
銀行金融監(jiān)管系統(tǒng)的總體災(zāi)難備份解決方案
在XRC的支持下,我們可通過定義一定的時(shí)間間隔或生產(chǎn)數(shù)據(jù)更新量門限值,來啟動(dòng)北京和ABC兩地的數(shù)據(jù)鏡像備份。啟動(dòng)間隔的長短取決于希望恢復(fù)的數(shù)據(jù)完整性的要求、現(xiàn)實(shí)帶寬的條件以及通訊線路投資預(yù)算。備份啟動(dòng)間隔越短,異地備份中心的數(shù)據(jù)滯后于生產(chǎn)中心的時(shí)間就越短,生產(chǎn)中心突發(fā)災(zāi)難時(shí)可能導(dǎo)致的數(shù)據(jù)丟失就越少,災(zāi)難備份中心恢復(fù)丟失數(shù)據(jù)所用的時(shí)間就越短。對(duì)于間隔時(shí)間長且流量大的業(yè)務(wù)數(shù)據(jù)進(jìn)行異地備份,應(yīng)根據(jù)實(shí)際情況提前仔細(xì)規(guī)劃,準(zhǔn)確計(jì)算所需帶寬和要求的通訊線路,同時(shí)兼顧租用通訊線路的成本。通過仔細(xì)的計(jì)劃,可以使得北京生產(chǎn)中心和ABC災(zāi)難備份中心之間的數(shù)據(jù)同步延遲時(shí)間為分鐘級(jí)。
當(dāng)災(zāi)難發(fā)生時(shí),如果數(shù)據(jù)還來不及傳送到災(zāi)難備份中心,則正在傳輸?shù)臄?shù)據(jù)可能會(huì)發(fā)生丟失現(xiàn)象,數(shù)據(jù)的丟失程度可通過 SDM及其參數(shù)的設(shè)置而減到最小。在災(zāi)難發(fā)生后,需要有一系列的災(zāi)難恢復(fù)處理過程,保證數(shù)據(jù)的完整性,保證用戶的通訊線路快速從生產(chǎn)中心切換到災(zāi)難備份中心,最終實(shí)現(xiàn)應(yīng)用的重啟和整個(gè)災(zāi)難備份中心的生產(chǎn)功能。如果網(wǎng)絡(luò)的切換能夠在一小時(shí)內(nèi)完成,有客戶記錄在兩小時(shí)內(nèi)完成其關(guān)鍵業(yè)務(wù)的恢復(fù)。事實(shí)上,災(zāi)難恢復(fù)過程的時(shí)間長短與用戶的應(yīng)用和網(wǎng)絡(luò)的實(shí)際情況有著密切的關(guān)系,以上所提到的災(zāi)難恢復(fù)時(shí)間僅供參考。下圖為XRC遠(yuǎn)程拷貝的實(shí)現(xiàn)步驟。
XRC遠(yuǎn)程拷貝的實(shí)現(xiàn)步驟
上圖中的系統(tǒng)數(shù)據(jù)移動(dòng)部件SDM(system data mover)是OS/390或z/OS操作系統(tǒng)的一個(gè)軟件組成部件,XRC的操作是在數(shù)據(jù)要求更新到磁盤時(shí),立即把數(shù)據(jù)寫到磁盤控制器的快速緩存器,同時(shí)發(fā)出指令要求拷貝同樣的數(shù)據(jù)到遠(yuǎn)程的磁盤。但是XRC 不要求異地的磁盤控制器回答完成拷貝的信息,即可以馬上把數(shù)據(jù)直接寫到本地磁盤,應(yīng)用的響應(yīng)時(shí)間可以不受影響。
GDPS/XRC所實(shí)現(xiàn)的災(zāi)難恢復(fù)遠(yuǎn)遠(yuǎn)超過了Share78 所定義的7層