監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價咨詢管理系統(tǒng) | 工程設(shè)計管理系統(tǒng) | 簽約案例 | 購買價格 | 在線試用 | 手機(jī)APP | 產(chǎn)品資料
X 關(guān)閉

災(zāi)難恢復(fù):你準(zhǔn)備好了嗎?

申請免費(fèi)試用、咨詢電話:400-8352-114

文章來源:泛普軟件

2004年7月5日,星期一,人們在度過一個愉快的周末后陸續(xù)進(jìn)入這座位于費(fèi)城最高的大樓準(zhǔn)備開始一周的工作,樓內(nèi)突然發(fā)生了停電故障。如果事情就此打住,人們也不必?fù)?dān)心,因?yàn)闉?zāi)難恢復(fù)專家們早就考慮到了這一點(diǎn)——大樓還有連接到另一電網(wǎng)的線路。但糟糕的是,維修中搶修人員無意中又弄斷了這條備用線路。

Glenmede信托公司總部位于這幢大樓內(nèi),占據(jù)著其中的四層。其首席技術(shù)官Nick Voutsakis說:“每場災(zāi)難各不相同,所以沒人能夠準(zhǔn)確地預(yù)測。你的規(guī)劃一定要非常靈活,以便應(yīng)對不測?!?/FONT>

像上面這樣的事件讓企業(yè)有機(jī)會看到部署的災(zāi)難恢復(fù)技術(shù)發(fā)揮作用。雖然有些公司效果非常好,但更多的公司計劃不夠全面、不合實(shí)際、技術(shù)上有缺陷。那么,哪些是經(jīng)實(shí)踐證明切實(shí)可行的最佳策略呢?應(yīng)當(dāng)部署哪些東西?IT部門又應(yīng)當(dāng)如何與整個組織合作,以便采取所有必要的防范措施?

“如果災(zāi)難恢復(fù)計劃沒有經(jīng)過測試或者測試力度不夠,企業(yè)最終會發(fā)現(xiàn),它們受到的保護(hù)并不如想象的那么到位,”Mike Karp說,他是科羅拉多州博耳德的調(diào)研公司企業(yè)管理合伙公司的分析師。

防患于未然

一些災(zāi)難恢復(fù)計劃過于簡化,與現(xiàn)實(shí)并不相符,所以一旦遇到緊急事件,派不上多大用場。還有些計劃過于復(fù)雜,沒人能看得懂。Voutsakis認(rèn)為,關(guān)鍵就在于找到平衡點(diǎn)。

但即便公司精心擬訂了計劃,如果需要實(shí)施,沒有人能找得到,照樣是一無用處。如果不知道計劃放在活頁夾的何處,或者放在因故障而停機(jī)的PC當(dāng)中,同樣是無濟(jì)于事。所以,要把計劃副本放在多個地方。Voutsakis說:“我們把計劃副本連同食物、藥品和手電筒等東西一起放在應(yīng)急包里,發(fā)給員工?!?/FONT>

Glenmede公司主要采用Windows 2000/XP,使用思科公司的交換機(jī)和戴爾公司的服務(wù)器和桌面機(jī)。其災(zāi)難恢復(fù)計劃分好幾層,具體視情形而定:如果員工因?yàn)橄麓笱┒鵁o法上班,服務(wù)器會在總部繼續(xù)運(yùn)行,員工可以安全地在家辦公。如果大樓停電,城市另一頭的“熱備份站點(diǎn)”可以在四個小時之內(nèi)讓關(guān)鍵系統(tǒng)啟動起來。運(yùn)營該站點(diǎn)的是Glenmede的業(yè)務(wù)連續(xù)性部門和外包提供商:SunGard公司,由SunGard數(shù)據(jù)系統(tǒng)公司的一個部門具體負(fù)責(zé)。如果災(zāi)難讓員工無法來大樓上班長達(dá)一周,SunGard處備用的桌面機(jī)可以供重要員工使用。

獨(dú)立日周末發(fā)生停電期間,Glenmede的管理人員在上午7:30宣布緊急事件。因?yàn)樗袛?shù)據(jù)都復(fù)制到了熱備份站點(diǎn),該公司得以在11:30之前恢復(fù)了所有系統(tǒng)的運(yùn)行。但大功告成需要一臺運(yùn)轉(zhuǎn)順暢的機(jī)器,這臺機(jī)器就是團(tuán)隊(duì)合作。

康涅狄格州斯坦福的Gartner公司的分析師 Roberta Witty忠告:“應(yīng)當(dāng)制訂業(yè)務(wù)連續(xù)性計劃,專門成立兩到五人組成的隊(duì)伍,并得到高層管理人員的支持。”

Glenmede的災(zāi)難恢復(fù)基層委員會包括CTO、服務(wù)部門主管、風(fēng)險管理人員以及IT審查委員會成員。該委員會進(jìn)而任命20個經(jīng)營部門的代表成立一個業(yè)務(wù)連續(xù)性小組。這些人受過業(yè)務(wù)連續(xù)性方面的培訓(xùn),負(fù)責(zé)擬訂計劃,與經(jīng)營部門合作。兩個委員會的會計記錄都要送交Glenmede的董事會。

每個經(jīng)營部門都要評估自己的流程和需求。在Members集團(tuán)公司——這家總部設(shè)在愛荷華州西得梅因的公司為信用合作社提供信用卡受理和抵押貸款等服務(wù),恢復(fù)窗口因部門和時間的不同而大不相同。

Members集團(tuán)公司的CIO Jeff Russell說:“你要與經(jīng)營部門合作,這樣才能充分了解每個應(yīng)用背后的驅(qū)動因素。單單一名IT人員是不可能認(rèn)識到每個部門的特定需求的。Members集團(tuán)使用StoneFly Replicator,來保管存放在遠(yuǎn)地的關(guān)鍵數(shù)據(jù)的鏡像。這個基于IP存儲區(qū)域網(wǎng)絡(luò)(SAN)的異步災(zāi)難恢復(fù)產(chǎn)品由總部設(shè)在圣迭戈的StoneFly Networks公司提供。”
  
災(zāi)難恢復(fù)有哪些前沿技術(shù)

雖然人們對前沿技術(shù)有哪些莫衷一是,但專家一致認(rèn)為,群集、SAN鏡像和復(fù)制等應(yīng)該屬于前沿技術(shù)。不過專家們警告說,這些技術(shù)價格不菲。

在操作系統(tǒng)當(dāng)中,OpenVMS和Unix比其他系統(tǒng)更受到青睞。譬如說,Alpha/OpenVMS就有內(nèi)置的群集技術(shù),許多公司用來對站點(diǎn)之間的數(shù)據(jù)進(jìn)行鏡像。許多金融機(jī)構(gòu)依靠基于VMS的鏡像機(jī)制來保護(hù)擔(dān)當(dāng)重任的交易處理系統(tǒng),其中包括德國商業(yè)銀行、國際證券交易所和德國證券交易所。

進(jìn)行股票和衍生工具交易的德國證券交易所就在相距5公里的兩個站點(diǎn)部署了OpenVMS群集。它還在網(wǎng)絡(luò)中使用了總部設(shè)在圣何塞的博科通信系統(tǒng)公司的光纖通道交換機(jī),以及思科的交換機(jī)和路由器,以確保高可用性。

“災(zāi)難恢復(fù)不單單涉及冷備份或者熱備份,而是不管發(fā)生什么情況,都能確保數(shù)據(jù)隨時可用,”德國證券交易所的系統(tǒng)和網(wǎng)絡(luò)支持部門主管Michael Gruth說。“這就需要兩個站點(diǎn)都要有群集技術(shù)。”

至于Windows方面,爭議比較多。Nickolett說:“雖然我們恢復(fù)Unix系統(tǒng)從未失過手,但Windows就不一樣了。常見問題包括:恢復(fù)失敗、軟件有沖突以及補(bǔ)丁或者服務(wù)包存在問題?!奔~約的福布斯網(wǎng)站公司也偏向于Windows之外的平臺。在每個工作日,該公司在網(wǎng)上要發(fā)布1500多篇文章,大量使用運(yùn)行在Intel/Linux平臺上的廣告工作流系統(tǒng),以及放在運(yùn)行Sun Solaris的高端富士通服務(wù)器的內(nèi)容管理系統(tǒng)。兩個系統(tǒng)都使用Revivio公司的連續(xù)保護(hù)系統(tǒng)(Continuous Protection System)加以保護(hù)。千兆以太網(wǎng)線路使用基于主機(jī)的鏡像技術(shù),連接到一個不知名的數(shù)據(jù)中心。福布斯網(wǎng)站負(fù)責(zé)運(yùn)營的總經(jīng)理Michael Smith說:“萬一主系統(tǒng)出現(xiàn)了問題,我們就能夠切換到該設(shè)備上。”

但不是所有人都認(rèn)為應(yīng)當(dāng)避免使用Windows。實(shí)際上,圣安東尼奧的癌癥治療和研究中心(CTRC)就大膽地使用微軟、EMC和思科的工具用于基于主機(jī)的鏡像技術(shù)。在這家醫(yī)學(xué)中心,21臺服務(wù)器——主要是Windows 2000/2003,外加幾臺Linux服務(wù)——把數(shù)據(jù)保存在EMC Clariion FC4700存儲陣列上。兩個思科SN 5428 iSCSI路由器和一個思科MDS 9506交換機(jī)通過千兆以太網(wǎng)網(wǎng)絡(luò),把數(shù)據(jù)和大容量圖像文件鏡像到遠(yuǎn)在22英里之外的研究中心的另一個Clariion陣列上。據(jù)CTRC的CTO Mike Luter聲稱,要恢復(fù)停機(jī)的服務(wù)器只要10分鐘。

Luter說:“對我們而言,業(yè)務(wù)連續(xù)性遠(yuǎn)比災(zāi)難恢復(fù)重要得多。我們希望可以隨時使用應(yīng)用軟件為治療病人提供幫助。如果我們沒法使用大樓,而要在其他地方治療病人,我們需要的就不僅僅是幾個計算機(jī)系統(tǒng)?!?/FONT>

重在測試

最好的技術(shù)和最到位的規(guī)劃,許多公司認(rèn)為在災(zāi)難恢復(fù)方面已經(jīng)做得足夠多了,但這還遠(yuǎn)遠(yuǎn)不夠。為了防備實(shí)際災(zāi)難,需要大量的測試。佛羅里達(dá)州克利爾沃特的業(yè)務(wù)連續(xù)性顧問John Glenn說:“常見的錯誤就是,沒有堅(jiān)持進(jìn)行測試,找出并糾正計劃存在的缺陷?!?/FONT>

Glenn說,這并不是說讓IT管理員在周末一個人“不斷試驗(yàn)”計劃。你應(yīng)當(dāng)在星期天讓所有系統(tǒng)停止運(yùn)行,看看遠(yuǎn)地的運(yùn)作是不是如同預(yù)期。并且請來十幾名員工,進(jìn)行實(shí)際測試,看看經(jīng)營部門會受到怎樣的影響,財務(wù)部門可以繼續(xù)核算嗎?銷售人員可以繼續(xù)銷售嗎?生產(chǎn)部門可以繼續(xù)生成產(chǎn)品嗎?福布斯公司的Smith提議,還要在工作時間進(jìn)行幾次出奇不意的隨機(jī)測試。

Glenmede的Voutsakis說:“我們對整個計劃每年測試七次。我們評估遭遇不同程度的災(zāi)難和各種事件下的運(yùn)行狀況,包括讓員工回家辦公,看看在家辦公效果如何?!彼f,真正遇到災(zāi)難后可能讓公司陷入癱瘓的問題只有在實(shí)際測試當(dāng)中才會出現(xiàn)。

Members集團(tuán)就遇到過這種情況。它原以為有足夠帶寬進(jìn)行異地復(fù)制。但事實(shí)上其T1線路無力勝任。比如,該公司的SQL數(shù)據(jù)庫就無法有效復(fù)制,原因是帶寬受到限制,于是無法傳輸?shù)絀P SAN。同樣,該公司的服務(wù)器有一半以上仍沒有進(jìn)行鏡像處理。Russell說:“我們將在不久搬遷,到時會增加更多帶寬?!?/FONT>

來源:CCW

發(fā)布:2007-04-22 10:10    編輯:泛普軟件 · xiaona    [打印此頁]    [關(guān)閉]
相關(guān)文章:
沈陽OA系統(tǒng)
聯(lián)系方式

成都公司:成都市成華區(qū)建設(shè)南路160號1層9號

重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓

咨詢:400-8352-114

加微信,免費(fèi)獲取試用系統(tǒng)

QQ在線咨詢