監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價咨詢管理系統(tǒng) | 工程設(shè)計管理系統(tǒng) | 簽約案例 | 購買價格 | 在線試用 | 手機APP | 產(chǎn)品資料
X 關(guān)閉

中小企業(yè)“赤膊上陣” 災(zāi)難恢復任重道遠

申請免費試用、咨詢電話:400-8352-114

來源:泛普軟件

從歷史來看,在認識到自我防衛(wèi)的價值之前人們往往要飽受煎熬,災(zāi)難恢復也是如此。如果說911事件讓人們意識到災(zāi)難的來臨總是猝不及防,給企業(yè)敲響了一次關(guān)于IT災(zāi)難恢復建設(shè)的警鐘。那么,汶川巨災(zāi)則再次讓人們感覺到災(zāi)難很可能就在不遠處,我們與災(zāi)難之間的距離不是隔岸觀火。

在災(zāi)難沒有來臨前,除了盡力防患于未然,別無良方。張家日是一家中型制造工廠的IT主管,他正在思考老板前天問的一個問題,如果公司的IT系統(tǒng)遭受到災(zāi)難是否會影響公司的業(yè)務(wù)營運?這個問題讓張家日全身冒汗,張家日的感覺在中小企業(yè)CIO中并非個案。今天,災(zāi)難恢復對企業(yè)來說早已不是什么新話題。但如果是一家中小型企業(yè)的話,恐怕制訂一套完善的災(zāi)難恢復策略并不樂觀。

一.中小企業(yè)災(zāi)難恢復現(xiàn)狀不容樂觀

最近,有調(diào)研公司發(fā)布的一份研究報告顯示,在許多中小企業(yè)看來災(zāi)難恢復距離本企業(yè)比較遙遠。在中小企業(yè)中有64%的企業(yè)還沒有應(yīng)用任何形式的災(zāi)難恢復解決方案,在剩下的36%的企業(yè)中也沒有執(zhí)行日常的災(zāi)難計劃測試。有31%的受訪者表示一旦發(fā)生破壞主數(shù)據(jù)的重大災(zāi)難可以實現(xiàn)恢復基本運營,但只有不到10%的受訪者表示可以在12小時內(nèi)恢復基本運營,而將近一半的受訪者表示完全恢復正常運營需要一周的時間。然而,有調(diào)查卻顯示:只有6%的公司可以在數(shù)據(jù)丟失后生存下來,43%的公司會徹底關(guān)門,51%的公司會在兩年之內(nèi)消失。

(1)沒有意識到災(zāi)難恢復的必要性

災(zāi)難恢復一般是針對地震、洪水、戰(zhàn)爭等小概率災(zāi)難事件,但概率小不等于不會發(fā)生。雖然這些災(zāi)難發(fā)生的概率比較小,但后果往往非常嚴重。實際上,災(zāi)難威脅造成的后果往往是無法用金錢來衡量的,由于對信息技術(shù)的高度依賴,災(zāi)難造成的后果往往會關(guān)系到企業(yè)的生死存亡。

無論是小公司還是中型企業(yè),電子郵件、業(yè)務(wù)數(shù)據(jù)、客戶資料及財務(wù)數(shù)據(jù)等都成了企業(yè)每天賴以生存的信息。事實上,由于現(xiàn)代企業(yè)對互聯(lián)網(wǎng)以及軟件等工具的大范圍應(yīng)用,使得“災(zāi)難”的定義也在逐步外延。因為企業(yè)在使用這些工具時,一旦出現(xiàn)了某種看似普通的電子故障,都可能會引發(fā)如供應(yīng)鏈通信中斷、在線交易停止或者網(wǎng)絡(luò)系統(tǒng)癱瘓等重大問題,這些無疑都已經(jīng)成為了企業(yè)所面臨的更可怕的“災(zāi)難”。

張家日認為很難想象一家企業(yè)在發(fā)生IT災(zāi)難的時候,沒有一個數(shù)據(jù)恢復系統(tǒng)會怎樣。而事實上只有備份數(shù)據(jù)并不能稱之為一個災(zāi)難恢復計劃。而且,更嚴重的是許多中小企業(yè)也并沒有將簡單的備份加入到某種形式的災(zāi)難恢復計劃中,這種情況確實讓人擔憂和不容樂觀

(2)受成本困擾無法針對多重災(zāi)難進行計劃

從調(diào)查的結(jié)果看,有些中小企業(yè)也認識到了災(zāi)難恢復的重要性,許多中小企業(yè)都表示希望能夠在緊急事件發(fā)生的時候快速進行災(zāi)難恢復。不過,在為未來的災(zāi)難規(guī)劃時,中小企業(yè)面臨的最大的問題是他們支付不起相關(guān)費用,無法針對多重災(zāi)難進行計劃。例如,無法針對面對自然災(zāi)難、病毒攻擊以及戰(zhàn)爭和恐怖活動分別進行災(zāi)難恢復計劃。

(3)擔心災(zāi)難恢復測試影響業(yè)務(wù)運作

調(diào)查顯示,約47%的中小企業(yè)擔心災(zāi)難恢復測試會造成業(yè)務(wù)中斷影響正常營運,因此對災(zāi)難恢復流程的測試頻率僅為一年一次甚至更少。受訪者提到的原因包括:人員不足,中斷業(yè)務(wù)工作,預算問題和中斷客戶服務(wù)等。

二.什么是IT業(yè)務(wù)災(zāi)難恢復計劃

(1)什么是IT業(yè)務(wù)災(zāi)難恢復

什么樣的威脅能夠?qū)е缕髽I(yè)業(yè)務(wù)的中斷?災(zāi)難是由于人為或自然的原因,造成IT系統(tǒng)運行嚴重故障或癱瘓,使IT系統(tǒng)支持的業(yè)務(wù)停頓或服務(wù)水平不可接受。企業(yè)業(yè)務(wù)災(zāi)難恢復是指在災(zāi)難發(fā)生時,一個企業(yè)的關(guān)鍵過程的業(yè)務(wù)可被迅速恢復運行??梢?,災(zāi)難備份和恢復的能力,不僅僅是面向可靠性,還是面向企業(yè)生存性。

在IT領(lǐng)域,災(zāi)難不僅指自然的原因,也包括人為的原因,災(zāi)難的范圍很寬泛。IT災(zāi)難恢復指的是在發(fā)生一些重大的不可預料的停機事件時,企業(yè)所采取的用以使其反作用最小化的一系列行動措施。災(zāi)難的發(fā)生可能是由于如下的因素:黑客攻擊、計算機病毒、電源故障、電纜斷裂或失效、系統(tǒng)管理錯誤、火災(zāi)、洪澇和其它的災(zāi)害等。

事實上,企業(yè)要保持業(yè)務(wù)連續(xù)性,最大的威脅并不是來自于火災(zāi)、地震等小概率大影響的災(zāi)難。相反,企業(yè)業(yè)務(wù)更多地受到諸如人員操作錯誤、流程缺陷等事件的威脅。雖然它們對經(jīng)濟的影響力遠不如那些重大災(zāi)難,但是它們卻時刻潛伏在企業(yè)的周圍,隨時一觸即發(fā),同樣會對企業(yè)造成致命的打擊。

(2)IT災(zāi)難恢復的等級劃分

那么,企業(yè)該如何在合理預算的前提下,更好地實施災(zāi)難恢復從而保證企業(yè)的業(yè)務(wù)連續(xù)性呢?從開始的時候企業(yè)就要問一下自己,花這么多錢要規(guī)避什么樣的風險,是要規(guī)避一個很大的災(zāi)害,如像911恐怖襲擊這種低概率事件,還是自身每天都要面臨的日常災(zāi)難風險。

災(zāi)難恢復的最佳方法主要在于規(guī)劃和預防。國際上對IT災(zāi)難恢復的等級大概劃分為七個層次,從最低級的磁帶備份,到實時備份。這個等級劃分的目的是讓企業(yè)清楚為什么要從業(yè)務(wù)層面做災(zāi)難恢復,不同業(yè)務(wù)應(yīng)該采取什么樣的手段。對于企業(yè)來說,不一定必須選擇第七級的方式。實際上,只要選擇一個最能滿足應(yīng)用需求的方式就可以了。它不一定是最高級的方式,也可能是最低級別的方式。如果客戶擁有非常多的應(yīng)用,客戶可劃分成關(guān)鍵應(yīng)用、重要應(yīng)用或者是一般應(yīng)用,然后針對每個部分采取不同的災(zāi)難恢復的策略。

為企業(yè)重要應(yīng)用和流程提供業(yè)務(wù)連續(xù)性包括三個方面:①高可用性:是指提供在本地故障情況下,能繼續(xù)訪問應(yīng)用的能力。無論這個故障是業(yè)務(wù)流程、還是物理設(shè)施、IT軟/硬件的故障。②連續(xù)操作: 是指當所有設(shè)備無故障時保持業(yè)務(wù)連續(xù)運行的能力,用戶不需要為正常的備份或維護而需要停止應(yīng)用的能力。③災(zāi)難恢復: 是指當災(zāi)難破壞生產(chǎn)數(shù)據(jù)時恢復數(shù)據(jù)的能力。這三個部分不是相互孤立的,而是相互關(guān)聯(lián)和交叉的。

(3)常用的災(zāi)難恢復方式

災(zāi)難恢復主要有兩種方式。一是自己建設(shè),一些有實力的大企業(yè)有資金、有能力自己做災(zāi)難恢復項目,缺點是自己建設(shè)災(zāi)難恢復中心,不僅建設(shè)周期長投入資金大,而且災(zāi)難恢復中心的維護成本、管理經(jīng)驗、應(yīng)急策略的規(guī)范等方面都是持續(xù)的挑戰(zhàn)。二是尋求外包方式,因為自建數(shù)據(jù)備份中心不但前期投入大,而且維護運營也需要投入比較大的人力。因此,除了敏感部門外,中小企業(yè)可以把災(zāi)難服務(wù)托管給第三方,當發(fā)生災(zāi)難時,可以按照事先定義好的配置和流程恢復業(yè)務(wù)。不但可以節(jié)省巨額投資和縮短災(zāi)難恢復的時間,還可以獲得專業(yè)的服務(wù)和經(jīng)驗。另外,還有多方共建模式,但是由于責任分配等問題而不成為主流。

三.一個完整的災(zāi)難恢復的步驟

正如現(xiàn)實生活中許多事物的不可預料性一樣,企業(yè)也很難預先知道網(wǎng)絡(luò)、數(shù)據(jù)中心運作過程中何時會受到威脅。而且,一些企業(yè)的應(yīng)用或者業(yè)務(wù)流程有上百個,這么多的業(yè)務(wù)流程,企業(yè)該如何入手做災(zāi)難恢復項目?對客戶來說,這的確是很大的難題。因為這涉及到怎么去平衡的問題,到底應(yīng)該花多少錢。

一個企業(yè)在實施災(zāi)難恢復項目的時候,千萬不要很快就跳到技術(shù)層面,只關(guān)注產(chǎn)品選擇、集成商的選擇,這是行不通的。一個完整的災(zāi)難恢復項目實施過程應(yīng)分哪幾步呢?

(1)分析評估面臨的威脅

一般來說,企業(yè)及其社會環(huán)境會決定著所面臨的威脅類型。在分析了威脅之后,應(yīng)當根據(jù)這些威脅對IT系統(tǒng)的影響程度進行分類。在災(zāi)難的響應(yīng)成本和可容忍的“宕機時間”之間實現(xiàn)平衡,可容忍的“宕機時間”越少,則企業(yè)就需要越多的成本來創(chuàng)建恰當?shù)捻憫?yīng)。比如,有些IT系統(tǒng)必須在幾分鐘或幾秒內(nèi)實現(xiàn)功能恢復,但有些系統(tǒng)可容忍的“宕機時間”為幾小時也不會產(chǎn)生嚴重的后果。

(2)設(shè)計一個良好的災(zāi)難恢復的基礎(chǔ)結(jié)構(gòu)

一個好的災(zāi)難恢復項目,至少要考慮到五個層面的基礎(chǔ)設(shè)施,包括電源、場地、網(wǎng)絡(luò)、硬件、軟件等都需要詳細考慮?;A(chǔ)結(jié)構(gòu)中的關(guān)鍵技術(shù)要素由以下幾部分組成:關(guān)鍵數(shù)據(jù)中心、一個可以備份主要數(shù)據(jù)中心資源的遠程站點、高帶寬的網(wǎng)絡(luò)連接等部分組成。在整個數(shù)據(jù)中心,業(yè)務(wù)連續(xù)性和災(zāi)難恢復的最佳策略都要遵循所有要素成分都保持冗余性的觀點。例如,在生產(chǎn)性和備份數(shù)據(jù)設(shè)施中都應(yīng)當運行多臺主機和服務(wù)器。另外,根據(jù)調(diào)查,最為常見的故障之一是電源和網(wǎng)絡(luò)連接。

(3)制定災(zāi)難恢復計劃

災(zāi)難恢復應(yīng)對計劃應(yīng)當清晰列出災(zāi)難事故的應(yīng)對策略,例如詳細說明各個部門和個人的角色和責任,并說明緊急情況下恢復IT系統(tǒng)的過程。災(zāi)難事故的應(yīng)對計劃的還應(yīng)包括資源需求、培訓練習和測試頻率、維護時間表、數(shù)據(jù)庫備份的時間表等。災(zāi)難事故的應(yīng)對流程包括:一是災(zāi)難降臨時的通知過程,二是應(yīng)急團隊動員后的恢復過程,三是回歸正常運作過程。

(4)測試災(zāi)難恢復流程是否正常

在定制了正式的計劃和流程之后,最為重要然而卻最容易被忽略的一個方面是測試災(zāi)難恢復流程是否能有效運作。企業(yè)必須測試其計劃和流程的完整性和有效性,以確保IT災(zāi)難恢復流程的可操作性。例如,可創(chuàng)建測試平臺以使演練模擬真實的運作。

總而言之,在當今復雜的條件下,要讓中小企業(yè)防御每一種災(zāi)難事故確實有點兒困難。但是,在無法預料的事情發(fā)生后,如果企業(yè)采用了恰當?shù)募夹g(shù)和實用的恢復策略,再通過災(zāi)難恢復流程和嚴格的測試方法,就可以將災(zāi)難對業(yè)務(wù)的影響降至最低。(IT專家網(wǎng))

發(fā)布:2007-04-24 10:30    編輯:泛普軟件 · xiaona    [打印此頁]    [關(guān)閉]
相關(guān)文章:
廈門OA系統(tǒng)
聯(lián)系方式

成都公司:成都市成華區(qū)建設(shè)南路160號1層9號

重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓

咨詢:400-8352-114

加微信,免費獲取試用系統(tǒng)

QQ在線咨詢

泛普廈門OA快博其他應(yīng)用

廈門OA軟件 廈門OA新聞動態(tài) 廈門OA信息化 廈門OA快博 廈門OA行業(yè)資訊 廈門軟件開發(fā)公司 廈門門禁系統(tǒng) 廈門物業(yè)管理軟件 廈門倉庫管理軟件 廈門餐飲管理軟件 廈門網(wǎng)站建設(shè)公司