監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價咨詢管理系統(tǒng) | 工程設(shè)計管理系統(tǒng) | 簽約案例 | 購買價格 | 在線試用 | 手機APP | 產(chǎn)品資料
X 關(guān)閉

天堂與地獄僅“容災(zāi)”一墻之隔

申請免費試用、咨詢電話:400-8352-114

文章來源:泛普軟件

在全球經(jīng)濟一體化的今天,信息系統(tǒng)越來越成為社會生產(chǎn)能力的樞紐和重要支柱,人們忽然發(fā)現(xiàn),今天,信息系統(tǒng)的安全竟然成為決定企業(yè)生死存亡的核心棋子,而其中的數(shù)據(jù)備份技術(shù)的發(fā)展已成為各企業(yè)信息系統(tǒng)的一門必修課。不斷出現(xiàn)的各種災(zāi)難性事件在給世界經(jīng)濟帶來極大的負面影響的同時,也使越來越多的人們開始審視自己企業(yè)業(yè)務(wù)運行系統(tǒng)的災(zāi)難抗御能力,人們發(fā)現(xiàn),天堂與地獄僅一墻之隔,“容災(zāi)”的概念在今天變得萬分醒目。

當企業(yè)享受信息化帶來快捷的服務(wù)決策和方便管理時,也必須面對數(shù)據(jù)丟失的危險,數(shù)據(jù)大集中的同時也會聚集風(fēng)險,對于這一點人們已經(jīng)意識到了。數(shù)據(jù)的丟失會中斷企業(yè)正常的業(yè)務(wù)運行,造成巨大的經(jīng)濟損失。人們開始思考災(zāi)難恢復(fù)體系建立的意義,開始將注意力慢慢轉(zhuǎn)向了一個新興的領(lǐng)域——容災(zāi)系統(tǒng)。實際上,國際上已將信息系統(tǒng)的容災(zāi)體系納入到一個更大的范疇之內(nèi)——業(yè)務(wù)連續(xù)性管理。業(yè)務(wù)連續(xù)性管理是一個危機應(yīng)急的框架,它涵蓋風(fēng)險管理、供應(yīng)鏈管理、IT容災(zāi)和恢復(fù)、環(huán)境設(shè)施管理和安全管理。

容災(zāi)及其誤區(qū)

我們常說的容災(zāi)系統(tǒng)就屬于IT容災(zāi)和恢復(fù)的技術(shù)范疇。容災(zāi),首先要弄清楚容什么樣的災(zāi),其次要清楚災(zāi)難過后如何恢復(fù),采用何種技術(shù)和管理手段確保信息系統(tǒng)能夠在災(zāi)難之后快速再建、數(shù)據(jù)如何利用后援手段確保最小程度的丟失。根據(jù)國務(wù)院信息辦今年頒布的《重要信息系統(tǒng)災(zāi)難恢復(fù)指南》中所述定義,災(zāi)難指由于人為或自然的原因,造成信息系統(tǒng)運行嚴重故障或癱瘓,使信息系統(tǒng)支持的業(yè)務(wù)功能停頓或服務(wù)水平不可接受、達到特定的時間的突發(fā)性事件,這類事件通常導(dǎo)致信息系統(tǒng)需要切換到備用場地運行。災(zāi)難恢復(fù)指為了將信息系統(tǒng)從災(zāi)難造成的故障或癱瘓狀態(tài)恢復(fù)到可正常運行狀態(tài)、并將其支持的業(yè)務(wù)功能從災(zāi)難造成的不正常狀態(tài)恢復(fù)到可接受狀態(tài)而設(shè)計的活動和流程。

在人們接觸到各種各樣、形形色色的或真或假的容災(zāi)理念之后,許多人被這個龐大而虛渺的天幕所困惑了,正所謂“亂花漸入迷人眼”。人們發(fā)現(xiàn),一個美好的容災(zāi)系統(tǒng)建設(shè)的愿望在實踐中往往是那么煩雜的過程,想像中的快速構(gòu)建的技術(shù)輪廓卻經(jīng)常那么不盡如人意,往往制約了容災(zāi)系統(tǒng)建設(shè)的最終實效。根據(jù)我們了解,眾多企業(yè)和行業(yè)對于如何建立最為有效于自身的容災(zāi)系統(tǒng)很少有相當清醒的認識,往往踏入了一些越陷越深的誤區(qū)。

誤區(qū)一:使用遠程備份系統(tǒng)替代容災(zāi)系統(tǒng),使容災(zāi)的實際效果遠遠低于規(guī)劃,甚至根本無法實現(xiàn)最初的災(zāi)難抗御的設(shè)想。

誤區(qū)二:采用單一技術(shù)手段實現(xiàn)多系統(tǒng)的混合容災(zāi)服務(wù),結(jié)果是進退兩難,因為這些單一的技術(shù)手段實際上具有很高的技術(shù)限定條件,一般只是單一系統(tǒng)的特定容災(zāi)技術(shù)手段之一,而無法適應(yīng)混合型容災(zāi)服務(wù)的整體范圍。最終這種所謂的容災(zāi)中心實際上變成了單一系統(tǒng)的特定數(shù)據(jù)備份中心,根本不具有擴展到多系統(tǒng)災(zāi)難恢復(fù)服務(wù)的能力,所謂的投入產(chǎn)出比可想而知,只能陷入重復(fù)建設(shè)、重復(fù)投資的怪圈,形成了一個為了容災(zāi)而容災(zāi)的錯誤定勢。這種情況的確時有發(fā)生,尤其在一些政府或行業(yè)指令性的災(zāi)難服務(wù)體系的建設(shè)中屢見不鮮。

誤區(qū)三:在容災(zāi)中心的建設(shè)上,盲目追求設(shè)備的高性能高指標,而忽略了容災(zāi)中心災(zāi)難響應(yīng)所特有的“小概率”特征,造成設(shè)備的大量閑置和浪費,設(shè)備投資不合理。

我們聽到的最多的問題是:我究竟適合什么樣的災(zāi)難恢復(fù)等級?這么多的技術(shù)手段究竟哪一個才適合我?現(xiàn)在容災(zāi)技術(shù)發(fā)展的成熟水準是什么?

災(zāi)備系統(tǒng)建設(shè)的技術(shù)路線圖

我們首先要清楚傳統(tǒng)的備份體系實際上僅僅處于國際上公認的災(zāi)難恢復(fù)等級的最底層的區(qū)域,數(shù)據(jù)備份是指為防止系統(tǒng)出現(xiàn)操作失誤或系統(tǒng)故障導(dǎo)致數(shù)據(jù)丟失,而將數(shù)據(jù)集合從應(yīng)用系統(tǒng)中以備份格式存儲到離線的存儲介質(zhì)的過程。在一般定義的災(zāi)備恢復(fù)等級中,第一級也稱為基本支持,主要是指介質(zhì)的庫外存放和管理,也就是備份系統(tǒng)來實現(xiàn),實際上,這還不是真正意義上的災(zāi)難恢復(fù)系統(tǒng),因為其數(shù)據(jù)的保存間隔比較長,常見的是每天一次,也就是對于數(shù)據(jù)的實時性或近實時性并不提供保證,而且備份出來的格式是專用的備份格式,并非應(yīng)用系統(tǒng)中的數(shù)據(jù)原有格式,恢復(fù)時一定要通過格式轉(zhuǎn)換進行倒回操作,因此也并不保證恢復(fù)的快捷和精細化的時間點恢復(fù)。傳統(tǒng)的數(shù)據(jù)備份主要是采用數(shù)據(jù)內(nèi)置或外置的磁帶機進行冷備份。早在1990年,存儲軟件供應(yīng)商就開始采用這種方式為用戶提供數(shù)據(jù)解決方案,比如CA ARCServe、VERITAS NBU、Legato等。要想對數(shù)據(jù)進行可靠的備份,必須選擇專門的備份軟、硬件,并制定相應(yīng)的備份及恢復(fù)方案。備份系統(tǒng)主要是人們在日常工作中對付常見系統(tǒng)錯誤的一種常規(guī)手法,因為在我們?nèi)粘P袨橹校藶椴僮麇e誤、系統(tǒng)軟件或應(yīng)用軟件缺陷、硬件損毀、電腦病毒、黑客攻擊、突然斷電、意外宕機、自然災(zāi)害等諸多因素都有可能造成計算機中數(shù)據(jù)的丟失,從而極有可能演變成一場滅頂之災(zāi)。因此,數(shù)據(jù)備份與恢復(fù)實際上是企業(yè)的必修課程。

在容災(zāi)體系中,人們往往采用RPO(災(zāi)難時的數(shù)據(jù)保存點)和RTO(災(zāi)難后的業(yè)務(wù)恢復(fù)點)這兩個指標來衡量容災(zāi)體系的應(yīng)急能力和系統(tǒng)保護能力。一般而言,確保RPO指標的基本要求(也就是僅僅考慮數(shù)據(jù)要保存到接近故障點)往往被稱為數(shù)據(jù)級災(zāi)難備份系統(tǒng),而對于RPO和RTO(也就是業(yè)務(wù)災(zāi)難恢復(fù)能力)的雙重要求,往往被稱為應(yīng)用級災(zāi)備系統(tǒng),也就是災(zāi)難時要考慮業(yè)務(wù)的處理系統(tǒng)的快速恢復(fù)能力。數(shù)據(jù)級災(zāi)備系統(tǒng)的代價相對比較低,而應(yīng)用級災(zāi)備則不同,根據(jù)系統(tǒng)的復(fù)雜程度,有可能十分高昂。所以,一些企業(yè)采用建立數(shù)據(jù)級災(zāi)備和應(yīng)用級災(zāi)備分步走的方式來實現(xiàn)持續(xù)性發(fā)展的目標。在一般定義的災(zāi)備等級中,第3級以上的級別針對RPO、RTO這兩個指標開始有了實際的意義,也就是我們說的構(gòu)建災(zāi)難備份系統(tǒng)。有些企業(yè)認為,建立遠程備份系統(tǒng)就是建立了數(shù)據(jù)級災(zāi)備,也就是達到了災(zāi)備的第一階段要求,這實際上是很大的誤解。先不說備份出來的數(shù)據(jù)格式已不是復(fù)制出來的格式,恢復(fù)時必須反向轉(zhuǎn)換,備份的很長的周期性間隔也無法達到一般的利用災(zāi)備中心建立應(yīng)急反應(yīng)體系的要求(RPO超過了24小時對于多數(shù)企業(yè)而言已經(jīng)沒有太大意義),而且備份時大量的遠程傳輸帶寬的占用(或本地備份汽車遠程運輸?shù)馁Y源消耗),使傳輸根本無法滿足企業(yè)數(shù)據(jù)和業(yè)務(wù)增長的要求,傳輸成本極高。因而,我們并沒有看到多少企業(yè)真正采用這種方式建立災(zāi)難備份中心,并能夠有效地利用和管理。

我們逐漸看到,至少是數(shù)據(jù)復(fù)制體系或遠程的電子傳輸以上的災(zāi)備技術(shù)手段,才是建立災(zāi)難備份中心的建設(shè)方案的技術(shù)手段可行性范疇。

實現(xiàn)災(zāi)備體系的技術(shù)手段

這是容災(zāi)方案討論的核心問題。

災(zāi)備系統(tǒng)的容災(zāi)技術(shù)是一個災(zāi)備系統(tǒng)建立的最為重要的考慮因素之一,這一因素的考慮是否完善,甚至決定了災(zāi)備系統(tǒng)的成敗。因此,我們可以看到,許多企業(yè)在下達了災(zāi)備系統(tǒng)建設(shè)任務(wù)之后,卻遲遲無法在技術(shù)方案的論證環(huán)節(jié)上達到統(tǒng)一,換句話說,找到一個完美的技術(shù)路線十分艱難。這里我們分析一下:

在構(gòu)建容災(zāi)備份系統(tǒng)時,我們首先考慮的應(yīng)該是遠程數(shù)據(jù)保護的機制,一般而言就是結(jié)合實際情況選擇合理的數(shù)據(jù)復(fù)制技術(shù)。而選擇合理的數(shù)據(jù)復(fù)制技術(shù)時主要考慮以下因素:

(1)災(zāi)難承受程度:明確計算機系統(tǒng)需要承受的災(zāi)難類型,系統(tǒng)故障、通信故障、長時間斷電、火災(zāi)及地震等各種意外情況所采取的備份、保護方案不盡相同?,F(xiàn)在人們經(jīng)常將災(zāi)難分為自然災(zāi)難和內(nèi)在漸進性災(zāi)難(如人為的失誤型故障、黑客攻擊、斷點等),實現(xiàn)的技術(shù)保護手段也開始有所區(qū)別。

(2)業(yè)務(wù)影響程度:必須明確當計算機系統(tǒng)發(fā)生意外無法工作時,導(dǎo)致業(yè)務(wù)停頓所造成的損失程度,也就是定義用戶對于計算機系統(tǒng)發(fā)生故障的最大容忍時間。這是設(shè)計容災(zāi)備份方案的重要技術(shù)指標。

(3)數(shù)據(jù)保護程度:是否要求數(shù)據(jù)庫可以恢復(fù)所有提交的交易并且要求實時同步數(shù)據(jù)也就是數(shù)據(jù)的連續(xù)性和一致性,是決定容災(zāi)備份方案規(guī)模和復(fù)雜程度的重要依據(jù)。

(4)最容易忽略的一點,容災(zāi)的技術(shù)手段是否適合于現(xiàn)有的所有參與系統(tǒng),對于生產(chǎn)系統(tǒng)的影響是否足夠小。這一點已成為目前容災(zāi)體系技術(shù)路線討論中最為困擾各方的一個因素?;旌舷到y(tǒng)容災(zāi)、開放設(shè)備的選擇常常使用戶的理想與技術(shù)現(xiàn)實產(chǎn)生鴻溝。

下面簡單介紹容災(zāi)中常見的技術(shù)手段:

1. 基于應(yīng)用的容災(zāi)備份技術(shù)

基于應(yīng)用的容災(zāi)備份技術(shù)是由應(yīng)用軟件來實現(xiàn)數(shù)據(jù)的復(fù)制和同步,當主中心失效時,容災(zāi)備份中心的應(yīng)用軟件系統(tǒng)恢復(fù)運行,接管主中心的業(yè)務(wù)。

在這種方式下,應(yīng)用軟件實現(xiàn)一定程度的修改,復(fù)雜性加深,且由應(yīng)用軟件來實現(xiàn)數(shù)據(jù)的復(fù)制和同步會對整個業(yè)務(wù)系統(tǒng)的性能造成較大的影響。

這種方式往往是應(yīng)用開發(fā)的范疇更廣泛,需要在應(yīng)用開發(fā)初期進入概要設(shè)計和需求目標開發(fā)。

2. 基于數(shù)據(jù)庫的容災(zāi)備份技術(shù)

目前已在一些主流數(shù)據(jù)庫系統(tǒng)的生產(chǎn)系統(tǒng)中廣泛采用。這是利用數(shù)據(jù)庫復(fù)制系統(tǒng)或一些專用的庫復(fù)制系統(tǒng),基于數(shù)據(jù)庫日志復(fù)制實現(xiàn)主、備用系統(tǒng)的數(shù)據(jù)庫的數(shù)據(jù)同步,即將主用系統(tǒng)數(shù)據(jù)庫操作Log復(fù)制到備用系統(tǒng)數(shù)據(jù)庫中執(zhí)行,實現(xiàn)二者數(shù)據(jù)的一致性?;跀?shù)據(jù)庫的復(fù)制方式可分為實時復(fù)制、定時復(fù)制和存儲轉(zhuǎn)發(fā)復(fù)制,并且在復(fù)制過程中,還有自動沖突檢測和解決手段,以保證數(shù)據(jù)一致性不受破壞。

這種方式對于主機系統(tǒng)和存儲設(shè)備都相當開放,也就是說,備份中心的建設(shè)是一個開放設(shè)備的系統(tǒng),主要的要求在于數(shù)據(jù)庫的一致性,數(shù)據(jù)的傳輸和復(fù)制一般采用TCP/IP網(wǎng)絡(luò)協(xié)議。

3.基于主機的容災(zāi)備份技術(shù)

這種方式主要采用主機上的卷復(fù)制技術(shù),通過IP網(wǎng)絡(luò)實現(xiàn)遠程的卷復(fù)制。

采用這種方式時,主中心和備份中心的距離不受限制,對磁盤陣列等設(shè)備要求不太高,由于是卷復(fù)制,對于數(shù)據(jù)庫具有通用的支持性。但這種方式會對主中心的主機系統(tǒng)帶來一定的負擔(dān),而且對于備份中心的主機系統(tǒng)具有一致性要求。在一些混合系統(tǒng)中,容災(zāi)中心提供災(zāi)備服務(wù)有一定制約。

4. 基于智能存儲系統(tǒng)的容災(zāi)備份技術(shù)

也就是常說的磁盤拷貝技術(shù)。常用于光纖直連的連接方式,同城容災(zāi)較多。磁盤陣列將磁盤遠程復(fù)制功能的處理負荷從主機轉(zhuǎn)移到智能磁盤控制器上。在這種方式下,數(shù)據(jù)復(fù)制軟件運行在存儲系統(tǒng)內(nèi),比較容易實現(xiàn)主中心和容災(zāi)備份中心的操作系統(tǒng)、數(shù)據(jù)庫、系統(tǒng)庫和目錄的實時拷貝維護能力。遠程備份系統(tǒng)的啟動、運行恢復(fù)相對比較簡單快捷。

這種方式在早期的單存儲系統(tǒng)容災(zāi)和點到點容災(zāi)系統(tǒng)中比較常見,而且由于對于主機系統(tǒng)的約束較小,相對構(gòu)建的改動也比較小,因而一些系統(tǒng)建立災(zāi)難備份系統(tǒng)選擇方案時,比較青睞這種模式。

如果采用光纖連接,這種方式只能用于同城方式,如果災(zāi)備中心的建立在異地,則需要協(xié)議的轉(zhuǎn)換設(shè)備才能實現(xiàn)基于IP的遠程傳輸,這在成本考慮中也必須是組成部分之一。該方案的開放性比較差,不同廠家的存儲設(shè)備一般不能配合使用,不太利于投資保護、而且對于混合系統(tǒng)的災(zāi)備服務(wù)仍然會出現(xiàn)難解的瓶頸。

目前,大部分的中高端存儲陣列都已經(jīng)具有這一能力,而且在復(fù)制技術(shù)上也在不斷演變和成熟化。

5. 虛擬化存儲容災(zāi)技術(shù)

鑒于存儲系統(tǒng)在異構(gòu)環(huán)境和平臺中受到的種種制約,近幾年,國際上興起了虛擬化存儲的理論,而且日臻成熟。虛擬化存儲的技術(shù)主要采用專門設(shè)立存儲服務(wù)層設(shè)備,對于所有連接后端的存儲數(shù)據(jù)實現(xiàn)專門的存儲服務(wù),如異構(gòu)存儲設(shè)備之間的數(shù)據(jù)倒送、存儲數(shù)據(jù)的連續(xù)時間點快照和快速讀取、存儲數(shù)據(jù)的存檔保護、遠程備份中心的數(shù)據(jù)專用復(fù)制服務(wù)甚至利用磁盤設(shè)備虛擬磁帶庫的仿真接口,從功能角度說,虛擬化存儲技術(shù)解決了存儲的開放性連接問題、容災(zāi)的混合系統(tǒng)災(zāi)備服務(wù)問題、災(zāi)備數(shù)據(jù)的快速挖掘和多時間點利用問題、故障時數(shù)據(jù)的一致性問題,將系統(tǒng)的故障恢復(fù)時間大大提升(分鐘級別)。虛擬化存儲技術(shù)所支持的存儲接口也包含了FC、iSCSI、SCSI等,適用環(huán)境相當廣泛。到目前為止,這一技術(shù)在存儲的服務(wù)能力上是最為強大的。目前,國際上正在興起的CDP(持續(xù)性數(shù)據(jù)保護)技術(shù)中,虛擬化存儲技術(shù)也是實現(xiàn)最為全面的技術(shù)。一般在復(fù)雜的生產(chǎn)系統(tǒng)、辦公系統(tǒng)、管理系統(tǒng)實現(xiàn)統(tǒng)一的災(zāi)備服務(wù)的要求下,虛擬化技術(shù)往往能獲得良好的效果。國際上,虛擬化存儲技術(shù)以美國飛康公司為代表,此外,除了專業(yè)的虛擬軟件廠商之外,目前,一些存儲設(shè)備的廠商也紛紛推出支持虛擬化的產(chǎn)品,可見其發(fā)展勢頭迅猛。虛擬化存儲技術(shù)在容災(zāi)領(lǐng)域的運用時間還不長,一些人們還在觀望其實際使用的性能狀況。

以上是容災(zāi)技術(shù)路線的常見表現(xiàn)形式。實際上,現(xiàn)在數(shù)據(jù)備份和連續(xù)復(fù)制技術(shù)已經(jīng)產(chǎn)生了融合技術(shù),這就是CDP(持續(xù)性數(shù)據(jù)保護)技術(shù)。這一技術(shù)的出現(xiàn),真正使數(shù)據(jù)的點備份變成了連續(xù)跟蹤數(shù)據(jù)變化的多點精細跟蹤技術(shù),使傳統(tǒng)意義的備份系統(tǒng)已經(jīng)淡化,而快速恢復(fù)以及任意時間點恢復(fù)已經(jīng)成為現(xiàn)實,試想,系統(tǒng)完全損壞后(包括硬盤),幾分鐘內(nèi),系統(tǒng)又通過遠程引導(dǎo)和恢復(fù)起來,這在傳統(tǒng)的恢復(fù)技術(shù)中是不可想像的。CDP技術(shù)的實現(xiàn)真正使數(shù)據(jù)復(fù)制和備份具有了高性能的RPO和RTO能力,使克服內(nèi)在漸進式的災(zāi)難具有了殺手锏。這一技術(shù)將在不遠的將來對于容災(zāi)技術(shù)的架構(gòu)產(chǎn)生又一次修正。 (CCW)

發(fā)布:2007-04-22 10:08    編輯:泛普軟件 · xiaona    [打印此頁]    [關(guān)閉]
沈陽OA系統(tǒng)
聯(lián)系方式

成都公司:成都市成華區(qū)建設(shè)南路160號1層9號

重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓

咨詢:400-8352-114

加微信,免費獲取試用系統(tǒng)

QQ在線咨詢

泛普沈陽OA快博其他應(yīng)用

沈陽OA軟件 沈陽OA新聞動態(tài) 沈陽OA信息化 沈陽OA快博 沈陽OA行業(yè)資訊 沈陽軟件開發(fā)公司 沈陽門禁系統(tǒng) 沈陽物業(yè)管理軟件 沈陽倉庫管理軟件 沈陽餐飲管理軟件 沈陽網(wǎng)站建設(shè)公司