監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價(jià)咨詢管理系統(tǒng) | 工程設(shè)計(jì)管理系統(tǒng) | 簽約案例 | 購(gòu)買(mǎi)價(jià)格 | 在線試用 | 手機(jī)APP | 產(chǎn)品資料
X 關(guān)閉

ILM標(biāo)準(zhǔn)化與實(shí)踐

申請(qǐng)免費(fèi)試用、咨詢電話:400-8352-114

文章來(lái)源:泛普軟件

信息生命周期管理(ILM,Information Lifecycle Management)是一個(gè)相對(duì)新的概念。ILM有兩個(gè)目標(biāo):降低管理成本,最有效地利用存儲(chǔ)硬件。為了實(shí)現(xiàn)這兩個(gè)目標(biāo),ILM需要依靠能夠與其協(xié)調(diào)配合的備份系統(tǒng)。隨著信息生命周期管理解決方案的發(fā)展,業(yè)界不斷遇到一些始料未及的問(wèn)題:由于存儲(chǔ)資源管理標(biāo)準(zhǔn)不統(tǒng)一,很多存儲(chǔ)系統(tǒng)在實(shí)施ILM的時(shí)候遇到了障礙。

本期選題介紹了ILM在標(biāo)準(zhǔn)化方面的一些進(jìn)展情況。并且探討了使用ILM工具來(lái)管理數(shù)據(jù)的方法和其所具有的商業(yè)價(jià)值。

無(wú)重復(fù)備份是ILM成功的關(guān)鍵

為什么需要ILM?

可靠安全的數(shù)據(jù)存儲(chǔ)對(duì)實(shí)現(xiàn)業(yè)務(wù)連續(xù)性是至關(guān)重要的。由于企業(yè)對(duì)技術(shù)流程信息的依賴,數(shù)據(jù)存儲(chǔ)在某種程度上正在成為全球高層IT管理人員和存儲(chǔ)系統(tǒng)管理員的難題。而且,金融、醫(yī)療衛(wèi)生等很多行業(yè)面對(duì)著很多新法規(guī),它們需要與不斷發(fā)展的法規(guī)保持一致,滿足這些法規(guī)對(duì)數(shù)據(jù)保留期限的要求。再加上企業(yè)存儲(chǔ)的數(shù)據(jù)量不斷增多,因此管理信息的成本每年有可能增長(zhǎng)20%到30%?;谏鲜鲈?,經(jīng)濟(jì)的數(shù)據(jù)存儲(chǔ)系統(tǒng)和存儲(chǔ)管理對(duì)企業(yè)和IT經(jīng)理們來(lái)說(shuō)變得極端重要了。

重復(fù)備份問(wèn)題是怎么產(chǎn)生的?

由于媒體的宣傳,企業(yè)正在認(rèn)識(shí)到,ILM是值得投資的,而且也非常希望用這種新方法提高數(shù)據(jù)存儲(chǔ)管理效率。但是在實(shí)施ILM解決方案的時(shí)候,企業(yè)有可能忘記考慮已有備份系統(tǒng)的影響,從而無(wú)法確保無(wú)重復(fù)數(shù)據(jù)存儲(chǔ)。

一般的備份系統(tǒng)每天會(huì)將主存儲(chǔ)系統(tǒng)中的文件(關(guān)鍵狀態(tài))存儲(chǔ)到成本較低的磁盤(pán)或磁帶上。如果一個(gè)特定文件一直保持關(guān)鍵狀態(tài),那么每天對(duì)其進(jìn)行備份的過(guò)程就會(huì)一直持續(xù)下去。

ILM進(jìn)行的數(shù)據(jù)歸檔與文件備份是不同的,前者進(jìn)行歸檔時(shí),是把運(yùn)營(yíng)性的、非關(guān)鍵數(shù)據(jù)轉(zhuǎn)移到長(zhǎng)期存儲(chǔ)系統(tǒng)中,而備份則在關(guān)鍵數(shù)據(jù)歸檔前將其保護(hù)起來(lái)。

在不能與ILM解決方案協(xié)調(diào)配合的備份系統(tǒng)中,不管數(shù)據(jù)是否已經(jīng)歸檔到其他地方,系統(tǒng)都會(huì)持續(xù)在磁帶或二級(jí)磁盤(pán)上存儲(chǔ)備份文件。這樣做嚴(yán)重忽視了一個(gè)問(wèn)題: 可能必須管理兩套相同的數(shù)據(jù),這必然增加成本、影響效率。

如何解決這一問(wèn)題?

要消除備份系統(tǒng)這個(gè)嚴(yán)重的缺陷,一個(gè)現(xiàn)實(shí)和有效的方法是實(shí)施能與ILM解決方案協(xié)調(diào)配合的備份系統(tǒng),如分布式備份系統(tǒng)。分布式備份系統(tǒng)徹底消除了每天將關(guān)鍵數(shù)據(jù)備份到昂貴的磁帶上的需求,因此減輕了企業(yè)的存儲(chǔ)管理負(fù)擔(dān)。

分布式備份系統(tǒng)從網(wǎng)絡(luò)中的客戶機(jī)中收集數(shù)據(jù),并以壓縮和加密格式將數(shù)據(jù)發(fā)送到離站磁盤(pán)存儲(chǔ)系統(tǒng)中。當(dāng)數(shù)據(jù)需要恢復(fù)時(shí),系統(tǒng)會(huì)按要求檢索數(shù)據(jù)。恢復(fù)和檢索的過(guò)程是完全自動(dòng)進(jìn)行的,這確??焖俸投嗦穫浞?,而且無(wú)重復(fù)備份。這種備份過(guò)程效率很高,可以保證用戶獲得預(yù)期的投資回報(bào)。

這種可與ILM解決方案協(xié)調(diào)配合的分布式備份系統(tǒng),有效利用ILM方案中的指針,可在備份系統(tǒng)或二級(jí)存儲(chǔ)系統(tǒng)中只保留一份文件。備份系統(tǒng)用指針能辨認(rèn)出哪些文件已經(jīng)歸檔,從而自動(dòng)從備份磁盤(pán)中去除這些多余的文件。由于不存在重復(fù)存儲(chǔ)和浪費(fèi)存儲(chǔ)空間的問(wèn)題,因此這種系統(tǒng)提高了成本效益。

在這種系統(tǒng)中,備份到磁盤(pán)上的是主存儲(chǔ)系統(tǒng)當(dāng)前的數(shù)據(jù),這最大限度地降低了對(duì)磁盤(pán)存儲(chǔ)容量的需求并降低了成本。分布式備份可更快、更經(jīng)常地進(jìn)行備份,恢復(fù)操作也更簡(jiǎn)單,同時(shí)它還降低了硬件和存儲(chǔ)系統(tǒng)成本,減少了每天必須進(jìn)行的管理工作。

備份文件的存在狀態(tài)需要單獨(dú)看待,從產(chǎn)生到保存在不同的存儲(chǔ)介質(zhì)層上,再到備份文件被刪除,備份文件的存在狀態(tài)在不同階段是不同的。在備份文件的整個(gè)存在期中對(duì)備份數(shù)據(jù)進(jìn)行管理可以稱為備份生命周期管理(BLM),它不是只管理主數(shù)據(jù),只管理主數(shù)據(jù)叫做ILM。

ILM邁向標(biāo)準(zhǔn)化

■ SNIA ILM 技術(shù)工作組

ILM是一套策略、流程、實(shí)踐、服務(wù)和工具,用來(lái)從信息創(chuàng)建之初直到最后被處理,使信息的業(yè)務(wù)價(jià)值和最合適、最具有成本效率的基礎(chǔ)設(shè)施保持一致。但目前由于存儲(chǔ)資源管理標(biāo)準(zhǔn)的不統(tǒng)一,造成了ILM實(shí)施的困難。這一困境正期待改變。

SNIA力促I(mǎi)LM標(biāo)準(zhǔn)化

ILM是業(yè)務(wù)驅(qū)動(dòng)型管理實(shí)踐,使用信息價(jià)值和該信息的處理需求,為數(shù)據(jù)保存、數(shù)據(jù)保護(hù)和數(shù)據(jù)安全等服務(wù)設(shè)定策略和服務(wù)級(jí)別目標(biāo)(SLO)。

IT資源需要應(yīng)對(duì)不斷變化的業(yè)務(wù)需求。從業(yè)務(wù)需求轉(zhuǎn)變?yōu)閿?shù)據(jù)處理和數(shù)據(jù)管理需求,這勢(shì)必需要業(yè)務(wù)部門(mén)的用戶和數(shù)據(jù)中心的人員進(jìn)行合作。如何管理數(shù)據(jù)成為這種轉(zhuǎn)變的重中之重。

數(shù)據(jù)服務(wù)的管理最好作為幾項(xiàng)基礎(chǔ)服務(wù)的集合來(lái)加以提供。存儲(chǔ)、數(shù)據(jù)保護(hù)和安全等基礎(chǔ)服務(wù)密切相關(guān),以至于其中一項(xiàng)服務(wù)的提供會(huì)影響到另一項(xiàng)服務(wù)的行為,這可能有助于整個(gè)服務(wù)提供,也可能有礙于服務(wù)提供。因此,通過(guò)單一集合來(lái)提供服務(wù)讓數(shù)據(jù)中心可以為行為、可靠性及性能都能提供預(yù)測(cè)的服務(wù),提供規(guī)劃及測(cè)試配置模板。

SNIA眼中的ILM

ILM是一套策略、流程、實(shí)踐、服務(wù)和工具,從信息創(chuàng)建之初直到最后被處理,使信息的業(yè)務(wù)價(jià)值和最合適、最具有成本效率的基礎(chǔ)設(shè)施保持一致。通過(guò)與應(yīng)用、元數(shù)據(jù)和數(shù)據(jù)相關(guān)的管理策略及服務(wù)級(jí)別,使信息與業(yè)務(wù)需求保持一致。

因?yàn)镮LM的這種定義似乎涵蓋了方方面面,我們不妨把定義簡(jiǎn)化為與SNIA及本文有關(guān)的一些方面。ILM提供了使業(yè)務(wù)需求和基礎(chǔ)設(shè)施保持一致的手段。從SNIA的角度來(lái)看,這意味著必須有一套已定義、標(biāo)準(zhǔn)化的以數(shù)據(jù)為中心的服務(wù)、服務(wù)級(jí)別目標(biāo)(SLO)及生命周期管理功能——這些功能支持以業(yè)務(wù)流程為中心的信息生命周期。同樣,必須有一套標(biāo)準(zhǔn)化的屬性,以描述異構(gòu)存儲(chǔ)配置的功能及為數(shù)據(jù)提供服務(wù)的相關(guān)數(shù)據(jù)管理功能。

SNIA在ILM方面的工作支持業(yè)務(wù)流程工作流的定義,包括文檔在整個(gè)轉(zhuǎn)換過(guò)程中的信息狀態(tài),但SNIA沒(méi)有期望定義這方面的任何標(biāo)準(zhǔn),因?yàn)檫@項(xiàng)工作對(duì)其他行業(yè)組織來(lái)說(shuō)更合適。同樣,使用服務(wù)級(jí)別目標(biāo)(SLO)規(guī)定計(jì)算和網(wǎng)絡(luò)需求無(wú)疑是ILM的一部分,但SNIA也沒(méi)有期望定義相關(guān)標(biāo)準(zhǔn),這些標(biāo)準(zhǔn)最好由其他行業(yè)專家來(lái)定義。

本文側(cè)重介紹的內(nèi)容主要包括:

● 定義標(biāo)準(zhǔn)的數(shù)據(jù)服務(wù)級(jí)別目標(biāo)(SLO),備份、復(fù)制和網(wǎng)絡(luò)存儲(chǔ)等存儲(chǔ)和數(shù)據(jù)管理產(chǎn)品可實(shí)現(xiàn)這些服務(wù)級(jí)別目標(biāo)。這種服務(wù)級(jí)別目標(biāo)是一種關(guān)鍵績(jī)效指標(biāo)(KPI),用來(lái)描述數(shù)據(jù)方面的服務(wù)級(jí)別,而不是描述應(yīng)用性能方面的服務(wù)級(jí)別。正因?yàn)槿绱?,它們可?yīng)用于各種類型的數(shù)據(jù)或者應(yīng)用。

● 存儲(chǔ)和數(shù)據(jù)管理產(chǎn)品的服務(wù)聚合,這些產(chǎn)品旨在解決與法規(guī)遵從、參考數(shù)據(jù)和資源分類相關(guān)的重要客戶管理問(wèn)題。

● 基于策略的ILM,以便可以在數(shù)據(jù)生命周期中對(duì)數(shù)據(jù)進(jìn)行合理分類和保存。這種管理為標(biāo)準(zhǔn)的數(shù)據(jù)分類定義做好了準(zhǔn)備,而且還允許基于應(yīng)用和內(nèi)容的分類方法可以驅(qū)動(dòng)數(shù)據(jù)分類。這種基于應(yīng)用和內(nèi)容的分類方法的定義超出了本文的討論范圍。譬如說(shuō),對(duì)數(shù)據(jù)進(jìn)行分類以確定它可能受到哪些政府法規(guī)的制約,這就是知識(shí)驅(qū)動(dòng)型活動(dòng)。如果這種活動(dòng)需要基于內(nèi)容的分類,那么這項(xiàng)標(biāo)準(zhǔn)工作將可以通過(guò)外部分類服務(wù)來(lái)實(shí)現(xiàn)。

數(shù)據(jù)服務(wù)抽象

這項(xiàng)規(guī)范引入了抽象級(jí)別,如圖1所示。這不是什么正式的架構(gòu),而是表明了功能的層次結(jié)構(gòu)。

它被分為三個(gè)抽象層,外加第四個(gè)使用層——業(yè)務(wù)和管理應(yīng)用。位于底部的是可通過(guò)存儲(chǔ)和數(shù)據(jù)管理產(chǎn)品獲得的原始功能。以存儲(chǔ)管理為例,許多這些服務(wù)自最早版本的存儲(chǔ)管理計(jì)劃規(guī)范(SMI-S)以來(lái)就有了。

在單項(xiàng)資源上面的是為數(shù)據(jù)中心而規(guī)劃的特定配置來(lái)組合這些服務(wù)。組合存儲(chǔ)集(CSS)聚合了存儲(chǔ)和服務(wù),它們代表不同配置生成同等功能的特性。這一層還允許根據(jù)站點(diǎn)特定的需求和偏好進(jìn)行定制,并且允許手動(dòng)及自動(dòng)創(chuàng)建配置。

數(shù)據(jù)服務(wù)由數(shù)據(jù)分類、生命周期管理和服務(wù)級(jí)別管理組成。它在存儲(chǔ)行為和提供數(shù)據(jù)服務(wù)級(jí)別之間提供了一種轉(zhuǎn)換。應(yīng)用正是通過(guò)這一數(shù)據(jù)服務(wù)管理接口來(lái)指定數(shù)據(jù)需求為服務(wù)級(jí)別目標(biāo)(SLO),數(shù)據(jù)管理層也正是通過(guò)這一數(shù)據(jù)服務(wù)管理接口來(lái)提供數(shù)據(jù)服務(wù)級(jí)別目標(biāo)(SLO)描述的服務(wù)。這個(gè)管理接口可用來(lái)把數(shù)據(jù)生命周期作為一組策略加以定義及管理。數(shù)據(jù)中心的管理員(IT架構(gòu)師和存儲(chǔ)管理員等)負(fù)責(zé)定義提供數(shù)據(jù)服務(wù)級(jí)別和組合存儲(chǔ)集之間的關(guān)系。實(shí)際上,這種層次結(jié)構(gòu)里面的所有關(guān)系都基于管理員手動(dòng)或者隨著技術(shù)的發(fā)展、使用自動(dòng)化程度不一的管理軟件進(jìn)行的映射。

總的來(lái)說(shuō),這種層次結(jié)構(gòu)的關(guān)鍵要素包括:

● 數(shù)據(jù)服務(wù)級(jí)別目標(biāo)(SLO)的標(biāo)準(zhǔn)定義: 這一概念為傳達(dá)作為需求或者作為已定義服務(wù)級(jí)別的服務(wù)級(jí)別目標(biāo)(SLO)屬性提供了標(biāo)準(zhǔn)框架。這樣一來(lái),就可以獨(dú)立于滿足這些需求的功能,指定數(shù)據(jù)服務(wù)級(jí)別。隨著功能因技術(shù)的進(jìn)步或者環(huán)境的變動(dòng)而發(fā)生變化,現(xiàn)有的服務(wù)級(jí)別目標(biāo)屬性只需映射成新功能,不會(huì)帶來(lái)破壞??蛻舳藨?yīng)用使用數(shù)據(jù)服務(wù)級(jí)別目標(biāo)(SLO)來(lái)規(guī)定數(shù)據(jù)需求; 數(shù)據(jù)服務(wù)資源管理器使用數(shù)據(jù)服務(wù)級(jí)別目標(biāo)來(lái)定義數(shù)據(jù)服務(wù)級(jí)別。

● 描述數(shù)據(jù)和存儲(chǔ)服務(wù)配置的標(biāo)準(zhǔn)屬性: 這一定義專注于預(yù)期特定產(chǎn)品配置的性能和行為。負(fù)責(zé)確定這些預(yù)期的是數(shù)據(jù)中心,而不是廠商開(kāi)發(fā)的工具或者文檔。尤其是,這些功能不僅僅代表單一產(chǎn)品的性能和行為,還代表組合產(chǎn)品的性能和行為——為了提供可預(yù)測(cè)的服務(wù)級(jí)別,可能需要組合產(chǎn)品的組合配置。這個(gè)配置模板提供的“功能”被稱為組合存儲(chǔ)集。

● 管理數(shù)據(jù)層的服務(wù): 提供這些服務(wù)的根本,主要包括如下功能: 配置、監(jiān)控及控制數(shù)據(jù)管理服務(wù),譬如數(shù)據(jù)備份、數(shù)據(jù)復(fù)制、數(shù)據(jù)安全和數(shù)據(jù)移動(dòng)。這包括基于特定情況及基于策略來(lái)執(zhí)行操作的功能。

● 抽象配置及管理存儲(chǔ)層的存儲(chǔ)和服務(wù): 這將通過(guò)當(dāng)前及將來(lái)版本的SMI-S加以提供。

● 數(shù)據(jù)生命周期管理策略: 這些策略允許自動(dòng)化管理與促使服務(wù)級(jí)別目標(biāo)(SLO)的變化適用于數(shù)據(jù)的事件相關(guān)的決策。

這些策略來(lái)自信息生命周期需求,并指定了數(shù)據(jù)管理層里面的信息生命周期。

● 數(shù)據(jù)分類: 這種結(jié)構(gòu)允許數(shù)據(jù)被組織成數(shù)據(jù)組以便管理,譬如服務(wù)級(jí)別管理和生命周期管理等,這可能包括自動(dòng)化管理數(shù)據(jù)分類的策略。

概念模型

數(shù)據(jù)服務(wù)資源管理器里面體現(xiàn)了數(shù)據(jù)服務(wù),圖2里面的抽象層表明了這種管理器的諸多組件。這部分定義了與每一個(gè)組件及其基礎(chǔ)服務(wù)相關(guān)的基本功能。ILM的“標(biāo)準(zhǔn)化”針對(duì)的是這些組件與服務(wù)如何銜接,以及每一個(gè)管理接口的定義。

數(shù)據(jù)放置、數(shù)據(jù)保護(hù)、數(shù)據(jù)安全、存儲(chǔ)及存儲(chǔ)服務(wù): 這是數(shù)據(jù)服務(wù)資源管理器的各種不同服務(wù)。每種服務(wù)必須為發(fā)現(xiàn)、配置和管理屬于數(shù)據(jù)中心一部分的資源及功能做好準(zhǔn)備,以便它們可以作為組合存儲(chǔ)集(CSS)的一部分使用。這些原始服務(wù)可以作為不同的管理域加以管理,也可以集成到全面管理環(huán)境。不同服務(wù)通過(guò)CSS聚合到單一服務(wù)。數(shù)據(jù)服務(wù)還可以直接利用這些基礎(chǔ)服務(wù)來(lái)提供直通式管理功能(譬如復(fù)制、刪除、使其不可改變)。

組合存儲(chǔ)集(CSS): CSS為配置及管理組合已知可以協(xié)同工作、提供可預(yù)測(cè)的服務(wù)級(jí)別的不同資源做好了準(zhǔn)備。CSS通過(guò)作為CSS配置一部分的這些資源,為定義預(yù)期的行為和性能做好了準(zhǔn)備。這表明要用專家知識(shí)把資源組合到工作配置中,并用來(lái)定義預(yù)期行為。CSS模型允許有不同的實(shí)現(xiàn)方式: 可以發(fā)現(xiàn)及記錄數(shù)據(jù)中心里面的現(xiàn)有配置、由數(shù)據(jù)中心的架構(gòu)師手動(dòng)配置CSS,還可以根據(jù)每個(gè)對(duì)象或者每筆交易,完全自動(dòng)組合動(dòng)態(tài)選擇的資源,以達(dá)到數(shù)據(jù)服務(wù)級(jí)別目標(biāo)(SLO)。

數(shù)據(jù)服務(wù): 數(shù)據(jù)服務(wù)為數(shù)據(jù)分類、數(shù)據(jù)服務(wù)級(jí)別管理及數(shù)據(jù)生命周期管理做好了準(zhǔn)備。數(shù)據(jù)服務(wù)組件為業(yè)務(wù)和管理應(yīng)用提供了面向服務(wù)的接口,業(yè)務(wù)和管理應(yīng)用使用數(shù)據(jù)服務(wù)級(jí)別目標(biāo)(SLO)作為規(guī)定服務(wù)需求的屬性。規(guī)定數(shù)據(jù)需求的服務(wù)級(jí)別目標(biāo)集合被稱為SLOG即SLO群組。這種需求通常是使用者為了確定數(shù)據(jù)在生命周期中需要哪些服務(wù)而執(zhí)行的分類流程的結(jié)果。

數(shù)據(jù)服務(wù)還可能使用SLO屬性來(lái)描述數(shù)據(jù)服務(wù)資源管理器支持的數(shù)據(jù)服務(wù)級(jí)別(ODSL)。數(shù)據(jù)服務(wù)將管理功能,以管理ODSL和CSS之間的映射。

組合存儲(chǔ)集

在為某個(gè)數(shù)據(jù)中心實(shí)現(xiàn)應(yīng)用解決方案時(shí),數(shù)據(jù)管理功能、存儲(chǔ)與用于提供該解決方案的存儲(chǔ)服務(wù)往往存在密切的依賴關(guān)系。組合存儲(chǔ)集是一個(gè)特定的集合,結(jié)合了數(shù)據(jù)管理功能、存儲(chǔ)和存儲(chǔ)服務(wù),數(shù)據(jù)中心的架構(gòu)師(即IT架構(gòu)師)在定義提供可預(yù)測(cè)的數(shù)據(jù)服務(wù)級(jí)別解決方案時(shí)要用到它們。

廠商和客戶都面臨的困境就是,不同產(chǎn)品配置的各種組合有可能會(huì)帶來(lái)同等的數(shù)據(jù)服務(wù)級(jí)別。在任何一個(gè)點(diǎn)評(píng)估吞吐量或者可用性并不能足夠準(zhǔn)確地為不同組合(有時(shí)產(chǎn)品配置截然不同)描述總體吞吐量或者可用性。

此外,數(shù)據(jù)中心管理變化無(wú)常,以至于每個(gè)數(shù)據(jù)中心各自都有特定的細(xì)微差別,這些差別與廠商、配置及評(píng)估方法有關(guān)。為解決這些問(wèn)題,CSS為這項(xiàng)功能做好了準(zhǔn)備: 把數(shù)據(jù)中心的原始功能規(guī)范,定制成由數(shù)據(jù)中心管理的一系列特定配置的功能,這些配置可以在該環(huán)境提供特定的服務(wù)級(jí)別。至少,CSS是一種文檔管理方案,可供IT架構(gòu)師選擇可用技術(shù)配置,以便可與提供數(shù)據(jù)服務(wù)級(jí)別之間來(lái)回映射。

數(shù)據(jù)服務(wù)

數(shù)據(jù)服務(wù)由數(shù)據(jù)分類、生命周期管理和服務(wù)級(jí)別管理組成。

(1)數(shù)據(jù)分類

數(shù)據(jù)分類是把數(shù)據(jù)組織成數(shù)據(jù)組,以便管理。分類方案的目的在于,根據(jù)數(shù)據(jù)組對(duì)業(yè)務(wù)的價(jià)值以及處理和存儲(chǔ)需求,把服務(wù)級(jí)別目標(biāo)與數(shù)據(jù)組聯(lián)系起來(lái)。

數(shù)據(jù)分類的前身是信息分類,信息分類用于把數(shù)據(jù)組與特定的生命周期聯(lián)系起來(lái)。一般可通過(guò)數(shù)據(jù)中心、業(yè)務(wù)部門(mén)、記錄信息管理員及公司在獲取及使用信息方面的其他利益相關(guān)者相互協(xié)作來(lái)獲得信息分類方案。圖3和圖4闡述了這些概念。



(2)服務(wù)級(jí)別管理

提供數(shù)據(jù)服務(wù)級(jí)別(ODSL)發(fā)送給使用者,譬如業(yè)務(wù)和管理應(yīng)用層當(dāng)中的電子郵件或者企業(yè)內(nèi)容管理應(yīng)用,使用目前在通用信息模型(CIM)中實(shí)現(xiàn)的“功能”模型。

ODSL功能的屬性基于數(shù)據(jù)SLO的屬性,它們與分配數(shù)據(jù)服務(wù)級(jí)別目標(biāo)(SLO)需求時(shí)作為“設(shè)置”所用的一組屬性相同。數(shù)據(jù)需求的設(shè)置被稱為服務(wù)級(jí)別目標(biāo)群組即SLOG。

服務(wù)級(jí)別管理提供了創(chuàng)建及管理ODSL及其功能的功能,如圖4所示。服務(wù)級(jí)別管理還提供了這一功能: 執(zhí)行從數(shù)據(jù)的SLOG設(shè)置到ODSL、從ODSL到CSS的“最佳適合的”映射。

SLOG/ODSL和CSS的目的在于,提供兩種“準(zhǔn)獨(dú)立的”抽象: 一種是描述數(shù)據(jù)需求和服務(wù)的特點(diǎn),另一個(gè)是組織管理存儲(chǔ)系統(tǒng)功能。通過(guò)把數(shù)據(jù)與SLOG和ODSL聯(lián)系起來(lái),可以讓需求隨著時(shí)間不斷變化,只要重新分配數(shù)據(jù)與SLOG的關(guān)系。SLOG本身保持不變(當(dāng)然,除非引入了新的目標(biāo)。)同樣,存儲(chǔ)層或者數(shù)據(jù)管理層的拓?fù)浣Y(jié)構(gòu)、技術(shù)或者特點(diǎn)發(fā)生變化,可能不會(huì)改變CSS本身,只有表明這些CSS如何物理實(shí)現(xiàn)的映射才會(huì)改變。

(3)生命周期管理

數(shù)據(jù)生命周期是一種抽象概念,通過(guò)使用SLOG和SLOG分配策略來(lái)實(shí)現(xiàn)。數(shù)據(jù)生命周期來(lái)自并支持信息生命周期。這包括并非事先規(guī)劃的特定的生命周期事件,譬如“現(xiàn)在運(yùn)用這個(gè)SLOG”。信息生命周期和數(shù)據(jù)生命周期之間的區(qū)別包括:

“信息生命周期”定義了適用于數(shù)據(jù)的業(yè)務(wù)需求和業(yè)務(wù)價(jià)值,并定義了可能會(huì)在數(shù)據(jù)生命周期改變價(jià)值和需求的事件。這些通過(guò)信息以及/或者應(yīng)用特有的關(guān)鍵績(jī)效指標(biāo)(KPI)來(lái)表達(dá)。SMI-S里面沒(méi)有信息生命周期的模型。

“數(shù)據(jù)生命周期”定義了在信息生命周期的每個(gè)階段都可以適用的數(shù)據(jù)SLOG,以及用來(lái)把數(shù)據(jù)轉(zhuǎn)換成初始或者新的SLOG和SLOG分配策略。數(shù)據(jù)生命周期支持信息生命周期,但通過(guò)專門(mén)針對(duì)數(shù)據(jù)的術(shù)語(yǔ)來(lái)表示。數(shù)據(jù)生命周期是一種抽象概念,通過(guò)使用數(shù)據(jù)SLOG和SLOG分配策略在SMI-S建立了模型。

圖5闡明了數(shù)據(jù)分類、服務(wù)級(jí)別管理和數(shù)據(jù)生命周期管理等概念。信息管理層的業(yè)務(wù)應(yīng)用生成數(shù)據(jù)。

進(jìn)行的“最佳適合”服務(wù)級(jí)別映射是從數(shù)據(jù)生命周期每個(gè)階段的所需SLOG映射到提供數(shù)據(jù)服務(wù)級(jí)別。如今,這通常通過(guò)業(yè)務(wù)部門(mén)的應(yīng)用管理員和IT架構(gòu)師或者存儲(chǔ)管理員之間討論或者協(xié)商進(jìn)行。另外,IT架構(gòu)師定義了從每個(gè)ODSL到一個(gè)或者若干CSS的一組有效映射,這些CSS能夠滿足ODSL里面定義的服務(wù)級(jí)別。

圖5中顯示為“策略”的SLOG分配策略用來(lái)為數(shù)據(jù)生命周期的每個(gè)階段應(yīng)用一組新的數(shù)據(jù)需求。有時(shí),應(yīng)用新的SLOG會(huì)導(dǎo)致映射成新的ODSL,有時(shí)不會(huì)。同樣,映射成新的ODSL可能會(huì)導(dǎo)致映射成新的CSS(參閱能夠支持兩個(gè)ODSL的CSS-y),也可能不會(huì)。映射成新的CSS可能會(huì)有后續(xù)行動(dòng),譬如數(shù)據(jù)移動(dòng)到新的存儲(chǔ)位置,還有可以確定是不是該刪除數(shù)據(jù)的SLOG分配策略。

鏈接:SNIA ILM技術(shù)工作組

SNIA(Storage Networking Industry Association,全球網(wǎng)絡(luò)存儲(chǔ)工業(yè)協(xié)會(huì))ILM技術(shù)工作組將開(kāi)發(fā)共享數(shù)據(jù)管理及相關(guān)存儲(chǔ)管理服務(wù),這些服務(wù)散布于跨越網(wǎng)絡(luò)存儲(chǔ)的應(yīng)用。ILM技術(shù)工作組將定義流程、控制機(jī)制及工件,可把數(shù)據(jù)管理需求(保護(hù)和可用性等方面的服務(wù)級(jí)別目標(biāo)及策略)映射成數(shù)據(jù)管理服務(wù)。雖然單個(gè)應(yīng)用能夠、也可以提供部分這些服務(wù),但I(xiàn)LM技術(shù)工作組將滿足對(duì)一組公用數(shù)據(jù)和存儲(chǔ)管理服務(wù)及它們跨共享及使用網(wǎng)絡(luò)存儲(chǔ)的多個(gè)應(yīng)用進(jìn)行協(xié)調(diào)的需求。

挖掘ILM的金礦

■Howard Marks

本文分析了運(yùn)用信息生命周期管理(ILM)工具和實(shí)踐來(lái)管理數(shù)據(jù)所具有的商業(yè)價(jià)值,IT人員據(jù)此能夠制訂出統(tǒng)一的ILM方案。

如果說(shuō)時(shí)間就是金錢(qián),那么大多數(shù)數(shù)據(jù)管理員都被透支了。用戶需要查看四年前創(chuàng)建的有關(guān)銷售會(huì)議的PowerPoint文檔; 法律人員說(shuō)要盡快處置商業(yè)文檔。新的法規(guī)在不斷涌現(xiàn),要求對(duì)數(shù)據(jù)保留政策進(jìn)行細(xì)微改動(dòng)。更讓人忙得暈頭轉(zhuǎn)向的是,要是上頭要求你提供與某樁官司有關(guān)的所有電子商業(yè)文檔: 電子郵件、即時(shí)通信、電子表格、Word和Excel文件,去年底生效的《聯(lián)邦民事訴訟規(guī)則》規(guī)定你只有120天的時(shí)間來(lái)完成這項(xiàng)工作。

由于時(shí)間如此緊迫,你能夠從倉(cāng)庫(kù)取回所有相關(guān)的備份磁帶、把內(nèi)容恢復(fù)到新服務(wù)器、抽取相關(guān)的數(shù)據(jù)、讓律師審查一切內(nèi)容嗎?

我們認(rèn)為不能。當(dāng)然,這讓涉足數(shù)據(jù)管理領(lǐng)域的廠商們?cè)谝贿呁抵鴺?lè),它們預(yù)料到新的電子發(fā)現(xiàn)規(guī)則會(huì)給IT人員帶來(lái)麻煩。據(jù)弗雷斯特研究公司聲稱,去年,記錄管理市場(chǎng)的產(chǎn)值高達(dá)2.8億美元。到明年,預(yù)計(jì)會(huì)增長(zhǎng)近500%,增至驚人的13億美元。

其中許多資金可能會(huì)用于ILM應(yīng)用程序。簡(jiǎn)而言之,ILM就是IT人員符合“物應(yīng)各有其所,亦應(yīng)各在其所”這句老話的法寶。它要求把數(shù)據(jù)存放在與價(jià)值相稱的位置,同時(shí),任何特定數(shù)據(jù)項(xiàng)的價(jià)值會(huì)隨著時(shí)間而變化; 不同的訪問(wèn)方法可能適用于生命周期中不同時(shí)期的數(shù)據(jù)項(xiàng)。

辛苦的工作

目前這沒(méi)有統(tǒng)一的ILM產(chǎn)品。你可以通過(guò)以下方法來(lái)達(dá)到局部目標(biāo): 組合電子郵件歸檔工具及文件管理和數(shù)據(jù)庫(kù)歸檔工具,并且制訂全面政策來(lái)定義數(shù)據(jù)(結(jié)構(gòu)化數(shù)據(jù)、電子郵件和文件等)的商業(yè)價(jià)值,那樣就可以通過(guò)與當(dāng)前值相稱的方式來(lái)管理數(shù)據(jù)。但想正中ILM的要害,就需要現(xiàn)在根本還沒(méi)有面市的技術(shù),譬如復(fù)雜的數(shù)據(jù)分類引擎。

你可以靜觀事變嗎?除非你在數(shù)據(jù)存儲(chǔ)方面的要求極低,并處于相對(duì)缺乏監(jiān)管的行業(yè),否則恐怕不行。當(dāng)然磁盤(pán)仍很便宜,但保留方面的規(guī)則,加上文件大小增加了千倍(10年前一封WordPerfect信函只有2KB大小,而現(xiàn)在一個(gè)微軟Word文件卻有2MB大?。?,這把小公司之外的所有公司推到了再也忍受不下去的地步。

沒(méi)必要這樣。向ILM遷移并不容易,但值得為之努力: 一項(xiàng)針對(duì)用戶的調(diào)查表明,實(shí)施了ILM計(jì)劃的調(diào)查對(duì)象有四分之三簡(jiǎn)化了主存儲(chǔ)系統(tǒng)的管理,并且減少了高端磁盤(pán)方面的開(kāi)支。

著手行動(dòng)

如果你現(xiàn)在被淹沒(méi)在大量信息中,電子郵件歸檔程序等單點(diǎn)解決方案讓你有一點(diǎn)喘息的機(jī)會(huì),同時(shí)確保你能滿足法規(guī)要求。在今后兩三年內(nèi),諸多廠商會(huì)提供新一代文件管理系統(tǒng)(包括分類和遷移服務(wù)),譬如Acopia Networks、博科通訊系統(tǒng)、NeoPath Networks、Njini和EMC(集成Infoscape和Rainfinity)。

但愿這些廠商會(huì)認(rèn)識(shí)到: 占用電子郵件歸檔大部分空間的是文件系統(tǒng)中也存在的郵件附件,隨后為IT人員提供集成這些歸檔文件的辦法。我們?cè)诤竺鏈y(cè)試了一些產(chǎn)品,它們聲稱可以使用詳細(xì)、靈活的標(biāo)準(zhǔn)對(duì)非結(jié)構(gòu)化文件進(jìn)行分類、遷移文件,或者為不同的數(shù)據(jù)遷移引擎提供界面。

最后,管理結(jié)構(gòu)化數(shù)據(jù)總是不但要依賴數(shù)據(jù)庫(kù)服務(wù)器環(huán)境,還要依賴應(yīng)用程序的數(shù)據(jù)庫(kù)模式和利用率。因而,應(yīng)用感知(application-aware)的單點(diǎn)產(chǎn)品其效果遠(yuǎn)遠(yuǎn)好于任何集成的解決方案。譬如說(shuō),Princeton Softech公司的Optim和Solix Technologies公司的ArchiveJinni為PeopleSoft和Oracle財(cái)務(wù)軟件等應(yīng)用程序提供了模塊和政策。

需要付出

ILM項(xiàng)目從頭搞起需要投入大量的時(shí)間和資金。從人力角度來(lái)看,ILM首先是個(gè)政策問(wèn)題。ILM工具把查找數(shù)據(jù)、遷移到相應(yīng)存儲(chǔ)設(shè)備的過(guò)程實(shí)現(xiàn)自動(dòng)化之前,企業(yè)先要制訂相應(yīng)的保留政策。

啟動(dòng)ILM項(xiàng)目是一筆財(cái)政投資。文件分類軟件往往會(huì)使企業(yè)平均花費(fèi)5萬(wàn)到10萬(wàn)美元。電子郵件歸檔的成本每個(gè)郵箱是10到50美元。不過(guò)有些方面的節(jié)省起到了抵消作用: 存儲(chǔ)設(shè)備越來(lái)越便宜; 通過(guò)刪除非活動(dòng)數(shù)據(jù),從而縮減備份和恢復(fù)窗口,加快電子郵件服務(wù)器和數(shù)據(jù)庫(kù)的速度; 另外還能夠在幾天內(nèi)滿足電子發(fā)現(xiàn)請(qǐng)求,而用不著取回磁盤(pán),讓幾名管理員干上一個(gè)月的磁帶恢復(fù)工作。

郵件首當(dāng)其沖

美國(guó)企業(yè)界距離借助電子郵件歸檔產(chǎn)品實(shí)現(xiàn)ILM夢(mèng)想最接近,譬如EMC的EmailXtender、賽門(mén)鐵克的Enterprise Vault和Zantaz的EAS,這些產(chǎn)品可以根據(jù)時(shí)間把電子郵件消息從主數(shù)據(jù)存儲(chǔ)區(qū)遷移出去。郵件消息放在輔助數(shù)據(jù)存儲(chǔ)區(qū)。在這里,用戶能夠以半透明的方式訪問(wèn)它們,如果以后企業(yè)的數(shù)據(jù)保護(hù)政策需要,還可加以刪除。

盡管我們現(xiàn)在認(rèn)為電子郵件歸檔這個(gè)工具主要用來(lái)確保遵從數(shù)據(jù)保留法規(guī),并提供檢索電子郵件消息、跨多個(gè)郵箱進(jìn)行搜索用于電子發(fā)現(xiàn)的功能,但這些系統(tǒng)原先的市場(chǎng)定位是作為簡(jiǎn)化電子郵件管理員工作的工具。因?yàn)槟呐率腔謴?fù)一則消息到Exchange服務(wù)器,也需要恢復(fù)整個(gè)信息存儲(chǔ)區(qū),或者以極慢的速度對(duì)多個(gè)郵箱進(jìn)行逐個(gè)備份,所以管理員有著強(qiáng)烈動(dòng)機(jī)來(lái)限制信息存儲(chǔ)區(qū)大小。

但對(duì)用戶郵箱規(guī)定限額導(dǎo)致用戶的.PST文件數(shù)量激增,隨意刪除郵件消息,而且數(shù)據(jù)管理轉(zhuǎn)到了單個(gè)用戶手里——而這是極不明智的,因?yàn)橛脩艨赡軙?huì)刪除屬于公司記錄的郵件。

大多數(shù)歸檔軟件需要Outlook或者Notes客戶軟件插件,為用戶顯示“消息已遷移”圖標(biāo),并且自動(dòng)從歸檔文件檢索消息和附件。使用Mac和Linux機(jī)器的用戶可能不具備全部功能。

理想情況下,ILM廠商會(huì)集成電子郵件和文件管理工具。因?yàn)樵S多用戶在文件服務(wù)器上創(chuàng)建文檔,然后把文件通過(guò)附件形式發(fā)送給同事,所以在文件系統(tǒng)和郵件服務(wù)器的數(shù)據(jù)存儲(chǔ)區(qū)都有同一個(gè)文件。如果使用SHA-2等抗沖突的散列算法,集成的文件/電子郵件ILM系統(tǒng)就能夠確認(rèn)這些冗余現(xiàn)象,只保留一份文件,從而節(jié)省磁盤(pán)空間。

數(shù)據(jù)庫(kù)面臨的困境

如果擁有數(shù)據(jù)庫(kù)遷移引擎,存儲(chǔ)管理員和數(shù)據(jù)庫(kù)管理員稍加努力,就可以為生產(chǎn)、測(cè)試、開(kāi)發(fā)及閑置等數(shù)據(jù)庫(kù)分配相應(yīng)的存儲(chǔ)池。不過(guò),說(shuō)到隨著數(shù)據(jù)老化、價(jià)值變小而遷移出去,文件和電子郵件消息具有優(yōu)勢(shì),因?yàn)樗鼈冊(cè)谕坏胤绞冀K有時(shí)間戳(time stamp)。

相比之下,Oracle或者SQL Server數(shù)據(jù)庫(kù)里面的行和列可能被時(shí)間分離,或者有不同的時(shí)間戳,而每個(gè)程序組織數(shù)據(jù)的方式各不相同。因而,對(duì)結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分類需要應(yīng)用程序創(chuàng)建的數(shù)據(jù)庫(kù)模式和分類引擎具有更密切的關(guān)系。

因而,一些數(shù)據(jù)庫(kù)ILM解決方案提供了面向SAP這些常見(jiàn)應(yīng)用程序的版本,從而簡(jiǎn)化這個(gè)過(guò)程,譬如EMC的DatabaseXtender、惠普的數(shù)據(jù)庫(kù)參考信息管理器和Princeton的Optim。Solix同樣有應(yīng)用程序定義,提供給使用其ArchiveJinni數(shù)據(jù)庫(kù)歸檔軟件的客戶。

除了隨著數(shù)據(jù)在生命周期中老化而進(jìn)行遷移外,大多數(shù)廠商還有一個(gè)模塊作為數(shù)據(jù)庫(kù)ILM套件的一部分,生成工作數(shù)據(jù)庫(kù)的較小拷貝,用于開(kāi)發(fā)及測(cè)試。這種微型數(shù)據(jù)庫(kù)可能含有一整套觸發(fā)器和存儲(chǔ)過(guò)程,一組代表性的數(shù)據(jù)可能只有主數(shù)據(jù)庫(kù)大小的十分之一,這樣編程員不必占用數(shù)TB的磁盤(pán)空間,就可以測(cè)試代碼。

Oracle的ILM助理(可從該公司的網(wǎng)站免費(fèi)下載)讓數(shù)據(jù)庫(kù)管理員可以輕松定義數(shù)據(jù)生命周期,根據(jù)生命周期來(lái)分配數(shù)據(jù)庫(kù)表。然后它會(huì)使用Oracle的表分區(qū)技術(shù),把數(shù)據(jù)從一個(gè)表空間的分區(qū)遷移到另一個(gè)表空間的分區(qū)——這另一個(gè)表空間位于成本較低的存儲(chǔ)層上。因?yàn)镺racle分區(qū)對(duì)用戶應(yīng)用來(lái)說(shuō)是透明的,所以用戶覺(jué)察不到這一點(diǎn)。

HSM的軟肋

上世紀(jì)80年代末90年代初,EMC、Commvault及其他廠商試圖利用大型機(jī)領(lǐng)域所用的分級(jí)存儲(chǔ)管理(HSM)技術(shù),解決數(shù)據(jù)生命周期問(wèn)題。幾家廠商竭力推銷Windows和Novell NetWare文件服務(wù)器采用三層HSM: 根據(jù)上一次修改及上一次訪問(wèn)等日期屬性,把文件從標(biāo)準(zhǔn)硬驅(qū)遷移到光盤(pán)庫(kù),再?gòu)墓獗P(pán)庫(kù)遷移到磁帶庫(kù)。用戶或者應(yīng)用程序訪問(wèn)時(shí),遷移文件被存根文件(stub)取代,然后從近線存儲(chǔ)設(shè)備中取回。

HSM似乎是個(gè)很好的想法,連微軟也把它集成到了Windows 2000中,稱之為遠(yuǎn)程存儲(chǔ)(Remote Storage)。

盡管HSM在批處理大型機(jī)環(huán)境比較成功,但在互動(dòng)性更強(qiáng)的分布式系統(tǒng)領(lǐng)域卻一敗涂地。HSM沒(méi)有流行起來(lái)有眾多原因——其中許多問(wèn)題如今仍是ILM的癥結(jié)。

HSM的最大問(wèn)題是什么呢?硬驅(qū)容量在增加,而成本跌得非??欤灾?xí)簳r(shí)存儲(chǔ)文件、甚至?xí)簳r(shí)存儲(chǔ)到磁盤(pán)庫(kù)上也節(jié)省不了多少資金,不值得這么做。許多企業(yè)還發(fā)現(xiàn),要對(duì)數(shù)據(jù)進(jìn)行分類,光有數(shù)據(jù)年齡這種信息還不夠。企業(yè)制訂了保留80天后遷移的政策,結(jié)果用戶卻抱怨無(wú)法打開(kāi)上一個(gè)季度的季末電子表格,因?yàn)樗麄儧](méi)有足夠耐性等待系統(tǒng)從磁帶恢復(fù)文件。現(xiàn)在這仍是個(gè)問(wèn)題。

存根文件和檢索機(jī)制也成問(wèn)題。如果員工試圖使用Windows搜索或者Google Desktop,通過(guò)查找文檔文件里面的客戶姓名來(lái)查找發(fā)到某個(gè)重要客戶的一封信件,HSM系統(tǒng)就會(huì)取回所有文件,這給服務(wù)器帶來(lái)了相當(dāng)大的負(fù)擔(dān),或者因沒(méi)有及時(shí)取回文件而導(dǎo)致搜索失敗,嚴(yán)重影響了用戶體驗(yàn)和工作效率。

不過(guò)市面上有一些HSM方案,譬如CommVault的DataMigrator、EMC的Disk Extender和賽門(mén)鐵克的NetBackup Storage Migrator,它們經(jīng)常被數(shù)據(jù)管理系統(tǒng)作為遷移引擎使用,而數(shù)據(jù)管理系統(tǒng)有自己的數(shù)據(jù)分類方法。CommVault還在添加數(shù)據(jù)分類選項(xiàng),可以根據(jù)年齡和內(nèi)容來(lái)遷移文件。

鏈接:ILM實(shí)施三步走之一: 對(duì)數(shù)據(jù)分級(jí)

一旦你實(shí)施了管理政策,也準(zhǔn)備好了電子郵件和數(shù)據(jù)庫(kù),就可以把重點(diǎn)放在生命周期上。這意味著做一條有三條腿的凳子:分級(jí)數(shù)據(jù)、數(shù)據(jù)分類(通過(guò)結(jié)合業(yè)務(wù)流程和自動(dòng)化分類引擎,對(duì)每組數(shù)據(jù)進(jìn)行評(píng)估)以及遷移引擎(把數(shù)據(jù)遷移到與當(dāng)前值相稱的位置)。

要是跟大多數(shù)IT人士說(shuō)起分級(jí)存儲(chǔ),他們就會(huì)想到高性能光纖通道驅(qū)動(dòng)器用于存儲(chǔ)寶貴數(shù)據(jù)、低成本SATA驅(qū)動(dòng)器用于存儲(chǔ)價(jià)值較低的數(shù)據(jù)。這只是個(gè)開(kāi)頭,但以一種與商業(yè)價(jià)值相一致的方式來(lái)存儲(chǔ)數(shù)據(jù)的關(guān)鍵根本不是從每TB成本來(lái)看選擇昂貴還是不太昂貴的存儲(chǔ)設(shè)備。要把存儲(chǔ)層看成提供不同的服務(wù)級(jí)別協(xié)議(SLA),而不只是不同的成本:主存儲(chǔ)層針對(duì)性能進(jìn)行了優(yōu)化,經(jīng)常備份以減少恢復(fù)點(diǎn)目標(biāo)(RPO);并且保持得很小,以便盡量縮短恢復(fù)時(shí)間。

我們?cè)诙x存儲(chǔ)層時(shí)還要考慮到安全。比如從投資銀行業(yè)務(wù)部門(mén)和經(jīng)紀(jì)業(yè)務(wù)部門(mén)一邊訪問(wèn)的服務(wù)器需要對(duì)所有敏感數(shù)據(jù)進(jìn)行加密,還要有全面的訪問(wèn)審查及控制手段。

分析在不同存儲(chǔ)層之間遷移數(shù)據(jù)帶來(lái)的成本節(jié)省時(shí),不但要考慮磁盤(pán)陣列每GB的原始成本,還要考慮存儲(chǔ)數(shù)據(jù)的全部成本,包括快照和數(shù)據(jù)恢復(fù)副本。以典型的大企業(yè)為例:關(guān)鍵的應(yīng)用程序把數(shù)據(jù)傳送到單一磁盤(pán)陣列。陣列經(jīng)配置后,可以每小時(shí)拍一次分離鏡像快照,并復(fù)制到一個(gè)或者多個(gè)數(shù)據(jù)恢復(fù)站點(diǎn);而在數(shù)據(jù)恢復(fù)站點(diǎn),又要拍快照。這種企業(yè)可能會(huì)把六個(gè)或者更多拷貝的應(yīng)用數(shù)據(jù)存放在最昂貴的第一層存儲(chǔ)設(shè)備上。

如果發(fā)現(xiàn)某部分?jǐn)?shù)據(jù)在生命周期中基本到了靜態(tài)階段,并把它遷移到只有兩個(gè)拷貝處于聯(lián)機(jī)狀態(tài)的存儲(chǔ)環(huán)境——一個(gè)在主數(shù)據(jù)中心,一個(gè)在數(shù)據(jù)恢復(fù)站點(diǎn),可以節(jié)省大量磁盤(pán)空間。

另外還要牢記:數(shù)據(jù)在生命周期中逐漸移動(dòng)時(shí),讀寫(xiě)比會(huì)大大提高,所以RAID 5或者RAID 6變得更有吸引力,它們與鏡像陣列相比存儲(chǔ)容量較大、讀性能較低。

根據(jù)塊訪問(wèn)頻率,把數(shù)據(jù)塊從高成本、高性能驅(qū)動(dòng)器遷移到低成本驅(qū)動(dòng)器。雖然這可能會(huì)對(duì)存儲(chǔ)數(shù)據(jù)的原始成本帶來(lái)一些影響,但它不會(huì)對(duì)備份和恢復(fù)時(shí)間帶來(lái)任何重大影響,因?yàn)檫@些功能是在卷、文件或者數(shù)據(jù)庫(kù)等級(jí)別上執(zhí)行的。

鏈接:ILM實(shí)施三步走之二: 確認(rèn)數(shù)據(jù)的價(jià)值

第二步就是知道任何一部分?jǐn)?shù)據(jù)的商業(yè)價(jià)值。大部分信息在一段時(shí)間后會(huì)失去實(shí)用價(jià)值。所以盡快刪除這些數(shù)據(jù)可消除數(shù)據(jù)泄露的可能性,并盡量減少了成本高昂的搜索工作。

不過(guò),有些文件(譬如有關(guān)營(yíng)銷資料和年度報(bào)告的歸檔)在更長(zhǎng)的一段時(shí)間內(nèi)具有價(jià)值。永久歸檔里面的數(shù)據(jù)不需要讓用戶易于訪問(wèn),只需要在元數(shù)據(jù)方面留下一點(diǎn)線索。

確定結(jié)構(gòu)化數(shù)據(jù)的保留期限比較簡(jiǎn)單。數(shù)據(jù)庫(kù)管理員知道每個(gè)數(shù)據(jù)庫(kù)有什么用途、如何影響貴公司業(yè)務(wù)。

確定非結(jié)構(gòu)化數(shù)據(jù)的保留期限則要難得多。電子郵件就包括發(fā)送者、接收者及內(nèi)容。從Linux的ext3到Network Appliance的WAFL,現(xiàn)代的文件系統(tǒng)保存文件創(chuàng)建、上一次修改及上一次訪問(wèn)日期,同時(shí)還保存了“隱藏”、“只讀”或者“該文件離線保存”等文件屬性。

每個(gè)文件還附有安全信息,包括訪問(wèn)控制列表;對(duì)大多數(shù)系統(tǒng)而言,還附有文件所有者。傳統(tǒng)的分級(jí)存儲(chǔ)管理(HSM)解決方案使用“文件上一次訪問(wèn)”日期作為惟一表明價(jià)值的信息源;如果文件在一段時(shí)間后沒(méi)有被訪問(wèn),就會(huì)被遷移出去。

最終,我們會(huì)看到足夠智能化的分類引擎,能夠認(rèn)出這樣的文字處理文檔是商業(yè)信函:最上面是日期,然后跟著姓名,接下來(lái)的6行里面有另一個(gè)姓名,最下面的姓名與最上面的姓名相一致。然后它會(huì)搜索數(shù)據(jù)庫(kù),看看目標(biāo)接收者是不是某個(gè)客戶;如果是,引擎就知道這是需要符合證券交易委員會(huì)17a-4規(guī)則或者其他法規(guī)保留要求的商業(yè)信函。

理想情況下,ILM分類引擎還會(huì)知道文件的訪問(wèn)頻率。遺憾的是,使用普通的NAS和文件服務(wù)器系統(tǒng)還無(wú)法實(shí)現(xiàn)這一點(diǎn)。分類方案廠商有望開(kāi)發(fā)出文件系統(tǒng)過(guò)濾器或者類似的代理,使用NetApp存儲(chǔ)設(shè)備(filer)或者EMC Celerra的反病毒掃描API來(lái)跟蹤文件訪問(wèn)頻率,但這需要在每個(gè)被管理的服務(wù)器上安裝代理。

鏈接:ILM實(shí)施三步走之三: 確定適合的存儲(chǔ)位置

最后,數(shù)據(jù)的存儲(chǔ)位置必須與其價(jià)值相一致。我們還要決定數(shù)據(jù)要不要仍可以從初始位置來(lái)訪問(wèn):當(dāng)我們制訂數(shù)據(jù)遷移政策、規(guī)定“把在過(guò)去90天沒(méi)有訪問(wèn)的所有Word文檔從用戶的主目錄遷移到中間歸檔文件共享區(qū)”,你該如何管理用戶訪問(wèn)呢?

最簡(jiǎn)單的情況就是單單遷移文件,然后把它們從主目錄上刪除。雖然這對(duì)IT人員和ILM廠商來(lái)說(shuō)很簡(jiǎn)單,但這會(huì)讓用戶非常惱火。我們既要遷移數(shù)據(jù),又要讓所有者可以從初始位置來(lái)訪問(wèn)。帶內(nèi)NAS虛擬化設(shè)備(譬如Neopath和Acopia Networks的設(shè)備)可以把用戶訪問(wèn)已遷移文件的請(qǐng)求重定向至新位置,具有真正的透明度,甚至?xí)@示用戶目錄下實(shí)際文件的大小。

我們還可以在初始位置留下一個(gè)指針文件(pointer file),讓用戶的計(jì)算機(jī)可以從新服務(wù)器裝入文件。但不同的操作系統(tǒng)對(duì)待鏈接和指針的方式可能有所不同。即便你的工作站全部使用Windows,通過(guò)鏈接打開(kāi)遷移文件的用戶也會(huì)保存對(duì)遷移位置的更改,這會(huì)使這個(gè)位置時(shí)常變更,會(huì)干擾歸檔文件保留狀態(tài)和版本。

遷移引擎也會(huì)集成到存儲(chǔ)管理工具包的其他部分里面,移動(dòng)文件時(shí),可以更新企業(yè)搜索索引;最好與備份程序集成在一起,利用新的文件位置來(lái)更新目錄。

顯然,有許多部分需要組合起來(lái)。但另一種情況就是數(shù)據(jù)無(wú)序(data anarchy),眼看著存儲(chǔ)成本不斷耗用預(yù)算。因此,為了向監(jiān)管部門(mén)表明貴公司在誠(chéng)信經(jīng)營(yíng),制訂政策非常重要。甚至一些小步驟也會(huì)讓你處于有利地位,譬如在實(shí)施電子郵件歸檔、規(guī)劃將來(lái)采購(gòu)存儲(chǔ)硬件時(shí)考慮到存儲(chǔ)層。 (ccw)

發(fā)布:2007-04-22 09:23    編輯:泛普軟件 · xiaona    [打印此頁(yè)]    [關(guān)閉]
相關(guān)文章:

泛普西安OA快博其他應(yīng)用

西安OA軟件 西安OA新聞動(dòng)態(tài) 西安OA信息化 西安OA快博 西安OA行業(yè)資訊 西安軟件開(kāi)發(fā)公司 西安門(mén)禁系統(tǒng) 西安物業(yè)管理軟件 西安倉(cāng)庫(kù)管理軟件 西安餐飲管理軟件 西安網(wǎng)站建設(shè)公司