當(dāng)前位置:工程項(xiàng)目OA系統(tǒng) > 泛普各地 > 陜西OA系統(tǒng) > 西安OA系統(tǒng) > 西安OA快博
ILM標(biāo)準(zhǔn)化與實(shí)踐
信息生命周期管理(ILM,Information Lifecycle Management)是一個(gè)相對新的概念。ILM有兩個(gè)目標(biāo):降低管理成本,最有效地利用存儲(chǔ)硬件。為了實(shí)現(xiàn)這兩個(gè)目標(biāo),ILM需要依靠能夠與其協(xié)調(diào)配合的備份系統(tǒng)。隨著信息生命周期管理解決方案的發(fā)展,業(yè)界不斷遇到一些始料未及的問題:由于存儲(chǔ)資源管理標(biāo)準(zhǔn)不統(tǒng)一,很多存儲(chǔ)系統(tǒng)在實(shí)施ILM的時(shí)候遇到了障礙。
本期選題介紹了ILM在標(biāo)準(zhǔn)化方面的一些進(jìn)展情況。并且探討了使用ILM工具來管理數(shù)據(jù)的方法和其所具有的商業(yè)價(jià)值。
無重復(fù)備份是ILM成功的關(guān)鍵
為什么需要ILM?
可靠安全的數(shù)據(jù)存儲(chǔ)對實(shí)現(xiàn)業(yè)務(wù)連續(xù)性是至關(guān)重要的。由于企業(yè)對技術(shù)流程信息的依賴,數(shù)據(jù)存儲(chǔ)在某種程度上正在成為全球高層IT管理人員和存儲(chǔ)系統(tǒng)管理員的難題。而且,金融、醫(yī)療衛(wèi)生等很多行業(yè)面對著很多新法規(guī),它們需要與不斷發(fā)展的法規(guī)保持一致,滿足這些法規(guī)對數(shù)據(jù)保留期限的要求。再加上企業(yè)存儲(chǔ)的數(shù)據(jù)量不斷增多,因此管理信息的成本每年有可能增長20%到30%?;谏鲜鲈?,經(jīng)濟(jì)的數(shù)據(jù)存儲(chǔ)系統(tǒng)和存儲(chǔ)管理對企業(yè)和IT經(jīng)理們來說變得極端重要了。
重復(fù)備份問題是怎么產(chǎn)生的?
由于媒體的宣傳,企業(yè)正在認(rèn)識(shí)到,ILM是值得投資的,而且也非常希望用這種新方法提高數(shù)據(jù)存儲(chǔ)管理效率。但是在實(shí)施ILM解決方案的時(shí)候,企業(yè)有可能忘記考慮已有備份系統(tǒng)的影響,從而無法確保無重復(fù)數(shù)據(jù)存儲(chǔ)。
一般的備份系統(tǒng)每天會(huì)將主存儲(chǔ)系統(tǒng)中的文件(關(guān)鍵狀態(tài))存儲(chǔ)到成本較低的磁盤或磁帶上。如果一個(gè)特定文件一直保持關(guān)鍵狀態(tài),那么每天對其進(jìn)行備份的過程就會(huì)一直持續(xù)下去。
ILM進(jìn)行的數(shù)據(jù)歸檔與文件備份是不同的,前者進(jìn)行歸檔時(shí),是把運(yùn)營性的、非關(guān)鍵數(shù)據(jù)轉(zhuǎn)移到長期存儲(chǔ)系統(tǒng)中,而備份則在關(guān)鍵數(shù)據(jù)歸檔前將其保護(hù)起來。
在不能與ILM解決方案協(xié)調(diào)配合的備份系統(tǒng)中,不管數(shù)據(jù)是否已經(jīng)歸檔到其他地方,系統(tǒng)都會(huì)持續(xù)在磁帶或二級磁盤上存儲(chǔ)備份文件。這樣做嚴(yán)重忽視了一個(gè)問題: 可能必須管理兩套相同的數(shù)據(jù),這必然增加成本、影響效率。
如何解決這一問題?
要消除備份系統(tǒng)這個(gè)嚴(yán)重的缺陷,一個(gè)現(xiàn)實(shí)和有效的方法是實(shí)施能與ILM解決方案協(xié)調(diào)配合的備份系統(tǒng),如分布式備份系統(tǒng)。分布式備份系統(tǒng)徹底消除了每天將關(guān)鍵數(shù)據(jù)備份到昂貴的磁帶上的需求,因此減輕了企業(yè)的存儲(chǔ)管理負(fù)擔(dān)。
分布式備份系統(tǒng)從網(wǎng)絡(luò)中的客戶機(jī)中收集數(shù)據(jù),并以壓縮和加密格式將數(shù)據(jù)發(fā)送到離站磁盤存儲(chǔ)系統(tǒng)中。當(dāng)數(shù)據(jù)需要恢復(fù)時(shí),系統(tǒng)會(huì)按要求檢索數(shù)據(jù)?;謴?fù)和檢索的過程是完全自動(dòng)進(jìn)行的,這確??焖俸投嗦穫浞荩覠o重復(fù)備份。這種備份過程效率很高,可以保證用戶獲得預(yù)期的投資回報(bào)。
這種可與ILM解決方案協(xié)調(diào)配合的分布式備份系統(tǒng),有效利用ILM方案中的指針,可在備份系統(tǒng)或二級存儲(chǔ)系統(tǒng)中只保留一份文件。備份系統(tǒng)用指針能辨認(rèn)出哪些文件已經(jīng)歸檔,從而自動(dòng)從備份磁盤中去除這些多余的文件。由于不存在重復(fù)存儲(chǔ)和浪費(fèi)存儲(chǔ)空間的問題,因此這種系統(tǒng)提高了成本效益。
在這種系統(tǒng)中,備份到磁盤上的是主存儲(chǔ)系統(tǒng)當(dāng)前的數(shù)據(jù),這最大限度地降低了對磁盤存儲(chǔ)容量的需求并降低了成本。分布式備份可更快、更經(jīng)常地進(jìn)行備份,恢復(fù)操作也更簡單,同時(shí)它還降低了硬件和存儲(chǔ)系統(tǒng)成本,減少了每天必須進(jìn)行的管理工作。
備份文件的存在狀態(tài)需要單獨(dú)看待,從產(chǎn)生到保存在不同的存儲(chǔ)介質(zhì)層上,再到備份文件被刪除,備份文件的存在狀態(tài)在不同階段是不同的。在備份文件的整個(gè)存在期中對備份數(shù)據(jù)進(jìn)行管理可以稱為備份生命周期管理(BLM),它不是只管理主數(shù)據(jù),只管理主數(shù)據(jù)叫做ILM。
ILM邁向標(biāo)準(zhǔn)化
■ SNIA ILM 技術(shù)工作組
ILM是一套策略、流程、實(shí)踐、服務(wù)和工具,用來從信息創(chuàng)建之初直到最后被處理,使信息的業(yè)務(wù)價(jià)值和最合適、最具有成本效率的基礎(chǔ)設(shè)施保持一致。但目前由于存儲(chǔ)資源管理標(biāo)準(zhǔn)的不統(tǒng)一,造成了ILM實(shí)施的困難。這一困境正期待改變。
SNIA力促ILM標(biāo)準(zhǔn)化
ILM是業(yè)務(wù)驅(qū)動(dòng)型管理實(shí)踐,使用信息價(jià)值和該信息的處理需求,為數(shù)據(jù)保存、數(shù)據(jù)保護(hù)和數(shù)據(jù)安全等服務(wù)設(shè)定策略和服務(wù)級別目標(biāo)(SLO)。
IT資源需要應(yīng)對不斷變化的業(yè)務(wù)需求。從業(yè)務(wù)需求轉(zhuǎn)變?yōu)閿?shù)據(jù)處理和數(shù)據(jù)管理需求,這勢必需要業(yè)務(wù)部門的用戶和數(shù)據(jù)中心的人員進(jìn)行合作。如何管理數(shù)據(jù)成為這種轉(zhuǎn)變的重中之重。
數(shù)據(jù)服務(wù)的管理最好作為幾項(xiàng)基礎(chǔ)服務(wù)的集合來加以提供。存儲(chǔ)、數(shù)據(jù)保護(hù)和安全等基礎(chǔ)服務(wù)密切相關(guān),以至于其中一項(xiàng)服務(wù)的提供會(huì)影響到另一項(xiàng)服務(wù)的行為,這可能有助于整個(gè)服務(wù)提供,也可能有礙于服務(wù)提供。因此,通過單一集合來提供服務(wù)讓數(shù)據(jù)中心可以為行為、可靠性及性能都能提供預(yù)測的服務(wù),提供規(guī)劃及測試配置模板。
SNIA眼中的ILM
ILM是一套策略、流程、實(shí)踐、服務(wù)和工具,從信息創(chuàng)建之初直到最后被處理,使信息的業(yè)務(wù)價(jià)值和最合適、最具有成本效率的基礎(chǔ)設(shè)施保持一致。通過與應(yīng)用、元數(shù)據(jù)和數(shù)據(jù)相關(guān)的管理策略及服務(wù)級別,使信息與業(yè)務(wù)需求保持一致。
因?yàn)镮LM的這種定義似乎涵蓋了方方面面,我們不妨把定義簡化為與SNIA及本文有關(guān)的一些方面。ILM提供了使業(yè)務(wù)需求和基礎(chǔ)設(shè)施保持一致的手段。從SNIA的角度來看,這意味著必須有一套已定義、標(biāo)準(zhǔn)化的以數(shù)據(jù)為中心的服務(wù)、服務(wù)級別目標(biāo)(SLO)及生命周期管理功能——這些功能支持以業(yè)務(wù)流程為中心的信息生命周期。同樣,必須有一套標(biāo)準(zhǔn)化的屬性,以描述異構(gòu)存儲(chǔ)配置的功能及為數(shù)據(jù)提供服務(wù)的相關(guān)數(shù)據(jù)管理功能。
SNIA在ILM方面的工作支持業(yè)務(wù)流程工作流的定義,包括文檔在整個(gè)轉(zhuǎn)換過程中的信息狀態(tài),但SNIA沒有期望定義這方面的任何標(biāo)準(zhǔn),因?yàn)檫@項(xiàng)工作對其他行業(yè)組織來說更合適。同樣,使用服務(wù)級別目標(biāo)(SLO)規(guī)定計(jì)算和網(wǎng)絡(luò)需求無疑是ILM的一部分,但SNIA也沒有期望定義相關(guān)標(biāo)準(zhǔn),這些標(biāo)準(zhǔn)最好由其他行業(yè)專家來定義。
本文側(cè)重介紹的內(nèi)容主要包括:
● 定義標(biāo)準(zhǔn)的數(shù)據(jù)服務(wù)級別目標(biāo)(SLO),備份、復(fù)制和網(wǎng)絡(luò)存儲(chǔ)等存儲(chǔ)和數(shù)據(jù)管理產(chǎn)品可實(shí)現(xiàn)這些服務(wù)級別目標(biāo)。這種服務(wù)級別目標(biāo)是一種關(guān)鍵績效指標(biāo)(KPI),用來描述數(shù)據(jù)方面的服務(wù)級別,而不是描述應(yīng)用性能方面的服務(wù)級別。正因?yàn)槿绱?,它們可?yīng)用于各種類型的數(shù)據(jù)或者應(yīng)用。
● 存儲(chǔ)和數(shù)據(jù)管理產(chǎn)品的服務(wù)聚合,這些產(chǎn)品旨在解決與法規(guī)遵從、參考數(shù)據(jù)和資源分類相關(guān)的重要客戶管理問題。
● 基于策略的ILM,以便可以在數(shù)據(jù)生命周期中對數(shù)據(jù)進(jìn)行合理分類和保存。這種管理為標(biāo)準(zhǔn)的數(shù)據(jù)分類定義做好了準(zhǔn)備,而且還允許基于應(yīng)用和內(nèi)容的分類方法可以驅(qū)動(dòng)數(shù)據(jù)分類。這種基于應(yīng)用和內(nèi)容的分類方法的定義超出了本文的討論范圍。譬如說,對數(shù)據(jù)進(jìn)行分類以確定它可能受到哪些政府法規(guī)的制約,這就是知識(shí)驅(qū)動(dòng)型活動(dòng)。如果這種活動(dòng)需要基于內(nèi)容的分類,那么這項(xiàng)標(biāo)準(zhǔn)工作將可以通過外部分類服務(wù)來實(shí)現(xiàn)。
數(shù)據(jù)服務(wù)抽象
這項(xiàng)規(guī)范引入了抽象級別,如圖1所示。這不是什么正式的架構(gòu),而是表明了功能的層次結(jié)構(gòu)。
它被分為三個(gè)抽象層,外加第四個(gè)使用層——業(yè)務(wù)和管理應(yīng)用。位于底部的是可通過存儲(chǔ)和數(shù)據(jù)管理產(chǎn)品獲得的原始功能。以存儲(chǔ)管理為例,許多這些服務(wù)自最早版本的存儲(chǔ)管理計(jì)劃規(guī)范(SMI-S)以來就有了。
在單項(xiàng)資源上面的是為數(shù)據(jù)中心而規(guī)劃的特定配置來組合這些服務(wù)。組合存儲(chǔ)集(CSS)聚合了存儲(chǔ)和服務(wù),它們代表不同配置生成同等功能的特性。這一層還允許根據(jù)站點(diǎn)特定的需求和偏好進(jìn)行定制,并且允許手動(dòng)及自動(dòng)創(chuàng)建配置。
數(shù)據(jù)服務(wù)由數(shù)據(jù)分類、生命周期管理和服務(wù)級別管理組成。它在存儲(chǔ)行為和提供數(shù)據(jù)服務(wù)級別之間提供了一種轉(zhuǎn)換。應(yīng)用正是通過這一數(shù)據(jù)服務(wù)管理接口來指定數(shù)據(jù)需求為服務(wù)級別目標(biāo)(SLO),數(shù)據(jù)管理層也正是通過這一數(shù)據(jù)服務(wù)管理接口來提供數(shù)據(jù)服務(wù)級別目標(biāo)(SLO)描述的服務(wù)。這個(gè)管理接口可用來把數(shù)據(jù)生命周期作為一組策略加以定義及管理。數(shù)據(jù)中心的管理員(IT架構(gòu)師和存儲(chǔ)管理員等)負(fù)責(zé)定義提供數(shù)據(jù)服務(wù)級別和組合存儲(chǔ)集之間的關(guān)系。實(shí)際上,這種層次結(jié)構(gòu)里面的所有關(guān)系都基于管理員手動(dòng)或者隨著技術(shù)的發(fā)展、使用自動(dòng)化程度不一的管理軟件進(jìn)行的映射。
總的來說,這種層次結(jié)構(gòu)的關(guān)鍵要素包括:
● 數(shù)據(jù)服務(wù)級別目標(biāo)(SLO)的標(biāo)準(zhǔn)定義: 這一概念為傳達(dá)作為需求或者作為已定義服務(wù)級別的服務(wù)級別目標(biāo)(SLO)屬性提供了標(biāo)準(zhǔn)框架。這樣一來,就可以獨(dú)立于滿足這些需求的功能,指定數(shù)據(jù)服務(wù)級別。隨著功能因技術(shù)的進(jìn)步或者環(huán)境的變動(dòng)而發(fā)生變化,現(xiàn)有的服務(wù)級別目標(biāo)屬性只需映射成新功能,不會(huì)帶來破壞??蛻舳藨?yīng)用使用數(shù)據(jù)服務(wù)級別目標(biāo)(SLO)來規(guī)定數(shù)據(jù)需求; 數(shù)據(jù)服務(wù)資源管理器使用數(shù)據(jù)服務(wù)級別目標(biāo)來定義數(shù)據(jù)服務(wù)級別。
● 描述數(shù)據(jù)和存儲(chǔ)服務(wù)配置的標(biāo)準(zhǔn)屬性: 這一定義專注于預(yù)期特定產(chǎn)品配置的性能和行為。負(fù)責(zé)確定這些預(yù)期的是數(shù)據(jù)中心,而不是廠商開發(fā)的工具或者文檔。尤其是,這些功能不僅僅代表單一產(chǎn)品的性能和行為,還代表組合產(chǎn)品的性能和行為——為了提供可預(yù)測的服務(wù)級別,可能需要組合產(chǎn)品的組合配置。這個(gè)配置模板提供的“功能”被稱為組合存儲(chǔ)集。
● 管理數(shù)據(jù)層的服務(wù): 提供這些服務(wù)的根本,主要包括如下功能: 配置、監(jiān)控及控制數(shù)據(jù)管理服務(wù),譬如數(shù)據(jù)備份、數(shù)據(jù)復(fù)制、數(shù)據(jù)安全和數(shù)據(jù)移動(dòng)。這包括基于特定情況及基于策略來執(zhí)行操作的功能。
● 抽象配置及管理存儲(chǔ)層的存儲(chǔ)和服務(wù): 這將通過當(dāng)前及將來版本的SMI-S加以提供。
● 數(shù)據(jù)生命周期管理策略: 這些策略允許自動(dòng)化管理與促使服務(wù)級別目標(biāo)(SLO)的變化適用于數(shù)據(jù)的事件相關(guān)的決策。
這些策略來自信息生命周期需求,并指定了數(shù)據(jù)管理層里面的信息生命周期。
● 數(shù)據(jù)分類: 這種結(jié)構(gòu)允許數(shù)據(jù)被組織成數(shù)據(jù)組以便管理,譬如服務(wù)級別管理和生命周期管理等,這可能包括自動(dòng)化管理數(shù)據(jù)分類的策略。
概念模型
數(shù)據(jù)服務(wù)資源管理器里面體現(xiàn)了數(shù)據(jù)服務(wù),圖2里面的抽象層表明了這種管理器的諸多組件。這部分定義了與每一個(gè)組件及其基礎(chǔ)服務(wù)相關(guān)的基本功能。ILM的“標(biāo)準(zhǔn)化”針對的是這些組件與服務(wù)如何銜接,以及每一個(gè)管理接口的定義。
數(shù)據(jù)放置、數(shù)據(jù)保護(hù)、數(shù)據(jù)安全、存儲(chǔ)及存儲(chǔ)服務(wù): 這是數(shù)據(jù)服務(wù)資源管理器的各種不同服務(wù)。每種服務(wù)必須為發(fā)現(xiàn)、配置和管理屬于數(shù)據(jù)中心一部分的資源及功能做好準(zhǔn)備,以便它們可以作為組合存儲(chǔ)集(CSS)的一部分使用。這些原始服務(wù)可以作為不同的管理域加以管理,也可以集成到全面管理環(huán)境。不同服務(wù)通過CSS聚合到單一服務(wù)。數(shù)據(jù)服務(wù)還可以直接利用這些基礎(chǔ)服務(wù)來提供直通式管理功能(譬如復(fù)制、刪除、使其不可改變)。
組合存儲(chǔ)集(CSS): CSS為配置及管理組合已知可以協(xié)同工作、提供可預(yù)測的服務(wù)級別的不同資源做好了準(zhǔn)備。CSS通過作為CSS配置一部分的這些資源,為定義預(yù)期的行為和性能做好了準(zhǔn)備。這表明要用專家知識(shí)把資源組合到工作配置中,并用來定義預(yù)期行為。CSS模型允許有不同的實(shí)現(xiàn)方式: 可以發(fā)現(xiàn)及記錄數(shù)據(jù)中心里面的現(xiàn)有配置、由數(shù)據(jù)中心的架構(gòu)師手動(dòng)配置CSS,還可以根據(jù)每個(gè)對象或者每筆交易,完全自動(dòng)組合動(dòng)態(tài)選擇的資源,以達(dá)到數(shù)據(jù)服務(wù)級別目標(biāo)(SLO)。
數(shù)據(jù)服務(wù): 數(shù)據(jù)服務(wù)為數(shù)據(jù)分類、數(shù)據(jù)服務(wù)級別管理及數(shù)據(jù)生命周期管理做好了準(zhǔn)備。數(shù)據(jù)服務(wù)組件為業(yè)務(wù)和管理應(yīng)用提供了面向服務(wù)的接口,業(yè)務(wù)和管理應(yīng)用使用數(shù)據(jù)服務(wù)級別目標(biāo)(SLO)作為規(guī)定服務(wù)需求的屬性。規(guī)定數(shù)據(jù)需求的服務(wù)級別目標(biāo)集合被稱為SLOG即SLO群組。這種需求通常是使用者為了確定數(shù)據(jù)在生命周期中需要哪些服務(wù)而執(zhí)行的分類流程的結(jié)果。
數(shù)據(jù)服務(wù)還可能使用SLO屬性來描述數(shù)據(jù)服務(wù)資源管理器支持的數(shù)據(jù)服務(wù)級別(ODSL)。數(shù)據(jù)服務(wù)將管理功能,以管理ODSL和CSS之間的映射。
組合存儲(chǔ)集
在為某個(gè)數(shù)據(jù)中心實(shí)現(xiàn)應(yīng)用解決方案時(shí),數(shù)據(jù)管理功能、存儲(chǔ)與用于提供該解決方案的存儲(chǔ)服務(wù)往往存在密切的依賴關(guān)系。組合存儲(chǔ)集是一個(gè)特定的集合,結(jié)合了數(shù)據(jù)管理功能、存儲(chǔ)和存儲(chǔ)服務(wù),數(shù)據(jù)中心的架構(gòu)師(即IT架構(gòu)師)在定義提供可預(yù)測的數(shù)據(jù)服務(wù)級別解決方案時(shí)要用到它們。
廠商和客戶都面臨的困境就是,不同產(chǎn)品配置的各種組合有可能會(huì)帶來同等的數(shù)據(jù)服務(wù)級別。在任何一個(gè)點(diǎn)評估吞吐量或者可用性并不能足夠準(zhǔn)確地為不同組合(有時(shí)產(chǎn)品配置截然不同)描述總體吞吐量或者可用性。
此外,數(shù)據(jù)中心管理變化無常,以至于每個(gè)數(shù)據(jù)中心各自都有特定的細(xì)微差別,這些差別與廠商、配置及評估方法有關(guān)。為解決這些問題,CSS為這項(xiàng)功能做好了準(zhǔn)備: 把數(shù)據(jù)中心的原始功能規(guī)范,定制成由數(shù)據(jù)中心管理的一系列特定配置的功能,這些配置可以在該環(huán)境提供特定的服務(wù)級別。至少,CSS是一種文檔管理方案,可供IT架構(gòu)師選擇可用技術(shù)配置,以便可與提供數(shù)據(jù)服務(wù)級別之間來回映射。
數(shù)據(jù)服務(wù)
數(shù)據(jù)服務(wù)由數(shù)據(jù)分類、生命周期管理和服務(wù)級別管理組成。
(1)數(shù)據(jù)分類
數(shù)據(jù)分類是把數(shù)據(jù)組織成數(shù)據(jù)組,以便管理。分類方案的目的在于,根據(jù)數(shù)據(jù)組對業(yè)務(wù)的價(jià)值以及處理和存儲(chǔ)需求,把服務(wù)級別目標(biāo)與數(shù)據(jù)組聯(lián)系起來。
數(shù)據(jù)分類的前身是信息分類,信息分類用于把數(shù)據(jù)組與特定的生命周期聯(lián)系起來。一般可通過數(shù)據(jù)中心、業(yè)務(wù)部門、記錄信息管理員及公司在獲取及使用信息方面的其他利益相關(guān)者相互協(xié)作來獲得信息分類方案。圖3和圖4闡述了這些概念。
(2)服務(wù)級別管理
提供數(shù)據(jù)服務(wù)級別(ODSL)發(fā)送給使用者,譬如業(yè)務(wù)和管理應(yīng)用層當(dāng)中的電子郵件或者企業(yè)內(nèi)容管理應(yīng)用,使用目前在通用信息模型(CIM)中實(shí)現(xiàn)的“功能”模型。
ODSL功能的屬性基于數(shù)據(jù)SLO的屬性,它們與分配數(shù)據(jù)服務(wù)級別目標(biāo)(SLO)需求時(shí)作為“設(shè)置”所用的一組屬性相同。數(shù)據(jù)需求的設(shè)置被稱為服務(wù)級別目標(biāo)群組即SLOG。
服務(wù)級別管理提供了創(chuàng)建及管理ODSL及其功能的功能,如圖4所示。服務(wù)級別管理還提供了這一功能: 執(zhí)行從數(shù)據(jù)的SLOG設(shè)置到ODSL、從ODSL到CSS的“最佳適合的”映射。
SLOG/ODSL和CSS的目的在于,提供兩種“準(zhǔn)獨(dú)立的”抽象: 一種是描述數(shù)據(jù)需求和服務(wù)的特點(diǎn),另一個(gè)是組織管理存儲(chǔ)系統(tǒng)功能。通過把數(shù)據(jù)與SLOG和ODSL聯(lián)系起來,可以讓需求隨著時(shí)間不斷變化,只要重新分配數(shù)據(jù)與SLOG的關(guān)系。SLOG本身保持不變(當(dāng)然,除非引入了新的目標(biāo)。)同樣,存儲(chǔ)層或者數(shù)據(jù)管理層的拓?fù)浣Y(jié)構(gòu)、技術(shù)或者特點(diǎn)發(fā)生變化,可能不會(huì)改變CSS本身,只有表明這些CSS如何物理實(shí)現(xiàn)的映射才會(huì)改變。
(3)生命周期管理
數(shù)據(jù)生命周期是一種抽象概念,通過使用SLOG和SLOG分配策略來實(shí)現(xiàn)。數(shù)據(jù)生命周期來自并支持信息生命周期。這包括并非事先規(guī)劃的特定的生命周期事件,譬如“現(xiàn)在運(yùn)用這個(gè)SLOG”。信息生命周期和數(shù)據(jù)生命周期之間的區(qū)別包括:
“信息生命周期”定義了適用于數(shù)據(jù)的業(yè)務(wù)需求和業(yè)務(wù)價(jià)值,并定義了可能會(huì)在數(shù)據(jù)生命周期改變價(jià)值和需求的事件。這些通過信息以及/或者應(yīng)用特有的關(guān)鍵績效指標(biāo)(KPI)來表達(dá)。SMI-S里面沒有信息生命周期的模型。
“數(shù)據(jù)生命周期”定義了在信息生命周期的每個(gè)階段都可以適用的數(shù)據(jù)SLOG,以及用來把數(shù)據(jù)轉(zhuǎn)換成初始或者新的SLOG和SLOG分配策略。數(shù)據(jù)生命周期支持信息生命周期,但通過專門針對數(shù)據(jù)的術(shù)語來表示。數(shù)據(jù)生命周期是一種抽象概念,通過使用數(shù)據(jù)SLOG和SLOG分配策略在SMI-S建立了模型。
圖5闡明了數(shù)據(jù)分類、服務(wù)級別管理和數(shù)據(jù)生命周期管理等概念。信息管理層的業(yè)務(wù)應(yīng)用生成數(shù)據(jù)。
進(jìn)行的“最佳適合”服務(wù)級別映射是從數(shù)據(jù)生命周期每個(gè)階段的所需SLOG映射到提供數(shù)據(jù)服務(wù)級別。如今,這通常通過業(yè)務(wù)部門的應(yīng)用管理員和IT架構(gòu)師或者存儲(chǔ)管理員之間討論或者協(xié)商進(jìn)行。另外,IT架構(gòu)師定義了從每個(gè)ODSL到一個(gè)或者若干CSS的一組有效映射,這些CSS能夠滿足ODSL里面定義的服務(wù)級別。
圖5中顯示為“策略”的SLOG分配策略用來為數(shù)據(jù)生命周期的每個(gè)階段應(yīng)用一組新的數(shù)據(jù)需求。有時(shí),應(yīng)用新的SLOG會(huì)導(dǎo)致映射成新的ODSL,有時(shí)不會(huì)。同樣,映射成新的ODSL可能會(huì)導(dǎo)致映射成新的CSS(參閱能夠支持兩個(gè)ODSL的CSS-y),也可能不會(huì)。映射成新的CSS可能會(huì)有后續(xù)行動(dòng),譬如數(shù)據(jù)移動(dòng)到新的存儲(chǔ)位置,還有可以確定是不是該刪除數(shù)據(jù)的SLOG分配策略。
鏈接:SNIA ILM技術(shù)工作組
SNIA(Storage Networking Industry Association,全球網(wǎng)絡(luò)存儲(chǔ)工業(yè)協(xié)會(huì))ILM技術(shù)工作組將開發(fā)共享數(shù)據(jù)管理及相關(guān)存儲(chǔ)管理服務(wù),這些服務(wù)散布于跨越網(wǎng)絡(luò)存儲(chǔ)的應(yīng)用。ILM技術(shù)工作組將定義流程、控制機(jī)制及工件,可把數(shù)據(jù)管理需求(保護(hù)和可用性等方面的服務(wù)級別目標(biāo)及策略)映射成數(shù)據(jù)管理服務(wù)。雖然單個(gè)應(yīng)用能夠、也可以提供部分這些服務(wù),但I(xiàn)LM技術(shù)工作組將滿足對一組公用數(shù)據(jù)和存儲(chǔ)管理服務(wù)及它們跨共享及使用網(wǎng)絡(luò)存儲(chǔ)的多個(gè)應(yīng)用進(jìn)行協(xié)調(diào)的需求。
挖掘ILM的金礦
■Howard Marks
本文分析了運(yùn)用信息生命周期管理(ILM)工具和實(shí)踐來管理數(shù)據(jù)所具有的商業(yè)價(jià)值,IT人員據(jù)此能夠制訂出統(tǒng)一的ILM方案。
如果說時(shí)間就是金錢,那么大多數(shù)數(shù)據(jù)管理員都被透支了。用戶需要查看四年前創(chuàng)建的有關(guān)銷售會(huì)議的PowerPoint文檔; 法律人員說要盡快處置商業(yè)文檔。新的法規(guī)在不斷涌現(xiàn),要求對數(shù)據(jù)保留政策進(jìn)行細(xì)微改動(dòng)。更讓人忙得暈頭轉(zhuǎn)向的是,要是上頭要求你提供與某樁官司有關(guān)的所有電子商業(yè)文檔: 電子郵件、即時(shí)通信、電子表格、Word和Excel文件,去年底生效的《聯(lián)邦民事訴訟規(guī)則》規(guī)定你只有120天的時(shí)間來完成這項(xiàng)工作。
由于時(shí)間如此緊迫,你能夠從倉庫取回所有相關(guān)的備份磁帶、把內(nèi)容恢復(fù)到新服務(wù)器、抽取相關(guān)的數(shù)據(jù)、讓律師審查一切內(nèi)容嗎?
我們認(rèn)為不能。當(dāng)然,這讓涉足數(shù)據(jù)管理領(lǐng)域的廠商們在一邊偷著樂,它們預(yù)料到新的電子發(fā)現(xiàn)規(guī)則會(huì)給IT人員帶來麻煩。據(jù)弗雷斯特研究公司聲稱,去年,記錄管理市場的產(chǎn)值高達(dá)2.8億美元。到明年,預(yù)計(jì)會(huì)增長近500%,增至驚人的13億美元。
其中許多資金可能會(huì)用于ILM應(yīng)用程序。簡而言之,ILM就是IT人員符合“物應(yīng)各有其所,亦應(yīng)各在其所”這句老話的法寶。它要求把數(shù)據(jù)存放在與價(jià)值相稱的位置,同時(shí),任何特定數(shù)據(jù)項(xiàng)的價(jià)值會(huì)隨著時(shí)間而變化; 不同的訪問方法可能適用于生命周期中不同時(shí)期的數(shù)據(jù)項(xiàng)。
辛苦的工作
目前這沒有統(tǒng)一的ILM產(chǎn)品。你可以通過以下方法來達(dá)到局部目標(biāo): 組合電子郵件歸檔工具及文件管理和數(shù)據(jù)庫歸檔工具,并且制訂全面政策來定義數(shù)據(jù)(結(jié)構(gòu)化數(shù)據(jù)、電子郵件和文件等)的商業(yè)價(jià)值,那樣就可以通過與當(dāng)前值相稱的方式來管理數(shù)據(jù)。但想正中ILM的要害,就需要現(xiàn)在根本還沒有面市的技術(shù),譬如復(fù)雜的數(shù)據(jù)分類引擎。
你可以靜觀事變嗎?除非你在數(shù)據(jù)存儲(chǔ)方面的要求極低,并處于相對缺乏監(jiān)管的行業(yè),否則恐怕不行。當(dāng)然磁盤仍很便宜,但保留方面的規(guī)則,加上文件大小增加了千倍(10年前一封WordPerfect信函只有2KB大小,而現(xiàn)在一個(gè)微軟Word文件卻有2MB大?。?,這把小公司之外的所有公司推到了再也忍受不下去的地步。
沒必要這樣。向ILM遷移并不容易,但值得為之努力: 一項(xiàng)針對用戶的調(diào)查表明,實(shí)施了ILM計(jì)劃的調(diào)查對象有四分之三簡化了主存儲(chǔ)系統(tǒng)的管理,并且減少了高端磁盤方面的開支。
著手行動(dòng)
如果你現(xiàn)在被淹沒在大量信息中,電子郵件歸檔程序等單點(diǎn)解決方案讓你有一點(diǎn)喘息的機(jī)會(huì),同時(shí)確保你能滿足法規(guī)要求。在今后兩三年內(nèi),諸多廠商會(huì)提供新一代文件管理系統(tǒng)(包括分類和遷移服務(wù)),譬如Acopia Networks、博科通訊系統(tǒng)、NeoPath Networks、Njini和EMC(集成Infoscape和Rainfinity)。
但愿這些廠商會(huì)認(rèn)識(shí)到: 占用電子郵件歸檔大部分空間的是文件系統(tǒng)中也存在的郵件附件,隨后為IT人員提供集成這些歸檔文件的辦法。我們在后面測試了一些產(chǎn)品,它們聲稱可以使用詳細(xì)、靈活的標(biāo)準(zhǔn)對非結(jié)構(gòu)化文件進(jìn)行分類、遷移文件,或者為不同的數(shù)據(jù)遷移引擎提供界面。
最后,管理結(jié)構(gòu)化數(shù)據(jù)總是不但要依賴數(shù)據(jù)庫服務(wù)器環(huán)境,還要依賴應(yīng)用程序的數(shù)據(jù)庫模式和利用率。因而,應(yīng)用感知(application-aware)的單點(diǎn)產(chǎn)品其效果遠(yuǎn)遠(yuǎn)好于任何集成的解決方案。譬如說,Princeton Softech公司的Optim和Solix Technologies公司的ArchiveJinni為PeopleSoft和Oracle財(cái)務(wù)軟件等應(yīng)用程序提供了模塊和政策。
需要付出
ILM項(xiàng)目從頭搞起需要投入大量的時(shí)間和資金。從人力角度來看,ILM首先是個(gè)政策問題。ILM工具把查找數(shù)據(jù)、遷移到相應(yīng)存儲(chǔ)設(shè)備的過程實(shí)現(xiàn)自動(dòng)化之前,企業(yè)先要制訂相應(yīng)的保留政策。
啟動(dòng)ILM項(xiàng)目是一筆財(cái)政投資。文件分類軟件往往會(huì)使企業(yè)平均花費(fèi)5萬到10萬美元。電子郵件歸檔的成本每個(gè)郵箱是10到50美元。不過有些方面的節(jié)省起到了抵消作用: 存儲(chǔ)設(shè)備越來越便宜; 通過刪除非活動(dòng)數(shù)據(jù),從而縮減備份和恢復(fù)窗口,加快電子郵件服務(wù)器和數(shù)據(jù)庫的速度; 另外還能夠在幾天內(nèi)滿足電子發(fā)現(xiàn)請求,而用不著取回磁盤,讓幾名管理員干上一個(gè)月的磁帶恢復(fù)工作。
郵件首當(dāng)其沖
美國企業(yè)界距離借助電子郵件歸檔產(chǎn)品實(shí)現(xiàn)ILM夢想最接近,譬如EMC的EmailXtender、賽門鐵克的Enterprise Vault和Zantaz的EAS,這些產(chǎn)品可以根據(jù)時(shí)間把電子郵件消息從主數(shù)據(jù)存儲(chǔ)區(qū)遷移出去。郵件消息放在輔助數(shù)據(jù)存儲(chǔ)區(qū)。在這里,用戶能夠以半透明的方式訪問它們,如果以后企業(yè)的數(shù)據(jù)保護(hù)政策需要,還可加以刪除。
盡管我們現(xiàn)在認(rèn)為電子郵件歸檔這個(gè)工具主要用來確保遵從數(shù)據(jù)保留法規(guī),并提供檢索電子郵件消息、跨多個(gè)郵箱進(jìn)行搜索用于電子發(fā)現(xiàn)的功能,但這些系統(tǒng)原先的市場定位是作為簡化電子郵件管理員工作的工具。因?yàn)槟呐率腔謴?fù)一則消息到Exchange服務(wù)器,也需要恢復(fù)整個(gè)信息存儲(chǔ)區(qū),或者以極慢的速度對多個(gè)郵箱進(jìn)行逐個(gè)備份,所以管理員有著強(qiáng)烈動(dòng)機(jī)來限制信息存儲(chǔ)區(qū)大小。
但對用戶郵箱規(guī)定限額導(dǎo)致用戶的.PST文件數(shù)量激增,隨意刪除郵件消息,而且數(shù)據(jù)管理轉(zhuǎn)到了單個(gè)用戶手里——而這是極不明智的,因?yàn)橛脩艨赡軙?huì)刪除屬于公司記錄的郵件。
大多數(shù)歸檔軟件需要Outlook或者Notes客戶軟件插件,為用戶顯示“消息已遷移”圖標(biāo),并且自動(dòng)從歸檔文件檢索消息和附件。使用Mac和Linux機(jī)器的用戶可能不具備全部功能。
理想情況下,ILM廠商會(huì)集成電子郵件和文件管理工具。因?yàn)樵S多用戶在文件服務(wù)器上創(chuàng)建文檔,然后把文件通過附件形式發(fā)送給同事,所以在文件系統(tǒng)和郵件服務(wù)器的數(shù)據(jù)存儲(chǔ)區(qū)都有同一個(gè)文件。如果使用SHA-2等抗沖突的散列算法,集成的文件/電子郵件ILM系統(tǒng)就能夠確認(rèn)這些冗余現(xiàn)象,只保留一份文件,從而節(jié)省磁盤空間。
數(shù)據(jù)庫面臨的困境
如果擁有數(shù)據(jù)庫遷移引擎,存儲(chǔ)管理員和數(shù)據(jù)庫管理員稍加努力,就可以為生產(chǎn)、測試、開發(fā)及閑置等數(shù)據(jù)庫分配相應(yīng)的存儲(chǔ)池。不過,說到隨著數(shù)據(jù)老化、價(jià)值變小而遷移出去,文件和電子郵件消息具有優(yōu)勢,因?yàn)樗鼈冊谕坏胤绞冀K有時(shí)間戳(time stamp)。
相比之下,Oracle或者SQL Server數(shù)據(jù)庫里面的行和列可能被時(shí)間分離,或者有不同的時(shí)間戳,而每個(gè)程序組織數(shù)據(jù)的方式各不相同。因而,對結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分類需要應(yīng)用程序創(chuàng)建的數(shù)據(jù)庫模式和分類引擎具有更密切的關(guān)系。
因而,一些數(shù)據(jù)庫ILM解決方案提供了面向SAP這些常見應(yīng)用程序的版本,從而簡化這個(gè)過程,譬如EMC的DatabaseXtender、惠普的數(shù)據(jù)庫參考信息管理器和Princeton的Optim。Solix同樣有應(yīng)用程序定義,提供給使用其ArchiveJinni數(shù)據(jù)庫歸檔軟件的客戶。
除了隨著數(shù)據(jù)在生命周期中老化而進(jìn)行遷移外,大多數(shù)廠商還有一個(gè)模塊作為數(shù)據(jù)庫ILM套件的一部分,生成工作數(shù)據(jù)庫的較小拷貝,用于開發(fā)及測試。這種微型數(shù)據(jù)庫可能含有一整套觸發(fā)器和存儲(chǔ)過程,一組代表性的數(shù)據(jù)可能只有主數(shù)據(jù)庫大小的十分之一,這樣編程員不必占用數(shù)TB的磁盤空間,就可以測試代碼。
Oracle的ILM助理(可從該公司的網(wǎng)站免費(fèi)下載)讓數(shù)據(jù)庫管理員可以輕松定義數(shù)據(jù)生命周期,根據(jù)生命周期來分配數(shù)據(jù)庫表。然后它會(huì)使用Oracle的表分區(qū)技術(shù),把數(shù)據(jù)從一個(gè)表空間的分區(qū)遷移到另一個(gè)表空間的分區(qū)——這另一個(gè)表空間位于成本較低的存儲(chǔ)層上。因?yàn)镺racle分區(qū)對用戶應(yīng)用來說是透明的,所以用戶覺察不到這一點(diǎn)。
HSM的軟肋
上世紀(jì)80年代末90年代初,EMC、Commvault及其他廠商試圖利用大型機(jī)領(lǐng)域所用的分級存儲(chǔ)管理(HSM)技術(shù),解決數(shù)據(jù)生命周期問題。幾家廠商竭力推銷Windows和Novell NetWare文件服務(wù)器采用三層HSM: 根據(jù)上一次修改及上一次訪問等日期屬性,把文件從標(biāo)準(zhǔn)硬驅(qū)遷移到光盤庫,再從光盤庫遷移到磁帶庫。用戶或者應(yīng)用程序訪問時(shí),遷移文件被存根文件(stub)取代,然后從近線存儲(chǔ)設(shè)備中取回。
HSM似乎是個(gè)很好的想法,連微軟也把它集成到了Windows 2000中,稱之為遠(yuǎn)程存儲(chǔ)(Remote Storage)。
盡管HSM在批處理大型機(jī)環(huán)境比較成功,但在互動(dòng)性更強(qiáng)的分布式系統(tǒng)領(lǐng)域卻一敗涂地。HSM沒有流行起來有眾多原因——其中許多問題如今仍是ILM的癥結(jié)。
HSM的最大問題是什么呢?硬驅(qū)容量在增加,而成本跌得非???,以至?xí)簳r(shí)存儲(chǔ)文件、甚至?xí)簳r(shí)存儲(chǔ)到磁盤庫上也節(jié)省不了多少資金,不值得這么做。許多企業(yè)還發(fā)現(xiàn),要對數(shù)據(jù)進(jìn)行分類,光有數(shù)據(jù)年齡這種信息還不夠。企業(yè)制訂了保留80天后遷移的政策,結(jié)果用戶卻抱怨無法打開上一個(gè)季度的季末電子表格,因?yàn)樗麄儧]有足夠耐性等待系統(tǒng)從磁帶恢復(fù)文件?,F(xiàn)在這仍是個(gè)問題。
存根文件和檢索機(jī)制也成問題。如果員工試圖使用Windows搜索或者Google Desktop,通過查找文檔文件里面的客戶姓名來查找發(fā)到某個(gè)重要客戶的一封信件,HSM系統(tǒng)就會(huì)取回所有文件,這給服務(wù)器帶來了相當(dāng)大的負(fù)擔(dān),或者因沒有及時(shí)取回文件而導(dǎo)致搜索失敗,嚴(yán)重影響了用戶體驗(yàn)和工作效率。
不過市面上有一些HSM方案,譬如CommVault的DataMigrator、EMC的Disk Extender和賽門鐵克的NetBackup Storage Migrator,它們經(jīng)常被數(shù)據(jù)管理系統(tǒng)作為遷移引擎使用,而數(shù)據(jù)管理系統(tǒng)有自己的數(shù)據(jù)分類方法。CommVault還在添加數(shù)據(jù)分類選項(xiàng),可以根據(jù)年齡和內(nèi)容來遷移文件。
鏈接:ILM實(shí)施三步走之一: 對數(shù)據(jù)分級
一旦你實(shí)施了管理政策,也準(zhǔn)備好了電子郵件和數(shù)據(jù)庫,就可以把重點(diǎn)放在生命周期上。這意味著做一條有三條腿的凳子:分級數(shù)據(jù)、數(shù)據(jù)分類(通過結(jié)合業(yè)務(wù)流程和自動(dòng)化分類引擎,對每組數(shù)據(jù)進(jìn)行評估)以及遷移引擎(把數(shù)據(jù)遷移到與當(dāng)前值相稱的位置)。
要是跟大多數(shù)IT人士說起分級存儲(chǔ),他們就會(huì)想到高性能光纖通道驅(qū)動(dòng)器用于存儲(chǔ)寶貴數(shù)據(jù)、低成本SATA驅(qū)動(dòng)器用于存儲(chǔ)價(jià)值較低的數(shù)據(jù)。這只是個(gè)開頭,但以一種與商業(yè)價(jià)值相一致的方式來存儲(chǔ)數(shù)據(jù)的關(guān)鍵根本不是從每TB成本來看選擇昂貴還是不太昂貴的存儲(chǔ)設(shè)備。要把存儲(chǔ)層看成提供不同的服務(wù)級別協(xié)議(SLA),而不只是不同的成本:主存儲(chǔ)層針對性能進(jìn)行了優(yōu)化,經(jīng)常備份以減少恢復(fù)點(diǎn)目標(biāo)(RPO);并且保持得很小,以便盡量縮短恢復(fù)時(shí)間。
我們在定義存儲(chǔ)層時(shí)還要考慮到安全。比如從投資銀行業(yè)務(wù)部門和經(jīng)紀(jì)業(yè)務(wù)部門一邊訪問的服務(wù)器需要對所有敏感數(shù)據(jù)進(jìn)行加密,還要有全面的訪問審查及控制手段。
分析在不同存儲(chǔ)層之間遷移數(shù)據(jù)帶來的成本節(jié)省時(shí),不但要考慮磁盤陣列每GB的原始成本,還要考慮存儲(chǔ)數(shù)據(jù)的全部成本,包括快照和數(shù)據(jù)恢復(fù)副本。以典型的大企業(yè)為例:關(guān)鍵的應(yīng)用程序把數(shù)據(jù)傳送到單一磁盤陣列。陣列經(jīng)配置后,可以每小時(shí)拍一次分離鏡像快照,并復(fù)制到一個(gè)或者多個(gè)數(shù)據(jù)恢復(fù)站點(diǎn);而在數(shù)據(jù)恢復(fù)站點(diǎn),又要拍快照。這種企業(yè)可能會(huì)把六個(gè)或者更多拷貝的應(yīng)用數(shù)據(jù)存放在最昂貴的第一層存儲(chǔ)設(shè)備上。
如果發(fā)現(xiàn)某部分?jǐn)?shù)據(jù)在生命周期中基本到了靜態(tài)階段,并把它遷移到只有兩個(gè)拷貝處于聯(lián)機(jī)狀態(tài)的存儲(chǔ)環(huán)境——一個(gè)在主數(shù)據(jù)中心,一個(gè)在數(shù)據(jù)恢復(fù)站點(diǎn),可以節(jié)省大量磁盤空間。
另外還要牢記:數(shù)據(jù)在生命周期中逐漸移動(dòng)時(shí),讀寫比會(huì)大大提高,所以RAID 5或者RAID 6變得更有吸引力,它們與鏡像陣列相比存儲(chǔ)容量較大、讀性能較低。
根據(jù)塊訪問頻率,把數(shù)據(jù)塊從高成本、高性能驅(qū)動(dòng)器遷移到低成本驅(qū)動(dòng)器。雖然這可能會(huì)對存儲(chǔ)數(shù)據(jù)的原始成本帶來一些影響,但它不會(huì)對備份和恢復(fù)時(shí)間帶來任何重大影響,因?yàn)檫@些功能是在卷、文件或者數(shù)據(jù)庫等級別上執(zhí)行的。
鏈接:ILM實(shí)施三步走之二: 確認(rèn)數(shù)據(jù)的價(jià)值
第二步就是知道任何一部分?jǐn)?shù)據(jù)的商業(yè)價(jià)值。大部分信息在一段時(shí)間后會(huì)失去實(shí)用價(jià)值。所以盡快刪除這些數(shù)據(jù)可消除數(shù)據(jù)泄露的可能性,并盡量減少了成本高昂的搜索工作。
不過,有些文件(譬如有關(guān)營銷資料和年度報(bào)告的歸檔)在更長的一段時(shí)間內(nèi)具有價(jià)值。永久歸檔里面的數(shù)據(jù)不需要讓用戶易于訪問,只需要在元數(shù)據(jù)方面留下一點(diǎn)線索。
確定結(jié)構(gòu)化數(shù)據(jù)的保留期限比較簡單。數(shù)據(jù)庫管理員知道每個(gè)數(shù)據(jù)庫有什么用途、如何影響貴公司業(yè)務(wù)。
確定非結(jié)構(gòu)化數(shù)據(jù)的保留期限則要難得多。電子郵件就包括發(fā)送者、接收者及內(nèi)容。從Linux的ext3到Network Appliance的WAFL,現(xiàn)代的文件系統(tǒng)保存文件創(chuàng)建、上一次修改及上一次訪問日期,同時(shí)還保存了“隱藏”、“只讀”或者“該文件離線保存”等文件屬性。
每個(gè)文件還附有安全信息,包括訪問控制列表;對大多數(shù)系統(tǒng)而言,還附有文件所有者。傳統(tǒng)的分級存儲(chǔ)管理(HSM)解決方案使用“文件上一次訪問”日期作為惟一表明價(jià)值的信息源;如果文件在一段時(shí)間后沒有被訪問,就會(huì)被遷移出去。
最終,我們會(huì)看到足夠智能化的分類引擎,能夠認(rèn)出這樣的文字處理文檔是商業(yè)信函:最上面是日期,然后跟著姓名,接下來的6行里面有另一個(gè)姓名,最下面的姓名與最上面的姓名相一致。然后它會(huì)搜索數(shù)據(jù)庫,看看目標(biāo)接收者是不是某個(gè)客戶;如果是,引擎就知道這是需要符合證券交易委員會(huì)17a-4規(guī)則或者其他法規(guī)保留要求的商業(yè)信函。
理想情況下,ILM分類引擎還會(huì)知道文件的訪問頻率。遺憾的是,使用普通的NAS和文件服務(wù)器系統(tǒng)還無法實(shí)現(xiàn)這一點(diǎn)。分類方案廠商有望開發(fā)出文件系統(tǒng)過濾器或者類似的代理,使用NetApp存儲(chǔ)設(shè)備(filer)或者EMC Celerra的反病毒掃描API來跟蹤文件訪問頻率,但這需要在每個(gè)被管理的服務(wù)器上安裝代理。
鏈接:ILM實(shí)施三步走之三: 確定適合的存儲(chǔ)位置
最后,數(shù)據(jù)的存儲(chǔ)位置必須與其價(jià)值相一致。我們還要決定數(shù)據(jù)要不要仍可以從初始位置來訪問:當(dāng)我們制訂數(shù)據(jù)遷移政策、規(guī)定“把在過去90天沒有訪問的所有Word文檔從用戶的主目錄遷移到中間歸檔文件共享區(qū)”,你該如何管理用戶訪問呢?
最簡單的情況就是單單遷移文件,然后把它們從主目錄上刪除。雖然這對IT人員和ILM廠商來說很簡單,但這會(huì)讓用戶非常惱火。我們既要遷移數(shù)據(jù),又要讓所有者可以從初始位置來訪問。帶內(nèi)NAS虛擬化設(shè)備(譬如Neopath和Acopia Networks的設(shè)備)可以把用戶訪問已遷移文件的請求重定向至新位置,具有真正的透明度,甚至?xí)@示用戶目錄下實(shí)際文件的大小。
我們還可以在初始位置留下一個(gè)指針文件(pointer file),讓用戶的計(jì)算機(jī)可以從新服務(wù)器裝入文件。但不同的操作系統(tǒng)對待鏈接和指針的方式可能有所不同。即便你的工作站全部使用Windows,通過鏈接打開遷移文件的用戶也會(huì)保存對遷移位置的更改,這會(huì)使這個(gè)位置時(shí)常變更,會(huì)干擾歸檔文件保留狀態(tài)和版本。
遷移引擎也會(huì)集成到存儲(chǔ)管理工具包的其他部分里面,移動(dòng)文件時(shí),可以更新企業(yè)搜索索引;最好與備份程序集成在一起,利用新的文件位置來更新目錄。
顯然,有許多部分需要組合起來。但另一種情況就是數(shù)據(jù)無序(data anarchy),眼看著存儲(chǔ)成本不斷耗用預(yù)算。因此,為了向監(jiān)管部門表明貴公司在誠信經(jīng)營,制訂政策非常重要。甚至一些小步驟也會(huì)讓你處于有利地位,譬如在實(shí)施電子郵件歸檔、規(guī)劃將來采購存儲(chǔ)硬件時(shí)考慮到存儲(chǔ)層。 (ccw)
- 1長沙救助站否認(rèn)毆打暗訪記者 稱其疑似精神病
- 2泛普OA軟件中資產(chǎn)送修的操作頁面是怎樣的?
- 3多地感受今冬最冷一天 專家稱,最冷時(shí)段還未到來
- 4重慶打黑至少?zèng)]收數(shù)百億資產(chǎn) 去向成謎 -2
- 5借力發(fā)力360度搜索問世
- 6八地交易所整頓過關(guān) 文交所份額化模式前景未明
- 7網(wǎng)站如何防范“上傳漏洞”入侵
- 8“云計(jì)算”正在改變網(wǎng)絡(luò)
- 9業(yè)務(wù)過程執(zhí)行的7個(gè)謬誤
- 10昆明機(jī)場萬名滯留旅客飛離 親歷者:乘客搶飛機(jī)
- 11國際油價(jià)暴漲暴跌 油價(jià)下調(diào)窗口或延至下周打開
- 12九大技巧助力管理員設(shè)置高效UTM
- 13中非叛軍威脅進(jìn)攻首都 美國宣布撤出使館人員
- 14OA系統(tǒng)為客戶打造“財(cái)務(wù)預(yù)算管理與網(wǎng)上報(bào)銷”
- 15新安全威脅下2007殺毒軟件呈現(xiàn)六大趨勢
- 16打造更安全Linux系統(tǒng)
- 17SOA與SaaS兩者將在何處相遇?
- 18計(jì)世獨(dú)家:六大技術(shù)將科幻變?yōu)楝F(xiàn)實(shí)
- 19局域網(wǎng)加快網(wǎng)速妙招
- 20客戶做自己OA系統(tǒng)的主人始終是泛普軟件的最終目標(biāo)
- 21ILM標(biāo)準(zhǔn)化與實(shí)踐
- 222007年最令人失望的九大新興技術(shù)
- 23評估NAS虛擬化實(shí)現(xiàn)效果的六個(gè)標(biāo)準(zhǔn)
- 24軟件管理的開發(fā)治理
- 25日擬發(fā)表“安倍談話” 修改歷史觀
- 26黑客是怎樣入侵攻擊企業(yè)網(wǎng)絡(luò)
- 27安倍稱將改善中日關(guān)系 在釣魚島問題上絕不退讓
- 28重慶打黑至少?zèng)]收數(shù)百億資產(chǎn) 去向成謎 -3
- 29蘭考失火孤兒所創(chuàng)辦人引爭議 官方由支持變反對
- 30開源的道路 Intel解剖開源商業(yè)模式
成都公司:成都市成華區(qū)建設(shè)南路160號(hào)1層9號(hào)
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓