監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價咨詢管理系統(tǒng) | 工程設(shè)計管理系統(tǒng) | 甲方項目管理系統(tǒng) | 簽約案例 | 客戶案例 | 在線試用
X 關(guān)閉

歸檔不同于備份

申請免費試用、咨詢電話:400-8352-114

周濤

目前,較普遍的歸檔應(yīng)用只是簡單地把備份數(shù)據(jù)保存很長時間,每周或每月不加選擇地進行全數(shù)據(jù)備份,再根據(jù)商業(yè)要求保存幾年甚至幾十年。但是,歸檔與備份有本質(zhì)的不同,因為歸檔的數(shù)據(jù)可能幾個月甚至幾年未被使用,而一旦需要時則必須盡快獲取。在備份數(shù)據(jù)中尋找特定的信息不僅耗時,而且代價很高。將備份當(dāng)作歸檔會帶來許多問題。

備份系統(tǒng)用于歸檔的困境

首先,當(dāng)用戶需要查找?guī)啄昵暗囊恍┫嚓P(guān)資料時,就必須記住這些文件存放在什么地方。這不是一件容易的事,即使用戶能記住,由于計算機平臺和軟件的日新月異,要找到當(dāng)年的讀取設(shè)備、操作系統(tǒng)和應(yīng)用程序,甚至還需要訪問權(quán)限去打開這些文件是相當(dāng)費力的。

其次,用備份數(shù)據(jù)來滿足電子發(fā)現(xiàn)的要求就更加困難。例如,公司要獲取某個員工在3年前某兩個月內(nèi)從Exchange服務(wù)器上發(fā)出的所有電子郵件,或許可以花很長時間從備份系統(tǒng)中恢復(fù)特定時間內(nèi)在Exchange服務(wù)器上保存過的電子郵件,但如果接收者在收到該員工電子郵件的同一天把它刪除了,那么被刪除的電子郵件就沒能在當(dāng)晚的備份作業(yè)中保存。因此,嚴(yán)格說來,即使找到了所有已備份的電子郵件,也不能符合電子發(fā)現(xiàn)的特定要求。

第三,恢復(fù)備份數(shù)據(jù)并進行查找會消耗大量時間和費用。試想一下,如果要把過去10年中滿足某些條件的Exchange服務(wù)器上的電子郵件找出來,而公司每星期做一次備份,那么該公司的IT管理員就必須把每個恢復(fù)到Exchange服務(wù)器中的滿足條件的電子郵件存入一個.pst文件,這樣的手工作業(yè)至少要重復(fù)500多次。

此外,備份系統(tǒng)用于保存歸檔數(shù)據(jù)是相當(dāng)?shù)托У?。一個歸檔系統(tǒng)對每個文件通常保存1~2份拷貝就足夠了,而備份系統(tǒng)卻沒有這樣的邏輯,特別是全備份系統(tǒng),每次備份總是把未刪除的舊數(shù)據(jù)又保存一次,浪費了很多存儲空間。隨著備份格式和磁帶介質(zhì)更新?lián)Q代,許多企業(yè)耗費了相當(dāng)大的精力進行設(shè)備升級和數(shù)據(jù)拷貝、遷移以及各種轉(zhuǎn)換,同時又保留舊的備份格式和舊磁帶上的數(shù)據(jù),導(dǎo)致不同格式數(shù)據(jù)的許多副本分散在不同的設(shè)備和介質(zhì)中,對這些數(shù)據(jù)進行有效管理和查詢幾乎不可能。

有效歸檔系統(tǒng)的特征

一個有效的歸檔系統(tǒng)最重要的特征是包含了足夠多的元數(shù)據(jù),并能通過邏輯方式獲取信息。例如,一個電子郵件歸檔系統(tǒng)的元數(shù)據(jù)應(yīng)至少包括發(fā)件人、收件人、主題、時間等信息,通常還會把電子郵件主體放入數(shù)據(jù)庫用于全文搜索,甚至把附件的相關(guān)信息和關(guān)鍵詞也提取出來作為元數(shù)據(jù)保存。

歸檔系統(tǒng)的另一個重要特征是能夠保存預(yù)定數(shù)量的副本。例如,一個公司可以決定把一份歸檔數(shù)據(jù)存放在磁盤介質(zhì)的存儲設(shè)備中,把另一份相同的數(shù)據(jù)存放在光盤或磁帶庫里,以確保數(shù)據(jù)萬無一失。

兩類主要的歸檔系統(tǒng)

根據(jù)保存數(shù)據(jù)方式的不同,歸檔系統(tǒng)大致可分為兩類。

一類是傳統(tǒng)的依附于備份軟件的歸檔系統(tǒng),允許用戶對所選擇的文件進行歸檔,并把有限的元數(shù)據(jù)附加上去,然后把這些歸檔數(shù)據(jù)的備份文件刪除,以減少重復(fù)數(shù)據(jù)。這種歸檔的缺陷在于,如果用戶想通過不同的元數(shù)據(jù)查找歸檔信息,就必須建立幾個附加不同元數(shù)據(jù)的歸檔文件。因此,這類系統(tǒng)基本上只適用于訪問率較低的歸檔數(shù)據(jù)。

第二類歸檔系統(tǒng)意識到任何歸檔數(shù)據(jù)可能有不同的用途,因此需要用不同的元數(shù)據(jù)來描述。實現(xiàn)這類系統(tǒng)的關(guān)鍵在于對實際的歸檔數(shù)據(jù)只保存一份,而把所有的元數(shù)據(jù)都保存在可搜索的數(shù)據(jù)庫中。這就是近年來逐漸興起的內(nèi)容尋址存儲(CAS)。與第一類只在備份后才成為歸檔數(shù)據(jù)的歸檔系統(tǒng)不同,CAS歸檔系統(tǒng)對所有的數(shù)據(jù)都自動不間斷地進行歸檔。一個文件或電子郵件一經(jīng)產(chǎn)生,其中一個拷貝以及相關(guān)的元數(shù)據(jù)就被保存到歸檔系統(tǒng)中去。

CAS歸檔的另一個優(yōu)勢在于,使用了單一實例和增量保存的手段。它對所有的文件或電子郵件都只保存一個拷貝,當(dāng)該文件或電子郵件被修改后再次發(fā)送和保存時,歸檔系統(tǒng)能夠只保存變化的字節(jié),因而極大地節(jié)省了磁盤空間,簡化了管理。這種特性使CAS歸檔系統(tǒng)頻繁地出現(xiàn)在分級存儲管理和重復(fù)數(shù)據(jù)刪除應(yīng)用中。

CAS歸檔系統(tǒng)

國外主要的存儲廠商如EMC和HP,以及一些初創(chuàng)企業(yè)如Bycast和Permabit等都相繼推出了CAS歸檔產(chǎn)品。這些產(chǎn)品雖然技術(shù)路線相近,但各自的特點和針對的應(yīng)用不盡相同。比如,HP RISS系統(tǒng)主要用于電子出件歸檔,而Bycast的方案局限于醫(yī)療影像的歸檔。國內(nèi)歸檔市場才剛剛起步,也出現(xiàn)了一些歸檔產(chǎn)品。谷數(shù)科技的D-Mesh集群CAS系統(tǒng)可以滿足多種歸檔的應(yīng)用需求,其最顯著的特點是內(nèi)嵌了非結(jié)構(gòu)化搜索引擎,極大地提高了元數(shù)據(jù)生成、管理和數(shù)據(jù)查找的效率,把歸檔技術(shù)推向一個新的高度。

來源:CIO時代

發(fā)布:2007-03-25 10:59    編輯:泛普軟件 · xiaona    [打印此頁]    [關(guān)閉]
相關(guān)文章:
南昌OA系統(tǒng)
聯(lián)系方式

成都公司:成都市成華區(qū)建設(shè)南路160號1層9號

重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓

咨詢:400-8352-114

加微信,免費獲取試用系統(tǒng)

QQ在線咨詢