監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價咨詢管理系統(tǒng) | 工程設(shè)計管理系統(tǒng) | 簽約案例 | 購買價格 | 在線試用 | 手機APP | 產(chǎn)品資料
X 關(guān)閉

數(shù)據(jù)大清理

申請免費試用、咨詢電話:400-8352-114

文章來源:泛普軟件

數(shù)據(jù)分類工具提供了基于策略管理數(shù)據(jù)的功能,從而為主存儲器騰出了空間。但這些工具大多數(shù)處理的只是非結(jié)構(gòu)化數(shù)據(jù)(如電子郵件和文件服務(wù)應(yīng)用創(chuàng)建的數(shù)據(jù)),而不是數(shù)據(jù)庫記錄。

美國國家核安全局的IT經(jīng)理Matt Decker知道自己不能只通過添加昂貴的高端存儲陣列,來跟上該局數(shù)據(jù)每年增長40%的迅猛勢頭。而人工刪除回收箱和臨時文件又無法釋放足夠的存儲空間。他說: “當數(shù)據(jù)不斷增多時,你突然成了它的奴隸?!?

Decker想知道到底是哪類數(shù)據(jù)在塞滿高端磁盤,那樣就可以評估數(shù)據(jù)價值,決定怎樣把數(shù)據(jù)轉(zhuǎn)移到較便宜的存儲介質(zhì)上,或聯(lián)機方式或離線方式。

這時,總部設(shè)在加州的Arkivio公司有了用武之地。兩年前,Decker請來這家公司進行數(shù)據(jù)審查。Arkivio的發(fā)現(xiàn)結(jié)果讓他大為震驚: 存放的數(shù)據(jù)大部分是重復(fù)文件、臨時文件和電子郵件的附件,多達3.5TB。Decker說: “要是有人發(fā)給我一封郵件,我認為其中的附件沒有問題,就會保存下來,而別人收到附件后也會這么做?!?

如今,Decker使用Arkivio公司的Auto-xplor工具,就可以自動標記這些數(shù)據(jù),然后備份起來,并設(shè)置策略引擎,根據(jù)數(shù)據(jù)重要性決定如何存儲。

這種數(shù)據(jù)分類或者標記工作過去要靠人工完成。而如今許多新興供應(yīng)商出售的工具則把代理放在應(yīng)用服務(wù)器上,由它們來搜尋磁盤卷。然后,分類軟件會生成有關(guān)這些卷的報告,并把該信息放入可以搜索的數(shù)據(jù)庫當中。

譬如,數(shù)據(jù)分類軟件有“創(chuàng)建日期”和“上一次訪問日期”這樣的字段,就可以根據(jù)關(guān)鍵字進行搜索。隨后,管理員就可以制訂策略,確定數(shù)據(jù)一旦分類完畢,應(yīng)存放在何處。

許多公司很早就向市場推出了能夠跨多種應(yīng)用(如電子郵件和文件服務(wù)器)對數(shù)據(jù)進行分類及存儲的軟件,譬如Arkivio、倫敦的Njini公司、加州的Kazeon系統(tǒng)公司以及StoredIQ公司。

Gartner公司的分析師Carolyn Dicenzo說,電子郵件最占用主存儲陣列上的空間。其次是文本文件。而保存這些數(shù)據(jù)風(fēng)險很高: 如果保存時間超過必要期限,就很難理清大量電子郵件的頭緒,以便合法取證,還會讓公司面臨訴訟。

迄今為止,數(shù)據(jù)分類技術(shù)廠商幾乎全都提供用于處理非結(jié)構(gòu)化數(shù)據(jù)(如電子郵件和文本文件)的產(chǎn)品。數(shù)據(jù)庫里面的結(jié)構(gòu)化數(shù)據(jù)用不著加以分類,不過越來越需要為這部分數(shù)據(jù)編制索引,以便它們也能夠加以搜索。企業(yè)戰(zhàn)略集團公司的分析師Steve Duplessie說,目前惟一在處理結(jié)構(gòu)化數(shù)據(jù)索引編制的一家公司是開發(fā)Greenwich軟件的英格蘭公司: CopperEye。

一切為了遵從法規(guī)

美國伊利諾斯州年產(chǎn)值57億美元的技術(shù)分銷商CDW公司預(yù)計,自己用于實施數(shù)據(jù)分類及分層存儲架構(gòu)所需的軟硬件上的開支將超過100萬美元。目的是為了更好地管理多達250TB的數(shù)據(jù),而大部分放在主存儲器上。

CDW的IT業(yè)務(wù)部門高級主管K.C. Tomsheck說: “對《財富》500強公司而言,法規(guī)遵從問題在過去一年事關(guān)重大。這讓我們把注意力轉(zhuǎn)向了記錄管理和信息生命周期管理?!?

于是Tomsheck在6月份開始實施數(shù)據(jù)分類項目。在第一個階段,他的法律事務(wù)部門對于如何對待不同類型的數(shù)據(jù)制訂了相應(yīng)策略。在第二個階段,項目管理辦公室對數(shù)據(jù)進行了分類。而在最后一個階段,網(wǎng)絡(luò)技術(shù)小組將確認由哪項技術(shù)來支持分層存儲架構(gòu)。

Tomsheck說,公司的主數(shù)據(jù)中心和備用數(shù)據(jù)中心都集中放在芝加哥,這為他的數(shù)據(jù)分類工作提供了極大幫助。他說: “數(shù)據(jù)庫、電子郵件、文件共享文檔,包括非結(jié)構(gòu)化數(shù)據(jù),它們都放在兩個地方的存儲設(shè)備上。我們的數(shù)據(jù)放在一個主存儲站點,然后可從該站點評估數(shù)據(jù),這很有幫助。”

該公司購買了EMC公司的12個網(wǎng)絡(luò)附加存儲(NAS)陣列,包括Centera內(nèi)容尋址存儲陣列。如果一切按計劃發(fā)展,大約150TB的數(shù)據(jù)將從主存儲陣列遷移到輔助的NAS陣列上。Tomsheck說: “我們把這看成是‘現(xiàn)在獲得回報還是以后獲得回報’的問題。”他希望能在三四年內(nèi)獲得投資回報。

Duplessie強調(diào),數(shù)據(jù)分類的成本通常不是來自技術(shù)本身,而是來自確定如何對數(shù)據(jù)進行分類所用的時間。

作為其戰(zhàn)略的一部分,Decker購買了EMC公司的Centera內(nèi)容尋址存儲器陣列,以便對電子郵件和文件進行聯(lián)機歸檔,那樣最終用戶仍能夠訪問數(shù)據(jù)。 (CCW)

發(fā)布:2007-04-22 10:02    編輯:泛普軟件 · xiaona    [打印此頁]    [關(guān)閉]
相關(guān)文章:
南昌OA系統(tǒng)
聯(lián)系方式

成都公司:成都市成華區(qū)建設(shè)南路160號1層9號

重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓

咨詢:400-8352-114

加微信,免費獲取試用系統(tǒng)

QQ在線咨詢

泛普南昌OA信息化其他應(yīng)用

南昌OA軟件 南昌OA新聞動態(tài) 南昌OA信息化 南昌OA快博 南昌OA行業(yè)資訊 南昌軟件開發(fā)公司 南昌門禁系統(tǒng) 南昌物業(yè)管理軟件 南昌倉庫管理軟件 南昌餐飲管理軟件 南昌網(wǎng)站建設(shè)公司