當(dāng)前位置:工程項(xiàng)目OA系統(tǒng) > 泛普各地 > 江西OA系統(tǒng) > 南昌OA系統(tǒng) > 南昌OA行業(yè)資訊
企業(yè)數(shù)據(jù)倉(cāng)庫(kù)中元數(shù)據(jù)的應(yīng)用研究
申請(qǐng)免費(fèi)試用、咨詢電話:400-8352-114
文章來源:泛普軟件0 引 言
以數(shù)據(jù)倉(cāng)庫(kù)為核心的商務(wù)智能(BI)技術(shù)日益受到業(yè)界重視,許多BI系統(tǒng)己經(jīng)投入使用,帶來了巨大的效益。但是數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)質(zhì)量問題已經(jīng)嚴(yán)重影響了商務(wù)智能的應(yīng)用能力,由此引發(fā)了人們對(duì)元數(shù)據(jù)管理和應(yīng)用的研究。
元數(shù)據(jù)是“關(guān)于數(shù)據(jù)的數(shù)據(jù)”或“關(guān)于數(shù)據(jù)的結(jié)構(gòu)化數(shù)據(jù)”,即關(guān)于數(shù)據(jù)的內(nèi)容、質(zhì)量、狀況和其他特性的信息。
1 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)質(zhì)量問題
基礎(chǔ)數(shù)據(jù)的正確性、真實(shí)性直接影響到報(bào)表和分析結(jié)果的可信度。突出的數(shù)據(jù)質(zhì)量問題包括:
● 數(shù)據(jù)被錯(cuò)誤理解
● 重要的事實(shí)錯(cuò)誤傳達(dá)
● 不能判斷商業(yè)變化造成的影響
● 缺乏工具連貫性
● 缺乏查帳索引
數(shù)據(jù)質(zhì)量問題主要是由分公司本身錄入、業(yè)務(wù)系統(tǒng)新舊多次切換和升級(jí)、業(yè)務(wù)擴(kuò)展操作等原因造成。
從圖1數(shù)據(jù)質(zhì)量管理體系架構(gòu)圖我們可以看到:元數(shù)據(jù)是數(shù)據(jù)質(zhì)量管理實(shí)現(xiàn)的基礎(chǔ),元數(shù)據(jù)管理支撐功能的實(shí)施是數(shù)據(jù)質(zhì)量管理系統(tǒng)的核心。
圖1 數(shù)據(jù)質(zhì)量管理體系架構(gòu)圖
數(shù)據(jù)質(zhì)量管理系統(tǒng)的核心是元數(shù)據(jù)管理支撐功能的實(shí)施:
● 數(shù)據(jù)質(zhì)量管理包含元數(shù)據(jù)管理
● 元數(shù)據(jù)管理功能為數(shù)據(jù)質(zhì)量管理提供支撐
元數(shù)據(jù)是數(shù)據(jù)質(zhì)量管理系統(tǒng)實(shí)現(xiàn)的基礎(chǔ),是描述和控制BI系統(tǒng)中數(shù)據(jù)的數(shù)據(jù),對(duì)上層功能提供信息支撐。
2 應(yīng)用元數(shù)據(jù)提高數(shù)據(jù)質(zhì)量的應(yīng)用實(shí)例
可以提高數(shù)據(jù)質(zhì)量的主要元數(shù)據(jù)業(yè)務(wù)應(yīng)用包括:元數(shù)據(jù)瀏覽、數(shù)據(jù)時(shí)效性探察、指標(biāo)管理與分析、數(shù)據(jù)血統(tǒng)分析、影響分析、處理過程分析、表重要程度分析和表無關(guān)程度分析等。
2.1 數(shù)據(jù)血緣分析
輔助管理人員對(duì)由BI系統(tǒng)提供的報(bào)表、指標(biāo)的數(shù)據(jù)項(xiàng)進(jìn)行血緣分析,了解該指標(biāo)或報(bào)表元素由源系統(tǒng)到BI系統(tǒng),由數(shù)據(jù)倉(cāng)庫(kù)到前端顯示或者報(bào)表系統(tǒng)的計(jì)算過程和處理方法,管理人員可以通過血緣分析結(jié)合數(shù)據(jù)時(shí)效性探查來了解提供報(bào)表和指標(biāo)的可信度或?qū)PIC的相應(yīng)的指標(biāo)定義和有關(guān)規(guī)范進(jìn)行核查。
業(yè)務(wù)人員可以對(duì)由BI系統(tǒng)產(chǎn)生的某一個(gè)指標(biāo)或者報(bào)表元素進(jìn)行血源分析,即已知某一數(shù)據(jù)項(xiàng),查找到該數(shù)據(jù)項(xiàng)從源系統(tǒng)到前端展示的若干ETL過程相關(guān)的數(shù)據(jù)項(xiàng)、計(jì)算方法、計(jì)算公式,形成該報(bào)表元素(或指標(biāo))的族譜圖,從而了解產(chǎn)生該數(shù)據(jù)項(xiàng)的流程。
2.2 處理過程分析
處理過程分析與數(shù)據(jù)血緣分析類似,但處理過程分析給出的是過程的執(zhí)行相關(guān)信息,數(shù)據(jù)血緣分析給出的是數(shù)據(jù)的流動(dòng)信息。
2.2.1 影響分析
影響分析使你可以回答類似下面的一些問題:
● 我所做的這個(gè)改動(dòng)還會(huì)影響到別的什么地方?
● 這個(gè)對(duì)象還依賴于別的什么對(duì)象?
圖2展示了在金融業(yè)務(wù)BI應(yīng)用中用MetaStage進(jìn)行交叉工具對(duì)數(shù)據(jù)質(zhì)量影響的分析,我們可以清晰地通過元數(shù)據(jù)管理工具分析出—個(gè)數(shù)據(jù)對(duì)象在數(shù)據(jù)處理鏈條上的所有依賴關(guān)系。
圖2 MetaStage交叉工具影響分析示例
2.3 數(shù)據(jù)時(shí)效性探察
BI系統(tǒng)中的數(shù)據(jù)時(shí)效性是BI系統(tǒng)中數(shù)據(jù)質(zhì)量的重要的組成部分,通過對(duì)BI系統(tǒng)元數(shù)據(jù)的管理,可以分析到某一條或某一些數(shù)據(jù)的時(shí)效性。首先通過元數(shù)據(jù)瀏覽和檢索功能,檢索感興趣某個(gè)數(shù)據(jù)項(xiàng)相關(guān)的元數(shù)據(jù)信息,探察該數(shù)據(jù)最后計(jì)算的時(shí)間;然后,通過元數(shù)據(jù)ETL分析,找到該元素以及和該元素相關(guān)的計(jì)算元素的ETL過程(從生產(chǎn)系統(tǒng)到數(shù)據(jù)倉(cāng)庫(kù),再?gòu)臄?shù)據(jù)倉(cāng)庫(kù)到前端展示系統(tǒng))的最終執(zhí)行時(shí)間。對(duì)上述時(shí)間進(jìn)行探查分析,以決定該數(shù)據(jù)的時(shí)間有效性和真實(shí)性。
2.4 元數(shù)據(jù)相關(guān)性分析
在調(diào)整BI系統(tǒng)時(shí),經(jīng)常遇到調(diào)整一些系統(tǒng)而影響其他系統(tǒng)的情況。為了保證數(shù)據(jù)的一致性,需要對(duì)整個(gè)BI系統(tǒng)中的相關(guān)的元數(shù)據(jù)進(jìn)行調(diào)整。此時(shí),通過元數(shù)據(jù)相關(guān)性分析,找到所有需要進(jìn)行調(diào)整的元數(shù)據(jù),可以統(tǒng)一進(jìn)行修改和調(diào)整。
3 結(jié)束語
元數(shù)據(jù)管理是提高數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)質(zhì)量的必由之路,元數(shù)據(jù)管理的復(fù)雜性及元數(shù)據(jù)管理的很多內(nèi)容仍然需要依靠管理制度、流程、其它輔助工具以及人工參與來共同完成。
- 1違法與否 指紋識(shí)別遭遇“隱私門”
- 2彩轉(zhuǎn)黑攝像機(jī)要注意的幾點(diǎn)重要技術(shù)指標(biāo)
- 3虛擬化趨成熟 IT架構(gòu)遭沖擊
- 4虛擬化和云計(jì)算將改變數(shù)據(jù)存儲(chǔ)
- 5深度數(shù)據(jù)包檢測(cè)技術(shù) 應(yīng)用空間無限
- 6越早采用云存儲(chǔ) 成本越可控制
- 73G如何走出冷漠
- 8云計(jì)算推災(zāi)難備份市場(chǎng)格局重構(gòu)?
- 9簡(jiǎn)要分析Wi-Fi是否能承載VoIP
- 10無線局域網(wǎng)布線要注意的細(xì)則與案例
- 11別讓垃圾信息浪費(fèi)存儲(chǔ)資源
- 12虛擬化變更和配置管理ABC
- 13多業(yè)務(wù)高性能的實(shí)現(xiàn)機(jī)理剖析
- 14用好IaaS公共云計(jì)算的三個(gè)關(guān)鍵
- 15IR-Cut:紅外夜視監(jiān)控時(shí)代的真實(shí)來臨
- 16財(cái)務(wù)管理預(yù)則立,不預(yù)則廢
- 17核安全文化與信息安全的結(jié)合
- 18數(shù)據(jù)中心電力需求激增的根本原因
- 19虛擬服務(wù)器環(huán)境下 用iSCSI還是FC?
- 20ITSM價(jià)值體現(xiàn),從被動(dòng)管理走向平臺(tái)化
- 21對(duì)于金融行業(yè)OA軟件平臺(tái)的資金監(jiān)管
- 22企業(yè)辦公尊重XX食品集團(tuán)用戶日常工作習(xí)慣
- 23數(shù)據(jù)中心服務(wù)器機(jī)柜內(nèi)的信息點(diǎn)數(shù)
- 24云存儲(chǔ)繁榮發(fā)展的六大技術(shù)前提
- 25移動(dòng)支付標(biāo)準(zhǔn):統(tǒng)一不統(tǒng)一?這是個(gè)問題
- 26南昌大學(xué)第二附屬醫(yī)院醫(yī)院OA辦公系統(tǒng)上線了
- 27虛擬化、刀片、節(jié)能 跨越數(shù)據(jù)中心的三道坎
- 28開源化SOA勢(shì)必改寫IT規(guī)劃方程式
- 29直播星“進(jìn)城”
- 30家有仙居 探秘智能家居系統(tǒng)
成都公司:成都市成華區(qū)建設(shè)南路160號(hào)1層9號(hào)
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓