監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價(jià)咨詢管理系統(tǒng) | 工程設(shè)計(jì)管理系統(tǒng) | 甲方項(xiàng)目管理系統(tǒng) | 簽約案例 | 客戶案例 | 在線試用
X 關(guān)閉

數(shù)據(jù)挖掘應(yīng)用現(xiàn)狀與產(chǎn)品分析

申請免費(fèi)試用、咨詢電話:400-8352-114

AMTeam.org

數(shù)據(jù)挖掘應(yīng)用現(xiàn)狀與產(chǎn)品分析   

高    敏  

 (新龍科技實(shí)業(yè)有限公司商業(yè)智能部  廣州  510180)   

摘要:數(shù)據(jù)挖掘技術(shù)的研究,極大地推動(dòng)了相關(guān)行業(yè)的發(fā)展。目前,有關(guān)的學(xué)術(shù)討論異常熱烈。而在產(chǎn)業(yè)界,也已經(jīng)有部分比較成熟的產(chǎn)品問世。本文結(jié)合自己從事數(shù)據(jù)倉庫的實(shí)際經(jīng)驗(yàn),分析了數(shù)據(jù)挖掘的應(yīng)用現(xiàn)狀,對其產(chǎn)品的主要特性進(jìn)行了研究和評價(jià),以期望為從事數(shù)據(jù)挖掘研究、開發(fā)、系統(tǒng)集成的有關(guān)人員提供有益的參考。   

關(guān)鍵詞:數(shù)據(jù)挖掘  知識(shí)發(fā)現(xiàn)  商業(yè)智能  客戶關(guān)系管理

1 前言   

數(shù)據(jù)庫中的知識(shí)發(fā)現(xiàn)(KDD:Knowledge Discoveryin Database)一詞首次出現(xiàn)在1989年8月舉行的第U屆國際聯(lián)合人工智能學(xué)術(shù)會(huì)議上。從1989年至今,KDD的定義隨著人們研究的不斷深入也在不斷地完善,目前比較公認(rèn)的定義是Fayyad等給出的:KDD是從數(shù)據(jù)集中識(shí)別出有效的、新穎的、潛在的、有用的以及最終可理解模式的高級(jí)處理過程LI J。KDD的過程一般包括數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)選擇、數(shù)據(jù)變換、數(shù)據(jù)挖掘、模式評估、知識(shí)表示。23。其中,數(shù)據(jù)挖掘(DM:Data Mining)是KDD中的一個(gè)很重要的步驟,但在通常的應(yīng)用中,并不區(qū)分二者的概念。   

數(shù)據(jù)挖掘的任務(wù)是從數(shù)據(jù)集中發(fā)現(xiàn)模式,模式可以有很多種,按功能可分為兩大類:預(yù)測型(Predictive)模式和描述型(Descriptive)模式。在實(shí)際應(yīng)用中,往往根據(jù)模式的實(shí)際作用細(xì)分為以下幾種:分類,聚類,回歸,序列,時(shí)間序列等。數(shù)據(jù)控掘的所處理的數(shù)據(jù)類型也很豐富,包括文本數(shù)據(jù),關(guān)系數(shù)據(jù)庫,Web頁面等。數(shù)據(jù)挖掘的應(yīng)用領(lǐng)域非常廣泛,比如金融(風(fēng)險(xiǎn)預(yù)測)、零售(顧客行為分析)、體育、電信、氣象、電子商務(wù)等等。   

數(shù)據(jù)挖掘的研究幾乎和它的應(yīng)用同步進(jìn)行。早在20世紀(jì)80年代初期,就有一些簡單的工具問世。數(shù)據(jù)挖掘工具可以分為兩類:通用挖掘工具和特定領(lǐng)域的挖掘工具。通用的數(shù)據(jù)挖掘工具不區(qū)分具體數(shù)據(jù)的含義,采用通用的挖掘算法,處理常見的數(shù)據(jù)類型。而專用挖掘工具則是針對某個(gè)特定領(lǐng)域的問題提供解決方案。在設(shè)計(jì)算法的時(shí)候,往往會(huì)充分考慮到數(shù)據(jù)、需求的特殊性,并作了優(yōu)化[3]。

2  通用挖掘產(chǎn)品

2.1  IBM DB2 InteIligent Miner   

Intelligent Miner采用了多種統(tǒng)計(jì)方法和挖掘算法,主要有單變量曲線,雙變量統(tǒng)計(jì),線性回歸,因子分析,主要量分析,分類,分群,關(guān)聯(lián),相似序列,序列模式,預(yù)測等。   

它能處理的數(shù)據(jù)類型有結(jié)構(gòu)化數(shù)據(jù)(如:數(shù)據(jù)庫表,數(shù)據(jù)庫視圖,平面文件)和半結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù)(如:顧客信件,在線服務(wù),傳真,電子郵件,網(wǎng)頁等)。   

Intelligent Miner通過其獨(dú)有的世界領(lǐng)先技術(shù),例如自動(dòng)生成典型數(shù)據(jù)集、發(fā)現(xiàn)關(guān)聯(lián)、發(fā)現(xiàn)序列規(guī)律、概念性分類和可視化呈現(xiàn),可以自動(dòng)實(shí)現(xiàn)數(shù)據(jù)選擇、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)挖掘和結(jié)果呈現(xiàn)這一整套數(shù)據(jù)挖掘操作。若有必要,對結(jié)果數(shù)據(jù)集還可以重復(fù)這一過程,直至得到滿意結(jié)果為止。根據(jù)ID(:的統(tǒng)計(jì),Intelligent Miner目前是數(shù)據(jù)挖掘領(lǐng)域最先進(jìn)的產(chǎn)品。它采取客戶/5匠務(wù)器(C/S)架溝,并且它的AH提供了C十十類和方法[4]。   

Intelligent Miner可用于行銷、財(cái)務(wù)、產(chǎn)品管理和客戶聯(lián)系管理領(lǐng)域的數(shù)據(jù)分析人員和業(yè)務(wù)技術(shù)人員。C心bank是美國名列第二的銀行,是首先采用IBM業(yè)務(wù)智能系統(tǒng)的大型企業(yè)之一。

The Bank of Montreal也是成功運(yùn)用IBM DB2Intelligent Miner的案例之一。    IBM DB2Intelligent Minerfor Data Version 6提供了一套分析數(shù)據(jù)庫的挖掘過程、統(tǒng)計(jì)函數(shù)和查看、解釋挖掘結(jié)果的可視化工具。它可以從企業(yè)數(shù)據(jù)集中驗(yàn)證并析取高價(jià)值的商業(yè)知識(shí),包括大量交易數(shù)據(jù)的銷售點(diǎn),ATM(Automatic Teller Machine),信用卡,呼叫中心,或電子商務(wù)應(yīng)用。分析家和商業(yè)技術(shù)專家能夠發(fā)現(xiàn)那些隱藏的、用其他類型的分析工具無法洞察的模式。Intelligent Miner提供了基本的技術(shù)和工具來支持挖掘過程,同時(shí)還提供了應(yīng)用服務(wù)支持定制應(yīng)用的發(fā)展。

2.2  DBMiner   

DBMiner是一個(gè)通用的聯(lián)機(jī)分析挖掘(OLAM:()nLine Analysis Mining)系統(tǒng),用于在大型關(guān)系數(shù)據(jù)庫和數(shù)據(jù)倉庫中交互地挖掘多層次的知識(shí)。其獨(dú)特之處在于緊密集成了聯(lián)機(jī)分析處理(OLAP:OnLine Analysis Processing)和多種數(shù)據(jù)挖掘功能,包括特征化、關(guān)聯(lián)、分類、預(yù)測和聚類等r22。DBMiner目前最新版本是3.o,其優(yōu)點(diǎn)為①對關(guān)系數(shù)據(jù),多維數(shù)據(jù)的強(qiáng)大的在線分析挖掘功能。②通過OLEDB和RDBMS可以連接到多種數(shù)據(jù)源。②關(guān)聯(lián)和時(shí)序算法對挖掘大數(shù)據(jù)集上頻繁的、連續(xù)的模式,相關(guān)性、依賴分析性能卓越。④對數(shù)據(jù)源、挖掘任務(wù)、挖掘應(yīng)用的多重集成。⑤革新的傾斜的多維利潤分析技術(shù)。⑧支持Microsoft SQL Server,Analysis入rver and Excel,如OLAP,數(shù)據(jù)聚集,透視表的充分集成。⑦用戶自定義參數(shù)和可視化分類,能幫助用戶更好的發(fā)現(xiàn)知識(shí)。⑧分析關(guān)系數(shù)據(jù)和多維數(shù)據(jù),分散的地圖式的觀察界面。⑨發(fā)現(xiàn)驅(qū)動(dòng)的oLAP探測器,更容易的導(dǎo)航。

2.3  SAS系列產(chǎn)品   

SAS/STAT(Statistics)提供統(tǒng)計(jì)分析功能。   

SAS/ETS(Econometric乙Time Series)為SAS提供具有豐富的計(jì)量經(jīng)濟(jì)學(xué)和時(shí)間序列分析方法的產(chǎn)品,包含方便的各種模型設(shè)定手段,多樣的參數(shù)估計(jì)方法,是研究復(fù)雜系統(tǒng)和進(jìn)行預(yù)測的有利工具。   

SAS/INSIGHT是一個(gè)功能強(qiáng)大的可視化的數(shù)據(jù)探索與分析的工具。  

SAS/EM(Enterprise Miner)是一個(gè)圖形化界面,菜單驅(qū)動(dòng)的、拖拉式操作的、對用戶非常友好且功能強(qiáng)大的數(shù)據(jù)挖掘集成環(huán)境。其中集成了:數(shù)據(jù)獲取工具,數(shù)據(jù)抽樣工具,數(shù)據(jù)篩選工具,數(shù)據(jù)變量轉(zhuǎn)換工具,數(shù)據(jù)挖掘數(shù)據(jù)庫,數(shù)據(jù)挖掘過程,多種形式的回歸工具,為建立決策樹的數(shù)據(jù)剖分工具,決策樹瀏覽工具,人工神經(jīng)元網(wǎng)絡(luò),數(shù)據(jù)挖掘的評價(jià)工具等。   

American Healthways領(lǐng)導(dǎo)了健康護(hù)理的一場革命。SAS/EM為判斷高危病人提供了一個(gè)健壯的數(shù)據(jù)挖掘和建模解決方案,使得他們可以為病人提供周到的護(hù)理和服務(wù)。   

AxA Financial使用SAS/EM來幫助他們建立利潤較高的顧客關(guān)系策略。

2.4  SPSS系列產(chǎn)品   

C1ementine是SPSS的核心挖掘產(chǎn)品,它提供廠一個(gè)可視比的快速建立模型的環(huán)境,被譽(yù)為第一數(shù)據(jù)挖掘:工具。使用它,企業(yè)可以將數(shù)據(jù)分析和建模技術(shù)與待定的商業(yè)問題結(jié)合起來,找出其他傳統(tǒng)數(shù)據(jù)挖掘工具可能找不出的答案。組成部分包括數(shù)據(jù)獲取、探查、整理、建橫和報(bào)告一——都使用一些有效、易用的按鈕表示,用戶只需用鼠標(biāo)將這些組件連接起來建立一個(gè)“數(shù)據(jù)流”,可視化的界面使得數(shù)據(jù)挖掘更加直觀和具有交互性,從而j2T以將用戶的商業(yè)知識(shí)在每一步中更好的利用。 C1ementine所使用的分析技術(shù)包括神經(jīng)元網(wǎng)絡(luò)、關(guān)聯(lián)規(guī)則和規(guī)則歸納技術(shù)。Clementine支持顧客剖析、時(shí)序分析、市場售貨籃分析和欺詐行為偵測。   

SPSS的另一種重要的控掘產(chǎn)品Answer丁ree可以幫助用戶確認(rèn)細(xì)分市場及其模式,建立顧客檔案資料,挖掘隱藏市場趨勢。應(yīng)答樹運(yùn)用的分析運(yùn)貿(mào):法則:兩類CHAID、分類和回歸樹、QUES丁。   

DecisionTime 2.0及WhotIF?  2.0幫助用戶建立準(zhǔn)確的預(yù)測,并利用此預(yù)測制定計(jì)劃。

2.5  COGNOS的Scenario,4Thought   

挖掘算法:多層感知機(jī)(MLP:Multi-Layer Processing)神經(jīng)元網(wǎng)絡(luò)技術(shù)(4 Thought)和基于CHAID的決策樹算法(Scenario)。   

Scenario和4Thought都護(hù)展了Cognos的決策支持能力并提供了一些數(shù)據(jù)挖掘功能,辦公布的用戶基準(zhǔn)中,Scenario表現(xiàn)出良好的結(jié)果和對用戶友好的界面,而4Thought在性能和準(zhǔn)確率方面具有較好的表現(xiàn)[4]。

2.6  BO的Business Miner  

1996年12月,美國Business()bjects公司推出了數(shù)據(jù)挖掘解決方案一——Busincs s Mincr。Business Miner采用了基于直覺決定的樹型技術(shù),提供了簡單易懂的數(shù)據(jù)組織形式,使用圖形化方式描述數(shù)據(jù)關(guān)系,通過百分比和流程表等簡單易用的用戶界面告訴用戶有關(guān)的數(shù)據(jù)信息。   

Business Miner能對從數(shù)據(jù)倉庫中傳來的數(shù)據(jù)自動(dòng)地進(jìn)行挖掘分析〕:作,剖析任意層面數(shù)據(jù)的內(nèi)在聯(lián)系,最終確定商業(yè)發(fā)展趨勢和規(guī)律。

3  專用挖掘產(chǎn)品   

由于實(shí)際的應(yīng)用環(huán)境干變?nèi)f化,目前還沒有一種通用產(chǎn)品能適應(yīng)各種商業(yè)需求,而大量存在的是各種各樣的專用數(shù)據(jù)挖掘產(chǎn)品。在專用領(lǐng)域中,種類最多的要數(shù)各種Web挖掘產(chǎn)品。

3.1  ACCRUE INsight5   

ACCRUE Insight 5是AccNe公司的主要產(chǎn)品,它是一個(gè)綜合性的Web分析工具。它能夠?qū)W(wǎng)站的運(yùn)行狀況有個(gè)深入、細(xì)致和準(zhǔn)確的分析。它的設(shè)計(jì)是以顧客為中心的,通過分析顧客的行為模式,幫助網(wǎng)站采取措施來提高顧客的忠誠度,從而建立長期的顧客關(guān)系。ACCRUE Insight 5利用了多種Web數(shù)據(jù)收集方法,包括高級(jí)網(wǎng)絡(luò)收集器,服務(wù)器收集器和服務(wù)器日志,而不是像很多網(wǎng)站那樣僅僅分析日志文件。高級(jí)網(wǎng)絡(luò)收集器以其能收集到最大量的數(shù)據(jù)而著稱,它能夠收集到服務(wù)器日志里所得不到的信息,例如按下“停止”鍵,下載的時(shí)間等一些對于網(wǎng)站分析有用的信息。但是對于加密的部分或者與它不適用部分則用到另外兩種方法。根據(jù)原始數(shù)據(jù),Accrue Insight 5運(yùn)用了一種叫做“服務(wù)器收集器”的分析方法,它支持鏡像服務(wù)器和負(fù)載平衡、路由器和一些其他網(wǎng)絡(luò)結(jié)構(gòu)設(shè)備,能夠?qū)⒁恍┘用艿牡刂忿D(zhuǎn)化為可分析的形式。

3.2  E.PIPHANY Enterprise Insight

E.PIPHANY Enterprise lnsight提供了一個(gè)獨(dú)特的、完全集成的系統(tǒng),為管理人員、分析人員還有其他商業(yè)人員傳遞商業(yè)信息。Enterprise lnsight應(yīng)用套件使用了一個(gè)通用的元數(shù)據(jù)層,定義了所有的數(shù)據(jù)源,分析性能,信息傳送應(yīng)用?;赪eb的結(jié)構(gòu)使得系統(tǒng)易于配置,易于使用,易于維護(hù)。它即可以作為一個(gè)獨(dú)立的應(yīng)用軟件使用,也可以作為E.PIPHANY’s E.5系統(tǒng)在市場、銷售、服務(wù)領(lǐng)域的解決方案套件。和所有的E.ANY產(chǎn)品一樣,Enterprise lnsight呈現(xiàn)了一個(gè)廣泛的、一致的消費(fèi)者的視圖、一個(gè)強(qiáng)有力的觀察,可以使企業(yè)的組織從市場、銷售、服務(wù)等工作中得到最大的利潤。企業(yè)上下的用戶都可以得到深入的商業(yè)信息,并且可以立即付諸行動(dòng)。有了Enterpriselnsight,企業(yè)可以和顧客、合作伙伴建立更穩(wěn)固的關(guān)系 。

 E.PIPHANY能提供在電子商務(wù)中極具競爭價(jià)值的顧客信息。Enterprise lnsight for ECommerce提供了分析顧客數(shù)據(jù)的能力,包括來至網(wǎng)絡(luò)的數(shù)據(jù)和傳統(tǒng)的數(shù)據(jù)源。它可以讓企業(yè)針對所有的顧客數(shù)據(jù)源,跟蹤他們的網(wǎng)絡(luò)行為和引導(dǎo)他們的Web活動(dòng)。   

Enterprise lnsight for E—Commerce包括“廠一系列預(yù)包裝的、易用的報(bào)表模板,對Web活動(dòng)進(jìn)行復(fù)雜的分析。根據(jù)領(lǐng)域?qū)<业囊庖?,E.岡PHANY已經(jīng)驗(yàn)證了相當(dāng)多的一系列的關(guān)鍵的電子商務(wù)的屬性和指標(biāo),并且已經(jīng)建立了大范圍的一個(gè)報(bào)告套裝。它通過提供關(guān)鍵領(lǐng)域的深入分析,比如站點(diǎn)活動(dòng),顧客喜好,在線銷售,錯(cuò)誤報(bào)告,標(biāo)語廣告活動(dòng)等,回答關(guān)鍵的電子商務(wù)的問題。

3.3  BIJUE MARTINI   

BLUE MARTINI的數(shù)據(jù)挖掘模塊提供了強(qiáng)大的分析能力,幫助理解顧客,并且發(fā)現(xiàn)隱藏在巨量數(shù)據(jù)后面的寶石。挖掘能揭示微妙的行為模式,而這些模式能產(chǎn)生知識(shí),驅(qū)動(dòng)所有客戶接觸點(diǎn)的個(gè)性化過程。一個(gè)在分析和銷售中的封閉循環(huán)保證了知識(shí)能產(chǎn)生生產(chǎn)性的、產(chǎn)生利潤的和具有競爭優(yōu)勢的機(jī)制。

3.4  其他挖掘   

例如AdVanced ScoutTM是和IBM合作完成的數(shù)據(jù)挖掘的商業(yè)應(yīng)用。它的目的是幫助NBA教練運(yùn)用商業(yè)智能的技術(shù)和數(shù)據(jù)挖掘來驗(yàn)證隱藏在大量全異的數(shù)據(jù)里的模式,進(jìn)而影響一場專業(yè)比賽的勝負(fù)。通過使用來源于現(xiàn)場數(shù)據(jù)收集系統(tǒng)的事件數(shù)據(jù)(EVENT DATA)以及類似于NBA比賽錄像的無結(jié)構(gòu)數(shù)據(jù),先進(jìn)的偵測系統(tǒng)幫助教練進(jìn)行預(yù)賽和賽后分析,甚至實(shí)時(shí)現(xiàn)場分析,這樣就能更好了解隊(duì)員組合是否有效、投籃特性等。

4  國內(nèi)的數(shù)據(jù)挖掘應(yīng)用   

目前國內(nèi)真正應(yīng)用數(shù)據(jù)挖掘的公司還不多明天科技有限公司。

4.1  菲親特一融通公司

比較成功的有菲奈特一融通公司和廣州華工    菲奈特一融通在IBM數(shù)據(jù)挖掘軟件的基礎(chǔ)上開發(fā)了商業(yè)智能套件B1.O航ce,在B1.O航ce的基礎(chǔ)上又開發(fā)了系列的B1.Bank、B1.Taxation、B1.ELec出c Power、B1.Retail、B1.Insurance、B1.Telecom和B1.Ciq。借助IBM巨人的力量,現(xiàn)在是國內(nèi)最有實(shí)力的數(shù)據(jù)挖掘公司。B1.O比ce能簡單、迅速地為企業(yè)構(gòu)建其專有的決策支持系統(tǒng),賦予企業(yè)管理層一個(gè)強(qiáng)有力的武器得以在授權(quán)范圍內(nèi)全面、詳細(xì)、及時(shí)地了解公司運(yùn)營狀況,作出合理的決策。B1.Bank是針對銀行業(yè)適時(shí)推出的一套完整的商業(yè)智能解決方案,為銀行提供決策支持并實(shí)現(xiàn)信息共享、加強(qiáng)客戶關(guān)系管理。B1.Bank包括銀行決策支持系統(tǒng)、客戶關(guān)系管理、銀行信息中心等針對不同使用對象的子系統(tǒng)。B1.Bank利用數(shù)據(jù)倉庫(DW)、聯(lián)機(jī)分析處理(OLAP)、數(shù)據(jù)挖掘(DM)以及Web等核心技術(shù),并采用了數(shù)據(jù)庫服務(wù)器(DB SERVER)、應(yīng)用服務(wù)器(APP SERVER)、用戶端(C/B)三層架構(gòu)。B1.Taxation稅務(wù)決策分析與輔助決策系統(tǒng)是菲奈特—融通公司針對稅務(wù)部門開發(fā)的分析與輔助決策系統(tǒng)。

4.2  廣州華工明天科技有限公司

廣州華工明天科技有限公司開發(fā)了多功能數(shù)據(jù)挖掘器(AFDMl.0)。該產(chǎn)品的特點(diǎn)如下:多平臺(tái)、企業(yè)級(jí)的數(shù)據(jù)挖掘;數(shù)據(jù)分類和處理功能;多種挖掘算法;串行、并行計(jì)算環(huán)境;可視化的結(jié)果分析工具。它提供了三方面的功能:挖掘、處理、統(tǒng)計(jì)。

4.3  應(yīng)用經(jīng)驗(yàn)探討

本人主要參與的是數(shù)據(jù)倉庫的開發(fā)工作,在國家開發(fā)銀行的基礎(chǔ)數(shù)據(jù)庫系統(tǒng)里,一期工程主要是集中抽取了需要的數(shù)據(jù),呈現(xiàn)了全局一致的視圖,采用了豐富靈活的OLAP分析方法,生成報(bào)表,給不同層次的使用人員提供了決策的依據(jù)。預(yù)計(jì)在二期工程中加入一定的數(shù)據(jù)挖掘功能,在系統(tǒng)中嵌入一些挖掘算法和模塊,比如分類和預(yù)測等。必須強(qiáng)調(diào)的一點(diǎn)是,人們通常把數(shù)據(jù)挖掘看得過于神秘,認(rèn)為只要有了一個(gè)數(shù)據(jù)挖掘工具,就能自動(dòng)挖掘出所需要的信息,這是認(rèn)識(shí)上的一個(gè)誤區(qū)。經(jīng)驗(yàn)證明,要想真正做好數(shù)據(jù)挖掘,數(shù)據(jù)挖掘工具只是其中的一個(gè)方面,同時(shí)還需要對企業(yè)業(yè)務(wù)的深入了解和數(shù)據(jù)分析經(jīng)驗(yàn)。一個(gè)企業(yè)要想在未來的市場中具有競爭力,必須有一些數(shù)據(jù)挖掘方面的專家,專門從事數(shù)據(jù)分析和數(shù)據(jù)挖掘工作。再同其他部門協(xié)調(diào),把挖掘出來的信息供管理者決策參考,最后把挖掘出的知識(shí)付諸應(yīng)用。或者,使用專家托管式服務(wù),選擇一個(gè)專門從事數(shù)據(jù)挖掘的公司,深入理解公司業(yè)務(wù)需求,與、lL冬人同配合完成檸損仟?jiǎng)?wù)。而在國內(nèi)的企業(yè)中,決策人員很容易走向兩個(gè)極端,一是認(rèn)為數(shù)據(jù)挖掘沒有用處,二是開始認(rèn)為數(shù)據(jù)挖掘是萬能的。這兩種觀點(diǎn)都是有害的。

5  結(jié)論   

數(shù)據(jù)挖掘從誕生到現(xiàn)在不過十多年的時(shí)間,在這短短的十幾年里,它吸引了各個(gè)行業(yè)的研究人員、工業(yè)界人士的興趣。目前,它已成為最近幾年對人類生活影響最大的幾項(xiàng)IT技術(shù)之一。在產(chǎn)業(yè)界,涌現(xiàn)出許多新興的數(shù)據(jù)挖掘相關(guān)產(chǎn)品供應(yīng)商,數(shù)據(jù)挖掘的應(yīng)用已取得初步的成功。隨著人們對信息的重視程度不斷加深,數(shù)據(jù)挖掘的前途必將是光明的。   

但是,數(shù)據(jù)挖掘作為一門新興的科學(xué)和技術(shù),它的發(fā)展還處于幼年期,要想使之得到廣泛充分地應(yīng)用,必須面對的挑戰(zhàn)為①建立基礎(chǔ)的數(shù)據(jù)挖掘理論體系;②提高數(shù)據(jù)挖掘算法的效率和處理能力;②改善數(shù)據(jù)挖掘系統(tǒng)的人機(jī)界面;④分布式挖掘和實(shí)時(shí)挖掘;⑤挖掘各種數(shù)據(jù)類型,包括半結(jié)構(gòu)和無結(jié)構(gòu)數(shù)據(jù)。   

參    考    文    獻(xiàn)

1  鄭緯民,黃  剛、數(shù)據(jù)挖掘縱覽[EB/OL],北京:清華大學(xué)出版社,1999.

2  Jiawei Han,Micheline Kamber●數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社

3  鄭緯民,黃  剛.?dāng)?shù)據(jù)挖掘工具及其選擇[EB/OL].北京:清華大學(xué)出版社,1999

4  AlexBerson,Stephen Smith,Kurt Thearling、構(gòu)建面向CRM的數(shù)據(jù)挖掘應(yīng)用[M].北京:人民郵電出版社,2001.8

點(diǎn)擊下載:數(shù)據(jù)挖掘應(yīng)用現(xiàn)狀與產(chǎn)品分析 .vip
發(fā)布:2007-03-25 10:53    編輯:泛普軟件 · xiaona    [打印此頁]    [關(guān)閉]
相關(guān)文章:
南昌OA系統(tǒng)
聯(lián)系方式

成都公司:成都市成華區(qū)建設(shè)南路160號(hào)1層9號(hào)

重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓

咨詢:400-8352-114

加微信,免費(fèi)獲取試用系統(tǒng)

QQ在線咨詢