監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價咨詢管理系統(tǒng) | 工程設計管理系統(tǒng) | 甲方項目管理系統(tǒng) | 簽約案例 | 客戶案例 | 在線試用
X 關閉

知識資源計劃(二)——企業(yè)天津OA信息化新平臺(AMT研究院 袁磊 編譯)

申請免費試用、咨詢電話:400-8352-114

AMTeam.org

知識資源計劃是一種管理方法,同時也是一種可運行的信息系統(tǒng)。在知識資源計劃中主要涉及知識表示、知識存儲、知識發(fā)現(xiàn)和知識使用支撐組件等關鍵技術(shù),以下對這四方面的關鍵技術(shù)進行簡要分析。

1、 知識表示技術(shù)

人類對知識的認識和獲取經(jīng)歷了一個漫長的過程。知識最原始的記載形式是信號,從信號到數(shù)據(jù)再到信息直到知識。在信息科學中,數(shù)據(jù)定義為事物、概念或指令的一種形式化的表示形式,以適合于用人工或自然的方法進行通信、解釋或處理。信息是數(shù)據(jù)表達的客觀事實。在上世紀四十年代,香農(nóng)(Shannon)研究了信息的數(shù)學本質(zhì),用熵的概念來研究信息的容量,以比特為信息的度量單位,開辟了信息研究的新篇章。知識則是經(jīng)過加工和改造過的信息。所以說,知識與信號、數(shù)據(jù)、信息之間密不可分,它們是四個不同層次的概念,其中信號是最底層,然后是數(shù)據(jù)、信息,知識位于最上層。它們四者的區(qū)別如表1所示:

表1 信號、數(shù)據(jù)、信息和知識的區(qū)別

名稱

特征

示例

信號

物理特征表示

紅燈、綠燈……

數(shù)據(jù)

未經(jīng)處理的原始材料

張三、男、26歲……

信息

有意義的數(shù)據(jù)

SOS……

知識

具有一定目的的信息,并能導致一定的行動

緊急警報à開始營救行動

知識可以認為是在實踐中應用并證實一個有組織的概念或框架時產(chǎn)生的結(jié)果,由一個包含語義信息的特征集以及與之相關的約束和規(guī)則集組成。知識表示則是描述這些結(jié)果所作的一組約定并易于被計算機接受和處理的一種表現(xiàn)形式。而知識表示方式常常取決于人類知識的結(jié)構(gòu)及其機制。從工程的角度,知識被理解為有助于解決問題的可復用的模式化的信息,一般的表示形式為:概念、規(guī)則、規(guī)律、模式、約束和可視化。這些知識可以直接提供給決策者,用于輔助決策過程,或者提供給領域?qū)<?,修正己有的知識體系,也可以作為新的知識存儲到應用系統(tǒng)的知識存儲機構(gòu)中,例如專家系統(tǒng)、規(guī)則庫等。

知識表示領域的核心是解決如何進行信息的編碼并以推理計算模型加以利用。傳統(tǒng)的知識表達模式有謂詞邏輯方法、框架表示方法、產(chǎn)生式規(guī)則、狀態(tài)空間搜索方式、語義網(wǎng)絡、腳本方法、過程式方法、直接表示法、面向?qū)ο蟮闹R表示方法等。近幾年,由于將本體引入知識工程領域,知識表示領域又出現(xiàn)了一些新的方法。近年,有專家認為知識表示由三個主要部分組成:邏輯、本體和計算。邏輯提供了通過邏輯運算從現(xiàn)有知識演繹出新的邏輯描述的功能;計算則是指確定一個描述是否能夠從給定描述演繹得出的過程。Ontology本體是自然事物及其關系的研究,在知識表示中又被稱為形式化本體和計算本體,是某個領域事物的符號描述,方便知識共享和重用的實現(xiàn)。

2、 知識存儲——知識庫系統(tǒng)技術(shù)

知識庫系統(tǒng)是近十幾年發(fā)展起來的一個綜合性方向,它是目前知識存儲領域主要的技術(shù)。由于知識庫系統(tǒng)技術(shù)集成了知識表示、知識獲取及問題求解等人工智能領域的最新成果,它又和數(shù)據(jù)庫緊密地結(jié)合在一起。因此,知識庫系統(tǒng)廣泛應用于設計、決策、診斷、控制、教學等領域,并成為人們研究的熱點。

對于知識庫系統(tǒng)的定義,目前還沒有統(tǒng)一的形式化描述。一般地,知識庫系統(tǒng)是一個完整的系統(tǒng),它是以知識庫為核心的,包含人、硬件和軟件的各種資源,用于實現(xiàn)知識共享的系統(tǒng)。知識庫是經(jīng)過合理組織的關于某一特定領域的陳述型知識和過程型知識的集合,知識通過一定的表示,存儲在知識庫中。知識庫與傳統(tǒng)的數(shù)據(jù)庫不同,知識庫不但包含大量的簡單事實,還包括了用于推理及問題求解的條件和規(guī)則。

知識庫系統(tǒng)實現(xiàn)需要解決知識表示、知識使用和知識獲取及發(fā)現(xiàn)三個關鍵技術(shù)問題,即知識采用什么形式表示,使計算機能對之進行處理,并以一種人類能理解的方式將處理結(jié)果告知人們。知識利用則是指利用知識庫中的知識進行推理,從而得出結(jié)論的過程。知識獲取及發(fā)現(xiàn)是指從知識源獲得知識來建造知識庫,并可以從已有的知識庫中發(fā)現(xiàn)新的知識。

圖1 知識庫系統(tǒng)運作流程

3、 知識發(fā)現(xiàn)技術(shù)

知識發(fā)現(xiàn)的研究始于從數(shù)據(jù)庫中發(fā)現(xiàn)有用模式這一概念,并先后具有不同的術(shù)語,如數(shù)據(jù)開采、知識提取、信息發(fā)現(xiàn)、數(shù)據(jù)模式處理以及數(shù)據(jù)庫中的知識發(fā)現(xiàn)。簡言之,知識發(fā)現(xiàn)就是在信息環(huán)境下,從大量現(xiàn)有的或歷史的數(shù)據(jù)集合中提取可信的、新穎的、有效的并能被人理解的模式的處理過程。它的應用對象是大型數(shù)據(jù)庫、文檔庫或知識庫,目標是發(fā)現(xiàn)數(shù)據(jù)庫中規(guī)律性的知識。

一般來說,知識發(fā)現(xiàn)分為六個步驟:數(shù)據(jù)清理、集成、選擇、挖掘、模式評價和知識展現(xiàn)。數(shù)據(jù)清理可以消除噪聲和不一致的數(shù)據(jù),使數(shù)據(jù)信息均一化;數(shù)據(jù)集成是將各種數(shù)據(jù)組合在一起;數(shù)據(jù)選擇是從知識庫中檢索與分析任務相關的數(shù)據(jù);數(shù)據(jù)變化將數(shù)據(jù)統(tǒng)一變換成適合于挖掘的形式;數(shù)據(jù)挖掘是知識發(fā)現(xiàn)的核心部分,使用智能方法提取數(shù)據(jù)模式;模式評價是根據(jù)某種興趣度度量,識別表示知識真正有趣的模式;知識展現(xiàn)是使用可視化的方法將挖掘得來的模式展現(xiàn)給用戶。

表2 知識發(fā)現(xiàn)的分類

任務

對象

方法

1、  分類或預測模型發(fā)現(xiàn);

2、  數(shù)據(jù)總結(jié)、聚類、關聯(lián)規(guī)則發(fā)現(xiàn);

3、  序列模式發(fā)現(xiàn);

4、  依賴關系和依賴模型發(fā)現(xiàn);

5、  異常和趨勢發(fā)現(xiàn);

1、  關系型數(shù)據(jù)庫;

2、  面向?qū)ο髷?shù)據(jù)庫;

3、  空間數(shù)據(jù)庫;

4、  時態(tài)數(shù)據(jù)庫;

5、  文本數(shù)據(jù)庫;

6、  多媒體數(shù)據(jù)庫;

7、  Web/Internet

1、   機器學習方法(決策樹、規(guī)則歸納學習、基于事例學習、遺傳酸法等);

2、   統(tǒng)計方法(多元回歸、自回歸、貝耶寺判別、費歇爾判別、非參數(shù)判別等);

3、   神經(jīng)網(wǎng)絡方法、數(shù)據(jù)庫方法;

4、   可視化

4、知識使用支撐組件技術(shù)

海量數(shù)據(jù)、信息爆炸和異構(gòu)的分布性知識,極大的阻礙了人們對知識的利用,對知識的創(chuàng)新也無法通過知識資源計劃的組織來實現(xiàn)。既然知識資源計劃是一個可執(zhí)行可操作的系統(tǒng),所以,要將相應的方法以及具體的需求加以實現(xiàn)必須由支撐組件技術(shù)提供支持。如前文所述,知識資源的使用分為兩大部分:知識集成與知識共享。知識集成和知識共享之間存在互相依賴的關系,集成的目的為了共享,共享又能促進知識的更全面的集成。

知識集成旨在通過共享標準的綜合數(shù)字信息來實現(xiàn)資源的高效組織,將分散的知識元素依據(jù)一定的邏輯規(guī)則有機結(jié)合在一起,使知識有序化、層次化,從而高效的利用信息資源,實現(xiàn)知識共享,有利于知識創(chuàng)新。知識共享是建立在知識集成的基礎之上的,通過集成,實現(xiàn)異構(gòu)系統(tǒng)之間的信息標準的統(tǒng)一,加強系統(tǒng)的問題求解能力,實現(xiàn)知識處理系統(tǒng)間的互操作性。

目前,對知識集成的研究主要分為四大方向:結(jié)構(gòu)化集成、基于特征的集成、模型驅(qū)動集成、面向?qū)ο蟮募?。其中所使用的支撐技術(shù)還是以基于不同開發(fā)平臺的網(wǎng)絡組件技術(shù)為主,如基于J2EE平臺的EJB技術(shù),基于Microsoft的COM技術(shù),以及基于.NET平臺的Web Service技術(shù)等,這些技術(shù)都存在一個共同的問題:盡管它們都號稱能夠?qū)崿F(xiàn)跨平臺使用,但是異構(gòu)平臺的集成性能不是很好,例如, 使用Java開發(fā)的EJB組件很難在Microsoft的平臺上使用。

 

發(fā)布:2007-03-25 09:52    編輯:泛普軟件 · xiaona    [打印此頁]    [關閉]
天津OA系統(tǒng)
聯(lián)系方式

成都公司:成都市成華區(qū)建設南路160號1層9號

重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務大廈18樓

咨詢:400-8352-114

加微信,免費獲取試用系統(tǒng)

QQ在線咨詢