當(dāng)前位置:工程項(xiàng)目OA系統(tǒng) > 泛普各地 > 廣東OA系統(tǒng) > 廣州OA系統(tǒng) > 廣州OA快博
網(wǎng)絡(luò)信息獲取的應(yīng)用 提高信息獲取的質(zhì)量
申請(qǐng)免費(fèi)試用、咨詢電話:400-8352-114
來(lái)源:泛普軟件 網(wǎng)絡(luò)信息獲取的應(yīng)用 提高信息獲取的質(zhì)量一、高質(zhì)量信息獲取的背景
互聯(lián)網(wǎng)的發(fā)展,給人們帶來(lái)了各個(gè)領(lǐng)域、形式多樣的數(shù)字化媒體信息,對(duì)這些信息進(jìn)行有效獲取和使用,將促進(jìn)人們的學(xué)習(xí)和工作效率。隨著互聯(lián)網(wǎng)的進(jìn)一步發(fā)展,各種基于互聯(lián)網(wǎng)的應(yīng)用也會(huì)逐漸產(chǎn)生,大量應(yīng)用在本質(zhì)上可以抽象為信息的有效獲取和使用,當(dāng)信息從發(fā)送者傳遞到需求者的手中時(shí),價(jià)值將隨之產(chǎn)生,應(yīng)用將隨之形成。因此,信息的個(gè)性化服務(wù),即如何將信息傳遞到真正需要這些信息的用戶手中,成為互聯(lián)網(wǎng)應(yīng)用的基礎(chǔ)性研究。
為幫助用戶獲取信息,首先產(chǎn)生了信息獲取的研究,它可以讓用戶根據(jù)自己的信息需求,方便地找到在信息內(nèi)容上與之匹配的網(wǎng)絡(luò)信息資源,例如數(shù)據(jù)庫(kù)的網(wǎng)絡(luò)檢索系統(tǒng)、網(wǎng)絡(luò)目錄、網(wǎng)絡(luò)搜索引擎等。用戶每次進(jìn)行信息獲取時(shí),都要明確地表達(dá)自己的需要,通常通過(guò)關(guān)鍵詞組合。這種方式存在如下不足:一方面,用戶有時(shí)難以找到合適的關(guān)鍵詞表達(dá)自己的需要,另一方面,隨著網(wǎng)絡(luò)信息資源的日益膨脹,檢索結(jié)果中存在越來(lái)越多的非相關(guān)信息,信息獲取的精度不足。
信息獲取主要關(guān)注用戶的短期信息需求,為提高使用的方便性和信息獲取的質(zhì)量,就要關(guān)注用戶的長(zhǎng)線信息需求,因此出現(xiàn)了對(duì)信息過(guò)濾技術(shù)的研究,信息過(guò)濾技術(shù)假設(shè)用戶的興趣將維持一段時(shí)間基本不變,利用有關(guān)用戶興趣的知識(shí),建立用戶的模型,從大量的動(dòng)態(tài)信息流中,根據(jù)用戶模型找出用戶感興趣的信息。
通常,我們會(huì)將經(jīng)由信息過(guò)濾形成的結(jié)果主動(dòng)推薦到用戶手中,從而形成了個(gè)性化主動(dòng)信息推薦,目前主要基于信息Agent進(jìn)行。通過(guò)信息推薦技術(shù),計(jì)算機(jī)以人為中心,主動(dòng)向用戶推薦信息,滿足用戶的信息需求,這將節(jié)省用戶的時(shí)間,提高其學(xué)習(xí)和工作效率。
通過(guò)信息推薦,各種網(wǎng)絡(luò)應(yīng)用可以將相關(guān)的信息主動(dòng)推薦到需要該信息的用戶手中,這一方面實(shí)現(xiàn)了應(yīng)用的價(jià)值,另一方面也提高了用戶的工作與生活質(zhì)量。例如企業(yè)競(jìng)爭(zhēng)情報(bào)信息的獲取、名人資訊獲取、學(xué)術(shù)研究資料的獲取。高質(zhì)量的信息獲取將成為高質(zhì)量網(wǎng)絡(luò)應(yīng)用的基礎(chǔ),這既是網(wǎng)絡(luò)應(yīng)用提供者的需要,也是網(wǎng)絡(luò)用戶的需要。
二、高質(zhì)量信息獲取的含義
高質(zhì)量信息獲取通常包括如下含義:
1、信息要準(zhǔn)確:信息推薦系統(tǒng)提供的信息要盡可能地滿足用戶的需求,這就需要對(duì)用戶需求的準(zhǔn)確把握、對(duì)信息內(nèi)容的準(zhǔn)確把握、對(duì)信息內(nèi)容和用戶需求之間相關(guān)性的準(zhǔn)確把握;
2、信息要及時(shí):網(wǎng)絡(luò)的開(kāi)放式環(huán)境決定了網(wǎng)絡(luò)上的信息隨時(shí)都在變化,一方面,不斷有新的信息出現(xiàn);另一方面,原有的信息隨時(shí)都可能成為過(guò)時(shí)的信息,因此推薦系統(tǒng)要及時(shí)提供用戶關(guān)注的信息;
3、用戶為中心:信息推薦系統(tǒng)要以用戶為中心進(jìn)行服務(wù),這就要方便用戶的使用,例如,系統(tǒng)主動(dòng)將信息推薦給用戶;用戶可以方便地表達(dá)自己的需求;系統(tǒng)要及時(shí)適應(yīng)用戶需求的變化。
三、高質(zhì)量信息獲取的相關(guān)技術(shù)
在信息獲取領(lǐng)域,有兩類研究方向:基于內(nèi)容的信息獲取和基于合作的信息獲取?;趦?nèi)容的信息獲取通過(guò)分析資源的內(nèi)容建立資源的特征向量,根據(jù)其與用戶需求的相關(guān)性,決定是否將該資源推薦給用戶。合作信息獲取基于網(wǎng)上不同用戶之間的相似性進(jìn)行信息推薦,例如用戶x和用戶y有相似的信息需求,將用戶x感興趣的信息資源推薦給用戶y將比較自然。下面對(duì)這兩類信息獲取技術(shù)的研究現(xiàn)狀進(jìn)行簡(jiǎn)介。
1、基于內(nèi)容分析的信息獲取
在基于內(nèi)容分析的信息獲取中,為判斷用戶是否喜歡某個(gè)信息資源,首先需要建立資源的特征向量,通常采用TFIDF (Term Frequency Inverse Document Frequency)方法生成加權(quán)關(guān)鍵詞向量。目前,有兩種常用的方法來(lái)預(yù)測(cè)用戶是否喜歡某個(gè)資源:
1) 關(guān)鍵詞匹配法。用戶需求通過(guò)加權(quán)關(guān)鍵詞向量表達(dá),在預(yù)測(cè)用戶對(duì)新資源是否感興趣時(shí),通過(guò)計(jì)算兩個(gè)關(guān)鍵詞向量的相似度進(jìn)行,也稱為矢量相似度法或矢量夾角的余弦值;
2) 向量空間法。通過(guò)用戶評(píng)價(jià)過(guò)的資源集來(lái)描述用戶的興趣。當(dāng)要預(yù)測(cè)用戶對(duì)新資源是否感興趣時(shí),需要將資源轉(zhuǎn)化為向量,在向量空間內(nèi)進(jìn)行分類計(jì)算(分為用戶感興趣的資源和不感興趣的資源)。這種方法計(jì)算量大,但準(zhǔn)確率高,一般需要離線進(jìn)行。
基于內(nèi)容分析的信息獲取技術(shù)通常存在如下障礙:
1) 基于目前的技術(shù),我們對(duì)信息資源只有有限的特征提取能力,通常只能對(duì)文本內(nèi)容進(jìn)行比較簡(jiǎn)單的特征提取,在很多領(lǐng)域,目前還沒(méi)有有效的特征提取方法,如:圖像、視頻、音樂(lè)等;
2) 用戶喜歡一個(gè)事物的原因各種各樣,例如對(duì)一幅畫(huà),用戶可能由于不同的原因喜歡它,例如“畫(huà)中有太陽(yáng)”、“畫(huà)中有大海”、“畫(huà)中是傍晚的景色”、“畫(huà)是宋朝的”等等,這種復(fù)雜性和多樣性,使得我們難以建立統(tǒng)一的用戶模型及資源模型;
3) 有些需求難以對(duì)計(jì)算機(jī)精確地描述清楚,例如需要的文章的質(zhì)量、風(fēng)格或者觀點(diǎn);
4) 有時(shí)用戶雖然明白自己喜歡什么,但是難以清楚地表達(dá)自己具體需要什么。
以上障礙影響了信息獲取的質(zhì)量,為提高獲取質(zhì)量,我們一方面可以采用新的算法,另一方面,合作信息獲取也有助于解決這些問(wèn)題。
2、基于合作的信息獲取
人工智能主要通過(guò)計(jì)算機(jī)來(lái)模擬人的智能,在機(jī)器智能的發(fā)展過(guò)程中,我們?nèi)〉昧朔浅XS碩的成果,但是,人們也發(fā)現(xiàn)其存在固有的缺點(diǎn),例如難以把握用戶的需求、缺乏聯(lián)想能力和創(chuàng)新性等,機(jī)器智能在很多領(lǐng)域難以超越人的智能。基于內(nèi)容的信息獲取相當(dāng)于純粹的機(jī)器智能。網(wǎng)絡(luò)的發(fā)展,使得計(jì)算機(jī)可以通過(guò)網(wǎng)絡(luò)相互連接,它們之間的合作將形成多機(jī)合作智能。同時(shí)計(jì)算機(jī)的背后是作為用戶的人,計(jì)算機(jī)的互聯(lián)也體現(xiàn)為人與人之間的互聯(lián),這種互聯(lián)為我們提供了挖掘人的智能的環(huán)境,并將使計(jì)算機(jī)活起來(lái),此時(shí)的智能可能不僅是機(jī)器智能,其中大量融合了人的智能,“人工智能”與“真人智能”將全面融合。這種合作智能在信息獲取中的應(yīng)用,就形成了合作信息獲取。
四、高質(zhì)量信息獲取的商業(yè)意義
第十一次CNNIC調(diào)查結(jié)果顯示,就網(wǎng)民上網(wǎng)目的來(lái)看,獲取信息是第一位的,53.1%的人將其作為上網(wǎng)最主要的目的。其次是休閑娛樂(lè)(24.6%),交友排在第三位(7%)。獲取信息仍然是網(wǎng)民上網(wǎng)最主要的目的。
根據(jù)互聯(lián)網(wǎng)實(shí)驗(yàn)室的一份研究報(bào)告,11.5%的網(wǎng)民使用過(guò)付費(fèi)網(wǎng)絡(luò)服務(wù)(這里所指的付費(fèi)網(wǎng)絡(luò)服務(wù)是指除去在線購(gòu)買書(shū)籍、光盤等實(shí)物產(chǎn)品之外的服務(wù)類網(wǎng)絡(luò)消費(fèi)項(xiàng)目),略高于10.3%的網(wǎng)上購(gòu)物比例。這表明付費(fèi)網(wǎng)絡(luò)服務(wù)已經(jīng)在中國(guó)啟動(dòng)。其中,電子郵箱以54.3%的絕對(duì)優(yōu)勢(shì)排名第一,網(wǎng)上游戲28.3%排名第二。有償信息獲取的比例幾乎可以被忽略。
這就存在一個(gè)巨大反差,53.1%的人將獲取信息作為上網(wǎng)的最主要目的,但是很少有人為之付費(fèi)。
有人將值得付費(fèi)的內(nèi)容劃分為四大類,即:稀缺、獨(dú)家的內(nèi)容;專業(yè)、權(quán)威的內(nèi)容;不可或缺、賴以生活或者工作的內(nèi)容;精品的授權(quán)內(nèi)容或某一領(lǐng)域的匯總整合內(nèi)容等。高質(zhì)量的信息獲取就是通過(guò)先進(jìn)的信息處理技術(shù),將第三類和第四類的信息進(jìn)行整合,以用戶為中心,及時(shí)提供準(zhǔn)確的信息,為用戶創(chuàng)造價(jià)值,從而推進(jìn)有償信息服務(wù)的發(fā)展。(CBISMB)
- 1重慶OA快博
- 2貴陽(yáng)OA快博
- 3西安OA快博
- 4南寧OA快博
- 5長(zhǎng)沙OA快博
- 6合肥OA快博
- 7濟(jì)南OA快博
- 8太原OA快博
- 9上海OA快博
- 10沈陽(yáng)OA快博
- 11長(zhǎng)春OA快博
- 12哈爾濱OA快博
- 1各大公司實(shí)施合肥OA的經(jīng)典方法論匯總
- 2SOA核心價(jià)值體現(xiàn) IBM專家談SOA服務(wù)重用
- 3HR戰(zhàn)略分析:假如唐僧團(tuán)隊(duì)裁員你會(huì)先裁掉誰(shuí)
- 4企業(yè)如何正確運(yùn)用合肥OA的“魔法棒”
- 5信息化項(xiàng)目支持 知識(shí)管理迫在眉睫
- 6商業(yè)智能的普及之道 開(kāi)拓思維和加強(qiáng)協(xié)作
- 7信息化中企業(yè)物資編碼管理實(shí)現(xiàn)方法
- 8為何ITIL難以深化 IT服務(wù)管理系統(tǒng)構(gòu)建對(duì)策
- 9詳解業(yè)務(wù)流程重組對(duì)企業(yè)財(cái)務(wù)管理的影響
- 10泛普OA軟件的自定義報(bào)表與分享微博
- 11合肥OA進(jìn)入普及時(shí)代 管理軟件行業(yè)拐點(diǎn)到來(lái)
- 12合肥OA攻略之貼牌生產(chǎn)企業(yè)合肥OA選型總結(jié)
- 13企業(yè)整體信息化項(xiàng)目建設(shè)的尷尬及顧慮
- 14五個(gè)技巧成功實(shí)施服務(wù)器虛擬化
- 15離散性企業(yè)合肥OA實(shí)施能力的研究與分析(中)
- 16中小企業(yè)如何智選PC 考慮因素面面觀
- 17泛普OA軟件的功能點(diǎn)9:微博動(dòng)態(tài)元素
- 18關(guān)于產(chǎn)品生命周期管理項(xiàng)目的風(fēng)險(xiǎn)管理
- 1910步為企業(yè)定制科學(xué)有效合肥OA軟件選型流程
- 20合肥OA實(shí)務(wù) 業(yè)務(wù)流程評(píng)述之貨款折讓流程
- 21可配置合肥OA 讓渠道商成為信息化專家
- 22關(guān)注:關(guān)于合肥OA報(bào)表體系幾個(gè)方面的思考
- 23日式制番管理在企業(yè)合肥OA系統(tǒng)中的實(shí)現(xiàn)
- 24管理革命先行 走出企業(yè)信息技術(shù)化誤區(qū)
- 25ITIL的“三要”、“三不要”
- 26及時(shí)應(yīng)對(duì)企業(yè)變化 合肥OA要走出服務(wù)鏈斷裂迷局
- 27淺析產(chǎn)品設(shè)計(jì)中的設(shè)計(jì)流程管理
- 28網(wǎng)絡(luò)信息獲取的應(yīng)用 提高信息獲取的質(zhì)量
- 29診斷中小企業(yè)軟件項(xiàng)目管理難題
- 30企業(yè)用好業(yè)務(wù)流程管理將如何跨越五大欄
成都公司:成都市成華區(qū)建設(shè)南路160號(hào)1層9號(hào)
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓