監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價咨詢管理系統(tǒng) | 工程設(shè)計管理系統(tǒng) | 甲方項目管理系統(tǒng) | 簽約案例 | 客戶案例 | 在線試用
X 關(guān)閉

數(shù)字圖書館與Internet的對比分析

申請免費試用、咨詢電話:400-8352-114

數(shù)字化革命和Internet的發(fā)展帶來了經(jīng)濟(jì)、貿(mào)易、信息傳播的全球化??墒?,Internet在全 世界范圍內(nèi)迅猛發(fā)展,網(wǎng)上龐大的數(shù)字化信息和人們獲取信息之間的矛盾日益突出,據(jù)權(quán)威機(jī)構(gòu)統(tǒng)計,網(wǎng)上約有數(shù)十億的網(wǎng)頁,并且這一數(shù)字還在不斷增長,而如何 有效利用如此龐大的信息技術(shù)的水平卻遠(yuǎn)遠(yuǎn)落后于信息增長的速度。而且,由于Internet上的信息資源很大程度上處于混亂無序狀態(tài),大大影響了信息利用 的效率,從而造成對網(wǎng)上巨大信息資源以及網(wǎng)絡(luò)互聯(lián)和帶寬的極大浪費。         

 1 Internet在資源利用上存在的主要問題          (1)查找困難。查找困難的根本原因在于信息倉儲中的數(shù)字化信息缺乏良好的組織結(jié)構(gòu),這恰如一個沒有合理的分類體系,不進(jìn)行嚴(yán)格編目控制,缺乏統(tǒng)一的主題 詞表的圖書館,館藏再豐富也無異于一座堆放資料的倉庫。         

 (2)互操作問題。Internet上的信息資源是由分布在各處的各種各樣的信息倉儲構(gòu)成的,每個倉儲都是一個相對獨立的信息空間,具有各自的信 息組織方式和處理方式,具有不同權(quán)限保護(hù)收費政策。用戶的信息需求往往也需要查詢多個倉儲才能滿足。在網(wǎng)絡(luò)環(huán)境下,用戶要了解每一個倉儲的特性并掌握其檢 索技術(shù),這無疑是一項沉重的負(fù)擔(dān)。         

 (3)大規(guī)模分布數(shù)據(jù)的操作。目前,Internet已成為一個全球的信息網(wǎng)絡(luò)系統(tǒng),網(wǎng)上的信息量達(dá)到了空前的規(guī)模,而且還在不斷增長,它們廣泛 分布在網(wǎng)絡(luò)的各個角落,在處理和檢索這些網(wǎng)絡(luò)信息時必須充分考慮信息的分布性和超大規(guī)模,于是在分布式數(shù)據(jù)集合上采用不同的方法進(jìn)行檢索也成為Web信息 檢索的一個重要挑戰(zhàn)。在過去的信息檢索研究中,人們提出過多種不同的檢索方法,例如,使用不同的檢索模型、語言學(xué)資源、參數(shù)設(shè)置或不同的信息空間等方法得 到的檢索結(jié)果也各不相同。而且每種方法不一定對每個查詢都能起到最佳性能,有時得到的檢索結(jié)果往往還具有很大的互補(bǔ)性。尤其是在一個數(shù)據(jù)集合中對不同的數(shù) 據(jù)子集分別進(jìn)行檢索時,這種互補(bǔ)現(xiàn)象尤其明顯。這時也需要通過對不同檢索數(shù)據(jù)集合的結(jié)果合并,得到在整個數(shù)據(jù)集上的結(jié)果,并提交給用戶。這是分布式信息檢 索的一個必要而重要的環(huán)節(jié)。最近,清華大學(xué)張敏等人提出了按位加權(quán)插入合并算法。雖然這種方法在一定程度上突破了傳統(tǒng)方法對分布數(shù)據(jù)集結(jié)果合并的綜合效果 總是低于使用集中數(shù)據(jù)集檢索的性能局限,但不能從根本上改變在Internet中,由于海量數(shù)據(jù)的多樣性和分布性所帶來的大規(guī)模分布數(shù)據(jù)的操作所帶來的一 系列問題。         

(4)搜索引擎的主要問題。在信息多元化的發(fā)展趨勢下,信息收錄完備性、檢全率、檢準(zhǔn)率、檢索功能和用戶檢索界面等方面還存在許多不足。搜索引擎發(fā) 展的主要問題是信息收錄的完備性不夠、檢全與檢準(zhǔn)都不理想,檢索功能單一。如何提高信息檢索的檢準(zhǔn)率及完善和用戶間的交互功能成為了搜索引擎的新問題。         

  (5)Internet網(wǎng)絡(luò)擁堵。中國互聯(lián)網(wǎng)正在穩(wěn)步發(fā)展,網(wǎng)民成倍增長,用戶的上網(wǎng)時間也持續(xù)增加,于是用戶上網(wǎng)時常常會碰到網(wǎng)絡(luò)擁堵問題,原因是:用 戶分散在各個地方,他們隨時會使用Internet,此時網(wǎng)絡(luò)組件很難控制和處理這些流量到達(dá)的分布和大小,從而導(dǎo)致網(wǎng)絡(luò)服務(wù)質(zhì)量的下降。          

2 數(shù)字圖書館技術(shù)的先進(jìn)性         

 數(shù)字圖書館與目前的互聯(lián)網(wǎng)相比,在提供信息資源技術(shù)上有很大的優(yōu)勢,具體有以下幾方面:         

2.1 資源內(nèi)容的組織方式不同         

數(shù)字圖書館的資源內(nèi)容是按照用戶需求挑選出來的具有高度價值的知識信息,它經(jīng)過分類、編輯、整理、加工等方法,以受教育者易于接受的形式提供給用 戶,是一種有很大增值價值的、有序的知識庫。而Internet上的資源內(nèi)容是無序的,上網(wǎng)信息的內(nèi)容魚龍混雜,良莠不齊。        

  數(shù)字圖書館將資源分為元數(shù)據(jù)庫和對象數(shù)據(jù)庫。元數(shù)據(jù)是描述和管理對象數(shù)據(jù)的數(shù)據(jù),對象數(shù)據(jù)是指數(shù)字化的文本、圖片、聲音、影像等數(shù)據(jù)。元數(shù)據(jù)要集中在數(shù)字 圖書館中心的超大規(guī)模的服務(wù)器上,對象數(shù)據(jù)庫則分布式存放在各地的資源點內(nèi)。當(dāng)用戶查詢時,中心高度系統(tǒng)通過元數(shù)據(jù)調(diào)度各個對象數(shù)據(jù)庫中的數(shù)據(jù)供用戶使 用。         

2.2 資源內(nèi)容標(biāo)引方法不同         

目前,Internet上提供的信息資源有的也經(jīng)過一定的標(biāo)引,但標(biāo)引深度以文獻(xiàn)條目為主,大多數(shù)全文文獻(xiàn)則是不經(jīng)標(biāo)引上網(wǎng)。在有用戶請求時由 Internet搜索引擎按每種文獻(xiàn)的前50~200進(jìn)行關(guān)鍵詞抽取,并與查詢請求匹配得出結(jié)果,其查全率、查準(zhǔn)率都有問題。數(shù)字圖書館的資源標(biāo)引則深入 到文獻(xiàn)內(nèi)容,對每一數(shù)據(jù)對象使用標(biāo)準(zhǔn)通用置標(biāo)語言/可擴(kuò)展置標(biāo)語言(SGML/XML)進(jìn)行置標(biāo),并抽取元數(shù)據(jù)組織元數(shù)據(jù)庫。SGML/XML是信息處理 的國際標(biāo)準(zhǔn),是用來定義具有特殊目的的標(biāo)記語言,它在文件的保護(hù)、交換、共用、整合、安全、擴(kuò)展、長級等方面的應(yīng)用都是其標(biāo)準(zhǔn)化所無法比擬的。          

2.3 檢索效果不同         

數(shù)字圖書館由于進(jìn)行了上述工作,使各資源庫之間實現(xiàn)跨庫無縫鏈接成為可能,只要采用合適的查詢引擎及中間件,用戶就能夠通過瀏覽器方便、迅速地找到 所需要的內(nèi)容。目前,數(shù)字圖書館大都采用分布式檢索,在此系統(tǒng)中,圖書館服務(wù)器和各個對象服務(wù)器是分布式分布的,且各個服務(wù)器上的數(shù)據(jù)庫要求可以是異構(gòu)

的,數(shù)據(jù)對象被封裝分布在各個服務(wù)器中,然后依據(jù)需求采用中間件來提供服務(wù)。而Internet上的信息網(wǎng)則不同,它沒有經(jīng)過加工、標(biāo)引,各種資源 雜亂無章,用戶在檢索信息時需要對一個個網(wǎng)站進(jìn)行訪問。在使用檢索引擎檢索信息時,如同大海撈針一樣,既慢又不全。         

3 數(shù)字圖書館的發(fā)展前景         

數(shù)字的信息化已經(jīng)成為歷史發(fā)展的必然趨勢,而數(shù)字圖書館是未來圖書館發(fā)展的大趨勢,從信息方面來講,必然有數(shù)字存儲海量化和信息的標(biāo)準(zhǔn)化兩個方面。 Internet的無國界特性使得數(shù)字圖書館的合作空間無限擴(kuò)大,全球性合作成為可能,并且逐步實現(xiàn)人才、技術(shù)、設(shè)施、資源等多方面的合作,在關(guān)鍵技術(shù)上 互通有無,最終實現(xiàn)全球數(shù)字一體化。

發(fā)布:2007-03-30 15:51    編輯:泛普軟件 · xiaona    [打印此頁]    [關(guān)閉]
相關(guān)文章: