監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價(jià)咨詢管理系統(tǒng) | 工程設(shè)計(jì)管理系統(tǒng) | 甲方項(xiàng)目管理系統(tǒng) | 簽約案例 | 客戶案例 | 在線試用
X 關(guān)閉

圖書館與網(wǎng)絡(luò)信息資源編目

申請免費(fèi)試用、咨詢電話:400-8352-114

 【內(nèi)容提要】著重論述了圖書館對網(wǎng)絡(luò)信息資源編目的必要性、可行性,以及編目工具——元數(shù)據(jù)DC、MARC和可擴(kuò)展標(biāo)識語言XML,介紹了目前國際圖書館界在這方面取得的進(jìn)展。
【摘 要 題】圖書情報(bào)工作論壇

1.對網(wǎng)絡(luò)信息資源編目的必要性
圖書館對網(wǎng)絡(luò)信息資源進(jìn)行編目的意義在于:一是把網(wǎng)絡(luò)信息資源及其服務(wù)有機(jī)地納入到圖書館服務(wù)中來,這意味著圖書館利用網(wǎng)絡(luò)信息資源補(bǔ)充已有館藏和提高圖書館滿足讀者信息需求的能力;二是運(yùn)用和移植圖書館學(xué)、情報(bào)學(xué)在組織文獻(xiàn)信息和書目控制文獻(xiàn)的研究成果和實(shí)踐經(jīng)驗(yàn),提高網(wǎng)絡(luò)信息資源的有序化程度。
1.1隨著數(shù)字化革命的深入和Internet的飛速發(fā)展,網(wǎng)絡(luò)信息資源呈現(xiàn)出幾何級數(shù)量增長,據(jù)國外最新研究結(jié)果表明,因特網(wǎng)上可編索引的網(wǎng)頁已超過10億頁,僅此一項(xiàng),其增長規(guī)模已超越了現(xiàn)有的非網(wǎng)絡(luò)資源,信息資源從內(nèi)容到形式都發(fā)生了質(zhì)的變化。網(wǎng)絡(luò)信息資源同非網(wǎng)絡(luò)資源相比,具有地理上分散、組織上無序、數(shù)據(jù)類型多、變幻多端的特點(diǎn)。
無序擴(kuò)張的網(wǎng)絡(luò)信息資源,一方面使網(wǎng)上信息包羅萬象,良莠不齊,信息分布、信息組合錯(cuò)綜復(fù)雜,信息污染嚴(yán)重;另一方面,廣大用戶,即信息的需求者,面對如此浩瀚的信息海洋,無法快捷地獲取自己所需的信息,對檢索和獲取信息的低效感到無奈。解決二者之間的矛盾,為用戶提供便利的信息獲取途徑和方法,就圖書館而言,最為有效的方法即是將網(wǎng)絡(luò)信息資源納入圖書館的服務(wù)當(dāng)中,對其進(jìn)行編目管理。
1.2網(wǎng)絡(luò)中存在著巨大數(shù)字化信息,用戶要想快速準(zhǔn)確地檢索到所需信息,就需要一個(gè)機(jī)構(gòu)能夠承擔(dān)起網(wǎng)絡(luò)信息的整序工作。目前,以網(wǎng)絡(luò)搜尋為目的的搜索引擎的出現(xiàn)(如國外的Yahoo、infoseek、altavista,國內(nèi)的網(wǎng)易、搜狐等),雖然在浩如煙海的網(wǎng)絡(luò)資源中起到了一定的導(dǎo)航作用,由于其處理方式是通過自動調(diào)用程序在網(wǎng)際網(wǎng)絡(luò)上選取網(wǎng)頁,然后使用全文檢索的技術(shù),以自動拆字詞作為索引的方式,建立其數(shù)據(jù)庫作為檢索的基礎(chǔ),這種方式的不足之處在于其查全率高,但查準(zhǔn)率低,以及缺乏一致性的用戶界面。檢索出的篇目太多,有時(shí)甚至有成千上萬篇,而其中真正有用的信息并不多。
這種情況下,圖書館應(yīng)發(fā)揮自己的職業(yè)優(yōu)勢,圖書館對非網(wǎng)絡(luò)信息資源的編目已有了豐富的經(jīng)驗(yàn),將其應(yīng)用于網(wǎng)絡(luò)信息資源的編目將起到事倍功半的效果,由圖書館對網(wǎng)絡(luò)信息資源進(jìn)行選擇、加工、整理,對網(wǎng)絡(luò)上的各種信息進(jìn)行篩選、過濾、描述、標(biāo)引,以便于查尋的方式把有價(jià)值的信息提供給用戶,這是利用網(wǎng)絡(luò)資源最為有效的途徑之一。
2.網(wǎng)絡(luò)信息資源編目的可行性
盡管網(wǎng)絡(luò)信息資源具有增長迅速、數(shù)量巨大、流動性大、穩(wěn)定性小的特點(diǎn),它與非網(wǎng)絡(luò)信息資源仍具有共性,可以這樣比喻,整個(gè)因特網(wǎng)就像一個(gè)巨大的圖書館,各個(gè)網(wǎng)站就是種類不同的圖書,而每一個(gè)網(wǎng)頁就是圖書中的一頁,共性的存在,是對網(wǎng)絡(luò)信息資源進(jìn)行編目的前提條件。
美國OCLC(Online Computer Library Center)對網(wǎng)絡(luò)信息資源的編目進(jìn)行了有益的嘗試,并且取得了重大的進(jìn)展。OCLC從1991年開始就致力于應(yīng)用計(jì)算機(jī)技術(shù)對因特網(wǎng)上的資源進(jìn)行精心篩選和標(biāo)引。通過試驗(yàn),證實(shí)了MARC和AACR2可適用于網(wǎng)絡(luò)信息資源,同時(shí)提出了修改完善MARC建議,在USMARC中新增加了856字段—電子網(wǎng)址和索取字段。由于MARC本身的局限性,如結(jié)構(gòu)復(fù)雜、著錄項(xiàng)目過于煩瑣,要求專業(yè)性強(qiáng),要受過專門訓(xùn)練的編目員來做等等,雖保證了著錄的精確性,但著錄速度慢,工作效率低,無法滿足海量的網(wǎng)絡(luò)資源的整序需求。
于是人們開始轉(zhuǎn)向研究一種新的著錄項(xiàng)目,一種用以描述網(wǎng)絡(luò)信息資源的格式和工具。“元數(shù)據(jù)”這一概念被及時(shí)推出,元數(shù)據(jù)的產(chǎn)生為網(wǎng)絡(luò)信息資源的組織提供了重要手段。到目前為止,世界上已開發(fā)出并付諸使用的元數(shù)據(jù)有許多種,如都柏林核心元數(shù)據(jù)(Dublin Core)、頻道定義格式(CDF)、藝術(shù)作品描述目錄(CDWA)、資源描述框架(RDF)等等。
有了高效實(shí)用的網(wǎng)絡(luò)信息描述工具以后,針對網(wǎng)絡(luò)信息資源編目的特殊性,1998年8月OCLC研究署向研究顧問委員會提交了 CORC(Cooperative Online Resource Catalog)計(jì)劃的構(gòu)想,這一計(jì)劃嘗試將傳統(tǒng)的圖書館編目規(guī)則與技術(shù)—文獻(xiàn)信息的選擇、描述、標(biāo)引及利用等運(yùn)用于網(wǎng)絡(luò)信息的存取,OCLC于2000年7月正式推出了CORC產(chǎn)品,并向美國和全世界推廣。CORC與商業(yè)的搜索引擎不同之處在于它有人工干預(yù),網(wǎng)絡(luò)資源是由圖書館員挑選的,它的目標(biāo)是將傳統(tǒng)的圖書館編目技術(shù)與先進(jìn)的計(jì)算機(jī)技術(shù)相結(jié)合形成一個(gè)新系統(tǒng),能夠明顯優(yōu)于現(xiàn)有的搜索引擎。
3.編目工具
圖書館員一向以善于組織信息著稱,我們曾經(jīng)有效地完成了印刷型資料的編目組織工作,當(dāng)然有能力完成網(wǎng)絡(luò)信息資源編目的使命。
目前圖書館界對網(wǎng)絡(luò)信息資源編目的工具以MARC和DC為主,對網(wǎng)絡(luò)信息資源進(jìn)行著錄的格式應(yīng)是基于XML的DC描述。
3.1MARC
MARC格式是美國國會圖書館從1963年開始研究應(yīng)用計(jì)算機(jī)對圖書進(jìn)行編目的工具,1971年,美國國家標(biāo)準(zhǔn)局將USMARC確定為美國國家標(biāo)準(zhǔn),1977年,國際圖聯(lián)(IFLA)發(fā)布UNIMARC格式,中國根據(jù)UNIMARC的框架體系和內(nèi)容,結(jié)合中國的特點(diǎn)編制了CNMARC。
MARC是用于描述、存儲、交換、控制和檢索的一套機(jī)讀書目數(shù)據(jù)標(biāo)準(zhǔn),它開始主要是針對印刷型書本的描述,對網(wǎng)絡(luò)信息資源進(jìn)行編目,是通過在MARC中增加856字段,即“電子資源地址與存取”,并采用5XX字段記錄資源格式的方法來進(jìn)行的。它的數(shù)據(jù)結(jié)構(gòu)嚴(yán)密,能很好地描述電子信息,尤其是在檢索點(diǎn)的選取原則上,能確保其數(shù)據(jù)元索組成具有統(tǒng)一性,有利于資源交換。此外,這種經(jīng)過編目人員過濾、篩選過的信息,確保了數(shù)據(jù)描述的可靠性、完全性和精確性。
856字段主要記錄被著錄的數(shù)字對象或與之相關(guān)的其它電子資源的存儲地址和存取方式,是可重復(fù)、必備字段,包含27個(gè)子字段。專業(yè)水準(zhǔn)的分類和準(zhǔn)確的記錄這兩大特色將使其能在Internet中占有一席之地。但用MARC格式編目Internet的成本相當(dāng)高,由于網(wǎng)絡(luò)信息地址時(shí)常更改,為了維護(hù)856 字段鏈接的有效性,需要耗費(fèi)相當(dāng)多的財(cái)力、人力和時(shí)間,編目的速度遠(yuǎn)遠(yuǎn)跟不上網(wǎng)絡(luò)信息資源增長的速度,因此這種高成本的編目方式只適用于編目一些最重要的網(wǎng)絡(luò)資源。
3.2DC
目前對因特網(wǎng)上的信息資源編目用
得最多的著錄工具是DC(Dublin Core)——都柏林核心,它是一項(xiàng)描述信息資源的國際標(biāo)準(zhǔn),1995年3月在俄亥俄州的都柏林核心研討會上,52位來自圖書館、計(jì)算機(jī)和網(wǎng)絡(luò)方面的學(xué)者和專家共同探討了基于網(wǎng)絡(luò)信息資源的描述問題,創(chuàng)建了都柏林核心集。
DC包含15個(gè)元素,依據(jù)其所描述內(nèi)容的類別和范圍可分為三組:a、對資源內(nèi)容的描述;b.對知識產(chǎn)權(quán)的描述;c、對外部屬性的描述。對資源內(nèi)容描述類包括:Title、Subject、Description、Source、Language、Relation、Coverage。對知識產(chǎn)權(quán)的描述包括:Creator、Publisher、Contributor、Rights。對外部屬性的描述包括:Date、Type、Format、 Identifier。
DC同MARC相比具有以下優(yōu)點(diǎn):
·  格式簡單且易于使用:因它只有15個(gè)元素,易于理解,適合各種背景的人群使用。
·  具有通用性:15個(gè)元素可自由選用及重復(fù)使用,元素的含義不因其是否嵌入所描述的資源而受到影響。它支持任何內(nèi)容的資源描述,使得跨學(xué)科的語義描述有了可操作性。
·  具有兼容性:DC通過RDF框架形成了資源描述的基礎(chǔ),對基于WEB的元數(shù)據(jù)提供了靈活的語法基礎(chǔ),如可內(nèi)嵌入HTML、XML語言,各種瀏覽器均支持它。
·  具有可擴(kuò)展性:可根據(jù)實(shí)際情況,通過使用限定詞能夠?qū)崿F(xiàn)擴(kuò)展描述的方法。
第七次都柏林核心研討會后,對DC進(jìn)行了重大改進(jìn),DC與MARC之間映射更加一致,接近一一對應(yīng)于MARC的許多字段,有利于將DC元數(shù)據(jù)記錄集成到圖書館原有的基于MARC的OPAC系統(tǒng)。

  3.2XML
圖書館在對網(wǎng)絡(luò)信息資源編目過程中,采用DC作為網(wǎng)絡(luò)信息資源的著錄工具、XML文檔結(jié)構(gòu)作為著錄格式是使網(wǎng)絡(luò)信息資源有序化的理想模式。
XML是一種區(qū)別于HTML和SGML的可擴(kuò)展標(biāo)識語言,它不象SGML那樣復(fù)雜,又能象HTML那樣可在WEB上傳送,它已廣泛應(yīng)用于互聯(lián)網(wǎng)上。XML是一種類似于HTML,被設(shè)計(jì)用來描述數(shù)據(jù)的語言,XML提供了一種獨(dú)立的運(yùn)行程序的方法來共享數(shù)據(jù),它是用于自動描述信息的一種新的標(biāo)準(zhǔn)語言,它能使計(jì)算機(jī)通信把Internet的功能由信息傳遞擴(kuò)大到人類其他多種多樣的活動中去。XML由若干規(guī)則組成,這些規(guī)則可用于創(chuàng)建標(biāo)識語言,正如HTML為第一個(gè)計(jì)算機(jī)用戶閱讀Internet文檔提供一種顯示方法一樣,XML也創(chuàng)建了一種任何人都能讀出和寫入的世界語。
XML作為新的一代網(wǎng)絡(luò)語言,它具有良好的可擴(kuò)展性,它允許各個(gè)不同的行業(yè)根據(jù)自己獨(dú)特的需要制定自己的一套標(biāo)記;它還具有良好的自描述性,能夠描述信息本身的含義甚至它們之間的關(guān)系;它遵循嚴(yán)格的語法要求,增加了網(wǎng)頁的文檔的可讀性和可維護(hù)性,提高了瀏覽器的時(shí)間空間效率;它便于不同系統(tǒng)之間信息的傳輸,XML是一種非常理想的網(wǎng)際語言。
XML文檔最好以一個(gè)XML聲明作為開始,一個(gè)完整的聲明是這樣的:
附圖
下面是一個(gè)基于XML的DC描述的一個(gè)例子,
<?XML version="1.0" encoding="GB2312" standalone="no"?>
<論文>
<HEAD>
<Title>Dublin Core形式書目</Title>
……
<BODY>
<dc:Title>Internet環(huán)境下電子化圖書館信息管理系統(tǒng)</dc:Title>
<dc:Creator>林雪英</dc:Creator>
<dc:Subject>圖書館信息管理</dc:Subject>
<dc:Description>…</dc:Description>
<dc:Date>2002—5--?</dc:Date>
<dc:Type>學(xué)術(shù)論文</dc:Type>
<dc:Source>http://www.fjinfo.gov.cn/publicat/qbts/004/18.htm</dc:Source>
<dc:Language>Chi</dc:Language>
<dc:Relation>福建科技</dc:Relation>
<dc:Rights>http://www.fjinfo.gov.cn</dc:Rights>
</BODY>
</論文>
每個(gè)著錄項(xiàng)目均為可選項(xiàng)目,可重復(fù)標(biāo)記,數(shù)據(jù)是可變長的,書目信息與全文版電子資源的鏈接是通過<dc:Source>……</dc:Source>來實(shí)現(xiàn)的。
4.圖書館對網(wǎng)絡(luò)信息資源進(jìn)行編目的現(xiàn)狀
網(wǎng)絡(luò)資源編目既然是傳統(tǒng)文獻(xiàn)編目在網(wǎng)絡(luò)環(huán)境下的延伸,而網(wǎng)絡(luò)資源又具有數(shù)量大、增長快、穩(wěn)定性小的特點(diǎn),實(shí)行聯(lián)機(jī)合作編目是理所當(dāng)然的必由之路。在這方面,美國做出了有益的嘗試。美國的OCLC在積其數(shù)十年合作編目豐富經(jīng)驗(yàn)的基礎(chǔ)上,順應(yīng)網(wǎng)絡(luò)信息資源發(fā)展的趨勢,及時(shí)推出“合作聯(lián)機(jī)資源目錄”——Cooperative Online Resources Catalog,即CORC構(gòu)想。
4.1CORC的概況。它的目的是在自動化編目工具與圖書館合作有機(jī)結(jié)合的基礎(chǔ)上,建設(shè)共享的網(wǎng)絡(luò)資源數(shù)據(jù)庫。目前它已建立4個(gè)數(shù)據(jù)庫:資源記錄數(shù)據(jù)庫、規(guī)范數(shù)據(jù)庫、尋路器數(shù)據(jù)庫、杜威十進(jìn)分類法數(shù)據(jù)庫,其中資源記錄數(shù)據(jù)庫相當(dāng)于一般的書目數(shù)據(jù)庫,以Dublin Core或MARC形式提供網(wǎng)絡(luò)信息,尋路器數(shù)據(jù)庫則以網(wǎng)頁形式揭示網(wǎng)絡(luò)資源的書目信息及其與資源的超文本鏈接。
4.2 CORC的功能。
·  快速生成書目記錄。圖書館利用CORC編目時(shí),只需根據(jù)編目人員提供的URL,系統(tǒng)會自動搜索、獲取相關(guān)域名的網(wǎng)頁,為相關(guān)網(wǎng)頁及其所有鏈接生成一系列的資源記錄,而且可定向獲取具有EAD與TEI頭標(biāo)的網(wǎng)頁,并自動生成書目記錄,CORC工具在獲取某一網(wǎng)址后,能自動過濾出關(guān)鍵概念與關(guān)鍵詞作為索引詞。
·  自動標(biāo)引分類法類號和主題詞。CORC安裝了豐富的機(jī)助編目工具,如杜威十進(jìn)分類法、美國國會圖書館標(biāo)題表、美國國家醫(yī)學(xué)圖書館標(biāo)題表等,以減輕編目人員的標(biāo)引工作強(qiáng)度。
·  通過合作與機(jī)器協(xié)助的方法維護(hù)記錄的URL(統(tǒng)一資源定位器)。在CORC系統(tǒng)中,由成員館分擔(dān)維護(hù)URL,當(dāng)用戶的記錄包含無效的URL時(shí),CORC的自動鏈接維護(hù)工具會通過“狀態(tài)屏幕”及時(shí)通知用戶,由用戶進(jìn)行核查、更正,從而保證了URL的正確性。
4.3CORC的啟示。
目前,國內(nèi)許多有實(shí)力的圖書館已經(jīng)開始對網(wǎng)絡(luò)信息資源加以收集、整理加工,開始了對網(wǎng)絡(luò)資源編目的有益的探索,但是同時(shí)存在著分散、不統(tǒng)一的特點(diǎn),作為發(fā)達(dá)國家的美國,合作聯(lián)機(jī)編目已走在我
們的前面,我們的問題不再是如何對網(wǎng)絡(luò)信息資源進(jìn)行編目,尋找什么樣的工具編目,而是應(yīng)該直接與國際接軌,充分利用CORC系統(tǒng)這一先進(jìn)的工具。
5.結(jié)束語
網(wǎng)絡(luò)信息的極大豐富,給圖書館的工作帶來了新的機(jī)遇和挑戰(zhàn),也給圖書館員帶來了新的工作內(nèi)涵,它使我們不斷地補(bǔ)充新知識、接受新生事物,采用新的編目工具組織新的信息。在對網(wǎng)絡(luò)信息資源進(jìn)行組織整理方面,圖書館應(yīng)是大有可為的,圖書館有知識、經(jīng)驗(yàn)都很豐富的編目人員,有一套切實(shí)可行的工作方法。目前,對網(wǎng)絡(luò)信息編目,圖書館界正在進(jìn)行如火如荼的研究,相信無論是用MARC或是DC,是用XML或是HTML,圖書館這在方面的工作將會做得越來越完善、越來越科學(xué)。
【責(zé)任編輯】宋雅范
【參考文獻(xiàn)】
1、盧共平.圖書館與網(wǎng)絡(luò)信息資源的組織管理.http://www.libnet.sh.cn/magzine/00-06
2、郭瑞華.對網(wǎng)絡(luò)信息資源著錄項(xiàng)目和著錄格式的研究.圖書館建設(shè),2002(1),55-57頁
3、吳萬曄.OCLC的CORC系統(tǒng)對我國虛擬圖書館發(fā)展的啟示.情報(bào)雜志,2002(8),86-89頁
4、王紹平.合作編目—網(wǎng)絡(luò)資源書目控制的必由之路.http://www.lib.sjtu.edu.cn/chinese/teaching&research
5、方小容.網(wǎng)絡(luò)信息資源編目與CORC系統(tǒng).現(xiàn)代圖書情報(bào)技術(shù),2002(2)65-68頁
6、吳開華等.數(shù)字圖書館元數(shù)據(jù)研究.圖書館學(xué)、信息科學(xué)、資料工作,2002(8),27-30
7、吳建中.網(wǎng)絡(luò)資源的組織與整理.http://www.kingsy.net/library/expert/wjz
8、Internet環(huán)境下電子化圖書館信息管理系統(tǒng).http://www.fjinfo.gov.cn/publicat/qbts/004/18.htm

發(fā)布:2007-03-30 15:49    編輯:泛普軟件 · xiaona    [打印此頁]    [關(guān)閉]
相關(guān)文章: