那旭東
(長(zhǎng)春工業(yè)大學(xué)圖書(shū)館,吉林長(zhǎng)春 130012)
隨著計(jì)算機(jī)技術(shù)、因特網(wǎng)的迅猛發(fā)展,人類知識(shí)信息資源的海量增加,數(shù)字化信息正以前所未有的速度不斷增加,人們獲取知識(shí)信息的方式也隨之發(fā)生了巨大變化,數(shù)字圖書(shū)館也就應(yīng)運(yùn)而生,并逐步由傳統(tǒng)圖書(shū)館向數(shù)字圖書(shū)館過(guò)渡轉(zhuǎn)變。
圖書(shū)館原來(lái)那種一成不變的管理方式已經(jīng)適應(yīng)不了以動(dòng)態(tài)和開(kāi)放為特征的新型方式,因此,整個(gè)圖書(shū)館的管理模式、工作環(huán)境、作業(yè)流程及服務(wù)手段都會(huì)隨之改變,圖書(shū)館通過(guò)搭建數(shù)字應(yīng)用系統(tǒng)平臺(tái),對(duì)數(shù)字信息資源進(jìn)行采集、加工整理并提供服務(wù),圖書(shū)館與讀者之間的供需關(guān)系變得更加密切,一切與知識(shí)資源相關(guān)的要素都將被有機(jī)地整合起來(lái),形成一種面向需求、適應(yīng)變化的圖書(shū)館知識(shí)管理機(jī)制。在這種不斷變化的新環(huán)境下,元數(shù)據(jù)作為一種有效的資源描述方法便會(huì)越來(lái)越顯示出它的重要性和實(shí)用性。
元數(shù)據(jù)是描述數(shù)據(jù)的數(shù)據(jù)[1],專門用來(lái)描述數(shù)據(jù)的內(nèi)容、特征和屬性,并對(duì)數(shù)據(jù)進(jìn)行管理,結(jié)構(gòu)化的數(shù)據(jù)是數(shù)字圖書(shū)館信息組織的根本。具體概括起來(lái),元數(shù)據(jù)對(duì)資源對(duì)象的作用主要有描述和管理兩個(gè)方面。
2.1.1 描述元數(shù)據(jù)
描述元數(shù)據(jù)用于描述或標(biāo)識(shí)信息資源對(duì)象的內(nèi)容、屬性和外觀特征,并對(duì)這個(gè)對(duì)象進(jìn)行定位、管理,且有助于發(fā)現(xiàn)與獲取數(shù)據(jù)。由于描述元數(shù)據(jù)屬于應(yīng)用范圍最廣、應(yīng)用頻率最高的元數(shù)據(jù)類型,通常也可以把描述元數(shù)據(jù)直接稱為元數(shù)據(jù)。針對(duì)每一個(gè)具體的數(shù)字資源的元數(shù)據(jù),也稱為元數(shù)據(jù)記錄。描述元數(shù)據(jù)是整個(gè)元數(shù)據(jù)體系中最主要的元數(shù)據(jù),應(yīng)用廣泛,可以根據(jù)不同的學(xué)科、主題、資源類型、用途等編制不同的描述元數(shù)據(jù)標(biāo)準(zhǔn)。
2.1.2 元數(shù)據(jù)元素項(xiàng)
一個(gè)元數(shù)據(jù)由許多完成不同功能的具體數(shù)據(jù)描述項(xiàng)構(gòu)成,這些具體的數(shù)據(jù)描述項(xiàng)又稱元數(shù)據(jù)元素項(xiàng)或元素。如題名、責(zé)任者、日期、唯一標(biāo)識(shí)符等都是元數(shù)據(jù)中的元素。
2.1.3 修飾詞
修飾詞是組成元素的最小術(shù)語(yǔ)單位。包括:
語(yǔ)義修飾詞:簡(jiǎn)稱修飾詞,對(duì)元素的語(yǔ)義進(jìn)行修飾,提高元素的專指性和精確性。
編碼體系修飾詞:用來(lái)幫助某個(gè)術(shù)語(yǔ)值的上下文信息或解析規(guī)則。其形式包括受控詞表、規(guī)范表或者解析規(guī)則。
2.1.4 描述元數(shù)據(jù)規(guī)范
描述元數(shù)據(jù)規(guī)范也可以稱元數(shù)據(jù)規(guī)范、元數(shù)據(jù)標(biāo)準(zhǔn),是描述某類資源的具體對(duì)象時(shí)所有規(guī)則的集合。一般包括完整描述一個(gè)具體對(duì)象時(shí)所需要的數(shù)據(jù)項(xiàng)集合,以及數(shù)據(jù)項(xiàng)的語(yǔ)義定義、著錄規(guī)則和計(jì)算機(jī)應(yīng)用時(shí)的語(yǔ)法規(guī)則。
2.1.5 元數(shù)據(jù)規(guī)范設(shè)計(jì)指南
元數(shù)據(jù)規(guī)范設(shè)計(jì)指南是設(shè)計(jì)制定某類特定資源所用的元數(shù)據(jù)規(guī)范需要遵照的規(guī)則和方法。元數(shù)據(jù)規(guī)范設(shè)計(jì)指南是抽象化的元數(shù)據(jù),它從更高層次上規(guī)定了元數(shù)據(jù)的功能、結(jié)構(gòu)、格式、設(shè)計(jì)方法、擴(kuò)展規(guī)則、語(yǔ)義語(yǔ)法規(guī)則、元數(shù)據(jù)規(guī)范的結(jié)構(gòu)格式等多方面的內(nèi)容,以保證各種元數(shù)據(jù)規(guī)范的一致性和整體性,在更大范圍內(nèi)實(shí)現(xiàn)數(shù)字圖書(shū)館之間的互操作和數(shù)據(jù)共享。
元數(shù)據(jù)的結(jié)構(gòu)主要指內(nèi)容結(jié)構(gòu)、語(yǔ)法結(jié)構(gòu)和語(yǔ)義結(jié)構(gòu)。
內(nèi)容結(jié)構(gòu)是指元數(shù)據(jù)的元素、修飾詞及其屬性、定義,其中可包含用于描述的通用的核心元素,用于描述某一類型資源的資源類型核心元素,用于描述某個(gè)具體對(duì)象的個(gè)別元素,以及揭示對(duì)象標(biāo)識(shí)、版權(quán)等內(nèi)容的管理性元素。
語(yǔ)法結(jié)構(gòu)是指元數(shù)據(jù)的格式結(jié)構(gòu)及其描述方式。例如用于文本編碼的內(nèi)容元數(shù)據(jù)TEI就包含了4個(gè)部分:頭標(biāo)、正文前內(nèi)容、正文、正文后附錄。目前,主要是采用XML語(yǔ)言和RDF框架用于標(biāo)識(shí)和描述元數(shù)據(jù)的這種格式結(jié)構(gòu)。
語(yǔ)義結(jié)構(gòu)主要是指元數(shù)據(jù)的元素及其修飾詞的定義方法。在這方面可以借鑒采用ISO/IEC11179標(biāo)準(zhǔn),按以下10個(gè)方面定義:
名稱(Name):元素名稱;
標(biāo)識(shí)(Identifier):元素唯一標(biāo)識(shí);
版本(Version):產(chǎn)生該元素的元數(shù)據(jù)版本;
注冊(cè)機(jī)構(gòu)(Registration Authority):注冊(cè)元素的授權(quán)機(jī)構(gòu);
語(yǔ)言(Language):元素說(shuō)明語(yǔ)言;
定義(Definition):對(duì)元素概念與內(nèi)涵的說(shuō)明;
選項(xiàng)(Obligation):說(shuō)明元素是限定必須使用的還是可選擇的(必備性);
數(shù)據(jù)類型(Data type):元素值中所表現(xiàn)的數(shù)據(jù)類型;
最大使用頻率(Maximum Occurrence):元素的最大使用頻次(可重復(fù)性);
注釋(Comment):元素應(yīng)用注釋,用于說(shuō)明子元素情況[2]。
數(shù)字圖書(shū)館是將圖像、文字、聲音等信息數(shù)字化,并通過(guò)網(wǎng)絡(luò)傳輸,從而使信息資源能夠全球共享[3]。簡(jiǎn)單地說(shuō),數(shù)字圖書(shū)館就是以數(shù)字形式存儲(chǔ)和處理信息的圖書(shū)館[4]。對(duì)數(shù)字資源的組織和管理是數(shù)字圖書(shū)館建設(shè)的重點(diǎn),元數(shù)據(jù)作為提供信息資源或數(shù)據(jù)的一種結(jié)構(gòu)化的編碼數(shù)據(jù),是其進(jìn)行的基礎(chǔ)[5]。
數(shù)字圖書(shū)館無(wú)論在哪個(gè)環(huán)境和層面上,都與元數(shù)據(jù)密不可分,或者說(shuō)元數(shù)據(jù)在數(shù)字圖書(shū)館中時(shí)刻都存在和發(fā)揮著作用。
在數(shù)字資源產(chǎn)生、制作、管理、發(fā)布、保存的過(guò)程中,元數(shù)據(jù)在各個(gè)環(huán)節(jié)上發(fā)揮著作用。
3.1.1 元數(shù)據(jù)對(duì)數(shù)字對(duì)象的描述
即對(duì)具體對(duì)象的內(nèi)容和外觀特征進(jìn)行格式化揭示和描述。例如一本數(shù)字化圖書(shū)的篇名、作者、出版者、大小等,以便于用戶的發(fā)現(xiàn)和尋找。
3.1.2 元數(shù)據(jù)對(duì)數(shù)字對(duì)象的管理
即對(duì)數(shù)字對(duì)象進(jìn)行管理的相關(guān)信息的格式化揭示和描述,包括在檢索、存取與顯示一個(gè)數(shù)字對(duì)象時(shí)所需的管理信息,如對(duì)象的標(biāo)識(shí)符;數(shù)字的權(quán)限管理如版權(quán)信息;文件的格式、大小、壓縮算法等特征;文件的上下文相關(guān)信息;在資源數(shù)字化或顯示、利用時(shí)的軟硬件環(huán)境信息等。
3.1.3 元數(shù)據(jù)對(duì)數(shù)字對(duì)象之間結(jié)構(gòu)的描述
一般來(lái)講,數(shù)字對(duì)象很少是一個(gè)實(shí)體的,通常來(lái)說(shuō)是個(gè)復(fù)合對(duì)象。例如一篇數(shù)字格式的學(xué)位論文,有Word格式、PDF格式,PDF格式又分為供免費(fèi)使用的文件以及必須經(jīng)過(guò)許可才能使用的全文文件,這樣一篇學(xué)位論文就對(duì)應(yīng)了3個(gè)實(shí)體對(duì)象,因此,需要對(duì)這些對(duì)象之間的關(guān)系和結(jié)構(gòu)進(jìn)行格式化揭示、描述和組織。
3.1.4 元數(shù)據(jù)對(duì)數(shù)字對(duì)象保存的描述
當(dāng)資源需要存儲(chǔ)和長(zhǎng)期保存時(shí),就要對(duì)其制作信息、保護(hù)條件、轉(zhuǎn)換方式、遷移方法、仿真環(huán)境、封裝方法、保存責(zé)任以及其它相關(guān)技術(shù)細(xì)節(jié)進(jìn)行描述和揭示。
在用戶使用數(shù)字圖書(shū)館的過(guò)程中,元數(shù)據(jù)的主要作用是在門戶網(wǎng)站和應(yīng)用系統(tǒng)中支持對(duì)信息的檢索和發(fā)現(xiàn)。在這個(gè)過(guò)程中,元數(shù)據(jù)可以發(fā)揮如下的作用。
3.2.1 提供準(zhǔn)確和快速的檢索
由于有了元數(shù)據(jù),可以通過(guò)字段檢索快速準(zhǔn)確地得到檢索結(jié)果,而不是“全文檢索”后又要在大量的檢索結(jié)果中大海撈針一般尋找自己所需的信息。所謂字段檢索,即指定檢索詞出現(xiàn)的字段,是指在元數(shù)據(jù)中被標(biāo)引過(guò)的,例如作者、文摘、主題詞、篇名、刊名、書(shū)名、出版者、出版年、圖像格式等。
3.2.2 提供知識(shí)導(dǎo)航功能
在數(shù)字圖書(shū)館門戶網(wǎng)站上為用戶建立基于某一知識(shí)體系的資源導(dǎo)航服務(wù),即由系統(tǒng)從元數(shù)據(jù)的某一特定字段中抽取相關(guān)內(nèi)容,并提供一個(gè)樹(shù)狀結(jié)構(gòu)的概念等級(jí)體系,用戶可以沿著這棵“樹(shù)”進(jìn)入不同的分支,到達(dá)葉子節(jié)點(diǎn),并在節(jié)點(diǎn)看到資源結(jié)果列表。
3.2.3 提供資源索引功能
資源索引功能是指將元數(shù)據(jù)中某一字段中的概念按字母順序線性排列起來(lái),不分等級(jí)。用戶通過(guò)檢索可以定位在索引中的任意某個(gè)位置,并瀏覽在這個(gè)位置附近的所有詞語(yǔ),進(jìn)而查詢所需詞語(yǔ)對(duì)應(yīng)的結(jié)果列表。
3.2.4 在報(bào)道和揭示服務(wù)中的作用
元數(shù)據(jù)也可以對(duì)服務(wù)過(guò)程、服務(wù)項(xiàng)目等進(jìn)行揭示和報(bào)道。例如,一個(gè)大學(xué)數(shù)字圖書(shū)館門戶網(wǎng)站的服務(wù)內(nèi)容元數(shù)據(jù)就包括:統(tǒng)一認(rèn)證、書(shū)目檢索、統(tǒng)一檢索、學(xué)科導(dǎo)航、資源類型導(dǎo)航、全文獲取服務(wù)、咨詢服務(wù)、用戶培訓(xùn)、在線幫助、個(gè)性化定制、動(dòng)態(tài)消息、網(wǎng)站介紹、網(wǎng)站索引、站內(nèi)檢索、相關(guān)鏈接等。這個(gè)門戶元數(shù)據(jù)既是設(shè)計(jì)數(shù)字圖書(shū)館門戶時(shí)使用的元數(shù)據(jù),也向用戶全面科學(xué)地揭示了數(shù)字圖書(shū)館的相關(guān)服務(wù)。
下面是用都柏林(Dublin Core)元數(shù)據(jù)對(duì)一篇網(wǎng)頁(yè)進(jìn)行描述的實(shí)例。
3.2.5 在數(shù)字資源開(kāi)放存取的作用
所謂“開(kāi)放存取”是針對(duì)傳統(tǒng)的基于訂閱的出版模式而言的,即是指由作者直接在線出版論文,在互聯(lián)網(wǎng)公共領(lǐng)域里可以被免費(fèi)獲取,允許用戶閱讀、下載、拷貝、傳遞、打印、檢索、超級(jí)鏈接,并為此建立索引或者用于其它任何合法用途[6]。它是基于互聯(lián)網(wǎng)的一種新型學(xué)術(shù)交流方式和出版模式[7],也是一種行之有效的學(xué)術(shù)出版模式,這其中包括正式發(fā)表論文的后印本,正式出版的著作、教材、會(huì)議論文集與研究報(bào)告等學(xué)術(shù)成果,非正式出版的論文的預(yù)印本、學(xué)位論文、工作論文、各種原始數(shù)據(jù)和元數(shù)據(jù)、教學(xué)參考資料、照片、圖表、地圖以及數(shù)據(jù)庫(kù)、政府出版物、網(wǎng)站等。
元數(shù)據(jù)揭示的是數(shù)字對(duì)象的內(nèi)容、特征和屬性,那么在元數(shù)據(jù)加工制作的過(guò)程中,就必須遵循相關(guān)的規(guī)則和格式,這些規(guī)則和格式的集合就是元數(shù)據(jù)規(guī)則。
隨著各種元數(shù)據(jù)標(biāo)準(zhǔn)的出現(xiàn),元數(shù)據(jù)的互操作性問(wèn)題也就逐漸顯現(xiàn)出來(lái)。元數(shù)據(jù)的互操作性的好壞直接影響了各種不同信息資源的檢索、共享和互相兼容性。元數(shù)據(jù)的互操作主要是通過(guò)語(yǔ)義互操作和結(jié)構(gòu)與語(yǔ)法的互操作來(lái)實(shí)現(xiàn)的[8]。例如,以Dublin Core的15個(gè)核心元素為基礎(chǔ),使不同元數(shù)據(jù)中相似相近的元數(shù)據(jù)元素相互映射,從而實(shí)現(xiàn)了語(yǔ)義上的互操作。又比如資源描述框架RDF的制定為元數(shù)據(jù)在互聯(lián)網(wǎng)的應(yīng)用提供了一個(gè)基礎(chǔ)結(jié)構(gòu),使不同元數(shù)據(jù)間可以互相操作,可擴(kuò)展標(biāo)記語(yǔ)言XML,又為元數(shù)據(jù)在語(yǔ)法上提供了互通性,用RDF/XML創(chuàng)建元數(shù)據(jù)格式時(shí),借用其它元數(shù)據(jù)集的一些元素,增加了元數(shù)據(jù)間語(yǔ)義的互通性,很容易就實(shí)現(xiàn)了互操作。
由于元數(shù)據(jù)規(guī)范的應(yīng)用,保持了元數(shù)據(jù)結(jié)構(gòu)的一致性,為信息的有效組織、元數(shù)據(jù)之間的互操作、元數(shù)據(jù)的廣泛應(yīng)用和共享奠定了基礎(chǔ),使數(shù)字圖書(shū)館的可持續(xù)發(fā)展成為可能。
數(shù)字圖書(shū)館作為信息時(shí)代的產(chǎn)物正處在篷勃發(fā)展的階段,而元數(shù)據(jù)是數(shù)字圖書(shū)館許多關(guān)鍵技術(shù)的基礎(chǔ),有了這個(gè)基礎(chǔ),數(shù)字圖書(shū)館的信息管理才能更趨合理化和科學(xué)化,資源的利用率也會(huì)大大提高。
[1] 王英芬.元數(shù)據(jù)模式組織網(wǎng)絡(luò)信息資源研究[J].農(nóng)業(yè)圖書(shū)情報(bào)學(xué)刊,2009(11):50-52.
[2] 肖瓏,趙亮.中文元數(shù)據(jù)概念與實(shí)例[M].北京:北京圖書(shū)館出版社,2007.
[3] 龔永紅.DC元數(shù)據(jù)及其在數(shù)字圖書(shū)館建設(shè)中的應(yīng)用[J].科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì),2010,20(31):78-80.
[4] 夏立新,黃曉斌.?dāng)?shù)字圖書(shū)館導(dǎo)論[M].北京:科學(xué)出版社,2009.
[5] 盧笑明,唐琳,李學(xué)鳴.元數(shù)據(jù)與圖書(shū)館數(shù)字資源組織管理[J].農(nóng)業(yè)網(wǎng)絡(luò)信息,2010(12):70-71.
[6] 陳紅星,張淑芳.網(wǎng)絡(luò)原生數(shù)字資源:概念特征與類型[J].圖書(shū)館學(xué)刊,2010(5):1-4.
[7] 關(guān)萍,吳立東.開(kāi)放獲取運(yùn)動(dòng)在高校圖書(shū)館的發(fā)展策略[J].黑龍江科技信息,2010(35):188-189.
[8] 吳開(kāi)華,邢春曉,羅德胤.?dāng)?shù)字圖書(shū)館元數(shù)據(jù)研究[J].中國(guó)圖書(shū)館學(xué)報(bào),2002(3):43-46.