張文亮 郭婧
摘要:梳理國內(nèi)數(shù)字圖書館標(biāo)準(zhǔn)化研究領(lǐng)域的相關(guān)文獻,利用文獻計量和知識圖譜分析的方法,總結(jié)目前該領(lǐng)域的研究熱點主要集中在元數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)字圖書館標(biāo)準(zhǔn)體系、特色數(shù)據(jù)庫標(biāo)準(zhǔn)以及版權(quán)研究幾個方面,分析目前研究中存在標(biāo)準(zhǔn)規(guī)范體系研究不足、內(nèi)容研究尚未完善、缺乏標(biāo)準(zhǔn)應(yīng)用指南研究等不足之處。
關(guān)鍵詞:數(shù)字圖書館;標(biāo)準(zhǔn)化;綜述
引言
我國數(shù)字圖書館的建設(shè)開始于20世紀(jì)90年代,為了更好地促進其發(fā)展,標(biāo)準(zhǔn)規(guī)范工作緊隨其后展開。CALIS從2002年開始進行相關(guān)研究,2003年底組織人員正式編制“CALIS子項目建設(shè)技術(shù)標(biāo)準(zhǔn)與規(guī)范”;國家數(shù)字圖書館工程從2005年開始建設(shè)數(shù)字圖書館標(biāo)準(zhǔn)規(guī)范,迄今已有30余項。實踐表明,標(biāo)準(zhǔn)規(guī)范的建設(shè)是數(shù)字圖書館發(fā)展的重要保障。
截止到目前,盡管國內(nèi)已經(jīng)有關(guān)于數(shù)字圖書館標(biāo)準(zhǔn)化研究的綜述,但是大都發(fā)表于2010年以前,距離當(dāng)前時間較長。此外,研究內(nèi)容多是對數(shù)字圖書館項目標(biāo)準(zhǔn)的概述。本文利用文獻計量統(tǒng)計以及知識圖譜分析的方法,在分析相關(guān)文獻的基礎(chǔ)上,揭示目前該領(lǐng)域的研究主題,總結(jié)其不足,以期為數(shù)字圖書館標(biāo)準(zhǔn)化領(lǐng)域研究提供借鑒。
1、研究設(shè)計
1.1文獻來源
為了對數(shù)字圖書館標(biāo)準(zhǔn)化研究的發(fā)展脈絡(luò)有系統(tǒng)性的掌握,本文對截止到2017年12月30日的CNKI中國知網(wǎng)數(shù)據(jù)庫的期刊文獻進行了全面檢索。在CNKI期刊全文數(shù)據(jù)庫的“圖書情報與數(shù)字圖書館”子庫中,將主題設(shè)置為“數(shù)字圖書館”或含“電子圖書館”或含“虛擬圖書館”或含“復(fù)合圖書館”,作為第一組檢索詞,并以“標(biāo)準(zhǔn)”“規(guī)范”“協(xié)議”“規(guī)則”“指南”為第二組檢索詞進行檢索,共獲得632篇核心期刊文獻,對這些文獻進行查重,并剔除無效征文通知等不相關(guān)文獻后,獲取有效文獻441篇。
1.2方法選擇
利用Bibexcel和Ucinet軟件對所獲取到的有效文獻進行文獻計量統(tǒng)計與知識圖譜分析。文獻計量統(tǒng)計包括年代分布、作者發(fā)文量分布,而知識圖譜則是利用從文獻中提取到的關(guān)鍵詞繪制知識圖譜。
2、文獻計量統(tǒng)計
2.1年代分布
數(shù)字圖書館標(biāo)準(zhǔn)化研究領(lǐng)域的發(fā)文量很大程度上可以表現(xiàn)出學(xué)者對該領(lǐng)域的關(guān)注度以及此領(lǐng)域的發(fā)展情況。對1990年至2017的441篇文獻進行年代統(tǒng)計,分析每年發(fā)文量以及出現(xiàn)的原因,見圖1。
由圖1可知,該領(lǐng)域的研究呈階段性發(fā)展。1996年,國家圖書館申請立項“數(shù)字式圖書館實驗項目”,主要對各類相關(guān)標(biāo)準(zhǔn)進行研究;1997年出臺的《文化事業(yè)發(fā)展“九五”計劃和2010年遠景目標(biāo)綱要》提出要使文獻資源數(shù)字化的進程加快以及對數(shù)字化圖書館進行研究;2001年立項的數(shù)字圖書館工程中,一項重要的內(nèi)容就是標(biāo)準(zhǔn)規(guī)范建設(shè),同年,CSDL項目正式啟動;2002年,CALIS開始對相關(guān)的國際標(biāo)準(zhǔn)進行研究。在這些政策以及項目的帶動下,我國數(shù)字圖書館標(biāo)準(zhǔn)化研究開始起步,至2005年發(fā)文量總體呈上升趨勢,并達到高峰期。2005至2013年研究進入慢速發(fā)展階段,發(fā)文數(shù)量逐漸減少,但總量依舊多于2005年之前的發(fā)文數(shù)量。2013至現(xiàn)在,標(biāo)準(zhǔn)化研究再次引起該領(lǐng)域?qū)W者的關(guān)注,發(fā)文量呈上升趨勢。2016年6月,《全國圖書館標(biāo)準(zhǔn)化工作“十三五”規(guī)劃綱要》中指出要研究建立一個圖書館標(biāo)準(zhǔn)規(guī)范體系以適應(yīng)數(shù)字圖書館事業(yè)的建設(shè)需求。在這些政策的帶動下,對數(shù)字圖書館標(biāo)準(zhǔn)化的研究探索得到更加廣泛的關(guān)注。
2.2作者發(fā)文量統(tǒng)計
對上述文獻的作者進行統(tǒng)計分析,441篇文獻的共同作者共計500位,并統(tǒng)計了作者分布情況:88.2%的作者只有一篇相關(guān)領(lǐng)域的研究成果,有兩篇以上研究成果的作者只占到了11.8%,這表明對數(shù)字圖書館標(biāo)準(zhǔn)化研究的核心作者相對不集中,見表1。
3、詞頻分析與可視化
詞頻分析是指利用Bibexcel軟件對有效文獻中的關(guān)鍵詞進行提取,在人工優(yōu)化的基礎(chǔ)上合并同類關(guān)鍵詞,并利用Excel軟件進行詞頻統(tǒng)計分析??梢暬治鰟t是在此基礎(chǔ)上利用可視化軟件將關(guān)鍵詞之間的聯(lián)系以知識圖譜的形式展示出來,并通過節(jié)點的大小、節(jié)點之間連線的粗細(xì)區(qū)別各研究主題的重要程度。
3.1詞頻分析
對441篇有效文獻進行關(guān)鍵詞的統(tǒng)計,經(jīng)過去重、合并后共得到494個有效關(guān)鍵詞。通過Excel統(tǒng)計頻次≥6的高頻關(guān)鍵詞,見表2。
從表2中可以看出,除“數(shù)字圖書館”、“圖書館”、“標(biāo)準(zhǔn)”這樣沒有分析意義的詞外,排名前十的高頻關(guān)鍵詞包括:元數(shù)據(jù)、互操作、合理使用、XML、元數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)字資源、都柏林核心元數(shù)據(jù)、數(shù)字化、信息資源、著作權(quán)。由此可見,元數(shù)據(jù)、合理使用以及互操作等是數(shù)字圖書館標(biāo)準(zhǔn)化領(lǐng)域的研究重點。
3.2可視化分析
在對關(guān)鍵詞統(tǒng)計的基礎(chǔ)上,利用Ucinet和Netdraw構(gòu)建了關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖譜,見圖2。
圖2中圍繞在數(shù)字圖書館周圍節(jié)點較大、連線較粗的關(guān)鍵詞有元數(shù)據(jù)、合理使用、互操作。表明我國學(xué)者在這三個方面研究最多。從“元數(shù)據(jù)”節(jié)點出發(fā),輻射出較多的連線,包括都柏林核心元數(shù)據(jù)、元數(shù)據(jù)標(biāo)準(zhǔn)、XML、MARC等,這些研究主題之間的聯(lián)系較為緊密。此外,技術(shù)標(biāo)準(zhǔn)、評價標(biāo)準(zhǔn)、分布式檢索、信息安全管理等主題雖然與數(shù)字圖書館相關(guān),但是彼此之間并沒有聯(lián)系,呈分散式分布,表明這些主題已經(jīng)引起國內(nèi)學(xué)者的關(guān)注,但是到目前為止并沒有形成研究熱點。
4、主題熱點研究
通過對有效文獻的詞頻與可視化分析,將目前數(shù)字圖書館標(biāo)準(zhǔn)化領(lǐng)域的研究主題歸結(jié)為以下幾個方面:
4.1元數(shù)據(jù)標(biāo)準(zhǔn)
元數(shù)據(jù)是一種結(jié)構(gòu)化的編碼數(shù)據(jù),用來對數(shù)據(jù)進行描述。隨著資源的開放共享,不同的元數(shù)據(jù)格式以及標(biāo)準(zhǔn)體系大量涌現(xiàn),元數(shù)據(jù)的標(biāo)準(zhǔn)化直接影響數(shù)字圖書館的建設(shè)發(fā)展。國內(nèi)學(xué)者很早就開始對元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范進行研究,包括古籍元數(shù)據(jù)、音樂元數(shù)據(jù)、拓片元數(shù)據(jù)、電子論文元數(shù)據(jù)等,一致認(rèn)為元數(shù)據(jù)的標(biāo)準(zhǔn)化是數(shù)字化建設(shè)的需要,是基礎(chǔ)性工程,也是促進元數(shù)據(jù)在跨學(xué)科資源描述過程中使用的重要保障?;谠獢?shù)據(jù)標(biāo)準(zhǔn)獨特性、多元化的特點,數(shù)字化的發(fā)展要求不同的元數(shù)據(jù)之間建立一種機制,實現(xiàn)互操作性。而語義一致性、語法一致性等是元數(shù)據(jù)互操作性的關(guān)鍵。
4.2數(shù)字圖書館標(biāo)準(zhǔn)體系
數(shù)字圖書館標(biāo)準(zhǔn)體系是標(biāo)準(zhǔn)的集合,它按照一定的邏輯體系囊括了該領(lǐng)域所有相關(guān)的標(biāo)準(zhǔn)。標(biāo)準(zhǔn)體系的建立可增強現(xiàn)有標(biāo)準(zhǔn)的可操作性、統(tǒng)一不同系統(tǒng)之間的標(biāo)準(zhǔn)規(guī)范,對數(shù)字圖書館建設(shè)的發(fā)展舉足輕重。數(shù)字圖書館標(biāo)準(zhǔn)規(guī)范建設(shè)主要包括資源的加工、組織、服務(wù)、互操作、長期保存與體系化建設(shè)。關(guān)于數(shù)字圖書館標(biāo)準(zhǔn)體系的探討,趙悅提出了從標(biāo)準(zhǔn)層級體系和標(biāo)準(zhǔn)內(nèi)容體系兩方面構(gòu)建數(shù)字圖書館標(biāo)準(zhǔn)規(guī)范體系框架。標(biāo)準(zhǔn)層級體系包括:國家、行業(yè)、地方、機構(gòu)層級;標(biāo)準(zhǔn)內(nèi)容體系方面包括:資源、服務(wù)、管理和技術(shù),并指出數(shù)字圖書館標(biāo)準(zhǔn)規(guī)范在未來5-10年內(nèi)的建設(shè)重點就是服務(wù)和管理。
4.3特色數(shù)據(jù)庫標(biāo)準(zhǔn)
特色數(shù)據(jù)庫是指各單位根據(jù)其需求建立的數(shù)據(jù)庫,主要用于其特色資源的保存和推廣。但是在推廣過程中,因建設(shè)標(biāo)準(zhǔn)的不同,造成資源難以共享。對此,王愛華等人提出特色數(shù)據(jù)庫在建設(shè)時,其標(biāo)準(zhǔn)可以借鑒并采用《我國數(shù)字圖書館標(biāo)準(zhǔn)規(guī)范研究》項目中介紹的系列相關(guān)標(biāo)準(zhǔn)、元數(shù)據(jù)標(biāo)引格式規(guī)范、文獻著錄的有關(guān)國際標(biāo)準(zhǔn)和國家標(biāo)準(zhǔn)等。
4.4版權(quán)研究
版權(quán)問題一直困擾著數(shù)字圖書館的發(fā)展,也是數(shù)字圖書館研究的重點。2004年,谷歌數(shù)字圖書館誕生,隨后接踵而來的就是版權(quán)問題。肖東梅認(rèn)為在現(xiàn)行的版權(quán)框架下,先授權(quán)后使用的版權(quán)規(guī)則是谷歌在數(shù)字圖書館項目中難以逾越的壁壘,而谷歌在版權(quán)問題中積極的探索促使數(shù)字圖書館版權(quán)問題受到重視。針對如何解決數(shù)字圖書館建設(shè)中出現(xiàn)的版權(quán)問題,秦珂學(xué)者提到了補償金制度。當(dāng)然,在對館藏文獻數(shù)字化以及網(wǎng)絡(luò)資源館藏化的過程中,版權(quán)問題也是不容忽視。
5、結(jié)語
總體而言,通過文獻計量與可視化分析可以知道目前我國數(shù)字圖書館標(biāo)準(zhǔn)化領(lǐng)域的研究主要集中在元數(shù)據(jù)、互操作、特色數(shù)據(jù)庫標(biāo)準(zhǔn)、版權(quán)以及數(shù)字圖書館標(biāo)準(zhǔn)體系等方面。在信息檢索、存儲、服務(wù)、安全等方面也有涉及,但是研究較少。本文在梳理該領(lǐng)域研究主題的過程中,也發(fā)現(xiàn)其存在的不足,主要表現(xiàn)在以下幾個方面:其一是標(biāo)準(zhǔn)規(guī)范體系研究不足。現(xiàn)有的對標(biāo)準(zhǔn)規(guī)范體系的研究多數(shù)在數(shù)字資源生命周期的基礎(chǔ)上展開,而隨著數(shù)字圖書館建設(shè)的深入發(fā)展,標(biāo)準(zhǔn)規(guī)范體系需要不斷的完善,才能更好地指導(dǎo)數(shù)字圖書館的建設(shè)發(fā)展。其二是內(nèi)容研究尚未完善。數(shù)字圖書館標(biāo)準(zhǔn)化的研究應(yīng)該符合一個完整的數(shù)字資源生命周期。目前關(guān)于資源建設(shè)的研究較多,對資源的長期保存、管理、服務(wù)等方面的研究還有所欠缺。其三是缺乏標(biāo)準(zhǔn)應(yīng)用指南研究。數(shù)字圖書館建設(shè)項目的發(fā)展推動了數(shù)字圖書館標(biāo)準(zhǔn)規(guī)范的建設(shè)。在重大項目標(biāo)準(zhǔn)規(guī)范建設(shè)成果中,只有國家數(shù)字圖書館工程制定了標(biāo)準(zhǔn)規(guī)范的應(yīng)用指南。應(yīng)用指南的缺失會使得標(biāo)準(zhǔn)規(guī)范建設(shè)成果難以運用到實踐中。