張 莉
(南昌師范學(xué)院,江西 南昌 330032)
數(shù)字圖書館這一概念最早誕生于美國,1994年美國國家科學(xué)基金會(National Science Founda?tion,NSF)、國防部先進研究項目局(Advanced Re?search Projects Agency,DARPA)、國家航空航天局(National Aeronautics & Space Administration,NASA)聯(lián)合資助美國六所大學(xué)的因特網(wǎng)技術(shù)基礎(chǔ)設(shè)施即數(shù)字圖書館項目[1]。我國是從1995 年開始從國外引薦、描述和研究數(shù)字圖書館[2]。至今數(shù)字圖書館已經(jīng)歷25 周年的發(fā)展變遷。對數(shù)字圖書館研究現(xiàn)狀、研究前沿和趨勢進行文獻計量分析,歸納最近五年境內(nèi)外數(shù)字圖書館研究主題,對比分析境內(nèi)外數(shù)字圖書館研究熱點的異同,查找研究領(lǐng)域的遺漏,有利于了解自身的定位,明確我國數(shù)字圖書館研究和建設(shè)努力的方向。
采用文獻研究法,從Web of Science(WOS)核心庫中查找2015 年來有關(guān)數(shù)字圖書館的文獻進行文獻計量分析。以署名“Peoples R China”區(qū)分境內(nèi)外文獻,署名為“Peoples R China”的是境內(nèi)文獻。學(xué)科范圍選擇信息科學(xué)與圖書館學(xué)(IN?FORMATION SCIENCE LIBRARY SCIENCE)和計算機科學(xué)與信息系統(tǒng)(COMPUTER SCIENCE IN?FORMATION SYSTEMS)。境內(nèi)文獻WOS 檢索式:((TS="digital library" OR TS="DIGITAL LI?BRARIES" OR TI=digital library) AND PY=(2015-2019)AND(AD="Peoples R China")AND(WC=IN?FORMATION SCIENCE LIBRARY SCIENCE OR WC=COMPUTER SCIENCE INFORMATION SYS?TEMS) NOT (TS="ACM Digital Library"))。境外文獻WOS 獻檢索式:(TS="digital library" OR TS="DIGITAL LIBRARIES" OR TI=digital library)AND PY=(2015-2019) AND (WC=INFORMATION SCIENCE LIBRARY SCIENCE OR WC=COMPUT?ER SCIENCE INFORMATION SYSTEMS) NOT(AD="Peoples R China" OR TS="ACM Digital Li?brary")。檢索語言選擇英語(English),文獻類型選擇所有文獻類型。引文索引選擇Science Cita?tion Index Expanded(SCI-EXPANDED)、Social Sci?ences Citation Index (SSCI)、Arts & Humanities Ci?tation Index (A&HCI)?!癆CM Digital Library”為過濾的無關(guān)文獻,并手工進一步過濾無關(guān)文獻。最終獲得境外文獻302篇,境內(nèi)文獻65篇。
分析工具采用SATI、Citespace 進行關(guān)鍵詞共現(xiàn)分析、社會網(wǎng)絡(luò)分析、聚類分析等知識圖譜分析[3][4]。采用SATI 統(tǒng)計詞頻和繪制社會網(wǎng)絡(luò)圖譜,進行共詞矩陣分析。運用Citespace 統(tǒng)計詞頻,計算中心度(Centrality),進行關(guān)鍵詞共現(xiàn)分析以及聚類分析。中心度(Centrality)指節(jié)點在社會網(wǎng)絡(luò)中的中心地位,取值范圍為[0,1],其值越高該節(jié)點在網(wǎng)絡(luò)中越重要,越可能是研究熱點詞。中心度的計算公式如下:
xij表示i 與j 有無關(guān)聯(lián),1 表示有關(guān)聯(lián),0 表示無關(guān)聯(lián)。G表示節(jié)點數(shù)量。聚類分析是運用某種相似度計算算法將對象集合分組為若干類似的對象組成的多組分類的分析方法。本文采用對數(shù)似然比(log-likelihood rate,LLR)算法分析計算關(guān)鍵詞和文獻相似度并進行分組聚類,以便概括聚類文獻的研究內(nèi)容[5]。突發(fā)性(Burst)檢測是Citespace根據(jù)Kleinberg于2002年提出的算法,按年度分別探測發(fā)文數(shù)量突然增加的情況,值較大表示關(guān)鍵詞在該年度的研究熱度上升[6]。本文采用突發(fā)性檢測指標來探測研究熱度上升的新興研究領(lǐng)域的關(guān)鍵詞,但均未顯示出突發(fā)性,表明還沒有在哪個研究領(lǐng)域形成突發(fā)的研究熱潮。
2.1.1文獻作者
境外共有685 位作者參與了數(shù)字圖書館研究,第一作者270位,第一作者發(fā)文量最高的作者是美國阿拉巴馬大學(xué)(University of Alabama)的Albertson Dan,發(fā)文4 篇。他的主要研究領(lǐng)域是可視化信息檢索、數(shù)字圖書館視頻資源檢索等。境內(nèi)作者共有194 位,第一作者53 位,第一作者發(fā)文量最高的作者是武漢大學(xué)的查先進(ZhaX?ianjin),共發(fā)表6 篇文獻。他的主要研究領(lǐng)域是社交媒體信息處理、移動圖書館(包含可用性、易用性、用戶體驗、移動上下文環(huán)境等研究)、電子服務(wù)質(zhì)量(包含信息、系統(tǒng)和服務(wù)等)、數(shù)字圖書館技術(shù)接受模型等。以年度發(fā)文頻次兩篇以上為統(tǒng)計標準,繪制出核心作者合作網(wǎng)可視化圖譜如圖1、圖2所示。境內(nèi)最大的核心作者合作團隊是武漢科技大學(xué)的嚴亞蘭(Yalan Yan)、查先進等5人,3人以上的合作團隊有2個。嚴亞蘭主要研究數(shù)字圖書館信息獲取自我效能感,并且與查先進的研究領(lǐng)域有合作研究。境外最大的核心作者合作團隊是比利時根特大學(xué)(University of Gh?ent)的Erik Mannens 等5 人,3 人以上的合作團隊有4個。Erik Mannens團隊主要研究關(guān)聯(lián)數(shù)據(jù)、語義檢索、社交媒體等。可見以上團隊都有各自的研究領(lǐng)域,核心作者團隊的重要作用在于開拓領(lǐng)域研究的廣度和深度、推動學(xué)科研究與發(fā)展。
圖1 境內(nèi)核心作者合作可視化圖譜
圖2 境外核心作者合作可視化圖譜
2.1.2發(fā)文機構(gòu)
表1 發(fā)文機構(gòu)
發(fā)文量排名前5的機構(gòu)如表1所示。繪制機構(gòu)合作可視化圖譜如圖3、圖4 所示。武漢大學(xué)發(fā)文量17 篇遠超境內(nèi)外其它機構(gòu),且中心度(Centrality)最高為0.13,與武漢科技大學(xué)和華中師范大學(xué)等11所機構(gòu)具有合作關(guān)系,表明武漢大學(xué)在數(shù)字圖書館研究方面顯示出絕對優(yōu)勢。由圖3的圖譜可見已經(jīng)形成了兩個較大的機構(gòu)合作網(wǎng),一個是以武漢大學(xué)和華中師范大學(xué)為中心形成了一支強大的機構(gòu)合作網(wǎng),另一個分支是以南京大學(xué)為中心的機構(gòu)合作網(wǎng)。
圖3 境內(nèi)機構(gòu)合作可視化圖譜
圖4 境外機構(gòu)合作可視化圖譜
2.1.3國家和地區(qū)發(fā)文分析
表2 國家和地區(qū)發(fā)文情況
圖5 國家和地區(qū)合作可視化圖譜
國家和地區(qū)的發(fā)文情況如表2所示。美國發(fā)文量123篇最高且遠超其它國家和地區(qū)。中國境內(nèi)發(fā)文量64篇排名第二,同時境內(nèi)的發(fā)文中心度比較高,說明近年來中國境內(nèi)與其它國家和地區(qū)的合作較為廣泛。繪制國家和地區(qū)合作可視化圖譜如圖5 所示,紫色外圈表示中心度較強的節(jié)點,連線粗細表示合作強度,節(jié)點大小表示發(fā)文量。由圖5可知美國、中國、西班牙和英國是數(shù)字圖書館領(lǐng)域研究的四個中心國家。中國境內(nèi)與眾多國家和地區(qū)存在科研合作關(guān)系,遍布亞洲、北美洲、歐洲、非洲、大洋洲等國家和地區(qū),顯示出境內(nèi)注重與境外相互學(xué)習(xí)和研究的良好態(tài)勢。
2.2.1 關(guān)鍵詞共現(xiàn)比較分析
關(guān)鍵詞共現(xiàn)分析是根據(jù)同一篇文獻中關(guān)鍵詞共現(xiàn)頻率繪制以關(guān)鍵詞為頂點、共現(xiàn)頻率為邊權(quán)值的復(fù)雜的關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)[7]。境內(nèi)外文獻高頻關(guān)鍵詞如表3所示,各取詞頻排名前25位的關(guān)鍵詞。
表3 境內(nèi)外文獻高頻關(guān)鍵詞
interface pattern evaluation network impact experience search technology acceptance model mobile library higher education usability 2 2 2 2 2 2 2 2 2 2 2 0.37 0 0.41 0 0 0.06 0.05 0 0 0 0 ontology linked data usability technology behavior service user interface digital humanity institutional repository knowledge classification 8 8 8 8 7 7 6 6 6 5 5 0.05 0.04 0.05 0.06 0.03 0.07 0.02 0.01 0.06 0.03 0.03
境內(nèi)外共同排在前幾位的高頻關(guān)鍵詞是模型(model)、服務(wù)(service)、高校圖書館(academic library)、檢索(retrieval)、系統(tǒng)(system)、技術(shù)(technology)、因特網(wǎng)(web)。模型(model)是中心度最高的熱點關(guān)鍵詞。與模型共現(xiàn)最高(即最相關(guān))的關(guān)鍵詞是在線(online,在線信息系統(tǒng)等)、科學(xué)論文推薦系統(tǒng)(scientific paper recommender system)、協(xié)同過濾(collaborative filtering)、元數(shù)據(jù)(metadata)、技術(shù)(technology)。對模型的研究表明數(shù)字圖書館正處于應(yīng)用研究階段,各種技術(shù)、系統(tǒng)、在線資源和服務(wù)模型有待探索、挖掘、驗證和改進。與服務(wù)(service)共現(xiàn)頻率最高的關(guān)鍵詞是信息技術(shù)(information technology)、感知有用性(perceived usefulness)、采納(adoption)、信息科學(xué)(Information sciences)、信息生態(tài)(Information ecology)。與高校圖書館(academic library)共現(xiàn)頻率最高的關(guān)鍵詞是電子資源(electronic re?source)、未來(future)、用戶研究(user study)、滿意度(satisfaction)、信息管理(information manage?ment)、數(shù)據(jù)分析(data analysis)。檢索(retrieval)關(guān)鍵詞具有較高的中心度,是與系統(tǒng)設(shè)計(de?sign)、用戶(user)、信息查找行為(information seeking behavior)、搜索引擎(engine)最相關(guān)的研究。
學(xué)界探討對知識(knowledge)的組織、分析和查找(search)[8]。數(shù)字圖書館的主要用戶群體之一是學(xué)生(student),因此學(xué)界開展了大學(xué)學(xué)生數(shù)字圖書館使用行為[9],電子借閱等研究。學(xué)界分析研究用戶界面(user interface),探討人機交互、用戶自我效能和減少信息負荷等[10]。影響(im?pact)是對數(shù)字圖書館技術(shù)、模型、服務(wù)等的用戶使用影響因素進行調(diào)查和研究[11],是從用戶使用的角度開展實證研究。可用性(usability)是對數(shù)字圖書館的可用性測試評價研究[12],它旨在改進數(shù)字圖書館應(yīng)用系統(tǒng)的開發(fā)和服務(wù)設(shè)計。
分析境外不同的熱點關(guān)鍵詞,境內(nèi)在一些領(lǐng)域研究不足需要加緊研究。用戶研究(user study)應(yīng)該放在數(shù)字圖書館建設(shè)的重要位置,體現(xiàn)以讀者為本的服務(wù)宗旨。境內(nèi)還應(yīng)加強人機交互、使用日志、查詢界面等研究,分析用戶使用行為(behavior)[13]。加強數(shù)字圖書館數(shù)據(jù)管理(management)和分析的研究,如個人生成學(xué)習(xí)教育資源的管理[14]。加強數(shù)字圖書館技術(shù)研究,如元數(shù)據(jù)(metadata)、本體(ontology)、關(guān)聯(lián)數(shù)據(jù)(linked data)、信息查詢分類(classification)等研究。加強機構(gòu)知識庫(institutional repository)和數(shù)字人文(digital humanity)研究。
2.2.2 關(guān)鍵詞聚類分析
(一)境內(nèi)文獻關(guān)鍵詞聚類分析
運用Citespace 對境內(nèi)文獻關(guān)鍵詞進行聚類分析并歸納研究內(nèi)容,將關(guān)鍵詞分成三組類別,各組S值大于0.7表明聚類內(nèi)部聯(lián)系非常緊密,聚類是高效率令人信服的[15],選取LLR算法處理后權(quán)值較大者為聚類標簽,如表4所示。
表4 境內(nèi)文獻關(guān)鍵詞聚類
聚類0,數(shù)字圖書館系統(tǒng)與服務(wù)研究。聚類1,信息處理和檢索技術(shù)研究。聚類2,以用戶服務(wù)視角研究數(shù)字圖書館信息獲取服務(wù)。
(二)境外文獻關(guān)鍵詞聚類分析
運用Citespace 對境外文獻關(guān)鍵詞進行聚類分析和歸納,將關(guān)鍵詞分成七組類別,各組S值在0.68以上,選取LLR算法處理后的權(quán)重較大的關(guān)鍵詞作為標簽,如表5所示。
表5 境外文獻關(guān)鍵詞聚類
聚類0,數(shù)字圖書館系統(tǒng)研究。具體可分為幾個研究維度:(1)移動圖書館系統(tǒng)研究。(2)數(shù)字圖書館系統(tǒng)功能研究。聚類1,數(shù)字圖書館智能信息處理研究。具體可分為幾個研究維度:(1)訪問控制研究。探討建立多級本體的數(shù)字圖書館體系結(jié)構(gòu),根據(jù)不同用戶的權(quán)限進行不同領(lǐng)域概念的受控訪問[16]。(2)推薦系統(tǒng)研究。(3)數(shù)字圖書館資源挖掘和利用研究,包含使用數(shù)據(jù)、作者、期刊、引文等的分析研究。聚類2,視覺和交互式檢索研究。聚類3,在線圖書館資源和服務(wù)研究。具體可分為幾個研究維度:(1)從圖書館員視角研究如何提供在線資源服務(wù)。(2)從用戶視角研究在線圖書館資源及服務(wù)。(3)研究在線資源和服務(wù)的質(zhì)量。聚類4,數(shù)字圖書館檢索界面研究。具體可分為幾個研究維度:(1)可視化、情境化界面研究。(2)分布式界面研究。聚類5,機構(gòu)知識庫研究。具體可分為幾個研究維度:(1)機構(gòu)知識庫價值研究。(2)機構(gòu)知識庫數(shù)據(jù)管理、共享和重用研究。(3)機構(gòu)知識庫開放獲取研究。聚類6,元數(shù)據(jù)、本體和語義標注研究。具體可分為幾個研究維度:(1)運用元數(shù)據(jù)增強數(shù)字館藏的可查找性和可交換性。(2)構(gòu)建本體增強查詢功能。(3)探索語義標注的數(shù)字圖書館語義web服務(wù)。
數(shù)字圖書館研究方興未艾。對發(fā)文量、作者、研究機構(gòu)、國家和地區(qū)的WOS 文獻計量分析,多方位理清了數(shù)字圖書館前沿研究的現(xiàn)狀,可作為相關(guān)機構(gòu)或研究人員的參考。對境內(nèi)文獻的計量分析可以把握境內(nèi)研究現(xiàn)狀,查找研究差距。境內(nèi)還有待向視覺和交互式檢索、檢索界面、用戶、機構(gòu)知識庫、數(shù)據(jù)管理及利用、元數(shù)據(jù)、本體、關(guān)聯(lián)數(shù)據(jù)、語義標注等研究領(lǐng)域進行深入研究。