王芳
摘要:本文以中國知網(wǎng)收錄的核心刊物和 CSSCI數(shù)據(jù)庫文獻為數(shù)據(jù)來源,對2019年5月前發(fā)表的關(guān)于圖書館大數(shù)據(jù)研究的論文進行文獻計量分析,采用文獻計量分析法,可視化分析法和內(nèi)容分析法等對文獻進行梳理分析,從描述性特征和內(nèi)容特征兩個方面入手,分析了國內(nèi)圖書館大數(shù)據(jù)領(lǐng)域研究的發(fā)展現(xiàn)狀。
關(guān)鍵詞:文獻計量? 圖書館? 大數(shù)據(jù)
在2011年5月,世界著名的咨詢公司麥肯錫(Mckinsey)發(fā)表了《大數(shù)據(jù):創(chuàng)新、競爭和生產(chǎn)力的下一個前沿領(lǐng)域》[1]報告,第一次提出了“大數(shù)據(jù)”的概念,各個行業(yè)和領(lǐng)域的數(shù)據(jù)量的增長也極其迅速,美國的學(xué)術(shù)界和企業(yè)界也對這種現(xiàn)象的意義進行了激烈的探討?!按髷?shù)據(jù)”這個名詞變得越來越流行,越來越重要,最后成為了國家和政府層面的發(fā)展戰(zhàn)略[2]。
圖書館,可以說是一個社會信息服務(wù)的中心場所,不僅僅需要有較高的技術(shù),而且還面臨著較高的管理風(fēng)險[3],不僅如此,圖書館還面臨著來自內(nèi)外部環(huán)境的激烈競爭與重重挑戰(zhàn)。從內(nèi)部環(huán)境來看,除了上面提到的主要挑戰(zhàn)之外,還存在許多圖書館不得不面對的挑戰(zhàn)因素,例如圖書館的基礎(chǔ)設(shè)施,運營的經(jīng)費,人力資源與管理制度等都是圖書館會面臨的問題;從外部環(huán)境來看,各種信息服務(wù)機構(gòu)和各大IT廠商都已經(jīng)專注于對大數(shù)據(jù)應(yīng)用的研究[4],圖書館在大數(shù)據(jù)的應(yīng)用競爭中,已經(jīng)落后與他們一步,盡管圖書館在資源方面占據(jù)優(yōu)勢,但是圖書館在技術(shù)應(yīng)用方面的劣勢使得其追上其他機構(gòu)的步伐受到了極大的限制。如何提高技術(shù)水平,避免與其他競爭者的差距越來越大,將是圖書館必須要考慮的一大問題。
圖書館學(xué)界已經(jīng)針對大數(shù)據(jù)開展了一定的學(xué)術(shù)研究與實踐應(yīng)用,都已經(jīng)取得了顯著的成功。本文將對中國知網(wǎng)(CNKI)中關(guān)于大數(shù)據(jù)在圖書館領(lǐng)域的應(yīng)用方面的文獻進行分析,采用文獻計量分析法,可視化分析法和內(nèi)容分析法對圖書館大數(shù)據(jù)的應(yīng)用研究領(lǐng)域的期刊文獻進行可視化分析,清晰全面的展現(xiàn)圖書館大數(shù)據(jù)研究的時空分布特征以及研究熱點,其展示結(jié)果更直觀也更具有科學(xué)性。通過分析結(jié)果,期望可以看清楚目前大數(shù)據(jù)在圖書館領(lǐng)域的應(yīng)用研究現(xiàn)狀以及研究的重點與存在的不足,為研究中遇到的困難提出建議,為以后的研究指明方向。
一、數(shù)據(jù)來源及研究方法
(一)數(shù)據(jù)來源
本文的研究數(shù)據(jù)來源于中國知網(wǎng)( CNKI)的核心期刊和 CSSCI數(shù)據(jù)庫,數(shù)據(jù)的獲取時間為2019年5月15日,以“圖書館”與“大數(shù)據(jù)”為檢索詞進行主題檢索,時間跨度為所有年份,共檢索出截至2019年5月15日前發(fā)表的文獻376篇,因為都屬于核心期刊或 CSSCI中的文獻,有很強的代表性,經(jīng)篩選最終得到的360篇文獻符合本研究的研究范圍。
(二)研究方法
本文從文獻的描述性特征與內(nèi)容特征兩個方面進行了研究,一方面運用文獻計量分析方法對與大數(shù)據(jù)圖書館應(yīng)用領(lǐng)域的相關(guān)文獻的發(fā)表的時間分布,作者以及發(fā)文機構(gòu)等因素呈現(xiàn)出的描述性特征進行統(tǒng)計分析,另一方面采用內(nèi)容分析法與可視化分析法對該領(lǐng)域文獻的關(guān)鍵詞與主題進行分析,探究該領(lǐng)域研究的重點以及研究熱點。用到的可視化軟件 Citespace是一款基于 java環(huán)境的用于計量和分析科學(xué)文獻數(shù)據(jù)的信息可視化軟件,是最近幾年在信息分析的研究中用到的影響力最強最有特色的信息可視化軟件。將以上三種方法結(jié)合在一起,對有關(guān)圖書館大數(shù)據(jù)應(yīng)用的文獻進行分析,能客觀科學(xué)的得到該領(lǐng)域研究現(xiàn)狀及發(fā)展趨勢等信息[5]。
二、調(diào)研結(jié)果與分析
(一)文獻發(fā)表年份分析
利用文獻計量方法來分析某一領(lǐng)域的發(fā)展歷程,根據(jù)文獻的增長及老化規(guī)律,對相關(guān)論文發(fā)文量進行年度統(tǒng)計分析,在剛開始研究某個領(lǐng)域的時期,由于相關(guān)理論基礎(chǔ)較為缺乏,所以文獻數(shù)量較低。隨著研究的深入,越來越多的研究者加入,研究成果增多,相關(guān)論文的發(fā)表量也會上升,漸漸地機構(gòu)增加,發(fā)文量增長較快,研究成熟后,發(fā)文量趨于穩(wěn)定[6]。通過對從CNKI中核心期刊和 CSSCI數(shù)據(jù)庫中檢索得到的360篇有關(guān)圖書館大數(shù)據(jù)應(yīng)用的研究文獻進行年代分布統(tǒng)計分析,統(tǒng)計得到圖一所示結(jié)果。(說明:2019年的發(fā)文量是預(yù)測值)
由圖1可以看出,大數(shù)據(jù)在圖書館的應(yīng)用研究文獻數(shù)量在核心期刊和 CSSCI中發(fā)表的較少,最早始于2006年,發(fā)文量為兩篇,該年發(fā)表的兩篇文獻分析探究了數(shù)字圖書館中常見資源特點和描述需求。可見大數(shù)據(jù)的概念還并沒有開始普及。在接下來的幾年時間中,關(guān)于該領(lǐng)域研究的文獻幾乎沒有。直到2012年,發(fā)文量持續(xù)上升,該領(lǐng)域越來越收到關(guān)注。到目前為止,每年的發(fā)文量總體數(shù)量保持平穩(wěn),說明我國圖書館大數(shù)據(jù)研究進入相對穩(wěn)定階段,上述現(xiàn)象與我國大數(shù)據(jù)的發(fā)展有密切關(guān)系。大數(shù)據(jù)最貼切的概念是2008年提出的,2008年以后,尤其是2012年以來大數(shù)據(jù)研究越來越受到重視,論文發(fā)表增長較快,成為當(dāng)前研究熱點,所以這與大數(shù)據(jù)在圖書館應(yīng)用的發(fā)展是一致的。
(二)作者及發(fā)文機構(gòu)分析
1.作者分析。某一領(lǐng)域的研究者往往會通過發(fā)表論文的方式把自己的研究成果公布并傳播出去。通過對文獻作者的分布情況進行分析,我們可以清楚地看到該領(lǐng)域研究者發(fā)表論文的總體情況[7]。在2006年到2019年之間,大數(shù)據(jù)在圖書館的應(yīng)用研究領(lǐng)域呈現(xiàn)出了許多科研成果,這些成果浸透著眾多科研工作者的心血。本文通過社會網(wǎng)絡(luò)分析法對大數(shù)據(jù)在圖書館的應(yīng)用領(lǐng)域的文獻作者的分布情況與合作情況進行分析,得到了作者共現(xiàn)網(wǎng)絡(luò)圖譜(也可以稱為作者與合作分布圖譜,圖2)。
由圖2可知,在大數(shù)據(jù)在圖書館的應(yīng)用研究領(lǐng)域,形成以馬曉亭,陳臣,熊太純等為中心的作者聚類群,表明這些學(xué)者是該研究領(lǐng)域的領(lǐng)軍人物。為了更加具體地顯示在中國圖書館大數(shù)據(jù)研究領(lǐng)域主要研究學(xué)者的學(xué)術(shù)成就,統(tǒng)計發(fā)表文獻量前十的學(xué)者名單,如表1所示。
從表1可以看出,馬曉亭,陳臣是目前為止圖書館大數(shù)據(jù)研究領(lǐng)域的核心研究人員,經(jīng)過統(tǒng)計他們共發(fā)表論文52篇,占該主題領(lǐng)域發(fā)文量的14%。另外,可以看出,大部分作者的發(fā)文量是4篇、3篇或者2篇,這說明該領(lǐng)域絕大多數(shù)的研究者進行的并不是長期研究。由此可以看出,我國大數(shù)據(jù)在圖書館的應(yīng)用領(lǐng)域的研究已經(jīng)具有影響力的代表作者出現(xiàn),但是核心作者群還沒有真正的形成,對該領(lǐng)域的研究人員還比較少,比較分散,研究成果也較少,因為大部分研究者都是短期研究,沒有深入研究,沒有對該領(lǐng)域長時間的關(guān)注。
2.發(fā)文機構(gòu)分析。每個研究機構(gòu)在研究領(lǐng)域方面都有一定的差異以及聯(lián)系,研究機構(gòu)的合作促進了相關(guān)領(lǐng)域的發(fā)展[8]。為了解圖書館大數(shù)據(jù)研究領(lǐng)域的機構(gòu)合作情況,利用Citespace可視化軟件生成研究機構(gòu)共現(xiàn)網(wǎng)絡(luò)圖譜,如圖3所示。
此次研究的數(shù)據(jù)也就是360篇文獻共來自37個發(fā)文機構(gòu)。由圖3可知,研究大數(shù)據(jù)在圖書館應(yīng)用的領(lǐng)先機構(gòu)分別是蘭州商學(xué)院信息工程學(xué)院和蘭州財經(jīng)大學(xué)信息工程學(xué)院,其次是蘭州商學(xué)院信息中心,蘭州商學(xué)院網(wǎng)絡(luò)中心。幾所機構(gòu)對該領(lǐng)域的研究時期較長,尤其是蘭州商學(xué)院信息工程學(xué)院和蘭州財經(jīng)大學(xué)信息工程學(xué)院,走在該領(lǐng)域的研究前沿??梢钥闯鎏m州的高校對該領(lǐng)域的研究比較重視,是該領(lǐng)域的代表機構(gòu)。
表2列出了發(fā)文量前二十的研究機構(gòu)。從表2可以看出,蘭州商學(xué)院信息工程學(xué)院和蘭州財經(jīng)大學(xué)信息工程學(xué)院、蘭州商學(xué)院信息中心、蘭州商學(xué)院網(wǎng)絡(luò)中心、蘭州財經(jīng)大學(xué)信息中心、南京大學(xué)信息管理學(xué)院等機構(gòu)對大數(shù)據(jù)在圖書館的應(yīng)用的研究較多,發(fā)表的論文相對較多,共占總數(shù)的16.3%。仔細(xì)研究這些發(fā)文機構(gòu),發(fā)現(xiàn)絕大多數(shù)是高校的信息學(xué)院與圖書館,除此之外還涉及其他專業(yè)與研究中心等。
(三)圖書館大數(shù)據(jù)研究熱點的分析(關(guān)鍵詞分析)
論文的關(guān)鍵詞是對文章思想的高度概括,某領(lǐng)域或主題論文的關(guān)鍵詞頻次能夠反映學(xué)界對該領(lǐng)域或主題的關(guān)注度和重視度,也能夠從中窺探該領(lǐng)域或主題研究的熱點[9]。為了對我國大數(shù)據(jù)在圖書館的應(yīng)用領(lǐng)域的研究熱點有個更清楚的認(rèn)識,運用詞頻統(tǒng)計分析法對該領(lǐng)域的360篇文獻進行關(guān)鍵詞統(tǒng)計,最終形成了該領(lǐng)域的關(guān)鍵詞共現(xiàn)圖譜(圖4)。表3出了頻次在前20的關(guān)鍵詞,通過分析,以期更清楚的認(rèn)識該領(lǐng)域的研究熱點和研究方向。
在納入統(tǒng)計的360篇文獻中出現(xiàn)了622個關(guān)鍵詞,出現(xiàn)3次及以上的有39個,可見該領(lǐng)域研究角度較多,范圍比較廣泛。將所有的關(guān)鍵詞進行處理,相同意思的關(guān)鍵詞進行合并,并將“圖書館”與“大數(shù)據(jù)”這兩個高頻次但對研究意義不大的詞語剔除,最終將頻次至少6次的關(guān)鍵詞共有14個繪制成表3。從表3可以看出,在圖書館的大數(shù)據(jù)應(yīng)用研究中,“高校圖書館”“數(shù)字圖書館”“大數(shù)據(jù)時代”“數(shù)據(jù)挖掘”“個性化服務(wù)”“知識服務(wù)”“數(shù)據(jù)分析”“云計算”等關(guān)鍵詞的出現(xiàn)頻次較高,說明該領(lǐng)域的研究者對大數(shù)據(jù)在圖書館的應(yīng)用研究工作者中的研究主體,面向的對象和研究內(nèi)容等的認(rèn)識比較一致,關(guān)注點也比較集中。從關(guān)鍵詞的詞頻統(tǒng)計,還可以看出大數(shù)據(jù)在圖書館的應(yīng)用對象大多為高校的圖書館,公共圖書館相對較少。研究緊密結(jié)合時代特征和實際需要,利用大數(shù)據(jù)的相關(guān)技術(shù),如數(shù)據(jù)挖掘,數(shù)據(jù)分析,云計算等,為圖書館用戶提供符合時代的個性化知識服務(wù)。
(四)圖書館大數(shù)據(jù)研究主題研究前沿的分析(主題分析)
隨著科技的進步,各種技術(shù)的發(fā)展應(yīng)用,圖書館的大數(shù)據(jù)技術(shù)的應(yīng)用也在不斷的發(fā)展,研究熱點也在不斷的更新前進[10]。為了研究目前我國在該領(lǐng)域的研究熱點與發(fā)展趨勢,我們利用Citespace可視化軟件中的 burst term 功能進行分析,得出了該領(lǐng)域的文獻突變關(guān)鍵詞的分析,如表4所示。表4所示是8個突變關(guān)鍵詞的年代分布。通過觀察突變詞的年代分布,可以看出該領(lǐng)域隨著研究熱點、時間的變化前進。表4中紅色的線段代表著突變關(guān)鍵詞在這個時間段的使用頻次突然增加,淺色的線段代表在該時間段突變關(guān)鍵詞出現(xiàn)的頻次較低。
由表4 可知,該領(lǐng)域研究中突變的關(guān)鍵詞有:數(shù)據(jù)主體、權(quán)屬關(guān)系、數(shù)據(jù)立法、圖書館數(shù)據(jù)、數(shù)據(jù)挖掘、數(shù)據(jù)處理、知識服務(wù)、高校圖書館等。在2006年,突變的關(guān)鍵詞有數(shù)據(jù)主體、權(quán)屬關(guān)系、數(shù)據(jù)立法、圖書館數(shù)據(jù),表明當(dāng)時的研究前沿在數(shù)據(jù)的規(guī)范化方面。 2012、2013年突變的關(guān)鍵詞為:數(shù)據(jù)挖掘,數(shù)據(jù)處理,知識服務(wù)等,表明這個時期,大數(shù)據(jù)技術(shù)開始成熟,開始注重知識服務(wù)的重要性。2017年突變關(guān)鍵詞為:高校圖書館。表明各大高校開始把大數(shù)據(jù)技術(shù)引入高校圖書館,更好地為學(xué)生提供專業(yè)的服務(wù),滿足學(xué)生越來越高的需求。
表4 圖書館大數(shù)據(jù)研究領(lǐng)域突變關(guān)鍵詞的年代分布
三、 結(jié)論與不足
本文中以 CNKI中“圖書館大數(shù)據(jù)”為主題的核心期刊和 CSSCI數(shù)據(jù)庫文獻為數(shù)據(jù)源,利用文獻計量分析法,可視化分析法和內(nèi)容分析法等,對中國大數(shù)據(jù)在圖書館的應(yīng)用研究領(lǐng)域近13年研究的歷史成果和研究現(xiàn)狀進行全面的梳理和總結(jié)分析,得出以下結(jié)論:一是以圖書館大數(shù)據(jù)為主題的文獻數(shù)量呈曲線增長的趨勢,這十幾年來該領(lǐng)域的研究者和研究成果都有了很大的提升,表明越來越多的人開始關(guān)注該領(lǐng)域,在該領(lǐng)域的研究也在不斷深入發(fā)展,尤其隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展,該領(lǐng)域的研究也在不斷發(fā)展。到目前為止,每年的發(fā)文量總體數(shù)量保持平穩(wěn),說明我國圖書館大數(shù)據(jù)研究進入相對穩(wěn)定階段;二是在圖書館大數(shù)據(jù)領(lǐng)域的研究中,比較早期的研究者以馬曉亭為代表,并出現(xiàn)陳臣,何勝,熊太純等在該領(lǐng)域中占有舉足輕重地位的研究者;三是從研究機構(gòu)來看,蘭州商學(xué)院信息工程學(xué)院和蘭州財經(jīng)大學(xué)信息工程學(xué)院為主要的兩個發(fā)文機構(gòu),他們與鄰近城市的其他研究機構(gòu)進行經(jīng)常的溝通,互相學(xué)習(xí),密切合作,共同推動中國圖書館的發(fā)展,將先進的大數(shù)據(jù)技術(shù)應(yīng)用于圖書館,為人們提供更好的個性化服務(wù)。四是圖書館大數(shù)據(jù)研究領(lǐng)域的內(nèi)容比較廣泛,研究熱點在高校圖書館、數(shù)據(jù)挖掘、數(shù)據(jù)處理、知識服務(wù)、個性化服務(wù)等方面,隨著大數(shù)據(jù)技術(shù)的逐漸成熟,其在圖書館的應(yīng)用也越來越深入,將相關(guān)的數(shù)據(jù)技術(shù)應(yīng)用到圖書館中,包括高校圖書館與公共圖書館,是圖書館為用戶提供更加專業(yè)的個性化信息服務(wù)與知識服務(wù),推動我國圖書館的發(fā)展。
本文中的數(shù)據(jù)源為CNKI中核心期刊與CSSCI數(shù)據(jù)庫中的中文期刊文獻,沒有涉及相關(guān)領(lǐng)域的外文文獻,所以結(jié)果還有待補充完善。由于CNKI數(shù)據(jù)庫自身的限制,沒有辦法運用Citespace可視化軟件進行文獻的引文分析,所以分析的結(jié)果并不完善,具有一定程度的局限性。另外,本文僅以圖書館大數(shù)據(jù)作為主題進行分析,可能忽略了其他該領(lǐng)域的主題,所以分析結(jié)果有待補充。
參考文獻:
[1]韓翠峰.大數(shù)據(jù)帶給圖書館的影響與挑戰(zhàn)[J].圖書與情報,2012(05):37-40.
[2]張文彥,武瑞原,于潔.大數(shù)據(jù)時代的圖書館初探[J].圖書與情報,2012(06):15-21.
[3]柳益君,何勝,馮新翎,武群輝,熊太純.大數(shù)據(jù)挖掘在高校圖書館個性化服務(wù)中應(yīng)用研究[J].圖書館工作與研究,2017(05):23-29.
[4]袁紅軍.大數(shù)據(jù)時代下圖書館參考咨詢服務(wù)創(chuàng)新機制探究[J].圖書館工作與研究,2017(01):16-19.
[5]蘇新寧.大數(shù)據(jù)時代數(shù)字圖書館面臨的機遇和挑戰(zhàn)[J].中國圖書館學(xué)報,2015,41(06):4-12.
[6]楊利軍,高軍.圖書館個性化服務(wù)中的大數(shù)據(jù)可視化分析與應(yīng)用研究[J].現(xiàn)代情報,2015,35(07):68-72.
[7]王紅,袁小舒.基于文獻計量的圖書館扶貧研究分析評價[J].晉圖學(xué)刊,2018(05):44-49.
[8]王紅,姚堯,段雨婕.基于知識圖譜的中國地圖制圖研究領(lǐng)域的文獻計量分析[J].湖北大學(xué)學(xué)報(自然科學(xué)版),2017,39(05):523-530.
[9]牟靜.大數(shù)據(jù)環(huán)境下的高校圖書館閱讀推廣研究——利益相關(guān)者共贏視角[J].圖書館研究,2015,45(01):72-75.
[10]樊偉紅,李晨暉,張興旺,秦曉珠,郭自寬.圖書館需要怎樣的“大數(shù)據(jù)”[J].圖書館雜志,2012,31(11):63-68+77.
作者單位:山西財經(jīng)大學(xué)信息學(xué)院