楊茜蕓
摘 要:本文選取CNKI數(shù)據(jù)庫(kù)收錄的3390篇有關(guān)數(shù)字圖書(shū)館的相關(guān)研究的論文為數(shù)據(jù)源,利用BICOMB進(jìn)行相關(guān)數(shù)據(jù)提取。首先是對(duì)研究文獻(xiàn)進(jìn)行形式特征的可視化分析,包括研究文獻(xiàn)的時(shí)間分布、著者及著者機(jī)構(gòu)分布、來(lái)源分布。然后對(duì)研究文獻(xiàn)的內(nèi)容特征進(jìn)行可視化分析,通過(guò)高頻關(guān)鍵詞的統(tǒng)計(jì)分析、共詞分析等分析了近年來(lái)數(shù)字圖書(shū)館有關(guān)研究的熱點(diǎn)領(lǐng)域。發(fā)現(xiàn)我國(guó)數(shù)字圖書(shū)館研究論文年發(fā)文量和研究主題隨時(shí)間的推移而變化顯著。從數(shù)量上看,發(fā)文量依次經(jīng)歷了上升、下降、基本持平3個(gè)階段,從內(nèi)容上看,以資源建設(shè)、信息技術(shù)、知識(shí)服務(wù)等主題相互結(jié)合、滲透的線索發(fā)展。
關(guān)鍵詞:數(shù)字圖書(shū)館;bicomb;研究熱點(diǎn)
1.引言
數(shù)字圖書(shū)館的建設(shè)及相關(guān)研究起步于20 世紀(jì)90 年代初的美國(guó)。我國(guó)國(guó)家圖書(shū)館自1995 年起開(kāi)始跟進(jìn)國(guó)際上數(shù)字圖書(shū)館的研發(fā)進(jìn)展。1997 年,由國(guó)家圖書(shū)館、中山圖書(shū)館等單位共同承擔(dān)的“中國(guó)試驗(yàn)型數(shù)字圖書(shū)館項(xiàng)目”,標(biāo)志著我國(guó)數(shù)字圖書(shū)館事業(yè)進(jìn)入到了試驗(yàn)階段。經(jīng)歷了10 余年的發(fā)展,我國(guó)數(shù)字圖書(shū)館領(lǐng)域的研究課題立項(xiàng)逐漸增多,研究?jī)?nèi)容日益廣泛,研究成果大量發(fā)表,其中也出現(xiàn)了一些關(guān)于數(shù)字圖書(shū)館研究文獻(xiàn)定量分析的論文。本文在有關(guān)文獻(xiàn)研究的基礎(chǔ)上,選取國(guó)內(nèi)CNKI 收錄的1994-2014 年間刊載在核心期刊的有關(guān)數(shù)字圖書(shū)館的相關(guān)研究論文,對(duì)論文的發(fā)表年代進(jìn)行統(tǒng)計(jì)與分析。得出該研究領(lǐng)域不同時(shí)段的研究熱點(diǎn),以期發(fā)現(xiàn)我國(guó)數(shù)字圖書(shū)館研究主題的發(fā)展與變化規(guī)律。
2.數(shù)據(jù)來(lái)源與研究工具
2.1 數(shù)據(jù)來(lái)源
本研究以中國(guó)學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫(kù)作為數(shù)據(jù)來(lái)源,為了能夠檢索到準(zhǔn)確、全面的論文,數(shù)據(jù)檢索起止時(shí)間段設(shè)定為“不限”到“2014”。以“篇名”為檢索項(xiàng),采用“數(shù)字圖書(shū)館”作為主要檢索入口詞,分別組配“評(píng)價(jià)”、“評(píng)估”(組配邏輯為“與”)的方式進(jìn)行檢索。由于檢索到的論文包含有會(huì)議通知、會(huì)議講話、紀(jì)念文章以及與主題明顯相關(guān)性不大的論文,在期刊的來(lái)源里面就只勾選SCI來(lái)源期刊、EI來(lái)源期刊、核心期刊和CSSCI,最后經(jīng)過(guò)篩選以及去重,最后得到論文3390篇。
2.2 研究工具
具體分析時(shí)主要采用 Bicomb軟件、Excel 軟件作為主要研究工具。其中Bicomb共詞分析軟件采用目前技術(shù)成熟、流行的數(shù)據(jù)庫(kù)語(yǔ)言開(kāi)發(fā),對(duì)CNKI的書(shū)目文獻(xiàn)信息進(jìn)行快速掃描,準(zhǔn)確提取并歸類存儲(chǔ)、矩陣分析等等,為進(jìn)一步研究提供全面、準(zhǔn)確的基礎(chǔ)數(shù)據(jù),并允許用戶對(duì)某些功能進(jìn)行修改、增加等拓展,具有較強(qiáng)的適應(yīng)性。
3.研究文獻(xiàn)的形式特征可視化分析
文獻(xiàn)特征,是指將不同文獻(xiàn)區(qū)分開(kāi)來(lái)的標(biāo)志。它包括文獻(xiàn)的內(nèi)容特征和文獻(xiàn)的形式特征。對(duì)研究文獻(xiàn)的形式特征進(jìn)行匯總性分析,有利于發(fā)現(xiàn)某一主題內(nèi)的文獻(xiàn)隨時(shí)間的變化情況、核心作者群及核心來(lái)源等。
3.1研究文獻(xiàn)的時(shí)間分布
科學(xué)文獻(xiàn)的數(shù)量是衡量科學(xué)知識(shí)的重要尺度之一,本文著眼于整體的宏觀的文獻(xiàn)數(shù)量與比率的分布狀況,通過(guò)文獻(xiàn)的數(shù)量與比率的數(shù)據(jù)統(tǒng)計(jì)與計(jì)算,來(lái)描述和預(yù)測(cè)文獻(xiàn)的數(shù)量、比率的發(fā)展?fàn)顩r,進(jìn)而給出總體性的統(tǒng)計(jì)描述與結(jié)論。經(jīng)過(guò)BICOMB統(tǒng)計(jì),CNKI共收錄了1994年至2014年3390篇論文,依照文獻(xiàn)分布的年代次序,繪制成圖1。
由圖1可看出數(shù)字圖書(shū)館相關(guān)研究論文的發(fā)表數(shù)量總體呈逐步上升趨勢(shì)。大致可分為三個(gè)時(shí)期:①1994-2000年,我國(guó)有關(guān)數(shù)字圖書(shū)館的研究已初見(jiàn)成熟。②2001-2003年,有關(guān)數(shù)字圖書(shū)館的研究發(fā)展緩慢。③2004-2006年,數(shù)字圖書(shū)館的相關(guān)研究已經(jīng)進(jìn)入快速發(fā)展時(shí)期。④2006至今,我國(guó)有關(guān)數(shù)字圖書(shū)館的研究論文的文獻(xiàn)發(fā)文量則處于一個(gè)比較平穩(wěn)的狀態(tài)。
3.2研究文獻(xiàn)的著者分析
我們?cè)诮y(tǒng)計(jì)過(guò)程中采用正規(guī)計(jì)數(shù)法對(duì)論文著者進(jìn)行著者分析,經(jīng)統(tǒng)計(jì),數(shù)字圖書(shū)館研究領(lǐng)域的3390篇論文共有3205位作者,見(jiàn)表1。
由表1可見(jiàn),發(fā)表一篇論文的作者數(shù)占總作者數(shù)的81%,同時(shí)寫兩篇論文的作者為368人,這與洛特卡定律所描述的數(shù)據(jù)還存在差異,這表明在有關(guān)數(shù)字圖書(shū)館的研究尚未達(dá)到使用洛特卡定律的條件,也說(shuō)明該領(lǐng)域的研究尚處于發(fā)展階段,還沒(méi)有形成穩(wěn)定的核心作者群。從表1可以得出,發(fā)文量最多的著者論文數(shù)為32篇,m4.24,因此,根據(jù)普賴斯理論,可以認(rèn)為,在數(shù)字圖書(shū)館相關(guān)研究領(lǐng)域,發(fā)文3篇及以上者為核心著者。
3.3研究文獻(xiàn)的機(jī)構(gòu)分析
利用BICOMB統(tǒng)計(jì)了全部作者的機(jī)構(gòu),現(xiàn)列舉出發(fā)文量較大的部分高校,見(jiàn)表2。統(tǒng)計(jì)的結(jié)果顯示,我國(guó)在圖書(shū)館相關(guān)文獻(xiàn)的作者大多分布在高校和科研機(jī)構(gòu)中,而且這些院校多為實(shí)力雄厚的綜合型高校以及理工科高效,如武漢大學(xué)、蘭州商學(xué)院信息工程學(xué)院等。
3.4研究文獻(xiàn)的來(lái)源分析
根據(jù)BICOMB統(tǒng)計(jì),3390篇論文共涉及發(fā)表在209種不同期刊上,現(xiàn)列舉出部分?jǐn)?shù)據(jù),見(jiàn)表3。由此可發(fā)現(xiàn),數(shù)字圖書(shū)館相關(guān)的論文分布比較集中,主要分布于與圖書(shū)情報(bào)密切相關(guān)的信息管理類、情報(bào)學(xué)和圖書(shū)館學(xué)等學(xué)科期刊上。
4.研究文獻(xiàn)的內(nèi)容特征可視化分析
文獻(xiàn)的內(nèi)容特征常按照文獻(xiàn)內(nèi)容的學(xué)科分類或主題關(guān)系來(lái)描述。通常一篇文章的關(guān)鍵詞是其核心內(nèi)容的濃縮和提煉,是文獻(xiàn)的精髓所在,能夠較好地反映某一研究領(lǐng)域的主題分布與特點(diǎn),可以體現(xiàn)出某一學(xué)科領(lǐng)域的發(fā)展方向,從而有助于發(fā)現(xiàn)該學(xué)科的范式特征。對(duì)研究文獻(xiàn)的內(nèi)容特征進(jìn)行分析,能夠把握某一領(lǐng)域的研究熱點(diǎn)與趨勢(shì)。
4.1高頻關(guān)鍵詞的統(tǒng)計(jì)分析
關(guān)鍵詞是從論文的題名、摘要和正文中選取出來(lái)的,是對(duì)文章主題的高度凝練。某一關(guān)鍵詞在文獻(xiàn)中出現(xiàn)的次數(shù)越多,則表明該關(guān)鍵詞所表征的研究主題是越熱門的研究熱點(diǎn)。因此,通過(guò)關(guān)鍵詞的詞頻進(jìn)行統(tǒng)計(jì)分析,高頻關(guān)鍵詞集中體現(xiàn)了某研究領(lǐng)域的研究熱點(diǎn)和發(fā)展動(dòng)向。由于不同作者對(duì)同一概念的關(guān)鍵詞界定不同,為保證詞匯的內(nèi)容指向性以及語(yǔ)義規(guī)范性,需要對(duì)關(guān)鍵詞進(jìn)行規(guī)范化的處理,即對(duì)同義詞進(jìn)行合并處理。
4.2高頻關(guān)鍵詞的共詞分析
如果僅對(duì)高頻關(guān)鍵詞進(jìn)行統(tǒng)計(jì),則無(wú)法看出這些關(guān)鍵詞之間的關(guān)系,所以要進(jìn)一步對(duì)高頻關(guān)鍵詞進(jìn)行處理,通過(guò)關(guān)鍵詞共現(xiàn)技術(shù)來(lái)深入挖掘它們之間的聯(lián)系。
利用BICOMB軟件共現(xiàn)矩陣功能統(tǒng)計(jì)其高頻關(guān)鍵詞在每篇論文中出現(xiàn)的頻次,可以得到35*35的共現(xiàn)矩陣。下表是高頻關(guān)鍵詞共現(xiàn)矩陣的部分?jǐn)?shù)據(jù),其中,“0”表示該詞在該篇文獻(xiàn)中沒(méi)有出現(xiàn)過(guò),“1”表示該詞在該篇文獻(xiàn)中出現(xiàn)過(guò)。對(duì)角線上的數(shù)據(jù)為該關(guān)鍵詞出現(xiàn)的頻次。
5.結(jié)語(yǔ)
數(shù)字圖書(shū)館的研究是一個(gè)不斷發(fā)展的過(guò)程,我國(guó)數(shù)字圖書(shū)館領(lǐng)域研究日趨成熟,也可能是隨著研究的不斷深化,出現(xiàn)新的分支研究領(lǐng)域。過(guò)去的20年中,數(shù)字圖書(shū)館的熱點(diǎn)研究?jī)?nèi)容隨著時(shí)間推移也出現(xiàn)了變化,以數(shù)字圖書(shū)館為主題的論文研究?jī)?nèi)容豐富多樣。隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的發(fā)展,必然會(huì)影響到傳統(tǒng)圖書(shū)館的發(fā)展趨勢(shì)。2000年以后,數(shù)字圖書(shū)館的概念逐漸清晰,虛擬圖書(shū)館等概念被數(shù)字圖書(shū)館取代,其相關(guān)研究結(jié)果表明數(shù)字圖書(shū)館的總體發(fā)展趨勢(shì)基本上是按照數(shù)字圖書(shū)館資源建設(shè)、技術(shù)研發(fā)等主題為線索持續(xù)開(kāi)展的,研究?jī)?nèi)容逐漸從數(shù)字圖書(shū)館建設(shè)構(gòu)想過(guò)渡到技術(shù)實(shí)現(xiàn)及資源開(kāi)發(fā),再到資源共建共享、完善數(shù)字圖書(shū)館服務(wù)等方面。綜上所述,數(shù)字圖書(shū)館研究論文內(nèi)容的變化側(cè)面反映出我國(guó)數(shù)字圖書(shū)館的建設(shè)已經(jīng)從理論逐步走向?qū)嵺`。為用戶提供個(gè)性化信息服務(wù)以及完善數(shù)字圖書(shū)館的資源共享共建、數(shù)字圖書(shū)館軟環(huán)境建設(shè)及服務(wù)質(zhì)量完善成為目前的研究熱點(diǎn)。結(jié)合當(dāng)前信息技術(shù)和網(wǎng)絡(luò)技術(shù)發(fā)展最新成果,如云計(jì)算技術(shù)在數(shù)字圖書(shū)館共享共建研究中的應(yīng)用也應(yīng)該會(huì)成為今后的研究熱點(diǎn)。(作者單位:華中師范大學(xué))
參考文獻(xiàn):
[1] 中國(guó)數(shù)字圖書(shū)館[EB/OL].http://www.d-library.com.cn/wm/lsyg.html.
[2] 殷沈琴,張計(jì)龍,任磊.基于關(guān)鍵詞共現(xiàn)和社會(huì)網(wǎng)絡(luò)分析法的數(shù)字圖書(shū)館研究熱點(diǎn)分析[J].大學(xué)圖書(shū)館學(xué)報(bào),2011(4):25-30,38.
[3] 董偉.國(guó)內(nèi)近十年數(shù)字圖書(shū)館領(lǐng)域研究熱點(diǎn)分析———基于共詞分析[J].圖書(shū)情報(bào)知識(shí),2009(5):58-63.
[4] 蘇娜.基于共詞分析的數(shù)字圖書(shū)館領(lǐng)域研究主題及進(jìn)展分析[J].情報(bào)雜志,2009(6):15-19.