檔案作為信息的承載體,天生具有資源屬性。檔案由于原始性﹑真實(shí)性,發(fā)揮了其他形式信息資源不可替代的作用。在檔案學(xué)界,關(guān)于檔案資源方面的文獻(xiàn)在不斷增長,具體包括檔案資源的整合建設(shè)﹑開發(fā)利用﹑評(píng)估體系﹑服務(wù)模式等方面。在這些研究中,馬伏秋[1]采用計(jì)量分析的方法,從論文作者﹑引文﹑內(nèi)容三個(gè)方面,對(duì)2000—2014年間在檔案學(xué)兩種CSSCI來源期刊《檔案學(xué)通訊》《檔案學(xué)研究》上發(fā)表的關(guān)于檔案信息資源開發(fā)與利用的論文進(jìn)行統(tǒng)計(jì)分析;周耀林[2]對(duì)2000—2009年間檔案信息資源建設(shè)相關(guān)論文的數(shù)量﹑研究主體﹑核心高頻詞匯等進(jìn)行了分析。本文旨在通過可視化知識(shí)圖譜軟件CiteSpaceⅢ,對(duì)CSSCI(中文社會(huì)科學(xué)引文索引)數(shù)據(jù)庫中收錄的檔案資源方面相關(guān)文獻(xiàn)進(jìn)行分析。
CSSCI(中文社會(huì)科學(xué)引文索引)作為一個(gè)專門的引文數(shù)據(jù)庫,可以檢索從1998年到目前為止的來源期刊論文及其被引用情況。眾所周知,CSSCI來源期刊是經(jīng)過嚴(yán)格選擇的,收錄的文獻(xiàn)質(zhì)量較高,且數(shù)據(jù)庫收錄文獻(xiàn)引用情況完備,界面簡潔明了,檢索結(jié)果精確。[3]本文以CSSCI(中文社會(huì)科學(xué)引文索引)數(shù)據(jù)庫中的文獻(xiàn)資料為數(shù)據(jù)來源,檢索時(shí)間段為1998年—2017年,分別以“關(guān)鍵詞=檔案資源”“所有字段=檔案資源”“篇名=檔案資源”為檢索式進(jìn)行檢索,分別返回119﹑141﹑96條記錄,為了保證查全文獻(xiàn),最終以“篇名=檔案AND篇名=資源”為檢索式進(jìn)行檢索,共得到323條文獻(xiàn)記錄。
本文選取美國德雷賽爾大學(xué)陳超美教授及其團(tuán)隊(duì)研發(fā)的可視化軟件CiteSpaceⅢ作為分析工具。CiteSpace工具自從2005年被引入國內(nèi)學(xué)術(shù)界,就得到了學(xué)術(shù)界的廣泛關(guān)注。CiteSpace軟件可以分析合作﹑共現(xiàn)﹑共引﹑耦合這四種關(guān)聯(lián)數(shù)據(jù)。本文具體用到的功能主要有:共被引文獻(xiàn)分析﹑合著作者分析﹑關(guān)鍵詞分析。通過這些分析,探查檔案資源領(lǐng)域有影響力的文章及作者,分析檔案資源領(lǐng)域研究內(nèi)容及熱點(diǎn)。
在CiteSpaceⅢ軟件界面,時(shí)間范圍選擇從1998年到2017年,時(shí)間分區(qū)(Year Per Slice)設(shè)定為1,即共分為20個(gè)時(shí)間區(qū);主題詞來源選擇文獻(xiàn)標(biāo)題(Title)﹑摘要(Abstract)﹑作者關(guān)鍵詞(Authour Keywords)﹑附加關(guān)鍵詞(Keywords Plus);網(wǎng)絡(luò)節(jié)點(diǎn)選擇引用文獻(xiàn)(Cited Reference),數(shù)據(jù)抽取對(duì)象為top20,即設(shè)置每一時(shí)間區(qū)取前20條記錄;“剪枝算法”選擇路徑搜索(pathfinder)算法,選擇此算法是為了使構(gòu)建的圖譜結(jié)構(gòu)更加明顯。運(yùn)行軟件,得到檔案資源研究的作者共被引網(wǎng)絡(luò)圖譜,見圖1。
圖1 檔案資源研究的作者共被引網(wǎng)絡(luò)圖譜
圖1體現(xiàn)了各研究者與他人之間的共被引關(guān)系以及這種聯(lián)系的強(qiáng)度。圖譜中的圓形代表高被引作者,節(jié)點(diǎn)的大小和被引頻次成正相關(guān)關(guān)系。兩節(jié)點(diǎn)之間有連線代表節(jié)點(diǎn)作者之間存在共被引關(guān)系,連線的粗細(xì)表示作者共被引次數(shù)的多少,連線越粗表示兩位作者多次被共同引用,表示研究領(lǐng)域相一致或有交叉。節(jié)點(diǎn)圈的厚度表明了被引作者的中心性。
被引頻次和中心性并不是正相關(guān)的,這是因?yàn)橹行男钥坍嫷氖屈c(diǎn)在整個(gè)網(wǎng)絡(luò)中的重要程度。有些文章被引頻次可能很高,但是與網(wǎng)路中其他節(jié)點(diǎn)之間聯(lián)系并不緊密,其中心性就會(huì)比較低。一般來說,高被引頻次文章及高中心性文章共同構(gòu)成了研究領(lǐng)域的關(guān)鍵性文獻(xiàn)。馮惠玲從宏觀的角度認(rèn)為,數(shù)字資源是當(dāng)那資源的重要組成,建議構(gòu)建“中國記憶”大型數(shù)字資源庫。[4]何振等從組織機(jī)構(gòu)角度構(gòu)想了國家檔案資源整合與共享工程。[5]錢毅從技術(shù)角度探討了數(shù)字檔案館系統(tǒng)管理策略。[6]呂元智就具體數(shù)字檔案資源語義描述工作進(jìn)行了探討。[7]肖希明則研究了國外三館(圖書館﹑檔案館和博物館)數(shù)字資源整合研究進(jìn)展。[8]需要說明的是,Burst表示引文次數(shù)激增,對(duì)應(yīng)文章為胡小琳的《論檔案資源的社會(huì)共享》,主要論述了實(shí)現(xiàn)檔案資源社會(huì)共享的策略和途徑。[9]
共詞分析主要是指通過分析兩個(gè)詞在同一篇文獻(xiàn)中共同出現(xiàn)的頻率來反映相關(guān)領(lǐng)域的研究情況。如果兩個(gè)詞反復(fù)在同一篇文獻(xiàn)中共同出現(xiàn),那么說明它們之間的聯(lián)系很緊密,在相關(guān)領(lǐng)域中具有一定的意義。運(yùn)用CiteSpaceⅢ可以對(duì)被研究文獻(xiàn)的關(guān)鍵詞進(jìn)行共詞分析,關(guān)鍵詞是對(duì)文章的高度概括,幾個(gè)關(guān)鍵詞共同反映了文獻(xiàn)的主題。
在CiteSpaceⅢ中選擇關(guān)鍵詞作為節(jié)點(diǎn)類型,運(yùn)行軟件,對(duì)得到的知識(shí)圖譜進(jìn)行調(diào)整,包括手動(dòng)對(duì)某些節(jié)點(diǎn)的位置進(jìn)行調(diào)整,以及刪去不重要的節(jié)點(diǎn)及連線,盡量使得到的圖譜結(jié)構(gòu)較為明顯,見圖2。
圖2 CiteSpaceⅢ中以關(guān)鍵詞為節(jié)點(diǎn)類型的知識(shí)圖譜
在與檔案資源相關(guān)的文獻(xiàn)中,在一定時(shí)間段內(nèi)反復(fù)出現(xiàn)的關(guān)鍵詞,被稱為高頻關(guān)鍵詞。它們?cè)谝欢ǔ潭壬象w現(xiàn)了研究領(lǐng)域的研究熱點(diǎn)。
中心性越高的關(guān)鍵詞在整個(gè)網(wǎng)絡(luò)圖中與其他關(guān)鍵詞之間的聯(lián)系越多,在圖譜中的位置越重要?!皺n案信息資源”“檔案館”“數(shù)字檔案資源”的中心性較高,表明在檔案資源領(lǐng)域這三個(gè)關(guān)鍵詞有著至關(guān)重要的作用。同時(shí),中心性在0.01以上的關(guān)鍵詞主要有“檔案信息資源”“數(shù)字檔案資源”“檔案信息”“檔案管理”,可以將它們分為兩類,一類是主要熱點(diǎn)理論,一類是主要熱點(diǎn)應(yīng)用。
在用CiteSpaceⅢ軟件繪制聚類知識(shí)圖譜的過程中,會(huì)自動(dòng)將一些高頻關(guān)鍵詞歸類在一個(gè)研究領(lǐng)域中,從而更生動(dòng)地展示研究成果。通過軟件聚類分析,可以得到圖3:
圖3 CiteSpaceⅢ軟件繪制的高頻關(guān)鍵詞聚類知識(shí)圖譜
圖3中左上角中的Q值和S值兩個(gè)指標(biāo),反映了圖譜繪制效果。一般來說,Q值>0.3就意味著分析出來的聚類團(tuán)組是顯著的;當(dāng)S值在0.5以上,一般認(rèn)為聚類是合理的。本文中的聚類分析S值為0.6929,Q值為0.4754,表示聚類形成的類別是顯著的,但是聚類的合理性有待加強(qiáng)。
根據(jù)圖3,同時(shí)結(jié)合CiteSpaceⅢ軟件中Cluster explore對(duì)關(guān)鍵詞按聚類進(jìn)行的列舉,不同階段對(duì)于檔案資源所關(guān)注的研究熱點(diǎn)不一樣。聚類0企業(yè)檔案主要包括企業(yè)檔案﹑檔案利用﹑檔案信息資源﹑檔案管理等關(guān)鍵詞,企業(yè)檔案資源如何管理﹑利用也一直是檔案資源領(lǐng)域關(guān)注的熱點(diǎn)。聚類1數(shù)字檔案資源包括的關(guān)鍵詞主要有資源建設(shè)﹑資源整合﹑資源共享﹑數(shù)字檔案資源服務(wù)﹑國家數(shù)字檔案資源等,數(shù)字檔案資源整合建設(shè)的方式﹑途徑等也是近幾年檔案資源開發(fā)所需要解決的問題。聚類2檔案館主要包括館藏建設(shè)﹑信息服務(wù)﹑檔案編研﹑關(guān)聯(lián)數(shù)據(jù)|檔案信息資源開發(fā)等,相關(guān)檔案資源主要來源于各級(jí)檔案館,因此館藏建設(shè)﹑編研及提供服務(wù)等內(nèi)容也是各級(jí)檔案館一直在思考的問題。聚類3信息資源包括的關(guān)鍵詞主要有檔案網(wǎng)站﹑信息組織﹑政府主體﹑政府信息資源﹑管理服務(wù)|資源整合等,說明在檔案資源領(lǐng)域,政府也是不可或缺的角色。聚類4檔案學(xué)包括的關(guān)鍵詞有檔案學(xué)教育﹑本科教育﹑圖書館學(xué)﹑課程資源建設(shè)等,說明在檔案學(xué)教育中檔案資源也是一個(gè)重要內(nèi)容。
本文運(yùn)用CiteSpaceⅢ軟件對(duì)CSSCI數(shù)據(jù)庫檔案資源相關(guān)文獻(xiàn)進(jìn)行可視化分析,主要分析了共被引文獻(xiàn)及關(guān)鍵詞共現(xiàn)現(xiàn)象。通過對(duì)共被引文獻(xiàn)的分析,找到了檔案資源領(lǐng)域關(guān)鍵性的文章,從而發(fā)現(xiàn)了領(lǐng)域內(nèi)有較大影響力的重要作者;通過對(duì)關(guān)鍵詞共現(xiàn)的分析,將檔案資源領(lǐng)域研究內(nèi)容大致進(jìn)行了聚類劃分。在研究的過程中,也發(fā)現(xiàn)了相關(guān)問題,對(duì)于檔案資源和檔案信息資源的表述,有研究者認(rèn)為兩個(gè)詞語外延不同,不能混淆使用。但在實(shí)際情況中,很多學(xué)者在文章中并不區(qū)分二者的不同,因此這兩個(gè)關(guān)鍵詞在分析中也可以合二為一。此外,關(guān)鍵詞共現(xiàn)聚類效果并不是很好。究其原因,主要是有些文章關(guān)鍵詞的選取并不能完整地表達(dá)文章主題,有些文章關(guān)鍵詞太少,且較為“一般”,對(duì)于文章關(guān)鍵性的特點(diǎn)不能很好地展示,于是對(duì)關(guān)鍵詞進(jìn)行共詞分析時(shí)可以考慮對(duì)關(guān)鍵詞先行處理,使分析結(jié)果能盡量符合現(xiàn)實(shí)情況。