劉麗
【摘要】數(shù)字檔案館一直是近年來我國檔案學(xué)研究領(lǐng)域中的重點(diǎn),然而縱觀國內(nèi)關(guān)于該問題的研究,通過文獻(xiàn)計(jì)量的視角全面分析數(shù)字檔案館研究發(fā)展?fàn)顩r的文章可謂鳳毛麟角。本文意在通過文獻(xiàn)計(jì)量的方法對這一領(lǐng)域進(jìn)行研究,以期掌握數(shù)字檔案館的研究方向和熱點(diǎn),為日后的研究提供參考。
【關(guān)鍵詞】數(shù)字檔案館;文獻(xiàn)計(jì)量;研究分析
數(shù)字檔案館(Digital Archives)作為一種高效便捷的網(wǎng)絡(luò)化檔案資源服務(wù)模式,它把分散于不同載體、不同地理位置的信息資源以數(shù)字化的形式存貯,以網(wǎng)絡(luò)化的方式相互連接,從而提供及時利用的功能,實(shí)現(xiàn)資源共享。
一、數(shù)據(jù)來源和檢索方法
本文以目前世界上最大的中文數(shù)據(jù)庫——中國知網(wǎng)(CNKI)為數(shù)據(jù)來源,它涵蓋了國內(nèi)多個學(xué)科領(lǐng)域的論文及專著,從中獲取的數(shù)據(jù)具有權(quán)威性和代表性。在檢索方法上,由于“關(guān)于數(shù)字檔案館,還有一些不同的、但許多時候被我們混為一談的稱呼,如電子檔案館、虛擬檔案館、無墻檔案館等,其中與數(shù)字檔案館最為接近,使用最多的概念是虛擬檔案館”,本文采取主題中包含“數(shù)字檔案館”或“虛擬檔案館”的模糊檢索策略,將文獻(xiàn)刊載的時間限定在2009年至2014年間,在“跨庫選擇”中去掉了“報(bào)紙”和“商業(yè)評論”選項(xiàng),以期能夠全面囊括近年來數(shù)字檔案館的學(xué)術(shù)研究。綜上檢索方法,在目標(biāo)數(shù)據(jù)庫中共搜索到學(xué)術(shù)論文3768篇。其中主要包括中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫論文3216篇,特色期刊205篇,中國博士學(xué)位論文全文數(shù)據(jù)庫4篇,優(yōu)秀碩士學(xué)位論文全文數(shù)據(jù)庫156篇,中國重要會議論文全文數(shù)據(jù)庫180篇,國際會議論文全文數(shù)據(jù)庫和中國學(xué)術(shù)輯刊全文數(shù)據(jù)庫各有5篇和2篇。
二、統(tǒng)計(jì)結(jié)果分析
(一)年載文量分析。年載文量分析是指某一研究領(lǐng)域內(nèi)發(fā)文量隨時間單位(年)變化的趨勢,它有助于發(fā)現(xiàn)并了解該研究領(lǐng)域的受重視程度和總體趨勢。為了更直觀簡潔地顯示國內(nèi)關(guān)于數(shù)字檔案館的研究趨勢,通過對上文中獲取的數(shù)據(jù)進(jìn)行整理,觀察可以發(fā)現(xiàn)如下兩個特點(diǎn):首先,近五年來關(guān)于數(shù)字檔案館的研究發(fā)文量較大,且呈現(xiàn)出逐年上升的趨勢;其次,這一上升趨勢較為平穩(wěn),年載文量上升的邊際量較小,說明國內(nèi)關(guān)于數(shù)字檔案館的研究穩(wěn)中有升,研究規(guī)模和數(shù)量穩(wěn)定維持在高量級之上。
(二)期刊分布。某一特定的研究領(lǐng)域往往對應(yīng)著多種期刊。這些期刊質(zhì)量的高低以及影響力的大小在一定程度上決定著文章的質(zhì)量。對數(shù)字檔案館相關(guān)文獻(xiàn)的期刊分布研究將有助于理清文章的學(xué)術(shù)價(jià)值。筆者統(tǒng)計(jì)出數(shù)字檔案館研究領(lǐng)域中載文量排名前15的期刊,結(jié)果發(fā)現(xiàn),國內(nèi)數(shù)字檔案館相關(guān)文獻(xiàn)多集中在檔案學(xué)期刊上,且排名前5的期刊總載文量較高,文獻(xiàn)分布存在著不均衡的態(tài)勢;同時,表中所列出的期刊有部分來源于CSSCI和北大核心等中文核心期刊數(shù)據(jù)庫,如《蘭臺世界》《中國檔案》《檔案學(xué)通訊》等。這說明數(shù)字檔案館研究文獻(xiàn)的質(zhì)量較高,具有一定的影響力。
(三)核心作者分析。核心作者是對本學(xué)科研究的發(fā)展具有較大貢獻(xiàn)的科研人員,同時也是期刊學(xué)術(shù)影響力、競爭力的重要貢獻(xiàn)者,他們影響著期刊的生存與發(fā)展。文獻(xiàn)計(jì)量領(lǐng)域?qū)W者普賴斯(PRICED)曾提出了核心作者計(jì)算公式:=0.749。該公式給出了某一學(xué)科或研究領(lǐng)域中核心作者的計(jì)算方法。公式中Mp表示核心作者的最低發(fā)文量,Npmax則為領(lǐng)域內(nèi)發(fā)文最多的作者論文數(shù)。依照這一公式,筆者通過中國知網(wǎng)獲取到數(shù)字檔案館研究中發(fā)文最多的作者,其論文數(shù)為16篇,則Mp=0.749*3,即發(fā)文量在3篇以上的為核心作者候選人。但通過進(jìn)一步觀察發(fā)現(xiàn),在候選人名單中發(fā)文量為4-5篇的作者人數(shù)較多。
(四)發(fā)文單位統(tǒng)計(jì)。發(fā)文單位的來源體現(xiàn)了學(xué)科或研究領(lǐng)域中作者來源的結(jié)構(gòu)以及各研究單位的科研實(shí)力對比。本文統(tǒng)計(jì)了載文量排名前15的發(fā)文單位,其結(jié)果就發(fā)文單位的性質(zhì)而言,國內(nèi)關(guān)于數(shù)字檔案館研究文獻(xiàn)的發(fā)文單位主要分為高校和各級檔案館;而在高校之中,關(guān)注數(shù)字檔案館這一研究領(lǐng)域的則大多是情報(bào)及檔案學(xué)科水平較高者,如武漢大學(xué)等。另一方面,各級檔案館因?yàn)樽陨淼臉I(yè)務(wù)要求和工作性質(zhì)自然對數(shù)字檔案館產(chǎn)生了關(guān)注,這也從某種角度體現(xiàn)出檔案從業(yè)者對業(yè)界熱點(diǎn)和新趨勢的把握和體查。不同機(jī)構(gòu)和單位的作者共同對國內(nèi)數(shù)字檔案館研究領(lǐng)域的研究做出了學(xué)術(shù)貢獻(xiàn),其學(xué)術(shù)價(jià)值既來自于各高校的理論探討,也來自于檔案館對現(xiàn)實(shí)業(yè)務(wù)和工作的探索。
(五)被引頻次分析。被引頻次用以反映某一文獻(xiàn)在研究領(lǐng)域內(nèi)被其他文獻(xiàn)引用的次數(shù)和頻率,反映了文獻(xiàn)的學(xué)術(shù)貢獻(xiàn)和影響度。同時,被引頻次對學(xué)科內(nèi)相關(guān)期刊也存在著影響,期刊的影響因子與期刊刊載文章的被引頻次成正比。此處的被引頻次分析實(shí)際上是前文核心作者分析的一種補(bǔ)充,因?yàn)閷τ诤诵淖髡邅碚f,其發(fā)文量在整個研究領(lǐng)域中處于優(yōu)勢地位,而其論文是否具有一定的影響力并不是只通過發(fā)文數(shù)量來反映,被引頻次高的論文作者可能并不是核心作者。因此,被引頻次分析可以發(fā)現(xiàn)數(shù)字檔案館研究中的重要文獻(xiàn),探究這些文獻(xiàn)的主題和研究方向則有利于把握整個研究領(lǐng)域的動態(tài)。其他文獻(xiàn)引用這些高被引文獻(xiàn),相當(dāng)于以被引文獻(xiàn)為核心,將數(shù)字檔案館中具有參考意義和學(xué)術(shù)意義的思維和思路向整個領(lǐng)域擴(kuò)散。研究發(fā)現(xiàn),中國知網(wǎng)數(shù)據(jù)庫中主題為數(shù)字檔案館的研究文獻(xiàn)中被引頻次超過20次以上的文獻(xiàn),其中被引頻次最高的是來自肖希明和鄭燃的《國外圖書館、檔案館和博物館數(shù)字資源整合研究進(jìn)展》,被引頻次達(dá)38次,顯著高于其他文獻(xiàn),進(jìn)一步分析可以發(fā)現(xiàn)文獻(xiàn)作者同在上文分析的核心作者之列。對于此類綜述性、介紹性的文獻(xiàn),因?yàn)槠浜w的內(nèi)容豐富全面,其被引次數(shù)較高也在情理之中。除此之外,表中列出的其他高被引頻次文獻(xiàn)中有4篇涉及云計(jì)算等技術(shù)領(lǐng)域,這也從一個側(cè)面反映出近年來云計(jì)算和大數(shù)據(jù)等宏觀趨勢對檔案學(xué)研究的影響。
然而,被引頻次分析并不能說明數(shù)字檔案館研究文獻(xiàn)中全部的研究重點(diǎn)和主題,由于本文的初始搜索策略為“主題”搜索,因此在高頻被引文獻(xiàn)中可能會出現(xiàn)并非完全涉及到數(shù)字檔案館的文獻(xiàn),如《論檔案館的文化自覺》,檔案館這一語義與數(shù)字檔案館并不同,但仍出現(xiàn)在了高頻被引文獻(xiàn)之中。因此,要進(jìn)一步了解數(shù)字檔案館的研究方向,則需要進(jìn)行關(guān)鍵詞分析。endprint
表1 被引頻次超過20次的論文
排序 篇名 被引頻次
1 國外圖書館、檔案館和博物館數(shù)字資源整合
研究進(jìn)展 38
2 云計(jì)算在檔案信息化領(lǐng)域的應(yīng)用啟示 28
3 企業(yè)檔案信息化建設(shè)的實(shí)踐與思考 26
4 云計(jì)算環(huán)境中數(shù)字檔案館服務(wù)與管理初探 26
5 基于關(guān)聯(lián)數(shù)據(jù)的圖書館、檔案館和博物館數(shù)字
資源整合研究 25
6 國家檔案信息資源“云”共享服務(wù)模式研究 25
7 云計(jì)算技術(shù)對檔案信息化的影響和啟示 24
8 論檔案館的文化自覺 23
9 面向用戶的檔案信息集成服務(wù)模式研究 23
10 基于知識服務(wù)的檔案管理模式的理論探索 22
11 基于云計(jì)算的檔案信息資源共享模式研究 22
12 檔案文化的發(fā)展趨勢:知性.自覺.主動 22
13 加快檔案信息化建設(shè)不斷創(chuàng)新檔案工作 22
14 基于知識管理的數(shù)字檔案館服務(wù)體系構(gòu)建 22
15 政府信息公開環(huán)境下的檔案信息資源共享 22
(六)關(guān)鍵詞分析。論文的關(guān)鍵詞反映了與主題相關(guān)的研究側(cè)重點(diǎn)。關(guān)鍵詞雖然在文章中所占篇幅不大,但卻是文獻(xiàn)的核心和精髓,是文章主題的高度概括和凝練,頻次高的關(guān)鍵詞常被用來確定一個研究領(lǐng)域的熱點(diǎn)問題。數(shù)字檔案館屬于檔案學(xué)研究的范疇,但具體到數(shù)字檔案館本身,仍然有一些更加具體的研究重點(diǎn)和方向。筆者獲取了中國知網(wǎng)中數(shù)字檔案館研究的關(guān)鍵詞,并剔除了如“數(shù)字檔案館”“檔案”“檔案館”等與研究主題高度重合或無效的關(guān)鍵詞,總詞頻共計(jì)1454次。呈現(xiàn)了關(guān)鍵詞的頻率和各個關(guān)鍵詞在整個關(guān)鍵詞庫中的權(quán)重。直觀地看出,在數(shù)字檔案館相關(guān)的研究中,關(guān)鍵詞出現(xiàn)頻率位列前三的分別為“信息化”(11%)、“數(shù)字化”(9%)和“建設(shè)”(6%)。其他關(guān)鍵詞則包含了數(shù)字檔案館的應(yīng)用領(lǐng)域,如高校檔案和城建檔案等;此外,諸如云計(jì)算和知識管理等數(shù)字檔案館的技術(shù)實(shí)現(xiàn)細(xì)節(jié)也出現(xiàn)在了關(guān)鍵詞分布之中。綜合分析可以發(fā)現(xiàn),國內(nèi)數(shù)字檔案館的研究方向較為全面,其涵蓋了數(shù)字檔案館的作用范圍、技術(shù)細(xì)節(jié)及實(shí)際意義等內(nèi)容,但關(guān)鍵詞分布所展現(xiàn)的高頻關(guān)鍵詞概念較為寬泛,也從另一個角度透露出現(xiàn)階段數(shù)字檔案館研究不夠深入的問題。
三、總結(jié)與建議
(一)研究數(shù)量多,覆蓋面廣。經(jīng)過上文的分析,近五年以來國內(nèi)關(guān)于數(shù)字檔案館的研究文獻(xiàn)首先在數(shù)量上保持了逐年上升的趨勢,但增幅則保持平穩(wěn),年發(fā)文量均保持在百篇這一量級之上。這種動態(tài)增長的趨勢反映出檔案科研工作者對數(shù)字檔案館這一議題的關(guān)注,同時核心作者對整個數(shù)字檔案館的研究作出了較大的學(xué)術(shù)貢獻(xiàn),整個文獻(xiàn)的數(shù)量得到了充實(shí)和豐富。隨后經(jīng)過被引頻次和論文關(guān)鍵詞分析可以看出,關(guān)于數(shù)字檔案館的研究,其方向涵蓋了現(xiàn)實(shí)意義、技術(shù)架構(gòu)以及知識管理等方方面面,可以說是將檔案學(xué)科的基本原理和問題在數(shù)字檔案館這一切入口中的豐富探索。
(二)研究機(jī)構(gòu)單一。雖然數(shù)字檔案館的研究文獻(xiàn)較為豐富,但是從研究單位分析中可以發(fā)現(xiàn)文獻(xiàn)來源的單一性和同質(zhì)性。多數(shù)文獻(xiàn)來源于高校檔案專業(yè)以及各級檔案館,但其他一些數(shù)字檔案館的重要應(yīng)用領(lǐng)域如企業(yè)、政府等部門則鮮有相關(guān)文章。檔案學(xué)應(yīng)用廣泛,如果相關(guān)的理論研究成果只存在于學(xué)界,則其應(yīng)用價(jià)值相對略顯單薄。一些企業(yè)的檔案管理部門和政府檔案管理部門應(yīng)當(dāng)從自己的工作經(jīng)驗(yàn)和業(yè)務(wù)流程著手,通過貢獻(xiàn)有價(jià)值的文獻(xiàn)來豐富數(shù)字檔案館的研究。同時,數(shù)字檔案館也并非單純地屬于檔案工作的概念,其背后的技術(shù)細(xì)節(jié)和知識管理體系仍然是企業(yè)戰(zhàn)略管理和科學(xué)管理的重要知識之一。因此在日后的研究中,數(shù)字檔案館研究的來源機(jī)構(gòu)應(yīng)該更加多樣,以期從不同的視角看待這一議題,從而使得整個學(xué)術(shù)價(jià)值多維化。
(三)研究熱點(diǎn)有待深化。從論文被引頻次分析以及關(guān)鍵詞分析中不難發(fā)現(xiàn),目前關(guān)于數(shù)字檔案館的研究仍存在著局限性。具體而言,雖然文獻(xiàn)數(shù)量和質(zhì)量都保持著較好的水平,但是文獻(xiàn)的探索深度并不及其廣度??v觀高被引頻次的論文,其中一些綜述性和介紹性的論文較多,它們在概念解釋和傳播國外先進(jìn)研究成果上都起到了良好的作用,但是其內(nèi)容的多為框架性的理論,提出的總結(jié)和建議往往只涉及到宏觀意義。在大數(shù)據(jù)、信息化和云計(jì)算等趨勢迅速發(fā)展的今天,數(shù)字檔案館的研究不能只流于表面,即對這些技術(shù)趨勢進(jìn)行介紹和提及或者與檔案學(xué)略加結(jié)合,而應(yīng)當(dāng)使用數(shù)據(jù)和嚴(yán)謹(jǐn)?shù)膶?shí)證研究來歸納數(shù)字檔案館運(yùn)行的規(guī)律,闡述其在業(yè)務(wù)中的實(shí)際意義,并結(jié)合自身的學(xué)科和業(yè)務(wù)特點(diǎn)來提出建設(shè)性的意見和建議,增加整個數(shù)字檔案館研究的深度。endprint