楊 彭
(南京大學信息管理學院 江蘇南京 210093)
數(shù)字圖書館是對圖書館的虛擬化,不僅可以實現(xiàn)紙質圖書、期刊文獻的電子化,而且極大地促進了文獻信息的跨時間、跨區(qū)域交流。因此,數(shù)字圖書館是圖書館服務的一次革命性轉變,從根本上突破了傳統(tǒng)圖書館的時空限制。自從20世紀90年代初美國科學家首次提出數(shù)字圖書館這一概念以來,數(shù)字圖書館的相關技術研究就迅速進入學術研究的視角,我國從1994年開始對該領域的相關理論和技術進行研究。本文基于CNKI中國期刊全文數(shù)據(jù)庫,擬從論文文獻的年代分布特征、高被引論文的期刊分布、高產作者分布和高頻關鍵詞分布等角度分析國內數(shù)字圖書館領域的研究現(xiàn)狀,強調數(shù)字圖書館相關技術的研究價值和研究方向,從而為國內的研究學者提供一定的參考,為促進數(shù)字圖書館領域的快速發(fā)展提供數(shù)據(jù)支撐和理論支持,以推進數(shù)字圖書館研究的進一步突破。
國內已經(jīng)發(fā)表了一些和數(shù)字圖書館文獻計量分析相關的文獻,從這些文章的研究內容來看,《近十年我國數(shù)字圖書館學術論文的計量分析》對2000~2010年數(shù)字圖書館領域發(fā)表的2062篇學術論文進行了作者、主題、時空分布分析,《以用戶為中心的數(shù)字圖書館個性化服務研究的文獻計量分析》從年代分布、主題分布以及作者分布角度分析了2002~2011年的 997 篇期刊文獻,《國內近十年數(shù)字圖書館領域研究熱點分析——基于共詞分析》基于1999~2008年CNKI數(shù)據(jù)庫收錄的1356篇學術論文重點進行了關鍵詞共詞分析,《基于Web of Science的數(shù)字圖書館研究論文定量分析》統(tǒng)計了1993~2004年SCI和SSCI數(shù)據(jù)庫收錄的819篇文章的時間、期刊、被引頻次、作者分布情況,《近6年我國數(shù)字圖書館研究論文定量分析》對1996~2001年間24種圖書館學情報學期刊發(fā)表的618篇文獻進行較為全面的論文年代、主題、來源期刊和作者分析,《1999~2008年我國數(shù)字圖書館研究論文的計量分析》則選取了1999~2008年間CNKI收錄的13727篇論文進行了較為系統(tǒng)的核心作者群、高產作者群、關鍵詞分析。
可見,這些研究主要局限在2008年以前的論文分析,缺少對我國數(shù)字圖書館近期成果的分析。另一方面,多數(shù)論文的分析主要針對某一個方面,如僅以關鍵詞進行共詞分析或僅針對國外文獻的分析,為了彌補現(xiàn)有文獻的不足,本文針對2008~2012年CNKI中發(fā)表的數(shù)字圖書館論文展開分析,以幫助學人了解我國數(shù)字圖書館領域最新研究狀況,促進我國數(shù)字圖書館研究與實踐更加健康快速發(fā)展。
CNKI中國期刊全文數(shù)據(jù)庫是我國收錄學術信息最為全面的數(shù)字資源。選擇CNKI作為數(shù)據(jù)來源分析我國數(shù)字圖書館的研究可以較為全面地把握該領域的研究現(xiàn)狀。但是由于《數(shù)字圖書館論壇》、《情報學報》等期刊并沒有收錄在CNKI中,一定程度上影響到研究數(shù)據(jù)的完整性。為了彌補中國期刊全文數(shù)據(jù)庫期刊收錄方面的不足,本文基于萬方學術期刊全文數(shù)據(jù)庫對《情報學報》、《數(shù)字圖書館論壇》兩本期刊進行了全面的數(shù)據(jù)調研。兩種期刊在2008~2012年間共收錄數(shù)字圖書館方向的文章267篇,其中《數(shù)字圖書館論壇》的載文量達到245篇。
考慮到研究國內數(shù)字圖書館發(fā)展現(xiàn)狀的時效性、精準性和全面性的要求,本文在CNKI中國期刊全文數(shù)據(jù)庫和萬方學術期刊全文數(shù)據(jù)庫中,將主題字段 “數(shù)字圖書館”和中圖分類號字段G250.7進行檢索或運算,發(fā)文年代限制為2008~2012年,同時選用期刊全文數(shù)據(jù)庫將文獻類型限定為論文類型,共檢索得到有效文獻數(shù)20152篇。
本文主要采用文獻計量學方法以及共詞分析法進行研究。文獻計量學方法是基于數(shù)學、統(tǒng)計學等學科,對文獻進行定量分析的方法。而共詞分析法則是一種利用專業(yè)術語(通常選擇關鍵詞)進行共現(xiàn)分析,以揭示內容結構特征的文獻統(tǒng)計學方法。
本文使用的輔助軟件工具是一種基于.NET平臺和c#高級程序語言的文獻題錄信息統(tǒng)計分析工具SATI。這種統(tǒng)計分析軟件可以實現(xiàn)導入并處理EndNote格式、NoteExpress格式及NoteFirst格式的國內文獻題錄信息和HTML格式的WoS國際文獻題錄信息。同時還可以利用該軟件進行數(shù)據(jù)格式的轉換、字段信息的抽取、詞條頻次的統(tǒng)計和知識單元共現(xiàn)矩陣、詞條頻率逐年分布矩陣及文檔詞條矩陣的構建。
通過一個研究領域的文獻年代分布研究,可以分析出該領域的研究走勢。根據(jù)文獻增長規(guī)律特征,一個領域在研究初期文獻量呈指數(shù)增長,發(fā)展到鼎盛時期增長變緩,成熟后數(shù)量會逐步下降。為了考察數(shù)字圖書館研究的成長性,本文統(tǒng)計了2008~2012年CNKI收錄的數(shù)字圖書館的期刊論文(見表1)以及其年化分布趨勢圖(見圖1)。
表12008~2012年國內數(shù)字圖書館領域發(fā)文量統(tǒng)計
圖12008~2012年數(shù)字圖書館領域文獻年代分布圖
由表1可以看出,2008~2012年我國數(shù)字圖書館領域每年的發(fā)文總量都在3600篇以上,2008至2009年的發(fā)文量更是突破了4000篇。但是2009年以后每年的發(fā)文量呈現(xiàn)出明顯的下滑趨勢。由圖1可以發(fā)現(xiàn),2009年是2008~2012年數(shù)字圖書館發(fā)文量最多的年度。自2009年之后發(fā)文量出現(xiàn)明顯下滑。本文查閱文獻后發(fā)現(xiàn),在2000~2008年期間,數(shù)字圖書館文獻一直處于上升期,但后幾年的上升出現(xiàn)了緩慢情形,因此2009年應該是數(shù)字圖書館發(fā)展的頂峰時期。技術的發(fā)展標志著將會有新的技術取代數(shù)字圖書館,就像10多年前圖書館自動化被數(shù)字圖書館所取代一樣,所以在未來的數(shù)字圖書館發(fā)展歷程中,云圖書館技術也許會取代數(shù)字圖書館技術。
數(shù)字圖書館的發(fā)文情況還可以從學科角度深入分析。每年數(shù)字圖書館領域發(fā)文的學科分布除了可以了解熱點發(fā)文年限,還能夠更深入地著眼于其多學科性質和重點學科的研究?;贑NKI中國期刊全文數(shù)據(jù)庫的學科統(tǒng)計功能,圖2形象直觀地顯示了2008~2012年圖書情報與數(shù)字圖書館和計算機軟件及計算機應用學科的發(fā)文情況。根據(jù)CNKI學科類別載文量的統(tǒng)計,這兩個學科的總發(fā)文量是每年最多的,占全年數(shù)字圖書館領域發(fā)文量的90%左右,因此選擇這兩個學科進行分析具有一定的代表性。
從圖2可以看出,2008~2012年圖書情報與數(shù)字圖書館學科的發(fā)文量比較穩(wěn)定,基本保持在3500篇左右。但是計算機軟件及計算機應用學科的發(fā)文量變化波動比較明顯。尤其是2010年以來,在數(shù)字圖書館領域發(fā)表的研究論文有所下降,2012年的發(fā)文量甚至不足500篇。從學科角度可以看出,數(shù)字圖書館的技術問題已基本解決,計算機領域在探索并考慮如何用新的技術和理念取代數(shù)字圖書館,這也和數(shù)字圖書館的成熟以及論文數(shù)量的下滑形成呼應。
圖2 數(shù)字圖書館的代表性學科發(fā)文量對比圖
代表性期刊分布可以有效地引導研究者的閱讀方向,研究者可以反復研讀和參考這些業(yè)內的權威期刊,在把握現(xiàn)有學術成果的基礎上獲取學術靈感和潮流化的研究主題。表2直觀地顯示了CNKI中國期刊全文數(shù)據(jù)庫數(shù)字圖書館領域篇均被引排在前20位的核心期刊以及通過萬方數(shù)據(jù)庫檢索得到的《情報學報》和《數(shù)字圖書館論壇》兩種期刊。這里的篇均被引頻次指標,是通過期刊2008~2012年數(shù)字圖書館領域的總載文量和這些論文的總被引量相除得到的。
由表2可以看出,這22種期刊都是圖書情報領域期刊,大多數(shù)是圖書情報領域的核心期刊。這些期刊的數(shù)字圖書館論文的篇均被引頻次基本在兩次以上,最高的甚至達到10次左右。另外根據(jù)CNKI的期刊發(fā)文量統(tǒng)計,僅僅2008~2012年,數(shù)字圖書館領域載文量在115篇以上的期刊就有40種,其中包含了《醫(yī)學信息學雜志》、《中國科技信息》、《科技咨詢》、《農業(yè)圖書情報學刊》等多學科方向的各種期刊。
這些數(shù)據(jù)有力地證明了數(shù)字圖書館研究是圖書情報學科的一個重要領域。圖書情報學期刊非常重視數(shù)字圖書館領域的論文發(fā)表。同時數(shù)字圖書館研究也受到其他學科相關領域的重視,具有實用性和多學科性的研究特征。
高被引文獻的作者一般都是具有一定學術影響力的學者。這些專家學者在自己的專攻領域或多或少都有一定的建樹,所以他們的學術研究成果比較具有說服力和權威性。因此,了解他們的知識結構和主攻方向顯得尤為重要?;?008~2012年的統(tǒng)計數(shù)據(jù),數(shù)字圖書館領域的高被引文獻作者的基本情況如表3所示,其中篇均被引頻次指標是通過CNKI高發(fā)文量作者的詳細發(fā)文情況列表,統(tǒng)計出發(fā)文總量和被引總量,然后相除得到的。
表22008~2012年數(shù)字圖書館領域代表性期刊分布表
根據(jù)表3,這些學者五年來的發(fā)文量基本都在10篇以上,篇均被引頻次保持在4次以上。他們所從事的工作、職務基本都是大學教授或是圖書館研究員。從這些數(shù)據(jù)可以發(fā)現(xiàn),這些專家學者在數(shù)字圖書館研究領域已經(jīng)取得相當?shù)某煽?,已?jīng)有學者大量參考和引用他們的學術成果。另外還可看到,武漢大學、中山大學以及中國科學院國家科學圖書館是高度重視數(shù)字圖書館領域的研究機構。因此,重視這些專家學者的論文發(fā)表成果以及密切關注這些研究機構的研究動向,將有助于數(shù)字圖書館相關技術的研究突破。
表32008~2012年國內數(shù)字圖書館領域高產作者分布
針對某一具體研究主題的基金項目資助情況分析,尤其是國家級項目的支持情況分析,可以挖掘出相應主題的學術地位以及受重視程度?;贑NKI中國期刊全文數(shù)據(jù)庫的基金項目統(tǒng)計功能,表4統(tǒng)計了2008~2012年國內數(shù)字圖書館領域國家級基金項目數(shù)量變化情況。
從表4的統(tǒng)計數(shù)據(jù)來看,盡管國家級基金資助項目的總量出現(xiàn)一定的波動:2009~2011年三年來國家基金支持的論文發(fā)表總量明顯下降。但從2008~2012年的總體發(fā)展趨勢來看,國家對數(shù)字圖書館研究的支持并沒有大幅度削減,尤其是2012年,發(fā)表論文的總量又重新回升至120篇。這些數(shù)據(jù)表明國家并沒有減少在數(shù)字圖書館研究領域的投入,數(shù)字圖書館領域仍然是國家較為關注的前沿研究方向。
表42008~2012年國內數(shù)字圖書館領域國家級基金項目統(tǒng)計表
國家自然科學基金和國家社會科學基金是國家支持基金中的兩大具有代表性的基金項目。從表4的統(tǒng)計數(shù)據(jù)可以看出,國家社會科學基金支持的論文發(fā)表總量要顯著高于國家自然科學基金。這一定程度上是由社會科學和自然科學的學科性質決定的。在數(shù)字圖書館領域,自然科學關注更多的是技術的實現(xiàn),而社會科學則更多地從管理角度著手進行研究。因此,自然科學基金支持的論文發(fā)表量的下降并不說明數(shù)字圖書館研究重視度的下降,因為要在現(xiàn)有完善的技術層面上取得突破需要更多時間和精力的投入,以及更有新意的選題。
關鍵詞往往是文章的核心切入點,對文獻關鍵詞進行分析可以全面把握文獻的內容結構,同時還可以推斷出某一具體學術領域的研究熱點和方向,給予研究者在學術選題方面一定的參考,更好地著眼于前沿研究主題。表5統(tǒng)計了國內數(shù)字圖書館領域使用頻次在160次以上的關鍵詞并且進行了關鍵詞的簡單整理:將同義的關鍵詞進行合并,同時將“管理”、“服務”等不具實際含義的關鍵詞排除。
根據(jù)表5的統(tǒng)計數(shù)據(jù),可以簡單地概括出2008~2012年數(shù)字圖書館領域的研究熱點。云計算、數(shù)據(jù)庫構建、知識產權保護、知識服務、個性化服務、元數(shù)據(jù)、信息資源共享、數(shù)據(jù)資源管理等主題一直是2008~2012年備受歡迎的研究主題。另外高校圖書館作為數(shù)字圖書館的一種,也成為學界較有影響力的研究熱點。當然,僅僅從關鍵詞頻次的角度來推斷某一具體研究領域的研究熱點還是遠遠不夠的。研究關鍵詞之間的共現(xiàn)關系,構建出關鍵詞內容之間的網(wǎng)狀關系結構對于分析相應主題領域的研究熱點是個很好的補充。因此,本文使用ucinet和sati軟件對五年來被引頻次在10次以上的文獻關鍵詞進行兩兩共現(xiàn)關系統(tǒng)計,構建出使用頻次在8次以上的四十個關鍵詞共詞矩陣,并通過ucinet的可視化制作軟件利用有向性指針呈現(xiàn)出來,如表6所示,其中節(jié)點數(shù)字分別表示關鍵詞頻次降序排列的序號。
表52008~2012年國內數(shù)字圖書館領域高頻關鍵詞統(tǒng)計
根據(jù)共現(xiàn)知識圖譜(見圖3)可以看出,數(shù)字圖書館處于網(wǎng)絡節(jié)點的中心位置,其中介中心性最大,是網(wǎng)絡中最重要的節(jié)點,其他節(jié)點圍繞中心節(jié)點緊密聯(lián)系。根據(jù)圖3中有向性指針的標注情況,一些重要的共現(xiàn)關鍵詞顯而易見。基于高頻關鍵詞統(tǒng)計表和知識圖譜可以歸納出2008~2012年數(shù)字圖書館領域的研究熱點:
(1)數(shù)字圖書館技術的發(fā)展在很大程度上推動著學術成果的交流,因此知識服務成為數(shù)字圖書館領域研究的一大熱點。知識服務的研究重在服務模式的構建和個性化服務的研究。
(2)云計算、RFID、開放存取技術這些新興技術是數(shù)字圖書館研究過程中重要的技術支撐。從知識圖譜可以看出,在進行數(shù)字圖書館具體技術研究時,這些新興技術往往被同時涉及。云計算的研究強調數(shù)字圖書館的移動性,而開放存取技術的研究注重一個重要概念——機構知識庫,以便推動信息共享空間的進一步擴展,RFID技術的研究則著眼于現(xiàn)有的網(wǎng)絡環(huán)境??傊?,對于新興技術的研究也是數(shù)字圖書館領域研究的熱點主題。
表62008~2012年國內數(shù)字圖書館領域高頻被引文獻關鍵詞分布
(3)數(shù)字圖書館的研究內容涉及方方面面,高校數(shù)字圖書館、移動數(shù)字圖書館、泛在數(shù)字圖書館、手機圖書館都是較受關注的研究領域。無論是手機圖書館、移動圖書館、還是泛在圖書館都強調在3G網(wǎng)絡環(huán)境下,跨越時間和空間的限制對圖書館信息資源的共享。而高校數(shù)字圖書館更偏向于個性化信息共享服務和圖書館聯(lián)盟方式的研究。
(4)數(shù)字圖書館最重要的是數(shù)字資源管理,因此信息資源整合、信息資源的共享、特色數(shù)據(jù)庫的構建成為數(shù)字圖書館領域研究的一大熱點,這些數(shù)據(jù)服務研究趨向于一種趨勢——網(wǎng)絡環(huán)境下的圖書館聯(lián)盟建設,尤其是高校圖書館。至于具體技術的實現(xiàn),有些專家學者將其與云計算技術緊密聯(lián)系在一起。
圖3 數(shù)字圖書館領域共現(xiàn)知識圖譜
在信息化時代,數(shù)字圖書館作為一個新興的研究主題一直備受學界關注。本文選取了2008~2012年度CNKI中國期刊全文數(shù)據(jù)庫和萬方學術期刊數(shù)據(jù)庫的文獻數(shù)據(jù),并對其進行年代、學科、高產作者、代表性期刊、高頻關鍵詞、項目基金支持情況以及熱點研究等方面的定量分析,用數(shù)據(jù)說話,客觀地揭示了五年來數(shù)字圖書館領域的發(fā)展現(xiàn)狀和研究熱點,以便給予研究專家一定的學術參考,從而取得更大的學術突破,進一步推動國內數(shù)字圖書館的研究進展。
從2008~2012年五年的文獻數(shù)據(jù)來看,2009年是數(shù)字圖書館發(fā)文的峰值年,發(fā)文量是五年來最高的,此后的文獻量呈現(xiàn)出明顯的下滑趨勢。因此,2009年是數(shù)字圖書館研究過程中的重要轉折點。在這種文獻背景下,數(shù)字圖書館的研究很有可能出現(xiàn)研究角度轉移的趨勢,就像10多年前圖書館自動化被數(shù)字圖書館所取代一樣。另外,數(shù)字圖書館的研究是一種理論和實踐的完美結合。圖書情報學科主要著眼于理論方向的研究,許多研究成果刊載在本學科的核心期刊上,而計算機軟件及計算機應用學科則更多關注數(shù)字圖書館技術層面的研究。從這兩個學科每年的發(fā)文量可以看出,隨著數(shù)字圖書館實現(xiàn)技術的逐步完善,理論方向的研究開始處于主導地位。當然,數(shù)字圖書館研究的不斷突破離不開一批專業(yè)知識深厚、投入全部研究精力的專家學者的支持。更為重要的是,國家對數(shù)字圖書館研究也表現(xiàn)出高度重視,每年由國家基金項目支持的論文數(shù)高達百篇左右。
綜上所述,專攻數(shù)字圖書館研究的專家學者如果對選擇的主攻方向始終滿含自信,并著眼于當前數(shù)字圖書館的研究熱點,從中找出新的突破點,不僅能夠實現(xiàn)個人研究的飛躍,還能從宏觀上推動國內數(shù)字圖書館研究的發(fā)展進程。
[1]蘇新寧,李思舒.我國數(shù)字圖書館研究十年:概況統(tǒng)計分析[J].數(shù)字圖書館論壇,2011,(5):2-11.
[2]蘇新寧,夏立新,胡守敏等.我國數(shù)字圖書館研究十年:基于科研項目分析[J].數(shù)字圖書館論壇,2011,(5):12-19.
[3]劉成山,張秀君.近十年我國數(shù)字圖書館學術論文的計量分析[J].現(xiàn)代情報,2011,(3):113-116.
[4]張小平,張爭,杜媛鯤.以用戶為中心的數(shù)字圖書館個性化服務研究的文獻計量分析(2002年~2011年)[J].農業(yè)圖書情報學刊,2012,(11):47-52.
[5]董偉.國內近十年數(shù)字圖書館領域研究熱點分析——基于共詞分析[J].圖書情報知識,2009,(5):58-63.
[6]周靜怡,孫坦.基于Web of Science的數(shù)字圖書館研究論文定量分析[J].情報科學,2005,(10):1521-1525.
[7]王惠翔,高凡.近6年我國數(shù)字圖書館研究論文定量分析[J].圖書情報工作,2002,(5):37-40.
[8]邱均平,王明芝.1999-2008年國內數(shù)字圖書館研究論文的計量分析[J].情報雜志,2010,(2):1-5.
[9]劉啟元,葉鷹.文獻題錄信息挖掘技術方法及其軟件SATI的實現(xiàn)——以中外圖書情報學為例[J].信息資源管理學報,2012,(1):50-58.