呂玉龍 王細榮
?
《圖書館雜志》“十二五”回眸
——基于關鍵詞可視化分析
呂玉龍王細榮
本文以《圖書館雜志》刊載的“十二五”期間學術文獻為統(tǒng)計分析對象,應用二模網絡、中心性分析、聚類分析、“K-核”分析、戰(zhàn)略坐標圖等可視化分析技術,從關鍵詞角度分析了該刊在“十二五”期間的內容特色及主題變化態(tài)勢。
“十二五”;《圖書館雜志》;可視化分析
《圖書館雜志》創(chuàng)刊于1982年,是上海市圖書館學會與上海圖書館聯(lián)合主辦的全國性圖書館學情報學專業(yè)核心學術期刊。一直以來,《圖書館雜志》秉承理論聯(lián)系實際的辦刊宗旨,力求前瞻探索與現(xiàn)實研究并重、理論學術與實踐操作并舉的內容特色?!笆濉逼陂g,適逢《圖書館雜志》創(chuàng)刊30周年,《圖書館雜志》進行了轉型發(fā)展的探索性改革,對期刊啟用新封面和嘗試性改版,上線新的數字化編輯系統(tǒng)和網站等,為讀者、作者、編者提供全新的期刊服務平臺和專業(yè)資訊平臺。本文以《圖書館雜志》“十二五”期間刊載的學術文獻為統(tǒng)計分析對象,使用二模網絡、中心性分析、聚類分析、“K-核”分析、戰(zhàn)略坐標圖等可視化分析技術,采取圖書館與信息科學研究的迷你型方法論教科書《圖書館焦慮——理論、研究和應用》中的數據采集、數據分析和數據解釋的研究框架,從關鍵詞角度分析了《圖書館雜志》在“十二五”期間的知識網絡結構、潛在的主題生態(tài)進化態(tài)勢以及內容特色,以期給讀者和編者提供參考。
1.數據獲取
《圖書館雜志》是中國知網(CNKI)全文全收錄的期刊,在CNKI中可檢索“十二五”期間《圖書館雜志》上刊載的全部文獻。經檢索,共獲取文獻1470篇,其中包含選題指南、總目錄、館舍介紹、簡訊、通知等非學術文章,這些文章作者或單位未著錄,故可通過去除作者或單位為空白的記錄,以篩選出學術文章的記錄數,共計1363篇,并將此作為研究分析對象。
2.數據總覽
“十二五”期間,《圖書館雜志》刊載文獻量按照年代分布如圖1所示。2013年,該期刊的學術文獻量較前兩年出現(xiàn)了較大幅度的下降,而后兩年較2013年又出現(xiàn)了較大幅度的下降。究其原因,《圖書館雜志》在紀念創(chuàng)刊30周年之際做出了在2013年開始改版嘗試的決定,進行了期刊定位和欄目設置的探索性改革。在欄目設置上,2013年和前兩年相比,“上圖講座經典”欄目減少了10期,延續(xù)了“理論探索”“工作研究”“公共圖書館”“高校圖書館”“新技術應用”“海外瞭望”“文史天地”和“悅讀時空”八大主設欄目。經過2013年一年的探索,《圖書館雜志》在2014年開始再次對期刊欄目進行了調整,主設“專題·專稿”“理論探索”“工作研究”“新技術應用”“國際交流”和“文獻考論”六大主題,并且不定期刊登“書刊推薦”和“書刊評介”。2015年,《圖書館雜志》不定期新增設“博士論壇”和“全民閱讀學壇”,期刊主題逐漸增加“閱讀推廣”的分量。
圖1 “十二五”期間《圖書館雜志》刊載文獻量變化趨勢圖
國內大部分學術期刊上所刊載的學術性文章通常都由作者標注關鍵詞,用來反映某篇學術論文的研究主題、研究方法、研究工具等內容。每種學術期刊的刊文都有一定特色,關鍵詞頻率的變化及關鍵詞之間的關系在較大程度上可以揭示其發(fā)文主題的變化情況。因此,可以通過關鍵詞分析,了解期刊的內容特色和辦刊主題。在上述1363篇文獻中,共計出現(xiàn)關鍵詞4294個,關鍵詞頻次6261次,篇均關鍵詞4.59個。文章選取高頻關鍵詞閾值為5,共得高頻關鍵詞114個,下面應用可視化技術分析這些高頻關鍵詞。
1.關鍵詞-年代分析
通過分析關鍵詞隨年代的遷移情況,可以了解期刊辦刊主題的穩(wěn)定性和連續(xù)性等變化情況。統(tǒng)計114個高頻關鍵詞在五年間出現(xiàn)的情況,得到“關鍵詞-年代”二模關系矩陣,應用NetDraw可視化該矩陣,并使用多維量表(MDS)方法重新排列,結果如圖2所示。由于多維量表技術是根據“距離”進行畫圖的,因此在二維空間中,距離越近的點關系越緊密。[1]圖2中,2011年、2012年和2013年在距離上比較接近,說明《圖書館雜志》在這3年刊載的內容主題具有較大的相似性。2014年和2015年的距離比較遠,與前3年的距離也比較遠,說明這兩年的內容主題變化較大,期刊定位一直處于探索中。同時,5年間的高頻關鍵詞沒有出現(xiàn)明顯的分塊情況,說明主題和內容具有一定的穩(wěn)定性和連續(xù)性。
圖2 高頻關鍵詞—年代的多維量表圖
2.關鍵詞中心性分析
關鍵詞出現(xiàn)的頻率越高,說明該主題是期刊關注的研究熱點,關鍵詞共現(xiàn)的次數越多,說明該主題與其他主題聯(lián)系能力越強。通過分析期刊刊載的關鍵詞的“中心性”,可以評價一個主題在期刊中的重要程度,或其在期刊主題中的影響力,從而可以找出期刊的主題關鍵詞。分別統(tǒng)計114個關鍵詞在1363篇文獻中共同出現(xiàn)的次數,得到一個高頻關鍵詞共現(xiàn)矩陣(主對角線上的元素表示每個關鍵詞的詞頻),將該共現(xiàn)矩陣導入社會網絡分析軟件UCINET 6中,沿著“Network→Centrality→MultipleMeasures”做標準化中心度分析,分別計算高頻關鍵詞的點度中心度、中介中心度和接近中心度,并使用Net-Draw可視化關鍵詞共現(xiàn)網絡,結果如圖3所示。
圖3 高頻關鍵詞共現(xiàn)網絡圖譜
圖3中,節(jié)點越大,表示點度中心度越大,該節(jié)點通常與其他節(jié)點存在較多關系;文本越大,表示中介中心度越大,即使它的度數較低,也能起到重要的中介作用,因而處于網絡的中心地位。由圖3可以看出,圖書館、高校圖書館和公共圖書館的點度中心度最大,其次是全民閱讀、閱讀文化、少兒閱讀等,中介中心性較大的除了圖書館、高校圖書館和公共圖書館外,還有圖書館學、圖書館員、讀者服務、閱讀推廣等,說明“十二五”期間,《圖書館雜志》重點關注這些領域和主題。點度中心度和中介中心度最少的是版本、圖書采訪、上圖、《四庫全書總目》、補正和Primo,說明《圖書館雜志》對這些方面刊載的文獻量很低。
3.關鍵詞K-核鍵詞
對高頻關鍵詞進行“K-核”分析,可以確定“核心-邊緣”關鍵詞,進而可以知道期刊的核心主題和邊緣主題?!癒-核”中所有關鍵詞的度數都至少為k。原始共現(xiàn)矩陣中非零元素的均值為2.63,選取共現(xiàn)頻次的閾值為3,通過UCINET 6將原始矩陣轉換為二值矩陣并運行“K-cores”分析,結果如圖4所示。圖4中,▲表示3-核簇,是核心關鍵詞;●代表2-核簇,是次級核心關鍵詞; 代表1-核簇,是次級邊緣關鍵詞;其余關鍵詞為邊緣關鍵詞,關鍵詞字體大小表示點度中心度。從圖4可以看出,核心關鍵詞有全民閱讀、少兒閱讀、中國圖書館學會、推廣委員會和閱讀學,其中全民閱讀和少兒閱讀的中心度最高;次級核心關鍵詞有13個,其中圖書館學、閱讀文化和閱讀服務的中心度較高;次級邊緣關鍵詞中,公共圖書館、圖書館和閱讀推廣的中心度較高。
圖4 高頻關鍵詞二值矩陣的讀K-核頻關鍵詞二
圖5 高頻關鍵詞聚類分析樹狀圖(部分)
4.關鍵詞聚類分析
聚類分析可以根據關鍵詞之間的緊密程度聚合為一個表達某個主題的相對獨立的簇,從而把所有關鍵詞劃分為若干個研究主題。為了消除共現(xiàn)頻次差異所帶來的影響,將原始共現(xiàn)矩陣采用Salton指數轉換為相關矩陣,導入SPSS 22.0進行系統(tǒng)聚類分析,聚類方法選擇“ward法”,度量標準選擇“平方Euclidean距離”,聚類樹狀圖(部分)如圖5所示。
114個關鍵詞可以分成10類,其中聚類9含有60個關鍵詞,可以進一步分成10類。“K-核”分析中的5個核心關鍵詞全部分布在類10中,13個次級核心關鍵詞主要分布在類1、2、6、7、10中,兩者中的絕大部分關鍵詞集中于類1、2、6、10中。
5.關鍵詞戰(zhàn)略坐標圖分析
戰(zhàn)略坐標圖(Strategical Diagram)分析方法由Law等人提出,是基于研究主題或類團的密度(Density)和向心度(Centrality)的一種可視化分析方法,用來揭示各主題聚類內的內部聯(lián)系情況和類間的相互影響情況。其中橫軸代表向心度,揭示研究主題與其他主題的關聯(lián)程度,縱軸代表密度,表示某研究主題維持和發(fā)展自身的能力。因此,應用戰(zhàn)略坐標圖法分析期刊某一時期的高頻關鍵詞,可以了解期刊主題的生態(tài)進化趨勢。根據上述的114個關鍵詞的共現(xiàn)矩陣分別計算聚類分析得到的19個類的密度和向心度,密度和向心度的均值為4.92和5.21,通過Excel散點圖的形式繪制戰(zhàn)略坐標圖(見圖6所示)。
圖6 高頻關鍵詞主題簇的戰(zhàn)略坐標圖
將戰(zhàn)略坐標圖應用于期刊刊載文獻的主題分析,位于第Ⅰ象限的主題的密度和向心度都較高,說明主題內部聯(lián)系緊密,并且與其他主題密切相關,期刊對該象限的主題興趣濃厚,形成系統(tǒng)化的關注;第Ⅱ象限的主題結構不緊密,但其研究狀況比較成熟,由于缺乏后續(xù)進展而受到的關注較少,期刊對該象限的主題有一定的關注度,但是關注內容成片狀化,處于關注邊緣地帶;第Ⅲ象限的主題密度和向心度都比較低,內部關系松散,與其他主題的聯(lián)系不夠緊密,期刊對該象限的主題需要進一步提煉;第Ⅳ象限的主題密度低但向心度高,雖然處于期刊關注的核心地位,但易被其他主題同化或吸納。如圖6所示,第Ⅰ象限的主題簇有類1、類7、類9-7、類10;第Ⅱ象限的主題簇有類2、類3、類6、類9-1;第Ⅳ象限的主題簇有類9-2;其余的主題簇均在第Ⅲ象限。
通過上述關于《圖書館雜志》在“十二五”期間刊載的學術文獻關鍵詞的知識圖譜分析,結合高頻關鍵詞的“K-核”分析和戰(zhàn)略坐標圖分析,可得出:
1.全民閱讀是其內容核心,閱讀推廣成潛力主題
全民閱讀是“K—核”分析中的核心關鍵詞,且在聚類分析和戰(zhàn)略坐標圖分析中歸于類10和第Ⅰ象限,其點度中心度和中介中心度緊隨公共圖書館之后,位列第四,足以凸顯出其核心主題地位。閱讀推廣是次級邊緣關鍵詞,但在戰(zhàn)略坐標圖中位于第Ⅰ象限,其點度中心度和中介中心度也位居前列,說明其在廣度和深度上具有較大的發(fā)展?jié)摿?,是期刊下一步關注的重點領域。
2.圖書館基礎理論和學科服務主題涵蓋范圍廣,但內容不集中,處于關注邊緣
類2(圖書館本質、基礎理論、圖書館學)和類6(學科館員、學科服務、大學圖書館、學科化服務、文獻采訪)處于戰(zhàn)略坐標圖的第Ⅱ象限。同時,絕大部分主題是次級核心關鍵詞,說明該領域的研究比較成熟,雖然關注度高但后續(xù)發(fā)展慢,存在被期刊邊緣化的風險。
3.圖書情報學主題需要進一步加強關注
大數據、云計算、可視化和數據挖掘等圖書情報方面的主題均位于第Ⅲ象限。說明期刊一直對這些領域存在興趣,但這些主題內部聯(lián)系松散,與其他主題聯(lián)系也不夠緊密,需要引起重視,對這些主題進行細分和優(yōu)化,在提高關注度同時,也要注意提高主題的內部聯(lián)系。
4.數字閱讀易被分解或演化為其他相關主題
類9-2(電子書、數字閱讀)位于第Ⅳ象限且是次級邊緣關鍵詞,盡管具有較高的向心度,但密度較低,說明該主題在期刊中內部結構不穩(wěn)定,在后期發(fā)展中易被期刊的其他主題消化或吸納。一方面,數字閱讀是現(xiàn)代信息技術給圖書館服務帶來的新手段,另一方面,數字閱讀和電子書是閱讀推廣的形式之一。
“十二五”期間,《圖書館雜志》抓住時代脈搏,在轉型發(fā)展中探索前行,重點關注公共文化服務體系的新理論、新模式和新途徑,倡導全民閱讀,關注少兒閱讀,弘揚經典文化。同時,《圖書館雜志》還注重圖書情報的前沿研究,特別是現(xiàn)代信息技術帶來的新手段和新業(yè)態(tài)方面的關注。通過分析發(fā)現(xiàn),《圖書館雜志》在一些主題或欄目設置方面還有優(yōu)化的空間,通過欄目設置的優(yōu)化和主題的提煉,可以進一步強化突出其辦刊特色;讀者若對全民閱讀和閱讀推廣等領域感興趣,可以將《圖書館雜志》作為重要的閱讀刊物之一。
[1]紀念《圖書館雜志》創(chuàng)刊30周年座談會在上海圖書館隆重舉行[J].圖書館雜志,2013,32(1):113.
[2][英]奧韋格布茲,焦群,博斯蒂克.王細榮,主譯.圖書館焦慮:理論、研究和應用[M].北京:海洋出版社,2015:62-174.
[3]魏瑞斌.學術期刊發(fā)文主題演變的實證研究以《情報學報》為例[J].情報雜志,2013,32(6): 64-69,39.
[4]劉軍.整體網分析UCINET軟件實用指南(第2版)[M].上海:上海人民出版社,2014:136,283-284.
[5]姜鑫.我國微博研究主題的共詞可視化分析[J].現(xiàn)代情報,2013,33(11):108-113.
[6]趙娟.共詞分析法探討國內圖書館閱讀研究熱點[J].河北科技師范學院學報(社會科學版),2013,12(4):119-123.
[7]韓紅旗,安小米.科技論文關鍵詞的戰(zhàn)略圖分析[J].情報理論與實踐,2012,35(9):86-90.
(作者單位:上海理工大學圖書館)
10.16653/j.cnki.32-1034/f.2016.11.033