[摘要] 以2012年US News&World Reports公布的美國大學(xué)圖書情報專業(yè)TOP 20學(xué)校為依據(jù),以SSCI收錄文章為數(shù)據(jù)源,借助Bibexcel提取關(guān)鍵詞構(gòu)建相異矩陣,利用SPSS聚類分析,采用“Squared Euclidean Distance”方法,對2001-2005和2006-2011的樹狀圖分析兩個時間段研究熱點的共性和差異性。目的在于了解美國TOP 20高校圖書情報專業(yè)的過去、現(xiàn)在和未來,為國內(nèi)本專業(yè)師生和即將留學(xué)美國的學(xué)生提供參考資料。
[關(guān)鍵詞]圖書情報 美國高校 Bibexcel Spss
1 引 言
當今世界,每個學(xué)科領(lǐng)域都在迅速變化和不停的更新之中,新的研究課題不斷涌現(xiàn),并逐漸成為該領(lǐng)域的研究熱點和前沿方向。例如,圖書情報學(xué)隨著信息技術(shù)和網(wǎng)絡(luò)的發(fā)展不斷向多個全新的領(lǐng)域延伸。在此,筆者以美國最有影響力的機構(gòu)《美國新聞和世界報導(dǎo)》(US News&World Reports)每年發(fā)布的美國大學(xué)排名為基礎(chǔ),選取其2012年公布的圖書情報專業(yè)排名前20的美國高校作為研究對象(見表1),得到這20所高校的圖書情報專業(yè)的文章被SSCI收錄的情況:2001-2005年1 496篇;2006-2011年1 964篇,利用分析軟件Bibexcel提取關(guān)鍵詞(SSCI部分收錄文章關(guān)鍵詞,但仍然具有一定的代表性),同時刪除無意義的詞,形成構(gòu)建相異矩陣;再使用SPSS軟件對關(guān)鍵詞矩陣進行層次聚類分析,從得到的樹狀圖分析聚類情況,探討美國高校圖書情報領(lǐng)域在2001-2005年,2006-2011年這兩個時間段的研究熱點的共性和差異性。
2 采集數(shù)據(jù)的采集
本文所有數(shù)據(jù)來源于美國科學(xué)情報研究所(Institute for Scientific Information, ISI)的《社會科學(xué)引文索引》數(shù)據(jù)庫(Social Science Citation Index,SSCI)。SSCI是美國科學(xué)情報研究所建立的綜合性社會科學(xué)引文獻數(shù)據(jù)庫,涉及經(jīng)濟、法律、管理、心理學(xué)、區(qū)域研究、社會學(xué)、信息科學(xué)等多個學(xué)科。收錄50個語種的1 700多種重要的國際性期刊,累計約350萬條記錄。 檢索條件如下:
((SU=INFORMATION SCIENCE LIBRARY SCIENCE) AND (AD=( UNIV MICHIGAN OR RUTGERS STATE UNIV OR UNIV N CAROLINA OR UNIV N TEXAS OR SYRACUSE UNIV OR UNIV PITTSBURGH OR DREXEL UNIV OR FLORIDA STATE UNIV OR UNIV TENNESSEE OR INDIANA UNIV OR UNIV CALIF LOS ANGELES OR UNIV TEXAS AUSTIN OR UNIV WASHINGTON OR UNIV ILLINOIS OR UNIV WISCONSIN OR UNIV MARYLAND OR Wayne State University or Univ Wisconsin--Milwaukee or Kent State University or Univ South Carolina Columbia or Simmons College) ) AND出版類型=(Article), 時間限制分別為2001-2005年和2006-2011年,分別得出1 496篇和1 964篇文獻。
3 Bibexcel關(guān)鍵詞及相異矩陣
3.1軟件的功能簡介
Bibexcel是由瑞典科學(xué)家Person開發(fā)的文獻計量學(xué)研究軟件,用于幫助用戶分析文獻數(shù)據(jù)或者是文本類型格式的數(shù)據(jù),實現(xiàn)引文分析。Bibexcel處理的數(shù)據(jù)來自 ISI Web of Knowledge平臺上的數(shù)據(jù)庫 ,包括 Web of Science數(shù)據(jù)庫、 Darwin Innovation Index數(shù)據(jù)庫和Medline數(shù)據(jù)庫等。Bibexcel除了對來源于上述數(shù)據(jù)庫中數(shù)據(jù)的相關(guān)知識單元 (如作者、關(guān)鍵詞、參考文獻等 )做頻次分析和排序外 ,還可構(gòu)建知識單元的共現(xiàn)關(guān)系矩陣[2]。
3.2 準備工作
首先使用Excel將所有文章不同詞型、單復(fù)數(shù)詞和縮寫詞如library和libraries,e-journals 和electronic journals、model 和 modeling、electronic commerce 和 e- commerce等統(tǒng)一為一種常用形式,規(guī)范關(guān)鍵詞。
3.3 Bibexcel的操作步驟
?將SSCI檢索到的文章保存形式*.txt文件轉(zhuǎn)換成Bibexcel可以接受的dialog格式,產(chǎn)生 *.doc文件。
?對*.doc文件進行關(guān)鍵詞分析,產(chǎn)生*.out文件。
?對*.out文件進行排序和去除重復(fù)WORDS,進而產(chǎn)生了*.cit和*.oux文件;*.cit文件得到關(guān)鍵詞1 754個(2001-2005 年),取頻次大于5者,總計21個,見表2;*.out文件得到關(guān)鍵詞3 833個(2006-2011年),取關(guān)鍵詞頻次大于10者,總計20個,見表3。
?分析*.cit和*.oux文件,產(chǎn)生共現(xiàn)文件*.coc。
?*.coc 分析得到*.ccc。
?利用*.coc 和*.ccc,得到共現(xiàn)矩陣,為了消除頻次懸殊造成的影響,用ochiia 系數(shù)將共現(xiàn)矩陣轉(zhuǎn)換成為相似矩陣,方法是將共現(xiàn)矩陣中的每個數(shù)都除以與之相關(guān)的兩個關(guān)鍵詞總頻次開方的乘積,公式如下:
對上面進行數(shù)據(jù)共現(xiàn)矩陣轉(zhuǎn)換后,矩陣中兩個詞的對角線上的數(shù)據(jù)表示該詞與自身的相似程度,按上述公式計算后均為1,從而得到相關(guān)矩陣。相關(guān)矩陣中的數(shù)字表明的是數(shù)據(jù)間的相似性,數(shù)字的大小表明了相應(yīng)兩個關(guān)鍵詞之間的距離遠近,數(shù)值越大則表明關(guān)鍵詞之間的距離越近,相似度越大; 反之,相似度越小。再用1 減去相關(guān)矩陣中的數(shù)據(jù),就可以得到相異矩陣[3],見表4和表5。
4 SPSS層次聚類分析
4.1 SPSS軟件簡介
SPSS軟件是世界上最早的統(tǒng)計分析軟件,由美國斯坦福大學(xué)的三位研究生于20世紀60年代末研制,應(yīng)用于自然科學(xué)、技術(shù)科學(xué)、社會科學(xué)的各個領(lǐng)域,具有自動統(tǒng)計繪圖、數(shù)據(jù)的深入分析等功能,使用方便,功能齊全,是世界上應(yīng)用最廣泛的專業(yè)統(tǒng)計軟件。SPSS的基本功能包括數(shù)據(jù)管理、統(tǒng)計分析、圖表分析、輸出管理等,本文采用SPSS V19.0進行層次聚類分析。
4.2 層次聚類分析過程
首先,每個個體自成一類;然后,按照某種方法度量所有個體間的“親疏程度”,并將其中最“親密”的個體聚成一小類,形成n-1個類;接下來,再次度量剩余個體和小類間的“親疏程度”,并將當前最親密的個體或小類再聚到一起,直到形成一個最大的類為止。親屬程度的測量方法有幾種,本文采用“平方歐氏距離法”(Squared Euclidean Distance),其定義為兩個個體k個變量值之差的平方和,數(shù)學(xué)定義為:
SEUCLID(x,y)= (xi-yi)2 (2)
其中個體xi是x的第i個變量,個體yi是y的第i個變量[4];
步驟如下:數(shù)值–analyze –classify –hierarchical cluster 。
4.3 聚類分析
分析結(jié)果如圖1和圖2所示:
5 樹狀圖分析及對比分析
5.1 2001-2005年樹狀圖分析(研究熱點):
?互聯(lián)網(wǎng)上的搜索引擎和信息檢索的研究:包括關(guān)鍵詞7、16、21。
?互聯(lián)網(wǎng)上的圖書館和用戶研究:包括關(guān)鍵詞12、14、19。
?電子商務(wù):包括關(guān)鍵詞4。
?信息鴻溝:包括關(guān)鍵詞3。
?企業(yè)的資源規(guī)劃和信息技術(shù)及革新:包括關(guān)鍵詞6、9、10。
?通訊:包括關(guān)鍵詞18。
?電子期刊及館際互借:包括關(guān)鍵詞5、11。
?信息系統(tǒng)和知識管理:包括關(guān)鍵詞8、13。
?技術(shù)采用及以計算機為傳媒的通訊:包括關(guān)鍵詞2、17。
?虛擬團隊及合作方法:包括關(guān)鍵詞1、15、20。
5.2 2006-2011年樹狀圖分析(研究熱點):
?美國學(xué)術(shù)圖書館及在互聯(lián)網(wǎng)應(yīng)用:包括關(guān)鍵詞18、20、1。
?圖書館學(xué):包括關(guān)鍵詞13。
?數(shù)字圖書館及用戶研究:包括關(guān)鍵詞4、19。
?情報學(xué)及及信息檢索:包括關(guān)鍵詞6、7。
?以計算機為傳媒的通訊及社會網(wǎng)絡(luò):包括關(guān)鍵詞3、16。
?電子商務(wù)及信任問題:包括關(guān)鍵詞5、17。
?互聯(lián)網(wǎng)及公共圖書館:包括關(guān)鍵詞11、15。
?信息系統(tǒng)和知識管理:包括關(guān)鍵詞8、12。
?信息技術(shù)的革新及外包:包括關(guān)鍵詞9、10、14。
?引用分析:包括關(guān)鍵詞2。
5.3 兩種樹狀圖對比分析
兩段的共性與差異性比較,如表6所示:
從高頻關(guān)鍵詞來看,一些關(guān)鍵詞的排列順序發(fā)生了變化, 有的上升、 有的下降;有新出現(xiàn)的,也有消失的。但是有50%的關(guān)鍵詞10年來一直是圖書情報學(xué)的研究熱點,雖然這些方向的研究深度和廣度都有一定的轉(zhuǎn)變,或過渡到更高層次,但是始終屬于相同的科研領(lǐng)域,十幾年來一直被該領(lǐng)域的科研人員進行探索、開發(fā)和利用,成為該領(lǐng)域的永恒和重點。從表6第三列——10年來相同的關(guān)鍵詞(Internet、information retrieval、electronic commerce、knowledge management、information technology、information systems、world wide web、libraries、user studies、innovation、computer-mediated communication )可以看出,美國TOP高校圖書情報專業(yè)近10年的研究熱點,分析如下:
?信息檢索 :關(guān)鍵詞含有Internet、information retrieval、world wide web、information systems。計算機技術(shù)的不斷發(fā)展和廣泛應(yīng)用,特別是計算機和網(wǎng)絡(luò)的結(jié)合,打破了傳統(tǒng)信息檢索的區(qū)域性和局限性,用戶可以足不出戶就輕松獲得所需要的信息,而且目前信息的形式呈現(xiàn)出多樣化。信息檢索先后經(jīng)歷了脫機信息檢索、聯(lián)機信息檢索、光盤信息檢索、網(wǎng)絡(luò)化信息檢索等4個發(fā)展階段,檢索的對象也已從相對封閉、獨立的數(shù)據(jù)庫集中的管理信息內(nèi)容逐漸擴展到如今開放的、動態(tài)的、快速的、分布廣泛且管理松散的網(wǎng)絡(luò)內(nèi)容,但是它依然存在著許多問題,科研人員一直致力于研究和攻克如準確率或查準率、標引規(guī)范化、自動分類、概念語義空間等難題[5]。
?圖書館及用戶研究:關(guān)鍵詞含有l(wèi)ibraries、user studies。用戶研究主要是以用戶為中心,為了使圖書館對用戶提供更人性化、更細致入微的服務(wù)而展開的研究,也就是現(xiàn)在人們常常聽說的積極用戶體驗。隨著信息技術(shù)和網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,圖書館服務(wù)的用戶類型、用戶的意識和對信息資源和服務(wù)的要求等都與過去有很大的不同,同時面臨的技術(shù)條件和社會環(huán)境發(fā)生了很大的變化[6];從提供印刷版資源服務(wù)到提供數(shù)字資源業(yè)務(wù)為主是圖書館發(fā)展戰(zhàn)略轉(zhuǎn)移的重點和核心,國外的主要圖書館已經(jīng)開始著手規(guī)劃和實施利用“云技術(shù)”進行數(shù)字資源長期保存計劃,不僅要保存正式的權(quán)威的知識系統(tǒng),而且也要考慮社區(qū)或民眾創(chuàng)建的內(nèi)容。為此,國外圖書館的用戶服務(wù)方針是“改進館內(nèi)和館外用戶無縫發(fā)現(xiàn)和利用圖書館資源的經(jīng)歷”。用戶研究主要體現(xiàn)在以下幾個方面:①深度挖掘圖書館資源、保持信息暢通;②加強對圖書館資源的利用,促進知識的傳播工作;③維護學(xué)術(shù)的客觀性和公正性;④創(chuàng)建和及時傳遞文獻、產(chǎn)品、服務(wù)和經(jīng)驗,為用戶提供最佳服務(wù);⑤實現(xiàn)對圖書館知識資源(無論是在線的還是館內(nèi)的)的無縫獲取。這10年期間的轉(zhuǎn)變主要有幾點:①從有限的用戶群到所有用戶的平等獲取信息;②從文獻信息管理與服務(wù)到知識管理與知識服務(wù)的轉(zhuǎn)變;③從館員中介的服務(wù)到用戶自助服務(wù)的轉(zhuǎn)變;④從自我封閉到宣傳推廣的轉(zhuǎn)變;從圖書館員能力到用戶能力的轉(zhuǎn)變[7]。
?知識管理及革新:關(guān)鍵詞含有knowledge management、information technology、innovation。知識管理其實就是對各種有用知識進行系統(tǒng)化的管理,它是圖書館管理的新內(nèi)容和新模式,也是一個圖書館的本質(zhì);圖書館不再是簡單地由圖書、館員、讀者構(gòu)成的,重心轉(zhuǎn)向知識管理;知識管理是以知識資源和知識作為管理對象的,通常研究知識的創(chuàng)造、獲取、組織、存儲、傳播、共享、服務(wù)、利用等,形成綿延不斷的知識創(chuàng)新、積累與有效利用的良性循環(huán)系統(tǒng),具體地已經(jīng)由傳統(tǒng)的文獻資源管理過渡到信息資源管理再向目前的知識管理發(fā)展;以科學(xué)研究為先導(dǎo)的知識創(chuàng)新和以信息化為載體的管理創(chuàng)新,相互支撐,互為動力,構(gòu)成了當代圖書館的新形態(tài);知識管理主要體現(xiàn)在以下幾個方面:建立知識庫,強調(diào)館員的知識和交流,形成尊重知識的良好內(nèi)部氛圍,把知識作為一種資產(chǎn)來管理等;其特點是:知識大眾化、網(wǎng)絡(luò)化、移動化、個性化和社會化,傳播數(shù)度快;形成知識無處不在的巨大知識庫。
?信息處理:關(guān)鍵詞含有 computer-mediated communication(CMC)、electronic commerce。CMC在美國的眾多高校中屬于“社會,社區(qū)和組織情報學(xué)”(Social, community, and organizational informatics)專業(yè)的內(nèi)容;而electronic commerce一般屬于“以獎勵為中心的設(shè)計”(Incentive-centered design)專業(yè)的內(nèi)容[8],但是隨著計算機和互聯(lián)網(wǎng)在圖書情報領(lǐng)域的快速發(fā)展和應(yīng)用,產(chǎn)生了很多交叉學(xué)科和領(lǐng)域。CMC和electronic commerce成為信息處理的一種關(guān)鍵技術(shù)和手段。CMC是以計算機為媒介的交流方式,研究的重點主要是不同的網(wǎng)絡(luò)通信技術(shù)對社會的影響;electronic commerce的技術(shù)基礎(chǔ)是計算機技術(shù)、網(wǎng)絡(luò)技術(shù)和數(shù)據(jù)庫為依托的信息技術(shù),通過互聯(lián)網(wǎng)尋找信息流等活動,交叉學(xué)科應(yīng)用到目前,尤其是在2005年后逐漸成熟的,主要集中在電子商務(wù)的信用、安全、在線信息服務(wù)等方面的研究。雖然當前電子商務(wù)在信息安全性、交易體制、法規(guī)建設(shè)等方面還存在弊端,但由于美國政府對電子商務(wù)的格外重視,加強政府部門宏觀規(guī)劃和指導(dǎo),制定良好的政策和法規(guī),使得電子商務(wù)已從“技術(shù)實現(xiàn)”階段進入“技術(shù)開放和普及”階段。
5.4 新出現(xiàn)的熱點和逐漸消失的領(lǐng)域
?新型的圖書館。后5年對圖書館的研究比較集中在學(xué)術(shù)圖書館、公共圖書館和數(shù)字圖書館。
?從館際互借和電子期刊的研究逐漸過渡到對引文分析的領(lǐng)域。不僅對來源文獻進行分析,更多地從事引用文獻的分析;由館員參與的館際互借到目前由用戶直接借閱,節(jié)約了人力和時間。
?信息鴻溝的消失到社會網(wǎng)絡(luò)的普及。隨著網(wǎng)絡(luò)的普及和開發(fā)資源的利用,信息的鴻溝也隨著消失,信息的貧富懸殊差距在縮小,目前的信息的隨手可得,信息量急劇上升。
?對虛擬團隊的合作及企事業(yè)的資源規(guī)劃、方法、研究等逐漸降溫,替代他們的是“外包”策略。由計算機網(wǎng)絡(luò)和信息技術(shù)、人力資源三方面組成的虛擬團隊通過計算機網(wǎng)絡(luò)和信息技術(shù)相連接來完成任務(wù)。但幾年來外包是一種新的戰(zhàn)略管理模型,其業(yè)務(wù)內(nèi)容主要包括信息技術(shù)、人力資源等;美國高校有關(guān)信息技術(shù)外包的理論和實踐已經(jīng)較為成熟,一般涉及信息技術(shù)設(shè)備的引進和維護、通信網(wǎng)絡(luò)的管理、數(shù)據(jù)中心的運作、信息系統(tǒng)的開發(fā)和維護、備份和容災(zāi)、信息技術(shù)培訓(xùn)等[9]。
?隨著搜索引擎技術(shù)的成熟,研究人員更多地關(guān)注情報科學(xué)。網(wǎng)絡(luò)環(huán)境下,情報學(xué)的計量分析方法和手段發(fā)生了很大變化:①由定性到定量;②由文獻計量分析向信息、網(wǎng)絡(luò)計量分析發(fā)展;③計量方法由單一發(fā)展到多樣化,如共詞分析、圖譜分析、信息可視化等綜合方法,以及大量的統(tǒng)計分析軟件(CiteSpace、Bibexcel、SPSS)的使用。
6 結(jié) 論
通過對美國圖書情報專業(yè)TOP20高校近10年研究熱點的聚類分析,我們可以得出如下結(jié)論:兩時間段的科研有不同點也有相同點,這是隨著世界環(huán)境和美國的政策改變而改變,滿足社會的需要而改變,但是科學(xué)還是有一定的延續(xù)性,只是深度和廣度上的拓展,這就產(chǎn)生了共性,共性方向為:①信息檢索;②圖書館及用戶研究;③知識管理及革新;④信息處理。這些高校的研究是圖書情報專業(yè)的風(fēng)向標,從中我們可以看出近幾年的科研方向和趨勢,為我們進一步了解該領(lǐng)域的科研狀況提供一些參考。
參考文獻:
[1] USNews:2012年美國大學(xué)圖書館學(xué)和信息研究專業(yè)研究生排名[EB/OL].[2011-08-30]. http://www. ivycedu.com/article/dxpm/1674.html.
[2] 姜春林,陳玉光. CSSCI數(shù)據(jù)導(dǎo)入Bibexcel實現(xiàn)共現(xiàn)矩陣的方法及實證研究[J].圖書館雜志 ,2010,29(4):58-63.
[3] 曹玲,楊靜,夏嚴. 國內(nèi)競爭情報領(lǐng)域研究論文的共詞聚類分析[J]. 情報科學(xué), 2010,28(6):923-926.
[4] 薛薇.基于SPSS的數(shù)據(jù)分析 [M].第二版.北京:中國人民大學(xué)出版社,2006:295-301.
[5] 謝安裕.網(wǎng)絡(luò)信息搜索引擎的發(fā)展研究[J].中國新技術(shù)新產(chǎn)品,2010(3):42-42.
[6] 羅玲. 淺論圖書館的用戶研究[J].四川圖書館學(xué)報, 2011(6):29-30.
[7] 初景利 ,吳冬曼.圖書館發(fā)展趨勢調(diào)研報告(三):資源建設(shè)和用戶服務(wù)[J]. 國家圖書館學(xué)刊 ,2010(3):3-9.
[8] 陳琦. 圖書館專業(yè)發(fā)展[EB/OL].[2007-06-28].http://lib.nwsuaf.edu.cn/old/txt/圖書館專業(yè)發(fā)展.ppt.
[9] 信息技術(shù)外包[EB/OL].[2012-01-13].http://baike.baidu.com/view/95244.htm.
[作者簡介] 謝 萍,女,1967,館員,發(fā)表論文2篇。魏小紅,女,1968,發(fā)表論文1篇。