蘆 曉,劉國慶
(1.貴州師范大學(xué) 圖書館;2.貴州師范大學(xué) 心理學(xué)院,貴州 貴陽 550025)
HistCite(History of Cite),意為引文歷史,或者叫引文圖譜分析軟件。該軟件系SCI的發(fā)明人加菲爾德開發(fā)[1],能夠用圖示的方式展示某一領(lǐng)域不同文獻(xiàn)之間的關(guān)系。這是一款非常強大的引文分析工具,可以快速繪制出某個研究領(lǐng)域的發(fā)展脈絡(luò),快速鎖定某個研究方向的重要文獻(xiàn)和學(xué)術(shù)專家,還可以找到某些具有開創(chuàng)性成果但無指定關(guān)鍵詞的文獻(xiàn)。 HistCite軟件是Thomson Reuters公司開發(fā),和WOS是同一家公司,所以HistCite只支持WOS數(shù)據(jù)庫,原版本已長時間不更新,且操作復(fù)雜。中國科學(xué)技術(shù)大學(xué)大王慶老師利用Python開發(fā)了一個方便使用的腳本,一個以HistCite源程序為核心的精簡易用免安裝版本由此誕生,即HistCite Pro版本。由于HistCite源程序只支持Windows系統(tǒng),所以Pro版本也只能在Windows系統(tǒng)下運行[2]。HistCite Pro軟件只要下載就可以直接使用,不用安裝。對于從WOS上導(dǎo)出的txt數(shù)據(jù)文件,不用做任何修改,只要把全部的txt數(shù)據(jù)文件放到TXT文件夾里面,然后雙擊main.exe即可一鍵完成加載,非常方便。
圖1 HistCite Pro文件
HistCite Pro軟件的使用大體可分為三個部分,分別是From WOS、To Analysis及Output the Results,下面利用HistCite Pro下載及分析國際對“寬恕”的研究文獻(xiàn)。
即在Web of Science平臺搜索下載文獻(xiàn)。打開Web of Science網(wǎng)頁,如圖2所示。
圖2 web of Science界面
選擇數(shù)據(jù)庫“Web of Science核心合集”;檢索條件可以根據(jù)自身研究設(shè)定,本例為Title=forgiveness、Time Span=1998-2018;然后點擊檢索。會出現(xiàn)如圖3所示的搜索結(jié)果,發(fā)現(xiàn)符合搜索條件的文獻(xiàn)有1 896篇。選擇點擊“保存為其他文件格式”,出現(xiàn)圖3中的對話框,WOS默認(rèn)最多可下載500條數(shù)據(jù),選擇“記錄1至500”,記錄內(nèi)容選擇“全記錄與引用的參考文獻(xiàn)”,文件格式選擇“純文本”,點擊“發(fā)送”。WOS會發(fā)送含此500條文獻(xiàn)記錄的“savedrecs.txt”文件至指定文件夾,HistCite軟件分析時要求將此.txt文件全部放入圖1中的“TXT”文件夾,此處可直接保存至此文件夾。
圖3 下載WOS文獻(xiàn)至TXT文件夾
因符合搜索條件文獻(xiàn)有1 896篇,每次最多可下載500篇文獻(xiàn),故需重復(fù)四次上述過程,即“記錄數(shù)”分別為1~500、501~1 000、1 001~1 500、1 501~1 896,最后將4個“savedrecs.txt”文件全部存入圖1中的“TXT”文件夾。至此,文獻(xiàn)下載過程結(jié)束。
即用HistCite Pro軟件對2.1導(dǎo)入的數(shù)據(jù)進(jìn)行分析。這時雙擊圖1 HistCite pro文件中的“main”程序,出現(xiàn)圖4窗口的上半部分。為解決部分計算機的兼容性問題,HistCite Pro軟件采用Python的多線程實現(xiàn)了ADV模式[3],如沒有兼容問題,確認(rèn)將所有“savedrecs.txt”文件已放入.TXT文件夾,則可直接輸入“YES”。按“Enter”鍵,則會出現(xiàn)圖4窗口的下半部分:顯示HistCite Pro軟件運行了在WOS數(shù)據(jù)庫下載的4個.txt文件。
圖4 HistCite運行窗口
這時,程序會自動打開一個瀏覽器窗口,將分析結(jié)果顯示在瀏覽器窗口,如圖5所示。若沒有自動打開瀏覽器,也可通過手工輸入,網(wǎng)址:http://127.0.0.1:1925/來實現(xiàn)。需要注意:在整個數(shù)據(jù)分析過程中此窗口不能關(guān)閉[4]。
通過上述分析,HistCite Pro軟件會將分析結(jié)果在瀏覽器網(wǎng)頁中打開,如圖5所示。至此,文獻(xiàn)的下載及分析過程結(jié)束,后續(xù)就是對分析結(jié)果的解讀。
圖5 HistCite Pro分析界面
從HistCite Pro軟件對以往文獻(xiàn)的分析結(jié)果可以得出關(guān)于某領(lǐng)域的研究作者、文獻(xiàn)發(fā)表時間、發(fā)表期刊、關(guān)鍵詞及文獻(xiàn)引用和被引用頻次的可視化分析[5]。此外,還可以將文獻(xiàn)有選擇地導(dǎo)入EndNote軟件,為后面的論文寫作做準(zhǔn)備[6]。下面以國際對“寬恕”的研究為例,依次介紹。
在圖5窗口下點擊Analysis→Yearly Output,或者直接點擊圖5區(qū)域2的Yearly Output,則會出現(xiàn)圖6(左),可以看到每年的文獻(xiàn)總數(shù)(RECS)、每年文獻(xiàn)的本地引用頻次(TLCS)和總引用頻次(TGCS)。再點擊Histogram,則得到圖6(右),為每年“寬恕”研究總文獻(xiàn)量的柱狀圖。從圖6中可以看出,近二十年來“寬恕”研究逐年增多,“寬恕”研究熱潮仍在繼續(xù)。
圖6 “寬恕”研究的發(fā)表時間情況
圖7 “寬恕”研究的發(fā)文數(shù)前15位作者
點擊Analysis→Authors,或者直接點擊圖5區(qū)域2的Authors,則可得到圖7界面。是對所有的文獻(xiàn)作者按發(fā)文數(shù)進(jìn)行排序:1 896篇“寬恕”研究文獻(xiàn)共有2 714位作者,圖7截取了前15位。通過此分析,可以快速了解“寬恕”研究領(lǐng)域內(nèi)的重要研究者[7],也就是大家俗稱的此領(lǐng)域內(nèi)的“專家大牛”。
點擊圖5區(qū)域1的Analysis→Journals,也可直接點擊圖5區(qū)域2的Journals,可得到圖8界面。圖8是對所有文獻(xiàn)發(fā)表期刊排名,通過此分析,可以看出哪些期刊發(fā)表“寬恕”研究的文章較多,研究者可在此領(lǐng)域論文發(fā)表選擇期刊時參考此分析[8]。
圖8 “寬恕”研究的發(fā)文期刊前15位
圖9 “寬恕”研究的前15位關(guān)鍵詞
點擊圖5區(qū)域1的Analysis→Words,也可直接點擊圖5區(qū)域2的Words,可得到圖9界面。圖9是對所有文獻(xiàn)中的關(guān)鍵詞進(jìn)行排序,通過此分析可以看出“寬恕”的研究方向,與“寬恕”聯(lián)系緊密的領(lǐng)域等。如本例中通過此分析可知,與“寬恕”研究最為緊密的有自我、和解、人際關(guān)系、公平、角色、健康等概念。
此外,通過HistCite Pro還可以對“寬恕”研究領(lǐng)域的語言、國別、研究機構(gòu)等進(jìn)行分析,方法與上述類似。
可視化分析能將問題直觀化,是眾多統(tǒng)計分析方法的目標(biāo)[9]。HistCite Pro就可以對文獻(xiàn)引用與被引用的關(guān)系進(jìn)行可視化呈現(xiàn),讓研究者對眾多引文間的關(guān)系盡快明了,在海量的文獻(xiàn)中有選擇性地詳覽重要、關(guān)鍵文獻(xiàn),近而用最短的時間了解此領(lǐng)域。下面先介紹文獻(xiàn)引用和被引用的幾個指標(biāo)。
①GCS(global citation score),即總引用頻次,它表示這篇文章被整個WOS數(shù)據(jù)庫中所有文獻(xiàn)引用的次數(shù)。②LCS(local citation score),即本地引用次數(shù),它表示這篇文章在當(dāng)前數(shù)據(jù)集中被引用的次數(shù)。在此例中,即被導(dǎo)入的1 896篇文獻(xiàn)引用的次數(shù)。因為導(dǎo)入的文獻(xiàn)是“forgiveness” 的搜索結(jié)果,所以如果一篇文章的 LCS 值高,意味著它是“寬恕”研究領(lǐng)域內(nèi)的重要文獻(xiàn)。③CR(cited references),參考文獻(xiàn)數(shù),它表示這篇文章的參考文獻(xiàn)在整個WOS數(shù)據(jù)庫中的數(shù)量。此指標(biāo)針對比較新的文獻(xiàn),剛剛發(fā)表還未被其他文獻(xiàn)引用,但可以從新文獻(xiàn)對以往文獻(xiàn)的引用分析其重要性。④LCR(local cited references),本地參考文獻(xiàn)數(shù),它表示這篇文獻(xiàn)的參考文獻(xiàn)在當(dāng)前數(shù)據(jù)集中的數(shù)量,即這篇文獻(xiàn)引用他人的情況。如果一篇文章的LCR值高,意味著它引用了大量的“Forgiveness”領(lǐng)域內(nèi)文獻(xiàn),極有可能是較新的綜述性文章。
簡而言之,LCS和LCR 更重要,它們分別代表了與本領(lǐng)域相關(guān)聯(lián)的被引用數(shù)和引用數(shù),LCS值高的文章一般是重要的新發(fā)現(xiàn)或者新解釋,LCR 值高的一般是綜述類文章[10]。下面主要運用LCS和LCR對較重要的文獻(xiàn)進(jìn)行可視化分析。
點擊Tools-Graph Maker,在跳出界面上點擊Make Graph,會出現(xiàn)圖10界面。圖10是將LCS值最高的30篇文獻(xiàn)進(jìn)行作圖分析:上側(cè)為菜單,可以直接打印、保存關(guān)系圖;左側(cè)菜單為關(guān)系圖的設(shè)置菜單,包括以LCS或以GCS為參照、圖中文獻(xiàn)的數(shù)量、設(shè)置成圓圈還是方框、圓圈的大小、序號的位置及大小、箭頭的朝向及大小等,重新設(shè)置后要點擊“Make Graph”才會重新作圖;右上側(cè)即為基于LCS或GCS的關(guān)系圖,圓圈大小代表引用或被引用的頻次,箭頭方向可以設(shè)置為引用或被引用[11],如圖中箭頭指向是被引用的文獻(xiàn),點擊圓圈內(nèi)的文獻(xiàn)序號會彈出新的網(wǎng)頁為此篇文獻(xiàn)的作者、題目、摘要等詳細(xì)信息;下側(cè)則為30篇文獻(xiàn)的出版信息。在此例中,發(fā)表于1999年的49號文獻(xiàn)被引用較多且較早,有可能為“寬恕”研究領(lǐng)域的開山之作;217、237、199等文獻(xiàn)也被引用較多,可能為特別重要關(guān)鍵的文獻(xiàn),如想熟悉“寬恕”的研究情況,這幾篇文獻(xiàn)需要詳細(xì)閱讀。
圖10 Graph Maker界面
EndNote軟件也是研究不可或缺的工具之一,其功能集文獻(xiàn)搜索、下載、閱讀、論文寫作于一體,文中不作詳細(xì)介紹。HistCite Pro中的文獻(xiàn)可以有選擇地導(dǎo)入EndNote軟件,這樣就使科學(xué)研究中的文獻(xiàn)分析、文獻(xiàn)閱讀、論文寫作等環(huán)節(jié)可以無縫對接[12],具體操作為:在圖5界面依次點擊Tools→Mark & Tag,則會出現(xiàn)圖11界面。
圖11 Mark & Tag界面
圖11中點擊右側(cè)LCS,則所有文獻(xiàn)按照LCS由高到低排序,如想選擇LCS前十位的文獻(xiàn)導(dǎo)入EndNote,則點擊前十篇文獻(xiàn)序號右側(cè)的方框,方框中出現(xiàn)“√”,點擊右側(cè)的“mark”按鈕,這時上側(cè)的“Marks”處會出現(xiàn)“10”,表明這時已“Mark”了10篇文獻(xiàn)。當(dāng)然還可以考慮其他條件繼續(xù)進(jìn)行Mark:如點擊LCR,可以標(biāo)記LCR排名前十的文獻(xiàn),點擊右側(cè)的“mark”按鈕,這是上側(cè)Marks處應(yīng)該出現(xiàn)全部被標(biāo)記的文獻(xiàn)數(shù)量(這時不一定是20,因為LCS前十與LCR前十的文獻(xiàn)有可能重合)。且這時點擊上側(cè)的“marks”,被標(biāo)記的全部文獻(xiàn)則會出現(xiàn)在頁面。
全部選擇完欲導(dǎo)出的文獻(xiàn)后,依次點擊File→Expor→Records,則會生成一個“HistCite export file.hci”的文件,注意這時需要將后綴.hci改為.txt,保存此文件,打開EndNote軟件導(dǎo)入此文件,則將上面所選文獻(xiàn)全部導(dǎo)入了EndNote軟件。
HistCite軟件對于研究人員、圖書館員、教師、編輯人員等都非常有用,其發(fā)明者尤金·加菲爾德強調(diào),HistCite軟件可以讓你快速知曉某個研究領(lǐng)域的歷史和現(xiàn)狀[1]。軟件可直接從湯森路透官網(wǎng)下載,特別是經(jīng)過國內(nèi)研究人員改進(jìn)的HistCite Pro版本,使用非常方便快捷,是研究人員把握某領(lǐng)域研究現(xiàn)狀、研究趨勢的一把利器。但需要指出的是,再快捷的工具永遠(yuǎn)替代不了閱讀文獻(xiàn),特別是對于某領(lǐng)域的新進(jìn)研究者,閱讀文獻(xiàn)的數(shù)量是基本保證,HistCite Pro軟件只不過是幫助研究者篩選出這些應(yīng)該閱讀的重要、關(guān)鍵文獻(xiàn)。