莊紀(jì)林 莊紀(jì)林
摘要給出一定條件,實(shí)現(xiàn)了SJR算法向特征因子算法的轉(zhuǎn)化。選取CSSCI收錄的圖書(shū)情報(bào)學(xué)期刊2007年互引矩陣,分別計(jì)算被引量、EF、SJR、IF、AI、SJRQ,并分成兩類(lèi)進(jìn)行相關(guān)度分析。結(jié)果表明,在一定條件下,SJR算法可轉(zhuǎn)化成特征因子算法,并且期刊評(píng)價(jià)指標(biāo)EF與SJR指標(biāo)顯著相關(guān),它們完全可以作為被引頻次與IF的參考、補(bǔ)充甚至替代。
關(guān)鍵詞特征因子文章影響分值SJRSJRQ影響因子期刊評(píng)價(jià)引文分析
分類(lèi)號(hào)G35
1引言
期刊評(píng)價(jià)是文獻(xiàn)計(jì)量學(xué)的重要應(yīng)用領(lǐng)域,主要用于反映學(xué)術(shù)期刊的質(zhì)量和水平。期刊評(píng)價(jià)的理論和方法經(jīng)過(guò)長(zhǎng)期的研究與發(fā)展,已經(jīng)取得了眾多成果,在實(shí)際應(yīng)用方面也取得了長(zhǎng)足進(jìn)展。文獻(xiàn)計(jì)量指標(biāo)從傳統(tǒng)的載文量、被引量、影響因子(Impact Factor,以下簡(jiǎn)稱(chēng)IF)[1,2]、到后來(lái)提出的h指數(shù)[3]、g指數(shù)[4]、A指數(shù)、r指數(shù)等類(lèi)h指數(shù)[5,6]。隨著谷歌的頁(yè)面排名(PageRank)算法出世,2008年Scopus推出了基于自身數(shù)據(jù)庫(kù)的評(píng)價(jià)指標(biāo)SCIMAGO 期刊排名(SCImago journal rank,以下簡(jiǎn)稱(chēng)SJR)[7]與每篇論文的參考源標(biāo)準(zhǔn)影響引子(Source Normalized Impact per Paper,以下簡(jiǎn)稱(chēng)SNIP)[8]。作為回應(yīng),湯姆森路透科技集團(tuán)也推出了期刊評(píng)價(jià)指標(biāo)特征因子(Eigenfactor,EF)[9]作為JCR的增強(qiáng)功能,并于2009年初正式采用。2012年SJR和SNIP對(duì)各自的算法進(jìn)行修正與改進(jìn),發(fā)表了修正指標(biāo)SJR2[10]與SNIP2[11] 。2015年湯姆森路透科技集團(tuán)也發(fā)布了兩個(gè)新的文獻(xiàn)計(jì)量學(xué)指標(biāo),一個(gè)是標(biāo)準(zhǔn)特征因子(Normalized Eigenfactor,以下簡(jiǎn)稱(chēng)NEI)[12],一個(gè)是期刊影響因子百分位(Journal Impact Factor Percentile,以下簡(jiǎn)稱(chēng)JIFP)[13] 。而作為新型期刊評(píng)價(jià)指標(biāo)的代表SJR和EF,兩者都采用了類(lèi)PageRank算法模型來(lái)評(píng)價(jià)科技期刊的質(zhì)量與影響力,是當(dāng)前期刊評(píng)價(jià)指標(biāo)的研究熱點(diǎn)。
幾十年來(lái),IF得到了廣泛的認(rèn)可和應(yīng)用,然而近年來(lái)學(xué)者們把更多注意力投入到SJR和EF等類(lèi)PageRank算法中,究其原因,是因?yàn)镮F存在著以下幾點(diǎn)問(wèn)題[14]:
1)IF在計(jì)算過(guò)程中并沒(méi)有考慮引用質(zhì)量,只有對(duì)引文數(shù)量的統(tǒng)計(jì)。一篇學(xué)術(shù)權(quán)威發(fā)表的文章中引用的參考文獻(xiàn)顯然應(yīng)該具有更高的價(jià)值。
2)在計(jì)算過(guò)程中未能排除期刊的自引行為,這使得期刊可以通過(guò)增加自引來(lái)提高影響因子。
3)IF計(jì)算方法采用的時(shí)間段為兩年,由于研究領(lǐng)域差異性導(dǎo)致不同領(lǐng)域的論文的被引頻次有較大差異。那些科研周期較長(zhǎng)、發(fā)表周期也相對(duì)較長(zhǎng)的領(lǐng)域,有可能出現(xiàn)引用行為因超出兩年的時(shí)限不能被計(jì)入被引量,進(jìn)而影響IF的計(jì)算結(jié)果。
4)SCI收錄的不同學(xué)科的期刊數(shù)目差別很大,這種差別不僅反映在論文數(shù)量上,而且反映在引文數(shù)量上。而相同或相近研究領(lǐng)域的論文傾向于相互引證,這又反過(guò)來(lái)加大了不同學(xué)科間刊物的影響因子的差異。
5)基于少量期刊刊載大量有重大意義和影響的科研成果的研究結(jié)果,SCIE收錄期刊只占全世界期刊總量的3.6%,而且語(yǔ)種大多為英文,非常有利于以英語(yǔ)為母語(yǔ)的國(guó)家的刊物獲得高影響因子。
自從SJR和EF算法問(wèn)世以來(lái),由于這類(lèi)算法不僅考慮了引文的數(shù)量,而且考慮了引文的質(zhì)量,能夠很容易地去除自引,其統(tǒng)計(jì)年限窗口也分別擴(kuò)大為3年和5年,因此受到了廣大學(xué)者的逐步關(guān)注與認(rèn)可,國(guó)內(nèi)也有很多學(xué)者對(duì)其進(jìn)行了研究?!短卣饕蜃釉砑皩?shí)證研究》[15]一文以18種CSSCI收錄圖書(shū)情報(bào)學(xué)期刊為例,計(jì)算出它們的特征因子分值和論文影響分值,在此基礎(chǔ)上對(duì)這兩項(xiàng)指標(biāo)同其他期刊評(píng)價(jià)指標(biāo)的關(guān)系進(jìn)行了探討,得出了特征因子分值、論文影響分值和期刊綜合指數(shù)、h指數(shù)、影響因子之間存在較強(qiáng)的皮爾遜相關(guān)性的結(jié)論;《SJR指數(shù)研究及其與影響因子的比較分析》[14]一文將SJR指數(shù)與影響因子各方面的特征進(jìn)行了比較,并通過(guò)2007年的實(shí)際數(shù)據(jù)對(duì)這兩項(xiàng)指標(biāo)的實(shí)際效果進(jìn)行了比對(duì)分析,總結(jié)了兩者在期刊評(píng)價(jià)中的優(yōu)勢(shì)以及不足之處;《評(píng)價(jià)期刊影響力的三項(xiàng)指標(biāo)比較研究》[16]一文以JCR中信息科學(xué)與圖書(shū)館學(xué)中影響因子排名前20的期刊為樣本,對(duì)影響因子、5年影響因子、SJR以及特征因子的排名進(jìn)行比較分析,得出SJR與其他三者之間沒(méi)有發(fā)現(xiàn)顯著相關(guān)性的結(jié)論。以上文章或者是實(shí)現(xiàn)了某種期刊評(píng)價(jià)算法并試圖對(duì)評(píng)價(jià)結(jié)果進(jìn)行分析,或者是對(duì)研究機(jī)構(gòu)發(fā)布的多個(gè)期刊評(píng)價(jià)指標(biāo)直接分析相關(guān)性。
3實(shí)證檢驗(yàn)
從以上分析可以看出,EF算法與SJR算法存在著高度的相似性,而且在滿足一定條件下,兩者的迭代過(guò)程是完全一樣的??梢灶A(yù)見(jiàn)EF算法與SJR算法在進(jìn)行期刊評(píng)價(jià)時(shí)其結(jié)果具有高度的相關(guān)性。為此,筆者選取2008-2009年CSSCI收錄圖書(shū)情報(bào)學(xué)期刊2007年度互引矩陣[15],并實(shí)現(xiàn)了EF和SJR算法,在相同統(tǒng)計(jì)年限窗口內(nèi)分別統(tǒng)計(jì)被引量、IF、EF、AI、SJR、以及SJRQ指標(biāo),并分類(lèi)驗(yàn)證指標(biāo)間的相關(guān)度。從第4小節(jié)的分析可知,從指標(biāo)間的對(duì)應(yīng)關(guān)系上來(lái)看,被引量與EF、SJR相對(duì)應(yīng),IF與AI、SJRQ相對(duì)應(yīng),下面分別對(duì)這兩組指標(biāo)考察其相關(guān)性。
表2共包含18種期刊的互引數(shù)據(jù),由于SJR算法中計(jì)算某期刊的引用總數(shù)時(shí)不僅包含對(duì)統(tǒng)計(jì)源期刊的引用數(shù),還包含對(duì)統(tǒng)計(jì)源期刊外的引用數(shù),所以這里把表2中前12種期刊作為統(tǒng)計(jì)源期刊,后6種期刊作為統(tǒng)計(jì)源外期刊。經(jīng)過(guò)整理可得以下表。
需要說(shuō)明的是,這里的各指標(biāo)值都是在相同的統(tǒng)計(jì)源期刊和相同的統(tǒng)計(jì)年限窗口下計(jì)算的,實(shí)際上它們之間的統(tǒng)計(jì)源期刊和統(tǒng)計(jì)年限窗口不盡相同,本文統(tǒng)一了統(tǒng)計(jì)源期刊和統(tǒng)計(jì)年限窗口的目的是為了盡可能探索這些期刊評(píng)價(jià)指標(biāo)之間的相關(guān)度。
通過(guò)表4與表5的排名來(lái)看,被引量、π*、EF及SJR之間具有極強(qiáng)的相關(guān)性,IF、AI及SJRQ之間也具有極強(qiáng)的相關(guān)性。為了進(jìn)一步說(shuō)明它們之間的相關(guān)性,筆者利用SPSS統(tǒng)計(jì)分析軟件,進(jìn)行相關(guān)度分析(Spearman相關(guān)系數(shù)),其結(jié)果如表6、7、8、9所示。
從表6、7、8、9可以清楚地看出被引量、π*、EF及SJR兩兩之間無(wú)論是數(shù)值還是排名的相關(guān)度都在0.9以上,是顯著相關(guān)的;IF、AI與SJRQ兩兩之間無(wú)論是數(shù)值還是排名的相關(guān)度也都在0.9以上,也是顯著相關(guān)的。通過(guò)相關(guān)度分析,從另一側(cè)面說(shuō)明了基于PageRank算法的EF算法與SJR算法大同小異,存在著高度的相似性。
4討論與小結(jié)
經(jīng)由前面的理論分析及算法推導(dǎo),如果在計(jì)算SJR指標(biāo)時(shí):
1)調(diào)整權(quán)重令α+β=d+e=1。
2)期刊j的參考文獻(xiàn)數(shù)只包含對(duì)統(tǒng)計(jì)源期刊的引用數(shù),而不是其所有的引用數(shù)。
3)去除自引因素的影響。
那么,計(jì)算EF指標(biāo)的迭代表達(dá)式(1)和計(jì)算SJR指標(biāo)的迭代表達(dá)式(18)從形式和意義上是完全一樣的。
同時(shí),根據(jù)表1所列EF算法與SJR算法之間的差別,如果再滿足以下兩個(gè)條件:
4)統(tǒng)計(jì)年限窗口一樣。
5)統(tǒng)計(jì)源期刊一樣。
那么計(jì)算EF和計(jì)算SJR的迭代過(guò)程和結(jié)果是完全一樣的。當(dāng)然,只是“迭代”的過(guò)程和結(jié)果完全一樣,并不是最終的EF和SJR值完全一樣。從SJR算法的定義得SJR=π*,而EF定義成(2)式EF=100Hπ*∑i[Hπ*]i。
那么,為什么EF算法不像SJR一樣直接采用π*呢?應(yīng)該是出于以下幾點(diǎn)考慮:
1)EF算法的迭代過(guò)程中用文章向量替代H′矩陣懸點(diǎn)列放大了懸點(diǎn)的作用,H是替代前的包含懸點(diǎn)的規(guī)范化互引矩陣,讓H點(diǎn)乘π*可部分抵消這種替代的影響。
2)同樣,(2)式分子中沒(méi)有加上文章向量貢獻(xiàn)的權(quán)重(1-α)a也是出于部分抵消迭代過(guò)程中文章向量所給予的初始值的影響。
3)(2)式中等式右邊乘以100是為了換算成百分值;(2)式中分母的引入是出于規(guī)范化的目的:由于∑i[Hπ*]i=1-dπ*,d為懸點(diǎn)向量,所以,如果存在懸點(diǎn),則∑i[Hπ*]i<1。分母的引入保證了∑iEF=100。
當(dāng)然,EF算法中在得出π*后從π*到EF轉(zhuǎn)換相較于SJR算法直接采用π*,這兩者究竟哪個(gè)更合理,則超出了本文的討論范圍,有興趣的研究者可以繼續(xù)研究下去。
因此,雖然期刊評(píng)價(jià)指標(biāo)EF和SJR之間存在著一些區(qū)別,這些區(qū)別主要表現(xiàn)在計(jì)算方法與來(lái)源數(shù)據(jù)兩個(gè)方面:從計(jì)算方法上看,主要涉及引用關(guān)系的權(quán)重、處理自引的方式以及引用論文的統(tǒng)計(jì)方式;從來(lái)源數(shù)據(jù)上看,SJR指標(biāo)以Scopus數(shù)據(jù)庫(kù)的數(shù)據(jù)為基礎(chǔ),EF以Web of Science的數(shù)據(jù)為基礎(chǔ),SJR指標(biāo)的統(tǒng)計(jì)窗口年限為3年,EF指標(biāo)的統(tǒng)計(jì)窗口年限為5年。但是,由于EF和SJR都是基于PageRank算法,兩者是一脈相承的,在滿足一定的條件下,SJR算法的迭代式與EF算法的迭代式從形式和意義上完全一樣的。
通過(guò)實(shí)證研究,發(fā)現(xiàn)被引量、π*、EF及SJR兩兩之間是顯著相關(guān)的,IF、AI與SJRQ兩兩之間也是顯著相關(guān)的。傳統(tǒng)期刊指標(biāo)被引量與影響因子雖然存在著一些缺陷,但在實(shí)踐上仍存在著相當(dāng)?shù)暮侠硇?。EF算法、SJR算法作為新興算法,克服了被引量與影響因子只考慮引文數(shù)量忽略引文質(zhì)量的缺陷,也完全可以作為被引量與影響因子的參考、補(bǔ)充甚至替代。
參考文獻(xiàn)
1Garfield E. Citation analysis as a tool in journal evaluation[J]. Science, 1972, 178(4060): 471-479.
2Henk F, Moed. Citation analysis of scientific journals and journal impact measures[J]. Current Science, 2005, 98(12): 1990-1996.
3Hirsch J E. An index to quantify an individuals scientific output[J]. Proceedings of the National Academy of Sciences of the United States of America, 2005, 102(46): 16569-16572.
4Egghe L. How to improve the hindex[J]. Scientist, 2006, 20(3):15-15.
5Jin B H et al. The R-and ARindices: Complementing the hindex[J]. Chinese Science Bulletin, 2007, 52(6):855-863.
6葉鷹. H指數(shù)和類(lèi)h指數(shù)的機(jī)理分析與實(shí)證研究導(dǎo)引[J]. 大學(xué)圖書(shū)館學(xué)報(bào), 2007(5): 2-5.
7Butler D. Free Journalranking Tool Enters Citation Market[J]. Nature, 2008, 451(7174): 6.
8Henk F Moed. Measuring Contextual Citation Impact of Scientific Journals[J]. Journal of Informetrics, 2010(4): 265-277.
9Bergstrom C T., West J D. et al. The Eigenfactor Metrics[J]. The Journal of Neuroscience, 2008, 28(45): 11433-11433.
10GuerreroBote V P, MoyaAnegón F. A further step forward in measuring journals scientific prestige: The SJR2 indicator[J]. Journal of Informetrics, 2012, 6(4): 674-688.
11Ludo Waltman, Nees Jan van Eck, Thed N.van Leeuwen. et al.Some modifications to the SNIP journal impact indicator[J]. Journal of Informetrics, 2013, 7 (2): 272-285.
12Thomson Reuters. Normalized eigenfactor score[EB/OL]. [2017-11-03] http://ipsciencehelp.thomsonreuters.com/incitesLiveJCR/glossaryAZgroup/g9/9709TRS.html.
13Thomson Reuters. Journal impact factor percentile[EB/OL]. [2017-11-03] http://ipsciencehelp.thomsonreuters.com/incitesLiveJCR/glossaryAZgroup/g8/9586TRS.html.
14楊康,劉明政,張旭. SJR指數(shù)研究及其與影響因子的比較分析[J]. 情報(bào)雜志,2009,28(11):27-30.
15米佳,濮德敏. 特征因子原理及實(shí)證研究[J]. 大學(xué)圖書(shū)館學(xué)報(bào),2009,27(6):63-68.
16田質(zhì)兵. 評(píng)價(jià)期刊影響力的三項(xiàng)指標(biāo)比較研究[J]. 現(xiàn)代情報(bào),2010,30(9):141-143,146.
17EIGENFACTOR.org. EigenfactorTM score and article influenceTM score: detailed methods[EB/OL]. [2017-11-03] http://www.eigenfactor.org/methods.pdf.
18SCImago Research Group. Description of scimago journal rank indicator[EB/OL]. [2017-11-03] http://www.scimagojr.com/SCImagoJournalRank.pdf.