■吳 濤 楊 筠 陳 晨 趙 娟 孫金立
1)第四軍醫(yī)大學(xué)《醫(yī)學(xué)爭鳴》編輯部,陜西省西安市長樂西路169號 710032
2)第四軍醫(yī)大學(xué)圖書館,西安 710032
3)西安郵電大學(xué)外國語學(xué)院,西安 710121
準(zhǔn)確公正地評價科技期刊對于研究者掌握學(xué)術(shù)動態(tài)、科研單位評價科研成果、圖書館選擇精品期刊等各個領(lǐng)域都有極其重要的作用。期刊評價理論發(fā)展至今,已經(jīng)涌現(xiàn)了大量的評價指標(biāo)。傳統(tǒng)指標(biāo)如總發(fā)文量、總被引頻次、他引率、引用半衰期等對期刊的評價目標(biāo)明確但單一,多從“量”的角度考慮。從“質(zhì)”的角度評價期刊的引文評價指標(biāo)有影響因子(Impact Factor,IF)、h指數(shù)、特征因子(Eigenfactor Score,ES)、SJR(SCImago Journal Rank)和 SNIP(Source Normalized Impact per Paper)等,以及這些指標(biāo)的衍生指標(biāo):5年IF(IF5)、類h指數(shù)(A指數(shù)、g指數(shù)、R指數(shù)等)、論文影響分值(Article Influence Score,AIS)等。這些琳瑯滿目的指標(biāo)都是通過不同的運算法則衡量期刊引文的數(shù)量和質(zhì)量,在科技期刊評價中具有一定的先進(jìn)性,但其弊端也逐漸暴露,這些引文評價指標(biāo)既有各自的優(yōu)缺點,彼此又存在高度相關(guān)性[1]。單一的評價指標(biāo)顯然無法滿足科技期刊評價的要求,但對期刊進(jìn)行多指標(biāo)的綜合評價又眾說紛紜,做法不一[2-4]。
對科技期刊進(jìn)行多指標(biāo)的綜合評價涉及指標(biāo)選擇、權(quán)重賦予、消除相關(guān)指標(biāo)間的信息重疊等諸多方面的問題。因子分析法通過分析多個原始指標(biāo)的相關(guān)關(guān)系入手,找到支配這種相關(guān)關(guān)系的有限個不可觀測的潛在變量(公因子),并用這些潛在變量來解釋原始指標(biāo)之間的相關(guān)性[5]。因子分析由于解釋力較強,能客觀確定各指標(biāo)權(quán)重,消除指標(biāo)間的相關(guān)重疊性,為綜合評價科技期刊提供了一種較好的方法[6]。
本文嘗試對 IF、IF5、h指數(shù)、SJR、ES和 SNIP六大具有代表性的期刊引文評價核心指標(biāo)進(jìn)行因子分析,找出它們之間的公因子,建立科技期刊引文綜合評價指標(biāo)函數(shù),并通過實例與這六個指標(biāo)進(jìn)行排序?qū)Ρ?,希望能對科技期刊引文綜合評價工作提供些許參考意見。
本文以基于WoS數(shù)據(jù)庫的IF、IF5、ES和基于Scopus數(shù)據(jù)庫的h指數(shù)、SJR和SNIP六大核心指標(biāo)為研究對象,選擇了2013年公布的這兩大數(shù)據(jù)庫共有的醫(yī)學(xué)類期刊作為因子分析數(shù)據(jù)來源。IF、IF5、ES來自2012年的期刊引證報告(Journal Citation Reports,JCR),h指數(shù)和 SJR查自網(wǎng)站 http://www.scimagojr.com/journalsearch.php,SNIP在 http://www.journalindicators.com/indicators上可查詢。排除數(shù)據(jù)不全或極端數(shù)值為零的期刊后,共收集1881份醫(yī)學(xué)期刊的評價數(shù)據(jù)。
將這1881份期刊的 IF、IF5、ES、h指數(shù)、SJR和SNIP數(shù)值錄入Excel表格,利用SPSS20.0統(tǒng)計軟件進(jìn)行因子分析。找出這六個指標(biāo)的公因子,以每個因子對公因子的貢獻(xiàn)率為權(quán)重,構(gòu)建指標(biāo)的綜合評價函數(shù)。再挑選出這1881份期刊中的分屬免疫學(xué)專業(yè)期刊(共68份)和綜合內(nèi)科醫(yī)學(xué)期刊(共71份),將其六個指標(biāo)的標(biāo)準(zhǔn)化數(shù)值分別代入新建函數(shù),得到這些樣本期刊的綜合評價指標(biāo)值,并排序,排序結(jié)果分別與六個指標(biāo)的排序結(jié)果對比分析。
為了消除原始數(shù)據(jù)數(shù)量級和量綱的差異,首先對原始數(shù)據(jù)作標(biāo)準(zhǔn)化處理(SPSS軟件自動處理過程),然后建立各指標(biāo)間的相關(guān)系數(shù)矩陣(表1)。對數(shù)據(jù)進(jìn)行KMO和Bartlett檢驗,KMO為0.796,大于0.5,表明樣本充足;Bartlett球形度檢驗的顯著性水平P=0.000<0.001,表明原始數(shù)據(jù)適合做因子分析。
表1 相關(guān)矩陣
將 IF、IF5、ES、SJR、h指數(shù)和 SNIP依次編號x1-x6,公因子提取采用主成分分析法。利用SPSS20.0計算各指標(biāo)相關(guān)矩陣特征值和方差累積貢獻(xiàn)率(表2),根據(jù)特征值大于1或者方差累積貢獻(xiàn)率大于80%確定公因子。由表2可知,因子1和2的特征值均大于1,并且它們提供的累積貢獻(xiàn)率(91.811%)已達(dá)到80%,因此提取前兩個因子為公因子。
然后建立因子載荷矩陣(表3),它反映了每個指標(biāo)與公因子之間相互聯(lián)系的密切程度。由表3可見,旋轉(zhuǎn)前的因子載荷矩陣不能明顯地反映出每個指標(biāo)在公因子上載荷的差別,也就很難解釋各公因子的專業(yè)意義,因此采用Kaiser標(biāo)準(zhǔn)化的正交旋轉(zhuǎn)法進(jìn)行因子旋轉(zhuǎn),使每個公因子上因子載荷的平方向0和1兩級分化,造成盡可能大的差別,以使各公因子支配不同的原始指標(biāo),從而使各公因子具有較為清晰的專業(yè)意義。旋轉(zhuǎn)后的因子載荷矩陣顯示因子1在 IF、IF5、SJR、SNIP上有較大的因子載荷(更接近1),因子2在ES和h指數(shù)兩個指標(biāo)上載荷最大。
表2 各因子相關(guān)矩陣特征值和方差累積貢獻(xiàn)率
表3 旋轉(zhuǎn)前后的因子載荷矩陣
通過我們前期對 IF、IF5、h指數(shù)、SJR、ES和SNIP六大指標(biāo)的特點及相關(guān)性的研究[1],再結(jié)合以上因子分析結(jié)果,將這六個指標(biāo)分為兩類:一類包括IF、IF5、SJR和SNIP,它們反映的是期刊的平均影響力,將其上載荷較大的公因子F1命名為平均影響力因子,對全部初始變量的方差貢獻(xiàn)率為57.453%。平均影響力因子與期刊發(fā)表論文總數(shù)成反比,側(cè)重反映期刊論文的平均水平。另一類包括ES和h指數(shù),它們反映的是期刊的整體影響力,將其上載荷較大的公因子F2定義為整體影響力因子,方差貢獻(xiàn)率為34.358%。期刊載文量越大,發(fā)表的論文越多,整體影響力越大。
使用SPSS20.0計算出各因子得分系數(shù)(表 4)。
表4 各因子得分系數(shù)矩陣
根據(jù)該得分系數(shù)矩陣,可列出各因子得分的計算表達(dá)式:F1=0.328x1+0.266x2-0.210x3+0.235x4-0.151x5+0.367x6;F2=-0.120x1-0.011x2+0.607x3+0.017x4+0.548x5-0.206x6。
再以公因子1和2旋轉(zhuǎn)后的主成分貢獻(xiàn)率(見表2)為權(quán)重進(jìn)行加權(quán)求和,得到每個期刊的綜合因子值 F:F=(0.57453 F1+0.34358 F2)/0.91811。
利用該綜合評價指標(biāo)函數(shù)對WoS數(shù)據(jù)庫和Scopus數(shù)據(jù)庫共有的免疫學(xué)期刊(共68份期刊該六項指標(biāo)齊全)進(jìn)行綜合評價,分別計算出各期刊的平均影響力因子(F1)、整體影響力因子(F2)和綜合因子(F)得分。根據(jù)各因子得分將68份期刊排序,并與 IF、IF5、ES、SJR、h指數(shù)和 SNIP排序結(jié)果對比分析。本文將綜合因子(F)排名前20的期刊排序結(jié)果列于表5。
從對比排序結(jié)果可以看出:(1)F排名第一的期刊(Annual Review of Immunology),多項指標(biāo)(F1、IF、IF5、SJR、SNIP)都排在第一,F(xiàn)2卻排在第 51位。研究這份期刊發(fā)現(xiàn),其載文量偏少,每年只發(fā)表20~30篇文獻(xiàn),導(dǎo)致F2排名靠后,ES和h指數(shù)也不是很高,但這份期刊篇均影響力很高,綜合排名仍為第一;(2)F排名第六的期刊(Journal of Immunology),F(xiàn)2、ES和 h指數(shù)排名第一或第二,但F1卻排在第68位上。研究該期刊發(fā)現(xiàn),其近五年年均載文量達(dá)1592篇(1382~1948篇),導(dǎo)致ES和h指數(shù)偏高,排名靠前,但篇均影響IF排到第15位,IF5、SJR和SNIP排名分別為14、11、15。權(quán)衡整體與平均影響力后,綜合因子排名第6,介于ES、h指數(shù)與IF、IF5、SJR、SNIP排名之間。(3)整體影響力與平均影響力均衡的期刊,IF、IF5、h指數(shù)、SJR、ES和 SNIP六大指標(biāo)排序結(jié)果較一致,則F1、F2與F排名也不會有大的出入。如F排名第三的期刊(Nature immunology),近五年年均載文量219篇(211~238篇),IF、IF5、ES、F1均排第三,SJR、SNIP排第二,h指數(shù)排第四。F排名第20的期刊(Biology of blood and marrow transplantation),其近五年年均載文量275篇(236~308篇),F(xiàn)1和F2分別排19和26,六大引文評價指標(biāo)排名也都介于17~28。
表5 免疫學(xué)期刊引文評價綜合指標(biāo)得分排序與其他指標(biāo)排序?qū)Ρ?/p>
利用該綜合評價指標(biāo)函數(shù)對WoS數(shù)據(jù)庫和Scopus數(shù)據(jù)庫共有的綜合性內(nèi)科學(xué)期刊(共71份期刊該六項指標(biāo)齊全)進(jìn)行綜合評價,計算各期刊的因子得分,再根據(jù)各因子得分將71份期刊排序,并與六大原始指標(biāo)的排序結(jié)果對比分析。
通過對比排序結(jié)果,我們發(fā)現(xiàn):(1)在載文量大的期刊,如綜合因子 F排名分列前三的 New England Journal of Medicine(近五年年均載文量達(dá)1818篇)、Lancet(近五年年均載文量達(dá)1797篇)、JAMA(近五年年均載文量達(dá)1305篇)都是醫(yī)學(xué)界的頂級綜合類雜志,其六大原始指標(biāo)排名基本都在前三,雖然可能因為載文量大的原因,代表平均影響力的F1因子排名受到影響,排在倒數(shù)后三位,但這并不能影響綜合因子F的排名。(2)在載文量小的期刊,如綜合因子 F排名第六的期刊 Annual Review of Medicine,其近五年年均載文量只有34篇(31~36篇),ES和h指數(shù)分別排在第13和第7位,IF、IF5、SJR和 SNIP分別排 4、5、3、5位,篇均影響力較整體影響力排名靠前,F(xiàn)因子排名很好地中和了這兩種影響力,排名第六。
目前,在國內(nèi)外期刊評價中,IF仍然占據(jù)著重要地位,其計算過程簡單,某刊前兩年發(fā)表論文在統(tǒng)計年的被引證次數(shù)除以該刊前兩年發(fā)表論文總數(shù),但局限性也很明顯:默認(rèn)所有引文具有同樣的權(quán)重,不排除自引,對于極端數(shù)值的變化敏感等等。IF5將統(tǒng)計的引文區(qū)間延長至5年,對IF做了一定的改進(jìn),但不能更正以上局限,而且從本研究及其他研究[7]結(jié)果看,IF與IF5排名差異小,相關(guān)程度極強,所以IF5取代IF意義不大。h指數(shù)在國外期刊評價中也是極為常用的,從h指數(shù)的計算原理就能看出h指數(shù)的數(shù)值變化是隨著時間只增不減的[7,8],期刊發(fā)表的論文數(shù)量越多,越有利于提高 h指數(shù),其同一種期刊的排名比IF排名靠前[9]。SJR與ES引入了引文網(wǎng)絡(luò)的概念,參考了衡量網(wǎng)頁重要性的PageRank算法,計算時考慮到引文的權(quán)重,但SJR與期刊刊載論文的平均水平關(guān)系較強[10],而ES具有發(fā)文量依賴傾向,用于評價期刊的總體影響力[11]。SNIP是期刊評價指標(biāo)團(tuán)隊中較新的成員,由于基于全球最大的文摘和引文數(shù)據(jù)庫Scopus和其能對不同主題領(lǐng)域來源期刊進(jìn)行直接評價的優(yōu)勢[12],而引起期刊評價界的廣泛關(guān)注,但從它的全稱“篇均來源期刊標(biāo)準(zhǔn)影響”和計算原理“引用潛力”(一篇文獻(xiàn)在特定學(xué)科領(lǐng)域里估計能達(dá)到的平均被引用次數(shù))看[13],SNIP是對期刊平均影響力的測量。因子分析的結(jié)果將IF、IF5、SJR和SNIP歸為一類,h指數(shù)和ES歸為一類,可見支配這些指標(biāo)相關(guān)性的重疊信息不取決于來源數(shù)據(jù)庫,也不在于引文區(qū)間和自引處理,或是否考慮引文權(quán)重等等,而在于計算的結(jié)果是期刊影響力的平均值還是整體值,載文量起了決定性的影響。
無論是哪一個期刊引文評價指標(biāo),都存在片面性,因此國內(nèi)外所有的數(shù)據(jù)庫在評價一本期刊時都會同時采用多個指標(biāo),但各自做法不一,而且這些引文指標(biāo)之間存在信息交叉,對不同期刊的評價有偏頗,我們需要構(gòu)建一個綜合評價指標(biāo)體系,將各指標(biāo)分配權(quán)重,消除信息重疊。本文對1881份醫(yī)學(xué)期刊的6個核心引文指標(biāo)數(shù)值進(jìn)行了因子分析,找出起支配作用的潛在因素——公因子F1、F2,并通過F1和F2在各指標(biāo)上的不同載荷,將這六個指標(biāo)分為兩類,F(xiàn)1代表了期刊的平均影響力,F(xiàn)2代表了期刊的整體影響力,期刊的載文量對于F1和F2的排序有重要的影響。在權(quán)衡F1和F2的基礎(chǔ)上,我們構(gòu)建了綜合引文評價指標(biāo)函數(shù)以計算綜合因子F值,將這六個相關(guān)的指標(biāo)通過降維轉(zhuǎn)化為一個綜合指標(biāo)。
通過對免疫學(xué)的68種專業(yè)期刊和內(nèi)科學(xué)的71種綜合期刊的實證研究證實,無論針對載文量偏大的期刊還是載文量偏小的期刊,該綜合因子能綜合這六大引文評價指標(biāo),消除載文量的影響,權(quán)衡期刊整體與平均影響力,客觀公正地評價科技期刊的質(zhì)量水平。當(dāng)然,還是那句老話:沒有哪種指標(biāo)是完美的。本研究構(gòu)建的綜合指標(biāo)函數(shù)具有一定的局限性,雖然樣本量大,但選擇的研究指標(biāo)類型有限,局限于引文評價核心指標(biāo),建立的綜合評價指標(biāo)體系還不夠全面、豐富。但通過因子分析法構(gòu)建綜合引文評價指標(biāo)在實例驗證中顯示出一定的合理性和應(yīng)用價值,對于消除載文量的影響也顯出一定的效果,對于期刊引文評價具有一定的參考價值。
[1]吳濤,史紀(jì)元,楊筠,等.科技期刊引文評價核心指標(biāo)的對比研究[J].中國科技期刊研究,2014,25(8):1058-1062.
[2]劉雪立.中文核心期刊評價指標(biāo)體系:演進(jìn)·問題·建議[J].編輯學(xué)報,2014,26(1):92-95.
[3]張曉雪.我國科技期刊評價指標(biāo)體系的現(xiàn)狀考察及未來發(fā)展思考[J].中國出版,2014(1):29-31.
[4]史艷芬.基于SSCI&Scopus對比分析期刊評價指標(biāo)的實證研究[J].情報雜志,2013,32(12):119-122.
[5]孫振球,徐勇勇.醫(yī)學(xué)統(tǒng)計學(xué)[M].3版.人民衛(wèi)生出版社,2011:362-373.
[6]辛督強,韓國秀.因子分析法在科技期刊綜合評價中的應(yīng)用[J].數(shù)理統(tǒng)計與管理,2014,33(1):116-121.
[7]吳海芳.幾種學(xué)術(shù)期刊評價指標(biāo)的相關(guān)性分析[J].大學(xué)圖書情報學(xué)刊,2013,31(6):86-89.
[8]李超.國內(nèi)期刊評價及其方法研究的進(jìn)展與實踐[J].情報科學(xué),2012,30(8):1232-1237.
[9]朱蓓,趙會懂.H指數(shù)與影響因子評價科技期刊的比較[J].中華醫(yī)學(xué)圖書情報雜志,2010,19(9):1-3,24.
[10]趙星,高小強,唐 宇.SJR與影響因子、h指數(shù)的比較及SJR的擴(kuò)展設(shè)想[J].大學(xué)圖書館學(xué)報,2009(2):80-84.
[11]竇曦騫,祁延莉.特征因子與論文影響力指標(biāo)初探[J].大學(xué)圖書館學(xué)報,2009(6):57-62.
[12]程小娟,楊晶晶.Scopus數(shù)據(jù)庫引文評價新指標(biāo)SNIP原理及可行性探討[J].圖書情報工作,2012,56(10):6-9,34.
[13]Huggett S.New perspectiveson journal performance[EB/OL].(2010-01)[2014-08-30].http://www.researchtrends.com/issue15-january-2010/behind-the-data-2/.