■樓文高 王瑩瑩 張 博
1) 上海商學院信息與計算機學院,上海市徐匯區(qū)中山西路2271號 2002352) 上海理工大學出版印刷與藝術設計學院,上海市楊浦區(qū)軍工路516號 200093
學術期刊是學者進行學術交流、傳播科研成果的主要方式和載體,期刊影響力是指其所載的論文在某段時間內(nèi)促進學術研究與應用發(fā)展的能力以及社會對其價值的認同程度和期刊本身傳播與擴散能力等的體現(xiàn)[1-3]。雖然期刊界和學術界做出了很多努力,但要對學術期刊作出全面客觀和準確的評價仍然十分困難。如果片面強調(diào)影響因子(Impact Factor,IF)或總被引頻次(Total Cites,TC)等單個指標的作用,將會導致期刊發(fā)展出現(xiàn)畸形,極有可能出現(xiàn)為了提高IF而故意減少發(fā)文量的“只剩下好看的結(jié)果”或只顧增加發(fā)文量而不顧質(zhì)量的“喪失期刊作為學術傳播工具的功能”等情形[4]。為此,2013年中國科學文獻計量評價研究中心(以下簡稱“評價中心”)提出了一個由他引TC和IF非線性“平權(quán)”組合的用于類內(nèi)期刊影響力評價與排序的綜合指標——學術期刊影響力指數(shù)(Clout Index,CI)。2015年起每年出版的《中國學術期刊影響因子年報》(以下簡稱《年報》),發(fā)布每種期刊的CI值(為了便于描述,以下將《年報》發(fā)布的CI簡稱為“《年報》CI”)及其排序。
由于CI同時兼顧了TC(表示期刊發(fā)展歷史與傳承以及發(fā)文量等絕對量規(guī)模因素)和IF(主要體現(xiàn)期刊前2年所載論文質(zhì)量等相對量效率因素)對期刊影響力的作用,而且為抑制單純追求大的TC(與之對應的IF很小)盲目擴大發(fā)文量而降低學術質(zhì)量的情況,提高CI的公正性,引入了基于期刊量效指數(shù)(Journal Mass Index,JMI)的調(diào)整系數(shù)K。因此,CI的合理性得到了國內(nèi)外期刊界和學術界的基本認可[1-9]。文獻[4,7-9]對《年報》CI、JMI的意義和作用以及K的合理性和有效性等進行了充分闡述。同時,文獻[1-3,5-6]也指出了CI的內(nèi)涵以及JMI區(qū)間的確定、K值的選取等都存在改進余地。楊浦[5]從CI的數(shù)學意義和目標內(nèi)涵兩方面分析了CI的優(yōu)缺點,認為CI具有引導期刊向論文質(zhì)量與載文量均衡發(fā)展的作用,但通過提高IF更容易提高CI值,仍然將期刊“引導向只追求影響因子的老路”,并提出應對TC和IF進行恰當?shù)念A處理使歸一化數(shù)據(jù)更靠近對角線分布和均衡提高兩個指標的難度等改進思路。俞立平等[6]認為TC、IF數(shù)據(jù)服從冪律分布,提出對其取對數(shù)預處理,使其接近于正態(tài)分布,并舍去調(diào)整系數(shù)K,以圖書館、情報學(以下簡稱“圖情類”)期刊為例進行實證研究,取得了較好效果,但由于存在計算誤差,并未得到其認為的合理得多的結(jié)果——《大學圖書館學報》排名(從第6名提高到第2名)高于《圖書情報工作》(詳見2.3節(jié)),而且當IF小于1時,取對數(shù)后會出現(xiàn)擴大歸一化數(shù)據(jù)區(qū)間的結(jié)果,與IF大于1時的情況相反,顯然是不太合理的。
綜上可知:《年報》CI及俞立平等[6]提出的修正CI(以下簡稱“YCI”)都有改進余地;應對TC和IF進行預處理使其接近于正態(tài)分布,盡可能地分布在對角線附近,減少提高TC和IF對提高CI的難度差異;應舍去基于JMI的調(diào)整系數(shù)K以減少排名歧義,并進一步研究CI的特性等。本文提出一種新的CI修正方法——NCI(New Modified Academic Journal Clout Index),詳細分析函數(shù)特性及其數(shù)據(jù)分布特點,通過對TC取開3次方根和對IF取開平方根預處理,使數(shù)據(jù)分布接近于正態(tài)分布,且使NCI具有較好的區(qū)分度和合理性;分別基于復合(他引)數(shù)據(jù)(TC和IF)對圖情類期刊進行實證研究,得到NCI值,與YCI值、《年報》CI值、CSSCI來源期刊及排名等進行比較,發(fā)現(xiàn)NCI與《年報》CI、YCI、CSSCI期刊排名等具有很好的一致性,而且NCI能夠挖據(jù)出更多信息,更全面客觀地表征期刊影響力,結(jié)果也更為合理和可靠。
1.1.1 《年報》CI簡介
《年報》提出的CI是由期刊在統(tǒng)計年的他引TC和他引IF進行組內(nèi)線性歸一化處理后非線性“平權(quán)”計算得到,計算公式為[1-3]
(1)
式中:αCI為《年報》提出的CI值;A、B分別是組內(nèi)期刊IF和TC的歸一化值[1-3]。當JMI的取值RJMI在(0.05,0.1]、(0.025,0.05]和(0,0.025]時,K分別取0.2、0.1和0.05;RJMI為其他值時,K取1。
由(1)式可知:(1)IF和TC的歸一化值A和B應盡可能地“平權(quán)”,即“等權(quán)”;(2)如果兩種期刊的IF相等,則TC大的期刊,其CI值應該更大。(3)引入基于JMI的調(diào)整系數(shù)K,可使CI真正達到“不能讓不顧載文質(zhì)量而過多增加發(fā)文量的期刊占便宜”的目的,從而引導期刊在載文質(zhì)量與數(shù)量之間實施均衡發(fā)展,避免落入期刊發(fā)展“誤區(qū)”——或者為了保證較高的IF而發(fā)文量很少,或者為了顯著增加TC而不顧質(zhì)量地過多增加發(fā)文量。
1.1.2 《年報》CI的指標和函數(shù)特性存在的不足
(1) 選取評價指標以及指標權(quán)重因期刊而異的問題。為了更好地體現(xiàn)公平計量,《年報》在計算CI時采用他引TC和IF,但《年報》并沒有給出他引TC和IF數(shù)據(jù),導致普通學者很難對CI進行深入研究。為此,俞立平等[6]采用復合TC和IF代替他引數(shù)據(jù),實證結(jié)果表明這種替代是有效的,這樣便于直接從《年報》獲得數(shù)據(jù),開展深入研究。
(3) 舍棄基于JMI的調(diào)整系數(shù)K。楊浦[5]和俞立平等[6]都認為基于JMI不同取值區(qū)間來確定K值的方法不夠嚴謹,《年報》也沒有提供理論依據(jù),而是主觀地根據(jù)調(diào)整5%期刊B值來確定K值。俞立平等[6]認為對復合TC進行取對數(shù)預處理后,顯著降低了個別期刊因TC過大而對CI的不利影響,對圖情類期刊的實證結(jié)果表明,舍去調(diào)整系數(shù)K的方案是基本可行的。
(1) 獲取數(shù)據(jù)。為了與俞立平等[6]的YCI值及其排序結(jié)果進行比較,從2017年《年報》獲取43種圖情類期刊的復合TC和IF數(shù)據(jù),從評價中心購得相應的他引數(shù)據(jù)。
表1 部分圖情類期刊復合IF、TC及其不同預處理后的數(shù)據(jù)
圖1(a)~(d)所示分別為復合IF及其采用不同預處理方法后得到的直方圖和正態(tài)分布曲線,偏度、峰度及正態(tài)性檢驗值如表2所示。其中峰度、偏度越接近于0,表明數(shù)據(jù)分布越接近于正態(tài)分布。
圖1 復合IF及其經(jīng)不同預處理后的直方圖和正態(tài)分布曲線對比
參數(shù)A0A03A04A0B0B03B04B0A′0B′0偏度2.5680.9190.5080.3291.7970.7870.3810.155-0.126-0.692峰度10.2401.5400.234-0.1883.2790.389-0.070-0.109-0.7941.214P值0.001c0.2000.2000.2000.0010.2000.2000.2000.1440.200
注:c表示Kolmogorov-Smironov檢驗(D檢驗)值;顯著性水平P>0.05表示數(shù)據(jù)服從正態(tài)分布;A′0和B′0分別為復合IF和TC取對數(shù)預處理后的結(jié)果。
由圖1和表2可知,復合IF原始數(shù)據(jù)呈中等左偏態(tài)分布,不宜直接進行歸一化處理,取開平方根、3次方根、4次方根預處理后的數(shù)據(jù)均(接近)服從正態(tài)分布規(guī)律,但數(shù)據(jù)的區(qū)分度逐次降低,從尖峰變?yōu)槠椒?。因此,為保證數(shù)據(jù)既近似服從正態(tài)分布又具有較高的區(qū)分度,筆者認為對復合IF取開平方根是比較合適的。從A′0和B′0偏度小于0可知,對數(shù)預處理后的數(shù)據(jù)是右偏的,與原始數(shù)據(jù)的左偏相反,顯然是“矯枉過正”了,是不太合適的。同理可得,對復合TC取開3次方根是比較合適的(限于篇幅,過程略)。
(3) 舍去基于JMI的調(diào)整系數(shù)K。雖然文獻[9]詳細論述了調(diào)整系數(shù)K對“量大質(zhì)低”期刊調(diào)低其CI值的合理性,但對到底應該調(diào)低多少是合理的,沒有給出令人信服的解釋,而且K取離散值,很容易受到處于臨界值附近期刊從業(yè)者的質(zhì)疑[1-3,5]。如對J1、J2兩種期刊,IF和TC的歸一化值A和B均為0.3、0.8,RJMI分別為0.099和0.101(實際差異非常小),則調(diào)整系數(shù)K分別為0.2和1,J1和J2期刊的CI值分別為320.78和686.20,即后者的CI值是前者的2倍多,這顯然是不合理的。上述雖然是特例,但從一個側(cè)面說明調(diào)整系數(shù)K取離散值是不合理的。且實證研究結(jié)果表明,采取本文的預處理方法對TC和IF進行預處理,可顯著降低過大TC對NCI的不利影響,故舍去調(diào)整系數(shù)K。
綜上所述,本文提出的期刊影響力新修正指數(shù)NCI的計算公式為
(2)
式中:AN、BN分別為IF、TC經(jīng)預處理后的歸一化值。
圖2(a)、(b)所示是俞立平等[6]采用的43種圖情類期刊的復合IF和TC數(shù)據(jù)預處理前、后歸一化值的散點圖??梢钥吹?,圖2(b)的數(shù)據(jù)分布更為分散、均勻,更向(1, 1)點和對角線靠近。大多數(shù)期刊數(shù)據(jù)分布于對角線之上(即BN>AN),即NCI值更多取決于TC,將引導更多期刊向提高IF(載文質(zhì)量)方向發(fā)展,更有利于促進期刊業(yè)的均衡發(fā)展。
圖2 復合IF和TC數(shù)據(jù)預處理前、后的歸一化值散點圖(a)復合IF和TC原始數(shù)據(jù)歸一化值散點圖;(b)復合IF和TC數(shù)據(jù)預處理后歸一化值散點圖
將各期刊的歸一化值(包括他引數(shù)據(jù))代入(2)式可計算得到其NCI值及其排序,列于表3中。作為對比,《年報》CI值、YCI值(αYCI)[6]以及筆者根據(jù)文獻[6]的公式和數(shù)據(jù)計算得到的α′YCI值及其排序和CSSCI來源期刊及其排序也列于表3中。
(1) 俞立平等[6]YCI的計算結(jié)果存在一定誤差。本文根據(jù)俞立平等[6]列出的數(shù)據(jù)及公式,重新計算得到的α′YCI值,與俞立平等[6]的結(jié)果不同,見表3第8列。
(2) 本文NCI值與α′YCI值排序結(jié)果具有很好的一致性。根據(jù)α′YCI值,《圖書情報工作》排名仍然高于《大學圖書館學報》,與NCI值排名一致。在復合NCI排名、《年報》CI排名前24位的期刊中,只有《中華醫(yī)學圖書情報雜志》不同,分別排第21和第27位,表明NCI值雖然采用復合數(shù)據(jù)進行計算,但高質(zhì)量期刊排名的一致性很好?!秷D書情報導刊》的排名相差很大,根據(jù)《年報》CI、α′YCI和本文NCI值分別排第41、36和25位,經(jīng)查,其2017、2018年《年報》CI值分別列第42和21位,可被引文獻量從2016年的601篇減少到2017年的174篇,其復合IF僅從0.147提高到0.246(同時TC從6614下降到5889),但其影響力排名卻從第42名快速躥升到第21名,這是難以合理解釋的,而根據(jù)NCI值,排名僅從第25位提高到第21位,顯然要合理得多。
表3 圖情類43本期刊的影響力指數(shù)NCI值與其他多個CI值及其排序結(jié)果對比
(3) 基于不同JMI區(qū)間K取離散值是欠合理的。如果2016年《圖書情報導刊》所載的可引文獻量從601篇增加到955篇,假定他引IF和TC不變,則RJMI在(0.05,0.10]范圍內(nèi),調(diào)整系數(shù)K從1變?yōu)?.2,2017年的CI值就從159.7“斷崖式”下降到37.4,即CI值下降到原來的1/4,排名也從第21名下降到第40名,這完全是調(diào)整系數(shù)K取離散值導致的,顯然是不合理的。
(4) 本文NCI與《年報》CI、α′YCI以及TC、IF之間具有很高的相關性,Pearson相關系數(shù)如表4所示。除復合TC與他引IF之間在0.05水平上顯著相關外,其他均在0.01水平上顯著相關。
表4 NCI值與《年報》CI值、復合(他引)TC和IF之間的Pearson相關系數(shù)
由表4可知:NCI與復合(他引)IF和TC之間的相關系數(shù)均高于α′YCI,且復合NCI與α′YCI的相關系數(shù)高達0.975,說明NCI能比α′YCI從復合(他引)IF和TC中挖掘出更多的有效信息;雖然復合NCI與《年報》CI來源于不同的指標數(shù)據(jù),預處理方法也不同,但相關系數(shù)達到0.946,采用相同數(shù)據(jù)時更是高達0.964,表明兩個指數(shù)具有高度一致性。從排名結(jié)果來看,兩個指數(shù)Q1和Q2區(qū)的期刊完全相同。因此,與俞立平等[6]α′YCI和《年報》CI相比,NCI更好地兼顧復合(他引)IF和TC的平衡性。
(5)與CSSCI來源期刊的比較。由表3可知,他引NCI排名前18位的期刊與CSSCI來源期刊完全相同,排名前9位期刊中只有一種期刊不相同。復合NCI排名前18位期刊與CSSCI來源期刊中只有一種期刊不相同,一致性很好。因為無法從中國知網(wǎng)下載《情報學報》2003—2012年的論文,故其TC相對較低,以至于NCI和《年報》CI的排名偏低(分別排在第12位、14位),而在CSSCI中排在第4位。
為進一步驗證NCI的合理性和有效性,筆者再選取2016—2018年《年報》圖情類、信息與新聞出版學、體育以及中國經(jīng)濟等類別期刊進行實證研究(限于篇幅,具體過程和結(jié)果略,備索),均得到類似的結(jié)果。
《年報》用TC和IF構(gòu)建相互掣肘的CI指數(shù)是比較合理的,優(yōu)于IF、TC等任何單一指標,有利于引導期刊在發(fā)文質(zhì)量與數(shù)量之間均衡發(fā)展。采用非線性“平權(quán)”模型替代線性模型以及基于JMI的調(diào)整系數(shù)K,可有效抑制個別期刊的過大TC(同時IF很小)而出現(xiàn)“大數(shù)吃小數(shù)”的情況,可均衡IF和TC對提升CI的效能。
對不同JMI區(qū)間,筆者建議采用連續(xù)的調(diào)整系數(shù),有兩種解決方案:(1)在RJMI∈(0,0.5]范圍內(nèi),取K=2×RJMI,即RJMI∈(0, 0.1]時,K=0~0.2,抑制作用稍大于《年報》,RJMI∈(0.1,0.5]時,K=0.2~1,由《年報》的無抑制改為適度抑制,其他情況下K取1,避免出現(xiàn)CI值“斷崖式”躥升或者下降的情況。(2)盡可能壓縮采用調(diào)整系數(shù)K的JMI范圍。在RJMI∈(0,0.1]、RJMI∈(0.1,0.3]范圍內(nèi),分別取K=2×RJMI和K=0.2+4×(RJMI-0.1)的分段線性函數(shù),其他情況下K取1。此外,對TC歸一化值是否屬于“過大”應作出明確規(guī)定(如必須大于0.70),只有“過大”時才需要調(diào)整。
采用如上兩種方案,可有效避免出現(xiàn)前述無法合理解釋的現(xiàn)象,從《年報》[1-3]圖2可以看出,需要調(diào)整的期刊也不多。今后編制《年報》時,建議改進調(diào)整系數(shù)K的取值方法。
圖情類期刊的實證研究結(jié)果表明:(1)NCI、俞立平等[6]α′YCI和《年報》CI均較好地揭示了復合(他引)IF和TC指標數(shù)據(jù)的有效信息;(2)與α′YCI相比,NCI值與IF和TC的相關系數(shù)更高,表明從IF和TC中挖掘出了更多的有效信息;(3)與《年報》CI相比,NCI更好地平衡、兼顧了IF和TC兩個指標。
因此,筆者以為,本文提出的NCI更合理和有效,期刊排序結(jié)果更接近于實際情況和學界、業(yè)界的普遍共識。
文獻[1-3,5-6]均認為CI計算方法還需要進一步完善。筆者以為,總的改進思路可概括為:(1)計算公式應盡可能簡潔;(2)更好地平衡TC和IF之間的關系,從而引導期刊在載文質(zhì)量和數(shù)量之間均衡發(fā)展;(3)IF相同時,TC更大期刊的CI值應該更大,TC相同時,IF更大期刊的CI值應該更大;(4)盡可能使IF和TC的歸一化值近似服從正態(tài)分布規(guī)律,接近對角線分布,使CI保持較好的區(qū)分度;(5)盡可能從IF和TC數(shù)據(jù)中挖掘出更多的有效信息;(6)盡量不用調(diào)整系數(shù)或者采用連續(xù)的調(diào)整系數(shù)。
針對文獻[1-3,5-6]提出的CI改進思路等,本文提出一種新的影響力指數(shù)修正計算方法(NCI),首先對IF取開平方根、對TC取開3次方根進行預處理,以使其近似服從正態(tài)分布,再進行歸一化后求得NCI值,可適度壓縮高影響力期刊之間的間距,適度擴大中等影響力期刊之間的距離。
對圖情類等期刊的實證研究結(jié)果表明:(1)新修正指數(shù)NCI與俞立平等[6]α′YCI、《年報》CI指數(shù)都能很好地揭示IF和TC的分布規(guī)律和有效信息;(2)與俞立平等[6]α′YCI和《年報》CI相比,NCI與IF和TC的相關系數(shù)更高、更均衡,表明NCI優(yōu)于α′YCI和CI,其期刊排名更接近于實際和學界、業(yè)界的共識;(3)NCI和α′YCI的預處理方法都能有效地抑制過大TC對CI的不利影響,都可舍去調(diào)整系數(shù);(4)《年報》基于JMI的調(diào)整系數(shù)K取離散值有時欠合理,對于處于臨界值附近的期刊,必定出現(xiàn)無法合理解釋的結(jié)果,據(jù)此提出兩種方案來改進調(diào)整系數(shù)K值;(5)基于他引數(shù)據(jù),NCI排名前18位的期刊與CSSCI來源期刊排名前18位的期刊完全相同,基于復合數(shù)據(jù)的期刊,只有一種期刊不同,NCI與《年報》CI排名前3、10、14和20位的期刊完全相同,一致性很好。
本文不足之處主要有:(1)采用“試湊法”確定TC和IF的合適預處理方法,雖然符合探索性研究的基本精神,但如何兼顧既近似服從正態(tài)分布又保持較高的區(qū)分度,理論依據(jù)有待完善。(2)雖然經(jīng)圖情類等四個類別的期刊實證研究有效,但對其他類期刊的有效性還有待進一步驗證。(3)須對預處理前、后指標數(shù)據(jù)的內(nèi)涵進行更好的界定和厘清。