馮曉娜,楊文霞,付露瑤,孫志騰,劉文云
科研成果是學(xué)術(shù)評(píng)價(jià)的基礎(chǔ),反映作者的學(xué)術(shù)影響力。隨著“除四唯”“破五唯”等政策和配套措施的出臺(tái),我國(guó)的學(xué)術(shù)評(píng)價(jià)、人才評(píng)價(jià)進(jìn)入新階段,亟待引入新方法、新思路,以實(shí)現(xiàn)評(píng)價(jià)方法的創(chuàng)新和內(nèi)容的深入[1]。目前學(xué)者學(xué)術(shù)影響力的評(píng)價(jià)指標(biāo)主要包括h指數(shù)[2]、h指數(shù)的衍生指數(shù) (g 指數(shù)[3]、A 指數(shù)[4]、R 指數(shù)[5]、AR 指 數(shù)[5]等)、學(xué)術(shù)矩陣和學(xué)術(shù)跡[6]、PageRank算法[7]及p指數(shù)等。h指數(shù)因操作簡(jiǎn)單、易于理解,得到廣泛應(yīng)用,但存在缺乏靈敏度、區(qū)分度和非波動(dòng)性等弊端;2010年G Prathap提出p指數(shù)[8],并分別從機(jī)構(gòu)[9]、學(xué)者[10]、期刊[11]等角度利用p指數(shù)進(jìn)行分析。由于p指數(shù)能兼顧學(xué)者論文產(chǎn)出的數(shù)量和質(zhì)量,相較于h指數(shù),具有更高的區(qū)分度、敏感性和時(shí)序波動(dòng)性[12],且有較好的靈活性、穩(wěn)定性、合理性和廣泛的適用性[13],受到越來越多學(xué)者的關(guān)注。
然而,p指數(shù)也存在缺點(diǎn),比如不能反映引文分布、時(shí)間因素、合著等的影響,需要對(duì)其進(jìn)行改進(jìn)和方案優(yōu)化。對(duì)于合著,G Prathap[14]提出按照合著者數(shù)量平均分配合著者權(quán)重和按照著者順序給予權(quán)重兩種方法,Hagen則提出調(diào)和算法[15]。對(duì)于p 指數(shù)不能體現(xiàn)引文分布和時(shí)間因素,大部分學(xué)者的改進(jìn)思路是按照文獻(xiàn)質(zhì)量進(jìn)行分類,對(duì)高質(zhì)量論文的引文量實(shí)行加權(quán)。例如,韓毅等[16]以學(xué)科文獻(xiàn)半衰期為閾值,半衰期外的文獻(xiàn)引用被賦予更高權(quán)重;張玲玲等[17]以普賴斯公式計(jì)算出的高質(zhì)量論文被引量和文獻(xiàn)半衰期為閾值,將文獻(xiàn)劃分為4類;唐璞妮[18]以h指數(shù)為閾值,將發(fā)文分為3個(gè)區(qū)域,對(duì)各區(qū)域論文的被引頻次分別賦權(quán)。
用算術(shù)平均值來反映引文非正態(tài)分布的集中趨勢(shì)是不合適的[19-20],Adler等[21]指出,由于引用數(shù)據(jù)呈右偏態(tài)分布,所謂的高篇均被引頻次只是由部分高被引的文章所貢獻(xiàn),不能說明每篇文章都是高被引。郝玉珊從被引的時(shí)間特征與被引分布的均衡性兩方面探討期刊的學(xué)術(shù)影響力[22],并利用改進(jìn)的泰爾指數(shù)修正期刊平均被引頻次[23]。一般情況下,被引頻次和篇均被引頻次相同時(shí),多篇文章對(duì)平均值具有貢獻(xiàn)的學(xué)者,與僅有少數(shù)幾篇文章對(duì)平均值產(chǎn)生貢獻(xiàn)的學(xué)者相比,具有更好的學(xué)術(shù)穩(wěn)定性。
本文在前人研究的基礎(chǔ)上,引入泰爾指數(shù),構(gòu)建綜合考量引文分布、時(shí)間、合著和學(xué)術(shù)穩(wěn)定性的評(píng)價(jià)指標(biāo),并進(jìn)行實(shí)證分析,以期為科學(xué)評(píng)價(jià)學(xué)者的學(xué)術(shù)影響力提供新的優(yōu)化方案。
1967年泰爾根據(jù)信息論中熵的概念提出泰爾指數(shù)(Theil Index),以衡量個(gè)人或地區(qū)之間收入的不平等性,熵是指每一事件的概率對(duì)數(shù)與其相應(yīng)概率乘積的總和。泰爾指數(shù)提出后,最先用于研究收入分配與收入差異,既而在教育、衛(wèi)生等資源分配差異的研究中普遍使用,隨后圖情界也開始使用該指數(shù)研究圖書館服務(wù)區(qū)域差異[24]、學(xué)術(shù)期刊配置的學(xué)科均衡性[25]、期刊評(píng)價(jià)[22]、期刊影響力指標(biāo)構(gòu)建[23]等問題。泰爾指數(shù)公式為:
公式(1)中,T代表泰爾指數(shù),n代表有n個(gè)地區(qū),Ii代表地區(qū)i 的收入,I代表所有地區(qū)的收入,Pi代表地區(qū)i的人口,P代表所有地區(qū)人口。泰爾指數(shù)越大,表示收入差距越大,即均衡性越差。
同理,某學(xué)者發(fā)表n篇論文,Ci表示其第i篇論文的被引頻次,C表示其所有論文的被引頻次,N表示該作者的總發(fā)文量,則泰爾指數(shù)可變異為:
在公式(2)中,T′為變異泰爾指數(shù),取值范圍為0~1。T′越接近0,表示作者每篇文章的被引頻次越接近,發(fā)文質(zhì)量越穩(wěn)定,學(xué)術(shù)穩(wěn)定性越高;越接近1,則表示作者發(fā)表的論文質(zhì)量差距越大。
由于變異泰爾指數(shù)T′屬于反向指數(shù),且介于0~1 之間,為了提高指數(shù)對(duì)發(fā)文均衡性的敏感度,取1/T′作為p指數(shù)的修正權(quán)值。修正后的p指數(shù)(p′)為:
論文被引的過程不僅是知識(shí)傳播的過程,也是論文生命力的體現(xiàn)和作者學(xué)術(shù)影響力積累的過程。時(shí)間間隔越大,知識(shí)傳播速度越慢,被引的概率越低。如果一篇論文在長(zhǎng)時(shí)間內(nèi)被引用,說明其生命力強(qiáng)勁,論文在不同時(shí)間被引用會(huì)給作者積累不同程度的學(xué)術(shù)影響力,正向影響其學(xué)術(shù)影響力。給不同時(shí)間段內(nèi)的論文被引頻次賦予不同權(quán)重,可以提高指標(biāo)對(duì)時(shí)間因素的敏感性。假設(shè)有A和B兩篇論文,二者的總被引頻次相同,但A發(fā)表于2015年,年均被引頻次為3.3,B發(fā)表于2017年,年均被引頻次為5。從總被引頻次看,兩篇論文影響力相同;從年均被引頻次來看,B的影響力要大一些;從兩篇論文的被引趨勢(shì)來看,A的被引頻次呈遞增到衰減的趨勢(shì),時(shí)間長(zhǎng),衰減速度慢,B的被引頻次呈遞減趨勢(shì),時(shí)間短,衰減速度快。由此可見,A的影響力更大一些(詳見表1)。
表1 兩篇論文的部分指標(biāo)統(tǒng)計(jì)
本文結(jié)合時(shí)間因素,給不同時(shí)間下的論文被引次數(shù)賦予不同的權(quán)重,計(jì)算時(shí)間加權(quán)被引頻次Ct。計(jì)算方法是:一篇論文自發(fā)表之日到現(xiàn)在的時(shí)間為t,第一年被引頻次權(quán)重為1/t,第二年被引頻次權(quán)重為2/t,依次類推,t年的被引頻次與其相應(yīng)的權(quán)重相乘之后加總,表達(dá)公式為:
公式(4)中t表示論文發(fā)文時(shí)長(zhǎng),ct代表第t年的被引頻次。就時(shí)間因素來說,一位學(xué)者的學(xué)術(shù)影響力為時(shí)間因素下個(gè)人所有論文的加權(quán)被引頻次,即由于本文僅統(tǒng)計(jì)論文的發(fā)文時(shí)間、發(fā)文量、被引時(shí)間與被引頻次,并不涉及論文的創(chuàng)新性,而且一篇論文的被引時(shí)間越長(zhǎng),其被引頻次越能顯示其影響力,所以論文的原創(chuàng)性與實(shí)用性會(huì)被時(shí)間驗(yàn)證。
綜合文獻(xiàn)[17-19]關(guān)于作者合著貢獻(xiàn)分配算法的研究,本文采用Hagen[15]提出的調(diào)和算法,公式如下:
公式(5)中,Wi表示第i 位作者對(duì)論文的貢獻(xiàn),n表示一篇論文共有n位作者。從公式(5)可知,不同署名次序的作者貢獻(xiàn)值不同,署名越靠前權(quán)重越大,越靠后權(quán)重越小,且合著作者數(shù)量越多,每位作者得到的貢獻(xiàn)值越小。在合著情況下,一位作者的學(xué)術(shù)影響力為其所有論文按照署名次序分配的貢獻(xiàn)值的總和。由于通訊作者的排序情況與標(biāo)注情況太過復(fù)雜,因此公式(5)并未討論通訊作者的情況。
綜合以上分析,將作者合著情況分配的貢獻(xiàn)值Wi作為p′的權(quán)重代入公式(3),得到Pnew指數(shù)。表達(dá)公式為:
普賴斯曾說:科學(xué)論文的被引頻次一般要在論文發(fā)表兩年之后達(dá)到峰值,因此本文的時(shí)間范圍設(shè)置為2014-2018年,在CNKI期刊數(shù)據(jù)庫中進(jìn)行高級(jí)檢索,檢索時(shí)間為2020年6月1日。選擇圖情檔領(lǐng)域20種CSSCI期刊發(fā)表的論文,得到22,387篇文獻(xiàn),按照被引頻次排序,有被引頻次的為5,777 篇,其中19 篇沒有作者。接著,選擇總被引頻次排名前50位作者作為研究對(duì)象,分別統(tǒng)計(jì)這50位作者的發(fā)文量(N)、總被引頻次(C)、h指數(shù)、p指數(shù)、Pnew指數(shù),并對(duì)p指數(shù)、Pw-d指數(shù)、Pnew指數(shù)做出排序。為了驗(yàn)證Pnew指數(shù)的合理性,分別對(duì)p指數(shù)與Pw-d指數(shù)(名次變化1)、p指數(shù)與Pnew指數(shù)(名次變化2)的名次變化作統(tǒng)計(jì):正數(shù)表示名次上升,負(fù)數(shù)表示名次下降,0表示沒有變化,具體數(shù)值表示名次變化幅度。俞立平教授提出的htop指數(shù)中,Pw-d指數(shù)針對(duì)引文分布和作者署名順序兩方面,與本文的Pnew指數(shù)具有一定程度的相似性,因此可作比較(詳見表2)。
表2 圖情檔領(lǐng)域部分作者相關(guān)指標(biāo)統(tǒng)計(jì)
2.2.1 總體數(shù)據(jù)分析
表3列出50位作者4個(gè)指數(shù)的統(tǒng)計(jì)數(shù)據(jù),從h指數(shù)、p指數(shù)、Pw-d指數(shù)到Pnew指數(shù),統(tǒng)計(jì)量的數(shù)值在逐漸變大。從均值與中值之差來看,h指數(shù)和p指數(shù)的差值相差不大,表明其數(shù)據(jù)較為集中,Pw-d指數(shù)其次,Pnew指數(shù)最為分散。從極大值與極小值的分布也可以看出:h指數(shù)與p指數(shù)的數(shù)值范圍最小,Pw-d指數(shù)其次,Pnew指數(shù)最大。從標(biāo)準(zhǔn)差來看,h指數(shù)與p指數(shù)的離散程度小,Pw-d指數(shù)其次,Pnew指數(shù)最大。綜合來看,4個(gè)指標(biāo)的區(qū)分度與離散程度的排序依次為:h 指數(shù)<p指數(shù)<Pw-d指數(shù)<Pnew指數(shù),表明融入引文分布、時(shí)間因素與作者合著情況的Pnew指數(shù)區(qū)分度最高。
表3 50位作者的描述性統(tǒng)計(jì)分析
2.2.2 各指標(biāo)數(shù)值與排名變化分析
(1)各指標(biāo)數(shù)值分析。從表2可知,h指數(shù)共有8 組重復(fù)值,涉及45 位作者,重復(fù)率為90%;p指數(shù)雖然僅有1組重復(fù)值,但與h指數(shù)的標(biāo)準(zhǔn)差(見表3)近似,因此其區(qū)分度也較低;Pw-d指數(shù)沒有重復(fù)值,且標(biāo)準(zhǔn)差超過40,極大地減少了近似值數(shù)量,提高了區(qū)分度;Pnew指數(shù)也沒有重復(fù)值,標(biāo)準(zhǔn)差進(jìn)一步增大,靈敏度與區(qū)分度進(jìn)一步提高。因此,在評(píng)價(jià)作者學(xué)術(shù)影響力時(shí),對(duì)于學(xué)術(shù)水平相近的作者,Pnew指數(shù)可以實(shí)現(xiàn)更精細(xì)的區(qū)分,取得更精準(zhǔn)的評(píng)價(jià)效果。
(2)各指標(biāo)排名與名次變化分析。根據(jù)表2繪制出50位作者p指數(shù)、Pw-d指數(shù)、Pnew指數(shù)的排名,以及p指數(shù)與Pw-d指數(shù)、p指數(shù)與Pnew指數(shù)的名次變化折線圖(見圖1)。從圖1可以看出,Pnew指數(shù)波動(dòng)幅度相對(duì)最小,Pw-d指數(shù)波動(dòng)幅度次之,p指數(shù)排名波動(dòng)最大;名次變化1與名次變化2基本呈同向變化,并且后者比前者波動(dòng)幅度大,說明Pw-d指數(shù)與Pnew指數(shù)具有較高相似度,而且Pnew指數(shù)具有更高穩(wěn)定性。Pw-d指數(shù)考慮引文分布與作者合著情況,而Pnew指數(shù)還考慮了時(shí)間因素,所以Pnew指數(shù)的內(nèi)涵更為豐富,在作者學(xué)術(shù)影響力評(píng)價(jià)中可以較合理地表達(dá)不同水平、不同作者合著的論文對(duì)作者學(xué)術(shù)影響力的影響。
從表2和圖1中可看出,排名靠前的幾位作者分別為邱均平、黃如花、李綱,他們?nèi)N指數(shù)的排名名次并未出現(xiàn)太大變化,表明這些指數(shù)都具有篩選高學(xué)術(shù)影響力作者的功能,也就是說,Pnew指數(shù)可作為一種有效的學(xué)者影響力評(píng)價(jià)指標(biāo)。在表2與圖1的名次變化中可以清楚看到各位作者在不同標(biāo)準(zhǔn)(指數(shù))下的排名變化,反映出圖情檔領(lǐng)域?qū)W者最近幾年的科研狀況。由于本文僅選擇2014-2018年的研究成果,因此通過作者各個(gè)指標(biāo)的數(shù)值與排序可以了解到該學(xué)科的新生代科研人才以及近幾年科研活動(dòng)逐漸減少的作者。新生代科研人才包括許海云、余厚強(qiáng)、白如江等,他們近幾年的研究成果逐漸增多,是圖情檔領(lǐng)域有潛力的優(yōu)秀學(xué)者,也預(yù)示著該領(lǐng)域未來的發(fā)展前景。由此可見,考慮時(shí)間因素之后,對(duì)作者學(xué)術(shù)影響力評(píng)價(jià)更加合理與公正,有利于篩選具有科研潛力的學(xué)者。
圖1 三種指數(shù)排名變化圖
本文統(tǒng)計(jì)期跨度短,有些作者由于被引頻次不足并未進(jìn)入前50名,因此未做統(tǒng)計(jì),如王知津、冷伏海、張曉林;有些作者雖然進(jìn)入前50名,但近幾年科研成果較少,排名較為靠后,如馬費(fèi)成、范并思。當(dāng)時(shí)間線延長(zhǎng)為最近10年或者15年時(shí),這些作者的科研成果可以得到更全面的反映,評(píng)價(jià)結(jié)果也會(huì)更接近實(shí)際學(xué)術(shù)影響力排名。從這一點(diǎn)來說,Pnew指標(biāo)對(duì)時(shí)間因素敏感度高,可用于學(xué)者不同時(shí)期影響力的分階段評(píng)價(jià)。
2.2.3 與其他指標(biāo)的相關(guān)性分析
為了證明Pnew指數(shù)評(píng)價(jià)學(xué)者影響力的合理性,將其與發(fā)文量、總被引頻次、p指數(shù)、Pw-d指數(shù)作對(duì)比,進(jìn)行相關(guān)性分析(結(jié)果見表4)。從表4可看出,Pnew指數(shù)與其他4個(gè)指標(biāo)的相關(guān)性都在0.01水平呈顯著正相關(guān),相關(guān)系數(shù)分別為0.854、0.911、0.602和0.770。其中,Pnew指數(shù)與總被引頻次和發(fā)文量的正相關(guān)性位居前兩位。這是因?yàn)镻new指數(shù)的計(jì)算引入了變異泰爾系數(shù)(T′)、時(shí)間因素下的加權(quán)被引頻次(Ct)和作者合著貢獻(xiàn)(Wi),表明總被引頻次和發(fā)文量實(shí)際上經(jīng)過了三次加權(quán),在一定程度上強(qiáng)化了Pnew指數(shù)與總被引頻次和發(fā)文量的相關(guān)度。Pnew指數(shù)與p指數(shù)的相關(guān)系數(shù)為0.602,二者存在顯著相關(guān)性,主要是因?yàn)镻new指數(shù)是由p指數(shù)衍生而來。同時(shí),相比Pw-d與p 指 數(shù)的 0.843 的高相 關(guān) 性,Pnew與 p 指 數(shù)間0.602的相關(guān)系數(shù)表明,Pnew指數(shù)又具有一定的獨(dú)立性。
表4 皮爾遜相關(guān)性分析
本文在p指數(shù)的研究成果上,綜合考慮引文分布情況、時(shí)間因素、作者合著情況和學(xué)術(shù)穩(wěn)定性,構(gòu)建了Pnew指數(shù)。為了驗(yàn)證Pnew指數(shù)的合理性與可靠性,以CNKI為數(shù)據(jù)源,在CSSCI收錄的圖情檔領(lǐng)域20種期刊中選擇2014-2018年出版的論文為樣本,選出這些論文中被引頻次排名前50位的作者為研究對(duì)象,從總體數(shù)據(jù)、各指標(biāo)數(shù)值與排名、相關(guān)性等方面進(jìn)行分析,得出以下結(jié)論。
(1)與其他指標(biāo)相比,Pnew指數(shù)的區(qū)分度與靈敏度更高。Pnew指數(shù)以合著情況下的貢獻(xiàn)值為正向權(quán)重,以被引均衡性為反向權(quán)重,使得數(shù)值范圍變大、離散程度變高,提高了區(qū)分度與靈敏度。
(2)與其他指標(biāo)相比,Pnew指數(shù)更加穩(wěn)定。由上文可知,在圖1中,3種指數(shù)的波動(dòng)幅度并不同,Pnew指數(shù)最小,Pw-d指數(shù)其次,p指數(shù)最大。這表明考慮論文分布、時(shí)間因素與作者合著情況的Pnew指數(shù)用以評(píng)價(jià)作者學(xué)術(shù)影響力的穩(wěn)定性高。名次變化1的波動(dòng)幅度要比名次變化2小,也印證了這一點(diǎn)。
(3)與其他指標(biāo)相比,Pnew指數(shù)對(duì)被引頻次高的學(xué)者更具有篩選性。根據(jù)三種指數(shù)分別對(duì)作者進(jìn)行排名,可以發(fā)現(xiàn)雖然三種標(biāo)準(zhǔn)下的排名略有差異,但排名靠前的作者均為圖情檔領(lǐng)域中高影響力的著名學(xué)者。因此,Pnew指數(shù)在一定程度上能夠客觀評(píng)價(jià)作者的學(xué)術(shù)影響力,具有一定的合理性與科學(xué)性。
本文針對(duì)p指數(shù)的缺陷,提出Pnew指數(shù),并在實(shí)證分析中取得了較好的檢驗(yàn)效果。相比中低被引頻次的作者,泰爾指數(shù)對(duì)高被引作者的敏感度更高,因此,Pnew更加適合對(duì)高被引頻次作者進(jìn)行評(píng)價(jià)。另外,以5年時(shí)間為統(tǒng)計(jì)期的Pnew指數(shù),其實(shí)驗(yàn)結(jié)果與作者的實(shí)際影響力存在一定偏差,因此Pnew還需放在一個(gè)更長(zhǎng)的評(píng)價(jià)期內(nèi)繼續(xù)進(jìn)行驗(yàn)證。本文只對(duì)作者學(xué)術(shù)影響力進(jìn)行實(shí)證研究,Pnew指數(shù)是否也適用于期刊、機(jī)構(gòu)、團(tuán)隊(duì)的評(píng)價(jià),還需要進(jìn)一步驗(yàn)證,這些都有待后續(xù)研究作進(jìn)一步探討。