李昕潔
引用數據的定量分析是計量學領域評估科研影響力的常用方法。作為科研績效評估最實用工具之一,時間滯后性是引用指標明顯的缺陷,即一篇論文引發(fā)引用行為通常需要一定的時間積累。為解決這一問題,WoS平臺于2015年9月引入使用次數(Usage Count)指標,擬通過使用次數及時體現(xiàn)研究者對論文的興趣大小。
科研基金作為科學研究的重要組成部分,在推進學科領域的科學研究方面發(fā)揮著不可替代的作用[1]。梳理已有論文發(fā)現(xiàn),國內外學者關于科研基金的研究主要集中在三點:(1)不同研究領域或國家的基金政策分析。Fournie等研究了德國基金政策對科研基金和研究前沿的影響[2]。Ebadi等發(fā)現(xiàn)科研基金促進了科學研究,并認為國家應加大科研經費的投入[3]。Breschi等[4]定量分析了ICT領域的科研基金數據。郭哲敏[5]統(tǒng)計分析了國內圖書館、情報和文獻學2015年基金項目情況,了解到社科基金立項特點與規(guī)律。(2)科研基金和科研成果之間的關系。Hoekman等[6]、Costas等[7]分別對科研合作、科研論文等進行分析,探尋科研基金對科研成果的影響力。部分學者注重于國家間基金資助論文的產出差異,如美國和中國[8]、中國和日本[9]。王賢文等[10]研究了主要國家的科研基金及基金論文情況。(3)科研基金與計量指標(如H指數、引用次數)之間的關系。國內外學者嘗試將科研基金與不同評估指標結合,并分析二者之間的關系,如H指數[11]、引用次數[12-13]、自引情況[14]、即年指標[15]、影響因子[16]。
綜上所述,對科研基金的多維度分析仍然是各學科的研究熱點。然而,關于基金對論文使用次數與引用次數的研究較為少見?;鹫撐牡馁|量必然高于非基金論文嗎[17]?基金論文的使用次數一定高于非基金論文嗎?基金論文的使用行為更易轉化為引用行為嗎?為嘗試回答上述疑問,在構建評估指標基礎上,本研究深入分析了使用次數、引用次數、轉化率與基金之間的關系。
在SCI-E核心數據庫中,本文構造檢索式“WC=(Information Science&Library Science)OR(Education,Special)OR(Business,F(xiàn)inance)OR(SocialWork)”AND“語種:English”AND“文獻類型:Article”AND“時間:2016”,最后精煉得到16627條論文記錄。
WoS提供TC和Z9兩種引用次數指標。TC表示WoS核心合集的被引頻次,而Z9代表WoS核心合集、BCI、CSCD等數據庫中的被引頻次合計。為與使用次數統(tǒng)計保持一致,本研究以TC作為論文的引用次數來源。
WoS以FU字段標識一篇論文是否有基金支持。如果一條文獻記錄有FU字段,則判定為有基金資助;如果沒有FU字段,則該篇論文沒有基金支持(本研究只探討論文是否有基金資助,不考慮基金個數)。
WoS提供U1和U2兩種使用次數指標。U1為最近180天的使用次數,隨統(tǒng)計時間變化而上升或下降;U2表示自2013年以來的累積使用次數,隨時間推移而增加或不變,其與引用次數的累積內涵相同。因此,本研究選取U2作為論文的使用次數來源。
基金論文率(Funding Rate,F(xiàn)R)和篇均論文引用次數(Citation Per Article,CPA)是引文分析中度量基金使用情況的兩個常用指標?;诨鹫撐穆屎推撐囊么螖?,本研究衍生出論文使用率(UsageRate,UR)、篇均論文使用次數(Usage Per Article,UPA),以及論文引用率(Citation Rate,CR)以衡量論文的使用次數與引用情況。此外,本研究以使用差異(Usage Difference,UD)和引用差異(Citation Difference,CD)研究基金論文與非基金論文之間的使用與引用行為差異。同時,以轉化率(Conversion Proportion,CP)評估論文使用次數轉換為引用次數的概率[18]。同時,本研究將H指數引入其中,以評估基金論文與非基金論文中高影響力論文數量的差異。各指標計算公式及含義如下:
(1)基金論文率(FR)=(NF/N)*100%,NF和N分別表示基金論文總數和總論文數。
(2)總論文H指數,基金論文H指數,非基金論文H指數。H指數越大,則表明該集合中的高被引論文數量越多。
(3)篇均論文引用次數(CPA)=TC/N,TC表示所有論文被引頻次,N表示總論文數。
(4)篇均論文使用次數(UPA)=TU/N,TU表示論文的總使用量,N表示總論文數。
(5)使用率(UR)=(NU/N)*100%,使用次數大于0的論文占總論文數的比例。NU表示被瀏覽、訪問、保存等使用過的論文數量,N表示總論文數。
(6)引用率(CR)=(NC/N)*100%,引用次數不為0的論文占總論文數的比例。NC表示被他人引用過的論文數量,N表示總論文數。
(7)引用差異(CD)=CPAF/CPAN=(TCF/NF)/(TCN/NN),CPAF為基金論文篇均引用次數,CPAN為非基金論文篇均引用次數。如果CD>1,則基金論文篇均引用次數大于非基金論文篇均引用次數,說明基金影響并增加論文的引用次數;反之說明基金不會影響論文的引用次數。
(8)使用差異(UD)=UPAF/UPAN=(TUF/NF)/(TUN/NN),UPAF為基金論文篇均使用次數,UPAN為非基金論文篇均使用次數。如果UD>1,基金論文使用次數大于非基金論文使用次數,說明基金會影響并增加論文的使用次數;反之說明基金無助于論文使用次數的增加。
(9)轉化率(CP)=(CPA/UPA)*100%,表示使用次數轉換為引用次數的概率,CP值越大表示論文使用次數轉化為引用次數的幾率越大。轉化率由引用與使用之間潛在關系啟發(fā)所得,即論文的引用行為必然發(fā)生于使用行為之后。
上述指標都有特定內涵:基金論文率衡量基金對科學研究的資助程度;使用率說明科研人員對科研成果的關注度;引用率揭示科研人員對學科論文的深度使用;H指數衡量基金論文與非基金論文中高影響力論文的數量;篇均論文引用次數和篇均論文中使用次數描述科研成果的規(guī)范化應用情況;引用差異和使用差異衡量基金論文和非基金論文的差異;轉化率揭示論文的使用次數有多少可以轉化為引用次數。
表1為2016年4個研究領域論文數量、使用次數和引用次數的統(tǒng)計數據,包括基金論文數和非基金論文數。根據表1可知,商業(yè)金融領域論文數量最多,其次是圖書情報領域,特殊教育領域發(fā)文量最少。從基金論文率來看,特殊教育領域占比最高,為39.70%;其次是社會工作領域,為35.68%;商業(yè)金融領域最低,僅為30.24%??梢园l(fā)現(xiàn),2016年4個學科的基金論文率都介于30%~40%。
表1 不同研究領域論文數量、使用次數和引用次數統(tǒng)計數據
從引用次數看,圖書情報領域論文總引用次數最高,最低為特殊教育領域;基金論文引用次數占比最高者為社會工作領域,商業(yè)金融領域最低。雖然圖書情報領域的基金論文使用次數和引用次數均高于商業(yè)金融領域,但其基金論文數量低于商業(yè)金融領域。
從使用次數看,特殊教育領域最低,但其基金論文使用次數占比最高。圖書情報領域使用次數最多,緊隨其后的是商業(yè)金融領域,二者總使用次數分別約為特殊教育領域的5倍和4倍之多。
本研究發(fā)現(xiàn),論文數量和引用次數之間的關系與論文數量和使用次數的關系相似,而引用次數、使用次數與基金論文數量表現(xiàn)出較強的正相關性。可以看到,論文數量、引用次數、使用次數三者的變化是一致的,即三者之間必然存在相關性。從基金維度看,論文數量、引用次數、使用次數三者的相關性仍然存在,表明基金因素與論文數量、引用次數、使用次數之間也存在相關性。
圖1為4個研究領域總論文H指數、基金論文H指數和非基金論文H指數統(tǒng)計情況??梢园l(fā)現(xiàn),4個研究領域的3種H指數均超過9??傉撐腍指數和非基金H指數最高的學科為圖書情報領域,基金論文H指數最高的學科則為商業(yè)金融領域。通過簡單的統(tǒng)計發(fā)現(xiàn),基金論文H指數在圖書情報、特殊教育、商業(yè)金融3個領域3種H指數中都是最小。難道科研基金無助于高影響力論文的產生嗎?
圖1 不同研究領域H指數比較
為此,本研究進一步統(tǒng)計3種類型H核論文數量的占比情況:圖書情報領域(0.41%、0.92%、0.52%),特殊教育領域(0.69%、1.43%、1.04%),商業(yè)金融領域(0.29%、0.80%、0.37%),社會工作領域(0.39%、1.00%、0.45%)(依次為總論文H核論文數量、基金論文H核論文數量、非基金論文H核論文數量的占比)。與簡單的H指數大小結果不同,4個學科領域的基金論文H核論文數量占比全部高于總論文H核論文數量占比和非基金H核論文數量占比,且圖書情報、商業(yè)金融和社會工作領域的基金論文H核論文數量占比是其余兩種的2倍。因此,本研究認為科研基金對領域內高影響力論文的形成具有顯著的推動作用。
引用率的統(tǒng)計結果見表2。引用次數>0的論文數量和總論文數量之間相差較為明顯,商業(yè)金融領域最多(3157篇),最少為特殊教育領域(694篇)。4個研究領域的3種引用率(總論文引用率、基金論文引用率、非基金論文引用率)都在46%以上。結合表2可知,4個研究領域中有較多論文的引用次數為0,原因可能是本研究選取2016年發(fā)表的論文,科研人員的引用時間較短。
4個研究領域的基金論文引用率全部高于總論文引用率以及非基金論文引用率?;鹫撐囊寐屎头腔鹫撐囊寐手g的差值均在10%以上,圖書情報領域二者相差甚至達到21.66%。因此,本文認為基金對論文的引用率具有很大影響,即基金論文引用率要高于非基金論文引用率。
表2 不同研究領域引用率(CR)情況
圖2為4個研究領域的總論文篇均引用次數、基金論文篇均引用次數,以及非基金論文篇均引用次數。3種篇均引用次數均超過0.98次,即平均每篇論文至少被引用1次。與篇均使用次數相比,篇均引用次數的數值較小。結合“使用次數分析”小節(jié)的分析,發(fā)現(xiàn)使用次數通常是引用次數的5~10倍,即一篇論文至少在被瀏覽5~10次之后才會被引用1次。圖書情報領域3種類型的引用次數在4個學科領域中都是最高的。
圖2 不同研究領域篇均引用次數比較
圖書情報領域的總論文篇均引用次數為1.86次,超過1.5次,而其他3個研究領域都處在1.5次之下。社會工作領域的總論文篇均引用次數最低,僅為1.24次。從基金論文篇均引用次數情況來看,圖書情報領域的基金論文篇均引用次數遠遠高于其他3個研究領域,達到2.58次,即圖書情報領域的基金論文平均被引用2~3次。其后依次是商業(yè)金融領域(1.85次)、特殊教育領域(1.76次)、社會工作領域(1.70次)。
最重要也最明顯的是,4個研究領域的基金論文篇均引用次數全部高于其他兩類指標,尤其高于總論文篇均引用次數(圖書情報領域的基金論文篇均引用次數是總論文篇均引用次數1.39倍)。4個研究領域的基金論文篇均引用次數全部是非基金論文篇均引用次數的1.4倍以上,社會工作領域甚至達到1.73倍。因此,本研究認為基金對論文的引用次數具有重要作用,尤其體現(xiàn)在圖書情報領域和社會工作領域。
使用率的統(tǒng)計結果見表3。使用次數>0的論文數量和總論文數量之間最多只相差615篇,最少僅71篇。4個研究領域的3種使用率(總論文使用率、基金論文使用率、非基金論文使用率)都在88%以上,可以認為4個研究領域中僅有一小部分的論文沒有被瀏覽、保存,且各領域之間引用率差距也不明顯。造成小部分論文沒有被使用的原因可能是本研究選取2016年發(fā)表的論文,科研人員的使用時間較短。
表3 不同研究領域使用率(UR)情況
4個研究領域的基金論文使用率全部高于總論文使用率以及非基金論文使用率。基金論文使用率和非基金論文使用率之間的差值均在5%左右。因此,本文認為基金對論文的使用率具有一定影響,即基金論文使用率高于非基金論文使用率。
圖3為4個研究領域的總論文篇均使用次數、基金論文篇均使用次數,以及非基金論文篇均使用次數??梢钥吹?,3種使用次數數值均超過6.75次,即平均每篇論文至少被瀏覽或保存6~7次。從總論文篇均使用情況來看,圖書情報領域以篇均使用17.98次排在第一位,其后依次是特殊教育領域(10.96次)、商業(yè)金融領域(9.59次)、社會工作領域(7.70次)?;鹫撐钠褂们闆r上,圖書情報領域最高,達到22.01次,其后依次是特殊教育領域(12.46次)、商業(yè)金融領域(12.18次)、社會工作領域(9.42次)。圖書情報領域在非基金論文篇均使用次數上仍然最高,為16.19次。
圖3 不同研究領域篇均使用次數比較
進一步分析可知,4個研究領域的基金論文篇均使用次數在3種篇均使用次數中數值最高,總論文篇均被引頻次處于其余兩者之間。特殊教育領域的基金論文篇均使用次數比非基金論文篇均使用次數高出25%,而圖書情報領域、社會工作領域均高出35%,商業(yè)金融領域更是達到43.80%。綜合上述分析,本研究認為基金對論文的使用次數具有明顯的促進作用,尤其體現(xiàn)在圖書情報領域、商業(yè)金融領域。
結合上述分析可以看出,基金論文的引用次數和使用次數高于非基金論文。但是,論文的引用行為是一個復雜的問題,導致論文獲得高引用次數必然是多因素綜合作用的結果。然而,本研究主要目的是探討基金因素對論文引用行為和使用行為的影響作用。因此,為排除其他因素的干擾,本研究將基金論文篇均引用次數與非基金論文篇均引用次數相除來描述二者之間的引用差異。由“引用次數分析”小節(jié)可知,4個研究領域的基金論文篇均引用次數均是非基金論文篇均引用次數的1.4倍以上,引用差異將深入解釋造成這種現(xiàn)象的原因。結合表4可知,4個研究領域的引用差異全部>1.40,說明基金論文獲得更多引用次數,基金對論文的引用次數有重要影響。然而,不同研究領域的引用差異也不盡相同:社會工作領域的引用次數最易受到基金影響,而特殊教育領域相對不易受到基金因素影響。
表4 不同研究領域的引用差異(CD)和使用差異(UD)
為排除非基金因素對論文使用次數的干擾,本研究將基金論文篇均使用次數與非基金論文篇均使用次數相除來描述二者之間的差異,結果見表4??梢园l(fā)現(xiàn),使用次數的分布規(guī)律與引用次數趨于一致:4個研究領域的使用差異都大于1.20,說明基金論文獲得更多的使用次數,基金對論文的使用次數同樣有重要影響。商業(yè)金融和社會工作領域論文的使用次數較易受到基金的影響,而特殊教育領域受到的影響相對較小。
齊普夫定律和洛卡特定律認為高頻詞匯、高頻作者在某一領域研究中發(fā)揮著不可替代的作用。為進一步分析基金對引用差異和使用差異的影響,本研究分別計算4個研究領域Top 10%高影響力論文的引用差異和使用差異大小。結合表4可知,Top 10%論文與總論文的引用差異和使用差異分布規(guī)律趨于一致:(1)4個研究領域的Top 10%論文引用差異和使用差異全部>1.00,說明基金同樣造成高影響力論文引用次數和使用次數的增加;(2)社會工作領域高影響力論文的引用次數更易受到基金影響,而商業(yè)金融領域高影響力論文的使用次數更易受到基金影響;(3)4個研究領域Top 10%論文引用差異全部大于使用差異,說明科研基金不僅影響論文的使用行為,更重要的是影響論文的引用行為,即科研基金擴大了論文的傳播范圍,也提升了論文的影響力。
總論文和Top 10%高影響力論文的引用差異和使用差異的主要區(qū)別在于,前者計算過程涉及更多論文數量,而后者集中討論小部分高被引用論文。盡管如此,4個研究領域中二者的計算結果卻依然較為相似。因此,本研究認為不同學科特征、論文數量、引用次數與使用次數差異不會對引用差異和使用差異的結果造成偏差。同時也表明,引用差異和使用差異可以用來衡量科研基金、引用次數、使用次數之間的內在關系。
與僅僅代表科研人員對科技文獻的瀏覽、保存次數的使用次數指標不同,引用次數可以揭示科研工作者對論文的實際使用和深層次利用。因此,探討論文使用次數轉化為引用次數的概率非常有意義。
根據轉化率公式,本研究計算了4個學科領域的總論文轉化率、基金論文轉化率和非基金論文轉化率(見表5)。在“引用次數分析”小節(jié)中,我們發(fā)現(xiàn)每篇論文的使用次數大約是引用次數的5到10倍,而通過轉化率分析,可以更準確地了解使用次數與引用次數的轉化比例。結合表5可知,4個研究領域的3種轉化率都在20%以下。社會工作領域以總論文轉化率16.05%處于第一位,即約1/5的使用行為轉化為引用行為;其后依次是商業(yè)金融領域(15.03%)、特殊教育領域(13.26%)、圖書情報領域(10.35%)。值得注意的是,社會工作領域的總體轉化率處在4個領域的第一位,但該領域的其他指標(如使用次數、引用次數)卻處于較低水平。
表5 不同研究領域的轉化率(CP)情況
分析基金論文轉化率和非基金論文轉化率可知,4個研究領域的基金論文轉化率全部高于其他兩種轉化率,總論文轉化率高于非基金論文轉化率。因此,本研究認為科研基金促進了論文使用行為轉化為引用行為的過程。
與引用行為相比,使用行為代表了科研人員對論文的另一種利用方式。本研究將論文使用次數融合到基金論文與非基金論文的影響力差異分析中。結合提出的9個評估指標,本文以WoS數據庫中4個研究領域的2016年論文數據,多維度分析了基金對論文引用行為與使用行為的影響。研究發(fā)現(xiàn):(1)基金論文率方面,特殊教育領域最高,商業(yè)金融領域最低;H指數方面,4個領域的基金H核論文數量占比全部高于總論文和非基金論文;(2)引用維度方面,4個領域的基金論文引用率和篇均引用次數都高于總論文和非基金論文的引用率、篇均引用次數,基金論文獲得更多引用次數;(3)使用維度方面,4個領域的基金論文使用率和篇均使用次數全部高于總論文與非基金論文的使用率、篇均使用次數,基金論文更易被使用;(4)轉化率方面,4個領域的基金論文轉化率全部高于總轉化率和非基金論文轉化率,基金促進了使用行為轉化為引用行為過程。綜上所述,本研究認為基金資助論文更易發(fā)生使用行為與引用行為,但各學科之間存在差異。