——以2009-2016年21位諾貝爾化學獎得主為例"/>
韓佳燕 趙 勇
(1.太原理工大學圖書館 太原 030024; 2. 中國農(nóng)業(yè)大學圖書館情報研究中心 北京 100083)
高層次科技人才的培育、引導和管理是加快建設(shè)創(chuàng)新型國家和世界科技強國面臨的突出和迫切議題之一。當前,我國正處于加速培育諾貝爾獎級成果和人才的關(guān)鍵窗口期[1]。諾貝爾自然科學類獎項是頂級科研成果評價的主要指標,諾貝爾獎得主在科學共同體權(quán)威結(jié)構(gòu)中居于頂尖位置[2],是最具代表性的高層次科技人才,也是國內(nèi)外學界研究的焦點。
管理學、教育學、心理學界主要從職務(wù)頭銜[3]、成長經(jīng)驗[4]、人格特質(zhì)[5]等方面對諾獎得主的成才規(guī)律進行了總結(jié),圖書情報學界更多是基于合作模式[6]、發(fā)文引文等文獻計量指標[7]對諾獎得主的學術(shù)產(chǎn)出表現(xiàn)與獲得諾獎之間的關(guān)聯(lián)進行了探測。也有學者對于諾獎領(lǐng)域中的“學術(shù)鏈”“人才鏈”的現(xiàn)象成因[8-9]、識別方法[10],以及諾獎得主的科研模式和規(guī)律[11-12]進行了研究。然而,目前鮮見有研究聚焦諾獎得主的文獻引用關(guān)系。從引用者出發(fā)來研究被引者,有助于發(fā)現(xiàn)對引用者產(chǎn)生重要影響的作者,從而更好地了解引用者[13]。同時,由于諾貝爾獎在科學和社會中的至高地位,獲得諾貝爾獎可能引發(fā)一系列“諾獎效應(yīng)”[14]。已有研究發(fā)現(xiàn)諾貝爾獎可能導致諾獎得主的生產(chǎn)力、發(fā)文模式、署名順序、合作者、研究方向、學術(shù)影響力[15-16]等方面發(fā)生變化。那么,諾獎得主的文獻引用關(guān)系在獲獎前后是否發(fā)生了變化?這是本文重點研究的問題。
本文以2009-2016年間的21位諾貝爾化學獎得主為例,以每位諾獎得主被Web of Science的核心合集數(shù)據(jù)庫收錄的學術(shù)論文為研究樣本,對引用關(guān)系中的諾貝爾獎效應(yīng)展開定量研究。本文研究的價值在于:通過對比分析獲獎前后諾獎得主的學術(shù)引用行為,揭示高層次科技人才的學術(shù)行為規(guī)律及其背后的機理,可以為相關(guān)管理部門制定科技人才政策提供決策依據(jù),有利于遵循規(guī)律順勢推進學術(shù)研究,引導學術(shù)交流,促進科技創(chuàng)新。
引用關(guān)系由施引者、被引者、施引者對于被引者的學術(shù)引用行為共同構(gòu)成。本文主要立足于諾獎得主的施引角度,分析其在學術(shù)論文中的施引行為以及引用認同群體。在施引行為研究方面,由于獲獎后的發(fā)文時間窗較短,獲獎前后的統(tǒng)計時間窗差異較大,引用次數(shù)缺乏可比意義,因此,本文將主要從引文時滯以及引文軌跡兩方面對獲獎前后諾獎得主的施引行為特征展開分析。
圖1 研究框架
學者的引用行為受到社會網(wǎng)絡(luò)的潛在影響,作者首先會引用其本人熟知作者的文章[17]。作者的聲譽、學術(shù)排名[18]以及科學社會關(guān)系[19]對于學術(shù)引用具有一定的影響。在被引群體研究方面,本文將重點關(guān)注諾獎得主的被引群體的聲譽、學術(shù)水平、以及被引者與諾獎得主之間的科學社會關(guān)系??茖W社會關(guān)系可分為一般交流關(guān)系、合著關(guān)系、同事關(guān)系以及師徒關(guān)系[20]。鑒于數(shù)據(jù)的可獲取性,本文主要關(guān)注同事、合著、師徒三種科學社會關(guān)系。具體研究框架如圖1所示。
2.1數(shù)據(jù)獲取
2.1.1 諾獎得主學術(shù)論文 2019年8月在諾貝爾獎官網(wǎng)獲取2009-2016年21位諾貝爾化學獎得主的全名和獲得諾獎相關(guān)的代表作信息,在Web of Science核心合集數(shù)據(jù)庫中以“諾獎得主代表作→諾獎得主姓名→諾獎得主的文獻集合”的路徑進行檢索,以盡量查全其學術(shù)論文集合。
2.1.2 諾獎得主學術(shù)論文與其參考文獻信息 篩選出21位諾獎得主為第一作者或通訊作者的學術(shù)論文集合并分別導入CRExplorer軟件,以相似度閾值為90%進行參考文獻的合并去重,導出施引文獻與參考文獻一一對應(yīng)的記錄集合。
2.1.3 參考文獻題錄數(shù)據(jù) CRExplorer軟件導出的21位諾獎得主學術(shù)論文中的參考文獻共計46 534篇。由于文獻數(shù)據(jù)規(guī)模較大,考慮到檢索可得性,其中DOI字段為空的參考文獻在本研究中未考慮。篩選出DOI字段不為空的36 707篇參考文獻,以DOI為依據(jù)在WOS核心合集數(shù)據(jù)庫中進行檢索,檢索到30 517篇,將未檢索到的6 190篇參考文獻在Scopus數(shù)據(jù)庫中進行擴檢,檢索得到5 819篇文獻。在WOS核心合集數(shù)據(jù)庫以及Scopus數(shù)據(jù)庫中檢索得到21位諾獎得主的參考文獻共計36 336篇。
2.1.4 參考文獻作者與機構(gòu) 利用中國農(nóng)業(yè)大學圖書館開發(fā)的元數(shù)據(jù)分析工具BibStats以及Excel軟件對參考文獻的題錄數(shù)據(jù)進行分解,得到參考文獻的通訊作者姓名和一級通訊機構(gòu),無通訊作者時取第一作者遞補。
2.1.5 被引學者H指數(shù)與維基百科收錄情況 利用八爪魚數(shù)據(jù)爬取軟件在Web of Science數(shù)據(jù)庫以及Scopus數(shù)據(jù)庫爬取被引學者的全名信息以及H指數(shù)。為保證收集數(shù)據(jù)的準確性,爬取步驟設(shè)定為“文獻→作者→作者詳情頁面→作者全名及H指數(shù)信息”。然后,利用八爪魚數(shù)據(jù)爬取軟件在維基百科官網(wǎng)輸入被引學者全名,爬取檢索結(jié)果的頁面鏈接。
21位諾獎得主參考文獻的檢索信息詳見表1。如表1中的“檢到數(shù)量/CR總量”所示,本文的數(shù)據(jù)樣本占諾獎得主所有參考文獻數(shù)據(jù)的47%以上,絕大部分都在75%以上,因此可以認為基于這些數(shù)據(jù)樣本展開分析是具有代表意義的,得出的分析結(jié)論具有一定的合理性。為保證數(shù)據(jù)表示的清晰可讀性,本文所有圖表利用簡化形式來表示各位諾獎得主的姓名及其獲獎年份,各編碼代表的源數(shù)據(jù)見表2。
表1 2009-2016年諾貝爾化學獎得主學術(shù)論文中的參考文獻檢索情況
表2 2009-2016年各位諾貝爾化學獎得主的編碼含義
2.2數(shù)據(jù)處理
2.2.1 被引學者姓名格式統(tǒng)一化 將來源于WOS核心合集數(shù)據(jù)庫和Scopus數(shù)據(jù)庫的被引學者姓名統(tǒng)一為WOS姓名形式,如將Abo, T.替換為Abo, T。
2.2.2 被引學者特征確定 被引學者特征包括被引學者聲譽(即是否被維基百科收錄)、被引學者學術(shù)水平(即H指數(shù)水平)、被引學者與施引諾獎得主是否具有同事關(guān)系、是否具有合作關(guān)系、是否具有師徒關(guān)系。
諾獎得主與被引學者的同事關(guān)系依據(jù)諾獎得主的發(fā)文機構(gòu)以及被引者的通訊機構(gòu)來判斷。諾獎得主與被引學者的合作關(guān)系以諾獎得主為第一作者或通訊作者的學術(shù)論文作者來判斷。以學術(shù)譜系數(shù)據(jù)庫(https://academictree.org/)中的信息為依據(jù),本文將諾獎得主的直系學生、直系老師以及二代老師看作與諾獎得主具有師徒關(guān)系。
被引學者的學術(shù)水平在本文中用H指數(shù)來衡量。由于H指數(shù)絕對數(shù)值的大小界定尚無一個統(tǒng)一的標準,而三分位數(shù)可以幫助確定分組時組間界限以及分層抽樣時中層的劃分,將數(shù)列三等分為低值、中值、高值三部分[21],因此本文利用三分位數(shù)將被引者的H指數(shù)劃分為上、中、下三個級別。H指數(shù)等級越高,即代表學術(shù)水平越高。各位諾獎得主學術(shù)論文中被引群體的H指數(shù)等級劃分節(jié)點如表3所示,可以發(fā)現(xiàn)各位諾獎得主被引群體的H指數(shù)等級劃分節(jié)點的數(shù)值相差不大,下-中位段H指數(shù)節(jié)點都在20左右,中-上位段H指數(shù)節(jié)點都在40左右。21位諾獎得主中有18位其自身的H指數(shù)處于上位段水平,學術(shù)水平較高,這說明大部分諾獎得主在學術(shù)論文中所引用的學者中有2/3學術(shù)水平低于自己,有1/3的被引學者與諾獎得主自身學術(shù)水平相當;也有少數(shù)諾獎得主的H指數(shù)處于中位段水平,如表3中加粗標注所示。
表3 21位諾貝爾化學獎得主學術(shù)論文中被引學者H指數(shù)的等級劃分情況
被引學者是否被維基百科收錄依據(jù)八爪魚爬取到的被引者姓名的檢索結(jié)果鏈接來判斷,維基百科收錄與否的檢索結(jié)果鏈接不同,檢索結(jié)果鏈接前綴為https://en.wikipedia.org/w/index.php?search=的標注為維基百科未收錄,檢索結(jié)果鏈接前綴為https://en.wikipedia.org/wiki/的標注為維基百科收錄,默認維基百科收錄者的聲譽較高。
2.2.3 施引行為特征確定 施引行為特征包括引文時滯和引文軌跡。CRExplorer軟件可導出施引文獻出版年(PY)、被引文獻出版年(RPY)、施引文獻對于被引文獻的施引軌跡類型(TYPE)等字段。引文時滯為首個施引文獻出版年(PY)減去被引文獻出版年(RPY)的差值。引文軌跡指一篇文獻發(fā)表后的被引次數(shù)隨時間變化的曲線[22]。2018年2月發(fā)行的1.8.2版本的CRExplorer軟件支持揭示參考文獻在導入的施引文獻集合中的引文軌跡,并根據(jù)引文軌跡來對參考文獻的類型進行標識,用(TYPE)字段表示。各類特征數(shù)據(jù)的處理過程總結(jié)如表4所示。
2.2.4 獲獎前后數(shù)據(jù)劃分 以諾獎得主獲得諾貝爾獎當年為分界點,按照諾獎得主學術(shù)論文的出版年份,對諾獎得主在獲獎前(包含諾獎年)和獲獎后所發(fā)表的學術(shù)論文進行劃分,得到獲獎前和獲獎后的被引學者特征數(shù)據(jù)以及施引行為特征數(shù)據(jù)。
表4 各類特征數(shù)據(jù)的處理過程概要
3.1被引群體與諾獎效應(yīng)
3.1.1 自引率升高 2009-2016年21位諾貝爾化學獎得主在獲獎前后作為第一作者或通訊作者的學術(shù)論文發(fā)文情況及自引率如表5所示。21位諾獎得主中有4位在獲獎后無第一作者或通訊作者發(fā)文情況,這可能是與年齡、諾獎效應(yīng)等因素存在一定的關(guān)系。隨著年齡增長,科學家的生產(chǎn)力一般呈下降趨勢,獲獎后科研外的社會性活動增加也可能導致科學生產(chǎn)力下降。其余17位獲獎后有論文發(fā)表的諾獎得主,除2009年的Ada E. Yonath外,16位諾獎得主獲獎后的自引率都不同程度地高于獲獎前。另外,根據(jù)自引率一般分布在10%~36%的范圍內(nèi)[23],自然科學和醫(yī)學領(lǐng)域的自引率一般在20%左右的研究結(jié)論[24],本研究中獲獎前后的自引率都明顯偏低,這可能是因為本文的研究樣本僅限于學術(shù)論文類型的文獻,且自引率僅按通訊作者為本人來計算而造成的。
表5 21位諾貝爾化學獎得主獲獎前后的發(fā)文量及自引率
續(xù)表5 21位諾貝爾化學獎得主獲獎前后的發(fā)文量及自引率
3.1.2 受科學社會關(guān)系和作者聲譽影響更大 在17位獲獎后有論文發(fā)表的諾獎得主中,大多數(shù)諾獎得主獲獎后在學術(shù)論文中引用來自具有科學社會關(guān)系和聲譽較高的學者的文獻的比例增加,僅有2009年的諾獎得主Ada E. Yonath在獲獎后引用四種關(guān)系型參考文獻的比例降低(見圖2)。
圖2 獲獎前后諾獎得主學術(shù)論文中參考文獻的科學社會關(guān)系占比(%)
此外,圖2中合作占比、同事占比、師徒占比、維基收錄占比中,實線圍成的形狀均與虛線圍成的形狀類似,這表明大多數(shù)諾獎得主在獲獎前后的學術(shù)引用風格相似。如圖3所示,大多數(shù)諾獎得主獲獎后在學術(shù)論文中的關(guān)系型被引學者占比增加,只有2015年的諾獎得主Tomas Lindahl在獲獎前引用具有合作關(guān)系和同事關(guān)系的學者較少,但在獲獎后引用這兩種科學社會關(guān)系類型學者論文的比例大幅增加。另外,對比圖2和圖3,獲獎前后諾獎得主在學術(shù)論文中參考文獻的科學社會關(guān)系占比均大于被引學者的科學社會關(guān)系占比,這說明不論獲獎前后,諾獎得主都傾向于引用具有科學社會關(guān)系或聲譽較高的學者的多篇文獻。
圖3 獲獎前后諾獎得主學術(shù)論文中的被引學者的科學社會關(guān)系占比(%)
3.1.3 更注重作者學術(shù)水平 根據(jù)諾獎得主獲獎前后學術(shù)論文中獲獎前后被引學者的H指數(shù)分析,從被引學者層面統(tǒng)計,如表6所示,獲獎前,諾獎得主引用下位段H指數(shù)的學者最多,僅有2012年的諾獎得主Brian K. Kobilka引用上位段H指數(shù)的學者最多。獲獎后,諾獎得主在學術(shù)論文中引用的上位段H指數(shù)學者占比最大,而2012年的諾獎得主Brian K. Kobilka在獲獎后引用上位段H指數(shù)學者的比例較低。2015年的諾獎得主Tomas Lindahl自身的H指數(shù)較低,他在獲獎前較為均衡地引用了各等級H指數(shù)的學者,在獲獎后對于下位段以及上位段H指數(shù)的學者引用比例較小,對于中位段H指數(shù)學者引用較多。另外,可以發(fā)現(xiàn),諾獎得主在獲獎后所引用學者的H指數(shù)平均值一般大于在獲獎前引用學者的H指數(shù)平均值。這說明在獲獎后,諾獎得主更關(guān)注學術(shù)水平較高的作者。
從參考文獻的層面來統(tǒng)計,如表7所示,不論獲獎前后,諾獎得主在學術(shù)論文中引用上位段H指數(shù)學者所著文獻的比例最大,且按參考文獻計算的平均H指數(shù)值均大于按被引學者計算的平均H指數(shù)值,這說明諾獎得主在獲獎前后均傾向于引用較高學術(shù)水平學者的更多篇文獻。值得說明的是,表6和表7都顯示2015年的諾獎得主Tomas Lindahl在獲獎后引用上位段H指數(shù)學者較少,結(jié)合表5可知Tomas Lindahl在獲獎后僅有一篇作為第一作者或通訊作者的學術(shù)論文,這可能由于樣本量太小而導致結(jié)論的偏差。
表6 獲獎前后被引學者的H指數(shù)(以被引學者統(tǒng)計)
表7 獲獎前后被引學者的H指數(shù)(以參考文獻統(tǒng)計)
3.2施引行為與諾獎效應(yīng)
3.2.1 引文時滯變長 引文時滯指論文發(fā)表時間與其引文發(fā)表時間之差,用來表示引文的新舊[25]。如表8所示,獲獎前后諾獎得主學術(shù)論文中的引文時滯分布都呈右偏分布,即在獲獎前后諾獎得主都以引用近期的文獻為主,這符合引文時滯的一般分布規(guī)律[25]。從引文時滯的平均值和中位值來看,大多諾獎得主在獲獎后的引文時滯略大于獲獎前,這可能是由于在獲得諾貝爾獎后,諾獎得主除科研之外的社會活動增加,如訪談、講座、政策決策和公共服務(wù)活動等。這些活動占據(jù)了諾獎得主原來的部分科研時間,可能使得諾獎得主與其他學者的科學交流變少,對于其他學者的科研成果的響應(yīng)時間變長。從引文時滯的最大值和最小值來看,獲獎前后未表現(xiàn)出明顯差異。
3.2.2 熱點施引減少 通常一篇論文在發(fā)表后的幾年時間內(nèi)會被其他論文引用,逐漸達到被引次數(shù)的高峰,之后被引次數(shù)慢慢減少,直到被人遺忘,這樣的引文軌跡稱為經(jīng)典引文軌跡[26]。還有一些引文軌跡比較特殊,如“睡美人”文獻[27]、“曇花一現(xiàn)”型文獻[28]等。同樣,根據(jù)參考文獻在特定施引文獻集合內(nèi)的引文軌跡,CRExplorer軟件將每篇參考文獻歸為睡美人文獻、持續(xù)被引文獻、熱點文獻或生命周期文獻。CRExplorer對于各類文獻的定義以及具體判定標準[29]見表9。
表8 獲獎前后諾貝爾化學獎得主的引文時滯對比
表9 CRExplorer中的特定引文軌跡類型文獻說明
表10 諾獎得主獲獎前后學術(shù)論文中的參考文獻的特殊引文軌跡類型占比
17位諾獎得主獲獎前后學術(shù)論文中的參考文獻的引文軌跡類型如表10所示。值得說明的是,在分析過程中,筆者發(fā)現(xiàn)CRExplorer確定持續(xù)被引文獻時存在不足之處,部分識別出的文獻不符合“持續(xù)被引文獻”的內(nèi)涵,根據(jù)“持續(xù)被引文獻”定義(見表9),若某位諾獎得主于同年引用了3篇同出版年的文章,且只引用了這一次,那么這3篇參考文獻均會被識別為“持續(xù)被引文獻”,而這種只被引用了一次的文獻實際上與在多個年份中均被引用的“持續(xù)被引文獻”是存在根本區(qū)別的,并不屬于特殊的引文軌跡類型。因此,本文人工判別并刪除了這些不滿足“持續(xù)被引”內(nèi)涵的文獻。
由表10可知,獲獎前熱點類型的參考文獻占比普遍比獲獎后比例更高,這與在獲得諾貝爾獎后,咨詢、講座等活動增加,諾獎得主分配給科研活動的時間和精力變少存在一定關(guān)系。其研究主題不再頻繁地更新變化,因此對于新興文獻在集中于其發(fā)表后三年內(nèi)的“曇花一現(xiàn)型”引用減少。此外,獲獎后諾獎得主學術(shù)論文中特殊引文軌跡類型的參考文獻占比增多,這主要是因為諾獎得主在獲獎后發(fā)文量較少,獲獎后的參考文獻總量也較少,而許多特殊引文軌跡類型的參考文獻是在獲獎前后均被引用的,因此獲獎后的特殊引文軌跡類型的參考文獻占比會表現(xiàn)為更多。
本文對諾獎得主獲獎前后學術(shù)論文中的被引群體特征以及其施引行為特征進行了對比分析,發(fā)現(xiàn)引用關(guān)系中表現(xiàn)出一定的諾獎效應(yīng)。在獲得諾貝爾獎之后,諾貝爾化學獎得主在學術(shù)論文中的自引率變高,引用認同學者中同事、合著者、師徒、聲譽較高作者、高學術(shù)水平作者的占比增大。從施引行為特征來看,獲獎后諾獎得主對于文獻的響應(yīng)速度變慢,“曇花一現(xiàn)型”的熱點引用減少。但不論獲獎前后,諾獎得主都更傾向于多次引用來自具有科學社會關(guān)系、聲譽較大、學術(shù)水平較高學者的文獻。
本文研究結(jié)論對高層次科技人才管理和引導具有一定的啟示。一要重視“科學社區(qū)”對于學術(shù)行為的影響。同事、師徒、合作等科學社會關(guān)系有利于促進學術(shù)交流,應(yīng)關(guān)注科學家之間的科學社會關(guān)系,推進構(gòu)建學術(shù)譜系數(shù)據(jù)庫。高層次科技人才可作為自己所在科學社會網(wǎng)絡(luò)中的代表人物,被推舉為科學社區(qū)的“區(qū)長”,通過促進科學社區(qū)代表間的交流,高效促進學術(shù)成果共享和科學發(fā)展。二要善于發(fā)揮高層次科技人才的引領(lǐng)作用。當前,文獻數(shù)據(jù)庫已經(jīng)可以通過引用關(guān)系來識別研究熱點[30],可以滿足追蹤熱點研究的需要,而從業(yè)多年的高層次科技人才則在引領(lǐng)研究發(fā)展方面可以發(fā)揮巨大作用,他們往往具有豐富的經(jīng)驗和獨到的眼光,更有可能引領(lǐng)未來的發(fā)展前沿方向,做出一些前瞻性研究,可以積極鼓勵和引導有志的青年學者加入,做好潛力人才儲備。