■康旭東 徐慶富 張春博
1)大連理工大學技術研究開發(fā)院,遼寧省大連市甘井子區(qū)凌工路2號 1160242)大連理工大學科學學與科技管理研究所,遼寧省大連市甘井子區(qū)凌工路2號 116024
繼承性、發(fā)展性和積累性是科學活動最基本的性質(zhì),幾乎所有的科研成果都是對前人工作的繼承和拓展[1]。這就決定了參閱和引用別人的文獻,借助和吸收已有的研究成果是科學家的基本行為、科學知識生產(chǎn)的基本過程和科學研究活動的基本特征,因此在文末著錄參考和引用的文獻已經(jīng)成為學術界的基本規(guī)范。參考文獻具有重要意義:對于科學學科而言,文章之間的引證關系體現(xiàn)了科學主題縱向上知識的繼承與發(fā)展和橫向上學科間的差異與聯(lián)系;對于科研人員而言,引用前人文獻可以為自己論文提供有說服力的證據(jù),并通過引證關系將自己嵌入科學知識網(wǎng)絡;對于科學研究成果而言,作為其他文章的參考文獻,體現(xiàn)了科學研究成果的價值,而引用其他參考文獻,則是通過吸收有價值的知識來提升自身價值。因此參考文獻是論文價值的重要影響因素,是科學研究的知識基礎。
論文的被引頻次可看作是對論文學術價值和影響力的測度[2]。雖然被引頻次存在引用動機復雜和時滯性等問題,并且近些年受到新興替代計量學的挑戰(zhàn),但是鑒于指標的客觀性和易獲取性等,被引頻次依然是學術界最常用的論文質(zhì)量測度指標。閱讀、梳理和總結高質(zhì)量的參考文獻是科學研究的基礎性工作,并影響論文的價值,那前人的研究成果在多大程度上影響后來者的研究?更確切地說,參考文獻的各個指標與論文被引頻次之間是否存在相關關系?假如參考文獻影響論文的被引頻次,那么不同的期刊載體之間,這種影響是否存在差異性?以上問題正是本文的研究內(nèi)容。
在已有的研究成果中,相關的參考文獻指標主要包括參考文獻的數(shù)量、質(zhì)量、時間,以及跨學科性等。
在數(shù)量方面,簡琳等[3]分析了6個學科的455篇論文被引的文本因素,發(fā)現(xiàn)參考文獻數(shù)量對英文文獻的被引存在顯著影響;姜磊等[4]以《期刊引證報告》(JournalCitationReports,JCR)中3個學科的論文為數(shù)據(jù)來源,研究了參考文獻數(shù)量對論文被引頻次的影響,發(fā)現(xiàn)兩者之間的相關關系并不顯著;王海濤等[5]則對JCR中2013年影響因子排名前20的經(jīng)濟類期刊在2011—2014年發(fā)表的論文進行回歸模型分析,發(fā)現(xiàn)參考文獻數(shù)量對論文被引頻次具有顯著影響。目前,對參考文獻數(shù)量與論文被引頻次之間是否存在相關關系的結論并不一致,支持兩者存在相關關系的學者認為,參考文獻數(shù)量越多,說明作者可能經(jīng)過廣泛的資料收集和前期調(diào)研,有利于提升科研成果的質(zhì)量;而反對者則認為參考文獻的數(shù)量與期刊的要求相關,是可操控的,并且有些相關的參考文獻并沒有被全部列出,兩者存在的相關關系不合乎常理。基于此,提出假設H1:參考文獻的數(shù)量與論文的被引頻次呈正相關關系。
在質(zhì)量方面,目前的研究大多選用參考文獻的被引頻次來表征參考文獻的質(zhì)量。比如Didegah等[6]選取基本科學指標(Essential Science Indicators,ESI)數(shù)據(jù)庫中3個學科2000—2009年刊載的論文為研究對象,發(fā)現(xiàn)參考文獻的篇均被引頻次與論文被引頻次之間存在顯著的相關關系;而Bornmann等[7]借助百分位指標,分析了生命科學等4個學科的1年發(fā)文數(shù)據(jù),驗證了牛頓假說,即高被引論文也更傾向于引用被引頻次較高的參考文獻。一般來說,參考文獻的質(zhì)量越高,說明該項研究建立在較高質(zhì)量的前人研究成果之上,正所謂“站在巨人的肩膀上”,科研的基礎較好,因而有可能產(chǎn)出高質(zhì)量論文?;诖?,提出假設H2:參考文獻的質(zhì)量與論文的被引頻次呈正相關關系。
在引用時間方面,早在20世紀60年代,Price[8]指出不同學科引用文獻的新舊程度不一樣,并且提出“普賴斯指數(shù)”這一指標,作為劃分科學“軟硬程度”的標準。隨著文獻年齡的增長,除特別經(jīng)典的文獻以外,大多數(shù)文獻的研究主題、技術方法、成果結論等都變得陳舊過時,逐漸失去利用的價值,因此建立在這些陳舊文獻基礎上的研究成果的質(zhì)量可能也不高,導致論文的被引頻次偏低。Peters等[9]和Onodera等[10]的研究結果均表明,表征參考文獻新舊程度的一些指標,比如普賴斯指數(shù)、引用半衰期等,與被引頻次之間存在明顯的相關關系,并且參考文獻越老,論文的被引頻次越低?;诖耍岢黾僭OH3:參考文獻越新,論文的被引頻次越高。
現(xiàn)在的科學研究正邁入大科學時代,學科間的相互交叉和滲透成為發(fā)展趨勢。一篇論文的跨學科程度可以用論文引用的參考文獻的跨學科程度來衡量。有關跨學科性、學科交叉的研究一直是文獻計量學領域的熱點,比如Porter等[11]從文獻施引的角度研究了過去30年間跨學科程度的變化,發(fā)現(xiàn)跨學科引用的比率一直在增加。那么,論文參考文獻的跨學科程度與其被引頻次之間是否存在相關關系?Lariviere等[12]以Web of Science(WoS)數(shù)據(jù)庫2000年收錄的論文為數(shù)據(jù)來源,采用ESI劃分學科的標準來研究論文參考文獻的跨學科程度與其被引頻次之間的關系,研究結果表明,參考文獻的跨學科水平與論文被引頻次之間的關系因?qū)W科而異,但是所有的學科都有一個共同特點,那些單一學科和高度跨學科的論文的被引頻次都不高。基于此,提出假設H4:參考文獻的跨學科程度越高,論文的被引頻次越高。
此外,Didegah等[13]基于參考文獻所在期刊的發(fā)行國家集中度測量了參考文獻的國際化程度,但筆者認為該指標過于間接,并不能有效表征參考文獻的國際化程度,而且國際合作使得單篇參考文獻的國際度衡量標準存在爭議,所以本研究沒有采取該指標。Glanzel等[14]考察了參考文獻中專利文獻等對論文被引頻次的影響,考慮到多數(shù)學科領域的論文引用專利并非普遍現(xiàn)象,所以本研究也沒考慮該指標。
絕大多數(shù)論文被引頻次影響因素的研究都是對某一個或者多個學科的多種期刊的論文進行統(tǒng)一的統(tǒng)計分析或者建立一個回歸模型等,但這種做法并不合理,因為發(fā)表在不同期刊上的論文存在多方面的差異。(1)雖然外在因素可能影響論文的被引頻次,但是被引頻次是由論文的內(nèi)在質(zhì)量決定。而不同等級的期刊對論文的質(zhì)量要求不同,發(fā)表在高等級期刊上的論文往往要經(jīng)過更加嚴格的同行評議,論文的質(zhì)量和創(chuàng)新性等能夠得到保證,同時為了擴大論文影響力和增大論文的可見度,作者會將高質(zhì)量論文投向受關注程度高、聲譽好的高等級期刊,因此高等級期刊集中了絕大部分高質(zhì)量論文,這就決定了不同等級期刊上的論文被引頻次可能存在“先天”差異,只有控制期刊這一變量,才能在一定程度上控制論文質(zhì)量這一最重要但是難以測度的因素。(2)不同期刊的排版和印刷方式不同,論文篇幅等指標則存在比較大的差異。要想研究各個因素對論文被引頻次的影響,則需要控制期刊這一變量,將期刊作為研究的最小單元來比較同一期刊內(nèi)的論文,而非大多數(shù)研究采用的學科單元。
綜合以上文獻可以看出,目前學術界對于參考文獻各個指標與論文被引頻次之間是否存在相關關系的研究結論并不相同,并且大多數(shù)研究都是以學科為單位,需要對此進一步驗證,進行以期刊為單位的多期刊間的對比研究;另外,國內(nèi)外大多數(shù)文獻只分析和參考文獻相關的一兩個指標,鮮有大數(shù)據(jù)量、系統(tǒng)地研究參考文獻各個指標與論文被引頻次之間的關系,因此本研究具有一定參考意義。
選擇合理的數(shù)據(jù)樣本是研究的重要基礎。本研究的所有數(shù)據(jù)來源于WoS數(shù)據(jù)庫,采用Onodera等[10]遴選學科的標準。Onodera等[10]選擇了JCR中的6個學科,鑒于指標的易獲取性以及數(shù)據(jù)處理的復雜性,本研究選擇凝聚態(tài)物理(Condensed Matter Physics)這一學科。
期刊的選擇標準是期刊應當僅屬于JCR中的1個學科,這是由2個原因決定的:(1)期刊所屬的學科范圍不同(1種期刊可能屬于多個學科)也會影響論文的被引頻次[15];(2)若1種期刊屬于多個學科,不方便計算跨學科性。此外,應當選擇發(fā)表論文數(shù)量比較大的期刊,以便建立回歸模型。Onodera等[10]只選擇了每個學科的4種代表性期刊,為了更好地進行期刊間的對比,本研究擴大了研究范圍,將凝聚態(tài)物理學科內(nèi)符合上述標準的期刊都挑選出來作為研究對象。
在時間的選定上,既應該離現(xiàn)在“充分遠”,使論文被引頻次達到比較穩(wěn)定的狀態(tài),也應該離現(xiàn)在“足夠近”,以保證研究結論的時效性[13],因此選擇學科內(nèi)各期刊的被引頻次基本達到峰值的年份。當然,各期刊的被引頻次達到峰值所需的時間有所不同,高影響因子的期刊要比低影響因子的期刊更晚達到引文峰值,因而只能選取各期刊間相對平衡的年份。
根據(jù)以上原則,本研究遴選2013年WoS數(shù)據(jù)庫中凝聚態(tài)物理學科下的12種期刊刊載的研究論文(Article),相關信息如表1所示,下載時間為2017年3月31日。
2.2.1因變量
本研究的因變量是論文的被引頻次,論文被引頻次是表征論文質(zhì)量的指標。雖然被引頻次并不能完全反映論文質(zhì)量,但是這一指標相對而言比較客觀、公正,并且易于獲得,仍是當前最普遍的論文質(zhì)量測度指標。每篇論文的被引頻次可以直接在WoS中獲取。
表1 12種期刊的名稱、研究論文數(shù)量以及當年JCR分區(qū)
2.2.2自變量
(1) 參考文獻的數(shù)量指標。每篇論文的參考文獻數(shù)量可以通過WoS數(shù)據(jù)庫直接獲得。
(2) 參考文獻的質(zhì)量指標。已有文獻采用的指標大多是參考文獻的平均被引頻次,但是平均被引頻次極易受到某些極值的影響,并不能真正反映參考文獻的被引頻次分布情況,因此本研究選用篇均參考文獻被引頻次的中值來表征參考文獻的質(zhì)量。利用自編程序采集每篇參考文獻的被引頻次,數(shù)據(jù)量非常龐大,8847篇論文樣本引用的參考文獻有數(shù)十萬篇。參考文獻的被引頻次理論上應當在施引論文的具體引用時間采集(論文的發(fā)表時間,甚至是撰寫時間),但是鑒于易獲取性,參考文獻被引頻次的統(tǒng)計時間截至本研究的數(shù)據(jù)采集時間。
(3) 參考文獻的時間指標。常用來衡量參考文獻新舊程度的指標包括參考文獻的引用半衰期和普賴斯指數(shù)等。參考文獻的引用半衰期是指較新的那一半?yún)⒖嘉墨I距論文發(fā)表時的時間,普賴斯指數(shù)是指最近5年的參考文獻所占的比例,這2個指標可以通過Excel和Bibexcel軟件提取。本研究采用普賴斯指數(shù)作為衡量指標。
(4) 參考文獻的跨學科性指標。采用JCR的學科分類來研究參考文獻的跨學科性,首先從參考文獻中提取所在的期刊,再根據(jù)JCR中期刊的學科分類確定該參考文獻所屬的學科,并對其中有更名、分裂或者合并的期刊做出相應處理。需要說明的是:①在JCR中,一種期刊可能屬于n(n≥1)個學科,為了避免引用學科數(shù)量膨脹,統(tǒng)計學科數(shù)量時,每個學科都獲得1/n的權重,以保證引用學科數(shù)量與參考文獻數(shù)量相等[16];②參考文獻中有部分文獻未被WoS數(shù)據(jù)庫收錄,例如圖書、專利、網(wǎng)絡文獻、會議論文和除科學引文索引(Science Citation Index, SCI)、社會科學引文索引(Social Science Citation Index, SSCI)、藝術與人文索引( Arts & Humanities Citation Index, A&HCI)收錄期刊以外的論文等,按照Porter等[17]的建議,測度“跨學科性”時這部分數(shù)據(jù)不列入統(tǒng)計范圍。
跨學科引證指數(shù)是研究論文跨學科性常用的指標[16],該指標將參考文獻分為隸屬本學科和隸屬其他學科2類,引用其他學科論文的數(shù)量占總引用量的比例即為跨學科引證指數(shù)。但是該指數(shù)無法區(qū)分所涉及的其他學科數(shù)目的多寡,無法衡量學科交叉的廣度以及被引頻次在各個學科中分布的均勻性。為彌補跨學科引證指數(shù)的不足,采用香農(nóng)(Shannon)指數(shù)[18]來表征論文的跨學科性,計算公式為
(1)
式中:fShannon為香農(nóng)指數(shù);Pi為參考文獻所隸屬的學科數(shù)量i占所有學科總數(shù)N的比例,數(shù)值越大說明跨學科性越高,所有的Pi值之和為1。
2.2.3控制變量
許多研究證明,除參考文獻以外,其他一些因素也有可能影響論文的被引頻次[13-14]。為了盡可能排除這些因素對本研究的影響,選取了一系列控制變量,包括作者數(shù)量、機構數(shù)量、國家數(shù)量、論文篇幅以及有無基金資助等,其中有無基金資助是引入的虛擬變量。此外作者的科研能力也是影響論文質(zhì)量的重要因素,但是由于本研究的論文樣本數(shù)量太大,和作者科研能力相關的指標,例如作者的h指數(shù)、已發(fā)表論文數(shù)量、總被引頻次等極難采集,因此只能放棄這部分數(shù)據(jù)。
研究的因變量——論文的被引頻次——為非負整數(shù),屬于典型的離散型數(shù)據(jù)。對于這類數(shù)據(jù)進行一般的線性回歸可能產(chǎn)生有偏和無效的系數(shù),通常采用計數(shù)模型來避免這些問題。典型的計數(shù)模型包括泊松回歸模型和負二項回歸模型,泊松回歸模型要求因變量的均值與方差相等,當方差明顯大于均值,即存在“過度分散”的現(xiàn)象時,考慮使用負二項回歸模型。此外,當數(shù)據(jù)中含有大量0值時,考慮使用零膨脹泊松回歸模型或零膨脹負二項回歸模型。
在分析各期刊的論文數(shù)據(jù)之前,首先從期刊這一層面研究了期刊等級與期刊內(nèi)論文的參考文獻各個指標之間的關系。圖1所示為各期刊的篇均參考文獻數(shù)量、篇均參考文獻的普賴斯指數(shù)、香農(nóng)指數(shù)和被引頻次中值,橫坐標與表1中期刊序號相對應,體現(xiàn)期刊是按照影響因子從大到小的排序。
由圖1可知,參考文獻的4個指標與期刊等級之間并不存在十分顯著的相關關系,但是隨著期刊影響因子和JCR分區(qū)的降低,篇均參考文獻數(shù)量、篇均參考文獻被引頻次中值以及篇均普賴斯指數(shù)這3個指標大體上呈現(xiàn)遞減趨勢。
PhysicalReviewB是凝聚態(tài)物理學科的著名期刊,JCR分區(qū)一直處在Q1區(qū),在該研究領域內(nèi)影響力較大,并且該期刊的發(fā)文數(shù)量較大,可以為本研究的模型提供充足的數(shù)據(jù)樣本。下面以PhysicalReviewB2013年刊載的4774篇研究論文為例,詳細說明實證分析過程。
3.2.1描述性統(tǒng)計與相關系數(shù)
表2所示為所有變量的描述性統(tǒng)計和相關系數(shù)。由表2可知,各個變量之間并不存在嚴格意義上的多重共線性;在實證分析的過程中,進一步檢測了方差膨脹因子(Variance Inflation Factor, VIF),發(fā)現(xiàn)最大的VIF不超過3,說明多重共線性在本研究中不顯著,可以將其納入同一回歸模型進行實證檢驗。此外,論文被引頻次的方差明顯大于均值,因此需要采用負二項回歸模型。
3.2.2模型結果分析
表3所示為模型回歸分析的結果。模型1為基礎回歸模型,顯示的僅為控制變量對論文被引頻次的影響,模型2~5分別為加入了與參考文獻有關的4個自變量,模型6則納入了所有自變量。
圖1 12種期刊參考文獻的指標。(a)篇均參考文獻數(shù)量;(b)篇均普賴斯指數(shù);(c)篇均香農(nóng)指數(shù);(d)篇均參考文獻被引頻次中值
表2 描述性統(tǒng)計和相關系數(shù)
注:①虛擬變量未列入表中;②***、**、*分別表示在1%、5%、10%的水平下通過顯著性檢驗,下同。
表3 模型估計結果
注:括號內(nèi)數(shù)值為標準誤差。
從模型1的估計結果可以看出,作者數(shù)量和論文篇幅對被引頻次有顯著的正影響,其余控制變量與被引頻次之間的關系均不顯著。從理論角度分析,作者數(shù)量越多,說明論文越集思廣益,可以為科研項目提供更豐富的研究思想、方法和資源;作者數(shù)量較多也有助于擴大論文的影響力,增加論文被引用的可能性。而論文篇幅越長,說明問題可能被討論得越充分,論文含有的信息量越多。這2個變量與被引頻次之間存在正相關關系具有其合理性,但是如果需要進一步確認,還需要更多模型間的對比分析。
從模型2~6的估計結果可以看出,和參考文獻相關的4個指標均與論文的被引頻次存在正相關關系,并且都在1%的水平上通過顯著性檢驗,即參考文獻的數(shù)量越多、篇均被引頻次的中值越高、普賴斯指數(shù)和香農(nóng)指數(shù)越大時,論文的被引頻次就越高。特別是普賴斯指數(shù)和香農(nóng)指數(shù)這2個指標,其相應的回歸系數(shù)分別為2.1173和1.0531,影響作用非常大。各個模型的結果均充分支持了原假設H1~H4。
只對PhysicalReviewB進行回歸分析并不能得到完整的結論,需要對其余11種期刊逐一進行回歸分析。鑒于論文篇幅,這一系列過程不再一一列出,表4所示為各個回歸模型的簡略結果。
表4 12種期刊回歸模型的簡略結果
注:①+++、++、+分別表示在1%、5%、10%的顯著性水平下通過檢驗,并且系數(shù)符號為正;②---、--、-分別表示在1%、5%、10%的顯著性水平下通過檢驗,并且系數(shù)符號為負;③空白表示未通過顯著性檢驗。
由表4可知,和參考文獻相關的4個指標與論文被引頻次之間的關系基本上可以分為3種類型。
(1) 表征參考文獻新舊程度的普賴斯指數(shù),在12種選定期刊中都對被引頻次呈現(xiàn)出正影響,并且基本都在1%的顯著性水平下通過檢驗,即最近5年的參考文獻所占的比例越高,論文的被引頻次就越高,這也與假設H3相符。參考文獻越新,論文被引頻次越高,這可能是因為:①新文獻在研究技術、方法以及結論等方面都比較新穎,有利于產(chǎn)出高質(zhì)量的研究成果;②新文獻所研究的內(nèi)容是新興的熱門領域或者新的學科增長點,其成果極容易受到學界關注,這也有可能促使論文的被引頻次增加。
(2) 參考文獻的數(shù)量和表征參考文獻跨學科性的香農(nóng)指數(shù)在大多數(shù)期刊中都與被引頻次有顯著的正相關關系,即參考文獻的數(shù)量越多、跨學科性越高時,論文的被引頻次就越高,基本符合假設H1和H4。根據(jù)Haslam等[19]的分析,參考文獻的數(shù)量越多,論文被引頻次越高,這可能是因為:①作者對研究課題做了廣泛而深入的前期了解和準備,因而提高了科研質(zhì)量;②該領域是一個成熟廣泛、或者眾多科研工作者正在研究的熱點領域,因此論文所涉及的研究成果容易受到其他研究人員的關注及引用;③參考文獻數(shù)量越多,反映出該研究的綜合性越強,先前的眾多研究成果在這里匯總。而參考文獻的跨學科性越高,論文的被引頻次越高,一方面可能是因為學科間的交叉融合更容易產(chǎn)生較高質(zhì)量的成果,另一方面也有可能是因為跨學科的研究容易吸引多個學科的研究人員的關注,論文的可見度增加,因而被引用的可能性也得到顯著提高。
(3) 表征參考文獻質(zhì)量的被引頻次中值與論文被引頻次之間的相關關系并不明顯。在多數(shù)期刊中,參考文獻被引頻次的中值與論文被引頻次之間不存在相關關系,即使在有相關關系的期刊中,這種關系的方向性也并不一致,該結論與假設H2并不相符。當然這一結論并不是否定引用前人高質(zhì)量論文的重要性,只是說從整個“大科學”層面,前人的研究成果很有可能會影響后來者的研究質(zhì)量,但是從單篇論文角度分析,前人的高質(zhì)量論文并不會過多影響施引論文的質(zhì)量。當然,這是基于本研究的數(shù)據(jù)而言,高影響力科研成就到底如牛頓所說的“站在巨人肩膀上”,還是像奧爾特加所說的“更多地由科學大眾推動”,還需要更大范圍數(shù)據(jù)的檢驗。
研究結果表明,在對期刊影響因子進行人為控制(即選擇同一期刊內(nèi)的論文比較)的前提下,在2013年凝聚態(tài)物理學科領域12種專業(yè)期刊的8847篇研究論文的4個參考文獻指標中,12種期刊的普賴斯指數(shù)都與論文被引頻次存在顯著正向相關關系,大部分期刊的參考文獻數(shù)量和香農(nóng)指數(shù)則與論文的被引頻次存在顯著的正相關關系,而篇均參考文獻的被引頻次中值則與論文被引頻次之間不存在顯著的相關關系。
本研究結論對于科研工作者開展科研活動、撰寫學術論文等也具有一定的參考意義:(1)在研究之前,要充分和廣泛地收集已有資料,認真閱讀前人文獻,從中總結出有用的結論、方法等,進而制定合理的科研計劃和科研目標,爭取產(chǎn)出高質(zhì)量的科研成果;(2)要主動出擊,及時地關注和跟蹤當前科技前沿,了解科技熱點,學習并且使用最新的技術方法,找準科研“處女地”;(3)要注重學科融合和交叉,打破學科界限,多與其他學科領域的研究人員交流,注重其他學科領域研究方法、技術、結論等在本領域的應用。
當然,本研究依然存在需要擴展的地方:(1)鑒于某些指標獲取和處理的復雜程度,所選的學科只有凝聚態(tài)物理,后續(xù)需要改進數(shù)據(jù)采集和處理的方法,研究更大的樣本,獲得更為普遍的結論;(2)參考文獻與論文被引頻次之間的理論關系和具體機制上的探討需要進一步挖掘。通過較大樣本的回歸模型,驗證了參考文獻的某些指標與論文被引頻次確實相關的結論;然而這種相關和影響機理需要深入探討,不但可以深化二者關系的理論認識,也為更深入的計量實證(例如突破傳統(tǒng)的引文著錄分析,進入全文層面的引用內(nèi)容分析,進而進行微觀知識引用和創(chuàng)新研究)提供參考。
致謝感謝遼寧重大裝備制造協(xié)同創(chuàng)新中心在本研究數(shù)據(jù)來源方面提供的支持。
作者貢獻聲明:
康旭東:完善研究設計,撰寫論文;
徐慶富:獲取與分析數(shù)據(jù),參與論文的撰寫與修訂;
張春博:提出研究設計,修改論文。