朱世琴 范丹丹 茍文靜
(華東理工大學科技信息研究所,上海 200237)
科學技術(shù)的每一個學科都會或多或少、或遠或近地與其他任何一個學科相關(guān)聯(lián)[1]。學科間通過引文知識擴散,并不斷借鑒其他學科有益的理論和方法,逐漸交叉滲透與融合,從而達到知識創(chuàng)新、科學發(fā)展的目的。知識擴散反映了知識的傳遞、繼承、應(yīng)用與創(chuàng)新[2]。探討論文的知識擴散對科研評估、科學預(yù)測以及準確衡量學科交叉產(chǎn)生的科研成果影響力具有潛在價值。十四五規(guī)劃明確提出:為推動科技自立自強,需要加強基礎(chǔ)研究、注重原始創(chuàng)新,優(yōu)化學科布局和研發(fā)布局,推進學科交叉融合??梢?,學科交叉研究受到政府和學術(shù)界的高度關(guān)注。目前,國內(nèi)外對學科交叉與知識產(chǎn)出的關(guān)系已開展了廣泛的研究,主要關(guān)注學科交叉與論文學術(shù)影響力的關(guān)系,但對于論文中知識擴散的廣度、速度及強度鮮有探究,沒有關(guān)注學科交叉程度與知識擴散的關(guān)系。本研究旨在計算論文的學科交叉度,探索學科交叉的實際效果和影響,從而判斷學科交叉程度與知識擴散的關(guān)系。
學科交叉反映了不同學科之間的知識流動和滲透,在科學研究中發(fā)揮著關(guān)鍵作用,并產(chǎn)生了許多開創(chuàng)性的科學發(fā)現(xiàn)。但學科交叉程度對論文價值的影響還有待思考。許多學者對學科交叉的意義進行了深入研究,嘗試從不同角度探索學科交叉成果的實際效果和影響力。
1)學科交叉與被引頻次的關(guān)系研究
Stopar K等[3]從主題和參考文獻兩個角度研究林業(yè)學科論文,研究發(fā)現(xiàn)論文學科交叉程度越高,被引頻次越高,學科交叉研究對林業(yè)論文的學術(shù)影響力具有促進作用。Alfredo Y Y等[4]從參考文獻多樣性、均衡性、差異性角度出發(fā),使用Tobit回歸模型分析學科交叉程度與論文影響力的關(guān)系,研究發(fā)現(xiàn)學科多樣性與影響力呈正相關(guān)關(guān)系,多樣性處于中等程度的論文影響力最強。Levitt J M等[5]對圖書情報領(lǐng)域前0.1%的高被引論文進行分析,發(fā)現(xiàn)多數(shù)高被引論文至少涉及兩個學科,即學科交叉研究相比單一的學科研究能產(chǎn)生更高的學術(shù)影響,推廣學科交叉研究有利于提高圖書情報領(lǐng)域的論文質(zhì)量。張琳等[6]引入PLOS官方平臺的使用數(shù)據(jù),結(jié)合引用數(shù)據(jù)對學科交叉研究成果進行綜合評價,發(fā)現(xiàn)學科交叉水平與論文影響力有一定正相關(guān)關(guān)系,學科交叉程度對使用數(shù)據(jù)和引用數(shù)據(jù)之間的相關(guān)關(guān)系有顯著影響。Chen S等[7]從不同維度探討學科交叉程度與高被引論文影響力的關(guān)系,發(fā)現(xiàn)無論是否考慮控制變量,多樣性和差異性明顯促進論文的影響力,而平衡性不利于論文的影響力。
雖然學科交叉研究一直被各界廣泛關(guān)注,產(chǎn)生了許多高影響力的學術(shù)成果,但學科交叉是否產(chǎn)生更高的實際效果和影響力仍存在分歧。Levitt J M等[8]將自然科學和醫(yī)學類期刊作為研究對象,研究發(fā)現(xiàn)多學科期刊的引文數(shù)量遠少于單一學科期刊。Zhang L等[9]對7種不同學科的TOP期刊研究發(fā)現(xiàn),學科交叉程度和引文數(shù)量的關(guān)系因?qū)W科而異,數(shù)學學科交叉程度越高,引文數(shù)量越多,與之相反,生物信息學的引文數(shù)量隨交叉程度提高而降低。
2)學科交叉與其他指標的關(guān)系研究
除了對學科交叉程度與影響力的關(guān)系進行探討外,學者們還從不同層面對學科交叉成果的價值進行測度。Bromham L等[10]對學科交叉程度與基金資助的關(guān)系進行探究,發(fā)現(xiàn)學科交叉程度越高,基金申請成功率越低。王菲菲等[11]使用Tobit回歸模型對學科交叉程度與論文價值成長老化指標進行分析,發(fā)現(xiàn)學科交叉度與論文成長老化指標呈倒U型關(guān)系。開濱等[12]采集了6個SCI學科中的睡美人文獻,對其學科交叉特征的相關(guān)性、獨特性和差異性進行分析,發(fā)現(xiàn)論文的睡美人特征越強,學科交叉程度越高。徐璐等[13]以圖書情報領(lǐng)域18種核心期刊為研究樣本,探討了期刊的跨學科引用對知識輸出的影響,發(fā)現(xiàn)期刊跨學科引用有助于擴大知識輸出的學科范圍,增強了該學科對其他學科的影響力,但降低了跨學科知識輸出的速度。
知識擴散作為知識生產(chǎn)和傳播的重要組成部分,在知識創(chuàng)新過程中發(fā)揮著重要作用[14]。關(guān)于知識擴散的相關(guān)研究,國內(nèi)學者已經(jīng)取得了一些研究成果。
現(xiàn)有學者多是將知識擴散作為評價指標,如趙蓉英等[15]通過作者知識擴散廣度、深度等指標,評價作者知識擴散的貢獻程度。Ding J等[14]使用知識擴散廣度、強度、速度和主題探討圖書情報學的知識擴散發(fā)展趨勢及其對其他學科的影響。魏緒秋等[2]以圖書情報學領(lǐng)域的圖書為研究對象,發(fā)現(xiàn)圖書知識擴散深度、擴散速度、擴散指數(shù)和擴散強度4個指標與圖書被引頻次相關(guān)性極強。但缺乏對影響知識擴散的因素的研究,僅張雪等[16]以中國醫(yī)藥領(lǐng)域為研究對象,分析專利的知識吸收對知識擴散廣度、強度、速度的影響,發(fā)現(xiàn)不同的知識吸收指標對知識擴散廣度、強度、速度產(chǎn)生不同影響。
縱觀上述研究可知:現(xiàn)有研究主要聚焦在學科、期刊及作者的知識擴散特征上,忽視了將學術(shù)論文這一學科交叉成果作為研究對象,論文知識擴散能力代表了知識傳播與知識流動能力,知識在不同學科之間流動,有助于產(chǎn)生新的知識點,了解論文在不同學科的知識擴散可以更好地提高知識價值。目前對學科交叉成果的科學認定及價值評估的角度較為單一,可以嘗試從論文知識擴散視角進行佐證,了解學科交叉與知識擴散的相關(guān)性可以為評估學科交叉成果提供參考。但是現(xiàn)有研究尚未提及學科交叉與知識擴散的關(guān)系研究。
據(jù)此,本文提出以下研究問題:學術(shù)論文的學科交叉程度與知識擴散是否有相關(guān)關(guān)系?學術(shù)論文的學科交叉對知識擴散會產(chǎn)生怎樣的影響?本研究將嘗試以基因工程領(lǐng)域論文為研究對象,通過參考文獻從學科交叉綜合指標和3個單一維度指標測度論文的學科交叉程度;通過引證文獻從論文知識擴散廣度、知識擴散強度、知識擴散速度視角衡量論文的知識擴散程度;并采用Tobit回歸模型對論文學科交叉和知識擴散之間的關(guān)系進行探析。
為探析論文知識擴散特征,本研究結(jié)合Liu Y等[17]在2010年提出的學科知識擴散廣度、強度以及速度,引入論文知識擴散廣度、強度以及速度3個測度指標。
1)論文知識擴散廣度(KDB)。引證學科數(shù)量從學科層面量化了學術(shù)論文影響力廣度,對于一篇論文,引證該篇論文所屬的JCR學科(去重)數(shù)量就是該篇論文知識擴散廣度。學術(shù)論文的引證文獻所屬學科越多,學術(shù)論文影響廣度越大。
2)知識擴散強度(KDD)。對于一篇論文,知識擴散強度等于該論文某一學科引證該論文最高的次數(shù)。引證某一學科論文數(shù)量越多,說明該論文的方法技術(shù)、理論知識對該學科影響力越強。
3)知識擴散速度(KDS)。一篇論文發(fā)表后,引用該論文的(去重)學科數(shù)量與統(tǒng)計起點到終點年數(shù)的比值,可以用來量化論文知識的整體擴散速度。
陳仕吉[18]指出,導(dǎo)致學科交叉研究與影響力關(guān)系不同的一個原因在于學者們在測度學科交叉程度時,并未使用統(tǒng)一的測度指標,只是涉及學科多樣性的一到兩個維度。為排除學科交叉測度指標不同所帶來的影響,本文根據(jù)Stirling A[19]提出的學科多樣性3個測度屬性,即多樣性、均衡性、差異性,選擇V、B、D作為學科交叉單一測度指標,Rao-Stirling指標作為學科交叉綜合測度指標,在文中簡稱為R。
1)V指標。指一篇論文參考文獻所屬JCR學科的類別,被用作測度學科交叉多樣性。若參考文獻所屬學科類別越多,則學科交叉多樣性越強。
V=n
(1)
2)B指標。使用香農(nóng)熵表示一篇論文引文學科均衡性,如果論文每個學科參考文獻的數(shù)量相同,說明該論文引文學科分布均衡,若引文學科分布越均衡,則學科交叉程度越高。
(2)
3)D指標。通過計算學科之間不同距離分析學科交叉程度,若一篇論文引文所屬學科差異性較大,則該論文學科交叉程度更高。
(3)
4)R指標。從多樣性、均衡性及差異性綜合測度論文學科交叉程度。若一篇論文參考文獻所屬學科類別非常相似,則該論文學科交叉程度較低,反之,則越高。
R=∑i,j(1-Si,j)pipj
(4)
其中n為參考文獻所屬學科類別,pi表示學科i的被引頻次占所有學科總被引頻次的比例,i不等于j,Si,j表示學科i和學科j的相似性程度矩陣中學科i和學科j之間的相似性。
由于本研究選取的因變量在正值上連續(xù)分布,存在大量0值,且呈現(xiàn)離散分布,而傳統(tǒng)的最小二乘法回歸模型忽略了0值的重要意義,故不適用于本研究。離散分布數(shù)據(jù)通常采用Tobit、泊松分布、負二項分布以及零膨脹分布等模型進行擬合。在選擇具體模型時,本研究結(jié)合樣本數(shù)據(jù),對模型一一進行檢驗,最終得到適合本研究所有樣本數(shù)據(jù)集的最佳模型為Tobit模型。Tobit模型適用于受限因變量的情況,采用最大似然法對參數(shù)進行估計,能夠較好地規(guī)避參數(shù)估計有偏的問題[20]。因此,本研究選擇Tobit模型對論文學科交叉和知識擴散指標進行回歸分析。其公式具體如下:
(5)
Y*=β0+βiXi+ε
(6)
式中,Y為因變量,Y*為潛在變量,Xi為自變量,βi為對應(yīng)的相關(guān)系數(shù),i為第i個變量,ε為隨機誤差項。
本研究選取Web of Science核心合集的SCIE數(shù)據(jù)庫作為數(shù)據(jù)源,以基因工程領(lǐng)域文獻為研究樣本,限定在標題或者作者關(guān)鍵詞字段檢索,數(shù)據(jù)檢索時間為2021年1月。檢索式為TI=(“gene*engineering”or“DNA engineering”or“gene* manipulat*”or“DNA manipulat*”or“gene*recombinat*”or“transgen*”or“gene*clon*”or“molecular clon*”)or AK=(“gene*engineering”or“DNA engineering”or“gene*manipulat*”or“DNA manipulat*”or“gene*recombinat*”or“transgen*”or“gene*clon*”or“molecular clon*”)。文獻類型限定為Article,由于論文存在“延遲引用”現(xiàn)象,絕大部分論文在發(fā)表3年后才被引用[21],為保證一定的引用時間窗口,所以時間跨度限定為2000—2018年,最終命中50 142條文獻。選擇“全記錄與引用的參考文獻”格式,導(dǎo)出論文的題錄信息,同時利用Python爬取每篇論文的引證文獻。
1)構(gòu)建期刊全稱—縮寫1—縮寫2—學科類別對照表。WoS學科分類體系以期刊為分類對象,更容易獲取參考文獻的學科數(shù)據(jù),并且WoS學科包含254個學科類別,劃分粒度細致,涵蓋學科最全,故研究選擇WoS學科分類方法[22]。為計算單篇論文的學科交叉指標和知識擴散指標,研究需要根據(jù)論文所屬期刊的學科類別將每篇參考文獻和引證文獻映射到特定的學科類目。首先從JCR下載期刊學科對應(yīng)信息,對照ESI期刊列表構(gòu)建期刊全稱—縮寫1—縮寫2—學科對照表;其次發(fā)現(xiàn)部分期刊未被收錄在JCR期刊中,故對丟失學科信息的期刊進行手動補足;最后成功將12 268本期刊匹配到學科。
2)數(shù)據(jù)清洗。由于題錄信息中包含參考文獻在內(nèi)的多個字段,故需要對其進行清理。首先刪除參考文獻為0以及題錄信息不全的論文,最終共得到49 997篇論文;其次對導(dǎo)出的論文提取學科類別、作者、機構(gòu)、參考文獻等字段,為了避免其他因素對研究結(jié)果產(chǎn)生影響,本研究設(shè)置4個控制變量,即合著人數(shù)(AU)、合著機構(gòu)數(shù)量(N_inst)、國際合作(I_collab)和國內(nèi)合作(N_collab)。如果合著機構(gòu)來自不同的國家,則I_collab取1;如果至少有兩個不同的機構(gòu)來自同一個國家,則N_collab取1;否則I_collab和N_collab均取0。這些數(shù)據(jù)通過Excel進行手動提取得到。
3)學科映射。通過論文的參考文獻可以有效獲取各個學科的知識和信息的輸入情況,了解論文知識的學科來源,測度論文的學科交叉程度[23]。利用Python提取每篇論文的參考文獻的期刊刊名,通過構(gòu)建的期刊—學科對照表,對每個刊名進行一一匹配。如果參考文獻和引證文獻涉及的期刊所屬學科有兩個以上,為保證數(shù)據(jù)準確性將其全部計入統(tǒng)計結(jié)果。根據(jù)上述步驟,獲得參考文獻共2 045 283篇,期刊未匹配到學科的參考文獻共212 247篇,匹配率達89.6%。通過Python共爬取1 510 875條引證文獻,期刊未匹配到學科的引證文獻共62 735篇,匹配率達95.8%。
4)指標計算。利用Python計算每篇論文的學科交叉程度和知識擴散程度。由于自變量中學科交叉多樣性指標(V)的取值范圍在[1,50],為了讓學科交叉指標更加統(tǒng)一,同時為消除奇異樣本帶來的不良影響,因此采用最大—最小值標準化方法,將其區(qū)間映射在[0,1]。而每篇論文的知識擴散廣度、知識擴散強度、知識擴散速度服從偏斜分布,為了減弱這些變量的偏斜分布,使得數(shù)據(jù)更加平穩(wěn),本研究對這些因變量進行加1取對數(shù)處理[4]。為保證計算結(jié)果的科學性與準確性,本研究將引證文獻和參考文獻的期刊學科匹配率不足50%的論文刪除,使用Vlookup函數(shù)對保留的論文進行匹配,最終共得到47 873篇論文。采用Stata 15.1統(tǒng)計軟件對數(shù)據(jù)進行分析。
對觀測樣本變量進行描述性統(tǒng)計,結(jié)果如表1所示??梢钥闯?,多數(shù)變量標準差較大,呈離散分布,且部分變量存在0值,適用于Tobit模型。
表1 各變量描述性統(tǒng)計分析
1)學科交叉論文分布。圖1展示了4個學科交叉指標的論文頻數(shù)分布,可以看出,基因工程領(lǐng)域?qū)W科交叉綜合程度較低,交叉水平呈現(xiàn)較大差異,分布均衡;引文學科多樣性集中在較低水平、而差異性呈中等水平,引文學科分布偏向均衡。說明基因工程領(lǐng)域的論文引文學科多樣性不高,但偏向于引用學科差異性中等的論文,且引文學科分布均衡,故基因工程領(lǐng)域?qū)W科交叉整體水平偏低。但是與已有研究[11,25]相比,可以發(fā)現(xiàn)基因工程領(lǐng)域論文的學科交叉的綜合程度、多樣性、均衡性、差異性均高于醫(yī)學信息學和納米科技與納米技術(shù)等領(lǐng)域,適合作為研究對象。
圖1 學科交叉指標論文頻數(shù)分布直方圖
2)知識擴散論文分布。3個知識擴散指標的論文頻數(shù)分布如圖2所示,可以看出,論文知識擴散兩極差異明顯、分布不均衡,論文分布主要集中在中等擴散廣度、低擴散強度以及低擴散速度區(qū)域。說明該領(lǐng)域論文雖然知識流向?qū)W科范圍廣,但影響力不強,傳播速度慢。
圖2 知識擴散指標論文頻數(shù)分布直方圖
本研究采用Spearman秩相關(guān)分析,構(gòu)建了學科交叉綜合指標、學科交叉多樣性指標、學科交叉均衡性指標、學科交叉差異性指標、知識擴散廣度指標、知識擴散強度指標、知識擴散速度指標、合著作者數(shù)、合作機構(gòu)數(shù)、國際合作和國內(nèi)合作的相關(guān)關(guān)系矩陣,如表2所示。
從表2可以看出,學科交叉綜合指標、多樣性、均衡性、差異性指標與知識擴散廣度、強度、速度的相關(guān)性不同,說明從不同維度研究學科交叉對知識擴散的影響具有必要性。變量全部通過了相關(guān)性系數(shù)顯著性檢驗,所選取的變量具有一定的影響力,且相關(guān)性系數(shù)很低,進一步檢驗變量的方差膨脹因子,結(jié)果顯示模型并不存在嚴格意義上的多重共線性,可以將全部變量納入回歸模型進行回歸分析驗證。
表2 學科交叉和知識擴散各指標變量的相關(guān)矩陣
表2(續(xù))
4.3.1 模型估計結(jié)果
為更加深入地研究變量之間的依賴關(guān)系,本文采用Tobit模型研究。將自變量(學科交叉多樣性、差異性、均衡性、綜合指標)、因變量(知識擴散廣度)、控制變量(合作機構(gòu)數(shù)、合著作者數(shù)、跨國合著機構(gòu)、國內(nèi)合著機構(gòu))代入回歸方程,使用Tobit模型估計學科交叉研究對知識擴散廣度的影響,其中Prob>chi2=0.0000,說明模型可信度較高。從表3可以看出,除機構(gòu)數(shù)外各變量均在至少0.1的水平下通過了顯著性檢驗。從模型1和3可以看出,學科交叉綜合指數(shù)對知識擴散廣度的影響在0.05水平上呈正向促進作用;學科交叉多樣性和差異性對知識擴散廣度的影響也在0.05水平上呈正向作用;而學科交叉均衡性對知識擴散廣度的影響則在0.05水平上呈負向作用。為了驗證學科交叉與知識擴散廣度是否存在U型或倒U型關(guān)系,對知識擴散廣度的所有一次回歸函數(shù)均加入二次項,獲得模型2、4、5和6,具體結(jié)果如表3所示。
表3 Tobit模型估計學科交叉研究對知識擴散廣度的影響
采用Tobit模型估計學科交叉研究對知識擴散強度、知識擴散速度的影響,其研究過程與上述研究相同,研究結(jié)果和表3類似,不再列出。
4.3.2 學科交叉綜合指標與知識擴散指標的回歸分析
根據(jù)Tobit模型估計學科交叉研究對知識擴散指標的回歸結(jié)果發(fā)現(xiàn),學科交叉綜合指標與知識擴散廣度、強度、速度之間存在統(tǒng)計學上的顯著關(guān)系,其關(guān)系式為:
ln(KDB)=-1.566*R2+1.512*R+1.829
(7)
ln(KDD)=0.941*R2-1.397*R+2.128
(8)
ln(KDS)=0.951*R2-0.322*R+0.482
(9)
一篇論文的學科交叉融合與多樣性越高,吸收的學科知識差異越大,R值越大。在一定程度上,該論文的知識基礎(chǔ)越全面與均衡,越有助于提高學科影響范圍和擴散速度。學科交叉綜合指標與知識擴散廣度兩者呈倒U型關(guān)系,表明論文學科交叉綜合指標在達到某個最優(yōu)值前,有利于提升知識擴散的廣度;而達到最優(yōu)值后,則會降低知識擴散的廣度。對于知識擴散強度而言,學科交叉綜合指標對其影響呈現(xiàn)U型左半邊,最低值為0.74。說明當R小于0.74時,論文多樣性越高,分布越均衡,學科差異越大,知識擴散強度越低,反之則越高。對于知識擴散速度而言,學科交叉程度對其影響則呈現(xiàn)U型右半邊,當R大于0.17時,學科交叉綜合指標越高,知識擴散速度越快,反之則越低。說明論文學科知識融合更全面、均衡,在一定程度上會被更加迅速地傳播到更多學科,但同時由于論文知識專業(yè)度不強,會降低知識擴散強度。
從表1可知,學科交叉綜合指標的平均值為0.38,如果想要提高論文知識擴散廣度、速度使其達到最優(yōu)值,則需融合種類更多、差異性更強的學科知識。學科交叉綜合指標與知識擴散廣度、強度、速度關(guān)系如圖3所示。
提取處于極值點的論文進行分析。研究發(fā)現(xiàn)共1 404篇論文處于知識擴散廣度極大值點,篇均被引頻次為36.2,發(fā)文量最多的學科為Neurosciences;2篇論文處于知識擴散強度極小值點,篇均被引頻次為20,所屬學科為Biology;共531篇論文處于知識擴散速度極小值點,篇均被引頻次為31.1,發(fā)文量最多的學科為Plant Sciences。
學科交叉綜合指標從學科多樣性、均衡性及差異性3個維度綜合測度論文的學科交叉程度。為了更加深入分析學科交叉各維度的影響,本研究分別探討了學科交叉多樣性、均衡性、差異性3個指標對知識擴散指標的影響。
4.3.3 學科交叉多樣性指標與知識擴散指標的回歸分析
根據(jù)Tobit模型回歸結(jié)果發(fā)現(xiàn),學科交叉多樣性指標與知識擴散廣度、強度、速度之間存在統(tǒng)計學上的顯著關(guān)系,其關(guān)系式為:
ln(KDB)=-3.045*V2+2.758*V+2.198
(10)
ln(KDD)=-4.658*V2+3.511*V+3.199
(11)
ln(KDS)=-0.534*V2+1.521*V+0.510
(12)
當論文引用學科類別越豐富時,知識傾向于多元發(fā)展,其V值越高,說明該論文掌握了多個學科的理論和方法,而這些學科知識的交叉和融合使得論文的知識擴散學科范圍更加寬泛,影響力更大,被學科吸收速度更快。學科交叉多樣性與知識擴散廣度和強度呈倒U型關(guān)系,說明若要提高論文的學科擴散的范圍及影響力,需要融合更多學科的知識,但存在一個閾值,當學科種類超過一定數(shù)量時,可能會造成論文知識冗雜,主題定位不清晰,科學性受到質(zhì)疑,從而降低論文的知識傳播范圍和影響力。結(jié)合表1可知,基因工程論文學科交叉多樣性的平均值為0.25,低于對知識擴散廣度和強度影響的最優(yōu)值,表明論文可以適度地增加不同學科參考文獻引用,提高知識綜合能力。對學科交叉多樣性與知識擴散速度關(guān)系進行倒U型檢驗,發(fā)現(xiàn)兩者不存在倒U型關(guān)系,即學科交叉多樣性達到知識擴散速度最優(yōu)值的點大于V的最大值,論文引用學科類別越多,知識傳播速度越快。學科交叉多樣性與知識擴散強度、廣度、速度的關(guān)系如圖4所示。
研究發(fā)現(xiàn),共568篇論文處于知識擴散廣度極大值點,篇均被引頻次為24.9,發(fā)文量最多的學科是Biochemistry & Molecular Biology;共1 539篇論文處于知識擴散強度極大值點,篇均被引頻次為30.2,發(fā)文量最多的學科也是Biochemistry & Molecular Biology。
4.3.4 學科交叉均衡性指標與知識擴散指標的回歸分析
Tobit模型回歸結(jié)果顯示,學科交叉均衡性指標與知識擴散廣度、強度、速度之間存在統(tǒng)計學上的顯著關(guān)系,其關(guān)系式為:
ln(KDB)=-2.245*B2+2.849*B+1.050
(13)
ln(KDD)=-5.098*B2+6.220*B+0.464
(14)
ln(KDS)=-0.550*B2+0.491*B+0.217
(15)
論文所引用各學科的參考文獻數(shù)量越均衡,理論基礎(chǔ)和系統(tǒng)知識越堅實,B值越大,其科學性越高[11],吸引更多學科引用,領(lǐng)域知識在學科中傳播速度越快,影響力越大。學科交叉均衡性與知識擴散廣度、強度、速度均呈倒U型關(guān)系,如圖5所示。表明論文引用學科分布越均衡,知識融合越全面,影響力更加廣泛和強大,傳播更加迅速。但當論文學科交叉均衡性超過閾值時,可能會表現(xiàn)出太過中庸,主題不清晰,論文缺乏新穎性和創(chuàng)造性,很難被擴散到更廣的學科范圍,產(chǎn)生更深的影響力;只有適當降低論文學科分布的均衡性,明確研究重點,論文的學術(shù)價值才會提升,知識擴散廣度、強度和速度才會提升。
結(jié)合表1可知,基因工程領(lǐng)域論文均衡性的平均值為0.82,高于達到知識擴散廣度、強度和速度的最優(yōu)值,表明論文引用學科均衡性過高,知識擴散偏弱,該領(lǐng)域?qū)W者應(yīng)當提高論文專業(yè)水平,明確重點,突出研究主題,才能更好地提高知識擴散廣度、強度和速度。
研究發(fā)現(xiàn),共190篇論文處于知識擴散廣度極大值點,篇均被引頻次為29.3,發(fā)文量最多的學科是Plant Sciences;共105篇論文處于知識擴散強度極大值點,篇均被引頻次為36.8,發(fā)文量最多的學科也是Plant Sciences;僅1篇論文處于知識擴散速度極大值點,該論文被引頻次為65,所屬學科為Entomology。
4.3.5 學科交叉差異性指標與知識擴散指標的回歸分析
Tobit模型回歸結(jié)果顯示,學科交叉差異性指標與知識擴散廣度、強度、速度之間存在統(tǒng)計學上的顯著關(guān)系,其關(guān)系式為:
ln(KDB)=-2.344*D2+2.478*D+1.813
(16)
ln(KDD)=-2.366*D2+1.536*D+2.903
(17)
ln(KDS)=-0.186*D2+0.170*D+0.496
(18)
論文所引用的參考文獻歸屬學科的差異度越高,知識越不容易整合[24],學科間知識流動更稀少,從某種程度上來說這篇論文的創(chuàng)新性越強[11],因而在一定程度上使知識擴散廣度、強度和速度越高。學科交叉差異性與知識擴散廣度、強度、速度均呈倒U型關(guān)系,如圖6所示,即知識屬性上學科差異度高的論文會產(chǎn)生更強、更廣泛、更迅速的影響力。但論文學科交叉差異性并非越高越好,當學科交叉差異性達到閾值后,論文融合的學科知識差異度過大,導(dǎo)致凝聚力不強,論文科學性受到質(zhì)疑,知識擴散廣度、強度和速度下降?;蚬こ填I(lǐng)域差異性均值為0.56,低于論文達到知識擴散廣度最優(yōu)值,若要提高論文影響范圍,需加強對差異性較大學科的引用,即論文探索、融合更多相差較大的學科知識,將此類學科中有價值的理論方法應(yīng)用到該學科的研究進程,并與該學科的知識理論相結(jié)合。
結(jié)合表1可知,論文達到知識擴散強度、速度最優(yōu)值的差異性指標略低于均值,說明基因工程領(lǐng)域不能一味地追求打破學科壁壘、擴大基礎(chǔ)知識的差距,而應(yīng)當在保持論文專業(yè)性的同時,適當整合差異性較強的學科知識,才能最大限度地促進論文知識傳播與擴散。
研究發(fā)現(xiàn),共1 508篇論文處于知識擴散廣度極大值點,篇均被引頻次為36.4,發(fā)文量最多的學科是Biochemistry & Molecular Biology;共203篇論文處于知識擴散強度極大值點,篇均被引頻次為54.9,發(fā)文量最多的學科是Plant Sciences;共872篇論文處于知識擴散速度極大值點,篇均被引頻次為34.7,發(fā)文量最多的學科也是Plant Sciences。
本研究以基因工程領(lǐng)域2000—2018年發(fā)表論文為研究對象,以合著作者數(shù)、合著機構(gòu)數(shù)、國內(nèi)及國外合著情況為控制變量,采用Tobit模型分析基因工程領(lǐng)域論文的學科交叉綜合指標、多樣性、均衡性、差異性對知識擴散廣度、強度、速度的影響。研究得出以下結(jié)論:
1)學科交叉和知識擴散基本呈現(xiàn)U型和倒U型關(guān)系。從多樣性、均衡性、差異性3個維度更能細致地分析學科交叉對知識擴散的影響。學科交叉綜合指標與3個單一維度指標和知識擴散廣度全部呈倒U型關(guān)系;學科交叉綜合指標與知識擴散強度呈U型關(guān)系,而3個單一維度指標則呈倒U型關(guān)系;學科交叉綜合指標與知識擴散速度呈U型關(guān)系,而均衡性、差異性呈倒U型關(guān)系,多樣性則不存在U型或倒U型關(guān)系。
2)學科交叉對知識擴散的影響存在最優(yōu)值。在基因工程領(lǐng)域中主要學科發(fā)展到一定程度后都會出現(xiàn)難以逾越的知識屏障,研究成熟的學科在產(chǎn)生這些屏障時會向發(fā)展程度低一級的學科滲透。起初,發(fā)展較低的學科由于成熟學科的跨界會得到迅速的發(fā)展,論文的知識多樣性增加,研究質(zhì)量與知識擴散基本提高,但是過度的學科合作使得知識體系融合產(chǎn)生一定難度,并不能解決問題,論文研究容易停留在低層次的形式上,缺乏實質(zhì)性的融合,反而對知識擴散產(chǎn)生不利影響?;蚬こ填I(lǐng)域的研究主要以Plant Sciences、Neurosciences等學科提供的理論方法為基礎(chǔ),脫離這些學科,論文專業(yè)性難以被認同,可能流于膚淺。
3)基因工程領(lǐng)域論文應(yīng)該適當增加引文的學科類別,降低引文均衡性,明確研究重點,突出研究主題,適當調(diào)整對差距較大學科的引用。目前基因工程領(lǐng)域大部分論文的引文學科多樣性不高,且偏向于引用學科類別跨度相對均勻、距離中等的論文,學科交叉整體水平偏低。推動論文學科交叉指標達到實現(xiàn)知識擴散的最優(yōu)值,有助于論文獲得更加廣泛、深遠、迅速的影響力。
本文以基因工程領(lǐng)域的論文為研究對象,研究對象較為單一,雖然具有參考價值,但研究結(jié)論可能不適合其他領(lǐng)域;本文以JCR分類為基準進行學科期刊匹配時較為準確和高效,但存在少量論文所在期刊未被JCR期刊收錄,可能會在一定程度上影響學科交叉度指標和知識擴散指標計算的精確度。今后研究可拓展到其他領(lǐng)域,并在提高精確度方面做進一步探討。