姚曉杰,屈文建,龔花萍,陳東有
(南昌大學管理學院,江西 南昌 330031)
現(xiàn)代科學的發(fā)展,知識協(xié)同是促進知識技術(shù)創(chuàng)新發(fā)展的重要途徑[1],跨學科已經(jīng)成為當代科學發(fā)展的時代特征。近些年來人工智能、納米技術(shù)、神經(jīng)系統(tǒng)科學、生物信息學等學科領域,均呈現(xiàn)出極高的綜合跨學科特征。不同學科之間通過相互融合、滲透,引發(fā)了社會重大的科技創(chuàng)新。同時,科學研究也逐步呈現(xiàn)出高度綜合的跨學科特征。學科交互融合為原創(chuàng)性科學成果提供了原始動力[2]。學者之間的科研合作也越來越體現(xiàn)跨學科交叉的動態(tài)趨勢。學科間的交互交融,有效地促進科學研究的創(chuàng)新效率提升。如何更好地促進不同學科之間的交叉,是跨學科研究亟需解決的問題。對于特定研究領域中學科關聯(lián)關系的研究,有助于有效促進學科知識之間的交互效率,因而成為學者們關注的焦點。
“跨學科”(interdisciplinary)是由美國心理學家伍德沃思最早提出,是指涉及兩個或兩個以上學科的實踐活動[3]。國內(nèi)外學者對跨學科交叉的研究集中在兩個方面:一方面是對學科交叉程度的研究。學者們從期刊的學科性、學科集成及論文產(chǎn)出等視角對交叉度進行度量。Leydesdorff等研究期刊中學科交叉性的指標包括多樣性、中心性和引文[4]。黃穎等從學科集成、學科專業(yè)化和學科擴散三個指數(shù)維度對跨學科性進行研究[5]。另一方面是對跨學科關聯(lián)關系的研究。以往學者在引文關系、合著關系、共詞分析及聚類分析等方面展開了大量研究[6-7]。Reis等通過研究人員的合作探討了通信和信息科學各領域之間的跨學科關系[8]。謝成等通過共詞分析法,構(gòu)建信息科學、經(jīng)濟學與管理學的學科關聯(lián)[9]。
然而,目前在跨學科交叉關系方面的研究,學者大都采用文獻計量方法,局限于某一個研究角度,較少全面系統(tǒng)地探討跨學科的關聯(lián)特征?;诖?,本文運用社會網(wǎng)絡分析的研究方法,從三個角度分別探測不同學科及主題在合作交互網(wǎng)絡中的結(jié)構(gòu)地位,對跨學科網(wǎng)絡中的學科及主題進行影響力識別,以及探測學術(shù)群網(wǎng)絡聚類特征。本研究對于拓展跨學科領域研究,以及對學者開展多學科合作、形成重大跨學科交叉團隊提供有益借鑒。
為更好地探求生物醫(yī)學領域不同學科主題的關聯(lián)關系特征,本文基于復雜網(wǎng)絡理論,主要運用主題識別、網(wǎng)絡中心度分析及塊模型分析方法,揭示該領域的跨學科網(wǎng)絡結(jié)構(gòu)特征、識別出關鍵學科及共同關注的研究主題。
在某一特定研究領域,主題代表學科范圍內(nèi)相關文獻的研究內(nèi)容[10]。主題識別又被稱為主題提取,通過對大量文本信息處理,幫助用戶快速有效地獲取關鍵內(nèi)容[11]。詞頻-逆向文件頻率值(TF-IDF)作為一種統(tǒng)計加權(quán)技術(shù),常被用于信息檢索提取及文本挖掘的運用[12]。TF是基于單一文檔,統(tǒng)計在文檔中某一詞語的出現(xiàn)頻率。IDF則是根據(jù)全部文檔的統(tǒng)計分析,衡量詞語的常見程度。TF-IDF計算公式如下:
(1)
其中,dj表示一篇文檔,|D|是文檔總數(shù)。nij代表詞語在文檔中的頻次,nkj代表文檔中所有詞匯的頻次。本文對主題詞的提取,采用python的TF-IDF術(shù)語加權(quán)算法實現(xiàn),來識別生物醫(yī)學領域?qū)W科研究主題。其中,TF統(tǒng)計生物醫(yī)學領域不同學科主題的頻率,IDF衡量主題詞的普遍重要性。
基于社會網(wǎng)絡分析,構(gòu)建學科及主題之間的關聯(lián)網(wǎng)絡,研究學科主題的網(wǎng)絡拓撲結(jié)構(gòu)。社會網(wǎng)絡分析使用量化方式描述節(jié)點之間關系,關注行動者之間的二元屬性關系,并把關系表達為一種模式或規(guī)則,來反映社會結(jié)構(gòu),從而進行結(jié)構(gòu)關系的量化[13]。它側(cè)重于研究社會關系的結(jié)構(gòu)和各種關系,實現(xiàn)對關系的測量及可視化。社會網(wǎng)絡關系表達式如下:
(2)
其中,v和g分別為點集和邊集,m和n分別為網(wǎng)絡邊數(shù)和節(jié)點數(shù)。本文跨學科關聯(lián)結(jié)構(gòu)網(wǎng)絡中,節(jié)點表示不同的學科或主題。邊則是節(jié)點間的連線,代表兩個學科(或主題)間的合作關聯(lián)。邊的權(quán)重代表合作強度。
衡量節(jié)點在網(wǎng)絡中的重要程度的指標是網(wǎng)絡中心度,通過節(jié)點值的測量識別其在結(jié)構(gòu)網(wǎng)絡位置上的影響力[14]。根據(jù)度中心度和中介中心度指標探測節(jié)點的重要程度,測度主題在結(jié)構(gòu)網(wǎng)絡中的影響力。度中心性是測度節(jié)點重要性的最直接指標,反映與網(wǎng)絡中其他節(jié)點直接聯(lián)系的緊密程度。度中心性的值越大,表示在網(wǎng)絡中的權(quán)利地位及影響就越大,能夠有效影響網(wǎng)絡中其他行動者[15]。度中心性Dc(i),公式表示為:
(3)
其中n表示網(wǎng)絡中的節(jié)點總數(shù),i表示某一節(jié)點。在學科主題網(wǎng)絡中,某一學科主題的度中心度越大,表明其與其他主題之間存在直接交互關系越強,在網(wǎng)絡中直接影響越大。
中介性可以評價某一節(jié)點在網(wǎng)絡中的媒介作用,通過中介中心度測度,識別節(jié)點在網(wǎng)絡結(jié)構(gòu)中的間接影響力。節(jié)點i的中介中心性CC(i)公式為:
(4)
公式(4)中,n和dij分別表示節(jié)點數(shù)量和點i與點t之間的最短路徑。中介中心性高的主題通常在該學科領域發(fā)展中承擔橋梁和中介作用,也是連接不同研究方向的關鍵主題。
本文運用塊模型分析方法對學科主題進行凝聚子群劃分,并分析子群內(nèi)部及子群間的關聯(lián)關系。塊模型是一種通過對行動者進行取值和分類的技術(shù),來研究不同行動者的網(wǎng)絡位置關系的分析方法[16],包括密度矩陣和相應的圖像矩陣的構(gòu)建。本文運用CONCOR算法迭代相關矩陣計算得到主題詞塊矩陣結(jié)構(gòu),從而實現(xiàn)學科子群的層次劃分。在子群劃分的基礎上,通過像矩陣值,研究子群內(nèi)部及彼此之間的關系模式,得出不同子群的層次結(jié)構(gòu)地位。與傳統(tǒng)聚類分析不同[17],塊模型分析更適用網(wǎng)絡關系的聚類,探討聚類之間的關系。
科研機構(gòu)成員的跨學科合作,可以更好地促進科研創(chuàng)新發(fā)展。生物醫(yī)學作為一個綜合交叉研究領域,涵蓋醫(yī)學、生命科學和生物學等多個學科,具有明顯的學科交叉特征。為了更好地探析該領域?qū)W者的跨學科合作現(xiàn)狀,本文以生物醫(yī)學科研機構(gòu)為實證對象,探析領域內(nèi)不同學科主題的網(wǎng)絡關聯(lián)關系特征。
選取上海交通大學Bio-X研究院機構(gòu)所有成員發(fā)表的論文為數(shù)據(jù)樣本,因為該研究團隊在生物醫(yī)學跨學科研究領域具有較好的代表性。對WoSTM核心合集中的SSCI和SCI兩個數(shù)據(jù)庫進行檢索,檢索條件限定機構(gòu)為“Shanghai Jiao Tong Univ,Bio X Inst”。為跟蹤生物醫(yī)學近十年的跨學科現(xiàn)狀,檢索時間限定為2011-2020年。將下載的文獻去重、清洗,最終獲取238篇有效數(shù)據(jù),將獲取得到的TI、AU、DE、WC等文獻字段數(shù)據(jù)存儲在MySQL數(shù)據(jù)庫中。分別運用Python、Ucinet軟件,進行主題提取、測算網(wǎng)絡結(jié)構(gòu)指標值,并進行網(wǎng)絡可視化。
對238篇學者科研合作發(fā)文數(shù)據(jù)統(tǒng)計,得到近十年來生物醫(yī)學領域?qū)W科類別分布共有57種,可能存在著關聯(lián)關系。從學科發(fā)文量來看,獲得了該領域中主要學科類別。對應的學科類別發(fā)文量和總發(fā)文量占比如圖1(a、b)所示。從圖中可以看出,遺傳學與遺傳排第一位,占總發(fā)文的18.75%。其次是神經(jīng)科學(14.06%)和精神病學(13.67%)。根據(jù)“二八定律”在學科類別分布中占比超過百分之八十的學科類別有6個,除了遺傳學與遺傳、神經(jīng)科學、精神病學外,還包括生物化學與分子生物學、多學科科學及藥學。從所屬學科大類來看,主要集中分布在醫(yī)學、生物學及藥學三個大學科。這表明了在學科交互合作網(wǎng)絡中生物醫(yī)學成員機構(gòu)具有廣泛的跨學科關聯(lián),但是存在核心交互學科。這與生物醫(yī)學在神經(jīng)科學和遺傳學領域的實際地位和影響是一致的。
圖1 生物醫(yī)學成員機構(gòu)WoS跨學科發(fā)文量(a)和其對應的占比(b)
2.2.1 學科分類關聯(lián)網(wǎng)絡
Web of ScienceTM數(shù)據(jù)庫中期刊論文被歸并劃分為一個或者多個學科類別。學者常常采用WoS學科類別來表征不同學科[18]。本文對每條記錄提取文獻的WoS學科分類,構(gòu)建學科類別共現(xiàn)矩陣,得到生物醫(yī)學WoS學科分類的結(jié)構(gòu)網(wǎng)絡關聯(lián)圖(圖2)。在該圖中節(jié)點和連線分別表示學科類別和學科類別之間的關聯(lián)關系。節(jié)點大小代表網(wǎng)絡中的核心邊緣地位,節(jié)點越大表明在網(wǎng)絡中的關聯(lián)程度越大??梢钥闯觯癎enetics & Heredity遺傳學與遺傳”、“Neurosciences神經(jīng)科學”、“Biochemistry & Molecular Biology生物化學與分子生物學”、“Pharmacology & Pharmacy藥學”、和“Cell Biology細胞生物學”處于網(wǎng)絡中間位置,關聯(lián)程度最大。處于最外層結(jié)構(gòu)位置的學科分類數(shù)量最多,尤其是“Physics Applied應用物理學”、“Nanoscience & Nanotechnology納米科學和納米技術(shù)”、“Materials Science,Multidisciplinary材料科學多學科”三個學科類別之間獨立形成關聯(lián)網(wǎng)絡,而不與學科相互關聯(lián)。通過對學科網(wǎng)絡結(jié)構(gòu)位置分析,表明不同學科類別在結(jié)構(gòu)關聯(lián)網(wǎng)絡中處于不同位置層次,越處于中間位置的,越與其他學科具有更多的關聯(lián)關系。生物醫(yī)學成員組織在網(wǎng)絡中間的位置相對集中,交互關系更為密切,但是外圍學科交互比較松散。這也反映了生物醫(yī)學研究院最早是在在神經(jīng)精神病學、人類遺傳科學和生命科學的基礎上建立起來的跨學科團隊。生物化學、納米科學、計算生物學及生命科學雖然關聯(lián)性較小,也在豐富生物醫(yī)學成員的結(jié)構(gòu),體現(xiàn)了生物醫(yī)學跨學科發(fā)展的趨勢。同時,它反映了生物醫(yī)學融合生物化學、納米技術(shù)及計算機科學多個學科領域的跨學科的特點。
圖2 基于WoS學科分類的關聯(lián)結(jié)構(gòu)網(wǎng)絡圖
2.2.2 主題內(nèi)容關聯(lián)網(wǎng)絡
主題作為文獻內(nèi)容的一個重要組成部分,通過分析可以獲取某一主題研究領域的學者關注熱點及發(fā)展趨勢。本文運用python進行摘要文本主題詞識別,最終得到22個高頻主題。如圖3所示,通過構(gòu)建主題共現(xiàn)矩陣并可視化,得到學科主題交互關聯(lián)結(jié)構(gòu)網(wǎng)絡圖。主題節(jié)點“Schizophrenia精神分裂癥”、“Major Depressive Disorder抑郁癥”、“Case-Control Study病例對照研究”、“Single Nucleotide Polymorphisms單核苷酸多態(tài)性”處于網(wǎng)絡結(jié)構(gòu)核心位置,具有較多的關聯(lián)關系。為了考察網(wǎng)絡中各節(jié)點之間的整體關聯(lián)程度,進一步測算整體網(wǎng)絡密度。數(shù)值越接近1,代表成員間關聯(lián)程度越緊密。主題網(wǎng)絡密度結(jié)果為0.562,表明生物醫(yī)學不同學科主題間的網(wǎng)絡關聯(lián)程度整體不強。圖中比較可以看出,生物學和醫(yī)學的主題關聯(lián)強度最大,這也表明不同學科主題的關聯(lián)性程度不同。
圖3 基于主題內(nèi)容的關聯(lián)結(jié)構(gòu)網(wǎng)絡圖
3.3.1 學科分類影響力識別
基于總被引頻次對學科分類進行測度,識別得到高影響力的學科,結(jié)果見圖4所示??梢钥闯?,影響最大的是學科是“Cell Biology細胞生物學”,值為1263,占所有學科總被引頻次的21.55%;其次是“Biochemistry Molecular Biology生物化學與分子生物學”總被引頻次是958,占比為16.34%;“Oncology腫瘤學”總被引頻次是640,占比為10.92%。
圖4 基于被引頻次的學科分類影響力識別
基于h指數(shù)對學科分類進行的測度,對交互學科影響力進行識別,結(jié)果見圖5所示??梢钥闯觥癎enetics Heredity遺傳學與遺傳”h指數(shù)值明顯最高17,影響最大。居于第二、三位的分別是,“Biochemistry Molecular Biology生物化學與分子生物學”、“Neurosciences神經(jīng)科學”。同時發(fā)現(xiàn)學科的h-index與衡量學科影響的篇均被引次數(shù)趨勢基本保持一致。在篇均被引統(tǒng)計分析中,細胞生物學值(151.41)明顯高于其他學科,具有較大的影響。
圖5 基于h指數(shù)的學科分類影響力識別
與傳統(tǒng)的文獻計量指標總被引頻次相比,h指數(shù)可以更好地評估學術(shù)的數(shù)量與質(zhì)量綜合水平。圖4、5比較,發(fā)現(xiàn)生物化學與分子生物學在總被引頻次和h指數(shù)都具有較大的影響力。細胞生物學總被引值最高,但是h指數(shù)指標較低。遺傳學與遺傳h指數(shù)值較高,但是被引頻次中排在第7位。
2.3.2 主題影響力識別
運用Ucinet對主題關聯(lián)網(wǎng)絡中的節(jié)點,進行中心性測量。點度中心度和中介中心度結(jié)果,如表1、2所示。表1可以看出“精神分裂癥”、“抑郁癥”及“病例對照研究”的點度中心度值居于前三位,分別為30、19和12,表明這三個主題在學科主題整個網(wǎng)絡結(jié)構(gòu)中,具有較大的直接影響力。與其他主題的直接關聯(lián)關系較強,處于網(wǎng)絡中的關鍵核心地位,是該領域?qū)W者研究的熱點。特別是“精神分裂癥”居于第一位,并且中心度值明顯高于其它節(jié)點,說明該主題是生物醫(yī)學領域不同學科共同關注的重點內(nèi)容。表2中,“單核苷酸多態(tài)性”中介中心度值最高,值為64.00,其次是“精神分裂癥”、“多囊卵巢綜合征”,值分別為49.45、42.00。表明該三個主題在網(wǎng)絡結(jié)構(gòu)中發(fā)揮著較大的中介橋梁作用,具有較強的間接影響力。其他主題依賴它們的媒介作用來實現(xiàn)網(wǎng)絡中的相互關聯(lián)。尤其是前三位的中介中心度值明顯高于其他節(jié)點,也表明了“單核苷酸多態(tài)性”、“精神分裂癥”、及“多囊卵巢綜合征”,目前在該研究領域中具有不可替代的橋梁關聯(lián)作用。
表1 基于點度中心度的主題內(nèi)容影響力識別
表2 基于中介中心度的主題內(nèi)容影響力識別
運用塊模型來分析生物醫(yī)學領域不同學科主題之間的網(wǎng)絡聚類關系。通過對學科主題網(wǎng)絡進行結(jié)構(gòu)分區(qū),得到7個凝聚子群。將不同的主題群進行學科歸屬,形成四大學科群。結(jié)果如表3所示。從學科主題歸類來看,醫(yī)學-生物學-藥學群在抑郁情感障礙及藥理學形成集聚,該學科群最大。而醫(yī)學-生物學、醫(yī)學-數(shù)學學科群相對較小。
表3 學科主題塊模型劃分
如表4所示,對7個主題模塊,進行模塊內(nèi)以及模塊間的親密關系及關聯(lián)程度測度,得到密度矩陣和像矩陣值??梢钥闯觯芏染仃嚸芏茸畲蟮膬蓚€模塊是第5和第3模塊,值分別是2.00、1.33,說明這兩個模塊在學科主題關聯(lián)網(wǎng)絡中內(nèi)部關聯(lián)程度最為緊密。從像矩陣結(jié)果,可以得到學科主題模塊外部及內(nèi)部間關聯(lián)關系。根據(jù)主題模塊內(nèi)外之間的關聯(lián),構(gòu)建主題模塊關聯(lián)圖,如圖6所示??梢钥闯觯t(yī)學-生物學群中的第1、2模塊、醫(yī)學-生物學-藥學群中的第3模塊和醫(yī)學-數(shù)學群中的第5模塊存在模塊內(nèi)部的主題關聯(lián)關系。同時,第1模塊又與第3、4模塊產(chǎn)生模塊之間主題交互關系。第6、7模塊關聯(lián)關系為0。特別是第1主題模塊的“精神分裂癥”“遺傳關聯(lián)”,在模塊內(nèi)外都有交互關系,在網(wǎng)絡交互結(jié)構(gòu)中發(fā)揮著重要作用。
表4 密度矩陣和像矩陣
圖6 跨學科主題模塊關聯(lián)關系圖
塊模型結(jié)果表明,不同學科之間的距離和密切關系形成了具有一定層次差異性的跨學科關聯(lián)網(wǎng)絡。在結(jié)構(gòu)化的多學科協(xié)同網(wǎng)絡中,學科及主題之間存在著一定的交互關系,但交互關系又分為不同的結(jié)構(gòu)層次。同時,也表明主題領域機構(gòu)學者之間開展的跨學科合作,其關系網(wǎng)絡表現(xiàn)出差異性,存在明顯的強弱差異。同一個結(jié)構(gòu)層次內(nèi)部的交互作用較強,而結(jié)構(gòu)層次之間的交互作用較弱。
本文基于社會網(wǎng)絡和塊模型分析,分別從WoS學科分類與主題兩個維度,在交互網(wǎng)絡拓撲結(jié)構(gòu)特征、學科主題影響力及學科群聚類關系特征三個層面上,揭示了生物醫(yī)學主題研究領域科研協(xié)同中的跨學科關聯(lián)關系特征。主要研究結(jié)論如下:
(1)學科主題關聯(lián)關系在網(wǎng)絡結(jié)構(gòu)上呈現(xiàn)親近-疏遠的差異特征。生物醫(yī)學領域關聯(lián)的學科范圍較廣,但整體交互關系較弱,一些學科處于孤立位置。從網(wǎng)絡結(jié)構(gòu)特征來看,核心學科和邊緣學科分化嚴重。在學科分類網(wǎng)絡中,遺傳學與遺傳、神經(jīng)科學、藥學、生物化學及細胞生物學處于網(wǎng)絡結(jié)構(gòu)核心位置,與其他學科類別有較多的關聯(lián)特性。主題關聯(lián)網(wǎng)絡中的精神分裂癥、抑郁癥及單核苷酸多態(tài)性處于網(wǎng)絡核心位置,是生物醫(yī)學領域的研究熱點。這與生物醫(yī)學在神經(jīng)科學和遺傳學領域的實際地位和影響是一致的。
(2)交互關聯(lián)的學科主題中,具有高影響力的學科及共同關注的研究主題。從學科類別的計量指標來看,生物化學與分子生物學、神經(jīng)科學在該學術(shù)領域具有較大影響,成為主要學科交叉點。從學科主題的節(jié)點中心性指標來看,精神分裂癥和單核苷酸多態(tài),在關聯(lián)網(wǎng)絡中與其他主題直接關聯(lián)關系最大,也發(fā)揮著重要的媒介影響作用,成為不同學科共同關注的熱點。這些關鍵學科在科研合作中,占有和控制著絕大多數(shù)的科研資源。
(3)跨學科關聯(lián)合作網(wǎng)絡形成了不同的學科主題凝聚子群,關聯(lián)關系表現(xiàn)出結(jié)構(gòu)層次差異?;趬K模型分析,對跨學科主題進行網(wǎng)絡聚類,得到7個模塊,進而形成醫(yī)學-生物學、醫(yī)學-生物學-藥學、醫(yī)學-數(shù)學以及醫(yī)學-生物學-化學-物理學四個學科群。同時在模塊內(nèi)部以及模塊之間形成了強弱不同的關聯(lián)關系。不同學科關聯(lián)網(wǎng)絡中,較易在親緣關系學科中形成團聚關聯(lián)。
本文對于跨學科關聯(lián)關系特征的研究,對于深入理解主題研究領域跨學科科研合作具有重要意義。從理論的角度,這在一定程度上豐富了跨學科理論研究。在實踐上,為主題研究領域開展多學科科研協(xié)作,形成重大跨學科團隊提供參考。科研人員開展積極有效的跨學科科研合作,要注重與相近學科開展合作。隨著不同學科知識交互,衍生出新的學科知識增長點,從而提升科研創(chuàng)新效率。此外,需要提升政策在跨學科合作中的推動作用。由于學科知識界限的阻礙,一些邊緣學科較難實現(xiàn)學科交互??梢酝ㄟ^重大聯(lián)合交叉科研項目、聯(lián)合資助等的激勵政策,鼓勵各個學科領域開展有效的跨學科科研合作,從而更好地實現(xiàn)科學研究上的突破。