張宇 馬亞雪 李悅 孫建軍
摘? ?要:探究新興交叉學科知識元的生存特征及影響因素,有助于從微觀層面揭示新興交叉學科的形成與演進過程,提升對新興交叉學科發(fā)展規(guī)律的科學認識。首先,構建多維測度指標量化新興交叉學科知識元的學科來源和學科影響力屬性;其次,采用Kaplan-Meier法構建新興交叉學科知識元的生存曲線并剖析不同屬性知識元生存特征差異;最后,利用Cox比例風險模型探究學科來源和學科影響力對知識元生存時間的影響機制。以醫(yī)學信息學為例開展實證分析后發(fā)現(xiàn),醫(yī)學信息學知識元生存曲線呈現(xiàn)先陡降后緩降的趨勢,平均生存時間為4.41年。醫(yī)學信息學新產生的知識元生存時間顯著低于原始學科歸屬為四個關聯(lián)學科的知識元,關聯(lián)學科中計算機科學的知識元在醫(yī)學信息學中的生存風險最高。學科來源復雜度、新興交叉學科使用頻次和學科地位、關聯(lián)學科熱度均與知識元生存時間存在正相關關系。相較于關聯(lián)學科熱度,新興交叉學科使用頻次和新興交叉學科地位對知識元生存時間影響程度更高。
關鍵詞:新興交叉學科;知識元;生存分析;學科來源;學科影響力
中圖分類號:G353.1? ?文獻標識碼:A? ?DOI:10.11968/tsyqb.1003-6938.2023066
Research on Factors Influencing the Survival Time of Emerging Interdisciplinary Knowledge Elements
Abstract Focusing on exploring the survival characteristics and influencing factors of emerging interdisciplinary knowledge elements, this study helps reveal the formation and evolution process of emerging interdisciplinary fields from a micro perspective, thus enhancing the scientific understanding of interdisciplinary development laws. Firstly, we construct a multidimensional index system, with which the disciplinary source and disciplinary influence attributes of emerging interdisciplinary knowledge elements are quantified. Then, we employ Kaplan-Meier method for the construction of survival curve and to analyze the differences in survival characteristics of knowledge elements with different attributes. Finally, the Cox regression is used to explore the effects on mechanism of survival time. Taking medical informatics as an example, the empirical analysis shows that the survival curve of medical informatics knowledge elements experiences a rapid decline in the first year and then a slow decline, with an average survival time of 4.41 years. The survival time of newly emerging knowledge elements in medical informatics is significantly lower than that of related disciplines. Among the related disciplines, the knowledge elements of computer science have the highest survival risk. The complexity of disciplinary source, the frequency of use and status of emerging interdisciplinary fields, and the popularity of related disciplines are all positively correlated with the survival time of knowledge elements. Compared with the popularity of related disciplines, the frequency of use and the status of emerging interdisciplinary fields have a higher degree of influence on the survival time of knowledge elements.
Key words emerging interdisciplinary fields; knowledge elements; survival analysis; disciplinary source; disciplinary influence
大科學時代背景下,學科邊界逐漸模糊,單一學科的研究范式與思維模式已經難以支撐重大科學問題的解決與創(chuàng)新發(fā)現(xiàn)[1]。多學科交叉創(chuàng)新成為促進科學發(fā)展的重要力量[2],并逐步推動新興交叉學科的產生[3]。多學科知識的不斷交互、重組與創(chuàng)新推動新興交叉學科的形成與發(fā)展[4]。知識元作為表達特定知識的最小內容單元[5],具備表示客觀實在和反映事物認知的雙重屬性,其動態(tài)變化過程可用于展現(xiàn)新興交叉學科的形成與發(fā)展過程[6]。具體來說,多學科知識元從原始學科知識體系中游離出來,通過交匯、重組、融合產生新的學科增長點,進而推動新知識元的出現(xiàn),并在原始學科知識元與新知識元的交互過程中推進新興交叉學科的創(chuàng)新與發(fā)展[7]。探究新興交叉學科中不同屬性知識元的生存特征及其影響因素,有助于從微觀層面揭示新興交叉學科的形成與演進過程,提升對新興交叉學科發(fā)展規(guī)律的科學認識,為推動我國新興交叉學科發(fā)展與創(chuàng)新提供理論支撐。
生存時間是衡量知識元生存特征的重要指標[8]。現(xiàn)有研究從知識元價值、語義功能等視角,剖析知識元在信息資源管理[9]、計算機[10]等學科中的生存特征及其影響因素,旨在識別領域熱點主題和技術方法,從而揭示知識元所屬學科的研究前沿和主題演化趨勢[11]。研究發(fā)現(xiàn)不同學科知識元的生存時間存在顯著差異[9-10];同時,知識元自身價值、承載知識元的文獻作者規(guī)模和引文特征、以及期刊等級與學科歸屬等因素也被證實會對知識元生存時間產生影響[12]。然而,鮮有研究聚焦學科交叉創(chuàng)新背景下新興交叉學科的知識元生存特征及其影響因素。
新興交叉學科是學科交叉領域知識體系化的結果[13]。隨著新興交叉學科逐漸形成獨立的知識體系,其與原始學科之間的學科分化不斷加劇,使得不同學科來源的知識元與新學科創(chuàng)新發(fā)展的適配能力產生差異,進而在新興交叉學科中表現(xiàn)出不同的生存特征[14]。如一些學科的知識元難以滿足新學科發(fā)展而逐步消失,另一些則由于其原始學科的理論方法體系與新學科重疊較高而獲得更長的生存時間;同樣,新產生的知識元也會隨著新興交叉學科的發(fā)展呈現(xiàn)出不同的生存特征。除學科來源外,知識元的學科影響力也會對新興交叉學科中不同屬性知識元的生存特征產生影響。研究發(fā)現(xiàn)知識元的學科影響力與其在知識傳播過程中的知識輸出能力呈正相關[15],學科影響力較高的知識元更有可能實現(xiàn)跨學科傳播;同時,影響力越高代表知識元的重要性越強[16],可能導致其具有更長的生存時間。
鑒于此,本研究聚焦新興交叉學科知識元的學科來源和學科影響力對其生存時間的影響。首先,構建多維測度指標量化新興學科知識元的學科來源和學科影響力屬性;其次,采用Kaplan-Meier法構建新興學科知識元的生存曲線并剖析不同屬性知識元生存特征差異;最后,利用Cox比例風險模型探究學科來源和學科影響力對知識元生存時間的影響機制。研究以醫(yī)學信息學為例開展實證分析,主要考慮到醫(yī)學信息學是融合多學科門類并被廣泛研究的新興交叉學科[17]。選擇該領域作為研究對象兼顧多學科交叉的研究背景和豐富的研究數(shù)據(jù)。
1? ?相關工作
生存分析最早出現(xiàn)于生物醫(yī)學領域[18]。相關研究以罹患癌癥的病患作為研究對象,采用壽命表法、Kaplan-Meier法和Cox比例風險模型等方法,探究治療方案的有效性和術后生存效果[19]。近年來,生存分析方法也被用于發(fā)掘影響勞動力流動[20]、企業(yè)進出口持續(xù)時間[21]、網絡輿情演化[22]等多類型研究對象的關鍵因素及其作用機制。
信息資源管理領域中,生存分析方法主要用于探究學者的成長路徑[23]、科技文獻傳播規(guī)律[24]、知識元的生存特征[12]等。以學者為對象的生存分析,集中于探究學術人才職業(yè)發(fā)展的影響因素,研究發(fā)現(xiàn)教育背景、學科、年齡等因素均會對躋身領軍人才造成影響[25]。此外,也有研究利用生存分析方法剖析人才流動的驅動因素[26]和榮譽獎項的授予偏好[27]。與傳統(tǒng)的履歷研究法等相對靜態(tài)的方法相比,基于生存分析方法的學者研究能夠避免大量刪失數(shù)據(jù)造成的結果偏差,并可以通過生存函數(shù)來刻畫研究對象在每個時點的生存效果,從而動態(tài)地反映學者成長路徑和影響機制[28]。
以科技文獻為對象的生存分析可細分為科學論文生存分析和專利文獻生存分析兩類。其中,科學論文生存分析主要通過構建論文被引生存率和老化風險率曲線,剖析論文被引趨勢和老化風險率的影響因素[24,29]。如朱世琴和蔣辛未對九個學科期刊2000年-2014年引文數(shù)據(jù)進行生存分析后發(fā)現(xiàn),社會學、哲學、心理學論文老化風險率較低,并且引文高峰出現(xiàn)越早對應的論文老化風險率越高[29]。專利文獻生存分析則貫穿專利生命周期始終,旨在發(fā)掘專利審查周期和專利存續(xù)的影響因素[30-31]。歐桂燕等對中國人工智能領域專利審查周期的影響因素進行生存分析,發(fā)現(xiàn)專利引文數(shù)增加會縮短專利審查周期,同時個人申請相較于高校及科研機構、機關團體的審查周期會更長[30]。宋爽和陳向東則通過Cox模型分析中美日三國戰(zhàn)略新興產業(yè)專利的生存影響因素,結果顯示區(qū)域技術優(yōu)勢可以延長專利存續(xù)時間并提升專利價值[31]。
以知識元為對象的生存分析,主要關注以關鍵詞或主題詞等形式存在的知識元的生存時間影響機制[10]。與生物醫(yī)學領域的生存分析有所區(qū)別,知識元存在“重生”現(xiàn)象,即消失后仍然可能被重新使用,因此知識元生存分析只考慮觀察期內知識元生存結局[9]。如劉智鋒等從語義功能的角度將關鍵詞分為問題類和方法類,探究關鍵詞所在論文特征對其生存時間的影響,結果表明論文被引頻次和下載次數(shù)與兩類關鍵詞生存時間均為正相關,而期刊等級、是否基金資助、作者合作規(guī)模和參考文獻數(shù)四個因素只與方法類關鍵詞的生存時間顯著相關[12]。
綜上所述,目前生存分析方法已被廣泛應用于探究學者、科技文獻和知識元的生存特征及其影響因素。以知識元為對象的生存分析研究更多關注相對成熟的學科領域,缺乏對學科交叉創(chuàng)新背景下新興交叉學科知識元生存時間影響因素的探索。為此,本研究聚焦新興交叉學科知識元生存特征分析,從知識元的學科來源和學科影響力兩個角度,挖掘新興交叉學科知識元生存時間的影響因素。
2? ?研究設計
知識元是學科知識結構的基本單元[32],能夠表征學科內特定的科學內涵[33]。作者關鍵詞可以相對全面地表示科學論文的內容,是研究科學領域知識結構的有效媒介[34],因而科學論文的作者關鍵詞常被用于代理學科知識元[35]。本研究以新興交叉學科科學論文的作者關鍵詞作為知識元,從學科來源和學科影響力兩個方面測度新興交叉學科知識元屬性,進而探究不同屬性知識元生存特征差異,剖析學科來源和學科影響力對知識元生存時間的影響機制(研究框架見圖1)。具體研究步驟如下:
(1)檢索目標新興交叉學科及其關聯(lián)學科的科學論文,采集論文的題錄信息并對數(shù)據(jù)進行預處理。其中,關聯(lián)學科是指與新興交叉學科存在內容關聯(lián)和知識交叉的學科[36]。
(2)從學科來源和學科影響力兩個視角,提出原始學科歸屬、學科來源復雜度、新興交叉學科使用頻次、新興交叉學科地位以及關聯(lián)學科熱度五個測度指標,并計算新興交叉學科知識元的上述屬性。
(3)采用Kaplan-Meier法構建新興交叉學科知識元生存曲線,比較分析不同屬性知識元生存特征差異。
(4)引入Cox比例風險模型探究新興交叉學科知識元的學科來源和學科影響力對其生存時間的影響機制。
2.1? ? 知識元屬性測度方法
2.1.1? ?知識元生存時間
知識元生存時間是知識元由起始觀察時間到觀察期內最后一次出現(xiàn)的時間[10],由于知識元存在“重生”現(xiàn)象,因此生存時間(T)的計算需要考慮知識元在觀察期內的“重生”時間,具體計算方法[9]如式(1)所示:
其中,t1為觀察期內知識元最后一次出現(xiàn)的時間,t0為起始觀察時間,觀察期通常設置為10年[9-10]。
2.1.2? ?學科來源
學科來源是指知識元的學科歸屬,本研究從原始學科歸屬和學科來源復雜度兩個方面對學科來源進行測度,前者用于表征知識元的學科起源,后者反映知識元跨學科程度。
(1)原始學科歸屬
現(xiàn)有研究主要通過知識元在不同學科出現(xiàn)占比確定知識元的學科歸屬[37],但是知識元的學科起源并不受知識元流動導致的學科分布差異的影響。科學論文作為新的科學研究成果或創(chuàng)新知識的科學記錄,可以反映學科知識的起源與發(fā)展脈絡[38]。因此,本研究將包含某一知識元的科學論文按其發(fā)表時間進行排序,發(fā)表時間最早的科學論文的學科類別作為知識元的原始學科歸屬,發(fā)表時間作為該知識元的首次出現(xiàn)時間,當發(fā)表時間相同時則根據(jù)論文接收時間人工判斷確定知識元的原始學科歸屬。
(2)學科來源復雜度
學科來源復雜度越高表明知識元跨學科適應能力越強。研究在學科交叉綜合測度指標Rao-Stirling指標[39]和2DS指標[40]的基礎上,將原公式中的“參考文獻”延伸為“知識元”,提出知識元學科來源復雜度(SC)測度指標,如式(2)所示:
其中,dij為學科i和學科j之間的學科距離,該值使用JCR 2019的229個WoS Category學科距離數(shù)據(jù)[40],Pi表示知識元a在學科i中出現(xiàn)頻次與在所有學科中出現(xiàn)頻次之比。
2.1.3? ?學科影響力
學科影響力代表知識元在學科內部的重要程度及其在傳播過程中的知識輸出能力[15]。研究從知識元在新興交叉學科中的使用頻次和學科地位,以及其在關聯(lián)學科中的熱度三個方面衡量新興交叉學科知識元的學科影響力。
(1)新興交叉學科使用頻次
知識元的新興交叉學科使用頻次(FU)通過其在新興交叉學科內部出現(xiàn)的總頻次進行測度,如式(3)所示:
其中,a代表知識元,T代表新興交叉學科,ST為新興交叉學科包含目標知識元的論文數(shù)量。
(2)新興交叉學科地位
知識元的新興交叉學科地位由其在知識網絡中的位置特征衡量[41],可通過點度中心度、中介中心度和PageRank等指標進行測度。實驗發(fā)現(xiàn)上述三個指標存在強正相關關系,研究選擇點度中心度作為知識元新興交叉學科地位(DP)的測度指標,如式(4)所示:
其中,da是指與知識元a共現(xiàn)的知識元數(shù)量。
(3)關聯(lián)學科熱度
關聯(lián)學科熱度代表知識元在與新興交叉學科具有內容交叉關系的學科中的使用頻次??蒲谢顒又械难芯繜岫韧浴氨灰俊钡戎笜藖砗饬浚?2]。引證行為本質上可視為對被引對象的使用行為[43]。為此,本文利用在關聯(lián)學科中的使用頻次反映其關聯(lián)學科熱度(DH)。具體計算如式(5)所示:
其中,N為關聯(lián)學科數(shù)量,a代表知識元,O代表關聯(lián)學科,SO為關聯(lián)學科包含目標知識元的論文數(shù)量。
2.2? ? 生存分析過程
研究采用Kaplan-Meier法構建新興交叉學科知識元的生存曲線,并剖析不同屬性知識元的生存特征差異,在此基礎上利用Cox比例風險模型探究知識元屬性對其生存時間的影響機制,具體過程如下:
首先,將學科來源和學科影響力視角下的原始學科歸屬、學科來源復雜度、新興交叉學科使用頻次、新興交叉學科地位和關聯(lián)學科熱度等五個屬性按照相應的閥值進行分組;其次,采用Kaplan-Meier法分別構建五個屬性下的知識元生存曲線,探究不同屬性新興交叉學科知識元的生存特征差異;最后,利用Cox比例風險模型同時對五個屬性進行分析,剖析每個屬性對新興交叉學科知識元生存時間的影響機制。
3? ?實證研究
3.1? ? 數(shù)據(jù)采集
醫(yī)學信息學(Medical Informatics,MI)起源于20世紀70年代,是在醫(yī)學(MED)、計算機科學(CS)、衛(wèi)生保健學(HC)、統(tǒng)計學(STAT)四個主要關聯(lián)學科的基礎上發(fā)展起來的新興交叉學科[17]。本研究選取醫(yī)學信息學作為新興交叉學科的代表開展實證分析。在Web of Science核心合集中以“WoS Category=學科名”為檢索式,檢索發(fā)表于1900年-2019年、類型為Article的科學論文,獲取相關論文的題錄信息。剔除缺少作者關鍵詞字段的論文后,得到五個學科論文數(shù)(見圖2(a))。其中,醫(yī)學信息學由于發(fā)展起步較晚,論文數(shù)少于四個關聯(lián)學科,為43,300篇。四個關聯(lián)學科中醫(yī)學論文數(shù)最多,衛(wèi)生保健學最少。由于論文作者關鍵詞大量缺失,導致1990年以前的數(shù)據(jù)分布較為稀疏,因此只考慮1990年-2019年間論文隨時間分布情況,可得出五個學科的論文時間分布(見圖2(b))。其中,各學科論文數(shù)整體上保持逐年增長的趨勢。五個學科在2005年以前論文增長速度相對穩(wěn)定,除統(tǒng)計學外其他四個學科論文數(shù)在2005年以后迅速增加,論文數(shù)在15年間增長近三倍。
對采集到的作者關鍵詞進行詞干提取、詞形還原等預處理,統(tǒng)計得到作者關鍵詞的數(shù)量分布(見圖2(c))。其中,五個學科的篇均關鍵詞數(shù)為4.737個,醫(yī)學信息學篇均關鍵詞數(shù)最多,為5.007個。進一步統(tǒng)計各學科關鍵詞數(shù)在1990年-2019年間隨時間的變化情況(見圖2(d))可以發(fā)現(xiàn),醫(yī)學、計算機科學、衛(wèi)生保健學和醫(yī)學信息學的關鍵詞數(shù)呈現(xiàn)逐年增長的趨勢,而統(tǒng)計學則相對趨于穩(wěn)定。
3.2? ? 知識元生存特征差異分析
知識元生存分析常用的觀察期為10年。從圖2(d)中可以看出2006年開始關鍵詞數(shù)出現(xiàn)明顯的增長,由于起始觀察時間之前需要有足夠年份的數(shù)據(jù)確定知識元的學科來源和學科影響力,起始觀察時間之后需要預留10年觀察期,為避免選取只選取某一年造成的偶然性,本研究在綜合考慮數(shù)據(jù)量和數(shù)據(jù)魯棒性的基礎上選取2007年-2009年醫(yī)學信息學出現(xiàn)的作者關鍵詞整體作為新興交叉學科知識元,去重后共得到11798個知識元。探究上述知識元在后續(xù)10年的生存特征,對應的觀察期分別為2008年-2017年、2009年-2018年、2010年-2019年。
構建新興交叉學科知識元的生存函數(shù)和風險函數(shù)(見圖3)。知識元在觀察期第一年生存函數(shù)降低較快,對應的風險函數(shù)急劇上升,之后生存函數(shù)和風險函數(shù)趨勢都相對平緩,平均生存時間為4.41年,數(shù)據(jù)刪失率約為21.2%,說明大部分知識元在觀察期內出現(xiàn)一次就迅速消失,僅有約五分之一的知識元能夠適應新興交叉學科的創(chuàng)新發(fā)展需要。
3.2.1? ?學科來源視角下知識元生存特征
(1)原始學科歸屬
分析醫(yī)學信息學知識元的原始學科歸屬分布(見圖4)可以發(fā)現(xiàn):超三成的知識元原始學科歸屬為醫(yī)學信息學,表明新產生的知識元在醫(yī)學信息學知識體系中占主導地位。關聯(lián)學科中醫(yī)學和衛(wèi)生保健學的知識元合計占比約40%,是醫(yī)學信息學重要的知識來源。
采用Kaplan-Meier法構建知識元生存曲線,結果顯示不同原始學科歸屬的知識元生存時間存在顯著差異(見圖5)。原始學科歸屬為醫(yī)學的知識元生存時間要顯著高于其他學科,在觀察期結束仍保持30%左右的生存率,而醫(yī)學信息學知識元在觀察期的第一年生存率就降到25%左右,整體生存時間顯著低于其他四個學科。Log Rank和Breslow檢驗結果顯著性為0.000。
(2)學科來源復雜度
分析醫(yī)學信息學與其關聯(lián)學科之間的學科距離(見圖6)發(fā)現(xiàn):醫(yī)學信息學與衛(wèi)生保健學和醫(yī)學的距離更近,與統(tǒng)計學和計算機學科的距離較遠。關聯(lián)學科之間除醫(yī)學與衛(wèi)生保健學距離相近,其他關聯(lián)學科間的距離都較遠,在一定程度上也表明醫(yī)學信息學的學科知識來源廣泛。
根據(jù)式(2)和學科距離數(shù)據(jù)計算得到知識元學科來源復雜度分布(見圖7)??梢园l(fā)現(xiàn)絕大多數(shù)知識元的學科來源復雜度在0到0.6之間,呈現(xiàn)先升高、后波動、再降低的變化趨勢,整體分布呈“M”型且較為分散。部分僅出現(xiàn)于新興交叉學科的知識元對應的學科來源復雜度為0。
考慮到學科來源復雜度在0.15-0.2和0.35-0.4兩個區(qū)間內出現(xiàn)峰值,按照0.16和0.36的閥值將知識元近似等分為學科來源復雜度較低、中等和較高的三組(見表1和圖8),學科來源復雜度越高對應的知識元平均生存時間越長,說明知識元的跨學科適配能力會對生存時間造成顯著影響。學科來源復雜度在(0.36,1]區(qū)間的知識元平均生存時間為5.43年,大于學科來源復雜度中等的4.48年和學科來源復雜度較低的3.56年。Log Rank和Breslow檢驗結果顯著。
3.2.2? ?學科影響力視角下知識元生存特征
(1)新興交叉學科使用頻次
統(tǒng)計在醫(yī)學信息學內部知識元的使用頻次(見圖9)可知:新興交叉學科使用頻次總體呈下降趨勢,知識元在觀察期內平均使用頻次為6.41次,大部分集中于0次-10次區(qū)間內,使用頻次較高的知識元僅占總數(shù)的極少部分,使用頻次最大值為772次。
根據(jù)帕累托法則將新興交叉學科使用頻次分為低頻和高頻兩類,對應的使用頻次分別為0次-6次和7次-772次。對照其生存函數(shù)(見圖10)發(fā)現(xiàn),低頻知識元在觀察期的第一年生存率就降至40%以下,而高頻知識元在觀察期的最后一年仍有約75%的生存率,可以看出新興交叉學科使用頻次會顯著影響知識元的生存時間,新興交叉學科使用頻次越高,對應的知識元生存時間越長。
(1)新興交叉學科地位
通過知識元共現(xiàn)情況計算得到知識元的新興交叉學科地位(具體分布情況見圖11)。呈現(xiàn)先上升再下降趨勢,峰值出現(xiàn)在6附近,說明大部分知識元僅出現(xiàn)一次且只與其所在論文的其他知識元存在共現(xiàn)關系。新興交叉學科地位在30之后曲線逐漸趨于平緩,僅有約四分之一的知識元在知識網絡中與超過30個節(jié)點共現(xiàn)。為此,以6和30為分界將新興交叉學科地位劃分為較低、中等和較高三類。
從不同新興交叉學科地位的知識元生存曲線(見圖12)可以看出,學科地位較低的知識元在觀察期的第一年生存概率就降到5%以下,這些知識元通常僅在新興交叉學科中“曇花一現(xiàn)”。學科地位較高的知識元則在觀察期內保持60%以上的生存率,Log Rank和Breslow檢驗結果均為0.000,這是因為學科地位較高的知識元與更多知識元存在共現(xiàn)關系,而知識網絡中的共現(xiàn)會促進知識元之間的交互融合與協(xié)同創(chuàng)新,從而顯著提升知識元的生存時間。
(3)關聯(lián)學科熱度
從知識元的關聯(lián)學科熱度分布(見圖13)來看,關聯(lián)學科熱度整體呈下降趨勢。其中,關聯(lián)學科熱度在0-5之間快速下降,然后在5-40之間下降幅度趨緩,在40之后逐漸保持穩(wěn)定,說明知識元在關聯(lián)學科中的使用頻次都不高且服從冪律分布。
研究根據(jù)關聯(lián)學科熱度的分布情況劃分為“關聯(lián)學科熱度>40”“5<關聯(lián)學科熱度≤40”“關聯(lián)學科熱度≤5”三類,并得到對應的生存曲線(見圖14)。知識元生存時間按照上述順序遞減,且后兩者之間的差異大于前兩者的差異。
3.3? ? 知識元生存時間影響機制分析
根據(jù)不同屬性知識元生存特征分析結果發(fā)現(xiàn),學科來源和學科影響力都會不同程度影響知識元生存時間,采用Cox比例風險模型進一步探究學科來源和學科影響力對新興交叉學科知識元生存時間的影響機制。對照知識元生存影響因素分類標準(見表2),每組分類變量均以第一個取值為參照。
計算Cox比例風險模型回歸結果(見表3)可得知,相較于原始學科歸屬為醫(yī)學信息學的知識元,原始學科歸屬_CS的相關性系數(shù)為正值,這表明原始學科歸屬為計算機科學會增加知識元的生存風險,減少知識元的生存時間,原始歸屬學科為醫(yī)學、衛(wèi)生保健學、統(tǒng)計學則對知識元生存時間的影響并不顯著。計算機科學作為學科交叉過程中的方法論學科,其支配新興交叉學科工具使用和技術應用[44],技術工具的更迭勢必會導致知識元生存時間的不確定性。學科來源復雜度較高和中等的知識元生存風險分別為學科來源復雜度較低知識元的0.883倍和0.877倍,值得注意的是,生存風險最低的是學科來源復雜度中等的知識元,造成此結果的原因可能是學科來源復雜度較低的知識元難以流動到關聯(lián)學科,而學科來源復雜度較高的知識元往往已經被關聯(lián)學科普遍接受和使用,創(chuàng)新性逐漸降低的同時使用頻次也慢慢減少,從而體現(xiàn)為更短的生存時間。
同樣的,學科影響力也顯著影響知識元生存時間,知識元的生存風險隨新興交叉學科使用頻次、新興交叉學科地位與關聯(lián)學科熱度的增加而降低。新興交叉學科使用頻次的Exp(B)為0.294,表明新興交叉學科使用頻次較高的知識元生存風險是使用頻次較低知識元的0.294倍。新興交叉學科地位中等和較高的回歸系數(shù)分別為-0.986和-1.593,表明新興交叉學科地位是知識元生存時間的重要因素,知識元的新興交叉學科地位越高,對應的平均生存時間越長。關聯(lián)學科熱度中等和較高的Exp(B)分別為0.777和0.549,表明關聯(lián)學科熱度中等和較高的知識元生存風險相比關聯(lián)學科熱度較低的知識元降低22.3%和45.1%,即關聯(lián)學科熱度較高的知識元在新興交叉學科普遍具有更長的生存時間。
4? ?研究結論與展望
本研究以醫(yī)學信息學及其關聯(lián)學科為例探究新興交叉學科知識元生存特征及其影響機制,運用Kaplan-Meier法分析不同屬性知識元的生存特征差異,在此基礎上采用Cox比例風險模型從學科來源和學科影響力兩個視角探究新興交叉學科知識元的生存時間影響機制。得到以下發(fā)現(xiàn):
(1)從知識元屬性來看,學科來源和學科影響力都會對新興交叉學科知識元生存時間造成不同程度的影響,學科來源表征知識元的學科起源和跨學科程度,而學科影響力反映知識元在知識網絡中的知識輸出能力,前者是對知識元自身屬性的刻畫,后者則從外部視角描述知識元跨學科傳播的可能性,且后者對于知識元生存時間的影響大于前者的影響。
(2)研究以醫(yī)學信息學知識元作為對象,但是由于醫(yī)學信息學科學范式仍在不斷地發(fā)展完善,加劇了新知識元的出現(xiàn)與消失,導致醫(yī)學信息學的知識元生存時間顯著低于知識結構更為成熟的關聯(lián)學科。
(3)考慮到知識元的學科歸屬對于生存時間的影響較弱,而選取醫(yī)學信息學作為代表是基于其豐富的多學科交叉數(shù)據(jù),因此研究結論可以推廣到一般性的交叉學科。
本研究也存在一些不足,在進行關鍵詞匹配時,僅考慮了詞形上的一致,沒有考慮在學科交叉過程中跨學科導致的語義漂移現(xiàn)象,未能從語義和語義功能上對知識元進行更加有效的區(qū)分。后續(xù)將在考慮跨學科語義的基礎上,識別知識元在學科交叉過程中的流動情況,實現(xiàn)學科交叉點的識別與生存預測。
參考文獻:
[1]? Wagner C S,Roessner J D,Bobb K,et al.Approaches to understanding and measuring interdisciplinary scientific research(IDR):A review of the literature[J].Journal of Informetrics,2011,5(1):14-26.
[2]? 張琳,孫蓓蓓,黃穎.交叉科學研究:內涵、測度與影響[J].科研管理,2020,41(7):279-288.
[3]? 韓啟德.學科交叉與現(xiàn)代科學范式轉移——在全國首屆前沿交叉學科論壇暨前沿交叉研究院聯(lián)席會上的講話[J].大學與學科,2021,2(1):1-4.
[4]? 文庭孝,羅賢春,劉曉英,等.知識單元研究述評[J].中國圖書館學報,2011,37(5):75-86.
[5]? 索傳軍.知識轉移視角下的學術論文老化與創(chuàng)新研究[J].圖書情報工作,2014,58(5):5-12.
[6]? Zhuge H.Semantics Resource and Grid[J].Future Generation Computer Systems,2004,20(1):1-5.
[7]? 戎軍濤,李蘭.知識元的本質、結構與運動機制研究[J].情報理論與實踐,2020,43(1):42-46,41.
[8]? 彭非,王偉.生存分析[M].北京:中國人民大學出版社,2004.
[9]? Peset F,Garzón-Farinós F,González L,et al.Survival analysis of author keywords:An application to the library and information sciences area[J].Journal of the Association for Information Science and Technology,2020,71:462-473.
[10]? 劉智鋒,李信.作者關鍵詞生存分析——以國內圖情領域為例[J].圖書館雜志,2020,39(7):48-57.
[11]? 孫佳佳,李雅靜.基于關鍵詞價值細分的高價值熱點主題識別方法研究[J].情報學報,2022,41(2):118-129.
[12]? 劉智鋒,馬永強,楊金慶.詞匯功能視角下關鍵詞生存時間影響因素研究[J].現(xiàn)代情報,2023,43(1):151-162.
[13]? 王傳毅,李祎.多樣性和凝聚性:國內高校自主設置交叉學科的結構特征[J].大學教育科學,2023(1):35-47.
[14]? 朱小平,張家軍.論我國交叉學科建設的規(guī)訓隱憂及消解路徑[J].高校教育管理,2022,16(5):52-63,72.
[15]? 李樵.外部引用視角下的中國圖書情報學知識影響力研究[J].中國圖書館學報,2019,45(6):65-83.
[16]? 張玲玲,張宇娥,杜麗.國家社科基金項目成果視角下圖情領域知識擴散研究[J].圖書館工作與研究,2017,(10):60-66.
[17]? 操玉杰,梁鎮(zhèn)濤,毛進.知識模因視角下跨學科研究領域的學科結構分析[J].圖書館論壇,2019,39(7):84-90.
[18]? Singer J D,Willett J B.Its About Time:Using Discrete-Time Survival Analysis to Study Duration and the Timing of Events[J].J Educ Stat,1993(18):155-195.
[19]? 王學敏,張維紅,杜偉嬌,等.阿帕替尼用于一線治療進展后晚期非鱗非小細胞肺癌的療效和生存分析[J].中國肺癌雜志,2017,20(11):761-768.
[20]? 張世偉,趙亮.農村勞動力流動的影響因素分析——基于生存分析的視角[J].中國人口·資源與環(huán)境,2009,19(4):101-106.
[21]? 陳勇兵,錢意,張相文.中國進口持續(xù)時間及其決定因素[J].統(tǒng)計研究,2013,30(2):49-57.
[22]? 陳瓂浩,李綱.突發(fā)社會安全事件網絡輿情演化的生存分析——基于70起重大社會安全事件的分析[J].情報雜志,2016,35(4):70-74.
[23]? 張建衛(wèi),王健,周潔,等.高校高層次領軍人才成長的實證研究[J].科學學研究,2019,37(2):235-244.
[24]? 張中文,徐天和,董秀芬,等.學術期刊論文生存被引次數(shù)的定義與應用[J].編輯學報,2015,27(4):316-319.
[25]? 瞿群臻,高思玉,汪鵬飛,等.基于生存分析視角的戰(zhàn)略科學家成長路徑研究[J].中國科技論壇,2022(7):157-166.
[26]? 孫玉濤,張帥.海外青年學術人才引進政策效應分析——以“青年千人計劃”項目為例[J].科學學研究,2017,35(4):511-519.
[27]? 孫玉濤,陳靈芝.諾獎候選人學術影響、提名人身份與獲獎概率[J].科學學研究,2019,37(9):1550-1557.
[28]? 張建衛(wèi),李海紅,喬紅,等.生存分析視角下杰出青年科技人才的成長路徑研究[J].中國科技論壇,2020,287(3):158-165.
[29]? 朱世琴,蔣辛未.基于CSSCI的人文社科期刊文獻老化風險率研究[J].情報學報,2017,36(10):1031-1037.
[30]? 歐桂燕,龐娜,吳江.專利審查周期影響因素研究——以中國人工智能領域為例[J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2022,6(8):20-30.
[31]? 宋爽,陳向東.區(qū)域技術差異對專利價值的影響[J].科研管理,2016,37(9):68-77.
[32]? 索傳軍,蓋雙雙.知識元的內涵、結構與描述模型研究[J].中國圖書館學報,2018,44(4):54-72.
[33]? 孫震,冷伏海,張晉輝.基于知識元的科學計量方法及其實證研究[J].圖書情報工作,2017,61(23):89-99.
[34]? Zhang J,Yu Q,Zheng F,et al.Comparing keywords plus of WOS and author keywords:A case study of patient adherence research[J].Journal of the Association for Information Science and Technology,2016,67(4),967-972.
[35]? 王康,陳悅,蘇成,等.多維視角下科學主題演化分析框架[J].情報學報,2021,40(3):297-307.
[36]? 王昊,蘇新寧.基于CSSCI本體的學科關聯(lián)分析[J].現(xiàn)代圖書情報技術,2010,198(10):10-16.
[37]? 楊賀,楊奕虹,李寧.關鍵詞-分類號關聯(lián)詞表構建[J].現(xiàn)代圖書情報技術,2013,(Z1):107-113.
[38]? 樓雯,蔡蓁.科學論文評價的涵義與方式研究綜述[J].情報雜志,2021,40(5):171-177.
[39]? Stirling A.A general framework for analysing diversity in science,technology and society[J].Journal of the Royal Society Interface,2007,4(15):707-719.
[40]? Lin Zhang,Loet Leydesdorff.The Scientometric Measurement of Interdisciplinarity and Diversity in the Research Portfolios of Chinese Universities[J].Journal of Data and Information Science,2021,6(4):13-35.
[41]? 林波,薛惠鋒,苗治平.網絡組織知識獲取模型及其仿真分析[J].情報雜志,2009,28(11):150-155.
[42]? 榮國陽,李長玲,范晴晴,等.主題熱度加速度指數(shù)——學科研究熱點識別新方法[J].圖書情報工作,2021,65(20):59-67.
[43]? Liu Y,Rafols I,Rousseau R.A framework for knowledge integration and diffusion[J].Journal of documentation,2012,68 (1) :31-44.
[44]? 馬費成,張帥.我國圖書情報領域新興交叉學科發(fā)展探析[J].中國圖書館學報,2023,49(2):4-14.
作者簡介:張宇,男,南京大學信息管理學院碩士研究生,研究方向:知識組織與管理;馬亞雪,女,南京大學信息管理學院博士后,研究方向:科技創(chuàng)新;李悅,女,南京大學信息管理學院碩士研究生,研究方向:科學計量;孫建軍,男,南京大學信息管理學院教授,博士生導師,研究方向:信息資源管理。