吳 斌,鄧 藝,龔金梅,鄔 平
(云南省科學技術情報研究院,云南昆明 650051)
2021 年5 月28 日,習近平總書記在“科技三會”上發(fā)表重要講話,再次強調(diào)堅持創(chuàng)新在我國現(xiàn)代化建設全局中的核心地位,把科技自立自強作為國家發(fā)展的戰(zhàn)略支撐。區(qū)域技術創(chuàng)新力作為地區(qū)生產(chǎn)力結構改革和動力機制轉換的原始創(chuàng)新動力[1],不僅能有效撬動先進生產(chǎn)力的跨越式發(fā)展,還能持續(xù)性地培育區(qū)域經(jīng)濟發(fā)展的新業(yè)態(tài)與新模式。科技資源共享服務體系作為催化科技原始創(chuàng)新的“助燃劑”,可以有效刺激區(qū)域科技資源主動開放互聯(lián)與協(xié)同共享的意愿,引導區(qū)域間錯位發(fā)展,構建優(yōu)勢互補的區(qū)域創(chuàng)新發(fā)展格局[2]。大型科研儀器是開展科學研究、支撐知識和技術創(chuàng)新的重要物質(zhì)基礎,為我國科學前沿探索、戰(zhàn)略性高新技術突破和社會發(fā)展提供了重要支撐[3]。周小平[4]、王肖波等[5]、許歡[6]、蔡萌等[7]的研究表明,大型科研儀器承擔著繁重的科學測試分析與理論實證的重任,可以有效支撐新品開發(fā)研制,加快企業(yè)科技創(chuàng)新的步伐,因此其分析測試內(nèi)容能在一定程度上反映區(qū)域當前技術發(fā)展水平和趨勢。鑒于此,通過對大型科研儀器承擔的大量具體分析測試內(nèi)容進行內(nèi)容挖掘,繪制出當前區(qū)域重要行業(yè)的技術發(fā)展趨勢,并將其作為一種行動指南和戰(zhàn)略規(guī)劃制定的重要手段[8],可以動態(tài)反映區(qū)域內(nèi)重點行業(yè)的技術創(chuàng)新空間格局的演變,為管理部門制定科技發(fā)展規(guī)劃提供指引,同時及時發(fā)現(xiàn)科研領域內(nèi)有關技術研發(fā)相互重合的現(xiàn)象并調(diào)整發(fā)展策略,防止“內(nèi)卷”。
目前大量關于區(qū)域技術創(chuàng)新能力的研究主要集中在區(qū)域間分布與產(chǎn)業(yè)集聚和區(qū)域技術創(chuàng)新能力評價兩個方面。
在區(qū)域間分布與產(chǎn)業(yè)集聚方面,肖玉賢等[9]基于文獻計量法發(fā)現(xiàn)我國區(qū)域創(chuàng)新能力水平呈現(xiàn)東西部差異明顯、鄰近城市發(fā)展相似的特點,這意味著區(qū)域之間存在緩慢流動的技術創(chuàng)新力,但具體流動的模式仍有待進一步探索;楊騫等[10]利用二次指派程序(quadratic assignment procedure,QAP)識別技術創(chuàng)新效率的區(qū)域差異,發(fā)現(xiàn)區(qū)域間差異是呈下降趨勢的,而區(qū)域內(nèi)差異是區(qū)域總體差異主要來源;曹晨等[11]基于社會網(wǎng)絡和潛在狄利克雷分配(LDA)研究了成渝地區(qū)技術創(chuàng)新合作現(xiàn)狀,定量化分析與總結區(qū)域技術創(chuàng)新在產(chǎn)業(yè)方面發(fā)展趨勢與不足;李國鋒等[12]利用區(qū)域高新技術研發(fā)數(shù)據(jù),結合政府駐地遷移信息進行雙重差分傾向得分匹配(PSM-DID)分析發(fā)現(xiàn),政府駐地遷移會左右區(qū)域技術創(chuàng)新進程;何龍斌等[13]綜合運用空間基尼系數(shù)、行業(yè)集中度以及區(qū)位熵等方法,基于官方統(tǒng)計年鑒得到中國區(qū)域高技術發(fā)展的空間演化情況;劉乃全等[14]從區(qū)域合作論文與合作專利的視角出發(fā)分析長三角區(qū)域的科技協(xié)同創(chuàng)新時空演變,發(fā)現(xiàn)政府之間緊密的合作交流能破除技術創(chuàng)新的地域與行政限制,促進區(qū)域間創(chuàng)新力的均衡流動;李哲等[15]基于熵權法構建綜合指標評價體系,用于分析我國省份之間技術創(chuàng)新時空演變;王業(yè)強等[16]根據(jù)技術創(chuàng)新與地區(qū)差距的關系,對技術創(chuàng)新區(qū)域發(fā)展路徑進行研究。
在區(qū)域技術創(chuàng)新能力評價方面,賴一飛等[17]基于超效率SBM 模型、Malmquist 指數(shù)和托賓(Tobit)模型分析了我國技術創(chuàng)新面板數(shù)據(jù),認為政策條件、科技基礎設施以及經(jīng)濟水平是區(qū)域技術創(chuàng)新效率的關鍵影響因素;劉天壽等[18]設計了隨機森林最小二乘系統(tǒng)辨識(RFWT)模型對我國12 個自貿(mào)區(qū)進行技術創(chuàng)新能力評價,以避免主觀因素和信息重疊帶來的影響;劉立燕等[19]結合數(shù)據(jù)包絡分析(DEA)和灰色關聯(lián)度對湖南區(qū)域技術創(chuàng)新能力進行研究,同時利用變量替換以及時間序列替換驗證創(chuàng)新能力差異結果的穩(wěn)健性;杜英等[20]基于三螺旋理論構建創(chuàng)新能力評價指標體系并結合熵權法對指標進行確權,通過分析子系統(tǒng)之間的協(xié)作耦合,系統(tǒng)化地揭示不同創(chuàng)新主體對區(qū)域技術創(chuàng)新能力的影響程度。除此之外,還有如馮岑明等[21]、楊艷萍[22]、李柏洲等[23]、王曉夢[24]等學者分別使用層次分析法(AHP)、徑向基函數(shù)(RBF)、主成分分析、熵-粗糙集以及灰色關聯(lián)分析等方法來進行區(qū)域創(chuàng)新能力評價研究。
從目前的相關研究內(nèi)容來看,技術創(chuàng)新能力的區(qū)域間分布與產(chǎn)業(yè)集聚的研究側重于探索其空間分布的形成機制、科技協(xié)同與合作的動態(tài)演化過程以及技術創(chuàng)新產(chǎn)業(yè)集聚的構成因素等方面,而區(qū)域技術創(chuàng)新能力評價的研究則重點關注影響區(qū)域技術創(chuàng)新評價指標優(yōu)化以及影響技術創(chuàng)新的各類因素,然而鮮有文獻對特定區(qū)域內(nèi)技術創(chuàng)新力形成的動力機制進行探索。原因可能在于:一是部分評價指標或存在模糊性與混淆性,因此基于觀測的統(tǒng)計模型無法可靠地識別因果關系[25];二是部分有關國內(nèi)區(qū)域的實證分析多基于《中國統(tǒng)計年鑒》、中國科學技術發(fā)展戰(zhàn)略研究院的《中國區(qū)域科技創(chuàng)新評價報告2022》以及地方統(tǒng)計年鑒等宏觀數(shù)據(jù)進行跨區(qū)間的分析驗證,區(qū)域內(nèi)的空間相對獨立,僅僅一組宏觀指標(諸如用于衡量投入的科研人員占比、研發(fā)支出、人均科技投入等指標,用于衡量產(chǎn)出的技術合同、高新技術服務收入、論文、專利等指標),無法洞察區(qū)域內(nèi)技術創(chuàng)新力的動力演化機制;此外,根據(jù)當?shù)禺a(chǎn)業(yè)發(fā)展需要,技術創(chuàng)新領域的側重點不同,區(qū)域內(nèi)技術創(chuàng)新主導政策不盡相同,區(qū)域內(nèi)所形成的創(chuàng)新格局也迥然相異,如郭平等[26]、劉潔[27]、陳敬明等[28]的研究所述。
針對采用宏觀統(tǒng)計指標衡量技術創(chuàng)新力的時滯性較長、難于觀測對區(qū)域內(nèi)技術創(chuàng)新力的動力學變化的難題,有學者如羅揚等[29]、張鐵山等[30]、鄭明等[31]、戴顯紅等[32]、王曉輝[33]的研究發(fā)現(xiàn),區(qū)域內(nèi)的科技基礎設施對于技術創(chuàng)新具有正向性的引導作用;同時,有學者研究表明,科技基礎設施對技術創(chuàng)新能力的影響存在區(qū)域異質(zhì)性[34],因此對科技基礎設施的利用過程能表征當前區(qū)域的科研活動類型與技術創(chuàng)新程度。
大型科研儀器作為重要的科技基礎設施,承擔了大量高端和前沿的科學研究與科技研發(fā)任務,其所承擔的分析測試內(nèi)容不僅能代表區(qū)域內(nèi)主流的前沿科技研發(fā)活動,也是區(qū)域內(nèi)技術創(chuàng)新力的具體表現(xiàn)。綜上,本研究對云南省大型科研儀器分析測試服務數(shù)據(jù)進行語義文本聚類分析,探索不同年度的熱點技術,觀測和總結區(qū)域內(nèi)技術創(chuàng)新空間格局的演變和發(fā)展規(guī)律,為支撐區(qū)域技術創(chuàng)新發(fā)展政策與制度的制定提供相關依據(jù)。
云南省大型科研儀器開放共享服務平臺(以下簡稱“大儀平臺”)于2016 年上線投入使用,面向全省提供儀器共享、在線預約、分析檢測、服務案例瀏覽、儀器設備查詢統(tǒng)計等共享服務,其共享服務記錄包括了共享服務單位名稱、主要檢測儀器名稱、服務金額、實際服務時間、開機時間、依托課題名稱、分析測試具體內(nèi)容、服務類型、申請人姓名電話與工作單位等字段,實現(xiàn)了整個儀器分析測試服務過程的全流程記錄。其中,分析測試具體內(nèi)容記錄了具體的分析測試任務與相關的研究內(nèi)容,能體現(xiàn)開展分析測試的科研目的。
截至2022 年12 月,云南省內(nèi)入網(wǎng)儀器管理單位有135 家1),共享大型科研儀器有3 634 臺套,儀器原值共25 億元。其中,大型科研儀器設備包括分析儀器(2 306 臺/套)、計量儀器(233 臺/套)、物理性能測試儀器(220 臺/套)、電子測量儀器(53臺/套)、海洋儀器(6 臺/套)、地球探測儀器(18臺/套)、大氣探測儀器(15 臺/套)、醫(yī)學診斷儀器(152 臺/套)、核儀器(2 臺/套)、特種檢測儀器(67 臺/套)、工藝試驗設備(213 臺/套)、激光器(9 臺/套)、計算機配套設備(47 臺/套)、其他儀器(293 臺/套),共計13 個大類,能為云南省內(nèi)各類科研任務提供全面的分析測試共享服務,累計的共享分析測試服務記錄數(shù)約85 萬條(以下簡稱“樣本”)、服務案例225 個。
基于自適應虛擬慣性的微電網(wǎng)動態(tài)頻率穩(wěn)定控制策略//劉堯,陳建福,侯小超,裴星宇,李建標,粟梅//(9):75
為甄別出與研究相關的大型科研儀器設備分析測試任務,只選擇高等學校、科研院所等非以檢驗檢測為主營業(yè)務的管理單位,剔除具有市場性質(zhì)檢驗檢測機構,得到有關服務記錄數(shù)為125 639 條,服務記錄數(shù)據(jù)跨度為2015—2019 年(見圖1)。
圖1 云南省大型科研儀器共享服務記錄數(shù)年度分布
云南省的大儀平臺于2015 年上線,2017 年達到使用高峰。究其原因是,2017 年科技部、國家發(fā)展改革委與財政部印發(fā)《國家重大科研基礎設施和大型科研儀器開放共享管理辦法》,同年云南省第一次實施了大型科研儀器入網(wǎng)管理單位共享服務評價考核與激勵性后補助政策措施,在政策與獎補的雙重紅利影響下大型科研儀器設備管理單位工作積極性較高,2017 年科研分析測試的共享服務記錄數(shù)量達6 萬余條。2018 年,由于財政預算資金緊張,云南省沒有開展大型科研儀器設備共享服務考評工作,因此大型科研儀器設備共享服務記錄數(shù)回落明顯(約3.9 萬條)。2019 年年初,根據(jù)科技業(yè)務管理需要,大儀平臺統(tǒng)一遷移至云南省科技信息管理系統(tǒng),開展了為期2 年的系統(tǒng)集成改造工作。云南省2015—2019 年大儀平臺的共享服務記錄涵蓋了動植物、農(nóng)業(yè)、金屬、化工等62 家科研機構約12 萬條分析檢測數(shù)據(jù),內(nèi)容涉及了生物基因工程、生態(tài)環(huán)境監(jiān)測、復雜礦物成分分析、痕量雜質(zhì)分析、自動化檢定等與研發(fā)項目和科研課題相關的前沿性技術。
為觀察區(qū)域內(nèi)技術熱點的遷移與演變,按照時間窗口t對大型科研儀器設備分析測試的熱點進行聚類。由于各個窗口期ti聚類名稱不同,很難看出聚類之間的關聯(lián)關系,因此按時間順序將數(shù)據(jù)拆分為3 個窗口進行語料庫的切片:t1為2015—2016 年,代表分析測試在共享服務啟動階段的技術領域;t2為2017—2018 年,代表分析測試服務關注的熱點技術領域;t3為2019 年,代表分析測試所關注的最新的技術領域。其次,按ti生成對應語料庫,構造基于TF-IDF 權重的“詞項-文檔”矩陣進行文本聚類,生成基于年度的聚類網(wǎng)絡。第三,不同年份的聚類主題名不同,將不同年份之間的聚類cij(i為時間窗口,j為聚類主題)進行逐次交集運算,獲得子集合的元素個數(shù)作為毗鄰窗口的兩個聚類主題的連接頻率。不同時間窗口的兩個聚類的連接強度wxy定義如下:
式(1)(2)中:x與y分別是毗鄰時間窗口的聚類序列號;c(i+1)j為聚類主題;f(·)是集合選擇函數(shù),根據(jù)連接強度wij,選擇集合cij元素,εij是集合c(i+1)j中新出現(xiàn)的分詞術語。
技術主題演化模型如圖2 所示。
圖2 云南省技術創(chuàng)新領域技術主題演化模型
最后,從最初時間的每個聚類主題選擇連接強度wij最大值作為技術演化路徑,最終形成基于時間的技術演化路徑。初始化每個聚類演化路徑:
對樣本數(shù)據(jù)進行清洗,基于時間窗口進行切片,并利用jiebaR 構建基于時間序列的多個語料庫(corpus),同時利用tm 工具包構建基于TD-IDF的TermDocumentMartrix 矩陣,將每條服務記錄作為一個文本(document)。在海量服務記錄的情況下,基于TD-IDF 構建的稀疏矩陣會產(chǎn)生大量的稀疏詞條,設置閥值98%進行過濾,對語料數(shù)據(jù)進行Hopkins 聚類趨勢分析,得到主題聚類具體情況見表1,基于時間切片的層次聚類分別如圖3~圖5 所示。
表1 基于樣本數(shù)據(jù)的主題聚類情況
圖3 樣本數(shù)據(jù)按時間切片t1 的文本聚類
圖4 樣本數(shù)據(jù)按時間切片t2 的文本聚類
圖5 樣本數(shù)據(jù)按時間切片t3 的文本聚類
鑒于樣本數(shù)據(jù)形成的多個聚類中的詞條數(shù)量較少,無法形成主題,因此選擇包含詞條數(shù)量為5 條以上的聚類作為時間切片的聚類主題(見表2):時間窗口t1中聚類1 主要是化學成分檢測,聚類2偏重環(huán)境監(jiān)測,聚類3 偏重食品成分測量,聚類4與聚類5 偏重化肥與農(nóng)藥的分析測試;時間窗口t2中聚類1 偏重生物元素的定量分析,聚類2 偏重環(huán)境監(jiān)測,聚類3 偏重食品安全測量,聚類4 偏重儀器的檢定;時間窗口t3中聚類1 偏重環(huán)境監(jiān)測,聚類2偏重儀器的檢定,聚類3偏重病原菌的分析檢測。
表2 基于樣本數(shù)據(jù)的技術聚類主題分布
為進一步觀察技術演化路徑,利用stringdist 工具包計算不同時間切片的相似度矩陣(見圖6),以代表不同技術主題聚類的連接強度wxy,并作為技術主題的演化路徑。
圖6 基于樣本數(shù)據(jù)不同時間切片的技術主題聚類連接強度矩陣
將t1與t2、t2與t3技術主題聚類連接強度矩陣進行乘積運算并進行歸一化處理,得到全部技術演化矩陣(見表3)。
表3 基于樣本數(shù)據(jù)的技術主題聚類連接強度矩陣
分析以上技術主題聚類連接強度矩陣中的數(shù)值不難發(fā)現(xiàn),云南省大型科研儀器開展分析測試與科研任務主要涉及環(huán)境監(jiān)測、農(nóng)肥分析、食品安全、生命科學以及儀器檢定5 個方面。其發(fā)展趨勢包括以下4 個方面:
一是環(huán)境監(jiān)測一直是科研分析與研究的主要領域。這與近年來云南省積極部署生物多樣性與生態(tài)安全戰(zhàn)略有關,特別是聯(lián)合國生物多樣性大會(COP15)在昆明舉辦之后,云南省在生態(tài)安全領域設立并推進了多項重大工程,環(huán)境監(jiān)測是其中的重要工作任務。
二是從起初的食品檢驗向食品安全檢驗方面過渡。近年來,國內(nèi)食品安全事件不斷出現(xiàn),為保障人民生命安全,云南省積極開展各類重大食品安全突發(fā)事件演練,使得食品安全檢驗任務量大為提升,特別是在新冠病毒感染疫情之后,倒逼研究人員大量開展了對食品安全檢測的各類研究。
三是儀器檢測成為一項重要工作。儀器檢測從t2時間窗口成為熱點領域,從時間線可知,自中美貿(mào)易摩擦以來,自主研發(fā)國產(chǎn)儀器成為了我國的一項緊要任務,特別是大型儀器設備的研制與開發(fā)成為了科研攻關的重要領域,因此儀器檢測的相關研究成為了對設備測試與分析的主要關注對象。
四是病原微生物分析檢測成為重要領域。近年來甲型流感、登革熱、埃博拉、新冠病毒感染等傳染病的暴發(fā),對全球公共衛(wèi)生產(chǎn)生巨大的影響,而病原體檢測技術在上述疾病的診斷和防控中發(fā)揮了重要作用,因此加強全基因組學檢測技術的應用、開發(fā)新型的快速便攜式檢測方法以及快速識別病原微生物,對于人類以及動物的健康、公共衛(wèi)生安全、食品安全意義重大。
根據(jù)大型科研儀器共享服務數(shù)據(jù)的技術時空演化路徑發(fā)展趨勢來看,云南省應重點在生物多樣性與生態(tài)安全、食品與生命科學以及大型設備制造、生物醫(yī)藥和大健康產(chǎn)業(yè)方面開展相關科研攻關,順應省內(nèi)技術創(chuàng)新發(fā)展的訴求。
一是構建完備的生物多樣性與生態(tài)安全監(jiān)測評估體系。主要是重視完善生物多樣性調(diào)查監(jiān)測技術標準體系,組織開展重點區(qū)域生態(tài)系統(tǒng)、重點生物物種及重要生物遺傳資源調(diào)查,構建生態(tài)定位站點等監(jiān)測網(wǎng)絡,以及相關數(shù)據(jù)庫建設等;同時探索衛(wèi)星遙感、無人機航空遙感、人工智能應用,在保障生物遺傳資源信息安全的前提下實現(xiàn)數(shù)據(jù)共享,研究開發(fā)生物多樣性預測預警模型,建立預警技術體系和應急響應機制等。
二是培育健康食品,開展綠色生態(tài)農(nóng)業(yè)研究。在農(nóng)業(yè)主管部門的協(xié)調(diào)下,組織農(nóng)業(yè)科研機構開展定向科研任務,支撐特色農(nóng)林資源培育與生物種業(yè)、轉基因育種與安全評價,推動全基因組設計育種的基礎科學問題研究;同時大力開發(fā)綠色農(nóng)藥,研究新型除/殺草劑,為綠色農(nóng)業(yè)的食品安全管理提供基礎支撐。
三是開展儀器檢驗檢測創(chuàng)新能力研究。依托省級大型科研儀器共享服務平臺,在科技主管部門協(xié)調(diào)下,針對云南省八大支柱產(chǎn)業(yè)的關鍵技術項目、重點研究項目等,開展儀器自動化、智能化與智慧化的分析檢測與服務,統(tǒng)籌實現(xiàn)儀器檢驗檢測的資源互通共享,提升區(qū)域協(xié)同創(chuàng)新服務能力,同時加強推動關鍵計量測試儀器國產(chǎn)化,促進國產(chǎn)計量測試設備的推廣使用;基于現(xiàn)有儀器進行適度的檢測分析工藝改造,提升儀器靈敏度、分辨率、分析速度等,并注重在原位測量、追蹤測量等領域開展技術創(chuàng)新研究,同時結合人工智能相關技術加強探索研究儀器分析的智能判斷和預測方法,以提升全省整體科技服務創(chuàng)新能力。
四是加快生物醫(yī)藥與大健康發(fā)展。集聚云南省資源要素,推動生物醫(yī)藥與大健康產(chǎn)業(yè)集聚化發(fā)展。目前云南省疫苗產(chǎn)業(yè)集群基本建成,加之省內(nèi)中藥材資源優(yōu)勢比較突出,應開展關鍵技術攻關、科研成果轉化,推進細胞、中藥、疫苗等生物醫(yī)藥產(chǎn)業(yè)全面發(fā)展,同時要培育疫苗龍頭企業(yè),壯大中藥材種植(養(yǎng)殖)企業(yè),引進和培育細胞工程和基因科技產(chǎn)業(yè)集群。
區(qū)域科研活動是技術創(chuàng)新能力的具體體現(xiàn),而科研活動必然離不開對科研儀器設備的使用,因此本研究通過對云南省開放共享的海量大型科研儀器設備服務記錄數(shù)據(jù)按時間切片進行文本挖掘,同時基于文本聚類形成多條技術演化的時空鏈路,由此具體觀察區(qū)域內(nèi)技術演化趨勢,在一定程度上把握區(qū)域科研活動的現(xiàn)狀與趨勢;同時,結合區(qū)域科技發(fā)展的實際情況,基于研究發(fā)現(xiàn)總結得到區(qū)域技術創(chuàng)新發(fā)展的啟示,并給出具有針對性的發(fā)展建議,為區(qū)域內(nèi)科技主管部門在科技創(chuàng)新布局與科技發(fā)展規(guī)劃方面提供參考,支持區(qū)域技術創(chuàng)新發(fā)展。
下一步,將通過神經(jīng)網(wǎng)絡對本研究構建的模型進行優(yōu)化,提升有關文本聚類精度、優(yōu)化技術主題聚類,使得對技術路徑時空演化趨勢的判別更加準確。
注釋:
1)此數(shù)據(jù)為筆者根據(jù)有關官方網(wǎng)站信息統(tǒng)計而得。如無特別說明,文內(nèi)其他有關數(shù)據(jù)來源均同此。