沈晚笑 蔡劍 滕憶希 王旭波
(1.浙江育英職業(yè)技術(shù)學(xué)院 浙江 杭州 310012;2.浙江省疾病預(yù)防控制中心 浙江 杭州 310051;3.浙江大學(xué)公共衛(wèi)生學(xué)院 浙江 杭州 310058;4.麗水學(xué)院 浙江 麗水 323000)
國家自然科學(xué)基金(以下簡稱“NSFC”)自設(shè)立以來,因其公平、公正的評審程序、深遠(yuǎn)的影響力和覆蓋全面的資助范圍,受到科研工作者的廣泛認(rèn)可。NSFC在推動國家基礎(chǔ)研究發(fā)展、促進(jìn)學(xué)科建設(shè)和培養(yǎng)科技創(chuàng)新人才等方面也取得了巨大的成就。然而,由于申請數(shù)量的持續(xù)增加,競爭日益激烈。項目課題名稱是項目的核心,能直觀的展現(xiàn)出所研究的主要內(nèi)容和方向,因此本文對2014年至2016年立項項目進(jìn)行詞云分析,力求從一個全新的角度,形象、客觀地揭示自然科學(xué)基金的研究熱點和趨勢,為更好總結(jié)資助結(jié)構(gòu)、提升科研人員項目申請中標(biāo)率提供參考。
研究數(shù)據(jù)來源于互聯(lián)網(wǎng)檢索出的2224個2014-2016年的NSFC立項項目和1305個2015年浙江省自然科學(xué)基金立項項目。
本文采用R軟件對2014-2016年NSFC立項項目課題進(jìn)行詞云分析,以txt的格式導(dǎo)入每年的立項項目,利用R軟件的4個包RColorBrewer、wordcloud、rJava、Rwordseg分析立項課題的詞頻,并進(jìn)行可視化操作,比較不同年份詞云圖中的關(guān)鍵詞以分析NSFC立項項目研究熱點及演變趨勢。
檢索到2014年NSFC立項項目212個,對立項項目課題進(jìn)行詞云分析,拆分為872個詞匯,其中“研究”出現(xiàn)頻率最高,共出現(xiàn)160次,頻次為8.5%,遠(yuǎn)高于位列第二的“機(jī)制”2.2%。刪除“研究”進(jìn)一步對立項課題熱點詞進(jìn)行分析,通過詞云圖的方式對排名靠前的高頻詞進(jìn)行呈現(xiàn),結(jié)果顯示,2014年NSFC排名前十的熱點詞為“機(jī)制”、“基于”、“及其”、“作用”、“機(jī)理”、“方法”、“技術(shù)”、“應(yīng)用”、“細(xì)胞”和“控制”。所分析的2014年NSFC項目中出現(xiàn)頻次小于0.15%的詞語共742個,有“喚醒”、“天線”、“出行”等。
2.2.1 2015年NSFC立項項目
檢索到2015年NSFC立項項目550個,對立項項目課題進(jìn)行詞云分析,拆分為1725個詞匯,其中,出現(xiàn)最多的詞是“研究”,出現(xiàn)頻次為7.9%,其次是“機(jī)制”,出現(xiàn)頻次3.1%,“基于”出現(xiàn)頻次1.8%,如表1所示。刪除“研究”后通過詞云圖進(jìn)一步對立項課題熱點詞進(jìn)行分析,2015年排名前十的的熱點詞為“機(jī)制”、“基于”、“作用”、“機(jī)理”、“及其”、“細(xì)胞”、“調(diào)控”、“分子”、“技術(shù)”和“功能”。在2015年NSFC立項項目中,僅出現(xiàn)一次的詞語為1138個,占總詞數(shù)23.02%,其中有157個詞在2014年NSFC立項課題中出現(xiàn),包括“遙感”、“木質(zhì)素”、“瀝青”等。
2.2.2 2015年NSFC生命科學(xué)部立項項目
對檢索到的2015年自然科學(xué)基金立項題目進(jìn)行深入分析,其中2015年NSFC生命科學(xué)部立項項目共108項,占2015年NSFC立項項目的20%。詞云分析結(jié)果顯示可拆分為447個詞語?!把芯俊背霈F(xiàn)頻率依然最高,出現(xiàn)頻次為3%,其次是“機(jī)制”、“調(diào)控”、“細(xì)胞”,出現(xiàn)頻率均超1.5%。剔除“研究”后,對2015年NSFC生命科學(xué)部立項課題進(jìn)一步分析發(fā)現(xiàn),2015年NSFC生命科學(xué)學(xué)部排名前十的熱點詞分別為“機(jī)制”、“調(diào)控”、“細(xì)胞”、“作用”、“信號”、“分子”、“植物”、“免疫”、“基因”、“機(jī)理”。在2015年NSFC生命科學(xué)學(xué)部立項課題中,僅出現(xiàn)一次的詞語共310個,占2015年NSFC所有課題出現(xiàn)一次的詞語27.24%。在這些詞中,除了生命科學(xué)相關(guān)詞匯外也出現(xiàn)了其他學(xué)科詞匯,例如“互聯(lián)網(wǎng)”、“動力學(xué)”等。
2.2.3 2015年浙江省自然科學(xué)基金立項項目
檢索獲得1305個2015年浙江省自然科學(xué)立項項目,對立項項目課題進(jìn)行詞云分析,可拆分為2871個詞匯,其中,出現(xiàn)最多的詞是“研究”,出現(xiàn)頻次為8%,其次是“機(jī)制”出現(xiàn)頻次3%,“基于”2%。剔除“研究”后通過詞云圖進(jìn)一步對立項課題熱點詞進(jìn)行分析可發(fā)現(xiàn),2015年浙江省自然科學(xué)基金立項項目熱點詞語與2015年NSFC立項課題熱點詞完全相同,2015年排名前十的浙江省自然科學(xué)基金熱點詞為“機(jī)制”、“基于”、“作用”、“調(diào)控”、“及其”、“機(jī)理”“細(xì)胞”、“分子”、“技術(shù)”和“功能”。除熱點詞外,“電子束”、“大功率”、“程序”等也出現(xiàn)在浙江省自然科學(xué)立項項目中。
2016年NSFC立項項目1462個,對立項項目課題進(jìn)行詞云分析,拆分為2247個詞匯,“研究”出現(xiàn)頻次居于榜首,為7.58%,其次是“基于”3.18%、“機(jī)制”2.02%。提出“研究”后通過詞云圖進(jìn)一步對立項課題熱點詞進(jìn)行分析發(fā)現(xiàn),2015年排名前十的NSFC的熱點詞為“基于”、“機(jī)制”、“影響”、“視角”、“行為”、“企業(yè)”、“理論”、“模型”、“風(fēng)險”和“網(wǎng)絡(luò)”。與前兩年相比,2016年國家更注重商業(yè)、互聯(lián)網(wǎng)與金融方向。除熱點詞之外,“農(nóng)戶”、“農(nóng)村”等有關(guān)三農(nóng)問題的詞屢屢出現(xiàn)。
國家自然科學(xué)基金是支持自然科學(xué)發(fā)展而設(shè)立的基金項目,申請和執(zhí)行國家自然科學(xué)基金項目,已經(jīng)成為科研人員學(xué)術(shù)生涯中重要的組成部分,但是隨著申請數(shù)量的持續(xù)增加,競爭也日益激烈。因此提高NSFC中標(biāo)率是每一位科研工作者申請前應(yīng)該思考的問題,而申請項目的研究內(nèi)容、創(chuàng)新性、科學(xué)價值是能否申請成功的重要依據(jù)之一[1]。馮莉等提出通過改善申請書的質(zhì)量,能提高NSFC的中標(biāo)率[2]。目前針對改善項目創(chuàng)新性和科學(xué)價值的研究和類似分析報道較少見。本文通過對2014-2016年NSFC立項項目進(jìn)行詞云分析,形象揭示自然科學(xué)基金的研究熱點和NSFC的資助結(jié)構(gòu),為廣大科研人員申請NSFC提供參考。如根據(jù)本研究結(jié)果,結(jié)合高頻詞匯分析后,可為課題研究的思路擴(kuò)展有所幫助。比如, 2014年中標(biāo)的典型題目可以是《基于新型納米機(jī)器人驅(qū)動技術(shù)的細(xì)胞信號轉(zhuǎn)導(dǎo)調(diào)控機(jī)制研究》(虛構(gòu)),2015年中標(biāo)的典型標(biāo)題可為《基于空間網(wǎng)絡(luò)控制系統(tǒng)特性基礎(chǔ)上的復(fù)合式量子傳感器對恢復(fù)城市生物污染的作用機(jī)理研究》(虛構(gòu))和2016年的典型標(biāo)題《基于異質(zhì)性視角的動態(tài)交互管理對社會網(wǎng)絡(luò)結(jié)構(gòu)演化風(fēng)險評估》(虛構(gòu))。
根據(jù)2014至2016年NSFC立項課題,對比所有詞匯的重復(fù)程度可發(fā)現(xiàn),每年的立項項目存在較強(qiáng)的獨立性,主題之間的關(guān)聯(lián)度較低,研究主題豐富?!白饔谩?、“機(jī)制”、“機(jī)理”等詞在中標(biāo)項目的持續(xù)出現(xiàn),提示NSFC仍然高度支持基礎(chǔ)研究的發(fā)展,在建立完善規(guī)范的科學(xué)體系上不斷努力[3]。由此推斷,未來基礎(chǔ)科學(xué)研究仍然會是NSFC所大力支持的方向。
研究表明2006-2009年生命科學(xué)部的資助比例占總資助率的一半以上[4],同時“細(xì)胞”、“免疫”等生命科學(xué)有關(guān)詞匯出現(xiàn)頻繁,且2016年與三農(nóng)有關(guān)的詞匯出現(xiàn)頻次大幅度上升,這與同期黨的十八和五中全會提出的綠色發(fā)展戰(zhàn)略不無關(guān)系。近年來,國家自然科學(xué)基金委提出將重點支持18個相關(guān)“藍(lán)綠”學(xué)科發(fā)展,這意味著NSFC將會在未來傾斜支持有關(guān)“藍(lán)綠”學(xué)科項目[5]。由此提示分析和研究黨和國家的發(fā)展戰(zhàn)略,對自然科學(xué)基金中標(biāo)具有積極意義。
與2014年基礎(chǔ)研究熱潮相比,2016年出現(xiàn)了“企業(yè)”、“視角”等熱點詞匯,且冷門詞匯每年重復(fù)出現(xiàn),都提示新興學(xué)科和交叉學(xué)科逐漸成為NSFC推動方向。在2018國家自然科學(xué)基金申請代碼中,新增了人工智能和交叉學(xué)科中的信息科學(xué),這也意味著從研究領(lǐng)域與學(xué)科劃分的角度來看,國家自然科學(xué)基金委在響應(yīng)國家科技發(fā)展戰(zhàn)略[5]上有了更明顯的側(cè)重點。
2015年浙江省自然科學(xué)基金立項項目熱點詞與2015年NSFC熱點詞完全一致,說明浙江省自然科學(xué)基金的資助體系與NSFC相匹配,與國家自然科學(xué)層面的項目銜接平衡。除了大量生命科學(xué)項目之外,“電子束”、“大功率”等詞在浙江省自然科學(xué)基金中頻繁出現(xiàn),卻在NSFC中出現(xiàn)頻率較低,體現(xiàn)浙江采取了差異化發(fā)展戰(zhàn)略,做強(qiáng)優(yōu)勢學(xué)科的同時,加大浙江特色產(chǎn)業(yè)有關(guān)學(xué)科扶持力度,來快速提升浙江基礎(chǔ)研究的綜合實力。因此高端工業(yè)自動化、物聯(lián)網(wǎng)、云計算與大數(shù)據(jù)、智慧城市、智慧海洋、電子商務(wù)等“兩化”深度融合領(lǐng)域的基礎(chǔ)科學(xué)研究在浙江省自然科學(xué)基金申請中標(biāo)率上有更大可能。由于本文數(shù)據(jù)來源為互聯(lián)網(wǎng)查詢檢索所得,數(shù)據(jù)完整性有待商榷。
本文研究的方法是用是基于R軟件的詞云分析[6,],通過生成的詞頻和詞云圖對研究目標(biāo)進(jìn)行分析和形象展示,具有直觀性、全局性和實用性等優(yōu)點,該分析方法可用詞語字體大小形象直觀地反映出NSFC立項課題熱點詞,為科研工作者開展文本信息挖掘和類似的研究提供參考。除詞云分析外,孫偉等使用Cite Space軟件進(jìn)行關(guān)鍵詞共現(xiàn)統(tǒng)計,繪制知識圖譜,通過節(jié)點大小反映關(guān)鍵詞的出現(xiàn)的頻率[8],郭婷等利用EXCEL分析文獻(xiàn)集的外部特征,利用SPSS對關(guān)鍵詞矩陣進(jìn)行因子分析、聚類分析和多維尺度分析,也是文本挖掘、信息可視化的研究方式之一。相比之下,EXCEL實用性較高,受眾群體廣泛,SPSS界面友好、統(tǒng)計功能強(qiáng)大 。Cite Space具有良好的點選擇縮減功能,圖譜顯示方式多樣 ,而R語言的優(yōu)勢是免費(fèi)、開放源代碼的平臺,無需編譯過程,程序運(yùn)行簡單。
本研究表明自然科學(xué)基金的資助結(jié)構(gòu)保持一定的穩(wěn)定態(tài)勢,探索性基礎(chǔ)性研究雖然風(fēng)險更大,但更受NSFC青睞,中標(biāo)率較高。新興學(xué)科和交叉學(xué)科反映學(xué)科發(fā)展規(guī)律和創(chuàng)新潛力,近幾年出現(xiàn)率有上漲傾向。與此同時,關(guān)注國家政策指向并與國家發(fā)展戰(zhàn)略目標(biāo)緊密相連例的研究,能提升中標(biāo)率。