周 杰
(杭州師范大學(xué) 教務(wù)處,浙江 杭州 311121)
大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目(以下簡稱“雙創(chuàng)計(jì)劃”)是高校培養(yǎng)大學(xué)生創(chuàng)新創(chuàng)業(yè)能力的重要舉措,是高校創(chuàng)新創(chuàng)業(yè)教育體系的重要組成部分,是深化創(chuàng)新創(chuàng)業(yè)教育改革的重要載體。自教育部決定在“十二五”期間實(shí)施國家級大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃以來,國家為“雙創(chuàng)計(jì)劃”實(shí)施出臺政策,2010年教育部頒布《關(guān)于大力推進(jìn)高等學(xué)校創(chuàng)新創(chuàng)業(yè)教育和大學(xué)生自主創(chuàng)業(yè)工作的意見》指出高等學(xué)校積極鼓勵學(xué)生自主創(chuàng)業(yè),大力開展創(chuàng)新創(chuàng)業(yè)教育[1]。2015年國務(wù)院辦公廳頒布《關(guān)于深化高等學(xué)校創(chuàng)新創(chuàng)業(yè)教育改革的實(shí)施意見》明確提出深入實(shí)施大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃,完善國家、地方、高校三級創(chuàng)新創(chuàng)業(yè)實(shí)訓(xùn)教學(xué)體系,擴(kuò)大覆蓋面,促進(jìn)項(xiàng)目落地轉(zhuǎn)化[2]。2018年國務(wù)院頒布《關(guān)于推動創(chuàng)新創(chuàng)業(yè)高質(zhì)量發(fā)展打造“雙創(chuàng)”升級版的意見》進(jìn)一步提出強(qiáng)化大學(xué)生創(chuàng)新創(chuàng)業(yè)教育培訓(xùn)[3]。各省市區(qū)先后結(jié)合自身實(shí)際進(jìn)行地方性探索實(shí)踐,各高校開展實(shí)施大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃。教育部“國家大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃”首批地方實(shí)施高校中浙江省有27所。2015年,浙江省出臺專門意見鼓勵有條件的高校開展創(chuàng)新創(chuàng)業(yè)教育改革試點(diǎn)。2013年起至今,所取得的研究成果不斷豐富,因此對杭州師范大學(xué)生命與環(huán)境科學(xué)學(xué)院(以下簡稱學(xué)院)近10年的“雙創(chuàng)計(jì)劃”項(xiàng)目進(jìn)行分析。
本文利用文本分析的方法和Python工具對2012—2020年學(xué)院國家級大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目進(jìn)行文本分析與共詞分析,較為全面地展示學(xué)院“雙創(chuàng)計(jì)劃”研究領(lǐng)域的發(fā)展路徑,挖掘和歸納其主要研究熱點(diǎn),從而厘清其研究現(xiàn)狀和趨勢,為推進(jìn)學(xué)院“雙創(chuàng)計(jì)劃”全面落實(shí)和進(jìn)一步發(fā)展提供參考。
創(chuàng)新創(chuàng)業(yè)的競賽項(xiàng)目可追溯至20世紀(jì)90年代,直到2012年教育部在全國范圍內(nèi)正式啟動了“雙創(chuàng)計(jì)劃”,通過國家級大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃平臺查詢統(tǒng)計(jì)2012-2020年的全國“雙創(chuàng)計(jì)劃”項(xiàng)目,共計(jì)有247 691項(xiàng)目,其中創(chuàng)新訓(xùn)練項(xiàng)目223 717項(xiàng),占83.64%;創(chuàng)業(yè)類項(xiàng)目31 396項(xiàng),占16.36%;如表1所示。數(shù)據(jù)顯示,歷年全國“雙創(chuàng)計(jì)劃”項(xiàng)目中創(chuàng)新訓(xùn)練類型的項(xiàng)目數(shù)量占據(jù)大部分,創(chuàng)業(yè)類型(創(chuàng)業(yè)訓(xùn)練和創(chuàng)業(yè)實(shí)踐)項(xiàng)目數(shù)量普遍偏低,項(xiàng)目類型分布不均衡,可落地轉(zhuǎn)化的項(xiàng)目比例較少,距離國家促進(jìn)項(xiàng)目落地轉(zhuǎn)化的目標(biāo)仍有一定的差距。
表 1 2012-2020年全國“雙創(chuàng)計(jì)劃”項(xiàng)目統(tǒng)計(jì)
如圖1所示,浙江省兩個項(xiàng)目類型的分布與全國相似,創(chuàng)新訓(xùn)練類型的項(xiàng)目數(shù)量占據(jù)絕大部分(歷年平均占比為74.22%),而與全國情況不同的是,浙江省歷年創(chuàng)業(yè)類項(xiàng)目占比均高于全國(每年創(chuàng)業(yè)類項(xiàng)目占比平均高全國9.51個百分點(diǎn))。
圖1 創(chuàng)業(yè)類項(xiàng)目比重
從項(xiàng)目類型占比的發(fā)展趨勢來看,2012—2016年,全國及浙江省“雙創(chuàng)項(xiàng)目”處于初期的探索階段,項(xiàng)目數(shù)量趨勢波動比較大,原因在于后續(xù)年份會根據(jù)前一年的結(jié)項(xiàng)情況做調(diào)整,2017—2020年,相較于全國創(chuàng)業(yè)類項(xiàng)目比重趨于穩(wěn)定,浙江省創(chuàng)業(yè)類項(xiàng)目逐年小幅上升,學(xué)院的發(fā)展也與之類似。從縱向發(fā)展以及橫向與全國情況比較,浙江省創(chuàng)業(yè)類項(xiàng)目發(fā)展和運(yùn)營狀況良好。
詞頻分析法和共詞分析方法是文本分析的兩種常用方法。其中詞頻分析利用表達(dá)文獻(xiàn)核心內(nèi)容的關(guān)鍵詞或主題詞,在某一領(lǐng)域文獻(xiàn)中出現(xiàn)頻次高低確定該領(lǐng)域的研究熱點(diǎn)和發(fā)展動向[4],但是不能反映研究主題之間的關(guān)聯(lián);共詞分析建立在詞頻分析基礎(chǔ)上,利用文獻(xiàn)集中專業(yè)術(shù)語共同出現(xiàn)的情況,確定文獻(xiàn)集所代表學(xué)科中研究主題之間的關(guān)聯(lián)[5]。其基本思想為:當(dāng)一堆表征某學(xué)科領(lǐng)域研究主題或研究方向的專業(yè)術(shù)語在同一篇文章中出現(xiàn),表明兩個詞之間存在一定關(guān)系,且共現(xiàn)次數(shù)越多,關(guān)系越緊密。分別統(tǒng)計(jì)文獻(xiàn)集中主題詞或關(guān)鍵詞在同一文獻(xiàn)中共同出現(xiàn)的頻次,便可形成由這些詞組成的共詞矩陣,因此為基礎(chǔ)對其進(jìn)行分層聚類以揭示詞與詞之間的親疏關(guān)系,從而歸納該領(lǐng)域的研究熱點(diǎn)、結(jié)構(gòu)和范式。
以python語言軟件為主要的研究開發(fā)工具,采用python語言軟件中jieba分詞包,其中詞頻分析主要是以大學(xué)生雙創(chuàng)項(xiàng)目結(jié)項(xiàng)報(bào)告的關(guān)鍵詞或者主題詞的提取來反映大學(xué)生在該領(lǐng)域的研究創(chuàng)新熱點(diǎn)和發(fā)展趨勢的一種文獻(xiàn)計(jì)量方法。共詞分析是在定型分析和定量分析結(jié)合基礎(chǔ)上,通過統(tǒng)計(jì)相關(guān)文獻(xiàn)集中專業(yè)術(shù)語的共同出現(xiàn)次數(shù),研究該領(lǐng)域的熱點(diǎn)主題及其存在的相關(guān)關(guān)系。
本文以2012—2020年學(xué)院國家級大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練項(xiàng)目的結(jié)項(xiàng)報(bào)告為數(shù)據(jù)來源,剔除報(bào)告中的與研究無關(guān)的格式文檔部分,一共收集有效結(jié)題報(bào)告36份,對有效文檔進(jìn)行規(guī)范處理,讓文本編碼格式符合python3.6語言的共詞分析的要求。
利用python3.6語言工具對文獻(xiàn)集進(jìn)行jieba分詞,去掉其中的停頓詞、阿拉伯?dāng)?shù)字、英文字符,利用TF-IDF算法對其中的分詞結(jié)果進(jìn)行關(guān)鍵詞提取分析,每篇文檔提取前10個關(guān)鍵詞,去重之后共有56個關(guān)鍵詞,按照重要性從高到低排序如表2所示。
表2 高頻關(guān)鍵詞匯總表
為了讓數(shù)據(jù)結(jié)果符合尺度分析的要求,利用R語言對上述56個關(guān)鍵詞進(jìn)行共詞分析,生成詞篇矩陣后進(jìn)行Ochiia系數(shù),在進(jìn)行多維尺度分析時,同時把系數(shù)轉(zhuǎn)化為56的共詞相似矩陣,將此相似矩陣再轉(zhuǎn)化為相異矩陣,結(jié)果如表3所示。
表3 高頻關(guān)鍵詞Ochiia系數(shù)相異矩陣
高頻關(guān)鍵詞Ochiia系數(shù)相異矩陣的數(shù)字表明了數(shù)據(jù)之間的相異性。即兩個對應(yīng)的關(guān)鍵詞之間距離的遠(yuǎn)近,數(shù)值越小或者越接近零,標(biāo)明關(guān)鍵詞的距離越近,相似度越高,數(shù)值越大,表明關(guān)鍵詞之間的距離越遠(yuǎn),相似度越低。本文通過對知識圖譜的清晰分析進(jìn)一步展示學(xué)院大學(xué)生的創(chuàng)新研究現(xiàn)狀和未來發(fā)展趨勢。
高頻關(guān)鍵詞聚類分析可以看出關(guān)鍵詞之間的關(guān)系是近還是遠(yuǎn),根據(jù)關(guān)鍵詞的親屬關(guān)系可以推斷我國大學(xué)生創(chuàng)業(yè)教育研究的發(fā)展趨勢。高頻關(guān)鍵詞聚類分析的原理是利用統(tǒng)計(jì)學(xué)中的聚類分析方法,以關(guān)鍵詞在同一篇報(bào)告中出現(xiàn)兩兩的頻率為分析對象,把關(guān)聯(lián)度密切高的關(guān)鍵詞匯集組成一個聚類,再從聚類中抽取其中的子關(guān)鍵詞及相近的關(guān)鍵詞再重新組成一個新的聚類。關(guān)鍵詞之間的相似度越低,說明它們之間的距離越遠(yuǎn),反之,則越近。把研究中36篇有效報(bào)告的關(guān)鍵詞分析,得到關(guān)鍵詞聚類分析結(jié)果如表4所示。
表4 高頻關(guān)鍵詞聚類分析
(1)包括工藝、固化劑、重金屬、廢水等關(guān)鍵詞,主要研究話題與環(huán)境、環(huán)境中的污染源、污染源對生物的影響作用相關(guān)。
(2)包括農(nóng)作物、土壤、低溫、重金屬等關(guān)鍵詞,主要研究的話題是農(nóng)藥學(xué)、農(nóng)藥與病蟲害、農(nóng)藥與農(nóng)作物生長等關(guān)系。
(3)包括蛋白、凋亡、病原菌等關(guān)鍵詞,主要研究的是細(xì)菌生物學(xué)、病毒學(xué)層面的研究。
(4)包括代謝、抗氧化、修飾、抑菌等關(guān)鍵詞,主要研究的是生物化學(xué)、生物代謝的作用等。
在python3.6中將56×56的相異矩陣進(jìn)行數(shù)據(jù)處理,以其中的56核心關(guān)鍵詞共同出現(xiàn)頻率為基礎(chǔ),探尋56個關(guān)鍵詞間隱藏的內(nèi)涵,同時應(yīng)用python中network工具包呈現(xiàn)關(guān)鍵詞之間的網(wǎng)絡(luò)連接關(guān)系,繪制出大學(xué)生創(chuàng)新項(xiàng)目研究熱點(diǎn)知識圖譜,結(jié)果如圖2所示。因此可以看出,學(xué)院大學(xué)生創(chuàng)新研究的熱點(diǎn)聚焦在生長環(huán)境、遺傳條件、污染物對于生物基因表達(dá)、抑制以及生物疾病誘導(dǎo)等方面,體現(xiàn)了一定的研究能力。
圖 2 大學(xué)生創(chuàng)新創(chuàng)業(yè)項(xiàng)目研究熱點(diǎn)知識圖譜
綜合以上知識圖譜的分析,學(xué)院大學(xué)生創(chuàng)新項(xiàng)目的研究熱點(diǎn)主要從以上4個方面展開,通過以上分析,得出大學(xué)生創(chuàng)新項(xiàng)目的發(fā)展趨勢:一是加強(qiáng)學(xué)科建設(shè),特別是加強(qiáng)學(xué)科基礎(chǔ)設(shè)施建設(shè)等;二是形成科學(xué)思想認(rèn)識和科學(xué)創(chuàng)新氛圍,目前來看,本科生創(chuàng)新項(xiàng)目的課題申報(bào)課題數(shù)目較少,一方面因?yàn)轭A(yù)算和投入原因,另一方面與學(xué)生群體學(xué)術(shù)研究氛圍有關(guān),教育管理部門應(yīng)當(dāng)增強(qiáng)對于學(xué)生科學(xué)創(chuàng)新的投入和培育。