宋 敏,程小芬
(1.廣州商學(xué)院會(huì)計(jì)學(xué)院,廣州 510000;2.佛山國(guó)家高新區(qū)火炬創(chuàng)新創(chuàng)業(yè)園有限公司,佛山 528000)
自2014年李克強(qiáng)總理提出“大眾創(chuàng)業(yè)、萬(wàn)眾創(chuàng)新”以來(lái),創(chuàng)新創(chuàng)業(yè)已成為新時(shí)代經(jīng)濟(jì)建設(shè)的國(guó)家戰(zhàn)略。2015年中共中央提出要把創(chuàng)業(yè)精神培育和創(chuàng)業(yè)素質(zhì)教育納入國(guó)民教育體系,并在2018年把創(chuàng)新創(chuàng)業(yè)教育和實(shí)踐課程納入高校必修課體系。應(yīng)用型本科院校是我國(guó)高等教育的重要組成部分,在不斷完善創(chuàng)業(yè)教育方面進(jìn)行了深入的探索與改革,取得了一定的成效,但仍存在不少問(wèn)題。學(xué)術(shù)界在討論應(yīng)用型本科創(chuàng)業(yè)教育現(xiàn)狀與問(wèn)題時(shí)往往是以學(xué)校個(gè)案來(lái)總結(jié),鮮有數(shù)據(jù)支持,這很難從全局上看清全國(guó)應(yīng)用型本科院校創(chuàng)業(yè)教育的真實(shí)面貌。
國(guó)家級(jí)大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃(以下簡(jiǎn)稱(chēng)國(guó)創(chuàng)計(jì)劃),是根據(jù)教育部在“十二五”期間所發(fā)高等學(xué)校本科教學(xué)質(zhì)量與教學(xué)改革工程相關(guān)文件所建立。國(guó)創(chuàng)計(jì)劃包括了創(chuàng)新訓(xùn)練項(xiàng)目、創(chuàng)業(yè)訓(xùn)練項(xiàng)目和創(chuàng)業(yè)實(shí)踐項(xiàng)目三類(lèi),而其中的創(chuàng)業(yè)實(shí)踐項(xiàng)目是學(xué)生團(tuán)隊(duì)在學(xué)校導(dǎo)師和企業(yè)導(dǎo)師共同指導(dǎo)下,采用前期創(chuàng)新訓(xùn)練項(xiàng)目或創(chuàng)新性實(shí)驗(yàn)的成果,提出一項(xiàng)具有市場(chǎng)前景的創(chuàng)新性產(chǎn)品或者服務(wù),以此為基礎(chǔ)開(kāi)展創(chuàng)業(yè)實(shí)踐活動(dòng),因此國(guó)創(chuàng)計(jì)劃創(chuàng)業(yè)實(shí)踐項(xiàng)目在一定程度上可以視為高等學(xué)校創(chuàng)業(yè)教育的成果[1]。
K-MEANS是一種非監(jiān)督機(jī)器學(xué)習(xí)算法,它是在給定若干個(gè)點(diǎn)情況下,把每個(gè)點(diǎn)分到一個(gè)類(lèi)簇中,使得類(lèi)簇內(nèi)部的點(diǎn)相似度高,不同類(lèi)之間的點(diǎn)相似度低。它是數(shù)據(jù)點(diǎn)到中心的某種距離作為優(yōu)化的目標(biāo)函數(shù),利用函數(shù)求極值的方法得到迭代運(yùn)算的調(diào)整規(guī)則。本文選用2020年國(guó)創(chuàng)計(jì)劃中應(yīng)用型本科高校申報(bào)的創(chuàng)業(yè)實(shí)踐項(xiàng)目信息,利用K-MEANS算法將數(shù)據(jù)進(jìn)行聚類(lèi)分析,以期總結(jié)應(yīng)用型本科創(chuàng)業(yè)教育的現(xiàn)狀。
本文的數(shù)據(jù)主要有兩部分,一是應(yīng)用型本科院校的數(shù)據(jù),二是創(chuàng)業(yè)實(shí)踐教育的數(shù)據(jù)。
高等學(xué)校數(shù)據(jù)來(lái)自教育部《2020年全國(guó)普通高等學(xué)校名單》,截至2020年6月30日,共有2 740所普通高等學(xué)校,其中本科院校1 263所(不包含港澳臺(tái)地區(qū)高等學(xué)校、內(nèi)地與港澳臺(tái)地區(qū)合作辦學(xué)以及中外合作辦學(xué))。在1 263所本科院校中,根據(jù)研究型與應(yīng)用型進(jìn)行劃分,將985、211院校以及博士培養(yǎng)單位定義為研究型大學(xué),其余大學(xué)根據(jù)其官方網(wǎng)站介紹的定位,確定為應(yīng)用型本科的學(xué)校共764所,其主要由民辦院校、職業(yè)院校轉(zhuǎn)型以及部分區(qū)域大學(xué)主動(dòng)轉(zhuǎn)型組成。
創(chuàng)業(yè)實(shí)踐教育數(shù)據(jù)來(lái)自國(guó)家級(jí)大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃平臺(tái),選擇申請(qǐng)時(shí)間為2020年的創(chuàng)業(yè)實(shí)踐項(xiàng)目,采用后羿采集器共采集了1 627個(gè)項(xiàng)目數(shù)據(jù)。按上文確定的名單,確定其中701個(gè)項(xiàng)目為應(yīng)用型本科大學(xué)所申報(bào)。經(jīng)過(guò)初次采集后,按項(xiàng)目詳情所提供的鏈接進(jìn)入二次采集,整理后的信息示例如表1所示。
表1 采集信息詳情(示例)
因?yàn)椴杉畔⑤^多為文字性表述,因此在預(yù)處理過(guò)程中采用數(shù)據(jù)清洗、數(shù)據(jù)變換等方法,其中數(shù)據(jù)屬性代碼轉(zhuǎn)換如下:
屬性0:項(xiàng)目小組學(xué)生人數(shù),在一定程度上反映了創(chuàng)業(yè)實(shí)踐教育成果,人數(shù)越多表明創(chuàng)業(yè)實(shí)踐教育受眾面越廣,以項(xiàng)目小組人數(shù)轉(zhuǎn)化為數(shù)值;
屬性1:第一主持入學(xué)時(shí)長(zhǎng),顯示了創(chuàng)業(yè)實(shí)踐教育的效率,入學(xué)年份越短則數(shù)值越高,按采集的學(xué)號(hào)信息判斷第一主持人入學(xué)年份,入學(xué)年份2016-2019年分別對(duì)應(yīng)數(shù)值為10、12、14、16;
屬性2:第一指導(dǎo)教師職稱(chēng),一定程度反映了創(chuàng)業(yè)實(shí)踐教育的人力資源投入情況,職稱(chēng)越高則數(shù)值越高,按博士生導(dǎo)師、教授、碩士生導(dǎo)師、副教授、行業(yè)高級(jí)職稱(chēng)、講師、行業(yè)中級(jí)職稱(chēng)、助教、行業(yè)初級(jí)職稱(chēng)、職稱(chēng)處空白者分別賦以數(shù)值29~20;
屬性3:所屬學(xué)科,按教育部《學(xué)位授予和人才培養(yǎng)學(xué)科目錄》,將所屬學(xué)科分為4類(lèi),其中哲學(xué)、歷史、藝術(shù)學(xué)數(shù)值為31,法學(xué)、教育學(xué)、文學(xué)為32,經(jīng)濟(jì)學(xué)、管理學(xué)、農(nóng)學(xué)為33,理學(xué)、工學(xué)、醫(yī)學(xué)為34;
屬性4:項(xiàng)目與專(zhuān)業(yè)匹配程度,通過(guò)項(xiàng)目名稱(chēng)與學(xué)生專(zhuān)業(yè)進(jìn)行評(píng)分,按非常匹配、比較匹配、匹配、較不匹配、不匹配分別賦以數(shù)值45~41;
屬性5:學(xué)科交叉情況,一定程度上反映學(xué)生知識(shí)融合與創(chuàng)新能力,有學(xué)科交叉為51,無(wú)學(xué)科交叉為50;
屬性6:商業(yè)轉(zhuǎn)化度,通過(guò)項(xiàng)目名稱(chēng)關(guān)鍵詞在阿里巴巴、淘寶、京東等平臺(tái)搜索,同質(zhì)化產(chǎn)品越多則表明商業(yè)競(jìng)爭(zhēng)度越大,轉(zhuǎn)化度越低。公益項(xiàng)目設(shè)為60,其他項(xiàng)目轉(zhuǎn)化度由非常低、低、一般、較高、高分別賦值61~65;
對(duì)采集信息在數(shù)據(jù)分析前將文字信息轉(zhuǎn)化為系統(tǒng)可用的數(shù)據(jù)字段,示例如表2所示。
表2 數(shù)據(jù)屬性轉(zhuǎn)換表
K-MEANS算法是典型的基于距離的聚類(lèi)算法,采用距離作為相似性的評(píng)價(jià)指標(biāo),即認(rèn)為兩個(gè)對(duì)象的距離越近,其相似度就越大。該算法認(rèn)為簇是由距離靠近的對(duì)象組成的,因此把得到緊湊且獨(dú)立的簇作為最終目標(biāo)。其數(shù)字描述如下:
給定n個(gè)點(diǎn)(x1,x2,…,xn),K-MEANS算法會(huì)根據(jù)事先制定的參數(shù)k,將這些點(diǎn)劃分出k個(gè)類(lèi)(k≤n),而劃分的標(biāo)準(zhǔn)是最小化點(diǎn)與Cluster重心(均值)的距離平方和,假設(shè)這些類(lèi)為:S= {S1,S2,…,Sk},則K-K-MEANS數(shù)學(xué)描述如下:
其中μi為第i個(gè)類(lèi)的重心(類(lèi)中所有點(diǎn)的平均值)。所以上面的最優(yōu)化問(wèn)題等價(jià)于最小化同一個(gè)類(lèi)中的不同點(diǎn)之間的平方差,即
根據(jù)上述公式,利用數(shù)獵云自助式大數(shù)據(jù)云平臺(tái),結(jié)合上文數(shù)據(jù),運(yùn)行K-MEANS聚類(lèi)設(shè)定參數(shù),如表3所示。
表3 K-MEANS聚類(lèi)設(shè)定參數(shù)
在該模型下的聚類(lèi)結(jié)果經(jīng)整理后如表4所示。
表4 聚類(lèi)結(jié)果
根據(jù)聚類(lèi)算法得到的結(jié)果顯示,可以提取出應(yīng)用型本科實(shí)踐教育中各類(lèi)型的綜合特征:
簇0:項(xiàng)目小組規(guī)模較大,第一主持人多為2018級(jí)和2017級(jí)學(xué)生,第一指導(dǎo)教師以教授為主,學(xué)科分布較廣,但仍以理工科及經(jīng)管學(xué)科為主,項(xiàng)目與專(zhuān)業(yè)匹配程度高,交叉度平均,商業(yè)轉(zhuǎn)化度中等;
簇1:項(xiàng)目小組規(guī)模適中,第一主持人多為2018級(jí)學(xué)生,第一指導(dǎo)教師以講師為主,學(xué)科分布以經(jīng)管學(xué)科、理工科為主,項(xiàng)目與專(zhuān)業(yè)匹配程度較高,交叉度平均,商業(yè)轉(zhuǎn)化度較弱;
簇2:項(xiàng)目小組規(guī)模適中,第一主持人為2018級(jí)學(xué)生,第一指導(dǎo)教師以助教為主,學(xué)科分布以經(jīng)管學(xué)科、理工科為主,項(xiàng)目與專(zhuān)業(yè)匹配程度較高,交叉度較高,商業(yè)轉(zhuǎn)化度較弱;
簇3:項(xiàng)目小組規(guī)模偏小,第一主持人多為2017級(jí)學(xué)生,第一指導(dǎo)教師以講師和副教授為主,學(xué)科分布廣,一半為理工科,一半為文科,項(xiàng)目與專(zhuān)業(yè)匹配程度高,交叉度較高,商業(yè)轉(zhuǎn)化度中等。
第一,創(chuàng)業(yè)教育覆蓋面越來(lái)越大,低年級(jí)學(xué)生申報(bào)更積極,但高年級(jí)學(xué)生申報(bào)項(xiàng)目的競(jìng)爭(zhēng)力更強(qiáng)。2020年共有3 208名應(yīng)用型本科學(xué)生參與國(guó)創(chuàng)計(jì)劃的創(chuàng)業(yè)實(shí)踐項(xiàng)目申報(bào),小組平均人數(shù)為4.576人。從年級(jí)上看,2018級(jí)學(xué)生作為第一主持人申報(bào)項(xiàng)目的占比為52.5%,其次是2017級(jí)學(xué)生的比例為31.2%;而2019級(jí)學(xué)生也有14.3%,這表明創(chuàng)業(yè)教育經(jīng)過(guò)5年發(fā)展,已經(jīng)取得了可喜的成果[2]。
雖然低年級(jí)學(xué)生的創(chuàng)業(yè)熱情可嘉,但其項(xiàng)目商業(yè)競(jìng)爭(zhēng)力卻不如高年級(jí)學(xué)生所申報(bào)的項(xiàng)目強(qiáng),2017級(jí)學(xué)生所申報(bào)項(xiàng)目的整體商業(yè)競(jìng)爭(zhēng)力最強(qiáng)。在小組成員的選擇上,高年級(jí)學(xué)生的小組規(guī)模較低年級(jí)的小,更符合創(chuàng)業(yè)團(tuán)隊(duì)的人數(shù)設(shè)計(jì),可能與大三、大四學(xué)生面臨畢業(yè)就業(yè)有關(guān)。
第二,對(duì)各校創(chuàng)業(yè)教育重視程度不一,創(chuàng)新訓(xùn)練到創(chuàng)業(yè)實(shí)踐的轉(zhuǎn)化率還有待提高。2020年共有280所應(yīng)用型本科院校申報(bào)了國(guó)創(chuàng)計(jì)劃的創(chuàng)業(yè)實(shí)踐項(xiàng)目,占全部應(yīng)用型本科院校的40%,平均每所學(xué)校申報(bào)2.5個(gè)項(xiàng)目,大部分學(xué)校僅有1~2個(gè)項(xiàng)目,但是大連東軟信息學(xué)院、成都東軟學(xué)院分別申報(bào)了23個(gè)和19個(gè)項(xiàng)目,成為其中佼佼者。
由于國(guó)創(chuàng)計(jì)劃中的創(chuàng)業(yè)實(shí)踐項(xiàng)目要求采用前期創(chuàng)新訓(xùn)練項(xiàng)目的成果而提出的,若假設(shè)2020年創(chuàng)業(yè)實(shí)踐項(xiàng)目由國(guó)創(chuàng)計(jì)劃2019年創(chuàng)新訓(xùn)練項(xiàng)目轉(zhuǎn)化而來(lái),2019年國(guó)創(chuàng)計(jì)劃的創(chuàng)新訓(xùn)練項(xiàng)目總數(shù)為35 475個(gè),根據(jù)采集獲取的11 282個(gè)項(xiàng)目來(lái)看,應(yīng)用型本科的申報(bào)項(xiàng)目為2 586個(gè),占22.92%,該數(shù)據(jù)與已公布2016年、2017年數(shù)據(jù)相近,這兩年的占比分別為20%和22%。根據(jù)該比例推算,應(yīng)用型本科院校2020年創(chuàng)新訓(xùn)練項(xiàng)目約有8 131個(gè),因此創(chuàng)業(yè)轉(zhuǎn)化率約為8.6%,由此說(shuō)明創(chuàng)業(yè)教育中,如何將創(chuàng)新轉(zhuǎn)化為創(chuàng)業(yè)是有待解決的難題[3]。
第三,項(xiàng)目與專(zhuān)業(yè)匹配程度總體較高,但各學(xué)科創(chuàng)業(yè)教育發(fā)展不均勻,學(xué)科交叉情況或與專(zhuān)業(yè)性有關(guān)。在聚類(lèi)結(jié)果的4種類(lèi)型中,前三類(lèi)項(xiàng)目基本為經(jīng)濟(jì)、管理、理工學(xué)科,其中工科又是最大贏家,共有201個(gè)項(xiàng)目,占比28.67%;其次為管理學(xué)科,共有167個(gè)項(xiàng)目,占比23.82%。文、史、哲、法、藝、教六個(gè)學(xué)科中,藝術(shù)學(xué)、教育學(xué)所申報(bào)的項(xiàng)目較多,哲學(xué)和史學(xué)的項(xiàng)目很少。總體來(lái)看,申報(bào)創(chuàng)業(yè)實(shí)踐項(xiàng)目與專(zhuān)業(yè)匹配程度較高,工科或者因?yàn)閷?zhuān)業(yè)性與技術(shù)性強(qiáng),較少學(xué)科交叉,相反文科類(lèi)專(zhuān)業(yè)的學(xué)科交叉較多。
第四,行業(yè)指導(dǎo)教師較少,講師和副教授為指導(dǎo)主力,但教授指導(dǎo)項(xiàng)目的商業(yè)競(jìng)爭(zhēng)力更強(qiáng),小組規(guī)模也較大。第一指導(dǎo)教師為行業(yè)中、高級(jí)職稱(chēng)的項(xiàng)目共有38個(gè),僅占5%;高校講師指導(dǎo)項(xiàng)目共261個(gè),占37%;副教授指導(dǎo)項(xiàng)目共196個(gè),占28%;教授指導(dǎo)項(xiàng)目100個(gè),占14%;助教指導(dǎo)項(xiàng)目56個(gè),占8%;剩余項(xiàng)目50個(gè),其指導(dǎo)教師未填寫(xiě)職稱(chēng)信息或職稱(chēng)信息在采集過(guò)程中丟失。
在剔除公益類(lèi)項(xiàng)目后,第一指導(dǎo)教師為教授所申報(bào)的項(xiàng)目有著更高的商業(yè)轉(zhuǎn)化度,副教授、講師所申報(bào)的項(xiàng)目競(jìng)爭(zhēng)力相近。而在小組規(guī)模的選擇上,職稱(chēng)級(jí)別高則選擇小組規(guī)模也較大,在教授級(jí)所指導(dǎo)的100個(gè)項(xiàng)目中,共計(jì)小組人數(shù)493人,副教授所指導(dǎo)的196個(gè)項(xiàng)目中,共計(jì)小組人數(shù)927人;講師所指導(dǎo)的261個(gè)項(xiàng)目中,共計(jì)小組人數(shù)1 153人;助教所指導(dǎo)的56個(gè)項(xiàng)目中,共計(jì)小組人數(shù)238人?;蛘呤且?yàn)榻淌谂鋫淞酥倘藛T,使其指導(dǎo)的團(tuán)隊(duì)建設(shè)能力更強(qiáng),加上自身在專(zhuān)業(yè)技術(shù)領(lǐng)域里的優(yōu)勢(shì),使項(xiàng)目質(zhì)量更高[4]。
國(guó)創(chuàng)計(jì)劃平臺(tái)是為了強(qiáng)化創(chuàng)新創(chuàng)業(yè)訓(xùn)練,培養(yǎng)高水平創(chuàng)新人才所建立的,利用K-MEANS對(duì)其中創(chuàng)業(yè)實(shí)踐項(xiàng)目數(shù)據(jù)做一個(gè)統(tǒng)一的聚類(lèi)分析和評(píng)估,可以從中總結(jié)應(yīng)用型本科創(chuàng)業(yè)教育現(xiàn)狀[5]。本文不足之處在于部分?jǐn)?shù)據(jù)采集不完整,且部分屬性特征需要人工判斷,帶有一定的主觀性;只采用了國(guó)創(chuàng)計(jì)劃的創(chuàng)業(yè)實(shí)踐項(xiàng)目數(shù)據(jù),若能聯(lián)合創(chuàng)新訓(xùn)練、創(chuàng)業(yè)訓(xùn)練數(shù)據(jù)一起分析,將對(duì)應(yīng)用型本科創(chuàng)業(yè)教育現(xiàn)狀呈現(xiàn)得更加完整。
吉林農(nóng)業(yè)科技學(xué)院學(xué)報(bào)2021年5期