段桂芹,鄒臣嵩
(1.廣東松山職業(yè)技術(shù)學(xué)院計(jì)算機(jī)與信息工程學(xué)院,廣東 韶關(guān) 512126;2.廣東松山職業(yè)技術(shù)學(xué)院電氣工程學(xué)院,廣東 韶關(guān) 512126)
數(shù)據(jù)挖掘能夠從教學(xué)數(shù)據(jù)中分析出有價(jià)值的信息,是輔助教學(xué)管理的重要手段[1]。作為一種經(jīng)典的無(wú)監(jiān)督數(shù)據(jù)挖掘技術(shù),聚類分析目前被廣泛地應(yīng)用在教育領(lǐng)域的多項(xiàng)研究與實(shí)踐中[2-5]。孫小素等人[6]利用聚類分析對(duì)學(xué)生個(gè)人能力進(jìn)行分類,用Fisher判別方法校驗(yàn)聚類分析的科學(xué)性,保證了學(xué)生成績(jī)?cè)u(píng)價(jià)的科學(xué)性和高效性。丁鵬飛[7]利用相關(guān)分析方法確定了5個(gè)聚類因子,將具有相似性的學(xué)生劃分為4種類型。彭琳鈞等人[8]在對(duì)學(xué)生綜合能力因子分析的基礎(chǔ)上,使用K-means算法對(duì)部分?jǐn)?shù)據(jù)進(jìn)行標(biāo)注,用訓(xùn)練后的SVM模型對(duì)其他數(shù)據(jù)進(jìn)行分類。張?zhí)鸬热薣1]提出了一種基于改進(jìn)的聚類的成績(jī)分析方法,對(duì)學(xué)生的課程成績(jī)進(jìn)行相關(guān)性分析。但是,由于K-means聚類算法在實(shí)際應(yīng)用中其類簇?cái)?shù)目依賴于人工經(jīng)驗(yàn),聚類質(zhì)量易受人為因素影響,因此需要引入相關(guān)指標(biāo)對(duì)聚類質(zhì)量進(jìn)一步評(píng)價(jià)。肖自乾等人[9]根據(jù)肘部法則對(duì)學(xué)生成績(jī)數(shù)據(jù)進(jìn)行分析,計(jì)算不同k值時(shí)的平均畸變程度。郭鵬等人[10]使用改進(jìn)的K-means算法結(jié)合CH指標(biāo)對(duì)學(xué)生成績(jī)聚類劃分后的效果進(jìn)行評(píng)估。谷欣超等人[11]使用全局K-means聚類算法對(duì)學(xué)生成績(jī)進(jìn)行聚類,得到不同聚類個(gè)數(shù)下的成績(jī)分類結(jié)果,并結(jié)合I Index指標(biāo)自動(dòng)地確定出最優(yōu)聚類數(shù)目,實(shí)現(xiàn)對(duì)學(xué)生多科成績(jī)數(shù)據(jù)的無(wú)監(jiān)督分類。段桂芹等人[12]提出了一種改進(jìn)K-medoids算法,結(jié)合DB指標(biāo)設(shè)計(jì)了聚類質(zhì)量評(píng)價(jià)模型,有效地挖掘出學(xué)生多門課程成績(jī)的分布情況。
在借鑒上述科研成果的基礎(chǔ)上,本文提出一種新的聚類內(nèi)部評(píng)價(jià)指標(biāo),給出了簇內(nèi)緊密度和簇間分離度新的計(jì)算方法,結(jié)合近鄰傳播算法設(shè)計(jì)了一種職業(yè)能力聚類模型,以某高校學(xué)生能力數(shù)據(jù)為樣本,完成職業(yè)能力聚類分析,驗(yàn)證了模型的實(shí)用性。
近鄰傳播算法(Affinity Propagation, AP)是Frey等人[13]于2007年在“Science”上提出的一種新的快速聚類算法,具有無(wú)需選擇初始聚類中心,無(wú)需依賴人工經(jīng)驗(yàn)預(yù)設(shè)聚類數(shù)k等優(yōu)點(diǎn)。AP算法是一種近鄰之間互傳信息的聚類方法[14-16],在算法執(zhí)行過(guò)程中,可自動(dòng)尋找聚類中心。該算法的基本結(jié)構(gòu)是:先使用歐氏距離公式計(jì)算出樣本集的相似度矩陣;再循環(huán)交替更新樣本的吸引度和歸屬度,在此過(guò)程中,當(dāng)?shù)螖?shù)超過(guò)最大值,或者類代表點(diǎn)連續(xù)多次迭代保持不變時(shí),AP算法視為結(jié)束,此時(shí)可將其余樣本分配至相應(yīng)簇中完成聚類[17-19]。AP算法由4步構(gòu)成,具體描述如下:
Step1使用式(1)計(jì)算集合中樣本xi和xj間的歐氏距離:
(1)
其中,i=1,2,…,N;j=1,2,…,N;l表示樣本的特征維度。
Step2使用式(2)取歐氏距離相反數(shù)作為樣本的相似度值s(i,k),得到相似度矩陣S:
(2)
其中,p(k)是相似度矩陣對(duì)角線上的數(shù)值,也是樣本xk能否成為簇中心的評(píng)判標(biāo)準(zhǔn),p(k)越大,說(shuō)明樣本xk被選作簇中心代表的幾率越大,本文借鑒了文獻(xiàn)[13]推薦的在無(wú)先驗(yàn)知識(shí)前提下取S矩陣的中值作為偏向參數(shù)p的默認(rèn)值。
Step3交替更新吸引度r與歸屬度a,生成優(yōu)質(zhì)簇中心代表。其中,吸引度r(i,k)表示樣本xk對(duì)xi的吸引程度,該值越大意味著xk成為xi簇中心的可能性越大;歸屬度a(i,k)表示樣本xi對(duì)xk的歸屬程度,該值越大說(shuō)明樣本xi選擇xk作為其簇中心的可能性越大。吸引度r與歸屬度a的交替更新過(guò)程如式(3)、式(4)所示:
r(i,k)=s(i,k)-maxk′≠k{a(i,k′)+s(i,k′)}
(3)
其中,a(i,k′)表示除xk外其他樣本對(duì)xi的歸屬度值,s(i,k′)表示除xk外其他樣本對(duì)xi的吸引度,即xi外其他樣本都在爭(zhēng)奪xi的所有權(quán),r(i,k)是xk成為xi的簇中心的累積證明。
(4)
其中,r(k,k)表示xk的自吸引度,a(k,k)表示xk的自歸屬度,r(i′,k)表示xk作為除xi外其他樣本的簇中心的相似度值。a(i,k)表示取所有大于等于0的吸引度值加上x(chóng)k的自吸引度作為簇中心的可能程度,即xk在這些吸引度值大于0的樣本點(diǎn)的支持下,xi選擇xk作為其簇中心的累積證明。
考慮到更新吸引度r與歸屬度a過(guò)程中,會(huì)出現(xiàn)振蕩現(xiàn)象,故此處引入了阻尼參數(shù)λ來(lái)降低震蕩幅度,校正迭代過(guò)程中的吸引度歸屬度,設(shè)阻尼參數(shù)λ∈[0,1),迭代次數(shù)為t,校正后的交替更新過(guò)程如式(5)、式(6)所示:
r(i,k)t+1=(1-λ)×r(i,k)t+1+λ×r(i,k)t
(5)
a(i,k)t+1=(1-λ)×a(i,k)t+1+λ×a(i,k)t
(6)
其中,r(i,k)t、r(i,k)t+1分別表示第t和t+1次迭代的吸引度,a(i,k)t、a(i,k)t+1分別表示第t和t+1次迭代的歸屬度。
Step4確定簇中心代表。將吸引度和歸屬度之和最大的樣本xk作為xi所在簇的中心代表,聚類數(shù)k應(yīng)滿足的條件如式(7)所示:
k=argmax{a(i,k)+r(i,k)}
(7)
內(nèi)部評(píng)價(jià)指標(biāo)是指與外部信息無(wú)任何關(guān)聯(lián),利用數(shù)據(jù)集的內(nèi)在屬性特征來(lái)評(píng)價(jià)聚類算法的優(yōu)劣。通過(guò)計(jì)算數(shù)據(jù)總體相似度、簇間平均相似度或簇內(nèi)平均相似度來(lái)評(píng)價(jià)聚類質(zhì)量。在評(píng)價(jià)過(guò)程中,通常將“簇內(nèi)緊湊,簇間分散”作為內(nèi)部評(píng)價(jià)的重要標(biāo)準(zhǔn),經(jīng)典的內(nèi)部評(píng)價(jià)指標(biāo)XB[20]的表達(dá)式如式(8)所示,其特點(diǎn)描述如下:
(8)
XB指標(biāo)將數(shù)據(jù)集中簇內(nèi)各樣本與簇中心的距離平方和作為簇內(nèi)的緊密度,使用最小簇中心距離的平方作為整個(gè)樣本集的分離度,將簇內(nèi)緊密度與簇間分離度的比值作為指標(biāo)的表達(dá)式[21-22],可以看出,XB指標(biāo)越小,則各簇間距離越大,簇間越分散,簇內(nèi)越緊湊,聚類質(zhì)量越高。然而,當(dāng)數(shù)據(jù)集為環(huán)形數(shù)據(jù)時(shí),其簇中心的重疊度較大,各簇間的中心距離趨近于0,由于簇間相似度極高,應(yīng)將二者視為一個(gè)聚類,以實(shí)現(xiàn)高質(zhì)量聚類劃分。而實(shí)際上,這種合并式聚類會(huì)導(dǎo)致簇中心重疊的簇全部被合并成一個(gè)聚類,明顯偏離實(shí)際結(jié)果,導(dǎo)致聚類評(píng)價(jià)結(jié)果無(wú)效。
為了便于理解,對(duì)圖1中的數(shù)據(jù)集進(jìn)行討論,該數(shù)據(jù)集由多個(gè)環(huán)形結(jié)構(gòu)的簇構(gòu)成,各簇中心極為接近,在計(jì)算該數(shù)據(jù)集的簇間距離時(shí),由于簇中心點(diǎn)趨于重疊,必然會(huì)出現(xiàn)簇間距離近似于0的情況,當(dāng)以“簇內(nèi)緊密,簇間分離”的標(biāo)準(zhǔn)進(jìn)行評(píng)判時(shí),意味著此時(shí)各簇極為相似,從聚類劃分的角度來(lái)看,為提高聚類質(zhì)量應(yīng)將兩簇合而為一,但經(jīng)過(guò)多次合并,圖1最終將全部合并為一個(gè)簇,這顯然與實(shí)際聚類結(jié)果有著明顯偏差。而本文用簇內(nèi)全部樣本與簇中心的距離之和表示簇內(nèi)緊密度,用任意兩簇間樣本距離和的最小值表示簇間分離度,則可以從幾何特征上確保各簇的結(jié)構(gòu)差異性,進(jìn)而避免簇間距離為0現(xiàn)象的發(fā)生,最大程度地反映出簇間的相似程度,克服了環(huán)形數(shù)據(jù)因中心點(diǎn)重疊而導(dǎo)致的聚類結(jié)果合并等問(wèn)題,通過(guò)平衡簇內(nèi)緊密度和簇間分離度之間的關(guān)系[23],確保最優(yōu)聚類的劃分,改進(jìn)后的指標(biāo)Improve-XB(以下簡(jiǎn)稱IXB)定義及公式如下:
圖1 環(huán)形人工數(shù)據(jù)集
定義1 簇內(nèi)緊密度(Compactness):數(shù)據(jù)集中全部樣本與所歸屬簇的簇中心距離之和。
(9)
其中,x為簇Ci的簇內(nèi)樣本,vi是該簇的簇中心,k表示樣本集被劃分后的簇個(gè)數(shù)。
定義2 簇間分離度(Separation):任意兩簇間樣本距離和的最小值。
(10)
其中,xm和xn為分屬2個(gè)不同簇的任意樣本。
定義3 IXB指標(biāo):簇內(nèi)緊密度與簇間分離度的比值與其倒數(shù)之和。
(11)
從式(9)、式(10)可以看出,當(dāng)k值增加時(shí),簇間分離度與簇內(nèi)緊密度的比值Sep/Comp增加,而Comp/Sep則反之,從式(11)可以看出IXB指標(biāo)值越大,說(shuō)明簇間越分散,同時(shí)簇內(nèi)越緊湊,聚類質(zhì)量越好。
定義4 最優(yōu)聚類數(shù)kopt:IXB(k)取最大值時(shí)的聚類數(shù)目。
kopt=argmax{IXB(k)}
(12)
其中,k∈[2,kmax],kmax由AP算法給出。
本文的測(cè)試環(huán)境為:Intel(R) Core(TM) i7-10750H CPU @2.6 GHz 2.59 GHz,16 GB內(nèi)存,Win10(64位)專業(yè)版,測(cè)試平臺(tái)為Matlab 2011b,實(shí)驗(yàn)由IXB指標(biāo)的有效性測(cè)試和實(shí)用性測(cè)試2個(gè)部分組成。
本實(shí)驗(yàn)針對(duì)新評(píng)價(jià)指標(biāo)IXB的有效性進(jìn)行測(cè)試,具體為:分別使用AP算法、改進(jìn)K中心點(diǎn)算法[24]和快速K-medoids算法[25]結(jié)合XB指標(biāo)、IXB指標(biāo)對(duì)表1中的UCI數(shù)據(jù)集進(jìn)行聚類數(shù)正確率對(duì)比測(cè)試,對(duì)比測(cè)試結(jié)果詳見(jiàn)表2,其中,AP算法的阻尼參數(shù)范圍是[0.5,1),測(cè)試中使用其缺省值0.5,最大迭代次數(shù)為900次,文獻(xiàn)[24]、文獻(xiàn)[25]算法的密度參數(shù)由樣本集自身決定,無(wú)需人工設(shè)定。
表1 UCI樣本實(shí)驗(yàn)數(shù)據(jù)
表2 評(píng)價(jià)指標(biāo)的聚類數(shù)對(duì)比測(cè)試
觀察表2可知,在5個(gè)UCI數(shù)據(jù)集上,3種聚類算法結(jié)合IXB的聚類數(shù)正確率分別為80%、80%、60%;3種聚類算法結(jié)合XB指標(biāo)所得的聚類數(shù)正確率分別為60%、60%、40%,可以看出,IXB評(píng)價(jià)指標(biāo)的聚類數(shù)正確率明顯高于原XB指標(biāo)。
本實(shí)驗(yàn)使用入侵檢測(cè)數(shù)據(jù)集KDD CUP99[26]從檢測(cè)率、分類正確率、漏報(bào)率、誤報(bào)率4個(gè)方面驗(yàn)證新指標(biāo)IXB的實(shí)用性。其中,訓(xùn)練集包含5種攻擊類型,共10325條記錄,測(cè)試集從corrected中隨機(jī)選取,共2845條記錄,數(shù)據(jù)預(yù)處理采用文獻(xiàn)[27]所提出的降維方法,整理后的數(shù)據(jù)如表3所示。
表3 KDD CUP99數(shù)據(jù)集
為了完成不同聚類數(shù)條件下的入侵檢測(cè)指標(biāo)對(duì)比,設(shè)置AP算法的阻尼參數(shù)λ在[0.5,1)區(qū)間內(nèi)的步長(zhǎng)為0.05,最大迭代次數(shù)為900次,結(jié)合IXB指標(biāo),得出表3訓(xùn)練集的最優(yōu)聚類范圍是[22,29]。測(cè)試集的各項(xiàng)檢測(cè)結(jié)果如表4所示,可以看出,當(dāng)聚類數(shù)為26時(shí),入侵檢測(cè)率達(dá)到最大值93.89%,當(dāng)聚類數(shù)為26和27時(shí),測(cè)試集的分類正確率同為最大值95.43%,當(dāng)聚類數(shù)為26時(shí),漏報(bào)率達(dá)到最低,為4.26%,當(dāng)聚類數(shù)為27時(shí),誤報(bào)率達(dá)到最低,為4.27%。
表4 測(cè)試集的入侵檢測(cè)結(jié)果 單位:%
綜合上述2個(gè)實(shí)驗(yàn)部分結(jié)果,可以得出:本文所提出的改進(jìn)聚類質(zhì)量評(píng)價(jià)指標(biāo)能夠反映出樣本集的最佳聚類數(shù)目或最優(yōu)聚類范圍,具有較好的實(shí)用性,可應(yīng)用于具體案例。
使用近鄰傳播算法與IXB指標(biāo)構(gòu)建的職業(yè)能力聚類模型由確定簇中心和確定最優(yōu)聚類劃分2個(gè)部分構(gòu)成,模型結(jié)構(gòu)如圖2所示,模型的描述具體如圖2所示。
圖2 職業(yè)能力聚類模型
4.1.1 確定簇中心
1)使用式(1)、式(2)得到學(xué)生職業(yè)能力的相似度矩陣。
2)使用式(3)、式(4)交替更新吸引度r與歸屬度a,得到簇中心代表。
3)設(shè)置阻尼參數(shù)λ、總迭代參數(shù)t,使用式(5)、式(6)降低震蕩幅度,校正吸引度與歸屬度。
4)將滿足公式(7)的候選點(diǎn)作為簇中心代表點(diǎn),重復(fù)執(zhí)行本環(huán)節(jié)中的步驟3,再次校正全部樣本的吸引度和歸屬度,篩選出簇中心代表點(diǎn),將其它樣本劃分至相應(yīng)簇中,獲取聚類數(shù)上限值kmax。
4.1.2 確定最優(yōu)聚類劃分
1)將聚類數(shù)上限值作為聚類數(shù)初值,即k=kmax。
2)使用式(9)、式(10)計(jì)算簇內(nèi)緊密度與簇間分離度,使用式(11)計(jì)算IXB指標(biāo)。
3)令k=k-1,重復(fù)執(zhí)行本環(huán)節(jié)中的步驟2,依次計(jì)算k={2,3,…,kmax}的IXB指標(biāo),使用式(12)獲取最優(yōu)聚類數(shù)kopt,并將IXB指標(biāo)最大時(shí)的聚類結(jié)果作為最優(yōu)聚類劃分輸出。
4.2.1 樣本描述
遵照高職院?!肮W(xué)結(jié)合”的教學(xué)特點(diǎn),我校同用人單位、行業(yè)協(xié)會(huì)專家、一線教師一起,根據(jù)物聯(lián)網(wǎng)應(yīng)用技術(shù)專業(yè)的崗位需求,完成了相關(guān)崗位的職業(yè)能力描述,設(shè)計(jì)了由基本素質(zhì)、專業(yè)核心技能、專業(yè)知識(shí)構(gòu)成的職業(yè)能力表(詳見(jiàn)表5)和職業(yè)能力等級(jí)標(biāo)準(zhǔn)(詳見(jiàn)表6),并對(duì)我校2018級(jí)物聯(lián)網(wǎng)應(yīng)用技術(shù)專業(yè)80名學(xué)生第2~4學(xué)期的職業(yè)能力進(jìn)行了采集,樣本數(shù)據(jù)詳見(jiàn)表7。
表5 物聯(lián)網(wǎng)應(yīng)用技術(shù)專業(yè)職業(yè)能力表
表6 職業(yè)能力等級(jí)標(biāo)準(zhǔn)
表7 學(xué)生職業(yè)能力樣本數(shù)據(jù)
4.2.2 聚類結(jié)果輸出
本節(jié)使用聚類模型對(duì)表7的80名學(xué)生從職業(yè)能力的3個(gè)方面進(jìn)行了聚類分析,具體為:基本素質(zhì)屬性(A1~A12)、專業(yè)核心技能屬性(B1~B6)和專業(yè)知識(shí)屬性(C1~C5)。模型中AP算法的阻尼參數(shù)為0.95,總迭代次數(shù)為900次,運(yùn)行環(huán)境為Matlab 2011b,所得IXB指標(biāo)與k值對(duì)應(yīng)關(guān)系如表8所示,關(guān)系圖如圖3所示,最大聚類數(shù)、最優(yōu)聚類數(shù)和IXBmax指標(biāo)如表9所示。由IXB指標(biāo)的特征可知,該值最大時(shí)的k值即為最優(yōu)聚類數(shù),此時(shí)的聚類結(jié)果為最優(yōu)劃分,各分項(xiàng)職業(yè)能力的最優(yōu)聚類劃分情況如圖4所示,詳細(xì)劃分結(jié)果詳見(jiàn)表10。
表8 k值與IXB指標(biāo)對(duì)應(yīng)關(guān)系表
表9 各職業(yè)能力的最大聚類數(shù)和最優(yōu)聚類數(shù)
圖3 k值與IXB指標(biāo)關(guān)系圖
圖4 各簇?cái)?shù)據(jù)最優(yōu)劃分情況
為了更準(zhǔn)確、深入地對(duì)聚類結(jié)果進(jìn)行分析研究,本文分別從學(xué)生的職業(yè)發(fā)展和企業(yè)的人才選擇2個(gè)角度對(duì)表10的最優(yōu)聚類劃分進(jìn)行分析,并給出相關(guān)建議。
表10 數(shù)據(jù)劃分結(jié)果
4.3.1 學(xué)生的職業(yè)發(fā)展
將表10中“專業(yè)核心技能”的聚類結(jié)果結(jié)合表7的具體學(xué)情信息進(jìn)行分析,第1類學(xué)生共25人,他們的B2、B5、B6職業(yè)能力突出,能力值都在4.3以上,建議此類同學(xué)將Android程序設(shè)計(jì)、物聯(lián)網(wǎng)系統(tǒng)仿真設(shè)計(jì)、嵌入式Linux應(yīng)用開(kāi)發(fā)等課程作為選修課程,將物聯(lián)網(wǎng)應(yīng)用系統(tǒng)測(cè)試與程序開(kāi)發(fā)崗位作為擇業(yè)方向。第2類學(xué)生共26人,與第1類學(xué)生相比,他們的“B2、B5、B6”能力值都低于3.5,但是“B1、B3、B4”能力值都在4.0以上,結(jié)合具體學(xué)情發(fā)現(xiàn)他們對(duì)終端設(shè)備安裝、通信組網(wǎng)興趣濃厚,在軟硬件安裝調(diào)試過(guò)程中,能夠?qū)Τ霈F(xiàn)的故障進(jìn)行分析、解決與總結(jié),因此建議此類同學(xué)將智能家居系統(tǒng)安裝與配置、RFID應(yīng)用技術(shù)、物聯(lián)網(wǎng)項(xiàng)目方案設(shè)計(jì)等課程作為今后的選修課程,將物聯(lián)網(wǎng)系統(tǒng)集成與運(yùn)維崗位作為擇業(yè)方向。第3類學(xué)生共29人,他們的各項(xiàng)專業(yè)核心技能值在2.5~3.3之間,相比前2類學(xué)生,他們的專業(yè)潛能優(yōu)勢(shì)并不明顯,建議這類學(xué)生主動(dòng)尋找自己的學(xué)科興趣,重視專業(yè)實(shí)踐,提升專業(yè)技能。
將表10中“專業(yè)知識(shí)”的聚類結(jié)果結(jié)合表7的具體學(xué)情信息進(jìn)行分析,第1類學(xué)生有12人,他們對(duì)專業(yè)知識(shí)的掌握程度較其他同學(xué)更加牢固,C1~C5的能力值都在4.2以上,有能力在本科院校繼續(xù)深造,因此,對(duì)于計(jì)劃選擇“專插本”的學(xué)生來(lái)說(shuō),可以考慮在相關(guān)理論課程方面投入更多的時(shí)間與精力,校方也可以為此類學(xué)生創(chuàng)造更為有利的學(xué)習(xí)條件。此外,觀察表10的聚類劃分結(jié)果,可以發(fā)現(xiàn)一個(gè)有趣的現(xiàn)象,這類學(xué)生的“專業(yè)核心技能”和“基本素質(zhì)”也都被劃分為同一類,這一結(jié)果與教師評(píng)價(jià)、學(xué)生互評(píng)、師生座談等多渠道反饋的實(shí)際學(xué)情基本相符,從未來(lái)就業(yè)角度來(lái)看,他們的就業(yè)面更寬、更廣,可塑性更強(qiáng)?!皩I(yè)知識(shí)”的第2類和第3類分別為20人和22人,從聚類結(jié)果來(lái)看,這2類學(xué)生的簇間距離小、相似度較大,C1~C5的能力值都在3.3~4.1之間,共同特點(diǎn)是對(duì)電工電子技術(shù)、傳感器、RFID應(yīng)用技術(shù)等基礎(chǔ)知識(shí)掌握得比較牢固,但卻存在一定程度的“偏科”現(xiàn)象,第2類學(xué)生對(duì)單片機(jī)、嵌入式技術(shù)的掌握程度優(yōu)于第3類,第3類學(xué)生的計(jì)算機(jī)網(wǎng)絡(luò)、操作系統(tǒng)等專業(yè)知識(shí)背景略好于第2類,建議這2類學(xué)生可以在感興趣的課程上投入更多的精力,進(jìn)一步強(qiáng)化自己的優(yōu)勢(shì)學(xué)科。第4類學(xué)生有16人,他們的共同特點(diǎn)是專業(yè)基礎(chǔ)知識(shí)掌握得相對(duì)較好,和第2、第3類學(xué)生相比,他們的專業(yè)課知識(shí)略顯薄弱,對(duì)無(wú)線傳感網(wǎng)、數(shù)據(jù)庫(kù)、嵌入式技術(shù)相關(guān)專業(yè)知識(shí)的認(rèn)知存在明顯不足,建議這類學(xué)生積極查漏補(bǔ)缺,彌補(bǔ)專業(yè)知識(shí)上的短板。第5類學(xué)生有10人,他們C1~C5的能力值都在2.2以下,在專業(yè)知識(shí)的基本認(rèn)知方面存在嚴(yán)重不足,尤其對(duì)主流物聯(lián)網(wǎng)設(shè)備器件的認(rèn)知能力有待提升,建議他們改變目前的學(xué)習(xí)方式,認(rèn)清自身的薄弱環(huán)節(jié),同時(shí)也需要師生們給予他們更多的關(guān)心,幫助他們樹(shù)立好正確的學(xué)習(xí)觀念。
4.3.2 企業(yè)的人才選擇
企業(yè)在人才選擇過(guò)程中,除了可以將學(xué)生在“專業(yè)核心技能”和“專業(yè)知識(shí)”特征項(xiàng)中表現(xiàn)出的職業(yè)傾向性作為主要參考依據(jù),還可以結(jié)合表10中“基本素質(zhì)”的聚類結(jié)果綜合分析。例如某企業(yè)在招聘系統(tǒng)集成相關(guān)崗位時(shí),可以先將“專業(yè)核心技能”中B1、B3、B4能力值突出的第2類學(xué)生和“專業(yè)知識(shí)”中C3、C4、C5能力值突出的第3類學(xué)生作為候選者,再根據(jù)崗位的具體需求,對(duì)候選者的“基本素質(zhì)”進(jìn)行二次篩選,如果崗位傾向于售后服務(wù),則可將環(huán)境適應(yīng)能力、出差意向(A5)和獨(dú)立工作解決問(wèn)題能力(A6)作為二次篩選的重要依據(jù);如果崗位傾向于售前咨詢、方案設(shè)計(jì),則可將語(yǔ)言溝通能力(A3)和獨(dú)立工作和書(shū)面表達(dá)能力(A4)作為二次篩選的重要依據(jù)。
本文使用近鄰傳播算法和改進(jìn)的XB評(píng)價(jià)指標(biāo)設(shè)計(jì)了一個(gè)學(xué)生職業(yè)能力聚類分析評(píng)價(jià)模型,從基本素質(zhì)、專業(yè)核心技能、專業(yè)知識(shí)3個(gè)職業(yè)能力維度給出了學(xué)生最優(yōu)聚類數(shù)目,客觀準(zhǔn)確地完成了職業(yè)能力數(shù)據(jù)的最優(yōu)聚類劃分,解決了經(jīng)典聚類算法在教育數(shù)據(jù)挖掘中存在的聚類數(shù)目過(guò)于依賴人工經(jīng)驗(yàn)等問(wèn)題,實(shí)現(xiàn)了高職學(xué)生職業(yè)能力數(shù)據(jù)的建模、分析與評(píng)價(jià)。該模型可用于高職學(xué)生職業(yè)能力(綜合素質(zhì))評(píng)價(jià)與職業(yè)傾向性預(yù)測(cè),能夠?yàn)榻虒W(xué)反饋與人才的分層分類培養(yǎng)提供理論支撐,能夠?yàn)閷W(xué)生的職業(yè)生涯規(guī)劃和企事業(yè)人力資源的合理配置提供客觀、科學(xué)的參考依據(jù)。