盧毅
(陜西學(xué)前師范學(xué)院 經(jīng)濟(jì)與管理學(xué)院, 陜西 西安 710061)
大學(xué)生與高中生相比,其學(xué)習(xí)主動(dòng)性和積極性有所下降,導(dǎo)致學(xué)業(yè)狀態(tài)存在較大波動(dòng)。如何及時(shí)發(fā)現(xiàn)大學(xué)生的真實(shí)學(xué)業(yè)狀態(tài)并進(jìn)行預(yù)警,可以從理論研究和教學(xué)實(shí)踐兩方面提升學(xué)生成績和學(xué)校教學(xué)管理,價(jià)值巨大[1]。
關(guān)于狀態(tài)預(yù)測與警示方面常規(guī)算法包括有決策樹、聚類、關(guān)聯(lián)規(guī)則和支持向量機(jī)等[2-4]。這些研究主要集中研究歷史課程學(xué)習(xí)成績對(duì)后續(xù)學(xué)習(xí)課程成績的影響,以及生活習(xí)慣、家庭情況對(duì)學(xué)業(yè)狀態(tài)的影響,但是綜合生活特征和學(xué)習(xí)特征的學(xué)業(yè)狀態(tài)預(yù)警的文獻(xiàn)較為少見。本文在對(duì)支持向量機(jī)模型基本的參數(shù)(懲罰參數(shù)以及核值參數(shù))對(duì)建模性能的影響的基礎(chǔ)上,從對(duì)參數(shù)優(yōu)化的角度出發(fā),綜合使用天牛須搜索算法,創(chuàng)新性的提出了基于SVM模型的BAS-SVM模型用于大學(xué)生就業(yè)狀態(tài)模型的生成。在實(shí)驗(yàn)論證的過程中,通過與其他的預(yù)測模型(極限學(xué)習(xí)機(jī)和前饋神經(jīng)網(wǎng)絡(luò)算法)進(jìn)行詳細(xì)的比較后,發(fā)現(xiàn)本文提出的BAS-SVM算法可以更加準(zhǔn)確的預(yù)測學(xué)生學(xué)業(yè)狀態(tài),有利于改善、調(diào)整主客觀因素提升學(xué)業(yè)水平[5]。
作為經(jīng)典的數(shù)據(jù)建模算法,BAS算法基于天牛覓食而建立的效率較高的群智能算法,算法的關(guān)鍵步驟如下[6-7]。
(1) 方向向量的明確
明確方向向量的目的是為了對(duì)天牛的搜索過程進(jìn)行模擬,如式(1)。
(1)
式中,j表示空間維度;round()的作用為制作隨機(jī)數(shù)。
(2) 確定天牛頭部的左右觸須的坐標(biāo)值,如式(2)。
(2)
式中,設(shè)置函數(shù)值xr和xl分別表示天牛的左邊觸須和右邊觸須出現(xiàn)在t次的空間坐標(biāo)值,其中t表示循環(huán)參數(shù),d是常量值,左右側(cè)觸須的須距。
(3) 生成適應(yīng)度的基本值,如式(3)。
(3)
式中,f(x)表示了適應(yīng)度獲取函數(shù),fr和fl表示天牛的左邊觸須和右邊觸須與目前空間的位置比對(duì)適應(yīng)度。
(4) 生成搜索步長,如式(4)。
δt=c1δt-1+δ0,dt=δt/c2
(4)
式中 ,δ值表示天牛搜索的最終步長值;δ0表示天?;境跏蓟介L,向大取值;δt表示經(jīng)過t次搜索后的步長的因子數(shù)值;c1、c2表示常量步長因子。
(5) 生成最新位置,如式(5)。
(5)
式中,sign()表示位置函數(shù);δt仍然表示第t次搜索的步長因子。
(6) 判斷是否符合預(yù)測的規(guī)則
主要通過當(dāng)前位置的適應(yīng)度的數(shù)值與前一次的空間位置適應(yīng)度值的比較,如果位置更優(yōu)則更新新的位置,相反的則不更新。
ξi≥0,i=1,2,…,n
(6)
(7)
為準(zhǔn)確合理地實(shí)現(xiàn)學(xué)業(yè)動(dòng)態(tài)預(yù)警,參考文獻(xiàn)[8-10]的基礎(chǔ)上,選擇考勤指數(shù)、學(xué)習(xí)指數(shù)、成績指數(shù)、“宅”指數(shù)和家境等5個(gè)關(guān)鍵指標(biāo)作為學(xué)業(yè)預(yù)警的主要指標(biāo),并將學(xué)業(yè)預(yù)警結(jié)果劃分為好、中、差三個(gè)等級(jí),如表1所示。
表1 學(xué)業(yè)動(dòng)態(tài)預(yù)警評(píng)價(jià)指標(biāo)
在SVM模型中,核心參數(shù)g的主要作用于分類的準(zhǔn)確度,而懲罰參數(shù)值C所影響的是模型控制方面的接近程度、誤差大小和復(fù)雜度。懲罰參數(shù)值與模型準(zhǔn)確度成正比,與泛化能力成反比。由于SVM模型算法與懲罰參數(shù)值的大小和核函數(shù)的關(guān)系緊密相關(guān)性,因此,引入了BAS算法,主要是對(duì)上述兩個(gè)參數(shù)值的合理計(jì)算,來提升SVM模型的準(zhǔn)確度,如式(8)。
(8)
式中,Total表示選擇的樣本集合數(shù)量值,right函數(shù)表示中分類合理的樣本集。
本文提出的BAS-SVM模型進(jìn)行學(xué)生就業(yè)預(yù)警執(zhí)行步驟如下。
(1) 第一步通過BAS算法,明確最優(yōu)懲罰參數(shù)和核函數(shù),選擇步長因子c1和c1,并使用BAS算法計(jì)算迭代最優(yōu)次數(shù)和當(dāng)前循環(huán)量。將預(yù)先準(zhǔn)備好的用于學(xué)業(yè)預(yù)警的準(zhǔn)備數(shù)據(jù)分為訓(xùn)練樣本、測試樣本兩種,分別用于本文提出的模型的生成和準(zhǔn)確度實(shí)驗(yàn)。
(2) 執(zhí)行迭代。首先設(shè)置t的值為0,同時(shí)對(duì)天牛的初始位置進(jìn)行定義,選擇最佳位置后,通過式(8)來完成天牛的左觸須和右觸須的位置計(jì)算。
(3) 循環(huán)結(jié)束后,將t的指針下一位,重復(fù)步驟(2),并計(jì)算出天牛左右須的適應(yīng)度f(xr)和f(xl)。
(4) 將第三步生產(chǎn)左右須的位置值,帶入式(5)中,更新位置xt,同時(shí)算出新的適應(yīng)度值f(xt);
(5) 完成天牛最新位置的獲得并更新值。做法為接受概率的數(shù)值P,引入式(6)首先判斷如果f(xt) (6) 進(jìn)行判斷,如果t (7) 最后,獲得最準(zhǔn)確的預(yù)警值,通過最終一輪循環(huán)獲得的xbest與fbest,使用式(8)計(jì)算最合理的懲罰系數(shù)C和核函數(shù)g,并在二者的基礎(chǔ)上完成最佳學(xué)生學(xué)業(yè)預(yù)警值測速和核對(duì)。 通過實(shí)驗(yàn),進(jìn)一步完成本文提出的算法的測算,并對(duì)比其他經(jīng)典算法,數(shù)據(jù)源選擇陜西學(xué)前師范學(xué)院經(jīng)濟(jì)與管理學(xué)院各專業(yè)學(xué)生為研究對(duì)象,好、中和差等3種學(xué)業(yè)狀態(tài)的樣本數(shù)據(jù)各150組。不同學(xué)業(yè)狀態(tài)樣本數(shù)據(jù),如表2所示。 表2 不同學(xué)業(yè)狀態(tài)樣本 操作系統(tǒng)為Windows10,CPU為Intel(R)Core(TM)i5-2400 4-core,主頻為2.60 GHz,內(nèi)存8 GB,仿真軟件為Matlab2015(a)。 對(duì)于學(xué)生學(xué)業(yè)預(yù)警的準(zhǔn)確性提出了評(píng)價(jià)指標(biāo),使用準(zhǔn)確率和誤判率作為評(píng)判基本指標(biāo)[11-12]。 (1) 準(zhǔn)確率T:假設(shè)學(xué)業(yè)狀態(tài)被正確識(shí)別的數(shù)量為A,而學(xué)業(yè)狀態(tài)的實(shí)際數(shù)量為B,則學(xué)業(yè)狀態(tài)評(píng)估的準(zhǔn)確率,如式(9)。 (9) (2) 誤判率F:假設(shè)學(xué)業(yè)狀態(tài)是第i類的實(shí)際數(shù)量為H,而將第i類學(xué)業(yè)狀態(tài)誤判為第j類學(xué)業(yè)狀態(tài)的數(shù)量為W,則學(xué)業(yè)狀態(tài)判斷的誤判率,如式(10)。 (10) 為了驗(yàn)證學(xué)業(yè)狀態(tài)預(yù)警的效果,將BAS-SVM和ELM[13]、SVM[14]和BP[15]經(jīng)典算法橫向?qū)Ρ?,選擇4.2節(jié)基于BAS算法獲得參數(shù):最大迭代次數(shù)gen=100,步長因子c1=0.997,c2=10,算法橫向比對(duì)的值,如表3和圖1-圖4所示。 表3 學(xué)業(yè)狀態(tài)預(yù)警結(jié)果 圖1 BAS-SVM學(xué)業(yè)狀態(tài)評(píng)估結(jié)果 圖2 ELM學(xué)業(yè)狀態(tài)評(píng)估結(jié)果 圖1-圖4中,“*”為學(xué)業(yè)狀態(tài)的預(yù)警類別,“○”為示學(xué)業(yè)狀態(tài)的實(shí)際類別,結(jié)合圖1和圖4的結(jié)果可以發(fā)現(xiàn),通過本文算法的學(xué)業(yè)預(yù)警結(jié)果非常的精確的體現(xiàn)了實(shí)際的學(xué)學(xué)業(yè)狀態(tài),圖例使用1代表學(xué)業(yè)較好、2代表學(xué)業(yè)一般、3代表學(xué)業(yè)差。在“*”與“○”重疊時(shí),學(xué)業(yè)狀態(tài)的預(yù)警分類值與現(xiàn)實(shí)的實(shí)際值完全相同,代表學(xué)業(yè)狀態(tài)預(yù)警結(jié)果準(zhǔn)確;在“*”和“○”不完全重疊時(shí),說明預(yù)警狀態(tài)與實(shí)際狀態(tài)發(fā)生偏差,預(yù)警出現(xiàn)失誤。由表3和圖1-圖4可知,采用基于BAS-SVM模型做出的學(xué)業(yè)狀態(tài)預(yù)警結(jié)果的準(zhǔn)確率高達(dá)97.12%,而誤判率僅有2.88%,優(yōu)于ELM的92.28%和7.72%,SVM的90.46%和9.54%和BPNN的86.35%和13.65%。與ELM、SVM和BPNN對(duì)比發(fā)現(xiàn),BAS-SVM可以有效提高學(xué)業(yè)狀態(tài)預(yù)警結(jié)果的準(zhǔn)確率,為學(xué)業(yè)狀態(tài)預(yù)警評(píng)估提供了新的方法和途徑。 圖3 SVM學(xué)業(yè)狀態(tài)評(píng)估結(jié)果 圖4 BPNN學(xué)業(yè)狀態(tài)評(píng)估結(jié)果 為提高大學(xué)生學(xué)業(yè)狀態(tài)的預(yù)警準(zhǔn)確度,在經(jīng)典的SMV模型的基礎(chǔ)上,調(diào)整核參數(shù)以及性能被懲罰的參數(shù)值,創(chuàng)建了改進(jìn)的BAS-SVM的大學(xué)生學(xué)業(yè)狀態(tài)動(dòng)態(tài)預(yù)警模型。將BAS-SVM模型的輸入變量為影響學(xué)業(yè)狀態(tài)的5個(gè)關(guān)鍵KPI值(考勤指數(shù)、學(xué)習(xí)指數(shù)、成績指數(shù)、“宅”指數(shù)和家境),經(jīng)過模型運(yùn)算后輸出預(yù)警判斷結(jié)果值。與ELM、SVM和BPNN對(duì)比發(fā)現(xiàn),BAS-SVM可以有效提高學(xué)業(yè)狀態(tài)預(yù)警結(jié)果的準(zhǔn)確率,為學(xué)業(yè)狀態(tài)預(yù)警評(píng)估提供了新的方法和途徑。4 仿真實(shí)驗(yàn)與結(jié)果分析
4.1 數(shù)據(jù)來源
4.2 評(píng)價(jià)指標(biāo)
4.3 結(jié)果分析
5 總結(jié)