李翔 黨曉楠 王清雯
摘要:本文以鎮(zhèn)江市高等專科學(xué)校醫(yī)藥與化材學(xué)院畢業(yè)生的就業(yè)質(zhì)量為預(yù)測目標,采用單雙隱層神經(jīng)網(wǎng)絡(luò)作為預(yù)測模型,通過比較模型訓(xùn)練時的預(yù)測精度,模型仿真時的預(yù)測時間及精度,比較單雙隱層的預(yù)測能力。實驗結(jié)果表明,對于較小輸入層神經(jīng)元數(shù)的BP神經(jīng)網(wǎng)絡(luò)模型而言,采用單隱層是較為合理的,預(yù)測精度也較高。采用雙隱層模型將會導(dǎo)致模型運算復(fù)雜化,預(yù)測精度反而降低。
關(guān)鍵詞:就業(yè)質(zhì)量;神經(jīng)網(wǎng)絡(luò);貢獻率;預(yù)測
中圖分類號:G642.0;TP393 文獻標志碼:A 文章編號:1674-9324(2018)29-0037-03
一、引言
高職院校學(xué)生的就業(yè)質(zhì)量一直是社會普遍關(guān)注的焦點,如何有效地對大學(xué)生的就業(yè)質(zhì)量進行預(yù)判,是當(dāng)前社會研究的熱點。目前,有大量的研究采用反向傳播(Back Propagation)神經(jīng)網(wǎng)絡(luò)對大學(xué)生的就業(yè)率、就業(yè)能力、就業(yè)情況進行分析,取得了令人滿意的研究成果。但目前關(guān)于采用BP神經(jīng)網(wǎng)絡(luò)對高職院校大學(xué)生就業(yè)質(zhì)量的分析研究仍然較少。同時,影響高職院校大學(xué)生就業(yè)質(zhì)量的因素眾多,如知識因素、個人因素等,如果將眾多的因素量化并建立數(shù)據(jù)庫時,數(shù)據(jù)庫便顯得龐大繁雜。模型結(jié)構(gòu)及參數(shù)的設(shè)定可能就會對模型的訓(xùn)練速度及精度有所影響,最終對就業(yè)質(zhì)量的預(yù)測精度造成影響。因此,需要對模型的結(jié)構(gòu)及參數(shù)的設(shè)定進行探討,尋找到預(yù)測高職院校大學(xué)生就業(yè)質(zhì)量的最佳模型。
因此,本文嘗試采用兩種不同結(jié)構(gòu)的BP神經(jīng)網(wǎng)絡(luò)模型對大學(xué)生的就業(yè)質(zhì)量進行分析,對不同隱層數(shù)的模型的預(yù)測精度進行比較分析。
二、BP神經(jīng)網(wǎng)絡(luò)
BP網(wǎng)絡(luò)(Back Propagation)是一種按誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò),是目前應(yīng)用最為廣泛的神經(jīng)網(wǎng)絡(luò)模型之一。BP網(wǎng)絡(luò)能學(xué)習(xí)和存貯大量的輸入-輸出模式映射關(guān)系,而無需事前揭示描述這種映射關(guān)系的數(shù)學(xué)方程。該網(wǎng)絡(luò)主要包括了一個輸入層和一個輸出層,中間包含了一個或者多個隱含層。每層都具有一定數(shù)量的神經(jīng)元,輸入層的神經(jīng)元數(shù)目對應(yīng)著影響目標值的各因素數(shù)目。層與層之間的神經(jīng)元存在著權(quán)值和閾值,具體的計算公式可參考文獻。
三、研究方法
1.模型數(shù)據(jù)庫的建立。對醫(yī)藥與化材學(xué)院的近三年畢業(yè)生采取問卷調(diào)查形式,問卷調(diào)查內(nèi)容涵蓋了影響大學(xué)生就業(yè)質(zhì)量的知識因素及個人因素,例如知識因素中的專業(yè)知識因素主要包含了外語過級情況、畢業(yè)生在校期間的班級排名等,個人因素包含了“自我自覺性評價”“自我實踐能力評價”“自我表達能力評價”“自我抗壓能力評價”“自我創(chuàng)新性評價”等。建立模型時需將各個因素進行量化,如“自我實踐能力評價”分為“很強”“較強”“一般”“弱”四個選項,在建立數(shù)據(jù)庫時分別設(shè)定值為“0.99”“0.75”“0.5”“0.25”,將“目前工作的滿意度及未來發(fā)展前景”作為大學(xué)生就業(yè)質(zhì)量的最終評價標準,其選項中“非常滿意”“滿意”“一般”“不滿意”分別設(shè)定值為“0.99”“0.75”“0.5”“0.25”。將各個因素有規(guī)律的量化是建立數(shù)據(jù)庫的基本要求,部分訓(xùn)練樣本的數(shù)據(jù)如表1所示。10個樣本的就業(yè)質(zhì)量目標值量化后分別對應(yīng)0.75、0.5、0.5、0.75、0.75、0.5、0.5、0.75、0.5、0.75。整個調(diào)查問卷過程回收有效問卷85份,任意選擇75份樣本數(shù)據(jù)建立數(shù)據(jù)庫以供模型訓(xùn)練,剩余10樣本數(shù)據(jù)作為“驗證組”,將與模型的“預(yù)測組”進行比較,判斷模型的預(yù)測精度。
2.模型主要參數(shù)的確定。
(1)傳遞函數(shù)及訓(xùn)練函數(shù)的確定。BP神經(jīng)網(wǎng)絡(luò)建模過程可直接采用MATLAB工具箱實現(xiàn),MATLAB提供了神經(jīng)網(wǎng)絡(luò)工具箱,網(wǎng)絡(luò)設(shè)計者可根據(jù)自己的需求直接調(diào)用工具箱中有關(guān)神經(jīng)網(wǎng)絡(luò)的設(shè)計及訓(xùn)練程序。神經(jīng)網(wǎng)絡(luò)工具箱提供了建立神經(jīng)網(wǎng)絡(luò)的專用函數(shù)newff ( ),該函數(shù)的調(diào)用格式為:net=newff(PR,[S1 S2 … SN],{TF1 TF2 … TFN},BTF,BLF,PF),其中PR為數(shù)據(jù)的取值范圍,通常原始數(shù)據(jù)都要經(jīng)過歸一化處理,處理后其值范圍在[-1,1]之間。Si為第i層的神經(jīng)元數(shù),總共N層,TFi為第i層的傳遞函數(shù),本文單、雙隱層的傳遞函數(shù)都設(shè)定為“tansig”,輸出層的傳遞函數(shù)設(shè)為“purelin”。同時,訓(xùn)練函數(shù)選擇“traingdm”函數(shù),該函數(shù)采用了有動量的梯度下降法,具有較高的訓(xùn)練精度。
(2)單隱層BP神經(jīng)網(wǎng)絡(luò)隱含層神經(jīng)元數(shù)的確定。本文隱含層神經(jīng)元數(shù)的確定參考高大啟提供的一個經(jīng)驗公式:
S=0.51+■(1)
式中,m為輸入層神經(jīng)元數(shù),n為輸出層神經(jīng)元數(shù),S為隱含層神經(jīng)元數(shù),本文輸入層神經(jīng)元數(shù)為9,輸出層神經(jīng)元數(shù)為1,通過計算可得隱含層神經(jīng)元數(shù)為6,因此,本文嘗試大的隱含層神經(jīng)元數(shù)分別為4、5、6、7。
(3)雙隱層BP神經(jīng)網(wǎng)絡(luò)隱含層神經(jīng)元數(shù)的確定。參考單隱層BP神經(jīng)網(wǎng)絡(luò)的隱含層神經(jīng)元數(shù),雙隱層第一層神經(jīng)元數(shù)分別為5、6、7,第二層神經(jīng)元數(shù)分別為5、6、7,因此共有九個不同結(jié)構(gòu)的雙隱層神經(jīng)網(wǎng)絡(luò)。
(4)學(xué)習(xí)率及其他訓(xùn)練參數(shù)的確定。本文的學(xué)習(xí)率設(shè)定為0.1,精度設(shè)定為0.02,訓(xùn)練步數(shù)設(shè)定為200000,訓(xùn)練步長設(shè)定為1000。
(5)Matlab的主要程序。
單隱層BP模型引用程序為:
net=newff(minmax(P),[X,1],{'tansig','purelin'},'traingdm');
雙隱層BP模型引用程序為:
net=newff(minmax(P),[X,Y,1],{'tansig','tansig','purelin'},'traingdm');
其中,P為用于訓(xùn)練的樣本各因素量化后的數(shù)據(jù)庫,X與Y分別為第一層與第二層隱含層的神經(jīng)元數(shù)目,T為用于訓(xùn)練的樣本目標量化后的數(shù)據(jù),Pn為用于模型驗證的原始數(shù)據(jù)。
四、BP神經(jīng)網(wǎng)絡(luò)模型的仿真
本文采用了75個樣本建立數(shù)據(jù)庫用于BP神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練,10個樣本數(shù)據(jù)用于模型性能的預(yù)測,實驗結(jié)果如表2與表3所示。本文的預(yù)測目標是大學(xué)生的就業(yè)質(zhì)量,采用的是“目前工作的滿意度以及未來發(fā)展前景”作為就業(yè)質(zhì)量的評價標準。因為本文采用了統(tǒng)計學(xué)模型進行數(shù)據(jù)分析,因此模型仿真后的值為具體數(shù)值,需要進一步對應(yīng)其滿意度,轉(zhuǎn)化后的預(yù)測滿意度與實際滿意度如表3所示。例如當(dāng)單隱含層的神經(jīng)元數(shù)為6時,樣本4的預(yù)測值為0.6216,相比較0.75,0.6216更加接近0.5,因此對應(yīng)的滿意度為“一般”,與實際值相同。
從表3可以看出,當(dāng)隱含層數(shù)為一層,隱含層神經(jīng)元數(shù)為5時,模型預(yù)測的精確度達到了90%,其他結(jié)構(gòu)模型的預(yù)測精度都低于該模型。特別是對于雙隱層BP神經(jīng)網(wǎng)絡(luò)而言,當(dāng)隱含層節(jié)點數(shù)為6/6時,模型的預(yù)測精度為80%,可以看出,單隱層神經(jīng)網(wǎng)絡(luò)模型的預(yù)測精度要高于雙隱層神經(jīng)網(wǎng)絡(luò)模型。這就從側(cè)面說明單隱層BP神經(jīng)網(wǎng)絡(luò)是具備了高精度的預(yù)測性能。
對于單隱層的BP神經(jīng)網(wǎng)絡(luò)模型而言,隨著隱含層神經(jīng)元數(shù)的增加,模型的預(yù)測精度呈現(xiàn)了一個先增加后降低的趨勢,說明當(dāng)采用BP神經(jīng)網(wǎng)絡(luò)模型進行預(yù)測時,隱含層神經(jīng)元數(shù)的選擇對預(yù)測精度有重大影響。合理選擇隱含層神經(jīng)元可提高模型的預(yù)測精度。
五、結(jié)論
本文采用了單、雙隱含層的BP神經(jīng)網(wǎng)絡(luò)對大學(xué)生的就業(yè)質(zhì)量進行了預(yù)測,當(dāng)隱含層神經(jīng)元數(shù)為6時,模型的預(yù)測精度達到了90%,說明該模型具有非常高的預(yù)測精度,模型具備了很強的適用性。當(dāng)對小樣本數(shù)據(jù)進行訓(xùn)練時,可以采用單隱層的BP神經(jīng)網(wǎng)絡(luò)。
參考文獻:
[1]馬丹丹,于占龍,劉越.BP神經(jīng)網(wǎng)絡(luò)在大學(xué)畢業(yè)生就業(yè)率預(yù)測中的研究與應(yīng)用[J].佳木斯大學(xué)學(xué)報(自然科學(xué)版),2014,32(5):751-753.
[2]楊光軍.灰色理論和BP神經(jīng)網(wǎng)絡(luò)在大學(xué)生就業(yè)信心指數(shù)預(yù)測中的應(yīng)用[J].數(shù)學(xué)的實踐與認識,2013,15(6):62-67.
[3]吳振磊,劉孝趙.一種基于BP神經(jīng)網(wǎng)絡(luò)的就業(yè)分析預(yù)測模型[J].輕工科技,2016,(9):70-71.
[4]陳立俊,王克強.基于人工神經(jīng)網(wǎng)絡(luò)方法的大學(xué)生就業(yè)問題探析[J].教育發(fā)展研究,2013,13-14.
[5]佘其平,鄧娟,李慶.基于BP神經(jīng)網(wǎng)絡(luò)的大學(xué)生就業(yè)情況分析[J].現(xiàn)代商貿(mào)工業(yè),2015,36(25),139-141.
[6]童輝杰,楊雅婕,呂航.應(yīng)用神經(jīng)網(wǎng)絡(luò)模型對大學(xué)畢業(yè)生就業(yè)質(zhì)量的預(yù)測[J].人類工效學(xué),2012,(3):20-23.
[7]周勇.大學(xué)生就業(yè)對我國經(jīng)濟的現(xiàn)實影響及建議[J].唐山學(xué)院學(xué)報,2016,28(1):100-104.
[8]葉斌,雷燕.關(guān)于BP網(wǎng)中隱含層數(shù)及節(jié)點數(shù)選取方法淺析[J].商丘職業(yè)技術(shù)學(xué)院學(xué)報,2004,3(15):52-53.