盧錚松 李珂珂
【摘要】在研究生網上課程評價系統(tǒng)收集的大量數據基礎上,構建了一種基于人工神經網絡的多指標課程評價模型,并將網上調查的結果以連接權的方式賦予該評價模型進行訓練。通過實際評價數據的驗證,該模型能夠準確地按照實際評價的過程進行工作。
【關鍵詞】評價模型;人工神經網絡;課程評價
【中圖分類號】G420 【文獻標識碼】A 【論文編號】1009—8097(2009)10—0053—05
一 引言
目前,我國高等教育面臨著培養(yǎng)大批創(chuàng)新人才和為國家自主創(chuàng)新做出更大貢獻兩大任務,對研究生教育已經從注重培養(yǎng)數量轉變?yōu)樽⒅嘏囵B(yǎng)質量。研究生的課程教學過程,是研究生培養(yǎng)質量控制中一個重要環(huán)節(jié),因此對于研究生課程教學質量的評估,也成為提高培養(yǎng)質量的重要課題之一。
然而,對研究生課程教學質量進行評價,是一項復雜的系統(tǒng)工程。在課程評價中涉及的因素較多,在評價中通常采用的問卷調查,由于指標和權重的確定帶有很大的主觀性,調查對象的反饋也存在部分無效信息或噪聲數據,因此并不能完全客觀地反映課程教學水平的高低。
隨著研究生培養(yǎng)工作的不斷發(fā)展,在課程調查方面已經積累了大量原始數據。通過數據挖掘技術,利用已經存在的大量研究生培養(yǎng)和課程調查數據,將其轉換成有用的信息和知識,建立一個完善的研究生課程評價體系和課程評價模型,能夠為課程評價提供高效客觀的結論,并以此為參考,不斷提高研究生的課程教學質量和培養(yǎng)質量。
本文試圖在構建研究生課程評價體系的基礎上,基于數據挖掘技術,通過數據分析和機器學習,提出一種基于人工神經網絡的多指標綜合評價模型。該評價模型不僅可以模擬調查者對課程進行評價,而且還具有很強的容錯能力,非常適合大規(guī)模的評價系統(tǒng)。
人工神經網絡(Artificial Neural Network,簡稱ANN)是近年發(fā)展起來的一門處理復雜系統(tǒng)的理論,其特有的信息處理能力和獨到的解算能力在很多方面都呈現(xiàn)出廣闊的應用前景。ANN主要解決數據挖掘的分類和回歸任務,它基于并行處理的機制,從結構上對人類的思維過程進行模擬,從而能實現(xiàn)人類思維的某些功能,如學習、邏輯推想、聯(lián)想記憶和自組織等[1]。相對于判定樹算法,ANN可以找出輸入屬性和可預測屬性之間平滑而連續(xù)的非線性關系。ANN已經在信號處理、模式識別、目標跟蹤、機器人控制、專家系統(tǒng)、組合優(yōu)化、網絡管理等眾多領域的應用中獲得了引人注目的成果。特別是在解決非線性系統(tǒng)的問題的方面,具有獨特的優(yōu)勢。
二 研究生課程評價體系構建
通過對某重點高校2007-2009年網上課程評價設計的調查問卷進行總結,以及對網上課程評價系統(tǒng)獲取的原始數據整理和匯總,并參考部分典型的課程教育質量評價體系,可以從課程內容、教學過程、教師情況等三個方面來構建課程評價體系。具體的評價指標詳見表1。
三 基于神經網絡的研究生課程評價模型
1 BP神經網絡的構建
目前人工神經網絡的算法模型有很多種,其中BP神經網絡是被廣泛應用的一種重要網絡形式,主要用來進行非線性系統(tǒng)的輸出輸入映射關系建模。其主要結構是由一個輸入層,一個或多個隱含層,一個輸出層組成,各層由若干個神經元(節(jié)點)構成,每一個節(jié)點的輸出值由輸入值、作用函數和閾值決定[2]。
本文采用的是如圖1所示的隱含層為一層的三層BP神經網絡模型。
(6)利用輸出層各單元的一般化誤差 與隱含層各單元的輸出 來修正連接權 和閾值 。
(7)利用隱含層各單元的一般化誤差 ,輸入層各單元的輸入 來修正連接權 和閾值 。
(8)隨機選取下一個學習樣本向量提供給網絡,返回到步驟(2),直到m個訓練樣本訓練完畢。
(9)重新從m個學習樣本中隨機選取一組輸入和目標樣本,返回步驟(2),直到網絡全局誤差E小于預先設定的一個極小值,即網絡收斂。如果學習次數大于預先設定的值,則網絡無法收斂。
(10)學習結束。
3 研究生課程評價模型中的BP神經網絡設計
在研究生課程評價模型中的BP神經網絡中,共有21個指標作為輸入的神經元;輸出層只有一個神經元,即研究生培養(yǎng)質量評價值,它是一個取值范圍是[0,1]的代數值。
隱含層的神經元數目選擇是一個十分復雜的問題,往往需要根據設計者的經驗和多次試驗來確定,因而不存在一個理想的解析式來表示,更不能機械地按照Kolmogorov定理來簡單地確定隱含層的神經元數目。隱含層的神經元數目與問題的要求、輸入和輸出單元的數目都有著直接關系。若隱含層節(jié)點數太少,網絡可能根本不能訓練或網絡性能很差;若隱含層節(jié)點數太多,雖然可使網絡的系統(tǒng)誤差減小,但一方面使網絡訓練時間延長,另一方面,訓練容易陷入局部極小點而得不到最優(yōu)點,也是訓練時出現(xiàn)“過擬合”的內在原因。
本文的具體應用當中,根據下面的經驗公式來確定隱含層節(jié)點數[4],在編程實現(xiàn)時分別選取高、中、低三個不同數值來觀察網絡性能,當網絡的評價誤差最小時,網絡中間層的神經元數目就是最佳值。
(7)
其中S為隱含層節(jié)點數,m為輸入層節(jié)點數,n為輸出層節(jié)點數,S取值范圍為5~15。
根據公式(7),我們首先將隱含層神經元數目設為5,然后逐步增加到10和15。多次試驗之后,通過對這3種情況下的誤差進行對比,發(fā)現(xiàn)隱含層神經元個數為10時,該B-P神經網絡的預測性能最好。因此,本應用中,隱含層神經元數目設為10。
由于應用神經網絡模型需要進行數據的預處理,即對輸入進行歸一化。同時課程評價調查中定性因素較多,對于每個指標的選項采用計分法,共分為1.0、0.7、0.5、0.3、0.1五個等級[5]。通過網絡評價系統(tǒng),讓指定范圍的研究生(如指定班級、指定專業(yè)等)對調查問卷進行評價,得出各個指標的評分值。
表2中以U5課程內容包含信息量、U9對創(chuàng)造性思維的鼓勵程度和U18講解清晰邏輯性強三個指標為例,說明評價指標歸一化處理參考對照表。
四 研究生課程評價模型的應用驗證
該應用的樣本來自于天津大學研究生課程評價與調查系統(tǒng)2007年到2009年的課程評價調查數據。在2007年到2009年間,對當年的一年級研究生進行了15門課程共6次評價調查活動,共計2992人次參與了問卷調查,生成有效調查記錄2972份。在評價系統(tǒng)中可進行調查結果的統(tǒng)計工作,統(tǒng)計頁面如圖2所示。
本文對調查結果進行了適當整理。首先將不同時期不同內容的調查問卷按照評價體系指標進行了歸納,剔除了個別只針對具體課程的問題。其次是對各項評價指標進行了歸一化處理。最后,對單門課程的調查問卷結果進行統(tǒng)計,得到每門參與調查課程各項指標的平均得分。最后統(tǒng)計結果如表3所示。
將各項指標的平均得分輸入BP神經網絡模型中,進行學習訓練。通過對訓練結果進行測試,誤差達到所要求的范圍之內則說明學習成功。一旦學習成功后,神經網絡就可再現(xiàn)調查對象們作為整體的經驗、知識和直覺思維,從而降低評價過程中的人為因素影響,較好的保證了模型計算的客觀性。
該應用具體步驟如下:
(1)按照圖1的網絡設計結構,隱含層神經元的傳遞函數為S型正切函數。由于輸出已經被歸一化到區(qū)間[0,1]中。因此,輸出層神經元的傳遞函數可以設定為S型對數函數。下面代碼片段用來創(chuàng)建一個符合本文應用的BP網絡(本文所有代碼均為MATLAB7.1代碼):
threshold = [0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1;0 1];
net = newff ( threshold, [10,1], {'tansig','logsig'}, 'traingdx');
其中,threshold設定了網絡輸入向量的取值范圍[0,1],網絡所用的學習函數為traingdx,該函數以梯度下降法進行學習,并且學習速率是自適應的[6]。
(2)利用參與調查課程的前10個樣本數據進行訓練。訓練參數的設定中,訓練次數為1000次,精度設為0.0001,其它參數取默認值。網絡訓練代碼如下:
net.trainParam.epochs =1000;
net.trainParam.goal=0.0001;
net=init(net);
net=train(net,P,T);
變量P和T分別表示網絡的輸入向量和目標向量。訓練結果如圖3所示,經過478次訓練后,網絡的目標誤差達到要求。
圖3:實際的MATLAB7.1訓練結果收斂圖
(3)利用后5個樣本數據進行測試。測試代碼如下:
Y = sim(net,P_test);
測試結果如表4:
由表4可見,預測誤差達到預期效果。因此,該模型可以滿足實際的應用要求[7]。
五 結論
由于對研究生課程進行評價的因素相對較為復雜,各項目權重的衡量屬于非線性問題,因此盡管有較多的調查結果,但對于某門課程效果的評價過程還是比較困難的。本文通過分析具體調查項目和結果的基礎上,提出一種基于BP神經網絡的課程評價模型。該模型通過BP網絡對歷史課程調查數據的分析和學習,能夠對研究生課程進行評價分析。通過實例驗證,該模型的評價效果達到了預期的要求。
此外,該課程評價模型在實際應用中尚存在部分問題,主要是評價結果統(tǒng)計時的歸一化無法對定性指標進行處理,如“課程主要提高了哪方面的能力”這樣的問題無法納入該體系中,需要在今后的研究中進一步完善。
參考文獻
[1] 徐宗本,張講社,鄭亞林.計算智能中的仿生學:理論與算法[M].北京:科學出版社,2003:138-139.
[2] CALLAN R. Artificial Intelligence [M].黃厚寬, 田盛豐, 等譯.北京: 電子工業(yè)出版社, 2004:252-254.
[3] Lili Rong.Building a three-layer BP neural network by fuzzy rules [A].Proc of the 9th International Conference on Neural Information Processing[C], 2002:452-456.
[4] 周開利.神經網絡模型及其MATLAB仿真程序設計[M].北京:清華大學出版社,2005:70-80.
[5] 龐玉成.基于人工神經網絡的項目集成管理績效評價研究[J].施工技術,2008,37(2):22-24.
[6] 馮楠,李敏強,寇紀淞,等.基于人工神經網絡的IT項目風險評價模型[J].計算機工程與應用,2006(6):24-26.
[7] Liang Haifeng.An adaptive BP-network approach to short term load forecasting [A].
Proc of the 2004 IEEE International Conference on Electric Utility Deregulation [C].2004:1004-1019.