崔榮一, 趙亞慧, 崔 旭, 尹哲峰, 張振國
(延邊大學(xué) a. 工學(xué)院; b. 教務(wù)處, 吉林 延吉 133002)
現(xiàn)代數(shù)量統(tǒng)計(jì)方法已在高校教學(xué)質(zhì)量評(píng)價(jià)中使用并在不同程度上取得了一定效果[1,2], 但這些方法仍然存在很多不完善的地方, 在確定各項(xiàng)評(píng)價(jià)指標(biāo)的權(quán)重方面有一定困難, 通常憑借專家經(jīng)驗(yàn)的評(píng)估, 導(dǎo)致評(píng)估主觀隨意性大, 評(píng)價(jià)結(jié)果的客觀性與合理性欠佳。傳統(tǒng)的評(píng)價(jià)方法是[3-5]: 給定評(píng)價(jià)指標(biāo)體系, 其中每個(gè)評(píng)價(jià)指標(biāo)被賦以確定的權(quán)重, 以表現(xiàn)該指標(biāo)對(duì)結(jié)果的重要程度。評(píng)價(jià)者通過觀察和分析給被評(píng)價(jià)者的各項(xiàng)指標(biāo)打分, 各指標(biāo)的分值與權(quán)重相乘后累加作為總的分值, 最終按事先確定的劃分規(guī)則由總分推定評(píng)價(jià)結(jié)果。這種評(píng)價(jià)模式存在以下兩方面的固有缺陷。
1) 線性。傳統(tǒng)評(píng)價(jià)模型的本質(zhì)是: 評(píng)價(jià)結(jié)果為各項(xiàng)評(píng)價(jià)因素的線性組合。但因素的線性組合是體現(xiàn)結(jié)果最簡單的方法, 不能解釋因素與結(jié)果之間的復(fù)雜聯(lián)系。教學(xué)活動(dòng)中各因素對(duì)結(jié)果的作用遠(yuǎn)超過線性關(guān)系所能表示的簡單機(jī)制。
2) 靜態(tài)。傳統(tǒng)評(píng)價(jià)模型中對(duì)各因素的權(quán)重是根據(jù)經(jīng)驗(yàn)設(shè)定的固定值, 不隨時(shí)間、 數(shù)據(jù)而變化。通常不同階段各因素之間的相對(duì)重要程度是不同的, 傳統(tǒng)模型無法從收集的數(shù)據(jù)中發(fā)現(xiàn)因素重要性的變化, 也無法自動(dòng)確定不同時(shí)期各因素的權(quán)重。另外, 靜態(tài)方式無法克服確定權(quán)重時(shí)人為因素影響。
人工神經(jīng)網(wǎng)絡(luò)是實(shí)現(xiàn)任意函數(shù)的映射功能的非線性機(jī)制[6-9], 它利用訓(xùn)練算法(如, 經(jīng)典的BP算法)匹配給定的訓(xùn)練數(shù)據(jù)。因此人工神經(jīng)網(wǎng)絡(luò)是解決非線性和動(dòng)態(tài)性的有力工具; 而Boosting是一種提高任意給定學(xué)習(xí)算法準(zhǔn)確度的有效方法[10-12], 可用于產(chǎn)生準(zhǔn)確的評(píng)價(jià)結(jié)果。
筆者研究教學(xué)質(zhì)量的智能評(píng)價(jià)方法, 通過引入人工神經(jīng)網(wǎng)絡(luò)技術(shù)打破上述兩方面的限制, 并利用Boosting法集成多個(gè)子評(píng)價(jià)器, 構(gòu)建準(zhǔn)確率高的評(píng)價(jià)器, 揭示因素與結(jié)果之間的復(fù)雜關(guān)系以及這種關(guān)系隨給定時(shí)期訓(xùn)練樣例集的變化而變化的動(dòng)態(tài)性質(zhì), 使評(píng)價(jià)器產(chǎn)生的結(jié)果客觀、 合理、 魯棒, 同時(shí)可以評(píng)估各項(xiàng)評(píng)價(jià)指標(biāo)的有效性。
在教育理論和實(shí)踐經(jīng)驗(yàn)指導(dǎo)下, 經(jīng)過調(diào)研、 分析和歸納, 可構(gòu)建影響教學(xué)效果的若干因素, 在評(píng)價(jià)體系中稱為指標(biāo), 筆者中稱為評(píng)價(jià)因素。由n個(gè)因素構(gòu)成質(zhì)量評(píng)價(jià)關(guān)鍵因素集
F={f1,f2,…,fn}(1)
關(guān)鍵因素集F中各因素具有相同的最大得分值M, 即
0≤fi≤Mi=1,2,…,n(2)
評(píng)價(jià)系統(tǒng)采用百分制時(shí):M=100, 每個(gè)指標(biāo)所得分值范圍為0~100。
傳統(tǒng)的教學(xué)質(zhì)量評(píng)價(jià)方法是讓評(píng)價(jià)者針對(duì)被評(píng)價(jià)教師評(píng)價(jià)關(guān)鍵因素集F中的各因素打分, 最后進(jìn)行加權(quán)平均, 以此作為對(duì)教學(xué)質(zhì)量的評(píng)價(jià)結(jié)果。
各項(xiàng)評(píng)價(jià)指標(biāo)具有確定的權(quán)重, 組成權(quán)向量
W=(w1,w2,…,wn)T(3)
歸一化條件為
(4)
其中wi為關(guān)鍵因素集F中指標(biāo)fi的權(quán)重, 表示該指標(biāo)的相對(duì)重要程度。對(duì)評(píng)價(jià)實(shí)例j, 教師的各項(xiàng)指標(biāo)得分值形成得分向量
Xj=(xj1,xj2,…,xjn)Tj=1,2,…,J(5)
其中xji為該實(shí)例中指標(biāo)fi所得分?jǐn)?shù), 取值范圍為[0,M];J為評(píng)價(jià)實(shí)例總數(shù)。傳統(tǒng)評(píng)價(jià)模型是一種線性評(píng)價(jià)模型, 即實(shí)例j的評(píng)價(jià)結(jié)果是各項(xiàng)指標(biāo)得分值的線性組合
sj=WTXj(6)
上述結(jié)果的取值范圍為[0,M](M為各項(xiàng)指標(biāo)得分上限, 見式(2))。
定義映射函數(shù)E將評(píng)價(jià)得分值(6)映射到[0,3]
E(x)=min([4x/M],3)x∈[0,M](7)
其中[·]表示取整。上述函數(shù)值0~3分別對(duì)應(yīng)于4個(gè)區(qū)間: [0,M/4),[M/4,M/2),[M/2,3M/4),[3M/4,M], 分別對(duì)應(yīng)于定性評(píng)價(jià)結(jié)論: “不合格”、 “合格”、 “良好”、 “優(yōu)秀”。因此, 傳統(tǒng)評(píng)價(jià)模型下實(shí)例j對(duì)教師的評(píng)價(jià)結(jié)果
ej=E(sj)(8)
ej在[0,3]中取值, 分別對(duì)應(yīng)于評(píng)價(jià)結(jié)果“不合格”、 “合格”、 “良好”、 “優(yōu)秀”。筆者將ej作為實(shí)例j的人工評(píng)價(jià)值。
為實(shí)現(xiàn)智能評(píng)價(jià)功能, 必須通過以下措施克服傳統(tǒng)評(píng)價(jià)模型的缺陷。
1) 引入因素到結(jié)果的非線性映射機(jī)制。為在評(píng)價(jià)機(jī)制中引入人類所具有的智能特性, 需以非線性變換模擬人類智能行為, 這樣可反映因素與結(jié)果之間的復(fù)雜關(guān)系。同時(shí), 非線性能保證評(píng)價(jià)結(jié)果對(duì)個(gè)別因素的局部微小變化(包括不恰當(dāng)?shù)牧炕u(píng)定)和噪聲數(shù)據(jù)具有一定的抵抗能力, 保證評(píng)價(jià)系統(tǒng)具有良好的穩(wěn)定性。
2) 實(shí)現(xiàn)因素集與評(píng)價(jià)結(jié)果之間關(guān)系的動(dòng)態(tài)性。根據(jù)每學(xué)期發(fā)生的學(xué)生對(duì)教師的評(píng)價(jià)數(shù)據(jù)、 教師同行之間的評(píng)價(jià)數(shù)據(jù), 通過機(jī)器學(xué)習(xí)方法確定當(dāng)前階段各項(xiàng)評(píng)價(jià)因素對(duì)評(píng)價(jià)結(jié)果的作用參數(shù), 使動(dòng)態(tài)權(quán)重能夠適應(yīng)不同時(shí)期的評(píng)價(jià)取向。同時(shí), 動(dòng)態(tài)性能夠有效地克服人為主觀因素局限性, 實(shí)現(xiàn)評(píng)價(jià)體系良好的自適應(yīng)能力。
這種智能化評(píng)價(jià)模型具有以下優(yōu)點(diǎn):
1) 揭示因素與結(jié)果之間的復(fù)雜關(guān)系, 使得評(píng)價(jià)結(jié)果更加客觀、 合理;
2) 因素與結(jié)果之間關(guān)系的動(dòng)態(tài)特性, 一方面能夠更準(zhǔn)確地匹配當(dāng)前教師與學(xué)生的評(píng)價(jià)數(shù)據(jù), 另一方面能分析發(fā)現(xiàn)不同時(shí)期各項(xiàng)評(píng)價(jià)因素對(duì)評(píng)價(jià)結(jié)果的重要程度;
3) 經(jīng)過訓(xùn)練后獲得的評(píng)價(jià)模型能根據(jù)當(dāng)前數(shù)據(jù)對(duì)教師教學(xué)行為進(jìn)行預(yù)測性評(píng)價(jià), 其結(jié)果反映當(dāng)前階段師生的評(píng)價(jià)趨勢;
4) 對(duì)各項(xiàng)因素測量值的微小誤差具有一定的抗干擾能力, 保證評(píng)價(jià)系統(tǒng)的穩(wěn)定性。
筆者采用人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)智能評(píng)價(jià)模型, 稱之為評(píng)價(jià)器。該評(píng)價(jià)器包括結(jié)構(gòu)相同的3個(gè)BP(Back Propagation)神經(jīng)網(wǎng)絡(luò), 稱為子評(píng)價(jià)器(見圖1), 因此評(píng)價(jià)器由子評(píng)價(jià)器集成而成。評(píng)價(jià)教師教學(xué)質(zhì)量時(shí)3個(gè)子評(píng)價(jià)器同時(shí)工作, 并采用Boosting協(xié)同判決規(guī)則決定最終評(píng)價(jià)結(jié)果。
圖1 集成評(píng)價(jià)器示意圖Fig.1 Diagram of ensemble evaluator
每個(gè)子評(píng)價(jià)器BP神經(jīng)網(wǎng)絡(luò)有n個(gè)輸入節(jié)點(diǎn), 對(duì)應(yīng)于評(píng)價(jià)指標(biāo)F;m個(gè)隱層節(jié)點(diǎn)和4個(gè)輸出節(jié)點(diǎn)(見圖2)。
輸入層的作用是接收對(duì)某教師教學(xué)質(zhì)量評(píng)價(jià)的各項(xiàng)評(píng)價(jià)因素的分值, 這些分值由評(píng)價(jià)人員確定(同行或?qū)W生)。隱層的作用是提取各項(xiàng)評(píng)價(jià)因素的特征, 反映給定評(píng)價(jià)分值所包含的內(nèi)在特征, 并采用sigmoid函數(shù)進(jìn)行非線性變換后輸出。輸出層對(duì)每個(gè)隱單元輸出進(jìn)行線性組合之后產(chǎn)生評(píng)價(jià)結(jié)果。按照前饋網(wǎng)絡(luò)的表征能力, 這種網(wǎng)絡(luò)結(jié)構(gòu)可逼近任意有界連續(xù)函數(shù)。
圖2 子評(píng)價(jià)器BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.2 BP-ANN structure of sub-evaluator
隱單元的個(gè)數(shù)m沒有理論上的結(jié)論, 可根據(jù)特定算法或經(jīng)驗(yàn)值確定[13-15], 而4個(gè)輸出單元對(duì)應(yīng)于不同評(píng)價(jià)結(jié)果。4個(gè)輸出單元的輸出yi(i=1,2,3,4)按以下方式進(jìn)行處理得到歸一化輸出
(9)
(10)
(11)
當(dāng)4個(gè)輸出單元中只有一個(gè)單元的輸出為1(或接近于1)而其余單元的輸出為0(或接近于0)時(shí), 輸出1對(duì)應(yīng)評(píng)價(jià)結(jié)果, 即圖2中4個(gè)單元中輸出為1 的單元對(duì)應(yīng)的結(jié)果即為評(píng)價(jià)結(jié)果(“優(yōu)秀”、 “良好”、 “合格”和“不合格”)。如果有多個(gè)單元輸出值較大且接近, 就無法斷定結(jié)果, 此時(shí)評(píng)價(jià)器的輸出為無效輸出。
歸一化輸出構(gòu)成輸出向量
(12)
有效輸出向量中有且僅有1個(gè)分量為1, 其余3個(gè)分量為0。對(duì)實(shí)例j, 式(12)表示的歸一化輸出構(gòu)成目標(biāo)輸出向量
(12)′
有效輸出向量與式(8)所示實(shí)例j的目標(biāo)值之間的關(guān)系如表1所示。
表1 實(shí)例j的目標(biāo)輸出向量
訓(xùn)練階段按上述對(duì)應(yīng)關(guān)系設(shè)置目標(biāo)輸出向量值。
筆者通過采集和整理學(xué)生與同行教師評(píng)價(jià)的基礎(chǔ)數(shù)據(jù), 并利用傳統(tǒng)評(píng)價(jià)模型構(gòu)造評(píng)價(jià)器的訓(xùn)練樣本集。評(píng)價(jià)實(shí)例j提供的訓(xùn)練樣例為
(13)
D={d1,d2,…,dJ}
(14)
其中J為訓(xùn)練樣例總數(shù)。
由于歸一化輸出(9)具有概率性質(zhì)式(10)和式(11), 因此, 可通過以下輸出熵判定評(píng)價(jià)器輸出是否有效
(15)
其中l(wèi)og為以2為底的對(duì)數(shù)。由熵的性質(zhì)可知
0≤H≤2
(16)
當(dāng)輸出熵很小時(shí), 即H<ε
(17)
輸出分布趨于確定, 即只有一個(gè)單元輸出接近于1, 而其余單元輸出接近于0, 評(píng)價(jià)器給出有效輸出, 對(duì)評(píng)價(jià)結(jié)果進(jìn)行確定性判定。當(dāng)輸出熵H接近于最大值2時(shí), 4個(gè)輸出相互接近, 評(píng)價(jià)結(jié)果完全不可確定。根據(jù)對(duì)數(shù)函數(shù)性質(zhì)可以給出表2所示的輸出熵與輸出分布之間的關(guān)系。其中典型輸出分布模式是指某些單元的輸出較大且相互一致而另一些單元的輸出很小的輸出情況, 其中不考慮輸出值的排列順序; 典型輸出單元個(gè)數(shù)是典型輸出分布中輸出值較大的單元數(shù)。
表2 輸出熵與輸出分布之間的典型關(guān)系
由表2可見, 當(dāng)式(17)中的ε遠(yuǎn)小于1時(shí)典型輸出單元個(gè)數(shù)趨近于1, 4個(gè)單元輸出中的有1個(gè)輸出明顯大于其他單元的輸出, 從而進(jìn)行確定性判定。
評(píng)價(jià)器訓(xùn)練策略如下。
Step1
從樣本集D中不放回地隨機(jī)選取JA≈J/3個(gè)樣本組成樣本集DA, 根據(jù)DA訓(xùn)練子評(píng)價(jià)器A(記為EA); 只要求EA是弱分類器, 錯(cuò)誤率小于50%即可。
Step2
產(chǎn)生0~1隨機(jī)數(shù)R
1) 若R=1: 隨機(jī)選取DDA中的樣本連續(xù)送入EA進(jìn)行測試, 當(dāng)遇到第1個(gè)被錯(cuò)判樣本時(shí), 把它加入訓(xùn)練集DB, 并重復(fù)本步驟。
2) 若R=0: 將把被EA正確判定的樣本加入訓(xùn)練集DB。
3) 產(chǎn)生的樣本數(shù)JB≈J/3時(shí)停止, 按此方法構(gòu)建的DB中的50%被EA正確判定, 而50%被錯(cuò)判。
Step3
利用DB訓(xùn)練子評(píng)價(jià)器B(記為EB)。
Step4
在(DDA)DB中選取樣本, 并用EA和EB進(jìn)行測試: 若EA和EB的判決結(jié)果不同, 就把該樣本加入DC, 否則忽略該樣本, 然后利用DC訓(xùn)練出子評(píng)價(jià)器C(記為EC), 這一策略的目標(biāo)是提高準(zhǔn)確率。集成效果增強(qiáng)了準(zhǔn)確率, 每個(gè)子評(píng)價(jià)器的訓(xùn)練都選擇已有的其它各子評(píng)價(jià)器所給出的最富信息的樣本進(jìn)行。
評(píng)價(jià)教師教學(xué)質(zhì)量時(shí), 對(duì)新的評(píng)價(jià)實(shí)例x, 3個(gè)子評(píng)價(jià)器按以下Boosting規(guī)則運(yùn)行并給出評(píng)價(jià)結(jié)果。
1) 若EA和EB判定結(jié)果相同, 則x的評(píng)價(jià)結(jié)果就是這個(gè)判定結(jié)果。
2) 若EA和EB判定結(jié)果不同, 則x的評(píng)價(jià)結(jié)果就是EC判定的結(jié)果。
利用某高校2013年度至2015年度全校期末成績和學(xué)生與教師同行的評(píng)估數(shù)據(jù), 進(jìn)行了3年的實(shí)踐應(yīng)用和驗(yàn)證測試, 并收集評(píng)估結(jié)果達(dá)不到滿意度的樣例, 作為進(jìn)一步訓(xùn)練的樣本數(shù)據(jù)反復(fù)訓(xùn)練評(píng)價(jià)器。所獲得結(jié)果的合理性和客觀性符合教師、 專家分析結(jié)果, 達(dá)到了預(yù)期目標(biāo), 有效補(bǔ)充與驗(yàn)證了人工評(píng)估工作, 其智能評(píng)估方法為該領(lǐng)域的進(jìn)一步深入研究奠定了堅(jiān)實(shí)的基礎(chǔ)。
所采集的數(shù)據(jù)如表3所示。
表3 評(píng)價(jià)數(shù)據(jù)規(guī)模
將學(xué)生評(píng)價(jià)數(shù)據(jù)和教師同行評(píng)價(jià)數(shù)據(jù)中的2/3作為訓(xùn)練數(shù)據(jù), 1/3用于測試分析。
BP網(wǎng)絡(luò)采用有監(jiān)督學(xué)習(xí)策略, 然而對(duì)給定的評(píng)價(jià)因素得分向量, 其目標(biāo)輸出并不是輕易確定的, 需經(jīng)專家級(jí)的人工判定, 甚至是專家-教師-學(xué)生集體判定, 造成訓(xùn)練數(shù)據(jù)構(gòu)造的極大困難。為解決工程上的問題, 在2.3節(jié)中采用傳統(tǒng)評(píng)價(jià)方法的結(jié)果作為目標(biāo)輸出向量值。這里隱含的假設(shè)是: 所采集的數(shù)據(jù)中傳統(tǒng)方式下對(duì)教師教學(xué)質(zhì)量的評(píng)價(jià)沒有顯著異常結(jié)果存在。如果存在原因與結(jié)果關(guān)系反常的數(shù)據(jù), 必須予以剔除。
訓(xùn)練過程如下。
1) 構(gòu)造得分向量。利用訓(xùn)練數(shù)據(jù)中教師各項(xiàng)評(píng)價(jià)因素得分值構(gòu)造得分向量(見式(5))。
2) 確定目標(biāo)輸出值。利用評(píng)價(jià)體系中設(shè)定的各項(xiàng)評(píng)價(jià)因素的權(quán)重, 計(jì)算傳統(tǒng)模式下的評(píng)價(jià)結(jié)果(見式(6)), 并通過定性評(píng)價(jià)映射(見式(8))確定人工評(píng)價(jià)值后, 通過表1中的對(duì)應(yīng)關(guān)系, 確定目標(biāo)輸出向量。
3) 制備訓(xùn)練樣本。通過上述兩步, 構(gòu)造如式(13)~(14)所示的訓(xùn)練樣本集。
4) 訓(xùn)練子評(píng)價(jià)器。利用上述訓(xùn)練樣本集, 按照2.5節(jié)給出的評(píng)價(jià)器訓(xùn)練策略訓(xùn)練子評(píng)價(jià)器。測試階段, 對(duì)子評(píng)價(jià)器的輸出有效性需進(jìn)行判定, 測試過程如下。
①子評(píng)價(jià)器輸出的有效性檢驗(yàn)。對(duì)給定測試數(shù)據(jù), 將得分向量輸入到子評(píng)價(jià)器, 并計(jì)算輸出熵, 當(dāng)輸出熵不滿足式(17)時(shí), 即H≥ε時(shí), 測試失敗, 該數(shù)據(jù)無法判定評(píng)價(jià)結(jié)果, 將該數(shù)據(jù)放入富信息數(shù)據(jù)集D′中; 否則進(jìn)入決策判定環(huán)節(jié)。
圖3 富信息數(shù)據(jù)反饋訓(xùn)練效果Fig.3 Effect of training withfeedback of informative data
② 決策判定。按照2.5節(jié)給出的Boosting規(guī)則判決評(píng)價(jià)結(jié)果。
由-0.9log0.9-3×(1/30)log(1/30)≈0.6(輸出模式為(9/10,1/30,1/30,1/30))可知, 式(17)中ε取0.6, 能為輸出有效性提供良好的判定界限。
測試過程中發(fā)現(xiàn)最初約50%的測試數(shù)據(jù)的輸出結(jié)果是無效的。將這些數(shù)據(jù)放入富信息數(shù)據(jù)集D′后對(duì)子評(píng)價(jià)器重新訓(xùn)練(富信息數(shù)據(jù)反饋訓(xùn)練), 能進(jìn)一步提高評(píng)價(jià)器的判決能力。隨富信息數(shù)據(jù)集反饋訓(xùn)練次數(shù)的增加, 無效輸出數(shù)據(jù)比例總體趨于下降(見圖3)。這說明對(duì)困難的數(shù)據(jù)加強(qiáng)學(xué)習(xí), 是提高子評(píng)價(jià)器有效性的重要途徑。
經(jīng)過富信息數(shù)據(jù)反饋訓(xùn)練手段完成訓(xùn)練后, 測試結(jié)果如表4所示。其中有效數(shù)據(jù)百分比是通過富信息數(shù)據(jù)反饋訓(xùn)練后對(duì)3 個(gè)子評(píng)價(jià)器其輸出都滿足式(17)的數(shù)據(jù)所占百分比。
表4 評(píng)價(jià)測試結(jié)果
表4中最右兩列傳統(tǒng)模式下特定因素對(duì)結(jié)果影響的百分比和筆者模式下特定因素對(duì)結(jié)果影響的百分比指的是: 選定某一評(píng)價(jià)因素fk, 當(dāng)其值在最小值到最大值之間變化時(shí), 傳統(tǒng)模式的評(píng)價(jià)結(jié)果發(fā)生變化的百分比和筆者模式的評(píng)價(jià)結(jié)果發(fā)生變化的百分比。這一測試是為檢驗(yàn)評(píng)價(jià)結(jié)果與評(píng)價(jià)因素之間的關(guān)聯(lián)特性, 測試中選擇的評(píng)價(jià)因素是課間休息適當(dāng), 其得分值在0~100之間變化時(shí), 傳統(tǒng)方式下平均90.8%的評(píng)價(jià)對(duì)象的評(píng)價(jià)結(jié)果發(fā)生了變化, 而且每年情況差不多; 而在筆者模式下僅有6.4%的評(píng)價(jià)對(duì)象的評(píng)價(jià)結(jié)果發(fā)生變化, 而且每年的變化幅度不同, 說明在非線性模式下這一因素對(duì)評(píng)價(jià)結(jié)果的影響不很強(qiáng)烈, 而且具有動(dòng)態(tài)特性。當(dāng)然, 對(duì)另一些因素, 筆者模式下的評(píng)價(jià)結(jié)果改變率會(huì)明顯高于傳統(tǒng)模式??傊? 筆者模式充分體現(xiàn)了評(píng)價(jià)因素到結(jié)果之間的非線性映射特性, 而且隨機(jī)抽樣后通過專家人工判讀, 筆者方式下的評(píng)價(jià)結(jié)果更加符合人類分析結(jié)果。
筆者提出了教學(xué)質(zhì)量評(píng)價(jià)的智能化方法, 有效地克服了基于線性靜態(tài)模型的傳統(tǒng)評(píng)價(jià)方法的缺陷, 使評(píng)價(jià)結(jié)果更加客觀、 合理。筆者成果的創(chuàng)新點(diǎn)如下。
1) 通過人工神經(jīng)網(wǎng)絡(luò)模型建立了因素到結(jié)果的非線性映射機(jī)制。非線性模型模擬了人類所具有的智能特性, 揭示了因素與結(jié)果之間的復(fù)雜關(guān)系, 使得評(píng)價(jià)結(jié)果更加客觀、 合理。同時(shí)評(píng)價(jià)結(jié)果對(duì)個(gè)別因素的局部微小變化(包括不恰當(dāng)?shù)牧炕u(píng)定)和噪聲數(shù)據(jù)具有一定的抵抗能力, 保證評(píng)價(jià)系統(tǒng)具有良好的穩(wěn)定性。
2) 實(shí)現(xiàn)了關(guān)鍵因素集與評(píng)價(jià)結(jié)果之間關(guān)聯(lián)強(qiáng)度分布的動(dòng)態(tài)調(diào)節(jié)。根據(jù)每學(xué)期發(fā)生的學(xué)生對(duì)教師的評(píng)價(jià)數(shù)據(jù)、 教師同行之間的評(píng)價(jià)數(shù)據(jù), 通過機(jī)器學(xué)習(xí)方法確定當(dāng)前階段各評(píng)價(jià)因素對(duì)評(píng)價(jià)結(jié)果的作用參數(shù), 使因素與結(jié)果之間的動(dòng)態(tài)聯(lián)系能夠反映不同時(shí)期的評(píng)價(jià)取向。同時(shí), 動(dòng)態(tài)特性能有效地克服人為主觀因素局限性, 實(shí)現(xiàn)評(píng)價(jià)體系良好的自適應(yīng)能力。
今后的研究工作尚需解決理論與實(shí)踐方面存在的問題。主要包括:
1) 決定教學(xué)質(zhì)量因素的完備性問題, 需要在教育理論框架內(nèi)尋求合理有效的解答;
2) 利用智能信息處理領(lǐng)域的新理論和新方法, 對(duì)我國高等教育發(fā)展與改革的宏觀范圍內(nèi)產(chǎn)生的大數(shù)據(jù)進(jìn)行有效的挖掘和處理, 使教學(xué)質(zhì)量的智能化評(píng)價(jià)趨于完善。