孫 毅, 劉仁云, 王 松, 冷曉冰, 臧雪柏
(1. 吉林大學(xué) a. 數(shù)學(xué)學(xué)院; b. 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 長(zhǎng)春 130012; 2. 長(zhǎng)春師范學(xué)院 數(shù)學(xué)學(xué)院, 長(zhǎng)春 130032;3. 中國(guó)石油吉林石化公司 信息管理部, 吉林 吉林 132000)
考試是評(píng)價(jià)學(xué)生學(xué)習(xí)情況的一種考核方式, 教師可通過(guò)對(duì)考試成績(jī)的分析準(zhǔn)確了解學(xué)生對(duì)知識(shí)的掌握程度, 并有針對(duì)性地調(diào)整教學(xué)方法及教學(xué)模式[1]。正確、 客觀的評(píng)價(jià)考試成績(jī)是每個(gè)教師都需要面對(duì)的問題。
合理有效的成績(jī)?cè)u(píng)價(jià)一方面可幫助任課教師反思課堂教學(xué)中的不足; 另一方面也能幫助出題教師正確估計(jì)學(xué)生的學(xué)習(xí)狀態(tài), 盡最大可能避免負(fù)面影響產(chǎn)生, 在一定程度上將會(huì)對(duì)后續(xù)課程如何教學(xué)提供重要參考[2,3]。筆者提出的考試成績(jī)?cè)u(píng)價(jià)與預(yù)測(cè)方法就是基于這兩個(gè)方面的考慮。
筆者通過(guò)一個(gè)實(shí)例闡述考試成績(jī)?cè)u(píng)價(jià)與預(yù)測(cè)的回歸分析法。
收集某校非英語(yǔ)專業(yè)50名學(xué)生1~3學(xué)期英語(yǔ)期末考試成績(jī), 根據(jù)所給數(shù)據(jù)建立合理的考試成績(jī)模型, 并預(yù)測(cè)這50名學(xué)生的英語(yǔ)四級(jí)考試成績(jī)。
1)y: 英語(yǔ)四級(jí)考試成績(jī);
2)x1: 第1學(xué)期英語(yǔ)期末考試成績(jī);
3)x2: 第2學(xué)期英語(yǔ)期末考試成績(jī);
4)x3: 第3學(xué)期英語(yǔ)期末考試成績(jī);
5)β0,β1,β2,β3為未知參數(shù), 其中β0為回歸常數(shù),β1,β2,β3為回歸系數(shù);
6)ε為隨機(jī)誤差。
依據(jù)題意建立多元線性回歸模型[4,5]
y=β0+β1x1+β2x2+β3x3+ε
(1)
對(duì)于隨機(jī)誤差ε, 假設(shè)
E(ε)=0, Var(ε)=σ2
(2)
則理論回歸方程為
E(y)=β0+β1x1+β2x2+β3x3
(3)
對(duì)50名學(xué)生的成績(jī)獲得50組數(shù)據(jù)(xi1,xi2,xi3;yi),i=1,2, …,50, 則模型可表示為
(4)
令
則模型可化為矩陣模式
y=Xβ+ε
(5)
模型滿足下列條件。
1) 自變量x1,x2,…,x50是確定性變量, 且rank(X)=3+1<50, 即X為一個(gè)列滿秩矩陣。
2) 滿足高斯馬爾科夫條件(G-M條件), 即
(6)
3) 正態(tài)分布的假設(shè)條件為
條件1)說(shuō)明其為自變量確定性的回歸問題。條件2)說(shuō)明隨機(jī)誤差的平均值為零, 且沒有系統(tǒng)誤差。隨機(jī)誤差項(xiàng)εi的協(xié)方差為零, 表明隨機(jī)誤差項(xiàng)在不同的樣本點(diǎn)之間是不相關(guān)的, 即不存在序列相關(guān)。條件3)說(shuō)明誤差項(xiàng)是正態(tài)分布, 在實(shí)踐中是合理的。
在滿足條件1)和條件2)的前提下, 多元回歸模型的矩陣式(5)可寫成
(7)
若同時(shí)滿足條件1)~3), 多元回歸模型矩陣式(5)可簡(jiǎn)化為
(8)
考慮模型式(8)的檢驗(yàn), 假設(shè)
H0:Hβ=c
(9)
其中
rank(X)=p+1, rank(H)=q≤p+1
(10)
若對(duì)回歸方程進(jìn)行顯著性檢驗(yàn), 可假設(shè)
H0:β1=β2=β3=0
(11)
如果H0被接受, 則表明用模型式(1)表示y與自變量x1,x2,x3的關(guān)系不合適。為建立對(duì)H0進(jìn)行檢驗(yàn)的統(tǒng)計(jì)量, 可在式(9)中取適合的H和c, 即可構(gòu)造出式(11), 以檢驗(yàn)統(tǒng)計(jì)量[6]。顯然, 取H=(0,IP),c=0即可。
為建立對(duì)H0進(jìn)行檢驗(yàn)的統(tǒng)計(jì)量, 將總偏差平方和進(jìn)行分解得
(12)
(13)
先對(duì)H0進(jìn)行統(tǒng)計(jì)量檢驗(yàn), 計(jì)算F統(tǒng)計(jì)量, 再由給定的的顯著水平a,查F分布表, 得到臨界值Fa(p,n-p-1)。如果F>Fa(p,n-p-1), 則認(rèn)定在顯著水平a下,y與自變量x1,x2,x3有顯著的線性關(guān)系, 即回歸方程是顯著的; 反之, 則認(rèn)為方程不顯著。該檢驗(yàn)過(guò)程的方差分析公式表如表1所示。
表1 方差分析公式表
經(jīng)計(jì)算求得上述表格中的各項(xiàng)結(jié)果如表2所示。
表2 方差分析數(shù)值表
顯然回歸方程是顯著的。
對(duì)于多元線性回歸模型, 總體回歸方程線性關(guān)系的顯著性, 并不意味著每個(gè)自變量x1,x2,x3對(duì)因變量y的影響都是顯著的[7,8]。因此, 有必要對(duì)每個(gè)自變量進(jìn)行顯著性檢驗(yàn), 這樣可把對(duì)y影響不顯著的自變量從模型中剔除, 而只保留對(duì)y影響顯著的自變量, 以建立更為簡(jiǎn)單合理的多元線性回歸模型。
如果某個(gè)自變量xj對(duì)y的作用不顯著, 則在回歸模型中其系數(shù)βj可取值為零。因此, 檢驗(yàn)變量xj是否顯著, 等價(jià)于檢驗(yàn)假設(shè)H0j:βj=0。若接受假設(shè)H0j,則xj不顯著; 反之,xj顯著。
且
圖1 英語(yǔ)四級(jí)考試成績(jī)對(duì)比圖
根據(jù)已知的50名學(xué)生3個(gè)學(xué)期的期末考試成績(jī), 將數(shù)據(jù)進(jìn)行初步處理, 應(yīng)用已建立的模型y=85+1.829x1+0.054x2+4.205x3+ε預(yù)測(cè)該50名學(xué)生在國(guó)家英語(yǔ)四級(jí)考試中應(yīng)得的成績(jī)。首先對(duì)成績(jī)進(jìn)行分析說(shuō)明; 其次說(shuō)明成績(jī)的合理可靠性; 最后再將預(yù)測(cè)的50名學(xué)生在國(guó)家英語(yǔ)四級(jí)考試中應(yīng)得的成績(jī)與其實(shí)際成績(jī)相對(duì)比, 其結(jié)果如圖1所示[9]。
由圖1可以看出, 兩條折線比較吻合。在個(gè)別學(xué)生的預(yù)測(cè)中出現(xiàn)不在預(yù)測(cè)模型中的情況, 造成這種情況有多種原因, 但基本上均為客觀原因或極特殊的主觀原因?qū)е聦W(xué)生考試成績(jī)出現(xiàn)了偏差。觀察折線圖, 通過(guò)對(duì)比可檢驗(yàn)?zāi)P偷挠行? 所預(yù)測(cè)的成績(jī)基本合理可靠。
應(yīng)用回歸分析模型不僅能評(píng)價(jià)考試成績(jī), 還能對(duì)成績(jī)進(jìn)行合理的預(yù)測(cè), 通過(guò)綜上實(shí)例, 應(yīng)用回歸分析模型進(jìn)行考試成績(jī)?cè)u(píng)價(jià)有以下幾個(gè)優(yōu)點(diǎn):
1) 應(yīng)用回歸分析評(píng)價(jià)考試成績(jī)可得到各種因素對(duì)考試成績(jī)影響的大小, 主要體現(xiàn)在自變量的系數(shù)上;
2) 通過(guò)對(duì)模型的顯著性檢驗(yàn)(F-檢驗(yàn))可初步判斷模型的合理性, 通過(guò)模型的回歸系數(shù)顯著性檢驗(yàn)(t-檢驗(yàn))可找到對(duì)因變量影響相對(duì)較弱的自變量, 將其剔除, 從而簡(jiǎn)化模型, 使模型的應(yīng)用更簡(jiǎn)單方便;
3) 應(yīng)用回歸分析法評(píng)價(jià)考試成績(jī), 不僅能對(duì)已知的成績(jī)進(jìn)行分析評(píng)價(jià), 同時(shí)能通過(guò)數(shù)據(jù)對(duì)未知的成績(jī)進(jìn)行合理預(yù)測(cè), 并且預(yù)測(cè)結(jié)果合理可靠。
但筆者所應(yīng)用的考試成績(jī)?cè)u(píng)價(jià)模型未考慮到現(xiàn)實(shí)中影響考試成績(jī)的全部因素, 導(dǎo)致了極個(gè)別學(xué)生的預(yù)測(cè)成績(jī)與實(shí)際成績(jī)之間有一定差距, 在今后的實(shí)際預(yù)測(cè)中應(yīng)多考慮造成影響的因素, 以使誤差減小, 當(dāng)然, 模型也會(huì)變得相對(duì)復(fù)雜。
參考文獻(xiàn):
[1] 胡曉華. 學(xué)生心理輔導(dǎo)案例新選 [M]. 杭州: 浙江教育出版社, 2010.
HU Xiao-hua. Case Newly Selected Student Counseling [M]. Hangzhou: Zhejiang Education Press, 2010.
[2]王晉. 大學(xué)生心理健康 [M]. 北京: 北京大學(xué)出版社, 2008.
WANG Jin. University Student’s Mental Healthy [M]. Beijing: Peking University Press, 2008.
[3]呂叢笑. 由文獻(xiàn)量變規(guī)律看我國(guó)數(shù)學(xué)研究的發(fā)展動(dòng)向 [J]. 寧波師院學(xué)報(bào), 1996, 14(3): 84-88.
Lü Cong-xiao. The Developments of Mathematical Based on Quantitative Rules of the Literature [J]. Journal of Ningbo Teachers School, 1996, 14(3): 84-88.
[4]施雨, 李耀武. 概率論與數(shù)理統(tǒng)計(jì)應(yīng)用 [M].西安: 西安交通大學(xué)出版社, 2005.
SHI Yu, LI Yao-wu. Probability Theory and Mathematical Statistics Application [M]. Xi’an: Xi’an Jiaotong University Press, 2005.
[5]李忠范, 孫毅, 高文森. 大學(xué)數(shù)學(xué)-隨機(jī)數(shù)學(xué) [M]. 北京: 高等教育出版社, 2009.
LI Zhong-fan, SUN Yi, GAO Wen-sen. Mathematics-Random Mathematics [M]. Beijing: Higher Education Press, 2009.
[6]馮力. 回歸分析方法原理及SPSS實(shí)際操作 [M]. 北京: 中國(guó)金融出版社, 2004.
FENG Li. Regression Analysis Theory and SPSS Application [M]. Beijing: China Financial Publishing House, 2004.
[7]RAYMOND H MYERS. Classical and Modern Regression with Applications [M]. 2nd ed. Beijing: Highter Education Press, 2008.
[8]DOUGLAS M BATES, DONALD GWATTS. 非線性回歸分析及其應(yīng)用 [M]. 北京: 中國(guó)統(tǒng)計(jì)出版社, 1997.
DOUGLAS M BATES, DONALD G WATTS. Nonlinear Regression Analysis and Applications [M]. Beijing: China Statistics Press, 1997.
[9]安維默. 用Excel管理和分析數(shù)據(jù) [M]. 北京: 人民郵電出版社, 2003.
AN Wei-mo. Manage and Analyze Data Using Excel [M]. Beijing: People’s Posts& Telecom Press, 2003.