王微
摘 要:考試對(duì)于學(xué)生來(lái)說(shuō)可謂再尋常不過(guò),小至隨堂測(cè)試,月考大至中考高考. 一名學(xué)生無(wú)論在哪個(gè)階段學(xué)習(xí)過(guò)程中,都會(huì)經(jīng)歷許許多多次測(cè)試,每一次測(cè)試都會(huì)有成績(jī)記錄,如若將這些數(shù)據(jù)搜集起來(lái)數(shù)量是驚人的.
關(guān)鍵詞:多元線性;分析;學(xué)生成績(jī)
學(xué)生接受教育是連續(xù)的,所以評(píng)價(jià)一名學(xué)生不能只依靠某次考試成績(jī),要縱向地連續(xù)觀察學(xué)生在各階段情況做綜合評(píng)價(jià)。中考成績(jī)是衡量學(xué)生進(jìn)入高中之前學(xué)習(xí)情況的一項(xiàng)重要指標(biāo),所以選擇這兩個(gè)變量作為二模成績(jī)的解釋變量是含有一定的合理性。
圖3是學(xué)校類(lèi)別x2,學(xué)生性別x3以及班級(jí)類(lèi)別x4的直方圖,圖4表示的是二模成績(jī)y關(guān)于中考成績(jī)x1和一模成績(jī)x3的散點(diǎn)圖。通過(guò)觀察可以對(duì)新添加解釋變量的情況有初步了解。
R軟件對(duì)樣本數(shù)據(jù)做多元回歸得表4.可以得到多元線性回歸模型雖然已經(jīng)得到回歸方程,但還要對(duì)模型的合理性進(jìn)行檢驗(yàn)。由上文多元回歸模型的理論可知,首先要對(duì)回歸方程做顯著性檢驗(yàn),分析數(shù)據(jù)發(fā)現(xiàn)該檢驗(yàn)得到p值很小,與此同時(shí)相關(guān)系數(shù)R2為0.9298,說(shuō)明建立的多元回歸模型比較合理,解釋變量能很好解釋因變量。
接下來(lái)還要對(duì)模型的解釋變量逐個(gè)進(jìn)行t檢驗(yàn),表4中顯示中考成績(jī)、一模成績(jī)的p值很小,說(shuō)明二者對(duì)二模成績(jī)影響很顯著。
學(xué)生性別這個(gè)變量對(duì)二模成績(jī)影響的p值為0.0271也很顯著。人們通知認(rèn)為高中男生的學(xué)習(xí)能力要強(qiáng)于女生,但分析結(jié)果表明這種說(shuō)法不是很正確。學(xué)生性別變量的回歸系數(shù)估計(jì)值為3.1393,表明女生成績(jī)普遍較好。高中階段的學(xué)習(xí),不僅要求接受新知識(shí)能力強(qiáng),而且要求有豐富的知識(shí)積累量??赡苁桥鷮W(xué)習(xí)態(tài)度較好,對(duì)知識(shí)掌握情況較好。
學(xué)校類(lèi)別變量對(duì)因變量影響不是很顯著,也就是說(shuō)學(xué)校水平對(duì)學(xué)生成績(jī)影響不大。樣本的五所學(xué)??梢苑譃閮蓚€(gè)水平:重點(diǎn)高中和普通高中。學(xué)校水平不同對(duì)學(xué)生二模影響的功能貢獻(xiàn)率不是很大,這個(gè)結(jié)果與只有去好學(xué)校才有優(yōu)異成績(jī)的想法不符。
二模成績(jī)與一模成績(jī)的散點(diǎn)圖說(shuō)明一模成績(jī)可以很好的預(yù)測(cè)二模成績(jī)。圖中有很清晰的兩條直線,可能是由于學(xué)校所處水平不同引起的,重點(diǎn)高中學(xué)生成績(jī)整體上要比普通高中要好。圖5是多元回歸方程的殘差圖,圖中點(diǎn)散亂分布在y軸的兩側(cè),說(shuō)明所選擇的中考成績(jī),學(xué)生性別等5個(gè)解釋變量可以很好的解釋二模成績(jī),也就是說(shuō)建立的模型有一定的合理性上述多元回歸模型殘差平方和,對(duì)上文五個(gè)解釋變量做顯著分析時(shí)知,學(xué)生個(gè)人對(duì)二模成績(jī)影響很大,學(xué)生類(lèi)別與班額對(duì)學(xué)生成績(jī)影響不是很顯著。殘差平方和的意義在于除了學(xué)生個(gè)人之外其他所有因素對(duì)因變量的影響,其中也包括學(xué)校的教學(xué)質(zhì)量。因此,我們就可以利用各自學(xué)校的殘差平方和去比較學(xué)校之間教學(xué)質(zhì)量差異。利用上式可以得到每所學(xué)校的學(xué)校對(duì)學(xué)生的影響程度表示為
利用樣本數(shù)據(jù)計(jì)算得到的結(jié)果見(jiàn)表6.
從表6可以看出,C、D兩所學(xué)校殘差平方和比較大,表明與其他幾所學(xué)校有明顯差異。從實(shí)際意義上看,說(shuō)明這兩所學(xué)校在師資力量、辦學(xué)條件、生源質(zhì)量等方面與其他三所學(xué)校有很大不同。
模型拓展
本文之前的分析都是在樣本數(shù)據(jù)的基礎(chǔ)上,利用數(shù)據(jù)中包含比較直觀的信息(學(xué)生成績(jī)、性別等),從學(xué)生角度分析影響學(xué)生的二模成績(jī)因素。在樣本中沒(méi)有任何關(guān)于學(xué)校辦學(xué)條件,師資力量等代表學(xué)校教學(xué)質(zhì)量相關(guān)信息情況下,是否可以利用簡(jiǎn)單線性回歸模型挖掘出潛藏在樣本中的信息,進(jìn)而估測(cè)學(xué)校的教學(xué)質(zhì)量的差異為學(xué)校排名。
其中表示來(lái)自第i所學(xué)校的第j學(xué)生的第二次模擬考試成績(jī)。
表示來(lái)自第i所學(xué)校的第j 學(xué)生的中考成績(jī)。由最小二乘法估計(jì)方法,我們有將樣本數(shù)據(jù)代入上式推導(dǎo)出的公式中,計(jì)算結(jié)果如表7所示。
數(shù)據(jù)分析之前,已經(jīng)大致了解學(xué)校的基本情況。其中學(xué)校編號(hào)為CDE的三所學(xué)校為省級(jí)示范高中,編號(hào)為AB的兩所學(xué)校為普通高中,實(shí)際學(xué)校排名情況與上表現(xiàn)是排名大體一致。
本文建立的多元回歸模型對(duì)三組學(xué)生成績(jī)分別從學(xué)生以及學(xué)校角度進(jìn)行分析,并結(jié)合統(tǒng)計(jì)學(xué)知識(shí)、R軟件對(duì)數(shù)據(jù)分析處理的結(jié)果進(jìn)行了有效的分析與合理解釋。
當(dāng)統(tǒng)計(jì)學(xué)與數(shù)據(jù)相遇總會(huì)有這樣那樣的火花,不一樣的風(fēng)景。樣本只包含幾次考試成績(jī)和關(guān)于學(xué)生自身的一些信息,沒(méi)有直接關(guān)聯(lián)教學(xué)質(zhì)量的信息。但是簡(jiǎn)單的分析就可以挖掘到許多隱藏在數(shù)據(jù)背后的信息,這就是統(tǒng)計(jì)學(xué)的魅力所在。通過(guò)上述分析再一次驗(yàn)證了數(shù)據(jù)力量是巨大的,合理、高效地利用為教學(xué)服務(wù),將具有重大的意義。
參考文獻(xiàn):
[1] 朱姝帆. 湖北省農(nóng)村居民家庭人均收入影響因素分析——多元線性回歸分析[J]. 科技創(chuàng)業(yè)月刊. 2009(01).