劉麗峰,黃海明
(1.山東理工大學,淄博255049;2.32148 部隊61 分隊)
學生的考試成績對在一定程度上能夠反映學生學習狀況,通過分析考試成績的特征,對進一步提高學生的學習效率,分析學生學習的規(guī)律,從而能提高培養(yǎng)學生的質量意義重大。學生的入學時的基礎知識水平存在客觀的差異,采用固定的標準衡量學生的學習狀況難以反映學生學習的真實情況,因此建立能夠反映學生入學成績差異的考試成績模型對客觀學習狀態(tài)有重要意義,對教師掌握學生學習的情況,如何找出影響學生學習成績的相關因素,為提高教學工作的效率提供一些理論和事實依據。
目前國內外學者對考試成績分析方法、分布特征及其影響因素已經進行了深入的研究:孫高強利用數據分析技術分析評教成績,再將分析的結果和結論通過數據可視化的方式進行展示[1];陳瀟瀟使用數據挖掘知識對學生的成績進行數據分析預測,應用Apriori 關聯規(guī)則算法挖掘出影響學生成績的潛在的規(guī)律[2];楊王黎等人研究了學生考試成績的統(tǒng)計規(guī)律,采用χ2檢驗法實現了成績的正態(tài)性檢驗,建立了根據學生成績評價試卷質量的模型[3];劉麗峰提出一種以Zernike 矩模式識別為基礎的工程測量課程分類方法,建立工程測量成績評定的數學模型[4]。梁利亭對如何在高職院校的成績分析當中使用決策樹算法進行了分析[5]。王進和陳曉思采用學校固定效應模型,分析不同的班級環(huán)境對學生學習成績造成的影響及其性別差異,研究結果顯示在較差的學校中,女生比男生較不易在同伴群體中形成反學校的認知、態(tài)度和行為,因而容易造成學習成績上的性別差異[6]。賀超凱和陳云芳通過對現行的學生平均學分績點的計算方法進行分析,指出了存在的問題,并提出改進的計算方法[7]。李金屏等人提出了一個定量的研究學生成績分布的數學模型,該模型可以預測學生考試成績的分布規(guī)律[8]。李翔等人利用三次Hermite 樣條和B-spline 構造了新的考試成績標準分布函數,并對成績分布特征進行了分析[9]。張國才認為成績分布模型與學生人數、學生群體和教師的能動性、學生的素質和基礎以及成績評定的標準四方面因素密切相關。師生的教學活動可改變成績分布模型,負偏態(tài)分布具有合理性[10]。鑒于以上文獻的研究發(fā)現,考慮學生的基礎知識水平的研究較少,本文則以入
學考試成績?yōu)榛A綜合考慮影響學生考試成績的主、客觀因素,對成績進行分析并建立其分布模型。
(1)考試成績的影響因素
根據影響學生學習的主要因素:自主學習、就業(yè)形勢影響、游戲娛樂和基礎知識水平,選擇三個指標構造加權平均分函數,其中自主學習通過考試成績體現,由于考試難度中等,由于本模型中假設各指標相互獨立,因此在不考慮基礎知識水平差異的情況下,自主學習的時間與考試成績(y)成正比。就業(yè)形勢好壞直接反映在招生的人數上,因此由班級總人數(NT)代表這一指標。針對游戲、娛樂方面的因素,這里僅考慮影響學習成績的游戲、娛樂,由受不及格人數影響的平均成績反映這一指標,該指標僅在模型結果分析時應用?;A知識水平對學生學習難易程度影響較大,由于學生學號(N)跟入學成績呈反比,即學號末尾數值越小,高考成績越高,理論基礎越扎實。
分析模型評定等級標準:根據成績分布一般服從正態(tài)分布的特點,將成績分為三個等級:大于1 倍標準差之外(或對應學號加權平均分)的成績?yōu)閮?yōu)異(Y1),小于60 分(或對應學號加權平均分)的為不及格(Y2),余者為良(Y3)。
定義1 加權平均分模型(ACG,y=ln(TN+2-N*Si)*Ai):以學號、學生總數為自變量的自然對數函數,在10 為底的對數坐標軸的雷達圖表示,成績圖形近似為圓形,該圓上對應學號的點表示良好或中等學生,圓外部及外切的點成績?yōu)閮?yōu)異,點在外部距離圓越遠成績越優(yōu)異;反之,內部或內切的點為不及格,點在內部距離圓越遠成績越差,且要求該函數為班級學生成績最優(yōu)或近似最優(yōu)擬合函數。
(2)影響因素定權(Si,Ai)
為評定各影響因素在考試成績中的貢獻率,本文采用了兩種方法進行確定:區(qū)間法加權平均分模型(IACG)圖為圓環(huán)通過值域區(qū)間確定[Vmin,Vmax](Rmin=Vmin,Rmin=Vmax),使不及格數據位于圓環(huán)的內部(Y2<Vmin),成績優(yōu)異數據位于圓環(huán)的外部(Y1<Vmax),其余數據則位于包含的區(qū)域內(Vmin<Y3<Vmax)內;綜合型加權平均分模型(CACG)通過最優(yōu)非線性擬合的方法確定各個指標的權重,采用最小二乘法計算學號N學生的加權平均函數值與其考試成績的殘差,使殘差平方和最小的參數為最優(yōu)。
圖1“區(qū)間型”加權平均分模型(IACG)和“綜合型”(CACG)加權平均分模型
(3)模型優(yōu)化
區(qū)間法(IACG)采用基于和諧度方程的參數優(yōu)化方法:由步驟(2)確定的指標權重不一定能滿足與全班考試成績的誤差和最小,因此采用和諧方程使其累計和最?。?/p>
上式中,y1N為學號末尾2 位數(以下簡稱為學號)為N個學生分數,GN為學號N學生的考試成績,NT為班級學生總數。為解決圖形大小變化點值相切隨之改變,選擇1 倍標準差作為點值的起算標準線。
(4)模型分析
定義2 點值比(PVR):加權平均分函數曲線上的數據之和與全班人數之比稱為點值比。
利用以上步驟確定的加權平均分函數計算各個學生的加權平均分,并計算點值比,通過例子和理論證明點值比與平均成績一致性,從而驗證模型的有效性。
定理1 點值比(PVR)的百分數與平均分數成正比,在人數增多的情況下趨近于平均成績。
證明:將全班成績集合TG及其3 個子集(優(yōu)異G、中等M和不及格F)所對應的人數分別設為Ntg,Ng,Nm,Nf,考試成績用Gi表示,符合正態(tài)分布,可得:
那么PVR 可以表示為:
上式中,a1、a2、a3,分別表示成績優(yōu)異、良好和不及格學生的平均成績,根據正態(tài)函數的概率統(tǒng)計分布特征,在班級考試成績已知時為Ntg、Ng、Nm、Nf常數。點值比與平均分之差在人數無限多的情況下是相等的,人數有限的情況下,點值比逼近平均分,即PVR與平均分(Gˉ)之差(Dap)趨近于零,證明如下:
當班級人數Ntg無限多時Dap趨近于0;反之,根據正態(tài)分布的性質,落入兩側(1 倍標準差、2 倍標準差、3倍標準差之外)的區(qū)域概率為小概率事件(分別為31.74%、4.56%、0.26%),根據10 個班的統(tǒng)計結果,以1倍標準差為例,由正態(tài)分布的對稱性,選擇不及格、優(yōu)秀的比例都為0.1587,優(yōu)良和中等的比例為0.6826,據此可以構造隸屬度函數。
各因素的權重:
將(9)和(10)式代入公式(8)可得:
上式可以看作3 個直線函數的合成(圖2):
圖2 成績函數解析
由圖3 可以看出y1和y3屬于同一函數,區(qū)別僅在于不同的值域,因此可以用一個函數y4=0.1587*x,x∈(0,60)∪(80,100)表示,因此,y=y2+y4,而y2、y4之和在其值域范圍內逐漸靠近,在(130.29,20.68)點函數y(即Dap)為0。由此命題得證。
定理2 加權平均函數(y1N)與擬合加權平均函數(y2N)相逼近或成比例關系,即y1N/y2N=1。證明如下:
由于擬合加權平均函數(y2)趨近于考試成績,因此y2趨近于平均成績,因此只要證明加權平均函數(y1)趨近于平均成績即可。
由于在一個班級內考試成績相差不大的情況下,加權平均函數趨近于圓,a1表示加權平均函數相對于圓的變化情況,因此a1趨近于零,當班級人數TN 一定時,N/T<1 為小于1 的固定值,因此N/T*a1趨近于零,ln(1+N/T*a1)也趨近于零;由于針對某一班級最優(yōu)加權平均分模型具有唯一性,因此為a2具有唯一性和不變性,y1趨近于固定值lnT*a2,因此有:
采用區(qū)間法加權平均函數模型和綜合法加權平均模型的計算步驟見圖3。
圖3 IACG(a)和CACG(b)建模
下面采用某職業(yè)大學的工程測量成績分析區(qū)間法和綜合法加權平均函數的應用。
本例子采用某職業(yè)大學2011-2015 屆10 個班工程測量考試成績(不含平時成績和實驗成績),每個班的人數招生規(guī)模為40 人,女生比例為2.6%~26.4%,在班級總人數下降的情況下,呈現逐年上升的趨勢。
(1)考試成績原始數據的特征分析
由于學生考試成績的隨機性,根據學號順序難以找到理想的擬合模型,因此對10 個班級的學生成績按升序排列,并對排列后的成績進行擬合,擬合結果見表1,相關系數(R2)>0.754,屬于強相關,因此加權平均分函數選擇自然對數函數y=a*ln(x)+b進行擬合,其中a表示班內成績變化的速率,變化的速率越大說明班級成績差異越大,在不考慮邊遠地區(qū)招生影響的情況下,學生之間高分和低分分異明顯,說明部分學生由于內外部因素的影響,部分學生成績出現大幅度下降,b 表示班級內的最低分,比較10 個班的擬合公式發(fā)現:b 值有逐年下降的趨勢,也說明考試成績的差距逐年增大。
表1 某職業(yè)大學10 個班級工程測量擬合函數比較
(2)加權評分函數模型計算結果
分別采用區(qū)間法加權評分函數模型(IACG)和綜合法加權評分函數模型(CACG)對10 個班的考試成績進行建模,并計算了各個班級分平均考試成績和點值比(表2),兩者的點值比之差最大值為14.29%,最小值為0,平均值為3.72%,由此可見兩者的差異不大,也說明了IACG 是反映學生成績基礎差異的近似最優(yōu)解。為比較兩者方法的點值比(PVR)與平均成績、和標準差的變化關系,計算了10 個班級的均值和標準差(圖4)。
圖4 點值比與均值、標準差對比
表2 工程測量考試成績加權分析函數統(tǒng)計表
表3 某職業(yè)大學考試成績加權平均分擬合結果
均值與由區(qū)間法、綜合法加權成績加權模型函數計算的IACGPVR、CACGPVR 在變化趨勢上都有很好的一致性,說明該模型在1 倍標準差范圍內(68.28%)的擬合值能夠在均值上下一定范圍內波動,證明了該模型的收斂性和正確性;在數值上IACGPVR 更加接近平均值,CACGPVR 變化幅度較小,這是由于綜合法加權成績分析模型要求模型在整體式達到殘差最小的原因,因此數值上更趨于10 個班級平均值的均值,而標準差卻與平均值(IACGPVR、CACGPVR)有相反的變化趨勢,這說明考試成績優(yōu)秀的學生越分散,部分入學前成績較好的學生進入大學后由于某些外界因素或主觀對專業(yè)愛好程度的影響,致使學習興趣下降,成績出現了大幅度下滑,反之,某些學生通過個人努力成績有了很大程度提高。
面對著嚴峻的就業(yè)形勢職業(yè)大學測繪工程專業(yè)的人數趨于飽和,也出現了縮招的現象,例如某職業(yè)大學的由原來的每屆4 個班(每個班40 人以上),下降到兩個班(每個班30 人左右),對5 年內10 個采礦工程卓越班的招生人數進行擬合,公式如下:
上式的相關性(R2=0.7202)達顯著水平,這是學校招生方面對就業(yè)形勢的應對策略。學生對就業(yè)前景的擔憂,表現出專業(yè)課不努力學習,如轉修第二專業(yè)、參加其他社會就業(yè)考試等,減少了用于專業(yè)課的時間,平均考試成績也呈現一定程度的下滑趨勢。
(3)結果分析
由表2 可以看出區(qū)間法和綜合法加權平均函數計算得到的點值比除(1102 班較大,14.3%),這是由于1102 班考試沒有出現不及格的現象,跟正態(tài)分布差異較大的原因。面積指數Ai表示在極坐標下加權成績分析函數包含的面積,由于兩者都近似于同一考試成績,因此相差不大(1.9%~8.9%)。形狀指數Si越趨近于0,加權成績分析函數就越趨近于平均分,其形狀就越趨近與半徑為分析分的圓形;區(qū)間法中的形狀指數逐漸減小,及綜合法的SI 大于0,說明了:①部分入學成績好的學生由于受到主客觀原因(如對學習失去興趣、就業(yè)形勢影響、網絡、手機等游戲影響)導致成績明顯下降,反之入學成績較低的學生通過認真學習,成績則不斷提高,從而減小了學號之間的差距,使得區(qū)間法表現出形狀指數下降,綜合法則表現出不降反增的趨勢;②除1101 班外都有1~3 名邊遠地區(qū)的特招生,入學成績較普招生低100~200 分,但由于人數較少,對形狀指數的影響不明顯(相關指數僅為-0.0103),但他們由于入學基礎較差及格率極低(7.14%);③部分女生作為調劑生,學號排在班級的末尾,平時上課認真聽講,因此考試成績偏高,隨著女生的比例逐漸增加(由2.6%增致26.4%),對形狀指數影響顯著(0.7817)。
從網絡上下載的某職中一年級32 名學生語文、數學、英語、政治、歷史、物理、生物和地理8 門的中考考試,其中成績分布的雷達圖見圖5。由圖5 可以看出該班的各科成績也與學號之間存在很強的相關性,隨著學號的增加成績下降明顯。
圖5 某初中(1)8門課程成績分布雷達圖
在表4 班級考試平均分與點值比的誤差英語課程最?。?0.55%),地理課程誤差最大(8.50%),平均誤差0.86%,平均成績的誤差率為8.50%,總成績轉換為百分制的誤差率為3.70%。由此也說明了入學基礎理論成績的影響對學生來說在各門課程都很顯著,而且形狀系數SI 變化不大,標準差僅為0.0542,也說明了入學成績對各門課程的平均影響程都相同,但形狀因子的平均值0.7395 明顯大于大學,這也是職中和職業(yè)大學課程特點的不同,從小學到初中學習的各門課程都有很緊密的聯系,差生不容易有大幅度的提高,且入學成績好的學生不受外界因素(手機、網絡等)因素的影響,成績依然保持很好;另外職業(yè)大學則由于學習了專業(yè)課,與職高學習的內容有較大差異,相對來說受到入學成績影響較小。
表4 某職中(1)考試成績加權平均分擬合結果
形狀指數為負數也說明考試成績跟入學基礎知識有重要的關系,已經能夠體現區(qū)間法加權指數分析模型的要求,即形狀指數(Si)<0,學生學號N>0,那么N*Si<0,且N*Si隨著學號N 的增加遞減,那么(NT+2+N*Si)就表示出學號增加權重減少,即入學基礎與學號呈反比的關系,因此本實例不需要再采用區(qū)間法進行分析。
該班級學生各科考試成績的最優(yōu)擬合模型為:班級各科成績的全集合擬合函數y=ln(TN+2-N*0.02)*23.41 的擬合結果最好,形狀指數Si小于零也說明了初中班級學生的學號對成績有重要的影響。由于沒有相關的數據資料,因此采用各科的平均分對模型進行驗證:平均值與點值比的誤差為-9.4531%。
為了對比對數模型在職中、職高、職業(yè)大學二年級學習的適用情況,選擇某職高(1)的期末各科考試成績進行比較結果見表5,由IACG 擬合的模型有71.43%的課程Si小于零,稍微低于初中的100%,但大于職業(yè)大學的40%,說明學生的入學基礎知識對高中成績影響仍比較大,只有語文、英語兩門語言類課程考試成績與學號無關,也表明了這兩門課程成績差的學生通過努力學習可以短期內有較大提高;適合于該班級各科的最優(yōu)擬合模型為y=ln(TN+2+N*0.03)*17.31。
表5 職高中(1)理科考試成績加權平均分擬合結果
用該校職高(1)大致相同程度的文科班相同科目(語文、數學和英語)的考試成績進行驗證,結果見表6。
由表6 可以看到語文成績的誤差最?。?.83),英語成績誤差為13.68%,由于文科生數學較理科弱,因此誤差最大33.93%,這也反映了文理科的差異。
表6 某高中(1)文科考試成績加權平均分擬合結果
針對考試成績的分布模式,本文定義了點值比的概念,并證明了點值比(PVR)與平均分數成正比,在人數增多的情況下點值比(PVR)的百分數趨近于平均成績;同時建立了“區(qū)間型”加權平均分模型(IACG)和“綜合型”(CACG)加權平均分模型,并對大學的多門專業(yè)課程考試成績、職高和職中的考試成績計算出的考試成績與實際考試成績進行比較,并通過兩者的差異分析影響學生成績的關鍵因素。與傳統(tǒng)的考試成績統(tǒng)計模型相比,IACG 和CACG 模型能反映學生的基礎成績對當前考試的成績的影響,同時也能反映出學生在已有基礎知識水平上學習狀況,為因人制宜地、客觀地評價學生的學習狀況提供了指導。所以,將IACG 和CACG 考試評價模型應用到教學中,具有很好的實用價值,為考試教學改革提供了更切合實際的評價方法。