摘 要:學(xué)生成績(jī)是教學(xué)評(píng)估的一項(xiàng)重要衡量指標(biāo),考慮學(xué)生考試成績(jī)特點(diǎn)提出了一種基于試卷難度系數(shù)變化的GM(1,1)修正模型,并運(yùn)用此模型對(duì)花溪一中考試成績(jī)進(jìn)行預(yù)測(cè),實(shí)踐證明該修正模型能減少誤差,提升預(yù)測(cè)精度。
關(guān)鍵詞:成績(jī)預(yù)測(cè); 發(fā)展灰數(shù);后驗(yàn)差檢驗(yàn); 小誤差概率;難度系數(shù)
中圖分類(lèi)號(hào):O212
文獻(xiàn)標(biāo)識(shí)碼: A
隨著科技數(shù)據(jù)信息的發(fā)展,探索新的教學(xué)方法、前瞻性數(shù)據(jù)化建設(shè)校園是校方義不容辭的責(zé)任。合理運(yùn)用信息技術(shù)能有效地解決教學(xué)中許多問(wèn)題。目前中小學(xué)對(duì)數(shù)據(jù)的應(yīng)用多限于成績(jī)查詢(xún)和一些常規(guī)統(tǒng)計(jì),如平均分、及格率、最高分等。這些描述性統(tǒng)計(jì)分析只是某一次考試當(dāng)前情況的體現(xiàn),無(wú)法挖掘數(shù)據(jù)中存在的關(guān)系和規(guī)則,無(wú)法根據(jù)現(xiàn)有的各項(xiàng)數(shù)據(jù)預(yù)測(cè)學(xué)生成績(jī)以及學(xué)生今后發(fā)展趨勢(shì)。本文通過(guò)與中學(xué)老師的溝通,了解中學(xué)考試成績(jī)展現(xiàn)特性,結(jié)合當(dāng)前考試形式,對(duì)學(xué)生成績(jī)進(jìn)行整理分析,通過(guò)搭建數(shù)學(xué)模型,實(shí)現(xiàn)對(duì)學(xué)生最終中考成績(jī)進(jìn)行預(yù)測(cè)分析,并選取貴州省貴陽(yáng)市花溪區(qū)第一中學(xué)(簡(jiǎn)稱(chēng)花溪一中)考試成績(jī)進(jìn)行分析,驗(yàn)證模型有效性。
1 數(shù)據(jù)預(yù)處理
數(shù)據(jù)來(lái)源于花溪一中2017屆學(xué)生初中各次考試成績(jī)(以下簡(jiǎn)稱(chēng)學(xué)生成績(jī))。考慮中考科目為:數(shù)學(xué)、語(yǔ)文、英語(yǔ)、理綜(物理、化學(xué)),故選取花溪一中2017屆學(xué)生8年級(jí)至9年級(jí)數(shù)學(xué)、語(yǔ)文、英語(yǔ)、物理、化學(xué)成績(jī)進(jìn)行整理,統(tǒng)計(jì)共634名學(xué)生的成績(jī)。為方便數(shù)據(jù)讀取和分析,引入一些符號(hào)標(biāo)記對(duì)原始各次考試進(jìn)行重新標(biāo)記,例如:“數(shù)學(xué)分?jǐn)?shù)81”表示“八年級(jí)上學(xué)期期末考試成績(jī)”,“數(shù)學(xué)分?jǐn)?shù)911”表示“九年級(jí)上學(xué)期第一次月考數(shù)學(xué)成績(jī)”,其他類(lèi)似。表1展現(xiàn)了整理后的數(shù)學(xué)成績(jī)的部分?jǐn)?shù)據(jù)。
1.1 缺失值情況分析
數(shù)據(jù)缺失值分布情況與分析結(jié)果息息相關(guān),圖1是數(shù)學(xué)考試成績(jī)的缺失數(shù)據(jù)情況。圖中,淺色為缺失值,深色為完整數(shù)據(jù),圖(a)體現(xiàn)各次考試的缺失數(shù)據(jù)量,圖(b)展示缺失數(shù)據(jù)在整個(gè)數(shù)據(jù)中的位置。數(shù)學(xué)成績(jī)總數(shù)據(jù)為634×16的數(shù)據(jù)框,其中616名的成績(jī)數(shù)據(jù)完整有效,僅18名同學(xué)的數(shù)學(xué)成績(jī)有缺失。缺失值共21個(gè),占總數(shù)據(jù)量10144的0.21%,缺失率小于10%,指標(biāo)的信息完整度均在理論范圍內(nèi)[1]。
同樣的方法,可得出各科成績(jī)數(shù)據(jù)缺失情況如表2所示,數(shù)據(jù)缺失比率均小于10%,故不會(huì)影響分析結(jié)果。
1.2 缺失值補(bǔ)齊
結(jié)合花溪一中實(shí)際考試成績(jī)情況,對(duì)學(xué)生考試成績(jī)進(jìn)行填補(bǔ),同一考生缺失數(shù)據(jù)較多的予以剔除,最終建立634名考生成績(jī)總表。為便于后期建模分析,選取學(xué)生八年級(jí)上下學(xué)期期末考試成績(jī)、九年級(jí)全部數(shù)據(jù)及花溪區(qū)區(qū)考成績(jī)和貴陽(yáng)市適應(yīng)性考試作為最終分析的數(shù)據(jù),并對(duì)缺失部分予以補(bǔ)齊。常用的缺失值補(bǔ)齊方法有均值補(bǔ)齊法、中位數(shù)補(bǔ)齊法、眾數(shù)補(bǔ)齊法等,結(jié)合學(xué)生成績(jī)實(shí)際情況,采取均值補(bǔ)齊法。
2 灰色預(yù)測(cè)模型概述
2.1 灰色預(yù)測(cè)模型
灰色預(yù)測(cè)對(duì)既含有已知信息又含有不確定信息的系統(tǒng)進(jìn)行預(yù)則,即對(duì)在一定范圍內(nèi)變化的、與時(shí)間有關(guān)的灰色過(guò)程進(jìn)行預(yù)測(cè)?;疑A(yù)測(cè)通過(guò)鑒別系統(tǒng)因素之間發(fā)展趨勢(shì)的相異程度,并對(duì)原始數(shù)據(jù)進(jìn)行生成處理來(lái)尋找系統(tǒng)變動(dòng)的規(guī)律,生成有較強(qiáng)規(guī)律性的數(shù)據(jù)序列,然后建立相應(yīng)的微分方程模型,從而預(yù)測(cè)事物未來(lái)發(fā)展趨勢(shì)的狀況[2]。
在充分使用數(shù)據(jù)的基礎(chǔ)上,建立GM(1,1)模型,分別對(duì)考生各科成績(jī)進(jìn)行預(yù)測(cè)。
2.2 灰色預(yù)測(cè)GM(1,1)模型
3.2 基于GM(1,1) 試卷難度系數(shù)修正模型的實(shí)現(xiàn)
為提高模型預(yù)測(cè)精度,通常會(huì)選取殘差修正模型,但是在計(jì)算殘差時(shí),常常發(fā)現(xiàn)殘差的波動(dòng)較大,根據(jù)原始數(shù)據(jù)的特征會(huì)出現(xiàn)正負(fù)交替現(xiàn)象,即使用殘差模型修正,也不能很好地改善擬合效果。通過(guò)實(shí)踐發(fā)現(xiàn),學(xué)生成績(jī)數(shù)據(jù)與每次考試的試卷難度系數(shù)息息相關(guān),所以在修正模型的過(guò)程中,
得到模型修正預(yù)測(cè)值后重新驗(yàn)證模型精度,進(jìn)行后驗(yàn)差檢驗(yàn),得到新的殘差如表6所示。
類(lèi)似方法對(duì)花溪一中全體同學(xué)所有科目進(jìn)行建模及模型檢驗(yàn),部分同學(xué)數(shù)學(xué)成績(jī)的各項(xiàng)指標(biāo)如表7所示。
經(jīng)計(jì)算,所有數(shù)據(jù)的發(fā)展系數(shù)a均小于1,故均可使用GM(1,1)進(jìn)行建模預(yù)測(cè),通過(guò)殘差符號(hào)結(jié)合難度系數(shù)得到各模型調(diào)整系數(shù)對(duì)模型進(jìn)行修正,最終得到修正后的模型預(yù)測(cè)值,并進(jìn)行新的后驗(yàn)比檢驗(yàn),結(jié)果除極少部分同學(xué)考試成績(jī)波動(dòng)特別大導(dǎo)致模型預(yù)測(cè)效果欠佳,其余均顯示模型預(yù)測(cè)通過(guò)后驗(yàn)比檢驗(yàn)和小誤差概率檢驗(yàn),效果良好。
3.3 花溪一中學(xué)生中考成績(jī)預(yù)測(cè)
綜上可以用修正后的GM(1,1)模型分別對(duì)花溪一中學(xué)生中考單科和總分成績(jī)(預(yù)測(cè)總分加上50分體育成績(jī)所得)進(jìn)行預(yù)測(cè)。首先對(duì)總分進(jìn)行預(yù)測(cè)。據(jù)了解,貴陽(yáng)市今年中考難度系數(shù)在0.75,以該難度系數(shù)為標(biāo)準(zhǔn),對(duì)學(xué)生中考成績(jī)預(yù)測(cè),預(yù)測(cè)結(jié)果如表8所示(僅選取前50名展示)。
由預(yù)測(cè)結(jié)果統(tǒng)計(jì):600以上約為30人。據(jù)最終花溪一中公布的2017年中考考試成績(jī)(由于資源有限,僅獲取了600以上同學(xué)總成績(jī)和1班同學(xué)的各科目成績(jī)),600以上為35人(含加分政策),根據(jù)修正后GM(1,1)模型預(yù)測(cè)出來(lái)的30人均包含在內(nèi)。利用修正后GM(1,1)模型預(yù)測(cè)的花溪一中學(xué)生中考成績(jī)分布如圖2所示。
其次,對(duì)花溪一中學(xué)生中考單科成績(jī)進(jìn)行預(yù)測(cè),表9展示部分同學(xué)各科成績(jī)預(yù)測(cè)結(jié)果。
為驗(yàn)證預(yù)測(cè)結(jié)果的準(zhǔn)確率,利用獲得的1班同學(xué)的總分及單科成績(jī)數(shù)據(jù)對(duì)預(yù)測(cè)結(jié)果進(jìn)行誤差分析,經(jīng)計(jì)算總成績(jī)預(yù)測(cè)的均方誤差為:-4.866;語(yǔ)文、數(shù)學(xué)、英語(yǔ)、物理、化學(xué)的均方誤差分別為:0.197、0.545、0.258、2.924,平均誤差均不超過(guò)5分,說(shuō)明模型預(yù)測(cè)效果良好。
4 結(jié)論
從學(xué)生成績(jī)殘差特性出發(fā),提出一種基于試卷難度系數(shù)變化的GM(1,1)修正模型,這符合“灰色系統(tǒng)理論的研究對(duì)象信息不完全,準(zhǔn)則具有多重性,模型非惟一性”的特點(diǎn)。且經(jīng)實(shí)踐表明,修正后的模型能提升學(xué)生成績(jī)預(yù)測(cè)模型精度。在預(yù)測(cè)學(xué)生成績(jī)時(shí),可以推廣使用。
參考文獻(xiàn):
[1]COHEN J,COHEN P,WEST S G, et al.Applied multiple regression/correlation analysis for the behavioral sciences[J].Journal of the Royal Statistical Society, 2003,52(4):691.
[2]楊華龍,劉金霞,鄭斌.灰色預(yù)測(cè)GM(1,1)模型的改進(jìn)及應(yīng)用[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2011,41(23):39-46.
[3]李夢(mèng)婉,沙秀艷.基于GM(1,1)灰色預(yù)測(cè)模型的改進(jìn)與應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2016,52(4):24-30.
[4]羅黨, 劉思峰, 黨耀國(guó). 灰色模型GM(1,1)優(yōu)化[J].中國(guó)工程科學(xué),2003,5(8):50-53.
[5]何瑞林. 中考試卷難度系數(shù)7:2:1[N].揚(yáng)州日?qǐng)?bào),2008-06-13(A03).
(責(zé)任編輯:周曉南)