姜志旺 張紅霞 申晨 劉曉樂(lè)
摘? ?要:文章針對(duì)不同課程各種課堂記錄數(shù)據(jù)對(duì)學(xué)生成績(jī)的影響,分析不同課程中的共同規(guī)律,從而得知哪些因素對(duì)學(xué)生成績(jī)的影響更大,以使智慧課堂更好地指導(dǎo)和管理教學(xué)過(guò)程。
關(guān)鍵詞:隨機(jī)森林;重要性;學(xué)生成績(jī)分類(lèi);智慧教學(xué)管理
通過(guò)大數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)的相關(guān)技術(shù)深入挖掘智慧教學(xué)爾雅課堂的相關(guān)數(shù)據(jù),挖掘內(nèi)在的規(guī)律和結(jié)論,可以更好地促進(jìn)智慧教學(xué)管理改革,使教學(xué)管理更加智能化和精準(zhǔn)化。在我國(guó)當(dāng)前的發(fā)展過(guò)程中,許多新型教和學(xué)的模式已經(jīng)逐漸開(kāi)始出現(xiàn),例如云教育、泛在學(xué)習(xí)、移動(dòng)學(xué)習(xí)、一對(duì)一數(shù)字化學(xué)習(xí),而這些模式的特征均是交互性的、嵌入性的、縮小化的。智慧教育會(huì)成為以后教育發(fā)展的突破口與沖擊點(diǎn),將會(huì)直接引起教育方面的改革,包括教育理念的改革、教學(xué)模式的改革、學(xué)習(xí)改革、教學(xué)管理和教學(xué)評(píng)價(jià)的變革[1]。
本文通過(guò)大數(shù)據(jù)、數(shù)據(jù)挖掘?qū)虒W(xué)數(shù)據(jù)進(jìn)行建模,通過(guò)模型建立和數(shù)據(jù)分析來(lái)挖掘教學(xué)數(shù)據(jù)中表現(xiàn)出來(lái)的規(guī)律,來(lái)更好地進(jìn)行智慧教學(xué)管理改革,這是根本的研究目的。
1? ? 數(shù)據(jù)預(yù)處理
通過(guò)爾雅課堂學(xué)習(xí)數(shù)據(jù),提取對(duì)本研究有用的數(shù)據(jù),即提取的特征屬性,包括任務(wù)完成率、視頻任務(wù)點(diǎn)完成率、章節(jié)測(cè)驗(yàn)完成率、視頻任務(wù)點(diǎn)學(xué)生觀看時(shí)長(zhǎng)(單位:min)、章節(jié)測(cè)驗(yàn)平均分、考試完成率、考試平均分、學(xué)習(xí)訪(fǎng)問(wèn)量等信息,得到如圖1所示的數(shù)據(jù)。
將數(shù)據(jù)進(jìn)行如下保留信息的轉(zhuǎn)換:
(1)將任務(wù)點(diǎn)完成率、視頻任務(wù)點(diǎn)完成率、章節(jié)測(cè)驗(yàn)完成率、考試完成率轉(zhuǎn)化為2位小數(shù)。
(2)刪除空數(shù)據(jù)與噪音數(shù)據(jù)。
經(jīng)過(guò)上述準(zhǔn)換,得到最終可用的數(shù)據(jù)如圖2所示。
將學(xué)生記錄按照學(xué)生成績(jī)進(jìn)行分類(lèi),98~100分為優(yōu)秀,90~98分為良好,45~90分為合格,0~40分為不合格,對(duì)應(yīng)的標(biāo)簽為0,1,2,3,按照此得到如圖3所示的數(shù)據(jù)。
2? ? 特征值提取
隨機(jī)森林是一種有監(jiān)督學(xué)習(xí)算法。首先,對(duì)數(shù)據(jù)進(jìn)行歸一化來(lái)統(tǒng)一量綱;其次,研究學(xué)習(xí)記錄信息對(duì)學(xué)生成績(jī)?cè)u(píng)級(jí)(優(yōu)秀、良好、合格、不合格)的特征貢獻(xiàn)度,即對(duì)學(xué)生成績(jī)?cè)u(píng)級(jí)的分類(lèi)結(jié)果,哪些特征對(duì)于決定學(xué)生成績(jī)?cè)u(píng)級(jí)的貢獻(xiàn)度較高。
本研究需要將隨機(jī)森林?jǐn)M合得到的特征的重要性排序和統(tǒng)計(jì)圖,規(guī)定>0.2為可以決定學(xué)生成績(jī)的分割線(xiàn)重要性值,以“創(chuàng)新創(chuàng)業(yè)”課程為例,隨機(jī)森林得到重要程度數(shù)據(jù)如表1所示。
首先,“創(chuàng)新創(chuàng)業(yè)”課程視頻任務(wù)點(diǎn)學(xué)生觀看時(shí)長(zhǎng)的重要性最高,為0.529 267 97,高出其他的特征,說(shuō)明視頻任務(wù)點(diǎn)學(xué)生觀看時(shí)長(zhǎng)是學(xué)生成績(jī)?cè)u(píng)定的最重要特征。其次,是學(xué)習(xí)訪(fǎng)問(wèn)量,為0.383 433 07。通過(guò)以上統(tǒng)計(jì)不難發(fā)現(xiàn),在爾雅課堂中對(duì)于學(xué)生成績(jī)?cè)u(píng)級(jí)起決定性的就是視頻任務(wù)點(diǎn)學(xué)生觀看時(shí)長(zhǎng)與學(xué)習(xí)訪(fǎng)問(wèn)量。
3? ? 學(xué)習(xí)數(shù)據(jù)分類(lèi)
通過(guò)研究特征任務(wù)點(diǎn)完成率、視頻任務(wù)點(diǎn)完成率、章節(jié)測(cè)驗(yàn)完成率、視頻任務(wù)點(diǎn)學(xué)生觀看時(shí)長(zhǎng)(單位:min)、考試完成率以及學(xué)習(xí)訪(fǎng)問(wèn)量能否有較高的教師評(píng)學(xué)成成績(jī)?cè)u(píng)定價(jià)的分類(lèi)準(zhǔn)確率。
需要對(duì)數(shù)據(jù)進(jìn)行分類(lèi)預(yù)測(cè),預(yù)測(cè)的算法可以支持向量機(jī)(Support Vector Machine,SVM)算法、邏輯回歸(Logistic Regression,LR)算法、樸素貝葉斯算法、決策樹(shù)算法、鄰近算法(K-NearestNeighbor,KNN)算法,要通過(guò)分類(lèi)算法參數(shù)的不斷調(diào)整來(lái)規(guī)避過(guò)擬合和欠擬合的現(xiàn)象。
調(diào)整好分類(lèi)器的參數(shù)后,需要對(duì)不同分類(lèi)器進(jìn)行統(tǒng)計(jì),統(tǒng)計(jì)的標(biāo)準(zhǔn)為模型分類(lèi)準(zhǔn)確率,將常用分類(lèi)器對(duì)應(yīng)的模型準(zhǔn)確率針對(duì)不同課程分別進(jìn)行統(tǒng)計(jì)。其中,“創(chuàng)新創(chuàng)業(yè)”課程分類(lèi)結(jié)果如表2所示。
如表2所示,基本分類(lèi)算法的效果都極差,其中,LR的分類(lèi)效果相對(duì)于其他的分類(lèi)器效果更好一些,為52.38%,原因是數(shù)據(jù)基本為離散數(shù)據(jù),且更符合更偏向于直接線(xiàn)性關(guān)系,所以邏輯回歸有較高的分類(lèi)準(zhǔn)確率。
從上述分類(lèi)的過(guò)程可以得到針對(duì)其他課程學(xué)生視頻觀看時(shí)長(zhǎng)對(duì)學(xué)生成績(jī)?cè)u(píng)級(jí)的影響可以說(shuō)起導(dǎo)向性的作用,通過(guò)對(duì)上述整個(gè)分類(lèi)過(guò)程的研究發(fā)現(xiàn),對(duì)于第一門(mén)課程完整數(shù)據(jù)做分類(lèi)預(yù)測(cè),分類(lèi)準(zhǔn)確率并沒(méi)有預(yù)測(cè)的效果好。
4? ? 結(jié)語(yǔ)
在以后的教育管理中應(yīng)該積極關(guān)注本研究結(jié)果中最重要因素:學(xué)生觀看視頻的時(shí)長(zhǎng)與學(xué)習(xí)訪(fǎng)問(wèn)次數(shù),觀看視頻時(shí)間長(zhǎng)的且具有較高學(xué)習(xí)訪(fǎng)問(wèn)量的學(xué)生成績(jī)的等級(jí)會(huì)更高。
分類(lèi)結(jié)果給以后的系統(tǒng)發(fā)展優(yōu)化帶來(lái)了更加明確的方向,通過(guò)輸入這些重要指標(biāo)的數(shù)值,可以直接、快速地反映出學(xué)生的成績(jī)?cè)u(píng)定,教師快速了解每個(gè)學(xué)生在學(xué)習(xí)過(guò)程中的進(jìn)度與知識(shí)掌握情況,使智慧教學(xué)的管理系統(tǒng)更加智能化,為今后的教學(xué)管理工作提供更科學(xué)的決策依據(jù)。
[參考文獻(xiàn)]
[1]曹培杰,尚俊杰.未來(lái)大學(xué)的新圖景“互聯(lián)網(wǎng)+高等教育”的變革路徑探析[J].現(xiàn)代遠(yuǎn)距離教育,2016(5):9-14.
Abstract:In view of the influence of various classroom record data on students performance in different courses, this paper analyzes the common laws in different courses, so as to find out which factors have a greater influence on students performance, so as to make the wisdom classroom better guide and manage the teaching process.
Key words:random forest; importance; classification of students grade; intelligent teaching management
無(wú)線(xiàn)互聯(lián)科技2019年15期