韋 偉,韓建華,徐月平,唐益柳
(安慶師范大學(xué)教師教育學(xué)院,安徽安慶246133)
隨著慕課、微課、翻轉(zhuǎn)課堂等在線學(xué)習(xí)形式的興起,混合式教學(xué)模式也日益受到重視。汲取在線教育精髓,合理開展混合式教學(xué)能夠提高人才培養(yǎng)質(zhì)量[1]。基于移動互聯(lián)網(wǎng),教師可以借助各種在線學(xué)習(xí)平臺,開展課前預(yù)習(xí)資源推送、課上講解答疑和課后鞏固演練等教學(xué)活動,結(jié)合“線上+線下”各自優(yōu)勢,最大限度做到“以學(xué)生為中心”,這有助于實現(xiàn)價值塑造、能力培養(yǎng)、知識傳授“三位一體”的教育[2]。與此同時,這些在線學(xué)習(xí)平臺通過及時采集積累了大量學(xué)生及其行為的數(shù)據(jù),這些數(shù)據(jù)有助于教師了解學(xué)生的學(xué)習(xí)過程。但就平臺提供的數(shù)據(jù)分析而言,功能還僅局限在簡單的數(shù)據(jù)統(tǒng)計之上,沒有有效處理和解釋這些豐富的數(shù)據(jù),沒有對教育教學(xué)形成更有效的指導(dǎo)。因此,如何利用這些數(shù)據(jù),開展更有深度的數(shù)據(jù)分析,也是當(dāng)前學(xué)習(xí)分析領(lǐng)域研究的熱點。雨課堂是主要面向高等教育領(lǐng)域的智慧課堂教學(xué)工具,它能采集和存儲相應(yīng)的動態(tài)生成數(shù)據(jù),但還存在數(shù)據(jù)挖掘和分析的不足。一方面,數(shù)據(jù)分析只是進行簡單匯總統(tǒng)計,比如公告閱讀次數(shù)、到課次數(shù)、答題分數(shù)等,缺乏過程性的聚類分析、相關(guān)分析和預(yù)測分析等;另一方面,數(shù)據(jù)以文本表格方式呈現(xiàn),可理解性不強,難以進行有效的可視化呈現(xiàn),特別是當(dāng)用戶缺乏專業(yè)的數(shù)據(jù)挖掘和分析知識,很難充分利用和解釋這些豐富的數(shù)據(jù)?;诖藛栴},關(guān)注智慧教學(xué)過程中動態(tài)生成性數(shù)據(jù)的分析,利用數(shù)據(jù)挖掘的相關(guān)方法和技術(shù)對原始學(xué)習(xí)行為數(shù)據(jù)進行變換處理,并進行聚類分析、相關(guān)分析和預(yù)測分析,以量化研究學(xué)生的學(xué)習(xí)態(tài)度和學(xué)習(xí)能力之間的關(guān)系,為今后教學(xué)活動的更好開展提供有力的數(shù)據(jù)支持。
數(shù)據(jù)挖掘的主要任務(wù)有聚類分析、關(guān)聯(lián)分析、預(yù)測分析等多種。K-means是常用的聚類方法之一,能在設(shè)定聚類數(shù)的情況下將每個對象數(shù)據(jù)歸為一類。這里我們通過每周累積的學(xué)生動態(tài)生成數(shù)據(jù)將學(xué)生自動劃為三類,對學(xué)生當(dāng)前的學(xué)習(xí)狀態(tài)進行評估,并繪制狀態(tài)變換圖。相關(guān)分析則是研究兩個或兩個以上處于同等地位的隨機特征間的相關(guān)關(guān)系的統(tǒng)計分析方法。這里通過相關(guān)分析,找出與學(xué)習(xí)效果之間影響較大的因素,該因素將是教師在教學(xué)活動中重點關(guān)注的學(xué)生行為數(shù)據(jù)。
文章還利用預(yù)測分析的方法對學(xué)生未來學(xué)習(xí)效果進行預(yù)測。預(yù)測有分類、回歸兩類,前者預(yù)測的決策特征值是離散值,后者預(yù)測的決策特征值是連續(xù)值。實驗中采用的方法有極限學(xué)習(xí)機(ELM)、支持向量機(SVM)、決策樹(CART)、XGBoost等方法。
雨課堂收集到的數(shù)據(jù)有課堂情況、課件推送、試卷、公告等4大類,具體有課堂得分、課后試卷得分、課件推送觀看頁數(shù)、簽到次數(shù)、到課率、彈幕次數(shù)、投稿次數(shù)、公告閱讀狀態(tài)等。考慮到課程進度、學(xué)生反饋的不一致,尤其是課堂中的提問很難保證在多個平行班完全一致,因此單純根據(jù)得分、題數(shù)或次數(shù)難以對學(xué)生的學(xué)習(xí)狀態(tài)和學(xué)習(xí)效果進行準確評估。這里在雨課堂統(tǒng)計數(shù)據(jù)基礎(chǔ)上,進行變換處理,得到學(xué)習(xí)態(tài)度、學(xué)習(xí)能力兩個方面共8個特征維度的數(shù)據(jù)。具體見表1。
表1 數(shù)據(jù)特征描述
教師在雨課堂發(fā)出公告后,學(xué)生的手機端能及時收到短信提醒。因為公告具有實效性,所以假設(shè)學(xué)習(xí)態(tài)度端正的學(xué)生能及時閱讀公告,及時率也能在一定程度上體現(xiàn)學(xué)習(xí)的主動性,閱讀及時率高的學(xué)生也會更多關(guān)注課程的學(xué)習(xí)。如果某條公告沒有閱讀,則該學(xué)生這條公告的閱讀及時率為0。單純的公告閱讀率不具有及時性,因此,公告閱讀及時率可以作為閱讀率的補充。到課率可由雨課堂的簽到次數(shù)直接統(tǒng)計。雨課堂還可以統(tǒng)計課堂得分,但由于不同班級之間題數(shù)、分值可能有所差異,不能直接進行比較。這里采用課堂答題率、課堂得分率。作業(yè)完成質(zhì)量的高低也是學(xué)生學(xué)習(xí)態(tài)度和能力的外在表現(xiàn)??紤]到課后作業(yè)一般以主觀題為主,完成期限比較長,所以沒有計算作業(yè)查閱的及時程度,只考慮作業(yè)查閱率、提交率和得分率。
表1還給出了每項特征的具體計算方式。需要強調(diào)的是,課程學(xué)習(xí)是一項長期的任務(wù),需要進行長期的觀察。因此,8個數(shù)據(jù)特征全部采用累積計算的方式。比如,第n周的公告閱讀率是前n周已閱讀公告數(shù)與已發(fā)公告數(shù)之比;公告閱讀及時率是前n周及時率的平均值。其他數(shù)據(jù)特征依此類推。最后,為提高數(shù)據(jù)分析的質(zhì)量,需要統(tǒng)一量綱,特征數(shù)據(jù)都通過公式G=z zmax歸一化到[0,1]范圍內(nèi),其中,z、zmax分別表示某學(xué)生某個特征值、該特征的最大值。某個周次某項數(shù)據(jù)如果缺失,可用最近前一周數(shù)據(jù)代替。比如,課后作業(yè)是平均約兩周布置一次,沒有作業(yè)的周次課后作業(yè)得分率、查閱率、提交率等用前一周的數(shù)據(jù)填充補齊。
某高校2016級小學(xué)教育(全科教師)專業(yè)三個平行班共149人,分別利用雨課堂平臺開設(shè)“數(shù)字化學(xué)習(xí)資源開發(fā)”課程,總共17個教學(xué)周、授課17次;平均每班發(fā)出課堂主客觀題33道、布置課后主觀作業(yè)7次、頒布公告35條。將采集到的課程數(shù)據(jù),經(jīng)過轉(zhuǎn)換、預(yù)處理,可以進行聚類、相關(guān)、分類、回歸等分析,從而為教學(xué)活動提供有效指導(dǎo)。
在學(xué)習(xí)態(tài)度和學(xué)習(xí)能力兩個維度上進行聚類分析,從整體上把握二者之間的關(guān)系。學(xué)習(xí)態(tài)度是表1中前6個特征的均值,學(xué)習(xí)能力則是兩個得分率的均值,兩者都做了歸一化處理。圖1是用K-means方法對所有學(xué)生在不同周次的聚類結(jié)果,聚類數(shù)(學(xué)習(xí)層次)為3。圖中每個編號分別代表不同的學(xué)生,“×”表示學(xué)習(xí)態(tài)度端正、學(xué)習(xí)能力強的學(xué)生,反之用“+”表示,其他學(xué)生為“○”樣本點。圖1中4張子圖則分別是第3周、第7周、第12周和第17周的聚類結(jié)果。圖1顯示,隨著課程的進行,學(xué)生聚集程度越來越集中,并且偏向右上角。這表明無論是學(xué)習(xí)態(tài)度,還是學(xué)習(xí)能力,都反映出課程有比較好的教學(xué)效果。
圖1 不同周次“學(xué)習(xí)態(tài)度——學(xué)習(xí)能力”聚類
每個學(xué)生在每周的聚類變化可以用圖2進行可視化分析。圖2中3條曲線表示3位學(xué)生的學(xué)習(xí)狀態(tài),圖中序號表示周次,符號“×”、“+”、“○”的含義與圖1 相同,表示學(xué)生屬于不同的學(xué)習(xí)層次。圖2顯示,第30號學(xué)生在課程學(xué)習(xí)的前4周狀態(tài)不佳,端正學(xué)習(xí)態(tài)度后,學(xué)習(xí)能力有較大提升,二者均呈遞增趨勢。第78號學(xué)生正好相反,在課程學(xué)習(xí)初期,學(xué)習(xí)態(tài)度和學(xué)習(xí)能力都處在高分段,但從第5周之后一直下滑。而第137號學(xué)生在適度端正學(xué)習(xí)態(tài)度之后,學(xué)習(xí)能力也有一定提升,但沒有達到較高水平。圖2中的箭頭表示學(xué)生狀態(tài)變化的方向。教師可以根據(jù)這些聚類結(jié)果,調(diào)整自己的教學(xué)方法或策略,也可以對個別學(xué)生進行針對性的干預(yù),加強監(jiān)督和指導(dǎo)。
通過相關(guān)分析,力圖找出與學(xué)習(xí)效果之間影響較大的因素,即表1中的具體特征。學(xué)生總評成績可以作為學(xué)習(xí)效果進行預(yù)測,也同樣歸一化到[0,1]范圍。根據(jù)總評成績,用K-means聚類方法將學(xué)生分成三類,即“優(yōu)秀”、“良好”、“中等及以下”(以下簡稱“優(yōu)”、“良”、“中”)。表2是聚類結(jié)果。依據(jù)聚類結(jié)果,對三類學(xué)生每周次的8個特征結(jié)果進行均值化處理,得到各特征的累積均值,如表3所示。
由表3可知,三個群體學(xué)生在各項指標(biāo)上的差異很大,“優(yōu)”類學(xué)生的指標(biāo)值始終處于高位,符合人們的主觀認識。學(xué)習(xí)態(tài)度端正,學(xué)習(xí)能力強的學(xué)生一般會有不錯的學(xué)習(xí)效果。
表4是各特征與學(xué)習(xí)效果的周平均相關(guān)系數(shù)。一般來說,相關(guān)系數(shù)0.00~±0.3是微相關(guān),±0.30~±0.50是實相關(guān),±0.50~±0.80是顯著相關(guān),±0.80~±1.00是高度相關(guān)[3]。就全體學(xué)生而言,8個特征與學(xué)習(xí)效果的相關(guān)程度在正實相關(guān)以上,其中作業(yè)得分率、課堂得分率和作業(yè)提交率的相關(guān)性最高。另外,作業(yè)得分率與三類學(xué)生也均呈較大的相關(guān)性。因此,教師可加大課后作業(yè)的監(jiān)管和指導(dǎo)力度,提高學(xué)生的學(xué)習(xí)效果。對于“中”類學(xué)生來說,到課率與學(xué)習(xí)效果之間呈正相關(guān)性,尤其是在課程早期,這種相關(guān)性呈增長勢頭更加明顯。因此,教師可以通過督促此類學(xué)生正常到課聽課來促進他們的學(xué)習(xí)。而對于“優(yōu)”、“良”等程度的學(xué)生來說,到課率基本和學(xué)習(xí)效果呈負微相關(guān)性?;九袛嗍牵爸小鳖悓W(xué)生由于學(xué)習(xí)以被動為主,提高其到課率有助于其學(xué)習(xí)成績的提高;但對“優(yōu)”、“良”兩類學(xué)生來說,由于他們學(xué)習(xí)主動性較強,課后思考及主觀作業(yè)的完成更利于個人成績的提高。學(xué)生的學(xué)習(xí)主動性可以由表1中的“學(xué)習(xí)態(tài)度”這個維度的指標(biāo)反映,具體值見表3。
考慮到不同周次各特征值的變化,同時周次也能反映學(xué)習(xí)的進程,因此將周次也作為特征輸入,參與模型的學(xué)習(xí)與預(yù)測。這里使用ELM[4]、SVM[5]、CART[6]、XGBoost[7]等4種機器學(xué)習(xí)方法建模,并且對學(xué)習(xí)效果進行回歸和分類預(yù)測。模型的訓(xùn)練采用10折交叉驗證的方式,數(shù)據(jù)隨機分成訓(xùn)練集和測試集,得到訓(xùn)練、測試的預(yù)測誤差和分類精度。具體結(jié)果見表5。
表5中的均方誤差和分類精度都是10折交叉驗證結(jié)果的平均值,模型的關(guān)鍵參數(shù)也一同給出。從表5看,4種模型的準確率都比較高,能夠?qū)崿F(xiàn)學(xué)習(xí)效果的預(yù)測。其中回歸模型中,SVM和XGBoost的測試誤差要低于ELM、CART;分類模型中,SVM和XGBoost的分類精度也優(yōu)于ELM、CART。
表5 模型主要參數(shù)及訓(xùn)練預(yù)測結(jié)果
表6是分別用SVM和XGBoost模型對不同周次的數(shù)據(jù)進行預(yù)測和分類的結(jié)果,其中樣本來自三類學(xué)生中的一例,具體由計算機隨機選擇。就分類而言,除第1、2周分類出現(xiàn)錯誤外,根據(jù)其他周次的課程數(shù)據(jù)能判斷學(xué)生最終的學(xué)習(xí)效果屬于哪一層次;就回歸而言,根據(jù)不同周次的課程數(shù)據(jù)也能基本判斷出學(xué)生的學(xué)習(xí)成績,并且隨著課程數(shù)據(jù)的積累,預(yù)測精度愈來愈準確。
表6 不同周次數(shù)據(jù)預(yù)測和分類結(jié)果
利用雨課堂平臺生成學(xué)生學(xué)習(xí)的過程數(shù)據(jù),經(jīng)過數(shù)據(jù)轉(zhuǎn)換得到閱讀率、提交率、得分率等8個特征。在聚類、相關(guān)、分類、回歸等數(shù)據(jù)分析基礎(chǔ)上,可以得出以下有意義的結(jié)論:
第一,通過聚類分析,教師不僅可以動態(tài)觀察學(xué)生整體的學(xué)習(xí)狀況,還可以發(fā)現(xiàn)不同學(xué)生的異常狀態(tài)。基于此,對全體學(xué)生可以適當(dāng)調(diào)整教學(xué)方法、教學(xué)策略等;對個別學(xué)生,可以通過針對性措施鼓勵或鞭策學(xué)生來提高學(xué)業(yè)成績。
第二,通過相關(guān)分析發(fā)現(xiàn),作業(yè)得分率、作業(yè)提交率、課堂得分率與學(xué)習(xí)效果有很強的相關(guān)性,教師可以在授課進程中給予關(guān)注,有意識地強調(diào)和管控課堂答題和作業(yè)完成的質(zhì)量。
第三,SVM、XBGoost等模型能用于學(xué)習(xí)效果的預(yù)測和分類,并且有較高的準確率。可在課程進行中不斷使用已生成的數(shù)據(jù)進行預(yù)測,并將預(yù)測結(jié)果反饋給學(xué)生,進一步起到學(xué)業(yè)預(yù)警的作用。
第四,對預(yù)測結(jié)果為“中”的學(xué)生,關(guān)注其課堂出勤情況。因為他們的學(xué)習(xí)成績與到課率呈正相關(guān)。