駱莉莎,黃星華,苑 溦
(江蘇開放大學,江蘇 南京 210036)
當前,網(wǎng)絡學習已經(jīng)成為重要的新型學習方式。2020年的突發(fā)疫情從客觀上快速將線上教育推向了普遍化與大眾化。然而,這一快速轉(zhuǎn)變也潛藏著很多實際問題,比如學生短時間內(nèi)還不能適應新的學習方式,傳統(tǒng)課堂學習評價重結(jié)果輕過程的模式已經(jīng)不再適用。
許多學者對于線上教育的評價方法進行了系統(tǒng)研究。馮天敏和張世祿[1]指出,在線學習的評價目的在于監(jiān)控學習進程、保證學習質(zhì)量、促進學生發(fā)展。雷軍程[2]比較了Udacity、Coursera、Edx 三大MOOC 平臺的課程評估方式,發(fā)現(xiàn)其評價模式與目前傳統(tǒng)課堂教學的評價模式類似。代利利和李經(jīng)山[3]指出,翻轉(zhuǎn)課堂學習需對評價體系的基本價值取向、三個關鍵維度和指標構(gòu)成、操作方法和權(quán)重分配等進行設計。其他學者[4-5]都對在線教育評價進行了研究。
綜合已有研究來看,如何利用大數(shù)據(jù)挖掘技術(shù)分析在線學習行為,采用合理、科學、創(chuàng)新、量化的評價手段反映學生學習過程的每個環(huán)節(jié),已經(jīng)成為當前研究的熱點。本文將討論如何基于在線學習數(shù)據(jù)實時預測學生的學習行為。
學生學習是一個循序漸進的過程,在線學習平臺可以記錄學習過程中每個階段的學習數(shù)據(jù),這些數(shù)據(jù)可以看做時間序列數(shù)據(jù)。人工智能領域的循環(huán)神經(jīng)網(wǎng)絡最適合處理時間序列問題。RNN 的特點是隱藏單元間的連接是循環(huán)的;如果輸入的是一個時間序列,可以將其在時間維度展開,其中的每一個單元,除了處理當前時間點的輸入數(shù)據(jù)外,還要處理前一個單元的輸出,最終輸出一個時間序列。然而,RNN 模型無法學習到“長依賴”的問題。隨后出現(xiàn)了LSTM(Long Short-Term Memory)長短期記憶網(wǎng)絡以消除RNN 長期依賴不可靠的問題。
LSTM,是一種特殊的RNN,能夠?qū)W習較長時間范圍內(nèi)數(shù)據(jù)的依賴關系,如學生近一個月的學習狀態(tài)對接下來一周的學習狀態(tài)的影響。LSTM 是為了避免“長依賴”問題而精心設計的。LSTM 也擁有RNN 的鏈狀結(jié)構(gòu),但是重復模塊則擁有不同的結(jié)構(gòu)。與神經(jīng)網(wǎng)絡的簡單的一層相比,LSTM 擁有四層,這四層以特殊的方式進行交互,其結(jié)構(gòu)如圖1 所示。
圖1 LSTM 神經(jīng)網(wǎng)絡模型
本研究基于某課程的在線教學平臺自動統(tǒng)計的學生學習數(shù)據(jù)開展模型訓練。本次研究共使用了兩個在線教學班(共145 名學生)的在線學習時間序列數(shù)據(jù)。
本文訓練的神經(jīng)網(wǎng)絡模型的目標在于找到學生學習時間序列的某種規(guī)律以指導教學。為此,需首先回答以下兩個問題:
應該用哪些數(shù)據(jù)來衡量學生的學習情況。因本研究針對的是學習的時間序列數(shù)據(jù),首先要求這樣的數(shù)據(jù)應該是隨著學習進程推進能實時收集、不斷擴充的數(shù)據(jù),而不是單個時間點的數(shù)據(jù);因而,期中考試成績、期末考試成績不能作為衡量數(shù)據(jù)。其次,由于涉及數(shù)據(jù)量大,這樣的數(shù)據(jù)應該是能夠自動采集的,而不需要太多教師手動的操作;因而,在線學習平臺自動記錄的數(shù)據(jù)更加符合要求,如教學資料的學習時長、學習次數(shù)、反復查看次數(shù)、學習資料的下載次數(shù)、簽到數(shù)、討論參與次數(shù)、章節(jié)測驗成績(系統(tǒng)自動批改)等。再次,學習數(shù)據(jù)應該是多維的,用于學生學習情況衡量的數(shù)據(jù)應該既包括學習過程的參與程度數(shù)據(jù),也需要包括學習效果的衡量數(shù)據(jù);只注重其中一個方面是偏頗的。經(jīng)過數(shù)據(jù)篩選,本研究采用學生對學習視頻的觀看次數(shù)和章節(jié)測驗(系統(tǒng)自動批改)成績作為學生學習參與程度和學習效果兩方面的評價。
對于學生的學習數(shù)據(jù)時間序列,究竟應該用前多少次的學習數(shù)據(jù)預測接下來一次學習的學習數(shù)據(jù)?這個問題在已有研究中并沒有確切的方法。首先,學生的學習時間應該遵循一定的規(guī)律,一般我們希望學習時長是穩(wěn)定的,使得學習進程是持續(xù)穩(wěn)定高效推進的。然而,各種因素都會影響學生在特定時間點的學習投入程度,可能的因素(包括但不限于)如下:(1)該時間點學生恰好有其他事務導致學習時間明顯降低甚至為零;(2)該部分課程教學資源較為枯燥,學生普遍沒有學習興趣;(3)學生基于之前的學習時間和測試分數(shù)認為該門課程較為簡單,投入時間不足。對于第(1)個因素,因?qū)儆趯W生的個人偶然因素,教師難以控制,在本研究的模型中也的確難以體現(xiàn),故在LSTM 模型中增加了Dropout 層,可在一定程度上消除隨機因素對本研究模型預測效果的不利影響。對于第(2)、(3)個因素,可以通過課程學習數(shù)據(jù)反映出來。本研究通過數(shù)據(jù)分析來尋找答案。為此,以145 名學生的學習數(shù)據(jù)為數(shù)據(jù)集進行研究,70%作為訓練集,30%作為測試集,以均方差作為模型優(yōu)劣的衡量參數(shù)。LSTM 模型的結(jié)構(gòu)為四個堆疊LSTM 層,每層配置一個隨機Dropout層,最后通過一個全連接層得到輸出值(輸出值即為下一次視頻觀看時長)。結(jié)果如圖2 所示。
圖2 中,隨著采用的前期數(shù)據(jù)量的增加,模型預測的均方誤差逐漸減小,預測精度逐漸升高。當采用的前期數(shù)據(jù)量較多時,在實際教學過程中,需要前期有一定時長的教學活動之后本研究的模型才能開始發(fā)揮作用,不利于教師及時了解學情;當采用前期數(shù)據(jù)量較少時,模型精度無法保證。對比圖2 中某學生學習數(shù)據(jù)的實際預測效果,綜合考慮,可選擇采用前5 次學習數(shù)據(jù)預測下一次學習數(shù)據(jù),由此平衡了模型精度與教學反饋及時性的矛盾。
為檢驗模型應用效果,以第一教學班數(shù)據(jù)作為模型訓練與調(diào)試的數(shù)據(jù)集,隨后以第二教學班在線教學過程作為本研究成果的模擬應用場景。
圖2 模型誤差與采用的前期數(shù)據(jù)次數(shù)
圖3 為隨機選擇的12 位同學的學習數(shù)據(jù)(各個教學視頻的觀看時長)。圖中,實心點代表實際數(shù)據(jù),叉代表本研究模型的預測數(shù)據(jù)??梢钥吹?,盡管有一定誤差,但模型基本能反映數(shù)據(jù)的整體變化趨勢。由于是根據(jù)前5 次學習數(shù)據(jù)預測下一次數(shù)據(jù),故前5 次無預測數(shù)據(jù)。從圖中可以看出本研究模型預測結(jié)果的一些特點:
(1)模型預測值與實際值相比,波動幅度更小。這是由于模型預測是基于全班所有學生的學習數(shù)據(jù),反映的是學生的整體情況,相對個體而言更為穩(wěn)定,因此波動較小。
(2)模型對學生的較大波動的學習數(shù)據(jù)有敏感的響應。當學生的某次學習時長有明顯向上或向下跳動時,模型預測的下一次學習時長也將相應變化,說明模型能反映學生個性行為。
(3)模型預測具有一定保守性。當學生在某次學習中學習時長突然下降時,即使學生在下一次學習立刻恢復正常學習時長,模擬預測的學習數(shù)據(jù)仍然偏低,需要多次學習后才能恢復到與實際相當?shù)念A測值;而當學生學習時長突然上升后再次降低到穩(wěn)定水平時,模型預測值也將快速降低,而不會維持在較高水平。
圖3 不同學生各次視頻觀看時長預測與實際對比
本研究基于在線教學的學生學習數(shù)據(jù)構(gòu)建了基于前5 次在線教學視頻觀看時長和各章測試成績預測下一次在線視頻學習時長的人工智能神經(jīng)網(wǎng)絡模型(LSTM 模型)。應用分析表明:該預測模型能很好反映學生的在線學習行為,具備滿意的預測能力。該模型對教師實時把握在線教學學情有輔助作用。