李菲 曹陽 顧問
(三江學院計算機科學與工程學院,江蘇 南京 210012)
學生學習成績預測一直是教育界研究的熱點,尤其在當前疫情期間,居家學習和在線教學成為常態(tài),如何有效利用信息技術,加強學生學習效果識別和預測,是教育領域的難點和重點。學生成績預測幫助老師及時調(diào)整教學方法、監(jiān)督和提醒學生,從而提高學生的最終學習成績。
在線教學借助中國大學慕課MOOC、超星、騰訊課堂等平臺,使用騰訊會議、QQ教室等工具,相比傳統(tǒng)教學,形式更靈活、學生學習行為更多樣化,這對教師的教學方法提出更高要求。劉茜萍等[1]在疫情期間,根據(jù)課程特點,綜合應用多種不同的教學平臺設計互動教學方案,提高教學質(zhì)量。陳逸菲等[2]利用SPOC課程教學的學習行為數(shù)據(jù),從中找到對成績影響最大的學習行為,實現(xiàn)數(shù)據(jù)驅(qū)動的混合式教學方式。除了改進教學方法外,機器學習方法、神經(jīng)網(wǎng)絡技術也應用在線教學數(shù)據(jù)分析中,幫助預測學習成績,提升學習效果。鄧天平等[3]采用聚類技術,結(jié)合慕課堂線上學習數(shù)據(jù)和線下考試成績,對學生進行聚類并分析各學習行為和成績之間的相關性。郎波等[4]根據(jù)學習平臺上的日常學習數(shù)據(jù),選取影響因子,采用BP神經(jīng)網(wǎng)絡和遺傳算法,對學生成績進行預測。曹洪江等[5]分析學生歷史成績的時序性,結(jié)合學習過程的遺忘特點,引入LSTM網(wǎng)絡進行建模,成績預測取得了較好的準確性。另外,考慮學生對課程的主觀情感因素,葉俊民等[6]針對學習社區(qū)的短文本情感特征,訓練深度學習模型。以上研究方法大多采用單一的神經(jīng)網(wǎng)絡模型,即輸入學生的知識結(jié)構和學習情感,沒有從線上教學實際出發(fā),考慮學生學習行為的多樣性,因此本文分析學生在線學習的行為特點,提出融合LSTM網(wǎng)絡和感知機MLP的預測模型:
(1)根據(jù)學生在線學習的周期特點,將學習特征分為每周學習特征和整學期學習特征兩大類;
(2)對每周學習特征,使用長短期記憶神經(jīng)網(wǎng)絡建模,模擬學生周期性學習過程,對整學期學習特征,采用MLP網(wǎng)絡建模;
(3)將LSTM網(wǎng)絡和MLP網(wǎng)絡融合,完成學生成績預測。
學生學習成績預測,通常使用學習過程中學生的若干行為特征,構建合適的學習模型。學習成績預測模型可以用數(shù)學符號表示如下:
(1)學生課程成績按照5個等級記錄,分別為優(yōu)秀、良好、一般、及格和較差,記為y∈[0,1,2,3,4],y(i)=3表示第i個學生的成績及格。
(2)學生每周學習行為,記為Pikj∈Rq,k∈{1,…,k},k代表一個學期的學習周數(shù),q代表每周的學生行為數(shù)據(jù)的維度[7],例如學生Si在k周(共16周)產(chǎn)生的學習行為特征序列為Pi=[Pi1,Pi2,…,Pik]。學生的每周學習行為有明顯時序特點,可通過長短期記憶時間網(wǎng)絡LSTM訓練。
(3)學生學期學習行為,記為E=[ec,ez,eg,ep],ec為單元測驗成績、ez為單元作業(yè)成績、eg為結(jié)課成績、ep為課程評價。
對學生學習效果進行預測,整個過程由采集學生學習數(shù)據(jù)、提取學習行為特征、構建學習模型和模型效果評價。(1)從中國大學MOOC平臺、騰訊會議收集學生在線學習數(shù)據(jù);(2)提取每周學習行為和學期整體學習行為,并進行數(shù)據(jù)優(yōu)化和清理;(3)對每周學習行為建立LSTM模型,并融合學期整體學習特征,構建學習效果預測模型;(4)通過常見的性能評價指標對預測模型進行評價。預測模型框架及處理流程如圖1所示。
圖1 預測模型框架
課題數(shù)據(jù)來源于三江學院計算機學院軟件工程專業(yè)和計算機科學技術450名學生在軟件測試課程的學習數(shù)據(jù),每個學生數(shù)據(jù)分別從中國大學慕課MOOC在線開放課程、慕課堂、騰訊會議記錄中獲取,并結(jié)合線下學習情況:(1)在線開放課程記錄包括單元測驗、單元作業(yè)、結(jié)課成績、討論區(qū)發(fā)言個數(shù)、獲贊數(shù)、課程評價;(2)慕課堂記錄包括考勤、點名、隨堂練習成績、討論次數(shù)、優(yōu)秀發(fā)言次數(shù)、視頻觀看次數(shù)、視頻觀看個數(shù)、視頻觀看時長;(3)騰訊會議學習記錄包括入會情況、課堂表現(xiàn),課堂表現(xiàn)可認為是線上課程的學習積極性,在實際教學中設置為“網(wǎng)課活躍度”行為特征,以量化學生線上學習參與程度。授課教師采用騰訊會議的投票功能,投票主題為知識點問題,學生對各選項進行投票選擇,實踐表明線上教學中學生不會主動參與話題討論,但大部分學生能積極投票,因此網(wǎng)課活躍度反映學生的參與程度,學生每參與一次投票活動,增加一個網(wǎng)課活躍度;(4)線下學習主要數(shù)據(jù)為期末考試成績和實驗成績,期末考試成績作為預測目標數(shù)據(jù)。
利用這些學習記錄,從線上線下多個維度綜合體現(xiàn)學生的學習情況,反應學生的主動學習態(tài)度和實際知識掌握程度,是學習成績預測的主要依據(jù)。
學生學習數(shù)據(jù)采集后需要進行分析,處理學習記錄中缺失、重復的異常情況,對學生的課程評價完成情感分析,具體操作如下:
(1)部分學生的學習記錄有缺失。個別學生沒有加入學校在線開放課程,單元測驗和單元考試學習記錄為空,只有慕課堂記錄和線下成績。對這部分學生的缺失數(shù)據(jù)以0計算。
(2)部分學生的學習記錄有重復。有部分學生使用多個賬號登錄學習,產(chǎn)生多組學習數(shù)據(jù),例如學生使用微信掃碼登錄慕課堂,使用認證賬號登錄在線開放課程,因此有兩組數(shù)據(jù),需要教師手工合并為同一組數(shù)據(jù)。
(3)學生課程評價情感分析。學生對課程評價屬于主觀感受,且非實名評論,因此對這部分數(shù)據(jù)要進行處理:首先學生評價時采用昵稱,教師從后臺數(shù)據(jù)庫關聯(lián)學生學號姓名;其次,并非所有學生都給出評價,參與評價的學生約占總?cè)藬?shù)的2/3;另外還存在一些無效評價、重復評價;最后,有的學生評價比較隱晦,沒有明確表達自己對課程的情感。綜上,我們在刪除重復和無效評價基礎上,采用自然語言處理技術,對學生評價短文本處理,獲取學生的課程情感,設定為中立、消極、積極三個等級。
學生課程評價,采用SnowNLP進行情感分析。Snow NLP是使用Python編寫的開源情感分析程序,其本質(zhì)是貝葉斯分類[8],通過pip3 install snownlp安裝,該庫計算語句情感sentiments,分值范圍為0~1,分值越高表示其越正向,我們設定sentiments>0.5為積極,=0.5為中立,<0.5為消極。
SnowNLP來源于電商評價,泛化能力存在一定局限性,因此我們結(jié)合結(jié)巴分詞,使用textrank關鍵詞提取,強化分詞,以提高情感評價準確性[9]。例如有學生評價:“雖然我學的不是軟件專業(yè),但是這門課還是教會了我很多東西”。SnowNLP評價sentiments值為0.61,判斷為積極情感,但通過結(jié)巴分詞textrank后,sentiments為0.73,進一步加強了情感導向。
學生原始數(shù)據(jù)處理后,根據(jù)學習數(shù)據(jù)特點,將這些數(shù)據(jù)按時間維度分為每周學習記錄、學期整體記錄兩大類,如慕課堂中每周簽到、隨堂練習記錄歸為周數(shù)據(jù),一學期軟件測試課程教學周期為16周,因此每個學生有16次周數(shù)據(jù)。分類后的學生學習行為特征如下:
表1 學期整體學習行為特征
表2 每周學習行為特征
學生數(shù)據(jù)經(jīng)過清洗處理后,還需要根據(jù)特征類型進行優(yōu)化處理,針對標簽類型的學習特征,采用one-hot編碼,將標簽分類轉(zhuǎn)換為啞變量(Dummy Variable);針對數(shù)字類型的學習特征,采用歸一化處理,通過最小-最大標準化映射到[0,1]區(qū)間,公式如下:
當前在學生學習領域的研究,往往使用獨立輸入的神經(jīng)網(wǎng)絡模型[5,6,10],即網(wǎng)絡只有一個輸入和一個輸出,而且網(wǎng)絡是層的線性堆疊。學生學習成績預測問題,包含多維度學習行為特征,網(wǎng)絡模型需要多模態(tài)輸入,使用不同類型的神經(jīng)層處理不同類型的數(shù)據(jù)。雖然可以訓練多個獨立的模型,對預測值做加權平均,但因為模型提取的信息存在冗余,因此針對本課題的實際情況,構建一個具有多輸入分支的網(wǎng)絡模型,學生周學習數(shù)據(jù)采用LSTM網(wǎng)絡,學生學期學習數(shù)據(jù)采用MLP網(wǎng)絡,用一個可以組合多個張量的層將這兩個不同的輸入分支合并。整個模型的結(jié)構如圖2所示。
圖2 學生學習成績預測融合模型結(jié)構
(1)學生每周學習情況具有時序特點,每周學習情況動態(tài)反映了學生的學習效果,對后續(xù)學習產(chǎn)生影響。LSTM能夠?qū)W習長期依賴關系,建立遠距離因果聯(lián)系,因此適合學生周期學習特征,輸入學生的時序數(shù)據(jù),輸出具有代表性的行為特征,體現(xiàn)學生在不同時刻的學習狀態(tài)。
在LSTM網(wǎng)絡中,用門的開關程度來決定對哪些信息進行讀寫或清除,有遺忘門、更新門、輸入門。LSTM通過遺忘門的Sigmoid激活函數(shù)實現(xiàn)遺忘不重要的信息,例如學生第一周的部分學習內(nèi)容對第二周的學習幫助不大,因此學生在第二周的學習會丟棄這部分內(nèi)容。遺忘門公式為:
LSTM通過輸入門將有用的新信息加入到記憶單元,計算公式為:
LSTM的輸出門,從當前狀態(tài)中選擇重要的信息作為輸出,輸出門ot(s)得到當前時間步的學生學習狀態(tài),即輸出ht(s),計算公式為:
以上公式中W是權值矩陣,B是偏置,?表示點積。
(2)學生的學期學習特征,由單元測驗成績、單元作業(yè)成績、開放課程結(jié)課考試成績、學生課程評價情感4個特征組成,代表學生在該學期中的整體表現(xiàn),設定為MLP網(wǎng)絡,作為學生評價模型的另一個輸入,和每周學習的LSTM模型實現(xiàn)融合。
把學期整體情況的輸出端和每周學習情況的輸出端合并起來,采用keras自帶的concatenate函數(shù),形成融合模型的輸入,再接上一個全連接層,完成整個模型構建。全連接層采用激活函數(shù)ReLu,模型優(yōu)化器為rmsprop,損失函數(shù)為categorical_crossentropy,迭代次數(shù)Epoch為500輪,輸出層采用softmax預測學生最終成績等級。
實驗數(shù)據(jù)集為2.2節(jié)處理后的學生課程數(shù)據(jù),評估指標采用精確率(Precision)、召回率(Recall)、F值(F1-Score)進行模型分類預測性度量。精確率是模型正確分類的正例樣本數(shù)與總的正例樣本總數(shù)的比值;召回率是模型正確分類的正例樣本數(shù)與分類正確的樣本總數(shù)的比值;F1值是準確率與召回率的調(diào)和平均,綜合體現(xiàn)精確率和召回率,F(xiàn)1值越高,分類效果越好。
其中,TP表示學生標簽為正例,被分類為正例;FN表示學生標簽為正例,被分類為反例;FP表示學生標簽為反例,被分類為正例;TN表示學生標簽為反例,被分類為反例。
為了展示本文模型的整體性能,將本文提出的融合網(wǎng)絡和支持向量機SVM、邏輯回歸LR、多層感知機MLP進行對比實驗。實驗結(jié)果如表3所示。
表3 實驗對比結(jié)果
從表3的實驗結(jié)果可見,LSTM+MLP融合的網(wǎng)絡模型,在精確率、召回率和F值上取得最優(yōu)值。對比實驗中其他算法預測準確率不高的原因,分析可能對所有的特征信息進行隨機分類訓練,在訓練時沒有區(qū)別性對待各屬性特征對學生成績的重要程度,LSTM捕獲了學生的序列信息,考慮每周的行為信息,加強了重要屬性特征提取,結(jié)合學期學習行為,大大提高了模型的預測分類效果。
本文針對在線教學現(xiàn)狀,提出了一種LSTM和MLP融合的學生成績預測方法,將學生學習數(shù)據(jù)分為周期性和整學期兩種類型,周學習數(shù)據(jù)采用LSTM網(wǎng)絡建模,學期數(shù)據(jù)采用MLP建模,這兩種模型融合使得預測能力更強,有效提高學生成績分類的準確性。在本校軟件測試課程上進行實驗,實驗結(jié)果表明,本文提出的融合模型取得較好的預測效果。未來的工作主要對學生學習行為之間的關系、學習行為與最終課程成績之間的關系采用更先進的神經(jīng)網(wǎng)絡表達,著重分析各類關系及關系權重,提高預測結(jié)果,準確反應學生的主動學習態(tài)度和實際知識掌握程度。