莊俊璽,王 琪,賴英旭,劉 靜,靳曉寧
北京工業(yè)大學信息學部,北京 100124
教育是國之大計,高等教育作為教育的重要組成部分,其發(fā)展狀況從側面反映了國家科學技術的發(fā)展水平。高等教育的普及化給高校教學管理工作帶來了新的挑戰(zhàn),如何在高等教育受眾增加的同時實現(xiàn)內涵式發(fā)展是我國高等教育發(fā)展面臨的重大課題。在這種情況下,期末成績作為衡量高等教育教學質量的直觀標準,如何精準地預測其變化已成為迫切需求。
成績預測預警的主要目的是發(fā)現(xiàn)存在學業(yè)危機和具有潛力的學生,以便教師及時采取干預措施幫助其提升學業(yè)。現(xiàn)有的成績預測方法大多采用數(shù)據(jù)挖掘的技術,如分類、聚類、回歸、關聯(lián)規(guī)則[1]。Gao 等[2]基于學生編程過程中的行為模式,使用差分序列挖掘的方法來預測學生最終的課程表現(xiàn)。Song 等[3]針對學生的在線點擊日志、歷史成績和人口統(tǒng)計信息設計了一種基于順序參與檢測機制的模型來捕獲學生的順序參與特征同時探索周期性特征進而預測學生的學習成績。Haryani等[4]使用分類和聚類技術處理學生滿意度調查和校園設施調查得到的反饋數(shù)據(jù),以幫助大學分配資源、制定政策進而提高教育質量。郭鵬等[5]使用改進的K-means算法和引入興趣度量的Apriori算法對學生的成績記錄進行挖掘以發(fā)現(xiàn)課程之間的關聯(lián)規(guī)則和相互影響。張明焱等[6]結合長短期記憶網(wǎng)絡(long short-term memory,LSTM)自動編碼特征和注意力機制提出一種風險學生早期預警模型,它可以有效地識別出風險學生并得到最早干預時間點。
除了以上針對人口統(tǒng)計特征、心理因素、在線學習數(shù)據(jù)等信息的成績預測研究,基于學生一卡通消費數(shù)據(jù)、門禁數(shù)據(jù)這類在校行為數(shù)據(jù)的研究也有很多。Liang等[7]基于極限梯度提升算法(extreme gradient boosting,XGBoost)和改進的粒子群優(yōu)化算法(particle swarm optimization,PSO)相結合的模型來解決學生成績的多分類問題進而預測學生的學習成績,不過該方法缺少對日常行為數(shù)據(jù)的關注;Yao 等[8]基于校園智能卡在信息中心生成的數(shù)字記錄構建校園社交網(wǎng)絡,并使用一種新的標簽傳播算法來預測學生的表現(xiàn),但該方法基于學生消費、進出圖書館等行為來構建社交網(wǎng)絡,缺少對日常行為本身的關注;Xu 等[9]根據(jù)學生的出勤率、在圖書館的平均時間、玩游戲的平均時間和參加的社團數(shù)量等信息使用K近鄰(K-nearset neighbors,KNN)算法來預測學生是否能順利完成學業(yè),實驗過程中使用的數(shù)據(jù)特征單一;Chen 等[10]針對人口統(tǒng)計特征、歷史表現(xiàn)數(shù)據(jù)和一卡通數(shù)據(jù)提出一種基于多頭注意力機制和分層漸進LSTM行為特征提取模型來預測學生的成績變化,預測過程中對行為數(shù)據(jù)的利用不充分;Chen等[11]根據(jù)學生的消費記錄、考勤結果、課程成績、圖書借閱等行為信息使用組合梯度提升樹算法(gradient boosting decision tree,GBDT)、人工神經(jīng)網(wǎng)絡(artificial neural network,ANN)和K-means 算法的預測模型來預測學生的學習成績和生活規(guī)律,在提取學生日常行為數(shù)據(jù)時粒度較粗。
針對以上研究存在的對日常行為數(shù)據(jù)關注較少、對行為數(shù)據(jù)的利用不充分、使用的數(shù)據(jù)特征單一、數(shù)據(jù)粒度粗等問題,本文提出一種基于三元深度融合的行為驅動成績預警方法,該方法重點關注學生的細粒度日常行為數(shù)據(jù),并從規(guī)律性、活躍性、勤奮性三方面入手來提取行為數(shù)據(jù),然后使用支持向量機遞歸特征消除算法(support vector machines recursive feature elimination,SVM-RFE)做特征選擇操作,最后搭建了一個三元深度融合成績預警模型來完成對學生的分類進而進行成績預警。實驗結果表明,本方法提出的模型有較好的分類預測效果,可以有效地幫助高校教師和輔導員進行教學干預。
社會學家對群體行為的研究由來已久。LeBon[12]認為群體行為是由成員自發(fā)形成的,它會隨著時間的推移強化或消失,主要受群體環(huán)境的影響,群體中的個人容易模仿群體中其他人的行為和態(tài)度。Park 等[13]認為,“群體行為是在公共和集體沖動的影響下發(fā)生的個人行為,它是社會互動的結果”。波普諾[14]認為,群體行為是那些在相對自發(fā)的、無組織和不穩(wěn)定的情況下人們因為某種普遍的影響和鼓舞相互作用而發(fā)生的行為。由此可見群體行為是自發(fā)形成的,它是群體中各參與者相互影響的結果。國內關于群體行為的研究經(jīng)常與政治和群體性事件相聯(lián)系,本文則從高校不同學生群體間的行為模式入手來研究群體行為。高校學生在日常生活中多以群體形式存在,班級同學經(jīng)常一起上課,朋友經(jīng)常一起吃飯運動,社團成員經(jīng)常一起舉辦活動,這使得他們往往具有群體共同目標和價值追求,因此他們在校期間的成績很容易受到所處群體的影響。Yang 等[15]發(fā)現(xiàn)學生間存在較強的同伴效應,作息規(guī)律的學生傾向于交校園行為有規(guī)律的朋友,一個勤奮的學生,他的朋友也很勤奮。Tsai等[16]發(fā)現(xiàn)學生在以小組為單位搜尋信息完成任務時尤其會考慮組內成員的想法和意見,他們往往會放棄同伴不需要的信息。Cheng等[17]發(fā)現(xiàn)學生在線學習過程中組內互動可以更好地發(fā)展他們的創(chuàng)造力、批判性思維和解決問題的能力。Liu[18]發(fā)現(xiàn)給學生推薦學習資料時,考慮群體學習行為比不考慮群體學習行為的推薦結果有更高的準確率,學生的滿意度也更高。
由此可見,高校學生群體間的行為具有較高的相似性,在進行研究時考慮群體行為的情況下效果更好,所以本文基于群體成員相似的行為模式和學生行為的規(guī)律性、過程性、周期性等特點從群體行為的角度出發(fā)來選擇特征。另外,群體行為不是群體的產(chǎn)物,而是由將特定行為帶入群體的一些人集合形成的,是相似個體行為集合的產(chǎn)物,因此,本文不僅分析了學生的群體行為,還考慮了學生個體的表現(xiàn)。
特征選擇可以從原始特征中剔除不相關的或冗余的特征以優(yōu)化數(shù)據(jù)集,它不僅能加速模型訓練的過程,還能在一定程度上提高模型分類的精度。根據(jù)算法與模型的結合方式可以將特征選擇算法分為三類,分別是過濾式特征選擇算法、包裝式特征選擇算法、嵌入式特征選擇算法??紤]到過濾式特征選擇方法因選擇特征過程與模型獨立所以選出的特征在模型中表現(xiàn)不如包裝式特征選擇算法,而包裝式特征選擇算法計算量大,影響系統(tǒng)效率,本文選用嵌入式特征選擇算法完成這一操作。常用的嵌入式特征選擇算法有SVM-RFE 算法、最小絕對值選擇與收縮算子(least absolute selection and shrinkage operator,Lasso)回歸和嶺(ridge regression,Ridge)回歸??紤]到Ridge回歸不能使特征的權重系數(shù)為0 所以不適用于減少特征數(shù)量的場景,Lasso 回歸在特征相關性較強時結果不穩(wěn)定,而SVM-RFE 算法既能遞歸地減少特征數(shù)量又不會受特征間相關性影響,本文使用SVM-RFE算法來選擇特征。
SVM-RFE算法是支持向量機(support vector machine,SVM)算法與遞歸特征消除(recursive feature elimination,RFE)相結合組成的。其中,SVM是一種應用于分類、回歸問題的有監(jiān)督學習算法,它使用一條到最近點邊界、有寬度的線條來區(qū)分各種類型,選擇邊界最大的那條線是模型最優(yōu)解,邊界上的點是擬合的關鍵點,被稱為支持向量。遞歸特征消除是一個基于貪婪算法的特征選擇框架,可以嵌入到不同的分類器中使用。SVM-RFE算法是RFE 框架嵌入到SVM 分類器中的應用,它在特征選擇的過程中以SVM的權重向量系數(shù)作為特征排序準則,每一步都迭代移除權重系數(shù)最低的特征,再用剩余的特征繼續(xù)訓練,直到選出所需數(shù)量的特征子集。
給定單個學生的特征集合M,M由學生的群體行為特征和個體行為特征組成,即M={m1,m2,m3},mi={xr1,xr2,…,xrn},其中m1是學生群體消費行為、進出圖書館行為、進出宿舍行為中的規(guī)律型行為數(shù)據(jù),m2、m3分別是學生個體消費行為中的活躍型行為數(shù)據(jù)和個體進出圖書館行為中的勤奮型行為數(shù)據(jù),xri表示某一時間各特征的值,n是周期總數(shù)。對于該學生,他的成績加權排名為s,根據(jù)排名可將學生劃分等級y,本文的目的是使用給定的學生特征集合M來預測學生的等級y以完成對學生分類進而進行成績預警。
受大五人格模型啟發(fā),本文重點關注五大人格中的責任程度,提取群體行為中的規(guī)律性特征。原始的消費數(shù)據(jù)包含學號、消費類型、消費地點、消費時間、消費金額等字段,在提取規(guī)律型行為時,本文從消費類型、消費地點、消費時間這三個字段入手進行分析。
對消費類型的記錄總數(shù)和消費地點情況統(tǒng)計可以發(fā)現(xiàn),有消費地點的消費類型有五種,這五種消費類型的記錄總數(shù)如表1所示,考慮到除“POS消費”外其他類型的記錄數(shù)較少,實驗過程僅使用“POS 消費”的數(shù)據(jù)。在此基礎上對各消費地點的記錄總數(shù)統(tǒng)計可得到表2的結果,所以在提取規(guī)律型行為時,消費數(shù)據(jù)中僅考慮記錄總數(shù)最多的五個地點。
表1 各消費類別的記錄總數(shù)Table 1 Total number of records for each consumption category
表2 各消費地點的記錄總數(shù)Table 2 Total number of records for each consumption location
然后對學生在這五個地點的消費時間進行分析,實驗過程中以一個小時為單位進行時間切片,可以得到圖1所示的結果。
圖1 五個地點各個時間段的消費頻數(shù)Fig.1 Consumption frequency of each time period in five locations
校園生活中學生正常作息情況下的消費時段大致相同,由圖1可看出學生各個地點的消費時間呈明顯的聚集狀態(tài),紅色的時間段即消費頻數(shù)高的時間段,本文根據(jù)學生在消費頻數(shù)較多的時段是否有刷卡行為來提取學生行為的規(guī)律性。為了更好地記錄學生的早出晚歸情況,在提取超市這一地點的規(guī)律型行為時,添加了6:00 至9:00 這一時間段來記錄學生的早出情況,在提取校車這一地點的規(guī)律型行為時,添加了20:00至24:00這一時間段來記錄學生的晚歸情況,提取食堂的規(guī)律型行為時同樣考慮了吃早飯較早和吃晚飯較晚這兩個時間段,最終得到各地點的時段數(shù)如表3所示。
表3 各個地點的時段總數(shù)Table 3 Total number of time slots for each location
學生早上抵達圖書館的時間、晚上離開圖書館的時間以及早上離開宿舍的時間往往能反映學生學習的勤奮程度,因此在提取規(guī)律型行為時考慮了到圖書館較早、離開圖書館較晚、離開宿舍較早這三類學生群體。對圖書館門禁數(shù)據(jù)和宿舍門禁數(shù)據(jù)中學生在各個時間段的刷卡頻數(shù)統(tǒng)計可以得到圖2所示的結果。
圖2 門禁數(shù)據(jù)的時段分布情況Fig.2 Time period distribution of access control data
由圖2(a)可以看出,學生早上進出圖書館行為在8:00 至9:00 這個時間段達到極大值,晚上進出圖書館行為在21:00 至22:00 這個時間段達到極大值,所以本文將上午九點之前到達圖書館的學生劃為到圖書館較早的學生群體,晚上九點之后離開圖書館的學生劃為離開圖書館較晚的學生群體。由圖2(b)可以看出,學生上午離開宿舍的時間在8:00至9:00這個時間段達到極大值,所以本文將上午九點之前離開宿舍的學生劃為離開宿舍較早的學生群體。這樣就得到了學生規(guī)律型行為的24個特征。根據(jù)學生所有時間在各個地點各個時間段的刷卡情況可以生成學生的規(guī)律型行為數(shù)據(jù)Fij(1 ≤i≤n,1 ≤j≤24),其中n為周期總數(shù),j是當前特征對應的下標,在周期為天的情況下,若學生有刷卡行為則對應位置置1,否則為0。在周期為周或月的情況下,對應位置的值為當前周期內的頻數(shù)和。
個體行為特征是學生日常行為的體現(xiàn),本文以一個小時為單位進行時間切片對學生的消費數(shù)據(jù)和圖書館門禁數(shù)據(jù)進行分析,旨在從消費數(shù)據(jù)中提取學生的活躍型行為,從圖書館門禁數(shù)據(jù)中提取學生的勤奮型行為。對消費時間的消費時段進行分析發(fā)現(xiàn),學生在24 個時間段均有消費行為,但1:00至6:00這5 h內的數(shù)據(jù)量較少。提取活躍型行為時,為充分提取學生行為的全局特征和局部特征,實驗過程中使用這24 個時間段內的所有數(shù)據(jù),這樣就得到了學生活躍型行為的24 個特征。根據(jù)學生所有時間的消費情況可以生成學生的活躍型行為數(shù)據(jù)Vij(1 ≤i≤n,1 ≤j≤24),其中n是周期總數(shù),j是當天對應時段的下標。
由圖2(a)可以看出進出圖書館行為頻數(shù)較多的時間段有16個,在0:00至7:00、23:00至24:00這8 h內的記錄幾乎沒有,所以在提取勤奮型行為時,為充分提取學生行為的全局特征和局部特征,實驗過程中使用除這8 h外的其他16個時間段內的所有數(shù)據(jù)。這樣就得到了學生勤奮型行為的16 個特征。根據(jù)學生所有時間的進出圖書館情況可以生成學生的勤奮型行為數(shù)據(jù)Lij(1 ≤i≤n,1 ≤j≤16),其中n是周期總數(shù),j是當天對應時段的下標。
考慮到學生寒暑假期間的在校行為數(shù)據(jù)與其他時期相比較少,會造成張量稀疏、增加模型計算量等問題,在進行特征選擇前先將寒暑假期間的數(shù)據(jù)篩除。以周為單位對消費數(shù)據(jù)、圖書館門禁數(shù)據(jù)進行分析可得到圖3所示的結果。
圖3 學生數(shù)據(jù)的周分布情況Fig.3 Weekly distribution of student data
可以看出,學生在一年內的第4周~第8周、第30周~第34周的記錄比較少,在進行后續(xù)操作前需要先將這10周的記錄刪除。
本文使用SVM-RFE算法執(zhí)行特征選擇操作,SVMRFE算法在特征選擇后將給出所有特征的得分排名,排名越小意味著該特征越重要,除此之外還會給出所有特征對應的support_,support_是由true、flase組成的向量,若特征所在位置對應的值為true 則表示該特征被選中??紤]到將學生的三類行為數(shù)據(jù)按周期總數(shù)展開后分別有n×24、n×24、n×16 個特征,其中n為周期總數(shù),在這種情況下,不同時間不同特征的重要性不一定相同。所以在進行特征選擇時,使用support_為true 的所有特征中64 個特征出現(xiàn)的總天數(shù)來判斷特征的重要性。三類行為數(shù)據(jù)特征選擇的結果如圖4所示,篩除出現(xiàn)頻次較少的特征后,最終得到的三類行為數(shù)據(jù)的特征數(shù)分別為21、19、14。
圖4 特征選擇的結果Fig.4 Results of feature selection
本文基于端到端深度學習的方式建立了三元深度融合成績預警模型(ternary deep fusion network,TDFN),該模型由四部分組成,分別是規(guī)律性特征提取模塊、活躍性特征提取模塊、勤奮性特征提取模塊、三元深度融合成績預警模塊,其總體架構如圖5所示。規(guī)律性特征提取模塊使用LSTM 從規(guī)律型行為數(shù)據(jù)中提取群體行為的規(guī)律性特征,活躍性特征提取模塊使用CNN 從活躍型行為數(shù)據(jù)中提取個體行為的活躍性特征,勤奮性特征提取模塊使用CNN從勤奮型行為數(shù)據(jù)中提取個體行為的勤奮性特征,三元深度融合成績預警模塊將得到的規(guī)律性向量、活躍性向量和勤奮性向量拼接,然后使用全連接層基于融合后的三類行為實現(xiàn)一個成績預警模型來對學生分類進而進行成績預警。
圖5 TDFN架構圖Fig.5 Architecture of TDFN
2.2.1 基于群體行為的特征提取
首先要提取群體行為特征,學生在校的群體行為因課程和時間影響呈現(xiàn)天然的規(guī)律性、過程性、周期性,考慮到群體行為的時序特征和LSTM具有長時記憶、能學習長期依賴關系等特點,本文使用LSTM來構建規(guī)律性特征提取模塊,該模塊包含三層:輸入層、LSTM 層、輸出層。輸入層為學生的規(guī)律型行為數(shù)據(jù),記為:
其中,n是周期數(shù),表示第i位學生第t天的規(guī)律型行為數(shù)據(jù),由18個與消費行為相關的特征和3個與進出行為相關的特征組成。
LSTM 層由多個LSTM 單元組成,LSTM 單元的結構如圖6所示,它通過輸入門、遺忘門、輸出門的控制完成特征的存儲與更新。用i、f、o、σ、W、b分別表示輸入門、遺忘門、輸出門、sigmoid函數(shù)、權重矩陣、偏置向量,t時刻各個門的處理過程如下:
圖6 LSTM單元結構Fig.6 Unit structure of LSTM
遺忘門決定學生在t-1 時刻哪些歷史行為特征被遺忘以避免梯度消失和梯度爆炸問題。例如,對學生而言,開學前幾天的行為對成績的影響程度不如期末考試前的行為,學期開始時的部分行為特征就會被遺忘。其計算方式如下:
輸入門控制學生當前時刻多少行為特征被保留,即當前時刻的規(guī)律型行為中有多少會被保存在細胞狀態(tài)。例如,學生在期末考試前經(jīng)常很早到圖書館間接說明了該學生學習較勤奮,他在這段時間到圖書館較早的行為特征就會被保留。其計算方式如下:
在得到新的細胞狀態(tài)向量值C?t后可以更新細胞狀態(tài),更新過程如下:
輸出門控制當前時刻的細胞狀態(tài)Ct中哪些內容將會被輸出,其計算方式如下:
輸出層由隱藏層狀態(tài)組成,它也是學生的規(guī)律性向量rv。
2.2.2 基于個體行為的特征提取
CNN 最早應用在計算機視覺領域,近年來其他領域也有它的影子。它一般由卷積層、池化層、全連接層組成,其中卷積層使用不同的卷積核來提取特征,池化層對卷積層提取到的特征篩選,使用最大池化或平均池化來壓縮特征實現(xiàn)降維,全連接層連接所有特征并輸出。為了充分提取學生個體行為的全局特征和局部特征,本文借助CNN 構建了活躍性特征提取模塊和勤奮性特征提取模塊來分別提取消費行為中的活躍性特征和進出圖書館行為中的勤奮性特征。以活躍性特征提取模塊為例,該模塊包含三層:輸入層、CNN層、全連接層。輸入層為學生的活躍型行為數(shù)據(jù),記為X∈Rt×d。
其中,d是周期數(shù),t是時段數(shù),消費數(shù)據(jù)中t為19。xij表示學生第i天的第j個時間段是否有消費行為,若學生有消費行為,xij為1,反之為0。
CNN層的詳細結構如圖7所示,它使用多個卷積核h∈Re×k來捕獲個體活躍型行為的局部特征,把學生每天在e(e≤t)時間段的刷卡信息連接起來,就形成了一個二維張量記為Vn:n+k-1∈Rt×d,卷積操作的計算方法如下:
圖7 卷積層的詳細結構Fig.7 Detailed structure of convolutional layers
其中,f為激活函數(shù),h是e×k的卷積核,e(e≤t)、k(k≤d)表示窗口大小,*是卷積操作。為了使模型不依賴于初始化權重同時加快模型收斂速度、防止模型過擬合,在卷積后引入了Batchnorm層來歸一化提取到的特征從而在一定程度上突出特征向量間的差異。學生的活躍型行為數(shù)據(jù)X經(jīng)過卷積層處理生成了活躍性特征向量fav。
全連接層以學生卷積后得到的活躍性特征向量fav為輸入,為避免訓練過擬合加入了Dropout 層使節(jié)點間的連接隨機失活,為提高模型的非線性表達能力加入了ReLU激活函數(shù)層,fav經(jīng)過全連接層生成學生的活躍性向量av,即av=MLP(fav)。
勤奮性特征提取模塊和活躍性特征提取模塊的特征提取方式相似,它的輸入為勤奮型行為數(shù)據(jù),輸入層中的t為14。值得注意的是,因為兩個模塊輸入數(shù)據(jù)的尺寸不一致,所以在實驗過程中,它們卷積層步長的值并不一致,全連接層參數(shù)的大小也不一樣。卷積層處理后生成了勤奮性特征向量fdv,全連接層以fdv為輸入最終得到了學生的勤奮性向量dv,即dv=MLP(fdv)。
2.2.3 基于三元深度融合的成績預警
三元深度融合成績預警模塊將規(guī)律性特征提取模塊、活躍性特征提取模塊、勤奮性特征提取模塊輸出的規(guī)律性向量rv、活躍性向量av、勤奮性向量dv以拼接的方式進行融合得到完整的特征向量radv,該過程可形式化表示為:
然后將融合后得到的特征向量radv送入全連接層來預測學生的成績。本文使用兩層全連接網(wǎng)絡來完成分類預測任務,隱藏層間加入了ReLU 激活函數(shù)層和Dropout層以達到更好的訓練效果,然后饋入Softmax層估算學生屬于各類別的概率越高表明學生屬于當前類別的可能性越大,對于不同類別的學生,老師應給予的幫助不同。該過程可形式化表示為:
模型訓練過程中使用交叉熵損失函數(shù),該函數(shù)通過最小化損失值來學習所有參數(shù):
其中,N為訓練集中學生總數(shù),y(i)是學生i的真實排名等級,若學生排名在學院的前80%則y(i)取0,否則取1。
3.1.1 數(shù)據(jù)集
本文使用DataCastle 競賽中的公開數(shù)據(jù)集,數(shù)據(jù)集是學生2013—2014、2014—2015 這兩個學年的原始在校行為數(shù)據(jù),考慮到兩個學年學生行為間存在差異且第二學年學生人數(shù)比第一學年多,本文使用第二學年的學生數(shù)據(jù)展開研究。將第二學年的學生按成績加權排名分為兩類,其中成績排名在后20%的為正樣本,成績排名在前80%的為負樣本,然后將數(shù)據(jù)集按6∶2∶2的比例劃分為訓練集、驗證集、測試集,它們的樣本數(shù)如表4所示。
表4 數(shù)據(jù)集統(tǒng)計結果Table 4 Dataset statistics results
3.1.2 評價指標
考慮到數(shù)據(jù)集中正負樣本不均衡,實驗采用Accuracy(準確率)、Weighted_Precision(加權精確率)、Weighted_Recall(加權召回率)、Weighted_F1(加權F1 指數(shù))四個指標對預測結果進行評估,它們的計算過程如下:
其中,TP、TN 分別為分類正確的正樣本個數(shù)、負樣本個數(shù),F(xiàn)P 為真實標簽為負但預測標簽為正的樣本數(shù),F(xiàn)N 為真實標簽為正但預測標簽為負的樣本數(shù)。TPi、TNi、FPi、FNi是將第i類標簽看作正樣本時得到的各類樣本數(shù),Precisioni、Recalli、F1-scorei是將第i類標簽看作正樣本時得到的精確率、召回率、F1指數(shù),wi表示真實標簽中第i類標簽的占比。考慮到樣本不均衡時使用Accuracy評估模型分類能力時效果不佳,實驗過程中重點關注后三個評價指標的表現(xiàn)。
3.1.3 實驗參數(shù)設置
本實驗使用PyTorch 框架來搭建模型,并在顯存為8 GB、型號為GeForce RTX 3070 的GPU 上加速訓練。在實驗中,對除寒暑假外的295天數(shù)據(jù)編碼生成三類行為數(shù)據(jù),實驗參數(shù)的設置情況如表5所示。
表5 實驗參數(shù)的設置情況Table 5 Setting of experimental parameters
為了驗證本文提出的三元深度融合成績預警模型的預測性能優(yōu)于其他深度學習模型,本文分別選取SPDN模型[19]、GritNet模型[20]和TBCNN[21]模型進行對比實驗。
(1)SPDN 模型:該模型將學生的行為序列分為13周,將網(wǎng)頁瀏覽行為、在線學習行為及行為之間的時間差分別編碼后輸入嵌入層模型轉化為稠密變量,然后使用多源融合CNN 模塊提取周特征表示向量,接著融合周特征表示向量和靜態(tài)特征中的分組、聚類模式后送入BiLSTM 層并將輸出依次饋入全連接層、Softmax 層以估算學生存在學業(yè)風險的概率。本文在對比實驗時選擇當前數(shù)據(jù)集,使用42周學生的行為序列,以消費行為替代網(wǎng)頁瀏覽行為,以進出圖書館行為替代在線學習行為,以學院替代靜態(tài)特征中的分組,去掉靜態(tài)特征中的聚類模式,同時將消費行為、進出圖書館行為、時間差的嵌入維數(shù)設為50,學院的嵌入維數(shù)設為18。
(2)GritNet 模型:該模型以周為單位,將學生觀看講座視頻、測驗回答正確等在線學習行為和對應的時間差分別編碼然后輸入嵌入層轉化為稠密向量接著送入BiLSTM層,在輸出前添加注意力層以關注嵌入序列中最相關的部分,最后將注意力層的輸出順序饋送到全連接層和Softmax層完成最終的畢業(yè)預測。本文在對比實驗時選擇當前數(shù)據(jù)集,使用42周學生的行為序列,融合消費行為和進出圖書館行為替代在線學習行為。
(3)TBCNN模型:該模型以學生一學年的在校行為數(shù)據(jù)為基礎,采用行、列、深度三個維度的卷積和注意力操作來捕捉學生行為的持久性、規(guī)律性和時間分布,并將學生成績預測問題視為top-k排名問題,以保證識別困難學生的準確性。該模型使用的數(shù)據(jù)集與本文使用的數(shù)據(jù)集相同,本文在對比實驗時將學生成績預測問題視為分類問題來進行。
將本文提出的TDFN模型與SPDN模型、GritNet模型和TBCNN 模型在相同的公開數(shù)據(jù)集上進行對比實驗,并使用Accuracy、Weighted_Precision、Weighted_Recall、Weighted_F1 等評價指標來評估這三個模型,實驗結果如表6所示。
表6 對比實驗的結果Table 6 Results of comparative experiments
可以看出,本文提出的模型在加權F1 指數(shù)方面可以達到0.854 2,它的各項指標均高于其他模型,和SPDN相比在加權精確率、加權召回率、加權F1指數(shù)方面分別提升了0.130 8、0.120 1、0.116 3,和GritNet 相比在加權精確率、加權召回率、加權F1 指數(shù)方面分別提升了0.119 1、0.132 5、0.117 2,與TBCNN相比在加權精確率、加權召回率、加權F1 指數(shù)方面提升了0.024 3、0.029 8、0.027 7。以上結果體現(xiàn)了本模型在成績預警時的優(yōu)越性。
考慮到TBCNN 和TDFN 預測性能相近,本節(jié)對其復雜度進一步分析,以FLOPs、參數(shù)量為評價指標,可以得到表7所示的結果。
表7 模型的復雜度分析Table 7 Complexity analysis of model
可以看出,本文提出的TDFN模型訓練過程中的計算量FLOPs遠小于TBCNN模型,能有效地提高模型的效率,但TDFN 模型要訓練的參數(shù)總數(shù)Params 遠大于TBCNN模型。
為了觀察不同參數(shù)值、不同優(yōu)化算法對模型預測性能的影響,本節(jié)將對比分析參數(shù)中不同的Batchsize、不同的學習率、LSTM結構中不同的隱藏層維度以及不同優(yōu)化函數(shù)對模型預測精度的影響。其中,不同Batchsize值、不同學習率、LSTM 結構中不同隱藏層數(shù)量的實驗結果分別如表8~表10所示。
表8 Batchsize對結果的影響分析Table 8 Analysis of impact of batchsize on results
表9 學習率對結果的影響分析Table 9 Analysis of influence of learning rate on results
表10 Hidden_size對結果的影響分析Table 10 Analysis of influence of Hidden_size on result
可以看出,隨著Batchsize的增大,學習率的增大,隱藏層數(shù)量的增多,模型預測時的加權F1 指數(shù)均存在先升后降的趨勢,當Batchsize為128、學習率為0.000 5、隱藏層數(shù)量為128時模型預測性能最佳。
不同優(yōu)化函數(shù)的結果如表11所示。
表11 優(yōu)化函數(shù)對結果的影響分析Table 11 Analysis of influence of optimization function on result
可以看出,優(yōu)化函數(shù)對模型預測精度也有影響,使用Adam優(yōu)化算法時模型預測性能最佳。
為了驗證本文提出的將三類特征分別輸入到三個不同特征提取模塊的有效性,將TDFN模型與只有規(guī)律性特征提取模塊的TDFN_L模型、只有活躍性特征提取模塊的TDFN_C 模型和融合規(guī)律性特征提取模塊和活躍性特征提取模塊的TDFN_LC模型對比來觀察本方法的有效性,其中TDFN_L 模型和TDFN_C 的輸入為F、V、L三類行為數(shù)據(jù)的拼接,即concatenate(F;V;L),然后將結果分別送入各模塊來預測學生成績;TDFN_LC的輸入分別為F、concatenate(V;L),即規(guī)律型行為數(shù)據(jù)輸入到規(guī)律性特征提取模塊、將活躍型行為數(shù)據(jù)和勤奮型行為數(shù)據(jù)拼接后輸入到活躍性特征提取模塊。實驗結果如表12所示。
表12 模塊的重要性分析Table 12 Analysis of importance of modules
通過對比表6中的各評價指標可以看出,將不同類別的行為數(shù)據(jù)輸入到不同的特征提取模塊時模型預測效果最好。即使是活躍型行為數(shù)據(jù)和勤奮型行為數(shù)據(jù),對比TDFN 模型和TDFN_LC 模型的結果發(fā)現(xiàn),使用兩個特征提取模塊進行預測的加權F1指數(shù)會比僅使用一個特征提取模塊進行預測的加權F1指數(shù)高0.011 5。
以FLOPs 和參數(shù)量為評價指標對三個特征提取模型的復雜度進行分析,可以得到表13所示的結果。
表13 模塊的復雜度分析Table 13 Complexity analysis of modules
可以看出,活躍性特征提取模塊的計算量和參數(shù)量均大于其他兩個模塊,以LSTM為基礎構建的規(guī)律性特征提取模塊的復雜度低于以CNN為基礎構建的特征提取模塊,活躍性特征模塊和勤奮性特征提取模塊中全連接層的神經(jīng)元個數(shù)對其復雜度也有影響。
為了進一步確定規(guī)律型行為數(shù)據(jù)、活躍型行為數(shù)據(jù)、勤奮型行為數(shù)據(jù)中哪一類行為數(shù)據(jù)對成績預測預警的影響更大,針對三類行為數(shù)據(jù)分別進行了消融實驗。具體地,將三類行為數(shù)據(jù)分別輸入到規(guī)律性特征提取模塊、活躍性特征提取模塊、勤奮性特征提取模塊作為基準實驗,分別刪除一類行為數(shù)據(jù)及其對應的特征提取模塊,使用Accuracy、Weighted_Precision、Weighted_Recall、Weighted_F1這四個評價指標來觀察這三類行為的重要性。實驗結果如表14所示。
表14 三類行為數(shù)據(jù)的重要性分析Table 14 Analysis of importance of three types of behavioral data
可以看出,當數(shù)據(jù)集中沒有活躍型行為數(shù)據(jù)時,模型預測時的加權F1 指數(shù)由原來的0.854 2 降低到0.799 2,下降了0.055,和不含規(guī)律型行為數(shù)據(jù)或不含勤奮型行為數(shù)據(jù)時的加權F1 指數(shù)相比也下降了0.041 4、0.045 3,這說明活躍型行為數(shù)據(jù)能更好地表現(xiàn)學生行為之間的差異,相較于其他兩類特征,它在模型進行成績預測預警時的作用更大。
活躍型行為數(shù)據(jù)和規(guī)律型行為數(shù)據(jù)中的絕大部分數(shù)據(jù)來自同一個原始數(shù)據(jù)且以上分析發(fā)現(xiàn)活躍型行為數(shù)據(jù)對模型預測性能的影響更大,這表明提取原始數(shù)據(jù)的全局信息和局部信息有利于提高模型預測精度,教育工作者可以通過敦促學生養(yǎng)成良好生活習慣的方式間接影響其全局信息和局部信息,從而影響學生期末時的成績,在進一步提高模型分類預測能力時可以考慮對活躍型行為數(shù)據(jù)中的特征做進一步篩選使其更具代表性。
對三類行為數(shù)據(jù)中0、1 值占比統(tǒng)計可以得到表15所示的結果,可以看出,規(guī)律型行為數(shù)據(jù)、活躍型行為數(shù)據(jù)、勤奮型行為數(shù)據(jù)中的1 值占比分別是14.08%、15.85%、3.84%。
表15 三類數(shù)據(jù)的0、1值占比Table 15 Proportion of 0 and 1 values of three types of data 單位:%
和規(guī)律型行為數(shù)據(jù)中的1值占比相比,勤奮型行為數(shù)據(jù)中1 值占比低10.24 個百分點,但兩者對模型預測精度的影響程度相似,這一方面表明去圖書館這類典型的學習行為對期末成績的影響更大,教育工作者可以安排適量的自習保證學生的學習時間從而影響他們的期末成績,另一方面證明了圖書館門禁數(shù)據(jù)在模型預測過程中的有效性,進一步提高模型預測能力時可以考慮從圖書館門禁數(shù)據(jù)中挖掘更多的信息。
總之,高校學生的學習生活習慣與最終的期末成績密切相關,高校自由環(huán)境下不具備自我規(guī)劃和自我約束能力的學生很容易出現(xiàn)上課期間看視頻打游戲睡覺、選擇課程時投機取巧避重就輕等現(xiàn)象,對于此類學生,教育工作者可以在因材施教的基礎上對其行為進行約束,比如增加課堂互動、安排自習等。
本文針對當前高校在成績預測預警方面的不足,基于高校學生的群體行為和個體行為提出了一個三元深度融合成績預警模型,它將群體行為和個體行為分別輸入到不同的特征提取模塊,然后將提取到的規(guī)律性向量、活躍性向量、勤奮性向量融合,最后基于融合后的特征向量使用全連接層來完成對學生的分類以達到給不同類別學生提供不同學習建議的目的。本文在公開數(shù)據(jù)集上驗證了模型的有效性,實驗結果表明該模型和其他模型相比有更好的分類預測效果,也驗證了三元特征提取模塊的重要性,即將規(guī)律型行為數(shù)據(jù)、活躍型行為數(shù)據(jù)和勤奮型行為數(shù)據(jù)分別輸入到不同的特征提取模塊時模型的預測效果更好。除此之外實驗也證明了活躍型行為對學生成績影響較大,未來工作中可以對這一類行為做進一步的研究。