潘曉君,張佑春
xMOOC是基于MOOC基礎之上讓學生對課堂教學內容能夠有較深入認知的教學模式[1].它的教與學活動主要以微課、討論、作業(yè)等形式的元素構成[2-3].
對比xMOOC,SPOC對于準備申請參加課程學習的學生設置了較高的門檻,只有達到預設條件的學生才被允許進入課程學習.它可以說是MOOC的教學擴展,教師可以在使用xMOOC的同時,對少部分的學生使用SPOC,極大地提高了教學效率[4].
由于xMOOC與SPOC這兩種模式在教學的目標和對象上是互不相同的.為便于開展線上線下混合教學模式,本文將兩種教學模式結合起來,充分發(fā)揮各自的優(yōu)勢,借鑒國內外一些優(yōu)質的在線平臺教學資源,對具有微課、微視頻、習題庫、案例庫、測試庫、作業(yè)等全方位的教學資源進行組建[5-6],設計和搭建了基于xMOOC+SPOC的課程資源平臺.
該平臺充分挖掘優(yōu)勢課程資源,重組教學內容,完善現(xiàn)有優(yōu)秀的教學案例,結合微視頻設計大賽等方式豐富相關的教學資源,進而提高整體的教學效果.搭建的課程資源平臺框架如圖1所示.
圖1 課程資源平臺的構建
本文構建的模型數(shù)據(jù)來源于xMOOC+SPOC平臺采集的學習日志,為了標記學生對知識點的認知情況,將課程學習中的每一節(jié)定義為知識點的粒度,從學生的日常學習和做題情況分析其對知識點的掌握程度,評估其知識水平能力.
為了評估學生的知識水平情況,本文采用最匹配的知識列表進行評定.首先需要定義學生知識水平的兩種端點狀態(tài),分別為1(知識點已掌握)和0(知識點未掌握).將學生的答題列表逐次匹配可能的知識狀態(tài)列表,從中挑選出最佳的匹配,若同時存在兩個或多個知識狀態(tài)列表與學生的答題列表匹配度較高時,則取它們的平均值.這樣學生的知識水平評估值就不只是1和0兩種端點狀態(tài),而是在[0,1]區(qū)間中的值.
為取得學生知識水平的評估值,本文參考了貝葉斯知識跟蹤模型中的初始參數(shù)值,具體參數(shù)描述如表1所示,表中qn和mn分別表示對于第n個題目,學生的答題情況與知識的了解程度.
表1 初始參數(shù)運算
各個參數(shù)的公式運算如下:
邏輯回歸算法是對采集的數(shù)據(jù)進行訓練,用獲取的數(shù)據(jù)樣本分析出它對應的類別[7].邏輯回歸訓練模型對學生的學習態(tài)度的評定需要經過如下幾個步驟,如圖2所示.首先對采集到的數(shù)據(jù)進行前期預處理,接著對數(shù)據(jù)進行特征的提取與挑選,然后就是對模型進行數(shù)據(jù)匹配及訓練操作,最后進行學習狀態(tài)的綜合評價.
圖2 邏輯回歸算法的訓練模型
xMOOC+SPOC平臺采集到的學習數(shù)據(jù)集是最開始的日志記錄,學生學習態(tài)度的行為特征是影響模型訓練結果的關鍵因素.為便于對SPOC平臺采集的數(shù)據(jù)過濾及分析,將學生學習態(tài)度特征集標記為T,如表2所示.
表2 學習態(tài)度特征集T
通過大量的研究發(fā)現(xiàn),學生最近時期的學習行為狀態(tài)最能表現(xiàn)其現(xiàn)實的學習情況,近期的數(shù)據(jù)具有較高的參考價值;前期的學習表現(xiàn)也在某種程度上反映了學生的學習情況,需要將前后期學習情況結合起來考慮.綜合整個學習過程,為了更加客觀地說明這種特性,本文引入了數(shù)學模型中的衰減函數(shù),以學習周為單位,依據(jù)學生多周的學習情況進行合理有效的衰減.具體的衰減函數(shù)定義為:
其中:Lj為第j周課件學習時長;λ為衰減系數(shù);衰減函數(shù)中的輸出Rj為基于衰減函數(shù)的第j周課件學習時長.
為了盡可能客觀反應學生學習的狀態(tài),本文使用當前流行的數(shù)據(jù)分析工具Matlab進行建模,運用多種分類算法進行相關實驗比較.本實驗的數(shù)據(jù)是采集于學校2020級計算機網(wǎng)絡課程的學習數(shù)據(jù).
本實驗運用的是交叉驗證方式,每次進行集中訓練的人數(shù)為200,選擇測試的數(shù)目為50.利用交叉訓練獲得模型參數(shù),以便運算出正樣本、負樣本,以及準確率.
實訓數(shù)據(jù)集依據(jù)學生學習課程的時長、參加討論互動,以及作業(yè)的完成情況等評價指標按照一定比例設置.學生學習狀態(tài)的特征集是分類器特征空間的輸入數(shù)據(jù),學生學習標簽是分類器標記的輸入.
為了更加精準地描述學生的學習狀態(tài),本文使用衰減函數(shù)定義學生的學習情況,衰減系數(shù)設置在0到0.6范圍內.在本模型中,當模型參數(shù)設定為0.6時得到的準確率是最高的,最能客觀反應學生的學習狀態(tài).
Matlab中有很多不同的分類算法,這些算法對應于不同的特征訓練集.本文采用的是交叉驗證的方法,將隨機森林算法、樸素貝葉斯、KNN分類算法及AdaBoost分類算法與邏輯回歸算法進行相互比較,實驗結果如表3所示,邏輯回歸算法在這些算法中準確率最高,性能表現(xiàn)最好.
表3 分類器算法準確率比較
本實驗將學生的學習態(tài)度標記為兩大類:積極與不積極;將常用的幾種分類算法召回率、F度量值、準確率等重要反應指標進行對比,結果如表4所示,結果顯示邏輯回歸算法的F度量值是最好的,對學生學習態(tài)度的誤判率是最低的.
表4 分類器算法性能指標比較
如圖3所示,邏輯回歸算法相對于其他幾種分類器,能夠較準確地預估學生學習態(tài)度是否積極,精準率較高.
圖3 準確率隨著學習周數(shù)的變化圖
在SPOC平臺下,本文通過對基于xMOOC的“計算機網(wǎng)絡”課程進行教學改革研究,運用相關的分類算法設置參數(shù),定義學習狀態(tài)特征,建立了基于xMOOC+SPOC的計算機網(wǎng)絡課程邏輯回歸模型,對采集的數(shù)據(jù)進行模式匹配及訓練.實踐證明,該模型對學生總體的學習狀態(tài)與對相關知識的掌握情況有很好的評估能力,能夠較好地監(jiān)督學生的整個學習過程,為課程的網(wǎng)絡化教學提供了個性化的技術指導.