劉 桐 顧小清
(華東師范大學(xué) 教育學(xué)部教育信息技術(shù)學(xué)系,上海 200062)
自下向上以數(shù)據(jù)驅(qū)動(dòng)的形式理解學(xué)習(xí)現(xiàn)象,解讀學(xué)習(xí)發(fā)生機(jī)理,從而連接以人為中心的學(xué)習(xí)設(shè)計(jì),是當(dāng)前技術(shù)賦能學(xué)習(xí)的核心議題,也是學(xué)習(xí)分析技術(shù)的未來走向(顧小清等,2020)。退學(xué)是線下學(xué)習(xí)失敗的主要表現(xiàn)(Ajjawi et al.,2020)。然而,隨著學(xué)習(xí)形式的不斷進(jìn)化,研究者認(rèn)識到,在線學(xué)習(xí)情境中,退出某門課程學(xué)習(xí)也是一種學(xué)習(xí)失敗,并指出學(xué)習(xí)倦怠、學(xué)習(xí)抱怨、學(xué)業(yè)情緒等可作為預(yù)測學(xué)習(xí)失敗的重要指標(biāo)(Jones & Rienties,2022)。由于在線學(xué)習(xí)的自愿性與靈活度強(qiáng),隨著受眾群體逐步擴(kuò)大,退課現(xiàn)象日益嚴(yán)重。據(jù)統(tǒng)計(jì),edX 在線學(xué)習(xí)平臺的課程結(jié)業(yè)率只有5%,學(xué)堂在線平臺的課程結(jié)業(yè)率也僅有4.5%(Feng et al.,2019)。因此,探明在線學(xué)習(xí)退課發(fā)生的原因具有重要的現(xiàn)實(shí)意義(Lee & Choi,2011;Jin,2020;Chaker & Bachelet,2020)。
諸多學(xué)者圍繞學(xué)習(xí)者退課現(xiàn)象開展研究。常李艷等(2021)使用文獻(xiàn)分析方法,發(fā)現(xiàn)學(xué)習(xí)者個(gè)人、課程以及社會(huì)環(huán)境因素是造成學(xué)習(xí)者退課的重要影響因素。休和張永森(Hew & Cheung,2014)使用問卷調(diào)查方法,發(fā)現(xiàn)擴(kuò)展知識面、滿足好奇心和個(gè)人挑戰(zhàn)等是學(xué)習(xí)者參加在線課程學(xué)習(xí)的主要驅(qū)動(dòng)力,而獲取結(jié)業(yè)證書不是多數(shù)學(xué)習(xí)者的最初目標(biāo)。然而,以上研究大多采用傳統(tǒng)的社會(huì)學(xué)方法,存在一定主觀性。隨著學(xué)習(xí)過程數(shù)據(jù)的積累以及智能技術(shù)的發(fā)展,學(xué)習(xí)路徑分析技術(shù)可逐步彌補(bǔ)傳統(tǒng)方法的不足。有學(xué)者從細(xì)粒度數(shù)據(jù)層面,通過專家知識與真實(shí)數(shù)據(jù)雙驅(qū)動(dòng)的形式,使用集成學(xué)習(xí)方法(Narayanasamy & El?i,2020)、深度學(xué)習(xí)方法(Yin et al.,2020)等知識發(fā)現(xiàn)技術(shù),尋找學(xué)習(xí)者在線學(xué)習(xí)的行為模式與規(guī)律。
在此背景下,本研究考慮在線課程參與形式自由化、課程內(nèi)容碎片化、學(xué)習(xí)時(shí)間靈活化等特點(diǎn),利用細(xì)粒度學(xué)習(xí)數(shù)據(jù),綜合使用數(shù)據(jù)挖掘算法與工具,從時(shí)域角度建模學(xué)習(xí)者退課過程,動(dòng)態(tài)捕捉學(xué)習(xí)路徑的狀態(tài)變化,解析學(xué)習(xí)者退課的行為特征和規(guī)律,為理解學(xué)習(xí)失敗提供事實(shí)依據(jù)。
分析學(xué)習(xí)路徑的動(dòng)態(tài)演變是理解學(xué)習(xí)失敗的切入點(diǎn)。通過查找近三年有關(guān)“學(xué)習(xí)路徑”的國內(nèi)外文獻(xiàn)發(fā)現(xiàn),當(dāng)前研究主要聚焦于學(xué)習(xí)路徑頂層設(shè)計(jì)、學(xué)習(xí)路徑模式發(fā)現(xiàn)和學(xué)習(xí)路徑自動(dòng)生成。
學(xué)習(xí)路徑的頂層設(shè)計(jì)在理論層面探討“應(yīng)然”問題。鐘紹春(2020)提出,以教學(xué)目標(biāo)為邏輯起點(diǎn),以學(xué)科知識和能力圖譜為核心,通過篩選學(xué)生群體的特點(diǎn),提供選擇數(shù)量少、覆蓋度高的路徑集。唐燁偉等(2019)設(shè)計(jì)了基于學(xué)習(xí)者畫像的精準(zhǔn)個(gè)性化學(xué)習(xí)路徑規(guī)劃框架,通過分析學(xué)習(xí)結(jié)果,為學(xué)習(xí)者提供針對其個(gè)性學(xué)習(xí)需求、學(xué)習(xí)內(nèi)容和學(xué)習(xí)活動(dòng)。
行為模式挖掘關(guān)注學(xué)習(xí)活動(dòng)的自組織過程。樂惠驍?shù)龋?019)利用優(yōu)秀慕課學(xué)習(xí)者的平臺記錄數(shù)據(jù),挖掘其學(xué)習(xí)序列長度、行為共現(xiàn)等方面的行為模式及其差異。模式識別、機(jī)器學(xué)習(xí)等智能算法也被用于學(xué)習(xí)行為挖掘。有學(xué)者使用層次聚類方法,發(fā)現(xiàn)學(xué)習(xí)者在線游戲?qū)W習(xí)環(huán)境的行為路徑模式,并與最終學(xué)習(xí)結(jié)果進(jìn)行關(guān)聯(lián)挖掘(Feng & Yamada,2021)。也有學(xué)者基于學(xué)習(xí)者參與討論、訪問課程資源以及登錄時(shí)間等行為序列數(shù)據(jù),使用主成分分析算法降低數(shù)據(jù)維度,提取數(shù)據(jù)特征,再利用貝葉斯網(wǎng)絡(luò)與決策樹算法,預(yù)測和預(yù)警學(xué)習(xí)者退課(Xing et al.,2016)。
學(xué)習(xí)路徑自動(dòng)生成是個(gè)性化路徑推薦的主要途徑。任維武等(2020)通過引入“契合度”概念,提出基于強(qiáng)化學(xué)習(xí)方法的自適應(yīng)學(xué)習(xí)路徑生成機(jī)制,實(shí)現(xiàn)學(xué)習(xí)者與學(xué)習(xí)資源之間的合理匹配。李振等(2019)通過先驗(yàn)知識子圖生成、學(xué)習(xí)目標(biāo)子圖生成和學(xué)習(xí)路徑生成與優(yōu)化三個(gè)步驟,輸出覆蓋學(xué)習(xí)目標(biāo)的知識元學(xué)習(xí)序列。高嘉騏等(2021)基于知識圖譜,通過評估學(xué)習(xí)者狀態(tài),提出學(xué)習(xí)路徑自動(dòng)生成方法。吳東山等(Son et al.,2021)使用遺傳算法和蟻群優(yōu)化算法等元啟發(fā)式算法,生成符合學(xué)習(xí)者學(xué)習(xí)背景和學(xué)習(xí)目標(biāo)的學(xué)習(xí)路徑,解決“信息迷航”等問題。
可見,學(xué)術(shù)界對學(xué)習(xí)路徑的內(nèi)涵存在兩種理解:一是學(xué)習(xí)路徑是已然存在的先驗(yàn)預(yù)設(shè)。此種觀點(diǎn)將學(xué)習(xí)路徑等同于知識關(guān)聯(lián),認(rèn)為依賴于知識之間的層級、包含與被包含等邏輯關(guān)系,通過差異化的知識點(diǎn)、概念、資源等聯(lián)結(jié)方式形成的結(jié)構(gòu)化序列,就是學(xué)習(xí)路徑。肖奎等(2018)認(rèn)為,學(xué)習(xí)路徑是從起始節(jié)點(diǎn)(知識基礎(chǔ))到達(dá)目標(biāo)節(jié)點(diǎn)(學(xué)習(xí)目標(biāo))的過程。二是學(xué)習(xí)路徑是學(xué)習(xí)者的行為軌跡。此種觀點(diǎn)認(rèn)為學(xué)習(xí)路徑是學(xué)習(xí)過程的客觀行為記錄,它隨著學(xué)習(xí)主體所處情境、行為習(xí)慣以及學(xué)習(xí)任務(wù)的差異而呈現(xiàn)不同樣態(tài),構(gòu)建過程也極具生成性。詹森等(Janssen et al.,2008)認(rèn)為學(xué)習(xí)路徑是學(xué)習(xí)者達(dá)成學(xué)習(xí)目標(biāo)的一系列行為操作。
以上兩種理解存在本質(zhì)差異,前者秉持學(xué)習(xí)路徑是嚴(yán)謹(jǐn)完備的專家知識體系子集的觀點(diǎn),后者認(rèn)為學(xué)習(xí)路徑是學(xué)習(xí)者學(xué)習(xí)過程的外顯行為表現(xiàn)軌跡。相較而言,行為軌跡更加契合學(xué)習(xí)分析技術(shù)方法。本研究將學(xué)習(xí)路徑定義為:學(xué)習(xí)者與學(xué)習(xí)資源交互過程中生成的行為序列,在數(shù)據(jù)層面具有細(xì)粒度、生成性、可計(jì)算等特點(diǎn),同時(shí)具有時(shí)序化、網(wǎng)絡(luò)化特征。
綜上,分析挖掘?qū)W習(xí)路徑以及終點(diǎn)事件的生成過程是當(dāng)前研究的熱點(diǎn),但較多研究僅利用學(xué)習(xí)成績對學(xué)習(xí)者群體做簡要?jiǎng)澐?,并依此為分析依?jù),難免會(huì)忽視學(xué)習(xí)者的學(xué)習(xí)動(dòng)機(jī)、學(xué)習(xí)方式以及學(xué)習(xí)習(xí)慣等方面的多樣性,為理解學(xué)習(xí)失敗帶來認(rèn)知偏差。因此,本研究依照從下向上的思路,從細(xì)粒度數(shù)據(jù)中挖掘?qū)W習(xí)者的不同群體,分析不同群體的內(nèi)在模式規(guī)律,從另一個(gè)角度理解學(xué)習(xí)失敗。
如何從學(xué)習(xí)者的過程性數(shù)據(jù)中識別并提取合理且可解釋的模式與特征,是本研究的核心問題,具體包括:
1)如何提取退課學(xué)習(xí)者群體的行為特征?換言之,從學(xué)習(xí)路徑差異的角度,使用何種方法鑒別退課學(xué)習(xí)者的類型?
2)不同類型學(xué)習(xí)者的學(xué)習(xí)路徑有何差異?不同類型學(xué)習(xí)者群體之間的行為模式以及行為差異是什么?造成差異的原因是什么?
本研究調(diào)取了學(xué)堂在線平臺“心理學(xué)概論”課程的數(shù)據(jù)倉庫,涉及選課用戶的視頻操作和交流討論等學(xué)習(xí)活動(dòng)的162 996 條數(shù)據(jù)記錄(Yu et al.,2020),涵蓋1 634 名學(xué)生(退課學(xué)生1 303 名,未退課學(xué)生331 名,退課率為79.4%)。本研究主要使用四個(gè)數(shù)據(jù)字段,分別是學(xué)習(xí)者ID、學(xué)習(xí)行為(如查看問題、點(diǎn)擊視頻、回復(fù)討論等)、學(xué)習(xí)資源ID(如視頻資源、發(fā)布問題、參與討論等)和系統(tǒng)時(shí)間戳。
本研究首先利用學(xué)習(xí)者是否退課的標(biāo)簽數(shù)據(jù),區(qū)分退課與未退課學(xué)習(xí)者,劃分退課學(xué)習(xí)數(shù)據(jù)集與未退課學(xué)習(xí)數(shù)據(jù)集;其次,截取學(xué)習(xí)者ID 列表、學(xué)習(xí)資源ID 列表和學(xué)習(xí)者操作行為列表,形成退課和未退課學(xué)習(xí)者的行為數(shù)據(jù)集,并通過數(shù)據(jù)清洗和索引編碼處理,形成數(shù)值化的行為編碼序列,由此表示學(xué)習(xí)路徑;再次,計(jì)算學(xué)習(xí)路徑相似度,構(gòu)建學(xué)習(xí)路徑相似度矩陣,作為聚類算法的輸入,發(fā)現(xiàn)不同類型的退課學(xué)習(xí)者群體;最后,比較不同類型退課學(xué)習(xí)者群體與未退課學(xué)習(xí)者群體在學(xué)習(xí)路徑圖拓?fù)鋮?shù)與行為模式等方面的差異(見圖1)。
圖1 研究技術(shù)路線
1.學(xué)習(xí)路徑編碼。本研究使用索引編碼方法處理學(xué)習(xí)路徑數(shù)據(jù)。具言之,本研究利用資源ID與具體行為(如暫停、播放、快進(jìn)、關(guān)閉等),作為學(xué)習(xí)路徑節(jié)點(diǎn)的索引依據(jù),保證每個(gè)資源的操作行為都具有獨(dú)立的編碼。例如,學(xué)習(xí)路徑編碼為[1,17,20,9,11,21],“1”表示加載A 視頻,“17”表示暫停A 視頻,“9”表示加載B 視頻,“11”表示關(guān)閉B 視頻。
2.學(xué)習(xí)路徑相似度計(jì)算。群體特征挖掘的主要難點(diǎn)在于如何基于學(xué)習(xí)路徑差異,從群體中發(fā)現(xiàn)相似的個(gè)體。因此,如何計(jì)算不同學(xué)習(xí)者路徑之間的相似度成為首要解決的技術(shù)問題。由于學(xué)習(xí)者路徑呈現(xiàn)離散化、時(shí)域難以對齊等問題,無法直接計(jì)算學(xué)習(xí)路徑的空間距離,因此本研究使用動(dòng)態(tài)時(shí)間規(guī)劃算法計(jì)算學(xué)習(xí)路徑之間的相似度。計(jì)算方法見公式(1)。動(dòng)態(tài)時(shí)間規(guī)劃算法的目標(biāo)是通過離散序列數(shù)據(jù)點(diǎn)距離計(jì)算方法,按次序求解兩個(gè)序列的點(diǎn)間距離,計(jì)算構(gòu)建點(diǎn)距離矩陣,并在矩陣中找到經(jīng)過的元素值和最小路徑,使得最終累積距離最小。累積距離就是兩條學(xué)習(xí)路徑的相似度。
3.基于路徑相似度的聚類計(jì)算。學(xué)習(xí)路徑由學(xué)習(xí)資源串聯(lián)而成,隨學(xué)習(xí)進(jìn)程逐步呈現(xiàn)有向無環(huán)圖的特征。本研究使用基于圖論的譜聚類方法獲取不同類別的學(xué)習(xí)者群體。與K-Means 等算法相比,譜聚類方法對數(shù)據(jù)分布的適應(yīng)性更強(qiáng),計(jì)算量較小,也易于實(shí)現(xiàn)。同時(shí),為了衡量聚類效果與可信度,本研究選取方差比標(biāo)準(zhǔn)作為聚類效果的度量衡,該標(biāo)準(zhǔn)通過計(jì)算聚類簇的組內(nèi)聚合度和組間分散度之間的比值,衡量聚類簇之間的距離與差異,從而得到不同聚類群體,計(jì)算方法見公式(2)。
其中,k 代表聚類類別數(shù),N 代表數(shù)據(jù)數(shù)目,Tr(Bk)代表組內(nèi)協(xié)方差,Tr(Wk)代表組內(nèi)協(xié)方差。該分值越大,說明聚類效果越好。
4.基于圖拓?fù)鋮?shù)的學(xué)習(xí)路徑差異比較。為進(jìn)一步解釋聚類結(jié)果的教育意義,基于學(xué)習(xí)路徑的圖特征,研究選取五個(gè)圖的拓?fù)鋮?shù)指標(biāo),比較學(xué)習(xí)路徑差異:1)平均路徑長度,指學(xué)習(xí)路徑總長度的平均值;2)平均邊長度,指學(xué)習(xí)路徑中連接任意兩個(gè)節(jié)點(diǎn)之間最短路徑的平均值;3)平均聚集系數(shù),指評估學(xué)習(xí)路徑中節(jié)點(diǎn)的聚集程度;4)平均邊長度/平均聚集系數(shù),指平均邊長度與平均聚集系數(shù)的比值,評估學(xué)習(xí)路徑是否具有小世界網(wǎng)絡(luò)的特征;5)特征向量中心度,用于評估學(xué)習(xí)路徑中節(jié)點(diǎn)的重要程度。
5.基于步長矩陣的行為模式差異比較。行為模式用于發(fā)現(xiàn)學(xué)習(xí)者操作之間的相關(guān)性與關(guān)聯(lián)關(guān)系,區(qū)別于聚合統(tǒng)計(jì)后的概率計(jì)算。本研究選取步長矩陣作為學(xué)習(xí)者行為模式發(fā)現(xiàn)的工具,通過計(jì)算獨(dú)立路徑點(diǎn)的行為發(fā)生概率,在細(xì)粒度層面預(yù)測學(xué)習(xí)者的具體操作,從而得出學(xué)習(xí)者行為轉(zhuǎn)換規(guī)律,并結(jié)合數(shù)據(jù)可視化方法,直觀地發(fā)現(xiàn)行為模式及差異。
研究問題一聚焦鑒別不同類型的退課學(xué)習(xí)者。如上文所述,行為序列的距離度量方式會(huì)影響學(xué)習(xí)路徑相似度結(jié)果,聚類簇?cái)?shù)量是影響最終聚類效果的重要參數(shù)。因此,在相似度計(jì)算時(shí),本研究選取三個(gè)常用的距離計(jì)算方式,包括歐氏距離、漢明距離、L1 距離;在譜聚類計(jì)算中,選擇2、3、4 三個(gè)聚類簇?cái)?shù)量作為聚類算法的超參數(shù)候選集合,進(jìn)行綜合計(jì)算和對比實(shí)驗(yàn)。
數(shù)據(jù)清洗、編碼、相似度計(jì)算和聚類計(jì)算均使用Python 數(shù)據(jù)處理腳本,對比實(shí)驗(yàn)結(jié)果見表一??梢钥闯?,在漢明距離和兩個(gè)聚類簇的參數(shù)下,聚類的方差比分?jǐn)?shù)最高(1 032.52),說明在此參數(shù)下聚類效果最好。經(jīng)過進(jìn)一步分割計(jì)算,本研究發(fā)現(xiàn)退課學(xué)習(xí)者群體中存在兩個(gè)聚類群體,分別有1 101人和199 人。
表一 不同超參數(shù)的聚類度量結(jié)果
研究問題二聚焦于在鑒別不同類型學(xué)習(xí)者群體后,從教育意義層面比較學(xué)習(xí)者的群體差異。綜合考慮未退課學(xué)習(xí)者與兩類退課學(xué)習(xí)者,本研究利用圖拓?fù)鋮?shù)與行為步長矩陣,分別比較探析學(xué)習(xí)路徑的圖特征差異和學(xué)習(xí)行為模式差異。
1. 基于圖拓?fù)鋮?shù)的學(xué)習(xí)路徑差異比較
1)學(xué)習(xí)路徑投入度。學(xué)習(xí)者平均學(xué)習(xí)路徑長度指學(xué)習(xí)者行為操作長度的平均值,一定程度上表示學(xué)習(xí)者與學(xué)習(xí)資源之間交互的次數(shù),更能反映學(xué)習(xí)者在線學(xué)習(xí)的投入程度。結(jié)合表中數(shù)據(jù)可以發(fā)現(xiàn),三類學(xué)習(xí)者的平均學(xué)習(xí)路徑長度分別是21.41、172.37 和293.14。與退課學(xué)習(xí)者相比,未退課學(xué)習(xí)者的平均學(xué)習(xí)路徑長度顯著長于退課學(xué)習(xí)者,說明未退課學(xué)習(xí)者投入時(shí)間更多,與學(xué)習(xí)資源的交互頻次更長。退課學(xué)習(xí)者中,類別1 退課學(xué)習(xí)者的平均學(xué)習(xí)路徑長度最短,類別2 退課學(xué)習(xí)者的平均學(xué)習(xí)路徑長度明顯長于類別1 退課學(xué)習(xí)者。由此可見,退課學(xué)習(xí)者的學(xué)習(xí)路徑差異仍較大。
2)學(xué)習(xí)路徑穩(wěn)定度。平均邊長度一般用來評估網(wǎng)絡(luò)中兩節(jié)點(diǎn)之間的距離,能夠體現(xiàn)網(wǎng)絡(luò)節(jié)點(diǎn)的聯(lián)通性。例如,六度分隔理論體現(xiàn)了人際社會(huì)的“弱紐帶”性質(zhì)。本研究的三類學(xué)習(xí)者的平均邊長度分別為2.379、2.184 和6.454??梢?,兩類退課學(xué)習(xí)者的邊長度都短于未退課學(xué)習(xí)者。學(xué)習(xí)路徑節(jié)點(diǎn)由學(xué)習(xí)資源構(gòu)成,連接邊由操作行為構(gòu)成,平均邊長度代表學(xué)習(xí)者在不同學(xué)習(xí)資源之間轉(zhuǎn)換時(shí)所執(zhí)行的操作次數(shù)。與未退課學(xué)習(xí)者相比,退課學(xué)習(xí)者在不同學(xué)習(xí)資源之間的切換頻率更高,單一資源使用的持續(xù)時(shí)間較短。值得一提的是,結(jié)合平均學(xué)習(xí)路徑長度,本研究推斷類別1 退課學(xué)習(xí)者資源使用數(shù)量低于未退課學(xué)習(xí)者與類別2 退課學(xué)習(xí)者。
3)學(xué)習(xí)路徑聚集度。平均聚類系數(shù)用于描述網(wǎng)絡(luò)中頂點(diǎn)之間結(jié)集成團(tuán)程度,發(fā)現(xiàn)圖結(jié)構(gòu)中的小集團(tuán)。本研究中,三類學(xué)習(xí)者的平均聚集系數(shù)為0.545、0.622 和0.284。由此可見,類別2 退課學(xué)習(xí)者的學(xué)習(xí)路徑聚集系數(shù)較高,未退課學(xué)習(xí)者的學(xué)習(xí)路徑聚集系數(shù)最低。結(jié)合前兩個(gè)圖的拓?fù)鋮?shù),本研究發(fā)現(xiàn),類別1 退課學(xué)習(xí)者由于投入的時(shí)間較少,利用資源較少,勢必會(huì)出現(xiàn)高聚集性,而類別2 退課學(xué)習(xí)者雖然投入的時(shí)間較多,但只利用局部有限的課程學(xué)習(xí)資源,缺少與其它可用資源交互,導(dǎo)致學(xué)習(xí)路徑呈現(xiàn)較高聚集性。
4)學(xué)習(xí)路徑均衡度。平均聚類系數(shù)與平均邊長度通常被同時(shí)考慮,用來判斷網(wǎng)絡(luò)是否具有小世界網(wǎng)絡(luò)特征。小世界網(wǎng)絡(luò)最早由沃茨和斯特羅加茨在1998 年提出,通常意指網(wǎng)絡(luò)中包含節(jié)點(diǎn)集團(tuán)和近距離網(wǎng)絡(luò),同時(shí)子網(wǎng)絡(luò)中大部分節(jié)點(diǎn)之間都具有連接,因此,小世界具有高平均聚類系數(shù)和低平均邊長度的特征(Watts & Strogatz,1998)。三類學(xué)習(xí)者平均聚類系數(shù)與平均邊長度的比值分別是4.365、3.511 和22.725(見表二)。結(jié)合小世界網(wǎng)絡(luò)的屬性,相較于未退課學(xué)習(xí)者,類別2 退課學(xué)習(xí)者的學(xué)習(xí)路徑更具小世界網(wǎng)絡(luò)特征。結(jié)合前三個(gè)圖的拓?fù)鋮?shù)結(jié)果,本研究從兩方面理解此現(xiàn)象:一方面,類別2 退課的學(xué)習(xí)路徑具有小世界網(wǎng)絡(luò)特征,此類學(xué)習(xí)者可能面臨“信息迷航”,學(xué)習(xí)內(nèi)容與活動(dòng)形式較為局限,難以找到可進(jìn)一步利用的課程學(xué)習(xí)資源,由此導(dǎo)致退課行為的發(fā)生;另一方面,此類學(xué)習(xí)者的自主學(xué)習(xí)目的可能更強(qiáng),在深入學(xué)習(xí)所需資源后難以達(dá)到目的,便退出了課程。
5)學(xué)習(xí)路徑重要度。特征向量中心度通過迭代計(jì)算某一節(jié)點(diǎn)與相鄰節(jié)點(diǎn)的中心性分?jǐn)?shù),從而體現(xiàn)此學(xué)習(xí)路徑節(jié)點(diǎn)的重要程度。特征向量中心度為非負(fù)值,數(shù)值越大代表節(jié)點(diǎn)的重要程度越高。結(jié)合圖2 可知,三類學(xué)習(xí)路徑節(jié)點(diǎn)特征向量值分布在0.1 與0.27 之間,與未退課學(xué)習(xí)者相比,退課學(xué)習(xí)者的特征值上限較高,未退課學(xué)習(xí)者的特征節(jié)點(diǎn)數(shù)量多于類別2 退課學(xué)習(xí)者,且遠(yuǎn)多于類別1 退課學(xué)習(xí)者;與未退課學(xué)習(xí)者相比,類別2 退課學(xué)習(xí)者的高特征向量值分布較平均,未退課學(xué)習(xí)者的高特征向量值分布較集中,處于0.15 與0.18 之間,說明大部分學(xué)習(xí)資源在后兩種學(xué)習(xí)者學(xué)習(xí)過程中具有較高的重要性。但由于類別2 退課學(xué)習(xí)者與未退課學(xué)習(xí)者的特征值分布出現(xiàn)了兩級分化的特征,部分資源的特征值接近于0,說明存在部分重要性較低的學(xué)習(xí)資源。
表二 不同類型學(xué)習(xí)者學(xué)習(xí)路徑圖拓?fù)鋮?shù)
2. 基于步長矩陣的行為模式差異比較
行為步長矩陣(behavior steps matrix)用于計(jì)算每步中出現(xiàn)不同學(xué)習(xí)行為的概率,借此解釋學(xué)習(xí)者每步操作中傾向于使用的資源。鑒于每類學(xué)習(xí)者的平均學(xué)習(xí)路徑長度存在差異,本研究利用可視化方法呈現(xiàn)行為步長矩陣,用顏色深淺代表行為發(fā)生概率的高低,由此發(fā)現(xiàn)三種學(xué)習(xí)者行為模式(見圖3)。
1)類別1 退課學(xué)習(xí)者注重課程體驗(yàn)。在完成約50 步操作行為后,大部分這類退課學(xué)習(xí)者就結(jié)束了課程學(xué)習(xí),且學(xué)習(xí)過程以加載視頻、播放視頻、暫停視頻等行為操作為主。類別1 退課學(xué)習(xí)者的平均學(xué)習(xí)路徑長度最短,接觸的學(xué)習(xí)資源也較少,側(cè)重于課程內(nèi)容體驗(yàn)。例如,在觀看課程視頻介紹或少部分課程視頻后,“體驗(yàn)型”學(xué)習(xí)者可能發(fā)現(xiàn)課程內(nèi)容不符合他們的預(yù)期,或未產(chǎn)生繼續(xù)學(xué)習(xí)的興趣,就轉(zhuǎn)學(xué)其它在線課程。大部分退課學(xué)習(xí)者屬于此類型(占85%)。
2)三類學(xué)習(xí)者存在相似的行為操作模式。他們都側(cè)重視頻操作交互行為,這與在線課程設(shè)計(jì)本身有極強(qiáng)的相關(guān)性,因?yàn)楫?dāng)前在線課程多以視頻為主。同時(shí),討論區(qū)的發(fā)帖、回帖、回答學(xué)習(xí)問題、檢查學(xué)習(xí)問題正誤等操作也出現(xiàn)在學(xué)習(xí)者學(xué)習(xí)路徑中,但占比較少。而在視頻交互操作行為中,類別1 退課學(xué)習(xí)者較多采用“加載視頻—播放視頻—暫停視頻”的行為模式,類別2 退課學(xué)習(xí)者與未退課學(xué)習(xí)者較多采用“加載視頻—播放視頻—暫停視頻—回答問題—檢查問題答案正誤—播放視頻”等連續(xù)學(xué)習(xí)的行為模式。
3)類別2 退課學(xué)習(xí)者的學(xué)習(xí)路徑缺少社會(huì)性學(xué)習(xí)行為。雖然類別2 退課學(xué)習(xí)者的學(xué)習(xí)行為模式具有較連續(xù)性的特征,但最終還是未完成課程內(nèi)容的學(xué)習(xí)(見圖3)。未退課學(xué)習(xí)者參與發(fā)帖、回帖等社交行為操作較多,類別2 退課學(xué)習(xí)者的行為操作多發(fā)生于視頻交互操作、課程問題回答等可獨(dú)立完成的學(xué)習(xí)情景中,屬于“孤立型”學(xué)習(xí)者。由此可見,此類學(xué)習(xí)者一方面缺少主動(dòng)求助、分享等行為,另一方面因?yàn)檩^少參與課程討論,因此獲得同伴或助教的支持也會(huì)減少。
通過引入“學(xué)習(xí)路徑相似度”概念,本研究基于在線課程學(xué)習(xí)者的行為數(shù)據(jù)、利用時(shí)間動(dòng)態(tài)規(guī)劃算法和譜聚類算法,發(fā)現(xiàn)退課學(xué)習(xí)群體存在“體驗(yàn)型”與“孤立型”兩類學(xué)習(xí)者。為解釋聚類結(jié)果的教育意義,本研究綜合考慮上述兩類退課學(xué)習(xí)群體和未退課學(xué)習(xí)者,從學(xué)習(xí)路徑平均長度、穩(wěn)定度、聚集度、均衡度和重要度五方面比較,發(fā)現(xiàn)退課學(xué)習(xí)者的學(xué)習(xí)投入較低,聚集性較高,且存在內(nèi)部差異,“孤立型”學(xué)習(xí)者的學(xué)習(xí)路徑更具小世界網(wǎng)絡(luò)特征。整體來看,退課學(xué)習(xí)者在利用資源和學(xué)習(xí)主動(dòng)性方面與未退課學(xué)習(xí)者存在較大差異。借助行為步長矩陣,本研究發(fā)現(xiàn)三類學(xué)習(xí)者存在類似的視頻交互行為,“體驗(yàn)型”學(xué)習(xí)者存在課程甄選行為,“孤立型”學(xué)習(xí)者缺少社會(huì)性交互學(xué)習(xí)行為。
圖2 三類學(xué)習(xí)者學(xué)習(xí)路徑特征向量中心度分布
與傳統(tǒng)學(xué)習(xí)失敗研究方法不同,本研究依照從下向上的思路,利用學(xué)習(xí)過程數(shù)據(jù)記錄,挖掘分析退課行為的群體特征與模式,為理解學(xué)習(xí)失敗提供新的研究視角。具言之,傳統(tǒng)研究方法大多采用自我報(bào)告或社會(huì)調(diào)查的方法,是從上向下的設(shè)計(jì)思路,少部分行為分析研究利用計(jì)數(shù)的方式,統(tǒng)計(jì)學(xué)習(xí)過程中的行為轉(zhuǎn)換關(guān)系,未能有效利用過程性的行為信息。本研究使用動(dòng)態(tài)時(shí)間規(guī)劃算法和譜聚類算法,不僅考慮學(xué)習(xí)行為出現(xiàn)的頻次和轉(zhuǎn)換概率,同時(shí)利用行為點(diǎn)層面的序列演變信息,計(jì)算學(xué)習(xí)者行為序列的空間距離關(guān)系,構(gòu)建學(xué)習(xí)路徑相似度矩陣,并基于子圖切分的譜聚類算法,識別不同的學(xué)習(xí)者群體。整體來看,本研究所用方法,考慮了學(xué)習(xí)者交互過程的整體信息,提升了數(shù)據(jù)利用效率;還利用了學(xué)習(xí)路徑的圖特征,為解釋算法的教育意義打下了基礎(chǔ)。
“體驗(yàn)型”學(xué)習(xí)者的高占比是導(dǎo)致所謂“高輟學(xué)率”的重要原因。在線課程建設(shè)的初心是打破優(yōu)質(zhì)教育資源的壁壘,為學(xué)習(xí)者提供包容開放的在線學(xué)習(xí)環(huán)境。退課行為雖然降低了資源的利用率,卻是學(xué)習(xí)者根據(jù)自身學(xué)習(xí)需求積極選擇的結(jié)果。因此,合理利用“體驗(yàn)型”學(xué)習(xí)者的行為模式,建立基于學(xué)習(xí)者靜態(tài)屬性、學(xué)習(xí)者行為交互數(shù)據(jù)、課程屬性標(biāo)簽以及課程內(nèi)容標(biāo)簽等多維度過程數(shù)據(jù)的個(gè)性化推薦機(jī)制,可為后續(xù)課程建設(shè)提供改進(jìn)優(yōu)化的思路。相應(yīng)的對策包括:
一是定位潛在學(xué)習(xí)者。發(fā)現(xiàn)課程的潛在受眾,是節(jié)省雙方時(shí)間成本的有效方式。“體驗(yàn)型”學(xué)習(xí)者的行為交互序列長度較短,課程選擇短暫,難以有效探知課程本身的學(xué)習(xí)內(nèi)容。因此,本研究建議在歷史行為數(shù)據(jù)的基礎(chǔ)上,通過課程標(biāo)簽、內(nèi)容標(biāo)簽等形式,建立學(xué)習(xí)者與課程之間的匹配關(guān)系,向?qū)W習(xí)者解釋推薦的理由與依據(jù),為學(xué)習(xí)者推薦相關(guān)的介紹性資源,從而挖掘潛在的課程學(xué)習(xí)者。
圖3 三類學(xué)習(xí)者行為步長矩陣
二是提供個(gè)性化學(xué)習(xí)支持,避免信息迷航。當(dāng)前部分在線課程成績與學(xué)習(xí)者修業(yè)學(xué)分掛鉤,學(xué)習(xí)者在非主動(dòng)選擇的情況下,如果難以獲取有效的學(xué)習(xí)支持,學(xué)習(xí)體驗(yàn)下降,就會(huì)出現(xiàn)“孤立型”學(xué)習(xí)者。因此,結(jié)合此類學(xué)習(xí)者學(xué)習(xí)路徑小世界網(wǎng)絡(luò)的特征,及早發(fā)現(xiàn)信息迷航行為,為學(xué)習(xí)者及時(shí)提供個(gè)性化學(xué)習(xí)解答與幫助,將有助于學(xué)習(xí)者盡早擺脫疑問,引導(dǎo)學(xué)習(xí)者進(jìn)入下一階段的學(xué)習(xí)。
結(jié)合研究所發(fā)現(xiàn)的共性行為模式可以發(fā)現(xiàn),當(dāng)前學(xué)習(xí)者的課程學(xué)習(xí)以觀看視頻為主,穿插問題回答、課程討論等傳統(tǒng)在線學(xué)習(xí)形式,且不同類別學(xué)習(xí)者的行為交互持續(xù)度不高。為追尋這一現(xiàn)象的原因,本研究進(jìn)一步統(tǒng)計(jì)學(xué)習(xí)者人口信息,發(fā)現(xiàn)大部分學(xué)習(xí)者處于26~30 歲間,且以本科生和研究生為主。作為受過高等教育,在網(wǎng)絡(luò)環(huán)境中成長的“數(shù)字原住民”,這些學(xué)習(xí)者的學(xué)習(xí)需求更明確,對學(xué)習(xí)資源的質(zhì)量要求更高,且更喜歡主動(dòng)選擇信息。因此,單純的視頻學(xué)習(xí)容易帶來學(xué)習(xí)過程的單調(diào)性,難以吸引學(xué)習(xí)者持續(xù)的深度參與。
因此,創(chuàng)新課程形式,是激發(fā)學(xué)習(xí)者學(xué)習(xí)興趣,突破學(xué)習(xí)瓶頸的可行路徑。首先,課程資源的質(zhì)量是基礎(chǔ),本研究建議在提升視頻資源清晰度的基礎(chǔ)上,不斷改進(jìn)課程活動(dòng)的組織排列方式、學(xué)習(xí)評價(jià)方式,增強(qiáng)學(xué)習(xí)資源的可用性與易用性。其次,教師可增設(shè)在線學(xué)習(xí)的反饋渠道,加強(qiáng)與學(xué)習(xí)者的交流,例如,可利用視頻彈幕的方法,鼓勵(lì)學(xué)習(xí)者學(xué)習(xí)過程中隨時(shí)發(fā)言,降低學(xué)習(xí)反饋的門檻與成本,用創(chuàng)新的交流方式,為后續(xù)教學(xué)活動(dòng)提供異步反饋。
綜合來看,“孤立型”學(xué)習(xí)者是潛在的課程完成者。此類學(xué)習(xí)者的學(xué)習(xí)投入較高,但缺少社交性學(xué)習(xí)互動(dòng),獲得的學(xué)習(xí)支持較少。有學(xué)者認(rèn)為缺少社會(huì)性支持是大部分退課學(xué)習(xí)者的主要原因(Onah et al.,2014)。因此,隨著課程學(xué)習(xí)的推進(jìn),為學(xué)習(xí)者提供多樣化的學(xué)習(xí)支持,是提升課程完結(jié)率的重要手段。主要對策如下:
其一,建立有效的人機(jī)交互方式。例如,可利用智能對話機(jī)器人,為學(xué)習(xí)者提供適應(yīng)性的情感支持,避免負(fù)面學(xué)業(yè)情緒對學(xué)習(xí)過程的消極影響,同時(shí)可作為資源推薦的窗口,為學(xué)習(xí)者提供適應(yīng)性的學(xué)習(xí)資源支持;其二,建立通暢的學(xué)習(xí)溝通渠道,促進(jìn)學(xué)習(xí)者與講授者、學(xué)習(xí)同伴互動(dòng),合力建設(shè)學(xué)習(xí)分享空間,并與學(xué)業(yè)評價(jià)相掛鉤,推動(dòng)學(xué)習(xí)者主動(dòng)開展學(xué)習(xí)交流,提升同伴交流頻率,增加學(xué)習(xí)互動(dòng)的機(jī)會(huì)。