摘 要:學(xué)習(xí)過程分析是學(xué)習(xí)分析的核心議題,但常因理論依據(jù)與分析技術(shù)之間的融合不佳,而限制了對教育意義的深入解釋。隱馬爾可夫模型(HMM)可以有效結(jié)合學(xué)習(xí)科學(xué)理論經(jīng)驗(yàn)和模型構(gòu)建,為解決此困境提供了一種簡單、透明、可解釋的方案。因此,從HMM分析方法切入,詳細(xì)介紹了HMM的基本組成及其在教育中的重要應(yīng)用價值,說明如何基于HMM建模學(xué)習(xí)過程和預(yù)測學(xué)習(xí)成果,強(qiáng)調(diào)了學(xué)習(xí)科學(xué)理論與數(shù)據(jù)相結(jié)合的重要性。通過多個案例分析,展示了HMM在游戲化學(xué)習(xí)、學(xué)業(yè)成就預(yù)測和自我調(diào)節(jié)學(xué)習(xí)過程分析中的典型應(yīng)用。最后,總結(jié)了HMM在教育研究中分析組別差異、多階段過程和多通道過程的三大方向與策略,為未來更有教育意義的學(xué)習(xí)分析研究提供理論與實(shí)踐指導(dǎo)。
關(guān)鍵詞:學(xué)習(xí)過程;學(xué)習(xí)分析;隱馬爾可夫模型;學(xué)習(xí)科學(xué);研究方法
中圖分類號 G43 文獻(xiàn)標(biāo)識碼 A 文章編號 1005-4634(2025)01-0001-10
0 引言
學(xué)習(xí)分析通過數(shù)據(jù)揭秘教育本質(zhì),是教育數(shù)字化轉(zhuǎn)型的關(guān)鍵推力[1]。學(xué)習(xí)過程分析旨在基于過程數(shù)據(jù)反映學(xué)習(xí)者的學(xué)習(xí)狀態(tài)與潛在的教育規(guī)律[2]103,關(guān)乎學(xué)習(xí)者與環(huán)境的交互、學(xué)習(xí)者的認(rèn)知思維發(fā)展和最終的學(xué)習(xí)成果,是學(xué)習(xí)分析的核心議題[3-4]。在教學(xué)中,只有深入理解學(xué)生的學(xué)習(xí)過程,才能更有效地為優(yōu)化學(xué)習(xí)體驗(yàn)和提高教學(xué)效果提供支持。隨著數(shù)據(jù)采集技術(shù)的發(fā)展,學(xué)習(xí)過程分析研究逐漸呈現(xiàn)出多通道和多模態(tài)的發(fā)展態(tài)勢[5 ]60,[6]。通常研究者會收集學(xué)習(xí)者在學(xué)習(xí)過程中與學(xué)習(xí)環(huán)境之間交互的多維數(shù)據(jù)[7],包括但不限于學(xué)習(xí)者的行為數(shù)據(jù)、情感數(shù)據(jù)和認(rèn)知數(shù)據(jù)等。這些數(shù)據(jù)相較于傳統(tǒng)的問卷量表與課堂觀察記錄顯得更為零散且缺乏明顯規(guī)則,但往往蘊(yùn)含著豐富的潛在信息[2]103。面對如此海量的多模態(tài)和多通道時序數(shù)據(jù),研究者面臨著一項(xiàng)重要挑戰(zhàn):如何從中挖掘出具有教育意義的潛在規(guī)律?
圍繞這一核心挑戰(zhàn),已有研究從分析技術(shù)與理論依據(jù)兩方面入手提供應(yīng)對方案。在分析技術(shù)方面,眾多研究者已經(jīng)開始廣泛應(yīng)用機(jī)器學(xué)習(xí)方法、數(shù)據(jù)挖掘技術(shù)來分析學(xué)習(xí)過程數(shù)據(jù)[8-9],挖掘其中可能有價值的潛在信息。例如,滯后序列分析可以揭示學(xué)習(xí)行為之間的時間依賴關(guān)系[10],聚類分析可以通過分組相似的行為模式來識別不同的學(xué)習(xí)路徑[11-12]。這些基于行為的微觀分析可以清晰展現(xiàn)學(xué)習(xí)者的行為轉(zhuǎn)換模式[13],但卻無法直接揭示更具有概括性的教育構(gòu)念(如學(xué)習(xí)動機(jī)、學(xué)習(xí)狀態(tài)等用于解釋學(xué)習(xí)規(guī)律和結(jié)果的核心概念)及更具推廣性的學(xué)習(xí)規(guī)律,這使得理論的介入以增強(qiáng)教育解釋力度變得尤為重要[14]。在理論依據(jù)方面,研究者充分意識到了理論對于學(xué)習(xí)過程分析的關(guān)鍵作用[15]。學(xué)習(xí)科學(xué)作為探究“人是如何學(xué)習(xí)的”以及“如何促進(jìn)有效的學(xué)習(xí)”的跨學(xué)科研究領(lǐng)域,融合了來自教育學(xué)、信息科學(xué)、認(rèn)知神經(jīng)科學(xué)等多領(lǐng)域的理論成果[16],這一綜合性視角使得學(xué)習(xí)科學(xué)能夠深入剖析學(xué)習(xí)的本質(zhì),探究學(xué)習(xí)的基礎(chǔ)機(jī)制,從而全方位地揭示學(xué)習(xí)發(fā)生的過程。結(jié)合學(xué)習(xí)科學(xué)理論,研究者能夠更加科學(xué)、深入地實(shí)施學(xué)習(xí)過程分析的各個環(huán)節(jié),包括指導(dǎo)研究者在模型中甄選變量、識別數(shù)據(jù)中的潛在混雜因素、抉擇值得關(guān)注的結(jié)果以及闡釋研究結(jié)果。例如,有研究者使用社會調(diào)節(jié)學(xué)習(xí)理論指導(dǎo)學(xué)習(xí)行為序列的編碼過程[17];也有研究者指出自我調(diào)節(jié)學(xué)習(xí)和社會建構(gòu)主義理論常被用于解釋分析結(jié)果[18]。盡管理論在這些方面起著至關(guān)重要的作用,但在實(shí)際分析過程中,理論通常僅限于提供分析的起點(diǎn)和闡釋結(jié)果的框架。隨著分析進(jìn)入深層次的數(shù)據(jù)挖掘階段,理論的影響力逐漸減弱,這導(dǎo)致學(xué)習(xí)過程分析面臨理論依據(jù)與分析技術(shù)無法良好融合的困境,嚴(yán)重限制了對研究結(jié)果教育意義的深入闡釋。
以揭示潛在信息為最大優(yōu)勢的隱馬爾可夫模型(Hidden Markov Model, 簡稱HMM),正為這一困境提供了簡單、透明、可解釋的解決方案[19]784。從學(xué)習(xí)科學(xué)的視角出發(fā)構(gòu)造HMM,能夠更好地發(fā)揮其在學(xué)習(xí)分析領(lǐng)域的優(yōu)勢,增強(qiáng)其在教育方面的可解釋性。從技術(shù)原理角度,HMM能夠通過概率運(yùn)算建構(gòu)出最大可能出現(xiàn)的教育構(gòu)念及其轉(zhuǎn)換規(guī)律,揭示數(shù)據(jù)背后最可能蘊(yùn)含的教育規(guī)律[20]41;而從理論融合角度,HMM是將理論依據(jù)充分融合學(xué)習(xí)過程分析的良好體現(xiàn),將學(xué)習(xí)科學(xué)理論天然地融入到教育構(gòu)念的特征建構(gòu)之中,極大地增強(qiáng)了分析結(jié)果的理論深度和教育解釋力度[21]5497-5498。此外,正如李海峰和王煒指出的,學(xué)習(xí)分析主要是通過預(yù)測模型和解釋模型兩類技術(shù)解密學(xué)習(xí)本質(zhì)[5]62。HMM正是解釋模型,并能夠和學(xué)習(xí)成果關(guān)聯(lián)構(gòu)建預(yù)測模型,在教育領(lǐng)域中具有較強(qiáng)的靈活性和通用價值。
綜上可知,面對復(fù)雜的時序數(shù)據(jù),學(xué)習(xí)過程分析尤其強(qiáng)調(diào)潛在的教育規(guī)律的揭示,這一過程離不開理論和數(shù)據(jù)的深度融合。HMM作為一種靈活且易于解釋的學(xué)習(xí)分析技術(shù),顯示出了其在揭示復(fù)雜數(shù)據(jù)背后規(guī)律和整合理論方面的巨大潛力。本研究旨在從學(xué)習(xí)科學(xué)視角出發(fā),深入探討HMM在學(xué)習(xí)過程分析中的應(yīng)用,包括其分析步驟、典型案例和應(yīng)用方向與策略,以期為學(xué)習(xí)過程分析研究者揭示潛在的教育規(guī)律提供示例與方法,推動學(xué)習(xí)分析領(lǐng)域的進(jìn)一步發(fā)展。
1 隱馬爾可夫模型概述
1.1 HMM的概念及其重要應(yīng)用價值
隱馬爾可夫模型是一種基于概率的統(tǒng)計學(xué)習(xí)方法,于20世紀(jì)60年代末至70年代初由Leonard等研究者提出并得到發(fā)展。HMM多用于解決線性序列問題,能夠從可觀測的序列數(shù)據(jù)中挖掘這一過程中最可能的隱藏狀態(tài)及狀態(tài)之間的轉(zhuǎn)移路徑。由于這一特點(diǎn),HMM自提出以來便在語音識別[22]、詞性標(biāo)注[23]、蛋白質(zhì)結(jié)構(gòu)預(yù)測和基因序列分析[24]等諸多現(xiàn)實(shí)場景中得到廣泛應(yīng)用。
學(xué)習(xí)者在學(xué)習(xí)過程中通常會產(chǎn)生多樣化的具有時序特性的可觀測數(shù)據(jù),例如點(diǎn)擊流數(shù)據(jù)、平臺日志數(shù)據(jù)、學(xué)習(xí)者交互行為數(shù)據(jù)等。HMM能夠從可觀測數(shù)據(jù)中推斷其背后蘊(yùn)藏的潛在信息,為打開學(xué)習(xí)過程的“黑箱”提供了可解釋的有效途徑。目前,許多教育研究者使用HMM來揭示學(xué)習(xí)者的學(xué)習(xí)過程,從而刻畫其深層次的學(xué)習(xí)狀態(tài)[25],或基于此預(yù)測該學(xué)習(xí)者的學(xué)習(xí)成效。程罡等人使用HMM識別了學(xué)生在學(xué)習(xí)周和考試周兩個課程階段所展現(xiàn)出的學(xué)習(xí)策略及活動模式[26]42;Geigle等人則借助一類雙層HMM對學(xué)生鼠標(biāo)點(diǎn)擊活動建模,揭示了不同學(xué)業(yè)表現(xiàn)的學(xué)生所展現(xiàn)的不同活動模式[27];Witteveen等人使用學(xué)生的成績單數(shù)據(jù)建立HMM模型,用于預(yù)測學(xué)生在高等教育中能否順利畢業(yè)[28]449;張思等人對學(xué)生在私播課論壇上的對話數(shù)據(jù)編碼,借助HMM模型識別學(xué)生在協(xié)作學(xué)習(xí)中所采用的交互模式[29]。
由此可見,HMM在學(xué)習(xí)分析領(lǐng)域具有重要的應(yīng)用價值,尤其是在對學(xué)習(xí)過程的刻畫和分析上。對于學(xué)生而言,使用HMM分析和梳理學(xué)習(xí)過程能夠更清晰地了解自己的學(xué)習(xí)模式,從而有針對性地調(diào)整學(xué)習(xí)策略;對于教師而言,通過HMM挖掘?qū)W習(xí)過程中不易觀察的潛在學(xué)習(xí)狀態(tài),有助于識別學(xué)生存在的問題并及時實(shí)施教學(xué)干預(yù);對于教育研究者與管理者而言,使用HMM能夠有效地預(yù)測學(xué)生的學(xué)習(xí)成效,識別學(xué)業(yè)風(fēng)險,為其作出合理且有效的決策提供指導(dǎo)。
1.2 HMM的技術(shù)特點(diǎn)
HMM包含兩個序列:一個是由可觀察的變量組成的序列,稱為觀測序列;一個是用于描述隱藏狀態(tài)的序列[30]。在學(xué)習(xí)過程分析場景下,觀測序列通常由學(xué)生的行為、表現(xiàn)等可被直接觀察和記錄到的時序數(shù)據(jù)構(gòu)成,而隱藏狀態(tài)序列則視研究問題而定,通常能夠反映隱含在學(xué)習(xí)者行為、表現(xiàn)中的教育構(gòu)念,如學(xué)習(xí)狀態(tài)、學(xué)習(xí)模式、調(diào)節(jié)過程等。在完成HMM建模后,Viterbi算法通過動態(tài)規(guī)劃的方式,逐步計算出該觀測序列下每個隱藏狀態(tài)的最優(yōu)概率,并據(jù)此推斷最可能出現(xiàn)的隱藏狀態(tài)序列,這是HMM的核心問題之一。在教育中,這一過程即表示通過學(xué)習(xí)者的行為、表現(xiàn)揭示潛在教育構(gòu)念。此外,HMM還包含三個重要的核心矩陣:初始概率矩陣表示起始時刻處在各隱藏狀態(tài)下的概率、狀態(tài)轉(zhuǎn)移矩陣表示隱藏狀態(tài)之間相互轉(zhuǎn)換的概率、發(fā)射矩陣則表示在當(dāng)前時刻隱藏狀態(tài)下觀察到特定可觀測狀態(tài)的概率。上述參數(shù)是使用HMM進(jìn)行學(xué)習(xí)過程分析的重要依據(jù),例如狀態(tài)轉(zhuǎn)移矩陣展現(xiàn)了不同類型教育構(gòu)念之間的轉(zhuǎn)換規(guī)律。
傳統(tǒng)的HMM進(jìn)一步發(fā)展出許多擴(kuò)展模型,從而適應(yīng)更多樣化的數(shù)據(jù)類型和特征。對于有限的離散型觀測數(shù)據(jù),例如學(xué)習(xí)環(huán)境觸發(fā)的事件標(biāo)簽(如“成功”“失敗”),可以直接使用傳統(tǒng)HMM建模;對于連續(xù)數(shù)值的變量,例如學(xué)習(xí)時長,則通常使用高斯HMM進(jìn)行建模;而針對混合型數(shù)據(jù),則可以使用混合HMM建模,通過特征融合,將離散和連續(xù)的數(shù)據(jù)整合為統(tǒng)一的特征輸入HMM。對于其他復(fù)雜的數(shù)據(jù),還需通過數(shù)據(jù)預(yù)處理將其轉(zhuǎn)化為適合HMM輸入的數(shù)據(jù)類型,例如針對平臺日志等時序數(shù)據(jù),需要根據(jù)數(shù)據(jù)特征劃分時間窗口,將其轉(zhuǎn)化為離散或連續(xù)的序列形式。
1.3 HMM工具包——hmmlearn和seqHMM
目前學(xué)界還缺乏集成HMM的專業(yè)軟件,但Python和R語言提供了專門計算HMM模型的第三方庫,不需要用戶掌握HMM復(fù)雜的內(nèi)在算法邏輯并且適用于多種數(shù)據(jù)類型。具體而言,hmmlearn是Python中處理HMM的第三方庫。根據(jù)數(shù)據(jù)類型及數(shù)據(jù)分布在該庫中選擇合適的HMM模型,包括“GaussianHMM”“CategoricalHMM”“MultinomialHMM”等。在建立模型的基礎(chǔ)上,利用函數(shù)對模型及模型參數(shù)進(jìn)行操作。例如,使用fit函數(shù)訓(xùn)練HMM模型,使用參數(shù)名“startprob_”“transmat_”“emissionprob_”輸出HMM的三個核心矩陣,使用“score”函數(shù)計算產(chǎn)生特定觀測序列的概率,通過“decode”或“predict”函數(shù),可以推斷出與給定觀測序列最相關(guān)的隱藏狀態(tài)序列,從而深入分析學(xué)生的潛在學(xué)習(xí)狀態(tài)。
在R語言中可對應(yīng)使用seqHMM工具包[31]2,建模過程與hmmlearn相似?!癰uild_hmm”和“fit_model”函數(shù)分別用于構(gòu)建和訓(xùn)練HMM模型,三個核心矩陣數(shù)據(jù)存放于變量“initial_probs”“transition_probs”“emission_probs”中。為了能夠更直觀地展示模型,該工具包中集成了可視化方法,例如,“plot(hmm [XCS.TIF] model)”函數(shù)能夠形象地展現(xiàn)HMM的結(jié)果:隱藏狀態(tài)以節(jié)點(diǎn)形式呈現(xiàn),每個隱藏狀態(tài)是一個餅狀圖,初始概率顯示在節(jié)點(diǎn)下方;發(fā)射概率表示為餅狀圖的切片比例;轉(zhuǎn)移概率以頂點(diǎn)之間的箭頭粗細(xì)表示大小。
2 學(xué)習(xí)科學(xué)視角下基于HMM的學(xué)習(xí)過程分析流程
在學(xué)習(xí)科學(xué)的視角下,HMM兼具學(xué)習(xí)過程解釋和學(xué)習(xí)成果預(yù)測雙重功能。作為解釋模型,HMM能夠建模學(xué)習(xí)者的學(xué)習(xí)過程,通過對學(xué)生在某個階段的多通道的行為、活動、表現(xiàn)等序列數(shù)據(jù)描述、解釋和分析,揭示潛在的學(xué)習(xí)規(guī)律;而作為預(yù)測模型,HMM能夠基于過程數(shù)據(jù),通過建模學(xué)習(xí)過程預(yù)測學(xué)習(xí)成果,有效地將學(xué)習(xí)過程與學(xué)習(xí)成果關(guān)聯(lián)起來。雖然上述兩類問題均以學(xué)習(xí)過程數(shù)據(jù)的分析為主,但分析過程卻存在差異。
2.1 基于HMM建模學(xué)習(xí)過程
學(xué)生在學(xué)習(xí)過程中會產(chǎn)生各種各樣可觀察和記錄的數(shù)據(jù),HMM的優(yōu)勢之一就是能夠基于可觀測序列數(shù)據(jù)建模學(xué)生的學(xué)習(xí)過程,從而挖掘內(nèi)隱的規(guī)律。如圖1所示,在學(xué)習(xí)科學(xué)視角下使用HMM建模某一群體某一階段的學(xué)習(xí)過程的具體步驟包括六步。
(1)確定研究問題:研究問題的確定是特征選擇、結(jié)果解讀的前提,通常使用HMM的研究者是為了揭秘學(xué)習(xí)者在某一主題的學(xué)習(xí)過程中的某一教育構(gòu)念(如活動模塊[21]5499,[26]33、學(xué)習(xí)策略[20]2-10等)的分布與變化規(guī)律。
(2)選取觀察特征:HMM建模的效果很大程度上取決于特征的質(zhì)量。研究者需要根據(jù)研究問題、理論依據(jù)和實(shí)際數(shù)據(jù)情況,選擇或編碼HMM的觀察特征,形成觀測序列。例如,程罡等人選擇學(xué)生在線課程中產(chǎn)生的12個學(xué)習(xí)活動數(shù)據(jù)作為觀測數(shù)據(jù)[26]42;而Tang等人則將學(xué)生在完成練習(xí)題過程中產(chǎn)生的行為日志數(shù)據(jù)重新編碼,并以此為觀察特征[21]5498-5499。在重新編碼特征的情況下,研究者必須參考學(xué)習(xí)科學(xué)相關(guān)理論或依據(jù)學(xué)科領(lǐng)域經(jīng)驗(yàn)制定合適的編碼方案,且由多位研究者參與編碼,保證編碼方案的信度和效度(專家評估、理論驗(yàn)證等)。初步選取后,結(jié)合主成分分析、相關(guān)分析等剔除掉信息量不高的特征選項(xiàng),由信息量較高、具有理論依據(jù)的特征組成最終的觀測序列。
(3)確定隱藏狀態(tài)數(shù)量:一方面可以借助理論知識與領(lǐng)域經(jīng)驗(yàn)確定隱藏狀態(tài)數(shù)目,另一方面也可以將不同狀態(tài)數(shù)目下的AIC(Aikaike Information Criterion)、BIC(Bayesian Information Criteria)等統(tǒng)計指標(biāo)作為依據(jù)[32]。一般來說,AIC值越小說明模型的擬合能力越強(qiáng),BIC值越小說明模型的結(jié)構(gòu)風(fēng)險越小。研究者可借助這兩種方法確定合適的隱藏狀態(tài)數(shù)量。在教育場景下,將隱藏狀態(tài)劃分為兩態(tài)或三態(tài)的做法較為常見[33]。
(4)訓(xùn)練HMM模型:將觀測序列作為訓(xùn)練數(shù)據(jù),借助hmmlearn或seqHMM工具包構(gòu)建并訓(xùn)練模型,可以通過調(diào)整輸入的不同初始參數(shù)、修改迭代次數(shù)等方式優(yōu)化模型,以最大化模型的似然概率,從而求解HMM模型的參數(shù)。
(5)解讀HMM結(jié)果:綜合HMM的隱藏狀態(tài)、初始概率矩陣、發(fā)射矩陣和狀態(tài)轉(zhuǎn)移矩陣的數(shù)據(jù)分布,以及學(xué)習(xí)科學(xué)知識分析隱藏狀態(tài)的定義,如學(xué)習(xí)過程中關(guān)鍵的認(rèn)知階段、情感狀態(tài)、社交互動模式等;隨后進(jìn)一步分析學(xué)生的潛在教育構(gòu)念及初始分布,教育構(gòu)念所對應(yīng)的外顯行為,以及構(gòu)念轉(zhuǎn)移規(guī)律。同時,可以通過可視化HMM結(jié)果,更加直觀地呈現(xiàn)該階段中教育構(gòu)念的轉(zhuǎn)移模式。
(6)結(jié)合學(xué)習(xí)科學(xué)理論與經(jīng)驗(yàn),根據(jù)模型結(jié)果、可視化呈現(xiàn)結(jié)果對研究問題作出回答。例如,借助自我調(diào)節(jié)學(xué)習(xí)理論深入分析學(xué)習(xí)行為背后存在的潛在調(diào)節(jié)策略[34]。
上述分析過程通常針對某一群體在某一階段的學(xué)習(xí)過程,從學(xué)習(xí)過程數(shù)據(jù)到觀測序列再到HMM模型,HMM的特征選取、參數(shù)抉擇和結(jié)果解讀都須要理論經(jīng)驗(yàn)的參與,這在一定程度上增強(qiáng)了HMM的可解釋性。
2.2 基于HMM預(yù)測學(xué)習(xí)成果
使用HMM預(yù)測學(xué)習(xí)成果在本質(zhì)上屬于分類問題,需要由研究者提前劃定學(xué)習(xí)成果的類別,如能夠畢業(yè)與無法畢業(yè)[28]458、存在學(xué)業(yè)風(fēng)險與安全[19]783等。HMM預(yù)測學(xué)習(xí)成果常常使用基于概率的分類方案,即通過比較每個類別對應(yīng)的HMM產(chǎn)生特定觀測序列的概率得出分類結(jié)果。如圖 2所示,部分分析流程與建模學(xué)習(xí)過程相同,不同之處在于增加了第二步、第五步和修改了四步,且需要訓(xùn)練多個模型。具體流程包括:(1)確定研究問題;(2)劃定學(xué)習(xí)成果的類別;(3)依據(jù)學(xué)習(xí)科學(xué)理論、學(xué)科領(lǐng)域經(jīng)驗(yàn)確定觀察特征;(4)為每個類別確定隱藏狀態(tài)數(shù)量,并為每個類別訓(xùn)練HMM模型;(5)計算并比較分類概率,依次對每個類別的HMM計算產(chǎn)生待預(yù)測的觀測序列的概率,這一概率表示“該學(xué)生在屬于該類別的前提下出現(xiàn)當(dāng)前觀測序列的可能性”,概率越大說明該學(xué)生越有可能屬于該類別;(6)依據(jù)預(yù)測結(jié)果回答研究問題。除此之外,還可以通過交叉驗(yàn)證或計算包含準(zhǔn)確率、精確率、召回率、F1分?jǐn)?shù)的混淆矩陣對模型的預(yù)測效果,即分類性能進(jìn)行評估。研究者可以通過模型評估的結(jié)果以及實(shí)際任務(wù)的需求確定是否進(jìn)一步調(diào)整模型參數(shù),以獲得更優(yōu)的預(yù)測模型。
3 基于HMM的學(xué)習(xí)過程分析案例
為了更加明確地闡釋HMM在學(xué)習(xí)過程分析中的兩類分析流程,選取三個典型案例闡釋學(xué)習(xí)科學(xué)視角下HMM的應(yīng)用情況:從建模學(xué)習(xí)過程、預(yù)測學(xué)習(xí)成果到綜合分析多維學(xué)習(xí)行為。這些案例,一是涵蓋了不同的學(xué)習(xí)環(huán)境,包括游戲化學(xué)習(xí)、在線學(xué)習(xí)平臺以及智能輔導(dǎo)系統(tǒng),體現(xiàn)了HMM在多種教育情境中的適應(yīng)性;二是涉及不同的學(xué)習(xí)對象和數(shù)據(jù)類型,從小學(xué)生到大學(xué)生,從行為數(shù)據(jù)到成績數(shù)據(jù),展示了HMM的廣泛應(yīng)用潛力;三是突出了HMM在結(jié)合學(xué)習(xí)科學(xué)理論進(jìn)行學(xué)習(xí)過程解讀和結(jié)果預(yù)測中的典型價值。這些案例不僅能夠揭示HMM適配的多樣化學(xué)習(xí)分析場景,也為研究者提供了具體的操作示例和實(shí)踐啟示。
3.1 建模學(xué)習(xí)過程案例:目標(biāo)講解對游戲化學(xué)習(xí)過程的影響分析
該研究由張鵬等人完成,旨在研究教師講解目標(biāo)與否對學(xué)習(xí)者的游戲化學(xué)習(xí)過程產(chǎn)生的影響。研究對象是206名五年級小學(xué)生,隨機(jī)分成實(shí)驗(yàn)組(92名學(xué)生)和對照組(114名學(xué)生)。實(shí)驗(yàn)組學(xué)生在游戲開始前接受了教師關(guān)于游戲目標(biāo)的講解,而對照組則沒有接受教師的講解,自行[CM(73mm]閱讀游戲目標(biāo)后直接開始游戲;兩組學(xué)生游戲化[CM)][LL]學(xué)習(xí)活動時間相同,均為75分鐘。研究與數(shù)據(jù)收集工具是教育游戲《方塊消消樂(3.0)》,通過模擬正方體的展開與折疊,讓學(xué)生學(xué)習(xí)相對面和相鄰面以及正確的展開圖。
為了有意義表征學(xué)習(xí)者的游戲化學(xué)習(xí)過程,研究依據(jù)教育游戲開發(fā)的理論基礎(chǔ)——掌握學(xué)習(xí)理論[35]、學(xué)習(xí)支架理論[36]和注意力測量理論[37],選取了表1中的六個關(guān)鍵特征值。經(jīng)過相關(guān)分析后,剔除掉與其他特征高度相關(guān)的每關(guān)嘗試次數(shù)后,其余特征形成多維觀測序列。
在確定隱藏狀態(tài)的數(shù)量時,考慮到教育模型的解釋性,通過比較不同狀態(tài)數(shù)下的AIC和BIC值,最終確定了三個潛在狀態(tài)為最優(yōu)解。綜合發(fā)射矩陣(表2)、初始分布矩陣(圖3圓圈中數(shù)據(jù))和轉(zhuǎn)移矩陣(圖3箭頭數(shù)據(jù)),這三個狀態(tài)分別代表了學(xué)習(xí)者的獨(dú)立學(xué)習(xí)狀態(tài)(獨(dú)立型)、需要適應(yīng)的學(xué)習(xí)狀態(tài)(適應(yīng)型)和高度依賴支架的學(xué)習(xí)狀態(tài)(依賴型)。使用Baum-Welch算法對HMM模型的參數(shù)進(jìn)行了估計,確保模型能夠準(zhǔn)確地描述學(xué)習(xí)者在不同學(xué)習(xí)狀態(tài)之間的轉(zhuǎn)換(如圖3所示)。
HMM的分析結(jié)果進(jìn)一步深化了教師講解對學(xué)習(xí)者游戲化學(xué)習(xí)過程影響的理解。通過HMM建模,本研究發(fā)現(xiàn)接受教師目標(biāo)講解的實(shí)驗(yàn)組學(xué)生在游戲開始時更可能處于獨(dú)立型學(xué)習(xí)狀態(tài),而未接受講解的對照組學(xué)生則傾向于以適應(yīng)型狀態(tài)開始。狀態(tài)轉(zhuǎn)移分析表明,隨著游戲難度的增加,未接受目標(biāo)講解的學(xué)習(xí)者更有可能保持對支架的依賴,而接受目標(biāo)講解的學(xué)習(xí)者更容易從依賴型轉(zhuǎn)向適應(yīng)型狀態(tài)。這些結(jié)果驗(yàn)證了教師講解在幫助學(xué)生理解游戲目標(biāo)中的重要性,能夠幫助學(xué)習(xí)者更快地進(jìn)入獨(dú)立學(xué)習(xí)狀態(tài),合理而不過度依賴學(xué)習(xí)支架。這為教師使用游戲化學(xué)習(xí)環(huán)境時的教學(xué)決策提供依據(jù),也為研究者提供“如何設(shè)計支架以免過度依賴”的研究方向。
3.2 預(yù)測學(xué)習(xí)成果案例:過程表現(xiàn)對學(xué)業(yè)成就的預(yù)測分析
該研究由Gupta等人完成,旨在通過分析學(xué)生在在線學(xué)習(xí)環(huán)境中的過程表現(xiàn)來預(yù)測其學(xué)業(yè)成就,特別是識別早期存在學(xué)習(xí)風(fēng)險的學(xué)生[19]783。研究對象為可公開獲取的開放大學(xué)學(xué)習(xí)分析數(shù)據(jù)集OULA中的學(xué)生。數(shù)據(jù)集包含四個STEM課程和三個社會科學(xué)課程的32 593名學(xué)生的記錄,記錄了學(xué)生的互動日志、作業(yè)成績等多種形式的數(shù)據(jù),為研究提供了豐富的過程表現(xiàn)信息。
研究采用了隱爾可夫模型來挖掘?qū)W生的序列學(xué)習(xí)行為,并基于課程評估的過程表現(xiàn)特征進(jìn)行建模。首先,基于學(xué)生的成績數(shù)據(jù)編碼為四種觀察狀態(tài)。具體而言,未嘗試的學(xué)生被編碼為“A”狀態(tài),成績低于四分位數(shù)的學(xué)生被編碼為“B”狀態(tài),成績在四分位數(shù)和中位數(shù)之間的學(xué)生被編碼為“C”狀態(tài),成績高于中位數(shù)的學(xué)生被編碼為“D”狀態(tài),以生成每個學(xué)生的學(xué)習(xí)軌跡。其次,利用最終的學(xué)業(yè)成績測驗(yàn),將學(xué)習(xí)者的隱藏狀態(tài)分為安全和有風(fēng)險兩類,其中安全是指最終成績?yōu)橥ㄟ^和優(yōu)秀,有風(fēng)險是指最終成績?yōu)椴煌ㄟ^和缺考。數(shù)據(jù)集中每門課包含兩個測試模塊,故而按照1∶1拆分,分別組成訓(xùn)練集和測試集。而后,基于訓(xùn)練數(shù)據(jù)集,分別為每門課中存在學(xué)業(yè)風(fēng)險和不存在學(xué)業(yè)風(fēng)險的學(xué)生各自訓(xùn)練了HMM,再分別計算這兩個HMM產(chǎn)生測試集中學(xué)生序列的概率,通過比較概率即可得出該學(xué)生的所屬類別,最后輸出預(yù)測準(zhǔn)確率等指標(biāo)。不同課程的預(yù)測結(jié)果如表3所示。研究結(jié)果顯示,大部分課程的預(yù)測準(zhǔn)確率超過了90%,其中課程STEM-1的準(zhǔn)確率最高,達(dá)到94.83%,其F1得分為0.926。通過這些結(jié)果可以看出,HMM能夠捕捉學(xué)習(xí)軌跡中細(xì)微的行為模式,可以有效識別有學(xué)習(xí)風(fēng)險的學(xué)生,并為教育工作者提供及時的干預(yù)數(shù)據(jù)。
3.3 綜合分析案例:智能輔導(dǎo)系統(tǒng)中學(xué)習(xí)者行為建模及成果預(yù)測分析
該研究由Tang等人完成,旨在更好地理解在線智能輔導(dǎo)系統(tǒng)中學(xué)習(xí)者的自我調(diào)節(jié)學(xué)習(xí)過程[21]5495。學(xué)生使用基于知識空間理論建設(shè)的網(wǎng)絡(luò)智能輔導(dǎo)系統(tǒng)進(jìn)行代數(shù)答題活動,產(chǎn)生了25 818條行為日志記錄,包括具體的學(xué)習(xí)活動類型、完成時間和知識狀態(tài)得分。
研究通過應(yīng)用雙層HMM探索智能輔導(dǎo)系統(tǒng)中學(xué)習(xí)者的自我調(diào)節(jié)學(xué)習(xí)過程,包括建模學(xué)習(xí)行為模式并預(yù)測學(xué)習(xí)表現(xiàn)。首先,基于知識空間理論對學(xué)習(xí)者的知識狀態(tài)進(jìn)行評分,將學(xué)習(xí)者數(shù)據(jù)分為“失敗組”和“掌握組”,并分別為其構(gòu)建了兩層HMM模型:第一層使用非隱馬爾可夫模型捕捉學(xué)習(xí)過程中的顯著行為序列,第二層構(gòu)建統(tǒng)一的隱馬爾可夫模型以描述這些行為序列之間的轉(zhuǎn)移。而后,基于雙層HMM模型輸出學(xué)習(xí)者的潛在概率分布,并輸入kNN、邏輯回歸和決策樹等算法對學(xué)習(xí)者的學(xué)習(xí)成果進(jìn)行預(yù)測。
研究結(jié)果發(fā)現(xiàn),掌握組和失敗組學(xué)習(xí)者的學(xué)習(xí)過程存在不同的學(xué)習(xí)行為模式:掌握組中的學(xué)習(xí)者呈現(xiàn)出不斷練習(xí)、尋求幫助、從解決方案中學(xué)習(xí)共三種體現(xiàn)出自我學(xué)習(xí)能力的學(xué)習(xí)模式;失敗組中的學(xué)習(xí)者也呈現(xiàn)出兩種與自我調(diào)節(jié)相關(guān)的學(xué)習(xí)模式,包括在犯錯后嘗試尋求幫助、嘗試從解決方案中學(xué)習(xí),但最終都變成了不斷犯錯的被動做法。此外,如表4所示,基于兩層HMM結(jié)果的多種算法的預(yù)測結(jié)果準(zhǔn)確率均高于86%,能夠基于學(xué)習(xí)者的學(xué)習(xí)過程有效預(yù)測學(xué)習(xí)者的學(xué)習(xí)成果。這些結(jié)果表明,結(jié)合HMM和機(jī)器學(xué)習(xí)算法,可以有效識別不同學(xué)習(xí)行為模式背后的潛在成果,為教師和智能教師系統(tǒng)支持學(xué)習(xí)者的自我調(diào)節(jié)學(xué)習(xí)過程提供參考。
4 基于HMM的學(xué)習(xí)過程分析方向與策略
基于前文對HMM學(xué)習(xí)過程分析實(shí)例的探討,總結(jié)和擴(kuò)展幾種常見的分析方向及其策略:分析組別間差異、多階段過程以及多通道過程。這些分析方向及其策略為研究者提供了實(shí)際操作的指南和啟示,有助于實(shí)現(xiàn)學(xué)習(xí)科學(xué)視角下有意義的學(xué)習(xí)過程分析。
4.1 基于HMM分析組別間差異
在教育研究中,對比不同的干預(yù)手段(如新的媒體技術(shù)、新的教學(xué)方法)和不同的干預(yù)對象(如不同年級、背景或能力水平的學(xué)生)[19]783,[21]5501之間的學(xué)習(xí)差異,是評估教育干預(yù)效果和分析學(xué)習(xí)者認(rèn)知發(fā)展規(guī)律的重要方式。通過應(yīng)用隱馬爾可夫模型,研究者可以揭示這些組別在學(xué)習(xí)過程中的潛在差異,從而識別哪些教學(xué)策略對特定學(xué)生群體更有效。這不僅有助于理解不同干預(yù)手段的具體影響,還能為個性化教育提供數(shù)據(jù)支持,使教育決策更加科學(xué)化和精準(zhǔn)化。
在具體策略上,研究者可以通過劃分干預(yù)/對照組、高/低學(xué)業(yè)成就組、專家/新手組、輟學(xué)高/低風(fēng)險組等進(jìn)行HMM建模和分析。具體而言,通過對比干預(yù)/對照組的過程差異,能夠更全面地權(quán)衡干預(yù)手段的實(shí)際效用,甚至闡釋最終學(xué)習(xí)成果有或無顯著差異的緣由,為決策者提供采用或拒絕采用某一教學(xué)干預(yù)手段的決策依據(jù);通過對比高學(xué)業(yè)成就與低學(xué)業(yè)成就組的學(xué)習(xí)過程差異,往往能得出不同效果產(chǎn)生的關(guān)鍵所在,能夠?yàn)檠芯空吆徒處熖峁└深A(yù)的抓手;通過對比專家/新手組,能夠更準(zhǔn)確地刻畫專家與新手的差異所在,為新手成長提供更清晰的發(fā)展路徑;通過對比輟學(xué)高/低風(fēng)險組的過程差異,能夠及時預(yù)警,為教師提供及時的干預(yù)時機(jī)以保障學(xué)習(xí)者的學(xué)業(yè)發(fā)展。
4.2 基于HMM分析多階段過程
學(xué)習(xí)過程通常包括多個階段,每個階段有著不同的學(xué)習(xí)目標(biāo)和活動。例如,K12的學(xué)段年級、在線學(xué)習(xí)平臺的知識單元、教育游戲中的關(guān)卡等,這些階段可能涉及不同的知識內(nèi)容、技能訓(xùn)練和評估方式,因此,學(xué)習(xí)者在每個階段的表現(xiàn)也會有所不同。在學(xué)習(xí)科學(xué)視角下,基于HMM的多階段過程分析能夠幫助研究者更細(xì)致地了解學(xué)習(xí)者在各個階段的行為模式和學(xué)習(xí)特征[26]42-43,從而為階段性教學(xué)設(shè)計提供依據(jù)。
具體策略方面,研究者可以根據(jù)內(nèi)生標(biāo)準(zhǔn)和外部標(biāo)準(zhǔn)進(jìn)行階段劃分[38],而后進(jìn)行HMM建模。具體而言,內(nèi)生標(biāo)準(zhǔn)指的是依據(jù)過程數(shù)據(jù)內(nèi)在特[HJ70x]征進(jìn)行階段劃分,例如小初高的學(xué)段劃分;外部標(biāo)準(zhǔn)是依據(jù)研究目的而引入階段劃分,例如獲得60分之前和之后的學(xué)習(xí)階段。分階段進(jìn)行HMM分析,除了有效地簡化數(shù)據(jù)分析過程之外,最主要的作用是能夠反映出不同階段中學(xué)習(xí)者的學(xué)習(xí)特征和學(xué)習(xí)策略[20]11,從而及時給予干預(yù)措施。尤其是在輟學(xué)、退課等涉及高利害關(guān)系的決策預(yù)測上(預(yù)測學(xué)習(xí)成果方面),分階段HMM有助于及早、及時確認(rèn)干預(yù)時機(jī)。
4.3 基于HMM分析多通道過程
多通道數(shù)據(jù)由多個平行序列組成。例如,學(xué)習(xí)者同一學(xué)習(xí)過程的眼動數(shù)據(jù)、表情數(shù)據(jù)、腦電數(shù)據(jù)、平臺日志數(shù)據(jù)等,共同刻畫學(xué)習(xí)者的學(xué)習(xí)過程。多通道分析和隱馬爾可夫模型相結(jié)合的分析策略能夠壓縮過程信息,提高過程數(shù)據(jù)的可解釋性,幫助研究者更好地理解多通道的協(xié)同牽制作用及其對學(xué)習(xí)成果的綜合影響[31]2。
在具體策略方面,關(guān)鍵在于對齊各通道并集成多通道狀態(tài):一是要選擇合適的時間粒度將各通道對齊,依據(jù)數(shù)據(jù)情況選擇以秒、分、時等自然時間或者游戲關(guān)卡為離散單元;二是要定義各通道狀態(tài),通常以有限集合作為各通道觀測狀態(tài)集合,例如表情通道中學(xué)習(xí)者狀態(tài)集合中有H(快樂)、A(憤怒)、S(悲傷)三個元素。在完成上述兩步的基礎(chǔ)上,對齊生成多通道觀測數(shù)據(jù),例如在t1時刻眼動數(shù)據(jù)通道E中,學(xué)習(xí)者處于興趣區(qū)AOI1,而表情通道F中學(xué)習(xí)者處于快樂狀態(tài)H,則t1時刻學(xué)習(xí)者的狀態(tài)向量為(AOI1,H)。
上述策略為最基本的HMM分析策略,在應(yīng)用HMM對學(xué)習(xí)過程進(jìn)行分析時可以組合使用,例如基于多通道數(shù)據(jù)對不同學(xué)習(xí)者的多階段學(xué)習(xí)過程進(jìn)行建模分析。此外,還可以在不同群體層次上應(yīng)用HMM進(jìn)行分析,不僅分析個體的學(xué)習(xí)路徑,還可以在群體層面進(jìn)行動態(tài)分析,例如揭示協(xié)作學(xué)習(xí)或項(xiàng)目過程中的團(tuán)隊(duì)角色分配和合作模式,為教育者調(diào)整團(tuán)隊(duì)結(jié)構(gòu)和協(xié)作策略提供數(shù)據(jù)支持。除了關(guān)注學(xué)習(xí)者的認(rèn)知學(xué)習(xí)過程外,HMM結(jié)合情緒分析工具,還可以分析學(xué)習(xí)者在學(xué)習(xí)過程中的情緒變化,進(jìn)而調(diào)整教學(xué)內(nèi)容以提高學(xué)習(xí)效率。
5 結(jié)束語
HMM分析學(xué)習(xí)過程,既是學(xué)習(xí)分析新方法、新技術(shù)的應(yīng)用,也是學(xué)習(xí)分析重視教育意義的體現(xiàn)。在學(xué)習(xí)科學(xué)視角下,HMM模型是分析學(xué)習(xí)過程、揭秘潛在教育規(guī)律的有力工具,能夠?yàn)樵诰€學(xué)習(xí)、虛擬學(xué)習(xí)環(huán)境、課堂教學(xué)與非正式學(xué)習(xí)的教學(xué)與研究人員提煉經(jīng)驗(yàn)知識;也是連接教育理論、教育經(jīng)驗(yàn)和數(shù)據(jù)分析的橋梁模型,具備極高的解釋性和靈活性。然而,HMM的局限性也不容忽視。在具體應(yīng)用中,HMM對研究者的理論理解與模型構(gòu)建能力有較高要求,其結(jié)果解讀高度依賴教育理論和實(shí)際經(jīng)驗(yàn),這對新手研究者可能是一種挑戰(zhàn)。此外,HMM對數(shù)據(jù)的假設(shè)也存在一定限制,隱藏狀態(tài)轉(zhuǎn)移通常假設(shè)為馬爾可夫性質(zhì)(即當(dāng)前狀態(tài)僅依賴于上一狀態(tài)),這可能無法充分捕捉復(fù)雜學(xué)習(xí)過程中的長期依賴關(guān)系。對于高維、多模態(tài)數(shù)據(jù)或存在非線性關(guān)系的復(fù)雜場景,HMM的能力可能不足,需要結(jié)合深度學(xué)習(xí)等方法進(jìn)一步提升分析效果。此外,HMM在分析顯性行為轉(zhuǎn)化或簡單序列關(guān)系時,可能并不是最優(yōu)選擇。例如,對于明確的行為編碼轉(zhuǎn)換問題,滯后序列分析等方法可能更加直觀和高效;而對于需要處理海量數(shù)據(jù)和更高復(fù)雜性的研究情境(如多層次學(xué)習(xí)過程建模),深度學(xué)習(xí)方法具有更大的潛力。因此,HMM并非適用于所有學(xué)習(xí)過程研究,研究人員應(yīng)根據(jù)具體研究問題、數(shù)據(jù)特性和分析目標(biāo)選擇最適合的方法,而非單純?yōu)樽非蠹夹g(shù)創(chuàng)新而使用復(fù)雜模型。
參考文獻(xiàn)
[1] 吳永和,錢雨,郭勝男,等.邁向可信學(xué)習(xí)分析:報告解析、結(jié)構(gòu)模型與未來生態(tài)——2023年學(xué)習(xí)分析與知識國際會議評述[J].現(xiàn)代遠(yuǎn)距離教育,2023(5):3-15.
[2] 江波,高明,陳志翰,等.基于行為序列的學(xué)習(xí)過程分析與學(xué)習(xí)效果預(yù)測[J].現(xiàn)代遠(yuǎn)程教育研究,2018(2): 103-112.
[3] 歐陽嘉煜,范逸洲,羅淑芳,等.特征工程:學(xué)習(xí)分析中識別行為模式的重要方法 [J].現(xiàn)代教育技術(shù), 2018, 28(4): 13-19.
[4] 李艷燕,馬韶茜,黃榮懷.學(xué)習(xí)分析技術(shù):服務(wù)學(xué)習(xí)過程設(shè)計和優(yōu)化[J].開放教育研究,2012,18(5): 18-24.
[5] 李海峰,王煒.學(xué)習(xí)分析研究:基本框架和核心問題——2022版《學(xué)習(xí)分析手冊》的要點(diǎn)與思考[J].開放教育研究,2022,28(6):60-71.
[6] NISTOR N,HERNáNDEZ-GARCíAC A.What types of data are used in learning analytics?An overview of six cases [J].Computers in Human Behavior,2018,89: 335-338.
[7] 張學(xué)波,李王偉,張思文,等.數(shù)據(jù)使能教學(xué)決策的發(fā)展——從數(shù)據(jù)教育應(yīng)用到多模態(tài)學(xué)習(xí)分析支持教學(xué)決策[J].電化教育研究,2023,44(3): 63-70.
[8] 顧小清,張進(jìn)良,蔡慧英.學(xué)習(xí)分析:正在浮現(xiàn)中的數(shù)據(jù)技術(shù)[J].遠(yuǎn)程教育雜志,2012,30(1):18-25.
[9] 韓錫斌,黃月,馬婧,等.學(xué)習(xí)分析的系統(tǒng)化綜述:回顧、辨析及前瞻[J].清華大學(xué)教育研究,2017,38(3): 41-51,124.
[10] 楊現(xiàn)民,王懷波,李冀紅.滯后序列分析法在學(xué)習(xí)行為分析中的應(yīng)用[J].中國電化教育,2016(2): 17-23,32.
[11] BHARARA S,SABITHA S,BANSAL A.Application of learning analytics using clustering data mining for students’ disposition analysis [J].Education and Information Technologies,2018,23(2): 957-984.
[12] LABROVIC J A,PETROVIC N,ANDELKOVIC J,et al.Patterns of behavioral engagement in an online English language course: cluster analysis[J].Journal of Computing in Higher Education,2023:1-26.
[13] 范逸洲,汪瓊.有效學(xué)習(xí)視角下的學(xué)習(xí)行為辨識技術(shù)[J].中國遠(yuǎn)程教育,2021(1):1-7,76.
[14] 李剛,趙佳琦,鄭澤琳.面向未來的下一代評估設(shè)計——基于OECD《創(chuàng)新評估以測量與支持復(fù)雜能力》報告的思考[J].開放教育研究,2023,29(6): 34-41.
[15] WISE A F,SHAFFER D W.Why theory matters more than ever in the age of big data[J].Journal of Learning Analytics,2015,2(2):5-13.
[16] 尚俊杰,王鈺茹,何奕霖.探索學(xué)習(xí)的奧秘:我國近五年學(xué)習(xí)科學(xué)實(shí)證研究[J].華東師范大學(xué)學(xué)報(教育科學(xué)版),2020,38(9):162-178.
[17] 李成正,彭鵬,曹蕾.在線協(xié)作情境中社會調(diào)節(jié)學(xué)習(xí)行為序列精準(zhǔn)挖掘與分析[J].黑龍江高教研究,2023,41(8):116-121.
[18] WANG Q,MOUSAVI A,LU C.A scoping review of empirical studies on theory-driven learning analytics [J].Distance Education,2022,43(1): 6-29.
[19] GUPTA A,GARG D,KUMAR P.Mining sequential learning trajectories with hidden markov models for early prediction of at-risk students in e-learning environments[J].IEEE Transactions on Learning Technologies,2022,15(6):783-797.
[20] LIU T X,ISRAEL M.Uncovering students’ problem-solving processes in game-based learning environments [J].Computers amp; Education,2022,182: 104462.
[21] TANG Y,LI Z,WANG G,et al.Modeling learning behaviors and predicting performance in an intelligent tutoring system: a two-layer hidden Markov modeling approach[J].Interactive Learning Environments,2023,31(9): 5495-5507.
[22] RABINER L R A tutorial on hidden Markov models and selected applications in speech recognition[J].Proceedings of the IEEE,1989,77(2): 257-286.
[23] KUPIEC J.Robust part-of-speech tagging using a hidden Markov model[J].Computer Speech amp; Language,1992,6(3): 225-242.
[24] EDDY S R.Hidden Markov Models[J].Current Opinion in Structural Biology,1996,6(3):361-365.
[25] 喬麗方,趙蔚,段紅,等.基于隱馬爾可夫模型的學(xué)習(xí)者在線自我調(diào)節(jié)學(xué)習(xí)過程挖掘——時間動力學(xué)視域下的分析[J].電化教育研究,2022,43(10): 57-64.
[26] 程罡,孫迪,尚偉偉.基于教育大數(shù)據(jù)的大規(guī)模私有在線課程中交互活動模式的研究[J].電化教育研究,2022,43(4): 40-46.
[27] GEIGLE C,ZHAI C.Modeling MOOC student behavior with two-layer hidden Markov models[C]// URREA C.Proceedings of the Fourth (2017) ACM Conference on Learning @ Scale.New York:Association for Computing Machinery,2017: 205-208.
[28] WITTEVEEN D,ATTEWELL P.The college completion puzzle: a hidden Markov model approach[J].Research in Higher Education,2017,58: 449-467.
[29] 張思,高倩倩,馬鑫倩,等.私播課論壇中學(xué)習(xí)者會話行為建模研究[J].電化教育研究,2021,42(11): 63-68,106.
[30] 黃志成.基于隱馬爾可夫模型的學(xué)習(xí)行為評估[J].計算機(jī)應(yīng)用與軟件,2014,31(6):59-62.
[31] HELSKE S,HELSKE J.Mixture hidden Markov models for sequence data: the seqHMM package in R[J].Journal of Statistical Software,2019,88(3):1-32.
[32] KUHA J.AIC and BIC: comparisons of assumptions and performance[J].Sociological Methods amp; Research,2004,33(2): 188-229.
[33] HARVEY L.Hidden Markov models and learning in authentic situations[J].Tutorials in Quantitative Methods for Psychology,2011,7(2):32-41.
[34] TANG Y,LI Z,WANG G,et al.Modeling learning behaviors and predicting performance in an intelligent tutoring system: a two-layer hidden Markov modeling approach[J].Interactive Learning Environments,2023,31(9):5495-5507.
[35] CARROLL J B.A model of school learning[J].Teachers College Record,1963,64(8): 1-9.
[36] WOOD D,BRUNER J S,ROSS G.The role of tutoring in problem solving[J].Journal of Child Psychology and Psychiatry,1976,17(2):89-100.
[37] LEE Y H,HEETER C.The effects of cognitive capacity and gaming expertise on attention and comprehension [J].Journal of Computer Assisted Learning,2017,33(5): 473-485.
[38] GAUTHIER J A,WIDMER E D,BUCHER P,et al.Multichannel sequence analysis applied to social science data [J].Sociological Methodology,2010,40(1): 1-38.
Hidden Markov Models from a learning sciences perspective: analysing learning processes by linking theory and data
ZHANG Peng1,SU Hanyu1,ZHANG Yuanyuan2,SHANG Junjie1
(1.Graduate School of Education,Peking University,Beijing[KG*2]100871,China; 2.Development Planning Division,Education Department,Jiangxi,Nanchang[KG*2]330038,China)
Abstract Analyzing the learning process is a core focus in learning analytics,but the lack of effective integration between theoretical foundations and analytical techniques often limits the depth of educational insights.The Hidden Markov Model (HMM) offers a powerful,transparent,and interpretable approach to bridge this gap by integrating learning science theory with model construction.This article introduces HMM from an analytical perspective,detailing its basic components and highlighting its important applications in education.It explains how HMM can model learning processes and predict learning outcomes,emphasizing the value of combining theoretical frameworks from Learning Sciences with data-driven methods.Through several case studies,the article illustrates HMM’s typical applications in areas such as game-based learning,academic achievement prediction,and self-regulated learning process analysis.Finally,the article outlines three key directions for using HMM in educational research:analyzing group differences,multi-stage processes,and multi-channel processes.These strategies provide theoretical and practical guidance for advancing learning analytics research with greater educational impact.
Keywords" "learning processes;learning analytics;Hidden Markov Model;learning sciences;research method
[責(zé)任編輯 孫 菊]
收稿日期2024-10-14
基金項(xiàng)目國家自然科學(xué)基金2023年面上項(xiàng)目(62377001)
作者簡介:張鵬(1999—),女,山東青島人。博士研究生,主要研究方向?yàn)閷W(xué)習(xí)科學(xué)、游戲化學(xué)習(xí)。
*通信作者尚俊杰(1972—),男,河南林州人。博士,長聘副教授,研究員,博士生導(dǎo)師,主要研究方向?yàn)閷W(xué)習(xí)科學(xué)與技術(shù)設(shè)計、游戲化學(xué)習(xí)、教育技術(shù)領(lǐng)導(dǎo)與政策等。