摘要:信息技術(shù)的發(fā)展,尤其是信息技術(shù)與教育的結(jié)合,使得教育領(lǐng)域一直提倡的因材施教成為可能。認知診斷通過分析學習者的學習數(shù)據(jù),進而挖掘?qū)W習者的認知狀態(tài),為教師實施針對性教學提供支持。認知診斷的常規(guī)模型有傳統(tǒng)模型、模糊診斷模型、基于神經(jīng)網(wǎng)絡模型和基于深度學習模型。文章首先對當前各類模型的常規(guī)算法及其優(yōu)化算法進行了詳細的闡述,然后總結(jié)了各類模型的優(yōu)缺點,最后對未來可能的研究方向進行了預測。
關(guān)鍵詞:認知診斷;IRT;DINA;Fuzzy CDF;神經(jīng)網(wǎng)絡認知診斷;深度學習
中圖分類號:TP301 文獻標識碼:A
文章編號:1009-3044(2024)17-0001-05 開放科學(資源服務)標識碼(OSID) :
0 引言
兩千多年前,孔子提出了“有教無類,因材施教”的教育理念,而我們也一直在嘗試如何能有效做到因材施教。在日常教學中,教師教學任務繁重,班級學生人數(shù)眾多,教師利用常規(guī)的信息化手段已無法高效、準確地找出每個學習者的知識盲點,無法給予學習者精準化、個性化的學習指導。
隨著信息技術(shù)的深入發(fā)展,數(shù)字技術(shù)已經(jīng)成為引領(lǐng)未來的新支柱,數(shù)字與教育的結(jié)合,為目前教育中出現(xiàn)的困局,提出了新的解題思路。認知診斷通過分析學習者答題結(jié)果,挖掘?qū)W習者對題目所涉及的知識點的掌握情況,為教師在教學活動中實現(xiàn)針對性的輔導提供依據(jù)。
1 認知診斷概述
認知診斷是指對學習者認知過程、加工技能或知識結(jié)構(gòu)進行的診斷和評估??赏ㄟ^采集、分析學習者的測試數(shù)據(jù),借助概率統(tǒng)計模型或機器學習算法,獲得學習者在問題解決過程中所用到的知識技能,及其對知識技能的掌握狀態(tài)[1]。隨著人工智能的發(fā)展,認知診斷模型不斷豐富,它的診斷精確度不斷提升,應用場景不斷擴大。認知診斷最開始僅限于線上學習的使用,但在“智學網(wǎng)”等一批線上學習平臺在中小學進行推廣使用后,平臺的線上、線下數(shù)據(jù)有效結(jié)合、不斷擴充,給線下教學提供了很好的數(shù)據(jù)支撐和教學依據(jù);同時認知診斷的應用領(lǐng)域也從最開始的僅用于學習者的答題預測,到現(xiàn)在應用于對學習者認知狀態(tài)的評估、對學習者學習心理因素的分析等。
目前認知診斷模型主要分為傳統(tǒng)模型、模糊認知診斷模型和基于神經(jīng)網(wǎng)絡的認知診斷模型等。
2 傳統(tǒng)的認知診斷理論
2.1 項目反應理論(Item Response Theory, IRT)
IRT是常用的單維連續(xù)型認知診斷模型,模型認為學習者對某一知識點的掌握程度可以用一種非線性函數(shù)來擬合,學習者對知識點的掌握程度是自身學習因素、試題區(qū)分度、試題難度等多因素共同影響的結(jié)果;模型中的單維,表示試題測量的是學習者的一種潛在特質(zhì);連續(xù)是指學習者能力值是連續(xù)型數(shù)據(jù);該模型假設(shè)學習者對試題的作答結(jié)果服從獨立同分布[2]。
當模型考慮試題的區(qū)分度、試題難度、試題的猜測度時,模型即變?yōu)槿齾?shù)模型,如公式(1)所示。公式1表示學習者i 正確回答試題j 的概率。該理論根據(jù)參數(shù)的不同及其應用場景的變化,還有雙參數(shù)模型和單參數(shù)模型。雙參數(shù)模型為不考慮猜測系數(shù)時的函數(shù)狀態(tài),如公式(2)所示;單參數(shù)模型為不考慮猜測系數(shù)和試題區(qū)分度時的函數(shù)狀態(tài),如公式(3)所示。為了更好地對模型解釋,模型所用參數(shù)的數(shù)學符號和含義如表1所示。
IRT實現(xiàn)了對學習者單個能力特質(zhì)的診斷,但無法實現(xiàn)對學習者多個能力特質(zhì)的測量。因此有學者將IRT理論進行多維度改進,即將學習者的能力值以向量的形式呈現(xiàn)。如公式(4)所示:
公式中θ'i =(θi1,θi2,θi3 ...θik )′表示學習者i 的k 維能力向量;α'j =(αj1,αj2,αj3 ... αjk )′表示試題j 的k 維區(qū)分度向量。
胡心穎[3]認為多維的IRT理論依然無法將學習者的能力與具體的知識點一一對應,因此她將Q矩陣引入模型,使得改進后的IRT模型實現(xiàn)了對學習者具體知識點掌握情況的判斷,如公式(5) 所示。公式中qjk表示試題j 是否考察了知識點k;如果qjk=1,表示試題j考察了知識點k;qjk=0,表示沒有考查知識點k;d 是k維的截距參數(shù)。
2.2 確定性輸入噪音與門模型(Deterministic Inputs Noisy And Gate,DINA)
DINA模型是常用的多維離散型認知診斷模型,模型假設(shè)學習者只有掌握了試題考查的所有知識點才能答對該試題。為了模擬真實場景中答題者可能因為僥幸,在不掌握相關(guān)知識點的前提下,答對題;或因為失誤而答錯了會做的題,模型引入了猜測參數(shù)和失誤參數(shù)。模型的項目特征函數(shù)如公式(6)、公式(7)所示。Pj (θi )表示當學習者的知識點掌握情況為 θi 的前提下,學習者答對試題 j 的概率。為方便對模型進行闡述,模型所用參數(shù)的數(shù)學符號和含義如表2所示。
DINA模型通過引入Q矩陣,很好地詮釋了試題和知識點之間的關(guān)系,使模型不僅實現(xiàn)了對學習者學習能力的多維測量,同時也讓模型具有更好的解釋性。但是DINA模型對于大規(guī)模在線數(shù)據(jù)的處理存在收斂速度較慢的問題,雖然有學者試圖通過增加超參來提升收斂速度,但這影響了模型的可解釋性。為此王超[4]嘗試了三種方案以提升數(shù)據(jù)的收斂速度。一是增量DINA模型,它是將學習者數(shù)據(jù)進行分組,每次只對其中一組學習者的數(shù)據(jù)進行遍歷;二是最大熵DINA模型,它嘗試將數(shù)據(jù)分為對參數(shù)貢獻大的變化集Xc 和對參數(shù)貢獻小的懶惰集Xl,在完整遍歷時對數(shù)據(jù)不斷篩選,確定變化集和懶惰集。在部分遍歷時,只對變化集進行遍歷;三是增量最大熵DINA模型,它在數(shù)據(jù)遍歷時不僅考慮變化集和懶惰集,而且在變化集中還對學習者進行分組。實驗證明三種方法都有效提升了數(shù)據(jù)的處理速度,但由于方法三集方法一和方法二的優(yōu)勢,因此方法三對算法的穩(wěn)定性和快速性貢獻度最大。
除了對算法的速度有改進之外,也有學者從實際應用角度對DINA模型提出了改進。湯成[5]將學習者在學習中的遺忘因素和答題次數(shù)對正確答題的影響引入到DINA模型中,對DINA模型的正確回答率進行了完善。Tj 是時間函數(shù),用于模擬學習者學習過程中的遺忘效果和做題次數(shù)對于正確回答試題的鞏固效果。α,β 是擬合艾賓浩斯遺忘曲線的常量參數(shù);γ 為學習者回答試題j 的情況,當學習者正確作答時γ 為1,否則為0。Count(γ)為學習者回答試題j 的次數(shù)。算法如公式(8)、公式(9)所示。
3 模糊認知診斷理論(Fuzzy Cognitive Diag?nostic Framework, Fuzzy CDF)
傳統(tǒng)的認知診斷模型對客觀題的預測有較好的效果,但在處理主觀題時效果不理想,因此又產(chǎn)生了基于模糊集理論的模糊認知診斷模型;并且各位學者基于教學實際場景又在模糊認知診斷模型的基礎(chǔ)上進行了各種完善。
模型首先考慮了學習者自身的潛在特質(zhì),認為潛在特質(zhì)的存在會影響學習者對知識點的掌握情況;其次,模型考慮到學習者對技能已形成的認知狀態(tài);第三,模型結(jié)合專家標注的Q矩陣將主觀題和客觀題分別建模??陀^題利用聯(lián)結(jié)型知識點假設(shè),使用模糊交建模,而主觀題使用補償型知識點假設(shè),采用模糊并建模。因為客觀題如果要正確,需要學習者完全掌握試題中涉及的所有知識點,因此采用聯(lián)結(jié)型假設(shè),而主觀題對學習者來說只要掌握部分知識點即可得分,因此采用補償型假設(shè);第四,模型還考慮了失誤參數(shù)和猜測參數(shù)對分值的影響。模型所用參數(shù)的數(shù)學符號和含義如表3所示。
模型假設(shè)每個知識點k 都有一個模糊集(I,μk)與之對應(I為學習者集合,μk 為知識點k 對應的隸屬度函數(shù)),集合I中的每個學習者i 在知識點k 上的認知水平αik 就是學習者i 在模糊集(I,μk)中的隸屬度,如公式(10)所示。
學習者i 在試題j 上的掌握程度為ηij,其中qjk = 1表示試題j 中考察了知識點k;qjk = 0表示試題j 沒有考查知識點k;當表示學習者i 對客觀題j 的掌握程度如公式(11)所示;當表示學習者i 對主觀題j 的掌握程度如公式(12)所示。
學習者i 在試題j 上的得分,如果考慮到猜測參數(shù)(gj)和失誤參數(shù)(sj)時,對于客觀題得分預測如公式(13)所示,其中客觀題的得分為伯努利分布;主觀題得分預測如公式(14)、公式(15)所示,主觀題采用高斯分布,σ2為主觀題得分的方差。
P (Xij = 1|ηij,gj,sj )=(1-sj)ηij+gj (1 - ηij ) (13)
P (Xij|ηij,gj,sj )=N(Xij|[(1-sj)ηij+gj (1 - ηij )],σ2) (14)
Xij=Σk = 1Kαik qjk (15)
李憂喜[6]認為主觀題中知識點的重要性影響著知識點在試題中的出現(xiàn)次數(shù),知識點高頻次的出現(xiàn)會提升學習者答題的正確率,因此他在模型中以知識點出現(xiàn)的比例來模擬知識點的重要性。將學習者對知識點的掌握程度αik 修改為αik = 1/1 + exp [-1.7 ∝ ik (θi - βik × nm) ] ,其中n 為知識點在試題集中出現(xiàn)的次數(shù),m 為試題集的總數(shù);同時基于主觀題是補償型知識點假設(shè),隨著知識點掌握的數(shù)量增多,正確回答試題的概率會增加,因此他又將學習者i 對主觀題j 的掌握程度改為了ηij= αik/Σk = 1Kqjk,取值范圍是0到1的連續(xù)值,qjk=1,1≤ k ≤ K。
4 基于深度學習的認知診斷理論
4.1 神經(jīng)網(wǎng)絡認知診斷模型
傳統(tǒng)認知模型是利用學習者的歷史答題數(shù)據(jù)來訓練參數(shù),用簡單線性模型來模擬學習者與學習資源的交互。但是學習者在與學習資料的交互中,其認知狀態(tài)是動態(tài)提升的,因此隨著深度神經(jīng)網(wǎng)絡的不斷發(fā)展,以深度學習為基礎(chǔ)的神經(jīng)網(wǎng)絡認知診斷框架(Neu?ral Cognitive Diagnose, Neural CD)[7]誕生了。它不僅可以解決數(shù)據(jù)稀疏問題,而且對不規(guī)則數(shù)據(jù)、稀疏回答記錄也具有較好的預測能力[8]。模型伴隨式地挖掘?qū)W習者的各類參數(shù),建立學習者、知識、學習資源之間的聯(lián)系,達到對學習者進行成績預測的目的。
模型用一個連續(xù)變量hs 表示學生對相關(guān)知識點的熟練掌握程度,hs=sigmoid (xs × A)。其中xs 為學生答題記錄的one-hot向量,A 為學生能力矩陣的待訓練參數(shù),A ∈ RN × K;N 為學生數(shù),K 為知識點數(shù)。
Qe 是試題因素,表示試題與知識點的關(guān)聯(lián)向量,Qe=xe×Q,其中xe為試題的one-hot向量。
試題的難度系數(shù):hdiff=sigmoid(xe × B) B ∈ RM × KM為練習數(shù),hdiff 表示每道試題所涉及知識點的難度系數(shù)矩陣。
試題的區(qū)分度系數(shù):hdisc = sigmoid (xe × D)D ∈ RM × 1
模型用三層全連接網(wǎng)絡來表示學生與題目間的交互,y = Qe × (hs - hdiff)×hdisc,y 為預測學生答對試題的概率。
4.2 基于深度項目反應理論的靜態(tài)認知診斷方法(Deep RIT,DRIT)
程松[9]基于深度學習和項目反應理論(IRT) 提出了基于深度項目反應理論的靜態(tài)認知診斷方法(DRIT)。模型通過給學習者初始化知識點掌握向量,利用深度神經(jīng)網(wǎng)絡來挖掘?qū)W習者的認知狀態(tài)和試題的區(qū)分度;采用注意力機制和循環(huán)神經(jīng)網(wǎng)絡挖掘試題難度;最后利用模型函數(shù)預測學習者得分,模型所用參數(shù)的數(shù)學符號和含義如表4所示。
對于試題Qj,用word2vec模型將試題中所包含的數(shù)量為U 的單詞轉(zhuǎn)化為同一維度的向量,即QTj= {w1,w2...w } u ,假設(shè)每個詞都有d0 維向量;對試題中的每個知識點v 用一個p 維的onehot 向量來表示即Kv ∈ {0,1}p,因此QKj={K1,K2...K } v ;接著利用kv = KvWk將kv變成一個全連接的d1維向量。
學習者認知狀態(tài)及試題區(qū)分度:學習者認知狀態(tài)和試題區(qū)分度都是通過深度神經(jīng)網(wǎng)絡自行習得。認知狀態(tài)是通過給每個學習者初始化一個知識水平向量α;然后用Kq 乘以α,得到一個向量Φ,使其作為深度神經(jīng)網(wǎng)絡的輸入,θ = DNNθ(Φ),即可求出學習者的能力參數(shù)θ;試題區(qū)分度是對試題所考察的知識點進行累加求和,得到一個結(jié)果向量A,然后以A 作為深度神經(jīng)網(wǎng)絡DNNa 的輸入,即A=Σkv ∈ Kvkv,其后系統(tǒng)將自動學習試題的區(qū)分度。由于IRT模型對試題區(qū)分度的要求是在[-4,4]之間,因此在系統(tǒng)得出A 值之后,再通過數(shù)學縮放,將A 值調(diào)整到規(guī)定范圍之內(nèi)。
試題的難度系數(shù):試題的難度系數(shù)由試題文本信息的難度和試題所考查的知識點共同決定。試題文本信息具有時間序列性,為此DIRT模型使用循環(huán)神經(jīng)網(wǎng)絡來學習試題文本難度數(shù)據(jù);試題所考察的知識點難度可通過試題文本信息與知識點之間的相似度衡量,因此系統(tǒng)使用基于注意力機制的循環(huán)神經(jīng)網(wǎng)絡來計算試題的難度。
首先,根據(jù)試題文本信息向量QTj={w1,w2...w } u 與試題里所包含的每個知識點Kq = {k1,k2...k } v ,求出它們的相似性以表示試題的難度,即ξj = wTtkv。
然后,再利用試題文本信息向量QTj={w1,w2...w } u與試題里所包含的知識點向量Kq = {k1,k2...k } v ,根據(jù)自注意機制的注意力值計分函數(shù)xt =Σkv ∈ Kqsoft max( ξj/根號下d0 ) kv + wt(xt 是指每個時刻的輸入)得到序列x =(x1,x2...xN)。
最后將(x1,x2...xN)作為輸入導入到循環(huán)神經(jīng)網(wǎng)絡中,循環(huán)神經(jīng)網(wǎng)絡輸出具有難度特征的隱向量h=(h1,h2...hN)。再將h 進行池化和縮放,即b = 8×(sigmoid(averagepooling(hN)) -0.5) 使難度系數(shù)b 被控制在[-4,4]中。
模型求解:根據(jù)以上算法,在求出學生的認知狀態(tài)、試題區(qū)分度、試題的難度系數(shù)之后,將其帶入項目反應理論中,求得學生在某題上的得分情況。
4.3 基于注意力的概念提升認知診斷模型
苑冬雪[10]等針對目前大部分認知診斷模型還不能有效挖掘概念之間隱含關(guān)系對正確答題的影響,因此嘗試對學生因素、試題因素、概念因素分別建模,設(shè)計出基于注意力機制的概念提升認知診斷模型。模型分為嵌入層、概念提升層、診斷層。
嵌入層將學習者、試題、概念的one-hot向量轉(zhuǎn)變?yōu)閐 維的特征向量,各參數(shù)計算公式及含義如表5所示;再針對每個知識點會對應不同難度的試題,設(shè)計了試題的區(qū)分度函數(shù)hdisc ∈ [ 0,1],hdisc = sigmoid (xq ×D) D ∈ RM × 1 D 為可訓練矩陣。
概念提升層是通過自注意力機制,自動學習各概念間的隱含關(guān)系,即各概念之間的權(quán)重。然后再根據(jù)各概念的權(quán)重,將它們整合,形成一個增強型概念模型。首先k 個概念經(jīng)過線性變化得到三個矩陣:
Q =C× Wq、K =C × Wk、V =C × Wv,其中 Wq、Wk、Wv均為可通過學習而自動更新的權(quán)重矩陣。然后通過A = soft max((Q × KT ) × 1d ) 獲得各概念間的隱含關(guān)系。最后通過C' = sigmoid (AV )獲得整合后的增強型概念模型。
診斷層通過全連接神經(jīng)網(wǎng)絡,得到學習者對概念的掌握程度hs 和試題的難度向量hdiff;同時利用試題因素和概念因素的交互來代替Q矩陣,使Q矩陣可以自動變化,以此來降低傳統(tǒng)認知診斷模型中人工標注Q矩陣的誤差。?代表對應元素相乘。
hs = sigmoid (Wsc × (su?C′) + bsc ) Wsc ∈ R2d × 1
hdiff = sigmoid (Wec × (eq?C′) + bec Wec ∈ R2d × 1
Q′q = soft max(eq × C′T ) x = Q′q⊙(hs - hdiff)×hdisc
最后通過sigmoid函數(shù)實現(xiàn)對學習者在試題上的答題預測:
f1 = sigmoid (W1 × xT + b1 )
f2 = sigmoid (W2 × f1 + b2 )
y = sigmoid (W3 × f2 + b3 )
5 結(jié)論
傳統(tǒng)認知診斷解決了對學習者進行能力值的預測;模糊認知診斷解決了對學習者主、客觀題的分別建模;神經(jīng)網(wǎng)絡則擺脫了人工標記的問題,利用神經(jīng)網(wǎng)絡的自我學習功能,挖掘試題的難度系數(shù)、區(qū)分度系數(shù)等參數(shù),進而求出學習者答對試題的概率。
早期認知診斷主要是除了對傳統(tǒng)認知診斷的算法進行改進外,更多的是對其進行的應用改進。孫晨輝[11]將學習者對知識點的掌握情況分為知道、運用、綜合難度三個層次,使得DINA更貼合學習場景;齊斌[12] 等以PH-DINA(Polytomous Hierarchical DINA)模型結(jié)合協(xié)同過濾算法在同時考慮了個體的知識屬性和種群的知識共性的前提下,實現(xiàn)了試題的精準推薦。
近年認知診斷主要是對基于模糊概念、神經(jīng)網(wǎng)絡的認知診斷模型的應用研究。張雨婷[13]等針對編程課程,提出了基于模糊認知診斷的P-FuzzyCDF(Programming-performance-based fuzzy cognitive diag?nosis framework)的認知模型;王煉紅[14]等考慮到學習者努力因素對知識點掌握的影響程度,提出了在模糊認知診斷的基礎(chǔ)上,基于能力特征與努力特征相融合的特征參數(shù)來建模學習者知識水平。另外還構(gòu)建了知識點弱項特征參數(shù)來提升模型預測準確性的認知反應模型(Cognitive and Response Model,C&RM)。張所娟[15]等針對當前各類模型中并未考慮知識點間相互關(guān)系的問題,構(gòu)想出基于多個知識點的權(quán)重學習,并結(jié)合深度神經(jīng)網(wǎng)絡構(gòu)建認知診斷模型,即融合知識交互的認知診斷模型。
目前認知診斷模型的預測準確度比之前更高,各類應用研究也更貼近現(xiàn)實教學場景。但是在知識遷移和試題文本信息表示上還有一些工作可做。比如:很多課程之間是相互聯(lián)系的,知識也是可以遷移的。但我們目前的研究更多的是針對一門課程進行的診斷。未來可以挖掘不同課程之間的知識遷移現(xiàn)象,以實現(xiàn)跨課程的認知狀態(tài)分析;目前對于試題文本信息的研究,多從文本的角度去進行算法設(shè)計,并沒有考慮到音視頻、圖片等題面信息的表示,未來可以更多地對試題信息的多元化表示進行研究,以豐富試題表示類型的研究。
參考文獻:
[1] 李振,周東岱.基于學科知識圖譜的智能化認知診斷評估方法[J].現(xiàn)代教育技術(shù),2022,32(11):118-126.
[2] 劉淇,陳恩紅,朱天宇,等.面向在線智慧學習的教育數(shù)據(jù)挖掘技術(shù)研究[J].模式識別與人工智能,2018,31(1):77-90.
[3] 胡心穎.基于認知診斷方法的計算機教育數(shù)據(jù)挖掘問題研究[D].合肥:中國科學技術(shù)大學,2021:54-56.
[4] 王超,劉淇,陳恩紅,等.面向大規(guī)模認知診斷的DINA模型快速計算方法研究[J].電子學報,2018,46(5):1047-1055.
[5] 湯成.基于深度學習與認知診斷的教學資源推薦算法研究[D].廣州:華南理工大學,2020:22-31.
[6] 李憂喜,文益民,易新河,等.一種改進的模糊認知診斷模型[J].數(shù)據(jù)采集與處理,2017,32(5):958-969.
[7] 陳恩紅,劉淇,王士進,等.面向智能教育的自適應學習關(guān)鍵技術(shù)與應用[J].智能系統(tǒng)學報,2021,16(5):885-898.
[8] 田剛鴻.面向長周期測評的認知診斷方法研究及應用[D].武漢:華中師范大學,2022:16-17.
[9] 程松.基于深度學習的學生認知水平診斷方法與應用研究[D].合肥:中國科學技術(shù)大學,2021:18-20.
[10] 苑冬雪,孫權(quán)森,傅鵬.基于注意力機制的概念增強認知診斷模型[J].計算機科學,2023,50(11):241-247.
[11] 孫晨輝.基于知識圖譜的JAVA自適應學習平臺設(shè)計與實現(xiàn)[D].武漢:華中師范大學,2020:17-21.
[12] 齊斌,鄒紅霞,王宇,等.基于協(xié)同過濾和認知診斷的試題推薦方法[J].計算機科學,2019,46(11):235-240.
[13] 張雨婷,李征,劉勇,等.基于編程認知診斷模型的學生表現(xiàn)預測[J].計算機系統(tǒng)應用,2023,32(9):239-247.
[14] 王煉紅,羅志輝,劉暢.面向慕課學習者評估的認知反應模型[J].電子學報,2023,51(1):18-25.
[15] 張所娟,余曉晗,陳恩紅,等.融合知識交互關(guān)系的認知診斷深度模型[J].模式識別與人工智能,2023,36(1):22-33.
【通聯(lián)編輯:王力】
基金項目:2022 校級自然科學重點項目《基于知識圖譜的認知診斷研究》(項目編號:ZRKXZ202203);2020 年安徽省教育廳高校優(yōu)秀青年骨干教師國內(nèi)訪問研修項目(項目編號:gxgnfx2020138)