張所娟 黃 松 余曉晗 陳恩紅
在學(xué)習(xí)場(chǎng)景中,知識(shí)的關(guān)聯(lián)性普遍存在[1],這種關(guān)聯(lián)性強(qiáng)調(diào)各個(gè)知識(shí)并不是孤立存在[2-3],學(xué)習(xí)不是多個(gè)知識(shí)的簡(jiǎn)單累加,而是“整體大于部分之和”[4]的過(guò)程.在不同的學(xué)習(xí)場(chǎng)景下,知識(shí)的關(guān)聯(lián)性發(fā)揮不同的作用.對(duì)于教師而言,在有限的教學(xué)時(shí)間內(nèi),需要根據(jù)知識(shí)的關(guān)聯(lián)性[5-6]合理設(shè)計(jì)編排教學(xué)內(nèi)容,有效組織教學(xué)活動(dòng).對(duì)于學(xué)生來(lái)說(shuō),需要找出知識(shí)系統(tǒng)的薄弱環(huán)節(jié),分析影響學(xué)習(xí)的關(guān)鍵點(diǎn).另外,科學(xué)合理的試題建立需要覆蓋課程知識(shí)體系中的重難點(diǎn).無(wú)論在何種場(chǎng)景下,解決教師教學(xué)、學(xué)生學(xué)習(xí)、題庫(kù)建設(shè)的有效性和知識(shí)間的關(guān)聯(lián)性都不可忽視.
在認(rèn)知診斷和知識(shí)追蹤模型中,大多數(shù)研究者將知識(shí)看作是獨(dú)立的[7-8].然而,學(xué)習(xí)中的知識(shí)之間通常具有密切關(guān)系[9].其中,忽略知識(shí)關(guān)系的一個(gè)主要原因是一旦知識(shí)屬性與模型及其聚合關(guān)系一起引入時(shí),知識(shí)之間的關(guān)系就變得不清楚[10].針對(duì)此問(wèn)題,Leighton等[11]提出AHM(Attribute Hierarchy Method),認(rèn)為學(xué)習(xí)過(guò)程中知識(shí)之間構(gòu)成一個(gè)相互關(guān)聯(lián)的網(wǎng)絡(luò).AHM將知識(shí)構(gòu)成一個(gè)層次結(jié)構(gòu)以建立知識(shí)間的關(guān)聯(lián)[12].
現(xiàn)有知識(shí)關(guān)聯(lián)的研究更多集中在對(duì)知識(shí)先決關(guān)系的討論[13-16],在認(rèn)知診斷[17]和知識(shí)追蹤[18-19]中均有考慮知識(shí)結(jié)構(gòu)信息,將知識(shí)概念之間的先決關(guān)系納入模型中.先決關(guān)系是指學(xué)生要達(dá)到教學(xué)目標(biāo)必須掌握的各級(jí)知識(shí)間的從屬關(guān)系,如特征分析是主成分分析的先決條件[15].同時(shí),要考慮在學(xué)習(xí)達(dá)成目標(biāo)時(shí)可能存在多種解決問(wèn)題的路徑[20-21],不同解題路徑對(duì)應(yīng)不同的知識(shí)點(diǎn)[22].從單個(gè)知識(shí)之間的聯(lián)系上看,無(wú)法明確知識(shí)之間的關(guān)系,而是要置于集合中考慮知識(shí)間的關(guān)聯(lián).因此,有必要對(duì)知識(shí)集合之間的關(guān)系建模.
但是,在現(xiàn)有研究中,對(duì)知識(shí)之間關(guān)聯(lián)性的研究較單一,僅考慮單個(gè)知識(shí)間的關(guān)系,未考慮知識(shí)集合之間的關(guān)聯(lián),更無(wú)法處理集合間的復(fù)雜關(guān)系.因此,本文引入模糊測(cè)度對(duì)知識(shí)集合進(jìn)行量化度量,并在此基礎(chǔ)上提出基于模糊測(cè)度的知識(shí)關(guān)聯(lián)性建模方法.首先,基于認(rèn)知心理學(xué)理論,分析知識(shí)間存在的三種不同關(guān)系,并利用模糊測(cè)度建模知識(shí)間的關(guān)聯(lián)性,通過(guò)實(shí)際教學(xué)場(chǎng)景論證方法的實(shí)用性.然后,在模糊測(cè)度建模的基礎(chǔ)上,從知識(shí)關(guān)聯(lián)性的視角討論知識(shí)的重要度和交互指標(biāo).最后,研究知識(shí)關(guān)聯(lián)性在認(rèn)知診斷中的應(yīng)用,真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)證實(shí)知識(shí)關(guān)聯(lián)性對(duì)認(rèn)知診斷的影響,不僅有效提升預(yù)測(cè)精度,也提供更好的可解釋性.
由于知識(shí)集合之間的關(guān)聯(lián)性,學(xué)習(xí)的發(fā)生可看作是知識(shí)集合之間相互作用的結(jié)果.依據(jù)認(rèn)知心理學(xué)理論[1],劃分如下3種集合關(guān)系,描述知識(shí)集合間的關(guān)聯(lián)性.
1)負(fù)協(xié)同關(guān)系或冗余關(guān)系.當(dāng)學(xué)生掌握多個(gè)知識(shí)點(diǎn)后,由于知識(shí)之間的相似性,在一定程度上對(duì)學(xué)習(xí)造成干擾,形成負(fù)協(xié)同增強(qiáng)的關(guān)系.舉例來(lái)說(shuō),學(xué)習(xí)字母d之前,學(xué)生很容易辨認(rèn)字母b,但由于字母b、d很相似,會(huì)產(chǎn)生混淆,字母d的學(xué)習(xí)干擾對(duì)字母b的識(shí)別.還有一種情況,知識(shí)x1(分?jǐn)?shù))是知識(shí)x2(分?jǐn)?shù)減法)的先決條件.相比只掌握x2,同時(shí)掌握知識(shí)集合{x1,x2}并不能明顯提高學(xué)生在解答分?jǐn)?shù)計(jì)算上的學(xué)習(xí)表現(xiàn),那么知識(shí)x1、x2存在冗余關(guān)系.
3)相互獨(dú)立關(guān)系.當(dāng)不符合上述兩種關(guān)系時(shí),認(rèn)為知識(shí)集合之間存在獨(dú)立關(guān)系.
上述3種關(guān)系表達(dá)知識(shí)集合間復(fù)雜的非線性關(guān)系,這對(duì)知識(shí)關(guān)聯(lián)性的量化建模提出挑戰(zhàn).本文引入模糊測(cè)度,對(duì)知識(shí)集合進(jìn)行量化度量,并在此基礎(chǔ)上提出基于模糊測(cè)度的知識(shí)關(guān)聯(lián)性建模方法.
為了更好地表達(dá)知識(shí)集合間復(fù)雜的非線性關(guān)系,本文引入模糊測(cè)度的概念,建模知識(shí)的關(guān)聯(lián)性.經(jīng)典測(cè)度具有可加性.例如,使用測(cè)度表示區(qū)域的面積,那么兩個(gè)不相交的區(qū)域之和的面積等于這兩個(gè)區(qū)域面積之和.概率測(cè)度就是一個(gè)可加性測(cè)度的例子.但是,經(jīng)典測(cè)度在很多情況下無(wú)法滿(mǎn)足可加性,如兩人合作的工作效率不一定等于兩個(gè)人工作效率之和,效率可能提高也可能降低.Sugeno[23]提出使用較弱的單調(diào)性代替可加性的一類(lèi)集函數(shù),即以集合為定義域的函數(shù)[24],稱(chēng)為模糊測(cè)度.模糊測(cè)度的主要特征是非可加性.相比可加性測(cè)度,模糊測(cè)度更符合客觀實(shí)際的情況.
定義1對(duì)于一個(gè)有限集合X,模糊測(cè)度可看作是一個(gè)實(shí)值集函數(shù)v∶2X→[0,1]:
1)v(?)=0,v(X)=1,
2)如果A?X,B?X,A?B,則v(A)≤v(B)
定義2X表示X的冪集,即X的所有子集構(gòu)成的集合.模糊測(cè)度目前已廣泛應(yīng)用于不同場(chǎng)景中,可被描述為重要性、可靠性、滿(mǎn)意度等相似的概念[25].例如,采納專(zhuān)家意見(jiàn)評(píng)價(jià)某設(shè)備的性能,可以使用模糊測(cè)度表示專(zhuān)家意見(jiàn)的可靠性.在教育領(lǐng)域,可將定義1中的X看作是達(dá)成學(xué)習(xí)目標(biāo)所需的n個(gè)知識(shí)的集合X={x1,x2,…,xn}.令X1?X,X2?X,模糊測(cè)度v(X1)為一個(gè)集函數(shù),表示知識(shí)集合X1促進(jìn)目標(biāo)達(dá)成的重要程度.顯然,知識(shí)集合覆蓋所有n個(gè)知識(shí)時(shí),v(X)=1且v(X1)∈(0,1],v(X2)∈(0,1].v(X1∪X2)表示考慮知識(shí)集X1∪X2對(duì)于目標(biāo)達(dá)成的重要程度,不僅要考慮知識(shí)集X1、X2本身的重要性,還要考慮知識(shí)集X1、X2之間的關(guān)聯(lián)性.而知識(shí)關(guān)聯(lián)性可能是顯性確定的,也可能是隱性模糊的.例如,進(jìn)位加法是以十進(jìn)制加法運(yùn)算為基礎(chǔ),它們之間存在顯著的關(guān)聯(lián)關(guān)系.而加法運(yùn)算和乘法運(yùn)算的交互關(guān)系是隱性的,較模糊.知識(shí)集合之間是否存在關(guān)聯(lián)性及關(guān)聯(lián)程度,可通過(guò)模糊測(cè)度建模,量化表達(dá)知識(shí)集合間的關(guān)系.
1)負(fù)協(xié)同關(guān)系或冗余關(guān)系建模.表示知識(shí)組合后對(duì)目標(biāo)達(dá)成的貢獻(xiàn)度低于單獨(dú)使用各個(gè)知識(shí)的貢獻(xiàn)度之和.也就是說(shuō),掌握該知識(shí)集合的重要度弱于單獨(dú)使用其子集重要度的總和,則知識(shí)集合間的關(guān)系是負(fù)協(xié)同關(guān)系.設(shè)知識(shí)集合為X1,X2,同時(shí)X1?X,X2?X.知識(shí)集合間的模糊測(cè)度關(guān)系為:
v(X1∪X2) 滿(mǎn)足上式時(shí),知識(shí)集合之間的關(guān)聯(lián)為負(fù)協(xié)同關(guān)系. 冗余關(guān)系可看作負(fù)協(xié)同關(guān)系的一種特例,用于表達(dá)知識(shí)集合間的先決條件,若知識(shí)x1為x2的先決條件.令X1={x1},X2={x2},根據(jù)定義1中2),即模糊測(cè)度的弱單調(diào)性,知識(shí)集合間的模糊測(cè)度關(guān)系為: v(X1∪X2)=v(X2). 滿(mǎn)足上式時(shí),知識(shí)集合之間的關(guān)聯(lián)為冗余關(guān)系.也就是知識(shí)組合后對(duì)目標(biāo)達(dá)成的貢獻(xiàn)與單獨(dú)使用知識(shí)集合X2相比沒(méi)有變化,對(duì)于目標(biāo)達(dá)成的重要程度不產(chǎn)生增強(qiáng)的作用. 2)增強(qiáng)促進(jìn)關(guān)系建模.多個(gè)知識(shí)組合后有助于學(xué)習(xí)目標(biāo)的達(dá)成,也就是說(shuō)掌握該知識(shí)集合比單獨(dú)使用其子集之和更重要,說(shuō)明知識(shí)集合間互補(bǔ)促進(jìn),存在協(xié)同增強(qiáng)的關(guān)系.當(dāng)知識(shí)集合的模糊測(cè)度符合 v(X1∪X2)>v(X1)+v(X2) 時(shí),認(rèn)為知識(shí)集合存在協(xié)同增強(qiáng)的關(guān)系.上式表示知識(shí)集X1、X2共同構(gòu)成的集合X1∪X2對(duì)于目標(biāo)達(dá)成的重要程度高于各個(gè)知識(shí)屬性集重要度之和.當(dāng)知識(shí)集X1、X2組合后激發(fā)出一種新的潛在關(guān)聯(lián),對(duì)促進(jìn)目標(biāo)的達(dá)成更重要. 3)相互獨(dú)立關(guān)系建模.兩個(gè)知識(shí)集組合后的對(duì)于學(xué)習(xí)目標(biāo)達(dá)成的重要度等于這兩個(gè)知識(shí)集單獨(dú)使用時(shí)的重要度之和,當(dāng)模糊測(cè)度滿(mǎn)足 v(X1∪X2)=v(X1)+v(X2) 時(shí),說(shuō)明知識(shí)集之間是相互獨(dú)立,不存在關(guān)聯(lián)性. 通過(guò)知識(shí)集合模糊測(cè)度的對(duì)比,可獲得知識(shí)集合間3種非線性的關(guān)系,由此完成對(duì)知識(shí)關(guān)聯(lián)性的建模.在不同的教育應(yīng)用場(chǎng)景下,模糊測(cè)度可賦予不同的含義以幫助理解教與學(xué)的過(guò)程.在教學(xué)場(chǎng)景中,模糊測(cè)度可幫助教師更好地理解知識(shí)間的聯(lián)系,以此作為編排教學(xué)內(nèi)容的依據(jù).而學(xué)習(xí)場(chǎng)景中加入模糊測(cè)度,在診斷學(xué)生認(rèn)知水平時(shí),基于關(guān)聯(lián)性考慮知識(shí)集的重要程度,可更準(zhǔn)確地找出知識(shí)學(xué)習(xí)中的薄弱點(diǎn).在評(píng)價(jià)場(chǎng)景中,以模糊測(cè)度為基礎(chǔ)檢查知識(shí)體系中重點(diǎn)知識(shí)的覆蓋范圍.因此,通過(guò)模糊測(cè)度建模知識(shí)關(guān)聯(lián)性,有助于不同教育場(chǎng)景下的目標(biāo)達(dá)成.本文在下述討論中統(tǒng)一將模糊測(cè)度作為知識(shí)集合促進(jìn)目標(biāo)達(dá)成的重要程度.通過(guò)模糊測(cè)度建??筛玫乇磉_(dá)知識(shí)集合的關(guān)聯(lián)性,同時(shí)反映知識(shí)集合的特征,為學(xué)習(xí)活動(dòng)的有效開(kāi)展提供數(shù)據(jù)支持和指導(dǎo). 案例分析1以教學(xué)內(nèi)容的編排呈現(xiàn)順序?yàn)槔?,若達(dá)成學(xué)習(xí)目標(biāo)需要3個(gè)知識(shí)共同作用完成,令X={x1,x2,x3}, v({x1})=0.45,v({x2})=0.45,v({x3})=0.3, v({x1,x2})=0.5,v({x1,x3})=0.9, v({x2,x3})=0.9,v({x1,x2,x3})=1. 這里模糊測(cè)度v表示知識(shí)集合促進(jìn)達(dá)成目標(biāo)的重要程度.例如,知識(shí)集合{x1,x2}對(duì)于目標(biāo)達(dá)成的重要程度為0.5. 根據(jù)已知的模糊測(cè)度值,考慮知識(shí)的學(xué)習(xí)序列,通過(guò)不同的編排順序?qū)W(xué)生產(chǎn)生不同的學(xué)習(xí)刺激.存在如下知識(shí)關(guān)聯(lián)性: v({x1,x2}) v({x1,x3})>v({x1})+v({x3}), v({x2,x3})>v({x2})+v({x3}). 由此可知知識(shí)集{x3}與知識(shí)集{x1}、{x2}之間均存在協(xié)同增強(qiáng)關(guān)系,而知識(shí)集{x1}、{x2}之間是負(fù)協(xié)同增強(qiáng)關(guān)系,顯然知識(shí)集{x3}在目標(biāo)達(dá)成中發(fā)揮積極作用.在不考慮先決關(guān)系的條件下,假定以知識(shí)點(diǎn)x1作為學(xué)習(xí)起點(diǎn),設(shè)計(jì)不同的學(xué)習(xí)次序.如圖1中實(shí)線所示,可知序列1對(duì)應(yīng)的學(xué)習(xí)順序?yàn)?/p> 圖1 不同序列下的教學(xué)設(shè)計(jì) x1→{x1,x2}→{x1,x2,x3}, 而序列2對(duì)應(yīng)圖中的虛線部分,知識(shí)的學(xué)習(xí)順序可表達(dá)為 x1→{x1,x3}→{x1,x2,x3}. 在序列1指導(dǎo)下的學(xué)習(xí)活動(dòng)中,學(xué)生學(xué)習(xí)知識(shí)點(diǎn)x1、x2后并未有明顯提升,直到完成知識(shí)點(diǎn)x3的學(xué)習(xí)后才有較明顯的飛躍.序列1的設(shè)計(jì)更適合一般學(xué)習(xí)者,持續(xù)平緩地獲得學(xué)習(xí)成就.對(duì)于序列2的學(xué)習(xí),在前期(學(xué)習(xí)知識(shí)點(diǎn)x1、x3后)學(xué)生可獲得顯著的進(jìn)步,而后期進(jìn)步并不明顯.序列2設(shè)計(jì)更適合于學(xué)習(xí)動(dòng)機(jī)不強(qiáng)的學(xué)生,通過(guò)較快獲得學(xué)習(xí)成就激勵(lì)學(xué)生. 相比其它領(lǐng)域,專(zhuān)家知識(shí)在教育系統(tǒng)中發(fā)揮更重要的作用.對(duì)于專(zhuān)家而言,相對(duì)較容易給出兩個(gè)知識(shí)集合之間的關(guān)聯(lián)指標(biāo)Δj(X1,X2).首先以單知識(shí)集的情況為例,選擇3~5位專(zhuān)家,給出單個(gè)知識(shí)的模糊測(cè)度v({xi})、v({xj})及知識(shí)集間的關(guān)聯(lián)指標(biāo)Δj({xi,xj}).根據(jù)各位專(zhuān)家的意見(jiàn)取平均值,獲得更客觀的結(jié)果.由已知的單個(gè)知識(shí)模糊測(cè)度及關(guān)聯(lián)指標(biāo),可計(jì)算2個(gè)知識(shí)點(diǎn)構(gòu)成集合的模糊測(cè)度: v({xi,xj})=v({xi})+v({xj})+Δj({xi,xj}). 由此,可進(jìn)一步擴(kuò)展為多個(gè)知識(shí)點(diǎn)構(gòu)成的集合 L={xi,xi+1,…,xi+n,…} 的關(guān)聯(lián)指標(biāo)[26-27]: 其中,k表示集合L中的維數(shù),即元素個(gè)數(shù),L(l)表示l維子集構(gòu)成的集合.由此可完成所有知識(shí)集合模糊測(cè)度的計(jì)算. 在涉及單個(gè)知識(shí)點(diǎn)集時(shí),可由領(lǐng)域?qū)<腋鶕?jù)經(jīng)驗(yàn)給定模糊測(cè)度,但是隨著知識(shí)數(shù)量的增加,給出各個(gè)集合的關(guān)聯(lián)指標(biāo)具有一定的主觀性且工作量較大.若能通過(guò)學(xué)生的學(xué)習(xí)數(shù)據(jù)獲得模糊測(cè)度,結(jié)果更客觀有效.通過(guò)數(shù)據(jù)驅(qū)動(dòng)的方法表示和學(xué)習(xí)模糊測(cè)度,使輸入更大的知識(shí)數(shù)目時(shí)模糊測(cè)度這一參數(shù)的學(xué)習(xí)是可計(jì)算的[28].舉例來(lái)說(shuō),若完成學(xué)習(xí)任務(wù)涉及知識(shí)x1、x2、x3,則需要計(jì)算的模糊測(cè)度個(gè)數(shù)為 23-2=6,v(?)=0,v({x1,x2,x3})=1, 如圖2所示. 圖2 模糊測(cè)度的計(jì)算規(guī)模 為了實(shí)現(xiàn)計(jì)算目的,可將模糊測(cè)度v值存儲(chǔ)在大小為2n的數(shù)組中,建立子集X′?X和二進(jìn)制表示方法之間一對(duì)一的映射關(guān)系.若X′={x1,x2,x3},則v({x1})表示為v(001),v({x1,x2})表示為v(011),v({x1,x2,x3})表示為v(111).基于模糊測(cè)度的弱單調(diào)性,構(gòu)成不同子集間模糊測(cè)度的約束關(guān)系,如v({x1})≤v({x1,x2}),且v({x1,x2,x3})=1.若已知函數(shù)的有限離散值α=(α1,α2,…αK)和模糊測(cè)度v,模糊積分計(jì)算得到實(shí)際值s.由此,已知輸入值α和實(shí)際值s,可通過(guò)遺傳算法或神經(jīng)網(wǎng)絡(luò)找到最優(yōu)的模糊測(cè)度v,使損失函數(shù)值最小. 具體算法如下所示. 算法1模糊測(cè)度學(xué)習(xí)算法 輸入輸入值α,實(shí)際值s//α為某函數(shù)f的離散值 輸出模糊測(cè)度的值 設(shè)置迭代次數(shù)t=0 //對(duì)應(yīng)2K-2個(gè)模糊測(cè)度值 Whilet //tmax為最大迭代次數(shù) v1,v2,…,vL=search(μ(t)) //搜索可行解 forl←1 toLdo //通過(guò)模糊積分計(jì)算獲得預(yù)測(cè)值 end for //根據(jù)目標(biāo)函數(shù)計(jì)算損失l vt+1=vl* //更新參數(shù) end while Returnv(tmax) 然而在實(shí)際應(yīng)用中,知識(shí)點(diǎn)的數(shù)量可能遠(yuǎn)超過(guò)3個(gè),那么模糊測(cè)度的計(jì)算會(huì)面臨復(fù)雜性急劇增長(zhǎng)的問(wèn)題.當(dāng)|X|=n時(shí),需確定模糊測(cè)度的數(shù)量為2n個(gè)參數(shù)值.例如,涉及知識(shí)點(diǎn)數(shù)量為10時(shí),所需確定的模糊測(cè)度值為210=1 024個(gè).當(dāng)n值變大時(shí),模糊測(cè)度的數(shù)量呈指數(shù)級(jí)增長(zhǎng),確定模糊測(cè)度變得非常困難.為了應(yīng)對(duì)上述問(wèn)題,可進(jìn)一步引入k可加模糊測(cè)度[29],在模糊測(cè)度的復(fù)雜性和表達(dá)能力方面進(jìn)行折衷. 在實(shí)現(xiàn)模糊測(cè)度的計(jì)算后,可得出知識(shí)的全局重要度及知識(shí)之間的交互指數(shù).基于知識(shí)的關(guān)聯(lián)性,綜合單個(gè)知識(shí)點(diǎn)的模糊測(cè)度值及同時(shí)考慮包含該知識(shí)點(diǎn)所有集合對(duì)應(yīng)的測(cè)度值.可采用合作博弈中Shapley指標(biāo)度量知識(shí)的全局重要度[30]. 定義2令v為一個(gè)模糊測(cè)度,對(duì)于?xi∈X,全局重要度指數(shù)為: (1) 其中,n為知識(shí)集X中的知識(shí)點(diǎn)個(gè)數(shù),n=|X|,A為知識(shí)點(diǎn)集合,A?X. 具體算法如下所示. 算法2計(jì)算知識(shí)全局重要度 輸入二進(jìn)制序列編碼的模糊測(cè)度冪集 輸出知識(shí)點(diǎn)xi的全局重要度 forxi←x1toxndo 獲得局部知識(shí)集合Ai=X{xi},求得局部全集A中所有含k個(gè)元素的子集K fork←0 ton-1 do end for vK∪i=vK∪vi //Ai各子集對(duì)應(yīng)編碼的模糊測(cè)度為vK end for 根據(jù)案例1中模糊測(cè)度值及式(1),計(jì)算知識(shí)點(diǎn)x1的全局重要度: 同理可得,知識(shí)點(diǎn)x2、x3的全局重要度分別為 φ(x2)=0.292,φ(x3)=0.416. 除了知識(shí)自身的重要性以外,還考慮其超集的模糊測(cè)度.盡管知識(shí)x3的模糊測(cè)度值不高,但它和其它知識(shí)關(guān)聯(lián)后產(chǎn)生的模糊測(cè)度值較高,因此知識(shí)x3的全局重要性最高.在此情況下,可將知識(shí)x3看作是后續(xù)學(xué)習(xí)中的重點(diǎn)內(nèi)容,在教學(xué)和學(xué)習(xí)過(guò)程中加以關(guān)注,并在知識(shí)x3上分配相應(yīng)的教學(xué)時(shí)間,設(shè)置練習(xí)的推薦. 通過(guò)模糊測(cè)度還可反映知識(shí)間的交互指標(biāo).例如,某些知識(shí)與其它知識(shí)總是存在積極的交互作用,可看作是學(xué)習(xí)中的關(guān)鍵點(diǎn),說(shuō)明這個(gè)知識(shí)點(diǎn)需要被重點(diǎn)關(guān)注或優(yōu)先推薦學(xué)習(xí)鞏固. 定義3知識(shí)點(diǎn)xi、xj關(guān)于模糊測(cè)度v的交互作用指標(biāo)[31]定義為 [v(A∪{xi,xj})-v(A∪{xi})- (2) 其中 n=|X|,I(xi,xj)∈[-1,1], A?X為知識(shí)點(diǎn)集合,交互指標(biāo)反映兩兩知識(shí)點(diǎn)在整個(gè)知識(shí)集合中的交互作用. 具體算法如下所示. 算法3計(jì)算知識(shí)交互指標(biāo) 輸入按二進(jìn)制序列編碼的模糊測(cè)度冪集 輸出知識(shí)對(duì){xi,xj}的交互指標(biāo) forxi←x1toxndo forxj←xi+1toxndo 獲得局部知識(shí)集合Aij=X{xi,xj}中所有含k個(gè)元素的子集K fork←0 ton-2 do end for vK∪i=vK∪vi //Aij各子集對(duì)應(yīng)編碼的模糊測(cè)度為vK //{xi,xj}交互指標(biāo) end for end for 同樣根據(jù)案例1的模糊測(cè)度值及式(2),可得知識(shí)對(duì){x1,x2}的交互指標(biāo)值: v(?∪{x1})-v(?∪{x2})+v(?)]+ v({x1,x3})-v({x2,x3})+v(x3)]= -0.45. 同理可得, I(x1,x3)=0.1,I(x2,x3)=0.1. 通過(guò)交互指標(biāo)可看出,知識(shí)點(diǎn)x3與知識(shí)點(diǎn)x1、x2交互值均大于0,說(shuō)明知識(shí)點(diǎn)x3對(duì)于學(xué)習(xí)目標(biāo)的達(dá)成較重要. 知識(shí)關(guān)聯(lián)性建模可應(yīng)用到認(rèn)知診斷等實(shí)際學(xué)習(xí)場(chǎng)景中,為教師教學(xué)、學(xué)生學(xué)習(xí)及試題建設(shè)提供有效的輔助決策支持.認(rèn)知診斷旨在識(shí)別認(rèn)知過(guò)程,并評(píng)估學(xué)生是否已掌握或擁有特定的認(rèn)知技能或知識(shí)[32-33],進(jìn)而實(shí)現(xiàn)對(duì)學(xué)習(xí)者表現(xiàn)的預(yù)測(cè). 本文建立融合知識(shí)關(guān)聯(lián)性的認(rèn)知診斷框架,如圖3所示. 圖3 知識(shí)關(guān)聯(lián)性融合的認(rèn)知診斷框架 在認(rèn)知診斷過(guò)程中,若某道題目涉及K個(gè)知識(shí)點(diǎn)(x1,x2,…,xK),題目所需的知識(shí)點(diǎn)標(biāo)記為1,否則為0,那么學(xué)生的潛在能力θ被分解為在這幾個(gè)知識(shí)點(diǎn)上的掌握水平 α={α1,α2,…,αK}, 聚合多個(gè)知識(shí)點(diǎn)后獲得理想的作答情況RI.同時(shí),還需要考慮學(xué)生做題時(shí)猜測(cè)和失誤的影響,得到實(shí)際的作答情況R.將認(rèn)知診斷中多知識(shí)聚合表達(dá)為 RI=f(α1,α2,…,αK), 其中,f∶[0,1]k→[0,1]表示聚合函數(shù),即聚合每個(gè)知識(shí)點(diǎn)上的掌握水平以獲得理想作答情況. 在現(xiàn)有研究中,多個(gè)知識(shí)間的聚合方式通常為聯(lián)結(jié)型和補(bǔ)償型[34],由不同的聚合函數(shù)表示.但無(wú)論何種聚合函數(shù),都未從知識(shí)集合間關(guān)聯(lián)性角度進(jìn)行考慮.由于模糊積分[35]是以模糊測(cè)度為核心建立的聚合方法,可通過(guò)模糊積分中的模糊測(cè)度表達(dá)知識(shí)集合間的關(guān)聯(lián)性,本文引入模糊積分作為聚合函數(shù).融合知識(shí)關(guān)聯(lián)性的認(rèn)知診斷具體實(shí)現(xiàn)如下.首先獲得各個(gè)知識(shí)點(diǎn)及知識(shí)集合間的模糊測(cè)度,利用模糊測(cè)度建模知識(shí)的關(guān)聯(lián)性,通過(guò)模糊積分聚合多個(gè)知識(shí)的掌握水平α,這里選擇模糊積分中的一類(lèi)典型代表Choquet積分[35]實(shí)現(xiàn)聚合計(jì)算: 其中,αk表示學(xué)習(xí)者在第k個(gè)知識(shí)點(diǎn)上的掌握水平,模糊測(cè)度v表示各知識(shí)集合對(duì)于正確作答的重要程度.那么Choquet積分聚合的結(jié)果就表示學(xué)生的理想作答情況,由此實(shí)現(xiàn)認(rèn)知診斷過(guò)程中的知識(shí)關(guān)聯(lián)性融合. 由于FuzzyCDF(Fuzzy Cognitive Diagnosis Frame-work)[36]完整體現(xiàn)認(rèn)知診斷過(guò)程,本次實(shí)驗(yàn)以FuzzyCDF作為實(shí)驗(yàn)框架,通過(guò)預(yù)測(cè)學(xué)習(xí)者的學(xué)習(xí)表現(xiàn)驗(yàn)證本文方法的可行性.實(shí)驗(yàn)中使用模糊積分替換FuzzyCDF中原有的聚合函數(shù). 從公平性角度出發(fā),本文實(shí)驗(yàn)采用與FuzzyCDF相同的參數(shù),具體實(shí)現(xiàn)細(xì)節(jié)見(jiàn)文獻(xiàn)[37].學(xué)生潛在能力θ及知識(shí)掌握水平α通過(guò)M-H(Metro-polis-Hastings)的馬爾科夫蒙特卡洛算法學(xué)習(xí)獲得.對(duì)于聚合函數(shù)Choquet 積分中模糊測(cè)度的參數(shù)學(xué)習(xí),由模糊積分神經(jīng)網(wǎng)絡(luò)[38]實(shí)現(xiàn). 首先將由FuzzyCDF得到學(xué)生在各知識(shí)點(diǎn)上的掌握水平作為輸入,輸出是學(xué)生在每道題目上的作答得分.根據(jù)定義1,模糊測(cè)度 其中,Δv(A)∈R+,由此可確保模糊測(cè)度的單調(diào)性.模糊積分神經(jīng)網(wǎng)絡(luò)根據(jù)模糊測(cè)度的單調(diào)性約束設(shè)計(jì)基于隨機(jī)梯度下降的優(yōu)化方法,實(shí)現(xiàn)模糊測(cè)度的訓(xùn)練(算法描述見(jiàn)2.2節(jié)).在獲得各知識(shí)點(diǎn)的模糊測(cè)度后,使用Choquet積分計(jì)算多知識(shí)聚合后學(xué)生的理想作答情況. 實(shí)驗(yàn)選擇公開(kāi)數(shù)據(jù)集Math1和Math2(http://staff.ustc.edu.cn/~qiliuql/data/math2015.rar),Math1數(shù)據(jù)集包含15道客觀題和5道主觀題,Math2數(shù)據(jù)集包含16道客觀題和4道主觀題,客觀題的得分為{0,1},主觀題得分為[0,1]. 使用AUC(Area Under the Curve)和MAE(Mean Absolute Error)作為評(píng)估指標(biāo),對(duì)比認(rèn)知診斷模型預(yù)測(cè)效果. 實(shí)驗(yàn)將Choquet積分作為聚合函數(shù)的模型(簡(jiǎn)稱(chēng)為CHI(Choquet Integral)方法)(https://github.com/kathy-sj/Choquet-integrals),并將CHI和其它基準(zhǔn)方法對(duì)比.選擇FuzzyCDF、 IRT(Item Response Theory)[39]、DINA(Deterministic Inputs, Noisy "And" Gate Model)[40]作為對(duì)比方法. 同時(shí)構(gòu)造2種不同比例的訓(xùn)練數(shù)據(jù)集,首先隨機(jī)抽取80%的數(shù)據(jù)用于訓(xùn)練,20%的數(shù)據(jù)用于測(cè)試模型效果.為了進(jìn)一步觀察各預(yù)測(cè)方法在不同數(shù)據(jù)稀疏度情況下的預(yù)測(cè)效果,再隨機(jī)抽取20%的數(shù)據(jù)用于訓(xùn)練,80%的數(shù)據(jù)用于測(cè)試模型. 各方法在Math1、Math2數(shù)據(jù)集上的得分預(yù)測(cè)結(jié)果如圖4所示.由圖可知,在認(rèn)知診斷模型中融合知識(shí)關(guān)聯(lián)性后,即使使用CHI進(jìn)行預(yù)測(cè),相比FuzzyCDF,在訓(xùn)練數(shù)據(jù)占 80% 的情況下,MAE值分別下降2.8%(Math1數(shù)據(jù)集)和0.8%(Math2數(shù)據(jù)集),比IRT和DINA更有優(yōu)勢(shì).在訓(xùn)練數(shù)據(jù)占20%的情況下,MAE值平均降低 0.7%.由此證實(shí)CHI在數(shù)據(jù)稀疏時(shí)仍有效. (a)Math1 另一方面,針對(duì)數(shù)據(jù)集中的客觀題計(jì)算AUC值,如圖5所示.由圖可看出,在考慮知識(shí)關(guān)聯(lián)性后,預(yù)測(cè)精度更高.此外,隨著訓(xùn)練數(shù)據(jù)稀疏度的增加,優(yōu)勢(shì)依然存在. 由圖4和圖5可看出,融合知識(shí)關(guān)聯(lián)性的認(rèn)知診斷模型在預(yù)測(cè)學(xué)習(xí)者表現(xiàn)時(shí),相比未考慮知識(shí)的關(guān)聯(lián)性,可得到更優(yōu)的預(yù)測(cè)效果.對(duì)比Math1、Math2數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),在Math1數(shù)據(jù)集上的優(yōu)勢(shì)更顯著.而在Math2數(shù)據(jù)集上,在80%數(shù)據(jù)用于訓(xùn)練,20%數(shù)據(jù)用于測(cè)試的情況下,CHI僅有微弱的優(yōu)勢(shì).這和Math2數(shù)據(jù)集上知識(shí)點(diǎn)本身的特征有關(guān),知識(shí)點(diǎn)之間存在的關(guān)聯(lián)性較弱(如掌握不等式的性質(zhì)和計(jì)算能力之間相對(duì)獨(dú)立),因此是否融合知識(shí)關(guān)聯(lián)性進(jìn)行預(yù)測(cè)對(duì)結(jié)果影響并不大.但同時(shí)也可說(shuō)明模糊積分作為聚合函數(shù)對(duì)于認(rèn)知診斷工作的通用性,對(duì)關(guān)聯(lián)性較弱的數(shù)據(jù)集同樣適用,并具有相對(duì)較優(yōu)的性能. 此外,為了驗(yàn)證聚合函數(shù)本身對(duì)預(yù)測(cè)效果的影響,進(jìn)行擴(kuò)展實(shí)驗(yàn).在不計(jì)算失誤和猜測(cè)這兩個(gè)因素的情況下,直接將聚合函數(shù)的輸出作為最終分?jǐn)?shù)與實(shí)際得分進(jìn)行對(duì)比,觀察預(yù)測(cè)表現(xiàn)的影響,結(jié)果如表1所示.由表可看出,在Math1、Math2數(shù)據(jù)集上,考慮知識(shí)關(guān)聯(lián)性的模糊積分方法,MAE值分別降低6.2%和1.6%,比考慮失誤和猜測(cè)參數(shù)時(shí)優(yōu)勢(shì)更明顯.而在客觀題上的AUC值分別提高5.2%和1.4%.從結(jié)果上看,預(yù)測(cè)誤差被部分轉(zhuǎn)移到失誤和猜測(cè)參數(shù)中. 表1 不同聚合函數(shù)對(duì)指標(biāo)值的影響 此外,從模型的解釋性上看,融合知識(shí)關(guān)聯(lián)性的認(rèn)知診斷模型可通過(guò)模糊測(cè)度更好地反映知識(shí)之間的關(guān)聯(lián)性.根據(jù)3.1節(jié)和3.2節(jié)的討論,以模糊測(cè)度為基礎(chǔ),計(jì)算各個(gè)知識(shí)點(diǎn)的全局重要度和兩兩知識(shí)點(diǎn)間的交互指標(biāo),可更好地理解和解釋知識(shí)的關(guān)聯(lián)性.下面舉例說(shuō)明. 案例分析2以Math1數(shù)據(jù)集上的第15題為例,題目涉及如下6個(gè)知識(shí)點(diǎn):函數(shù)的性質(zhì)(x1)、函數(shù)的象限(x2)、空間想象(x3)、抽象歸納(x4)、推理論證(x5)、計(jì)算(x6).根據(jù)各知識(shí)點(diǎn)及知識(shí)集合的模糊測(cè)度,可計(jì)算得出每個(gè)知識(shí)的全局重要度及兩兩知識(shí)之間的交互指標(biāo)(見(jiàn)式(1)、式(2)).其中知識(shí)點(diǎn)函數(shù)的性質(zhì)(x1)、函數(shù)的象限(x2)的全局重要程度較高, φ(x1)=0.241,φ(x2)=0.212, 而重要性程度最低(φ(x6)=0.091)的是知識(shí)點(diǎn)計(jì)算(x6)這一通用技能.對(duì)于考察函數(shù)相關(guān)的問(wèn)題,這一結(jié)果是可接受和合理的. 另外,通過(guò)交互指標(biāo)可體現(xiàn)知識(shí)之間的關(guān)聯(lián)性,通過(guò)模糊測(cè)度計(jì)算可得知識(shí)點(diǎn)x1、x2交互指標(biāo)I(x1,x2)=-0.206,知識(shí)點(diǎn)x1、x6交互指標(biāo)I(x1,x6)=-0.068.一般而言:交互指標(biāo)越高,互補(bǔ)性越強(qiáng)[41];交互指標(biāo)越低,知識(shí)點(diǎn)之間的關(guān)聯(lián)性越高.根據(jù)計(jì)算結(jié)果可看出,知識(shí)點(diǎn)x1、x2之間的關(guān)聯(lián)性更強(qiáng).從知識(shí)點(diǎn)本身上看,函數(shù)的性質(zhì)(x1)和函數(shù)的象限(x2)之間的關(guān)聯(lián)性必然強(qiáng)于函數(shù)的性質(zhì)(x1)和計(jì)算(x6)之間的聯(lián)系.這與交互指標(biāo)顯示的結(jié)果一致,也說(shuō)明模糊測(cè)度表征知識(shí)關(guān)聯(lián)性的有效性. 案例分析3以Math1數(shù)據(jù)集上的主觀題為例,知識(shí)全局重要度與影響得分程度之間的關(guān)系如圖6所示.圖中橫軸表示每道題涉及知識(shí)點(diǎn)對(duì)應(yīng)的全局重要度,基于模糊測(cè)度計(jì)算得出全局重要度(見(jiàn)式(1)).縱軸表示是否掌握知識(shí)點(diǎn)對(duì)得分的影響程度,由計(jì)算知識(shí)點(diǎn)掌握水平與實(shí)際得分的皮爾遜相關(guān)系數(shù)表示. 圖6 知識(shí)全局重要度與影響得分程度的關(guān)系 由圖6可見(jiàn),題17需要3個(gè)知識(shí)點(diǎn){x5,x10,x11},對(duì)應(yīng)的全局重要度分別為 φ(x5)=0.25,φ(x10)=0.35,φ(x11)=0.4, 這3個(gè)知識(shí)點(diǎn)的知識(shí)掌握水平與實(shí)際得分的相關(guān)系數(shù)分別為0.6,0.67,0.72.知識(shí)的重要性越高意味著該知識(shí)對(duì)于學(xué)生實(shí)際得分的影響越大.題16、18、19也有同樣趨勢(shì).而對(duì)于第20題,由于各個(gè)知識(shí)點(diǎn)的全局重要度相近,對(duì)應(yīng)的知識(shí)點(diǎn)掌握水平與得分的相關(guān)系數(shù)也接近.由圖6可看出,越重要的知識(shí),其掌握水平與實(shí)際得分的相關(guān)系數(shù)就越大,這一趨勢(shì)符合一般認(rèn)知規(guī)律,進(jìn)一步說(shuō)明模糊測(cè)度建模的合理性. 關(guān)聯(lián)性存在于知識(shí)及知識(shí)集合之間,這種關(guān)聯(lián)性可能是顯性確定的,也可能是隱性模糊的.本文通過(guò)模糊測(cè)度建模知識(shí)的關(guān)聯(lián)性,量化表達(dá)知識(shí)及知識(shí)集合復(fù)雜的關(guān)系,這對(duì)于理解學(xué)生的認(rèn)知過(guò)程具有積極意義.本文同時(shí)以模糊測(cè)度為基礎(chǔ),拓展延伸至知識(shí)全局重要度和交互指標(biāo)及知識(shí)關(guān)聯(lián)性在認(rèn)知診斷這一場(chǎng)景中的應(yīng)用,充分體現(xiàn)知識(shí)關(guān)聯(lián)性對(duì)實(shí)際學(xué)習(xí)場(chǎng)景的現(xiàn)實(shí)意義.基于現(xiàn)有的認(rèn)知診斷框架,引入模糊測(cè)度對(duì)知識(shí)關(guān)聯(lián)性進(jìn)行表征.本文對(duì)于框架中參數(shù)的學(xué)習(xí)問(wèn)題開(kāi)展研究,然而如何學(xué)習(xí)獲得更優(yōu)化的參數(shù)仍是一個(gè)挑戰(zhàn).為此,下一步將考慮借助其它研究工作實(shí)現(xiàn)參數(shù)優(yōu)化,并基于此著力解決認(rèn)知水平和知識(shí)關(guān)聯(lián)性統(tǒng)一表征的認(rèn)知診斷框架實(shí)現(xiàn)問(wèn)題.2 模糊測(cè)度計(jì)算
2.1 依賴(lài)于專(zhuān)家知識(shí)的模糊測(cè)度計(jì)算
2.2 數(shù)據(jù)驅(qū)動(dòng)的模糊測(cè)度計(jì)算
3 知識(shí)的全局重要度和交互指標(biāo)
3.1 知識(shí)的全局重要度
3.2 知識(shí)的交互指標(biāo)
4 在認(rèn)知診斷中的應(yīng)用
4.1 融合知識(shí)關(guān)聯(lián)性的認(rèn)知診斷
4.2 實(shí)驗(yàn)設(shè)置與結(jié)果分析
5 結(jié) 束 語(yǔ)