郗閩
關(guān)鍵詞: 學(xué)生教學(xué); 認知診斷; 貝葉斯網(wǎng)絡(luò); 結(jié)構(gòu)學(xué)習(xí); 層級關(guān)系; 分類性能
中圖分類號: TN711?34; TP393 ? ? ? ? ? ? ? ? 文獻標識碼: A ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2018)24?0079?03
Research on BN?based generalized cognitive diagnosis model for students
XI Min
(Xian Aeronautical University, Xian 710077, China)
Abstract: In allusion to the disadvantage that only score values are given for measurement and diagnosis of students′ psychological change and generalized cognition, and different knowledge structures with the same score value cannot be explained in the traditional teaching, the Bayesian network (BN) is introduced into the generalized cognitive diagnosis of students on the basis of the fact that, as for the current task of student cognitive diagnosis, information feedback of student test results is more important. The Bayesian structure learning is conducted for the data obtained from the test, so as to obtain hierarchical relationships between attributes. The BN network classifier is constructed to classify the students′ cognitive states. A verification was conducted for the constructed BN?based generalized cognitive diagnosis model of students. The results show that the obtained hierarchical relationships between attributes are reasonable, the classification performance is good, and the model has a broad application prospect.
Keywords: student teaching; cognitive diagnosis; Bayesian network; structure learning; hierarchical relationship; classification performance
在教學(xué)與學(xué)生考試評估中,評估結(jié)果的分數(shù)值并不能揭示隱藏其背后的認知過程與結(jié)構(gòu)信息,而評估通常的主要任務(wù)為反饋信息[1],以有利于對學(xué)生思想政治教育的促進。針對此缺點,本文構(gòu)造了基于BN網(wǎng)絡(luò)的學(xué)生廣義認知診斷模型,將貝葉斯網(wǎng)絡(luò)(Bayesian Network,BN)引入學(xué)生廣義認知診斷中。在此主要進行了兩方面的研究,分別為測驗所得數(shù)據(jù)進行貝葉斯結(jié)構(gòu)的學(xué)習(xí)得到屬性間的層級關(guān)系與構(gòu)建BN網(wǎng)絡(luò)分類器對學(xué)生認知狀態(tài)進行分類,從而更好的為教育服務(wù)。
1.1 ?認知診斷
新一代健康教育理論的核心:認知診斷雖處于發(fā)展初期,但已成為國內(nèi)外心理研究的熱點[2]。在教育中,期待得出學(xué)生認知過程中的具體信息,以指導(dǎo)不同學(xué)生有針對性的學(xué)習(xí)。認知診斷最早可追溯至20世紀六七十年代,提出為掌握而學(xué)的布魯姆認為測驗不僅要提供篩選功能,更能提供具體信息,以提高測驗效度[3]?;谛睦韺W(xué)模型,認知診斷采用心理學(xué)的各種方法分析測驗任務(wù)中所涵蓋的技能、知識等分量,從而獲得模型并進行設(shè)計測驗。最終采用測量模型獲得測量數(shù)據(jù),也即融合各種變量于測量模型,并利用統(tǒng)計方法對個體特征進行揭示。
1.2 ?貝葉斯網(wǎng)絡(luò)概念
1985年提出的貝葉斯網(wǎng)絡(luò)(BN)已在機器學(xué)習(xí)、專家系統(tǒng)與人工智能等領(lǐng)域得到廣泛的應(yīng)用,其是統(tǒng)計學(xué)、數(shù)據(jù)挖掘等多個領(lǐng)域的交叉學(xué)科[4]。BN基于概率論圖形模式,采用概率分布將不確定性設(shè)計成模型以用于分析不確定事物并做出推理[5]。BN包括兩部分:條件概率分布(Conditional Probability Distribution,CPT)與有向無環(huán)圖(Directed Acyclic Graph,DAG),分別表示變量與變量之間的關(guān)系。有向無環(huán)圖又包括測試狀態(tài)、屬性等抽象成的節(jié)點與表示節(jié)點間相依關(guān)系的有向邊,條件概率表示節(jié)點間的聯(lián)系程度[6]。圖1為BN網(wǎng)絡(luò)圖的一個實例,列表中表示了預(yù)測任意實例的概率分布。式(1)為貝葉斯定理,其為貝葉斯網(wǎng)絡(luò)建立的依據(jù)。
[PAiB=PBAiPAij=1nPAjPBAj,i=1,2,…,n] (1)
式中,[A1,A2,…,An]為A的n個不相容狀態(tài),且為必然事件;[PAi,PBAi,PAiB]分別為先驗概率、條件概率與后驗概率。
1.3 ?貝葉斯網(wǎng)絡(luò)學(xué)習(xí)與分類器
1) BN網(wǎng)絡(luò)學(xué)習(xí)
BN網(wǎng)絡(luò)的推論需基于BN網(wǎng)絡(luò)學(xué)習(xí)構(gòu)造的模型。BN網(wǎng)絡(luò)學(xué)習(xí)即通過數(shù)據(jù)以構(gòu)造其網(wǎng)絡(luò),其既可定性又可定量,包括參數(shù)與結(jié)構(gòu)學(xué)習(xí)兩個過程[7]。結(jié)構(gòu)學(xué)習(xí)是構(gòu)建模型,將數(shù)據(jù)的因果關(guān)系圖形化,參數(shù)學(xué)習(xí)則是求得網(wǎng)絡(luò)結(jié)構(gòu)中節(jié)點概率分布。
2) BN網(wǎng)絡(luò)分類器
BN網(wǎng)絡(luò)建立后,采用BN公式根據(jù)被試學(xué)生作答情況進行信息的預(yù)測與能力的推斷分類。BN分類器選取已知類別的訓(xùn)練樣本,通過模式識別判斷測試樣本所屬類別。BN分類器模型可分為樸素、樹增廣的樸素、增廣BN網(wǎng)的樸素BN分類器等。
認知診斷的目的是通過學(xué)生的作答情況,以分析其心理狀態(tài)與知識技能掌握情況。因此,Q矩陣被應(yīng)用其中。其是測試項目與認知屬性的關(guān)聯(lián)陣,是可觀察與不可觀察間的橋梁[8]?;谑孪仍O(shè)定的屬性層級關(guān)系得到Q矩陣、鄰接矩陣,化簡得到Qr矩陣,從而基于Dr編寫題目進行測試,得到最為接近被試者屬性掌握模式以使得BN結(jié)構(gòu)學(xué)習(xí)結(jié)果更加可靠。
本文的屬性結(jié)構(gòu)學(xué)習(xí)采用K2算法,設(shè)變量[X1,X2,…,Xn]的完整數(shù)據(jù)為D,K2算法在被正整數(shù)與排序變量所限制的空間中找尋最優(yōu)模型,其過程為:計算排序中父節(jié)點集合為空時的節(jié)點結(jié)構(gòu)分數(shù),然后將排序在前的節(jié)點組合為其父節(jié)點,形成新網(wǎng)絡(luò)結(jié)構(gòu)并對其進行評分;在評分最高的網(wǎng)絡(luò)結(jié)構(gòu)中找到該節(jié)點的父節(jié)點,重復(fù)進行該過程,直到找出所有節(jié)點的父節(jié)點,進而找到屬性間的層級關(guān)系。認知診斷中的變量包括學(xué)生心理狀態(tài)、知識技能、試題等的認知屬性。
在認知診斷中需要依據(jù)項目反映情況識別原理[9]。BN分類器基于數(shù)據(jù),所有屬性均參與分類,且判斷對象的類是通過其概率值。因此,其為優(yōu)良的分類方法,被廣泛地應(yīng)用在醫(yī)療、故障診斷等領(lǐng)域。
本文中所用到的分類器為樸素、增廣樸素BN分類器,樸素BN模型節(jié)點結(jié)構(gòu)為一個父節(jié)點、多個子節(jié)點,分別為類別與屬性變量,表示為C,[X1,X2,…,Xn],即表示學(xué)生理想掌握模式類別與題目。分類器原理為基于屬性變量值,計算后驗概率分布,該組類別則為得到最大的C值[10]。樸素BN分類公式為:
[PCiX=PCiPXj=1nPxjCi] ? ?(2)
增廣樸素BN模型則是在節(jié)點間增加邊,以彌補樸素BN模型不符合實際的變量間獨立的假設(shè),其分類公式為:
[PCiX=PCiPXj=1nPxjπXj] ? (3)
分類器性能評價標準為復(fù)雜度、簡潔度與準確度,本文采用最為常用的準確度對分類器進行評價,準確度的指標有:正確率、錯誤率、精度與召回率。本文對分類器模型評估采用交叉驗證法,包含hold out,K?fold,leave?one?out三種交叉驗證方法。本文采用其中10?fold法,數(shù)據(jù)會被分成10個等級,共進行10次驗證,每次取數(shù)據(jù)集中1個數(shù)據(jù)集為測試集,9個為訓(xùn)練集。通過題目的細致編制,分析與報告每個學(xué)生的掌握情況,并將其分類到特定的模式中。建立BN分類器的步驟為:
1) 標識類與屬性變量及其值;
2) 搜集含有一系列屬性變量與一個類別變量的數(shù)據(jù);
3) 進行BN網(wǎng)絡(luò)參數(shù)與結(jié)構(gòu)學(xué)習(xí),從而構(gòu)造出含有概率分布表與有向無環(huán)圖的BN網(wǎng)絡(luò)分類器。
4 ?實驗驗證
4.1 ?屬性層級關(guān)系
在學(xué)生心理狀態(tài)中選擇6個知識點屬性,初步設(shè)定其層級關(guān)系,如圖2所示。通過將學(xué)生的觀察反應(yīng)模式與屬性層級模式作為訓(xùn)練數(shù)據(jù)集,得到BN學(xué)習(xí)結(jié)果圖如圖3所示。比較圖2與圖3可得出,兩者結(jié)構(gòu)變化較小,僅在有變化處做出分析可進一步在細節(jié)處了解學(xué)生心理狀態(tài)。
4.2 ?分類器性能評價
為了驗證本文所設(shè)計的分類器性能,對樸素、增廣樸素BN分類器分別運用實證數(shù)據(jù)進行驗證,表1為其分類效果。從表中可看出,兩個分類器效果相差較小,分類正確率可以達到88%,分類效果良好,結(jié)構(gòu)簡單,因而其為有效的分類工具。
本文針對傳統(tǒng)教學(xué)中對學(xué)生心理變化和廣義認知的測量與診斷只給出分數(shù)值,而無法對分數(shù)值相同的不同知識結(jié)構(gòu)進行解釋的缺點,基于目前學(xué)生認知診斷的任務(wù)更多的是學(xué)生測試結(jié)果的反饋信息,將具有堅實數(shù)學(xué)理論基礎(chǔ)、數(shù)據(jù)挖掘理論與算法支持的貝葉斯網(wǎng)絡(luò)引入學(xué)生廣義認知診斷中。文中最后對所構(gòu)造的基于BN網(wǎng)絡(luò)的學(xué)生廣義認知診斷模型進行驗證,結(jié)果表明其得到的屬性層級關(guān)系合理,分類性能良好且結(jié)構(gòu)簡潔,能夠較好地應(yīng)用在認知診斷中,具有廣闊的應(yīng)用前景。
參考文獻
[1] 朱天宇,黃振亞,陳恩紅,等.基于認知診斷的個性化試題推薦方法[J].計算機學(xué)報,2017,40(1):176?191.
ZHU Tianyu, HUANG Zhenya, CHEN Enhong, et al. Cognitive diagnosis based personalized question recommendation [J]. Chinese journal of computers, 2017, 40(1): 176?191.
[2] 毛秀珍.基于屬性掌握概率的認知診斷模型[J].四川師范大學(xué)學(xué)報(自然科學(xué)版),2014,37(3):437?443.
MAO Xiuzhen. The attribute mastery probability cognitive diagnostic model [J]. Journal of Sichuan Normal University (Natural science), 2014, 37(3): 437?443.
[3] 王郁.基于HO?DINA模型的學(xué)生心理多級評分認知診斷模型研究[J].現(xiàn)代電子技術(shù),2018,41(2):53?55.
WANG Yu. Research on multi?level scoring cognitive diagnosis model for students′ psychology based on HO?DINA model [J]. Modern electronics technique, 2018, 41(2): 53?55.
[4] SINGH P K, CHERUKURI A K. A note on bipolar fuzzy graph representation of concept lattice [J]. International journal of computing science & mathematics, 2014, 5(4): 381?393.
[5] 王郁.基于G?AHM模型的群體水平評估認知診斷模型研究[J].現(xiàn)代電子技術(shù),2018,41(10):105?107.
WANG Yu. Research on group?level evaluation cognitive diagnosis model based on G?AHM model [J]. Modern electronics technique, 2018, 41(10): 105?107.
[6] GLYKAS M. Fuzzy cognitive strategic maps in business process performance measurement [J]. Expert systems with applications, 2013, 40(1): 1?14.
[7] LIU Q, WU R, CHEN E, et al. Fuzzy cognitive diagnosis for modelling examinee performance [J]. ACM transactions on intelligent systems & technology, 2018, 9(4): 1?26.
[8] 丁樹良,王文義,羅芬.認知診斷中Q矩陣和Q矩陣理論[J].江西師范大學(xué)學(xué)報(自然科學(xué)版),2012,36(5):441?445.
DING Shuliang, WANG Wenyi, LUO Fen. Q matrix and Q matrix theory in cognitive diagnosis [J]. Journal of Jiangxi Normal University (Natural sciences edition), 2012, 36(5): 441?445.
[9] NIESINK P, POULIN K, ?AJNA M. Computing transitive closure of bipolar weighted digraphs [J]. Discrete applied mathematics, 2013, 161(1): 217?243.
[10] SINGH P K, KUMAR C A. Bipolar fuzzy graph representation of concept lattice [J]. Information sciences, 2014, 288: 437?448.