摘" 要:在信息化時代教育變革的背景下,個性化學習逐漸成為研究的焦點,實現(xiàn)個性化學習的關(guān)鍵之一是對學習者的認知能力進行精準評估,以便對學生成績做出準確預(yù)測。文章基于認知診斷和集成學習理論,提出了一種基于多特征認知診斷的學生成績預(yù)測模型,綜合考慮學生的潛在能力特質(zhì)和知識點掌握程度對答題表現(xiàn)的影響,旨在提高成績預(yù)測的準確性。通過對比實驗、參數(shù)敏感性實驗和案例分析,驗證了模型的有效性。
關(guān)鍵詞:認知診斷;集成學習;成績預(yù)測
中圖分類號:TP391.1" 文獻標識碼:A" 文章編號:2096-4706(2024)23-0033-04
Student Performance Prediction Model Based on Multi-feature Cognitive Diagnosis
LI Shulin1, LI Zilin2
(1.Guangyuan Lizhou Secondary Specialized School, Guangyuan" 628017, China;
2.North Sichuan College of Preschool Teacher Education, Guangyuan" 628017, China)
Abstract: In the context of educational reform in the information age, personalized learning has gradually become a focal point of research. One of the key aspects of achieving personalized learning is the precise assessment of learners' cognitive abilities to accurately predict student performance. Based on cognitive diagnosis and Ensemble Learning theories, this paper proposes a student performance prediction model based on multi-feature cognitive diagnosis, which comprehensively considers the impact of students' latent ability traits and mastery degree of knowledge points on answering performance, aiming to improve the accuracy of performance prediction. Through comparative experiments, parameter sensitivity experiments and case analysis, the effectiveness of the model is verified.
Keywords: cognitive diagnosis; Ensemble Learning; performance prediction
0" 引" 言
《中國教育現(xiàn)代化2035》[1]指出,要加快信息化時代教育變革。建設(shè)智能化校園,統(tǒng)籌建設(shè)一體化智能化教學、管理與服務(wù)臺。隨著教育信息化的持續(xù)深入以及互聯(lián)網(wǎng)的迅猛發(fā)展,在線教育已成為計算機融合傳統(tǒng)教育領(lǐng)域而形成的一個新的重要研究和應(yīng)用方向[2]。認知診斷是在線教育中對學生的認知水平進行分析的重要理論。通過模型分析后的數(shù)據(jù),教師可以掌握學生的詳細情況,進而做到有的放矢。
認知診斷作為個性化學習的核心技術(shù),已有30多年的發(fā)展歷史。認知診斷可以對學生的知識結(jié)構(gòu)和認知過程進行評價。傳統(tǒng)的認知診斷模型通常依賴于人為設(shè)計的交互函數(shù),其中最經(jīng)典的就是確定性技能診斷模型(DINA[3]),隨著時代發(fā)展,技術(shù)的進步,深度學習在不同的領(lǐng)域都取得了不錯的結(jié)果,2020年Wang等人通過神經(jīng)網(wǎng)絡(luò)應(yīng)用與教育認知診斷相結(jié)合,提出了神經(jīng)認知診斷模型[4],它借助神經(jīng)網(wǎng)絡(luò)對學生、試題、學生與試題的交互過程三者進行建模,提高了模型的學習能力,之后又在此模型上進行了擴展,在該模型的基礎(chǔ)上考慮知識點之間的隱性關(guān)系對學生知識點掌握程度的影響,實現(xiàn)了深度學習與認知診斷的結(jié)合。
為了發(fā)揮不同認知診斷模型的優(yōu)勢,本文采用了集成學習算法。集成學習模仿了人類在做出重大決策前會尋求多種意見來輔助判斷的行為。人類做出重大的決定前會尋求多種意見來輔助決策,集成學習算法就是模仿這種行為而產(chǎn)生[5]。通過結(jié)合多個基學習器的優(yōu)勢,集成學習可以提升模型整體的效果。集成學習更多的是一種框架思想,因此集成學習與其他機器學習方法無縫結(jié)合成為可能[6]。
目前的認知診斷模型主要集中于診斷學生的知識點掌握情況,往往忽略了學生潛在能力特質(zhì)的影響。本文提出了一種基于多認知診斷模型集成的學生成績預(yù)測方法,綜合考慮學生的潛在能力特質(zhì)和知識點掌握程度對答題表現(xiàn)的影響,以提高預(yù)測的準確性和全面性。
1" 模型架構(gòu)
模型的構(gòu)建基于集成學習Stacking思想,通過集成多維項目反應(yīng)理論模型和基于深度學習的認知診斷模型,綜合考慮了學生的潛在能力特質(zhì)和知識點掌握程度特征,得到更準確的評估。
1.1" 模型框架
該模型將神經(jīng)認知診斷模型與多維項目反應(yīng)理論模型進行集成,在預(yù)測的時候同時考慮了知識點掌握程度和潛在能力特質(zhì)對答題情況的影響。模型部分結(jié)構(gòu)如圖1所示。
1.2" 模型輸入層
該文將學生的特征以及試題特征分別送入模型中,學生的特征以θ與α來表示本文認為學生的知識點掌握程度以及能力均是連續(xù)的,其每個數(shù)都介于0到1之間。其中θs以及αs可以通過學生的獨熱碼向量xs以及深度網(wǎng)絡(luò)訓練出來的矩陣得到,如式(1)所示:
θs,αs?X s (1)
試題難度與區(qū)分度也會影響學生知識點的掌握情況,因此利用b向量來表示試題的難度特征,而a表示試題區(qū)分度向量,其向量的每個數(shù)都介于0到1之間,為連續(xù)小數(shù)。a、b可以通過試題的獨熱碼向量xe和通過深度學習訓練出來的B、C矩陣得到,如式(2)所示:
a,b?X e (2)
1.3" 模型中間層
在得到向量θs、αs、a、b后,再將此向量分別送入式(3)和(4)。其中Qe為Q矩陣向量,即該題所包含的知識點。根據(jù)公式即可分別得到知識點掌握程度,以及學生的潛在能力值。
(3)
(4)
1.4" 模型輸出層
在得到θ與α之后,將此向量進行拼接,送入全連接層,如式(5)所示:
(5)
在模型訓練階段,通過最輸出試題答對的概率和正確標簽之間的標準交叉熵損失來學習模型的參數(shù),如式(6)所示。其中ytrue表示真實的答題結(jié)果,取值為0或1,表示學生的答題是錯誤還是正確。通過將這個損失最小化,模型的參數(shù)w和b將被調(diào)整,從而使模型在測試數(shù)據(jù)上可以更準確地預(yù)測學生答題的正確性。
(6)
2" 實驗結(jié)果及分析
2.1" 數(shù)據(jù)集
實驗采用Math2015數(shù)據(jù)集。該數(shù)據(jù)集中包含Math1和Math2兩個數(shù)據(jù)集的信息,如表1所示。
Math1數(shù)據(jù)集(http://staff.ustc.edu.cn/~qiliuql/data/math2015.rar)是某高中最終數(shù)學測試的數(shù)據(jù),測試練習包括客觀練習和主觀練習。該數(shù)據(jù)集有72 359個交互記錄,4 209個學習者,15個客觀練習題,5個主觀練習題和11個知識概念。這里采用Math1數(shù)據(jù)集中的客觀題部分來進行實驗。
Math2數(shù)據(jù)集(http://staff.ustc.edu.cn/~qiliuql/data/math2015.rar)是某高中最終數(shù)學測試的數(shù)據(jù),測試練習包括客觀練習和主觀練習。該數(shù)據(jù)集有62 578個交互記錄,3 911個學習者,16個客觀練習題,4個主觀練習題和16個知識概念。這里采用Math2數(shù)據(jù)集中的客觀題部分來進行實驗。
2.2" 實驗參數(shù)和評價指標
本文實驗使用的主要的參數(shù)如下:
1)批大小(batch_size)。批大小用于指定每次送入網(wǎng)絡(luò)中訓練數(shù)據(jù)樣本的大小,本研究批大小設(shè)置為32。
2)學習率(learning_rate)。學習率用來控制網(wǎng)絡(luò)參數(shù)權(quán)重的更新幅度,本研究最終設(shè)置學習率為0.002。
3)迭代次數(shù)(epoch)。深度學習模型中的迭代次數(shù)代表模型進行完整訓練的次數(shù),本文設(shè)定迭代次數(shù)為30。
4)優(yōu)化器(optimizer)。基于梯度使用不同的優(yōu)化器來最小化損失函數(shù)會有不同的效果,本研究選擇的優(yōu)化器為Adam[7]算法。
同時本研究采用了以下四個評價指標:準確性(ACC)、曲線下面積(AUC)、均方根誤差(RMSE),與神經(jīng)認知診斷(NCDM)保持一致。
2.3" 對比實驗
選取的基線有MIRT[8]、MCD、NCD[4]和SCDM[9],其中MIRT屬于項目反應(yīng)理論,MCD為數(shù)據(jù)挖掘下的認知診斷模型,NCD與SCDM均為深度學習下的認知診斷模型,Wang等人[4]和Gao等人[10]的研究證明,將訓練集和測試集按8∶2的比例劃分可以獲得最佳的實驗結(jié)果。數(shù)據(jù)集隨機劃分為8∶2分別作為訓練集和測試集,在測試集上進行對比實驗。實驗結(jié)果如表2和表3所示。
2.4" 超參數(shù)敏感性實驗
參數(shù)敏感性實驗對評估模型在不同參數(shù)配置下的性能表現(xiàn)起到重要作用。本實驗分別從batch_size參數(shù)敏感性和learnig_rate參數(shù)敏感性入手。
2.4.1" batch_size 參數(shù)敏感性實驗
batch_size定義了每次迭代訓練時用于更新模型權(quán)重的樣本數(shù)量。本實驗將batch_size分別設(shè)置為8、16、32和64,從而了解不同batch_size對實驗結(jié)果的影響。本實驗在Math1和Math2兩個數(shù)據(jù)集上分別進行。結(jié)果表明,batch_size設(shè)為不同值時,曲線下面積(AUC)值和準確性(ACC)值均相對穩(wěn)定,即本模型在兩個數(shù)據(jù)集上對batch_size大小變化的敏感度較低,表現(xiàn)相對穩(wěn)定。實驗結(jié)果如圖2所示。
2.4.2" learnig_rate參數(shù)敏感性實驗
learnig_rate用于確定每次迭代中的步長,使損失函數(shù)收斂到最小值。本實驗將learnig_rate分別設(shè)置為0.001、0.002、0.004和0.008,從而了解不同learnig_rate對實驗結(jié)果的影響。同樣,本實驗在Math1和Math2兩個數(shù)據(jù)集上分別進行。結(jié)果表明,learnig_rate設(shè)為0.002時,AUC和ACC的值達到最佳表現(xiàn)。而learnig_rate在其他值時,模型的表現(xiàn)也相對穩(wěn)定。實驗結(jié)果如圖3所示。
2.5" 案例分析
本文隨機選取了一名學生,通過雷達圖對其知識點掌握程度及潛在能力特質(zhì)進行了可視化分析,并基于此對該學生在第2題和第3題的答題情況進行了詳細分析。第2題和第3題分別涉及第3、8和第3、11知識點??梢暬治鼋Y(jié)果如圖4所示。
從圖中可以看到,學生答錯了第2題。首先,學生在第3知識點的潛在能力特質(zhì)與知識點掌握程度相當。但在第8知識點上,雖然學生掌握了該知識點,其潛在能力特質(zhì)較低,導致第2題答錯。而對于第3題,學生答對了,這主要歸因于其在第11知識點上的潛在能力特質(zhì)和知識點掌握程度得分較高。因此,可以得出結(jié)論,學生的潛在能力特質(zhì)對其答題情況有一定的影響。
3" 結(jié)" 論
準確預(yù)測學生的學習成績對教師掌握學生的學習情況具有重要意義,有助于提高教學質(zhì)量、促進學生學業(yè)進步,并有針對性地培養(yǎng)學生的能力。本文采用集成學習方法,結(jié)合多種認知診斷模型的優(yōu)勢,綜合考慮了不同特征,不僅能夠更準確地評估學生對知識點的掌握情況,還能揭示學生的潛在能力特質(zhì)。未來的研究將重點探索如何結(jié)合更多學生的學習特征,以進一步提升模型的整體表現(xiàn)。
參考文獻:
[1] 新華社.中共中央、國務(wù)院印發(fā)《中國教育現(xiàn)代化2035》 [R/OL].(2019-02-23).https://www.gov.cn/zhengce/ 2019-02/23/content_5367987.htm.
[2] 劉淇,陳恩紅,朱天宇,等.面向在線智慧學習的教育數(shù)據(jù)挖掘技術(shù)研究 [J].模式識別與人工智能,2018,31(1):77-90.
[3] TORRE J D L,DOUGLAS J A J P. Higher-Order Latent Trait Models for Cognitive Diagnosis [J].2004,69(3):333-353.
[4] WANG F,LIU Q,CHEN E H,et al. Neural Cognitive Diagnosis for Intelligent Education Systems [C]//Proceedings of the AAAI Conference on Artificial Intelligence.New York:AAAI Press,2020,34(4):6153-6161.
[5] 徐繼偉,楊云.集成學習方法:研究綜述 [J].云南大學學報:自然科學版,2018,40(6):1082-1092.
[6] DONG X B,YU Z W,CAO W M,et al. A survey on ensemble learning [J].Frontiers of Computer Science,2020,14:241-258.
[7] KINGMA D P,BA J. Adam: A Method for Stochastic Optimization [J/OL].arXiv:1412.6980 [cs.LG].[2024-09-06].https://doi.org/10.48550/arXiv.1412.6980.
[8] YAO L H. A Multidimensional Partial Credit Model With Associated Item and Test Statistics: An Application to Mixed-Format Tests [J].2006,30(6):469-492.
[9] SHEN J H,QIAN H,ZHANG W,et al. Symbolic Cognitive Diagnosis via Hybrid Optimization for Intelligent Education Systems [C]//Proceedings of the AAAI Conference on Artificial Intelligence.Vancouver:AAAI Press,2024,38(13):14928-14936.
[10] GAO W B,LIU Q,HUANG Z Y,et al. RCD: Relation Map Driven Cognitive Diagnosis for Intelligent Education Systems [C]//SIGIR'21: Proceedings of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval.[S.I.]:Association for Computing Machinery,2021:501-510.
作者簡介:李姝霖(1999—),女,漢族,四川廣元人,助理講師,碩士研究生,研究方向:智能教育;李子林(1993—),男,漢族,黑龍江哈爾濱人,專任教師,碩士研究生,研究方向:智能教育。