歐頔 曾晟
摘要:為了促進貝葉斯網(wǎng)絡在教育領域的應用,加快實現(xiàn)利用貝葉斯網(wǎng)絡為教育教學賦能的目的,文章采用文獻分析法,針對貝葉斯網(wǎng)絡在教育中的應用開展研究,通過對國內外文獻的檢索以及研究,篩選合適的設計實例,分析貝葉斯網(wǎng)絡在教育中應用方向以及存在的問題,對未來的發(fā)展方向提出展望。
關鍵詞:貝葉斯網(wǎng)絡;人工智能;學生模型
中圖分類號:TP391? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2023)13-0032-03
開放科學(資源服務)標識碼(OSID)
1 基本概念
1.1 貝葉斯定理
貝葉斯網(wǎng)絡也叫作信念網(wǎng)絡,它是利用有向無環(huán)圖和條件概率表來描述屬性與屬性間的依賴關系和聯(lián)合概率分布。
聯(lián)合概率分布公式如公式(1) :
[P(x1,x2,...,xd)=i=1dP(xi∣πi)=i=1dθxi∣πi]? ? (1)
貝葉斯網(wǎng)絡的訓練往往以評分搜索法為基礎,具體是使用評分函數(shù)(Score Function) 估測模型準確率。對于名為D的數(shù)據(jù)集合,貝葉斯網(wǎng)絡B=
[sB|D=fθ∣B∣-LLB|D]? ?(2)
[LL(B∣D)=i=1mlog PB(xi)] (3)
其中,[∣B∣]表示參數(shù)對象數(shù)目,[fθ]表示每個參數(shù)[θ]需要的字節(jié),則[fθ][∣B∣]表示模型參數(shù)需要的字節(jié)數(shù),[LL(B∣D)]表示貝葉斯網(wǎng)絡B的對數(shù)似然,這可以體現(xiàn)出概率分布是比較好地描述了數(shù)據(jù)。因此,貝葉斯網(wǎng)絡的訓練等價于評分函數(shù)最小化。如果網(wǎng)絡結構固定(名為G) ,[fθ∣B∣]為常數(shù)c。因此,將公式(4) 轉換如下:
[s(B|D)=c-LL(B|D)]? ? (4)
如上所示,最小化評分函數(shù)轉換為對參數(shù)的極大似然估計。SPSS Modeler 封裝的貝葉斯網(wǎng)絡算法可以將最大似然作為選擇參數(shù)的方法[1]。
1.2 貝葉斯網(wǎng)絡特點
貝葉斯方法可以用來計算專家系統(tǒng)中的不確定知識。最近幾年數(shù)據(jù)庫內的海量數(shù)據(jù)持續(xù)擴充,同時有研究發(fā)現(xiàn),貝葉斯網(wǎng)絡也可以用在知識發(fā)現(xiàn),尤其是對于大規(guī)模數(shù)據(jù)庫,貝葉斯網(wǎng)絡更加適配,體現(xiàn)在:
1) 對于數(shù)據(jù)不完備的數(shù)據(jù)集,貝葉斯網(wǎng)絡也能夠處理。以往的指導性學習方法掌握一切可能的數(shù)據(jù)輸入,如果某一輸入的數(shù)據(jù)缺失,那么建立的模型就會有偏差,貝葉斯方法可以解決這個傳統(tǒng)的指導性學習方法的缺點,由于貝葉斯網(wǎng)絡反映出來的概率關系是針對整體數(shù)據(jù)域中的數(shù)據(jù),所以在某一變量缺失的情況下,它建立的模型依然是精確的。
2) 貝葉斯網(wǎng)絡可以根據(jù)因果關系進行學習。如果缺少了插入值,貝葉斯網(wǎng)絡仍然能夠進行決策,獲得變量域的理解是數(shù)據(jù)分析的重中之重。
3) 貝葉斯網(wǎng)絡能夠促進知識和數(shù)據(jù)域的關聯(lián),因為貝葉斯統(tǒng)計和貝葉斯網(wǎng)絡緊密相關。以往只有先獲得處理數(shù)據(jù)域的先驗知識才能建立精確預測模型,而貝葉斯網(wǎng)絡具有因果關系,可直接進行因果先驗知識的分析,通過貝葉斯網(wǎng)絡能夠獲得較為全面的先驗知識。
4) 貝葉斯網(wǎng)絡能夠避免數(shù)據(jù)溢出[2]。
2 貝葉斯網(wǎng)絡概述
2.1 貝葉斯網(wǎng)絡發(fā)展歷史
貝葉斯統(tǒng)計的前身是英國學者貝葉斯(Bayes)在1763年發(fā)表的哲學性論文:關于概率問題求解的評論“An Essay Towards solving aproblem in the Doctrine of chances”,后來發(fā)展形成貝葉斯學派。在1921年,遺傳學家SewallWright提出了一個概率模型,把有向無環(huán)圖作為模型基礎,認知科學和人工智能領域將其稱為貝葉斯網(wǎng)絡(Bayesain Networks,BNS)。貝葉斯網(wǎng)絡于20世紀70年代后期取得了初步的進展。
20世紀90年代,學者們開展了進一步研究,在數(shù)據(jù)挖掘以及機器學習領域對其進行應用。最近幾年,與貝葉斯學習理論相關的文章內容涉及的人工智能部分有:模式識別、聚類分析、因果推理和不確定性知識表達等。同時,ISBA作為專業(yè)研究貝葉斯理論的學術刊物網(wǎng)組織出現(xiàn)[3]。
2.2 國內外研究現(xiàn)狀
Pearly在20 世紀 80 年代末,創(chuàng)造性地提出了貝葉斯網(wǎng)絡理論[4],并成功將其應用于專家系統(tǒng)。在此之后,學者們開始廣泛關注貝葉斯網(wǎng)絡,認為它是有效表示與推理不確定知識信息的工具。在理論研究和實際應用上,貝葉斯網(wǎng)絡理論取得了很大的進展。推理、實際應用和網(wǎng)絡學習是當前對貝葉斯網(wǎng)絡的主要研究方向。貝葉斯網(wǎng)絡中的學習分為兩種,參數(shù)學習用于確定各個網(wǎng)絡結點的條件概率分布。結構學習算法分為基于得分的結構學習算法與基于約束的結構學習算法。前者先以評分標準評估數(shù)據(jù)集與網(wǎng)絡結構擬合的程度,再選取分數(shù)最高的網(wǎng)絡結構。后者認為,貝葉斯網(wǎng)絡可以體現(xiàn)隨機變量之間的獨立性關系?;诩s束的結構學習算法首先檢驗訓練數(shù)據(jù)集的獨立性,確定各結點集之間獨立性的統(tǒng)一條件。然后在盡可能多地覆蓋這些條件的情況下,建構獨立性的網(wǎng)絡結構。Cheng[5]用互信息代替條件獨立檢驗,把信息論應用于統(tǒng)計測試,提出三階段算法等。參數(shù)學習一般通過統(tǒng)計樣本來實現(xiàn),先確定網(wǎng)絡結構后計算其中結點的條件概率分布。常用貝葉斯參數(shù)估計、EM(期望最大化)算法、最大似然估計法和Gibbs 抽樣算法。
網(wǎng)絡推理指的是后驗概率,即在給出部分證據(jù)的情況下,確定其中某些結點的取值概率。根據(jù)所要求精度的不同,將推理算法分成了近似推理算法和精確推理算法。精確推理算法常用的有連接樹算法和消息傳播算法。近似推理算法常用基于搜索的方法和基于 Monte Carlo 思想的采樣方法。由于貝葉斯網(wǎng)絡能夠表示和推理因果關系,因此被廣泛應用在包括教育領域在內的各個領域。Millan[6]用離散貝葉斯網(wǎng)絡對學生進行測評并構建學生模型,首先,依靠貝葉斯網(wǎng)絡預測學生回答正確的概率,據(jù)此得出一種自適應的診斷算法。Zapata[7]用貝葉斯網(wǎng)絡建立分布式多代理教學系統(tǒng),構建了學生模型,利用其推理能力建立自適用于學生的學習應用。Martin 用離散貝葉斯網(wǎng)絡評估學生知識掌握情況,利用貝葉斯網(wǎng)絡的推理能力預測學生掌握某一知識點的概率,并分析學習行為 [8]。王璋[9]應用離散貝葉斯網(wǎng)絡于評估導學,預測學生掌握某一知識點的程度,說明了在評估學生方面貝葉斯網(wǎng)絡推理機制是有效的。黃建明等人[10]把離散貝葉斯網(wǎng)絡用于預測學生成績的高低。學生群體掌握知識的程度是連續(xù)的,以上學者離散化連續(xù)變量的取值,將掌握程度的取值區(qū)間分割成離散值。雖然計算得到簡化,但是也會損失變量特征,而且在實際情況中,區(qū)間內所有的連續(xù)值不可能都是同一種情況,這會降低預測的精度。
3 貝葉斯網(wǎng)絡的應用
3.1 應用現(xiàn)狀
貝葉斯網(wǎng)絡目前主要用在以下幾個方面:
1) 專家系統(tǒng)
貝葉斯網(wǎng)絡的推理能力可達到專家水平,它能夠模仿人的智能,解決專業(yè)領域的實際問題。如在醫(yī)學上,遠程醫(yī)療系統(tǒng)CPCSBN優(yōu)于世界上常用的遠程醫(yī)療診斷方法;Pathfinder用于輔助“淋巴節(jié)點”的診斷。
2) 數(shù)據(jù)挖掘
貝葉斯網(wǎng)絡可用于輔助聚類分析。因果關系是普遍存在于客觀世界的一種關系,學者們發(fā)現(xiàn)在數(shù)據(jù)挖掘中,貝葉斯網(wǎng)絡能夠挖掘多層、多點的因果概念關系。貝葉斯統(tǒng)計學作為其起源,使得含有統(tǒng)計性質的數(shù)據(jù)挖掘與貝葉斯網(wǎng)絡順理成章地結合起來。
3) 故障診斷
貝葉斯網(wǎng)絡可用于分析故障特征,尋找故障原因;依據(jù)常見故障或當前系統(tǒng)狀態(tài),進行故障監(jiān)控和故障預防。比如微軟為幫助用戶解決使用過程中可能發(fā)生的問題,在視窗軟件中加入了疑難解答。
4) 學習幫助
通過引導學習者掌握事件發(fā)生的規(guī)律和事件二者的因果關系,貝葉斯推理原理可以對學習者進行學習幫助。對考試結果的研究和分析,有助于教師的思考、觀點和建議。領導決策時也可以依據(jù)分析,作為自己制定工作策略的參考,指導學校的教學工作[11]。
3.2 建立學生模型
國內和國外的學者已經(jīng)對學生模型做出了許多研究。一些學者從構成學生模型的內部要素角度分析建模。首都師范大學的王陸、楊卉等人[12]提出了兩層動態(tài)學生模型,用廣義模糊綜合評判方法來評價學生的二級特征。國外部分學者[13]認為從知識水平的角度來說,對學生知識狀態(tài)的主要有鉛版模型、基于約束的模型、覆蓋模型等。有研究者[14]總結了不同模型的特點,提出了基于覆蓋模型和認知偏差或者是對其他模型的整合;還有學者[15]以學習者個性特征為關鍵構建學生模型,如像認知風格和認知偏好等個人特征。近年來適應性技術和情感計算不斷發(fā)展,人們也開始關注基于情緒感知的學生模型。
用于自適應學習系統(tǒng)時,學生對節(jié)點知識的掌握程度表現(xiàn)為貝葉斯網(wǎng)絡中某一節(jié)點概率[16]。節(jié)點知識分為兩大類,一類為定性知識,一類為定量知識,此種圖論模型就是對節(jié)點知識的結構化描述[17]。劉艷等[18]學者提出了新方法評估學生的學習情況,基于貝葉斯網(wǎng)絡的學習評估方法可以精確地測算出學生對某塊知識的掌握程度,得到學生的差異性結果,就可以開展個性化的學習策略。
建立學生模型,從信息處理的角度看就是分析處理學生學習的各種信息,包含著認知診斷和知識表示兩個方面。建立模型的理論和方法有許許多多,目前常見的包括認知型、偏差型和覆蓋型。覆蓋型的學生模型,描述的是學習者哪些內容知道,哪些內容不知道,把學生的知識作為領域中專業(yè)知識的某個子集來描述。對于有著大量知識點的課程測試,覆蓋模型能清晰地表示出先驗知識。
馬文龍[19]建立的適應性教學系統(tǒng)采用粗蓋型學生模型,用一種自動和人工相結合的方法構造模型。課程的領域專家(即授課老師)先根據(jù)個人的教學經(jīng)驗,給出該課程某些知識點的先驗概率,再由系統(tǒng)建立領域知識模型、構建貝葉斯網(wǎng)絡結構、選擇條件概率分布函數(shù)。系統(tǒng)投入使用一段時間后,已收集到足量的學生數(shù)據(jù),可以開展推理和優(yōu)化。馬文龍的學習者模型模擬了知識在大腦中存儲的過程。課程知識按照領域里面內在的邏輯關系被模型連接為語義網(wǎng)絡。學習者也是以這樣的邏輯順序來學習課程知識的。所以,首先需要做的是,建立領域知識模型,即將知識點間的邏輯關系整理清楚。
對于眼下流行的教育超媒體系統(tǒng),貝葉斯網(wǎng)絡推理機制也可以有效地為其服務,如何針對其特點構造有效而準確的網(wǎng)絡是難點重點。閆志勇[20]著眼于構造網(wǎng)絡的過程,抓住教育超媒體系統(tǒng)中課程知識點與知識點關系緊密的特點,利用層次劃分減少聚簇數(shù)量,在通過聚簇消除無向環(huán)方法的基礎上,使得貝葉斯推理減少了計算量。
馬愛利[21]設計了一個模擬系統(tǒng)以模擬數(shù)學的教學,以貝葉斯網(wǎng)為學生模型,用于遠程教學,功能結構圖如圖1所示:
學科知識點儲存在學科知識庫,用于學習本科知識的所有規(guī)則儲存在學科規(guī)則庫。題庫內是每一章節(jié)的測試題、練習題與下一章節(jié)的預習。將學科規(guī)則庫、學科知識庫和學生學習記錄相結合,通過推理機制能夠整合成教學資源,通過決策控制模型和信息控制模型能夠轉換為長期學生模型。學生行動解釋器主要負責處理信息并針對答題情況提供反饋。教師行動解釋器主要負責在學生需要幫助時給予合適的幫助,不同情況的學生會得到個性化的教學決策。學生學習記錄中保存著該生題目作答情況,便于學生及教師掌握自己的學習變化[21]。
4 問題和展望
1) 在選取用于建立學生模型的學生特征時,除知識水平相關因素外,也應考慮個性特征。如學習風格、學習興趣、認知偏好等。未來的研究中,可以對學生特征的建模進行補充,擴充學生模型。
2) 領域專家提供的知識點關系較為主觀,貝葉斯網(wǎng)絡具備學習能力,如若提供足夠的實驗數(shù)據(jù),貝葉斯網(wǎng)絡完全可以自動構建網(wǎng)絡結構,模型的完備性和準確性會大幅提升。未來的研究中,可以利用貝葉斯網(wǎng)絡的學習算法進行知識地圖的分析和構建。
3) 當前在設計個性化學習路徑時,更為關注的是對學習者知識掌握程度的預測,未來的研究應更多地結合學生的學習風格、認知偏好等因素,以推薦更加個性化的學習路徑。
參考文獻:
[1] 毛瑤瑤.數(shù)據(jù)挖掘模型在智慧教育中的應用研究[D].西安:西安電子科技大學,2021.
[2] 王瑋,陳恩紅,王煦法.基于貝葉斯方法的知識發(fā)現(xiàn)[J].小型微型計算機系統(tǒng),2000,21(7):703-705.
[3] 慕春棣,戴劍彬,葉俊,等.用于數(shù)據(jù)挖掘的貝葉斯網(wǎng)絡[J].軟件學報,2000,11(5):660-666.
[4] A Bayesian Diagnostic Algorithm for Student [M]. San Francisco: Morgan Kaufmann, 1988:51-53.
[5] Cheng J, Grainer? J. Kelly. How To Build an Effective Knowledge Map [J]. Artificial Intelligence,2002(137):43-90.
[6] Learning Bayesian Networks The Combination of [J]. User Modeling and User-Adapted Interaction, 2002,12(2-3):281-330 .
[7] Zapata-Rivera J D,Greer J.Inspectable Bayesian student modelling servers in multi-agent tutoring systems[J].International Journal of Human-Computer Studies,2004,61(4):535-563.
[8] Cristina Conati,Abigail Gertner,Kurt Vanlehn.Using bayesian networks to manage uncertainty in student modeling[J]. International Journal of? Human-Computer Studies,1995,42(6):575-591.
[9] 王璋.基于貝葉斯網(wǎng)絡的評估導學方法研究[D].杭州:浙江工業(yè)大學,2006.
[10] 黃建明.貝葉斯網(wǎng)絡在學生成績預測中的應用[J].計算機科學,2012,39(S3):280-282.
[11] 沈海峰.基于貝葉斯網(wǎng)絡數(shù)據(jù)挖掘技術理論及算法的研究[D].合肥:合肥工業(yè)大學,2002.
[12] 楊卉,王陸,馮紅.在智能教學系統(tǒng)中兩層動態(tài)學生模型的研究[J].電化教育研究,2005(1):72-75.
[13] 陳仕品,張劍平.適應性學習支持系統(tǒng)的學生模型研究[J].中國電化教育,2010(5):112-117.
[14] 孫中紅.個性化智能網(wǎng)絡教學系統(tǒng)中學生模型的研究[J].中國電化教育,2009(10):107-110.
[15] 劉小丹,胡小紅.自適應學習系統(tǒng)中基于情緒感知的學生模型設計[J].中國教育信息化·高教職教,2015(10):85-88.
[16] 董曉輝,楊曉宏,張學軍.自適應學習技術研究現(xiàn)狀與展望[J].電化教育研究,2017,38(2):91-97,121.
[17] 陳麗花.貝葉斯網(wǎng)絡在學生模型建模中的應用分析[J].微型機與應用,2010,29(8):80-82.
[18] 劉艷,張銳.基于貝葉斯網(wǎng)絡的學習評估模型及其在E-learning系統(tǒng)的應用[J].滁州學院學報,2009,11(4):49-52,55.
[19] 馬文龍,瞿有甜,張金偉.貝葉斯網(wǎng)絡在適應性教學系統(tǒng)中的應用研究[J].計算機系統(tǒng)應用,2008,17(1):68-71.
[20] 閆志勇,李明,倪勁峰,等.貝葉斯網(wǎng)絡在自適應教育超媒體中的應用[J].計算機工程與應用,2002,38(8):217-219.
[21] 馬愛利,張卓奎.貝葉斯網(wǎng)絡在遠程教學中的應用[J].現(xiàn)代電子技術,2008,31(2):129-133.
【通聯(lián)編輯:唐一東】