鐘卓 唐燁偉 鐘紹春 趙一婷
[摘? ?要] 領域模型作為構建自適應學習系統(tǒng)的核心組件,引起了研究者的廣泛關注。文章針對現(xiàn)有教育領域模型知識內容分散、能力刻畫不足的問題,提出了能夠建立知識、問題、能力三者間映射關系的教育知識圖譜KQA模型。該模型由知識圖式、問題圖式、能力圖式三層圖式和知識內容、關聯(lián)關系、映射關系、學習路徑四個要素組成。利用基于機器學習的實體抽取、關系抽取、實體對齊等方法,從數(shù)據(jù)獲取、知識抽取、知識融合、知識推理四個方面,提出了教育知識圖譜KQA模型的構建方法。研究為知識圖譜在教育領域的應用提供依據(jù),對個性化學習的開展具有重要意義。
[關鍵詞] 人工智能; 知識圖譜; 模型構建; 機器學習; 學習路徑; 自適應學習
[中圖分類號] G434? ? ? ? ? ? [文獻標志碼] A
[作者簡介] 鐘卓(1987—),男,湖北仙桃人。博士研究生,主要從事智慧教育、數(shù)字化學習環(huán)境的研究。E-mail:382452265@qq.com。
一、引? ?言
近年來,深度學習、知識圖譜、人工神經(jīng)網(wǎng)絡等人工智能技術的迅猛發(fā)展,驅動著社會從“互聯(lián)網(wǎng)+”進入“人工智能+”新時代?!督逃畔⒒?.0行動計劃》中強調:“建立健全教育信息化可持續(xù)發(fā)展機制,構建網(wǎng)絡化、數(shù)字化、智能化、個性化、終身化的教育體系?!盵1]構建新型教育體系的關鍵在于個性化學習的開展,個性化學習的實現(xiàn)離不開自適應學習系統(tǒng)的大力支持。自適應學習系統(tǒng)的核心組件包括領域模型、用戶模型、自適應模型、自適應引擎和呈現(xiàn)模型五部分[2]。領域模型是構建自適應學習系統(tǒng)的重要基礎和核心要素,而構建語義清晰、結構完整、可擴充性好的領域模型是自適應學習系統(tǒng)面臨的一個重要挑戰(zhàn)。以知識圖譜為代表的人工智能技術為教育領域模型構建提供了技術保障?!缎乱淮斯ぶ悄馨l(fā)展規(guī)劃》特別指出,“重點突破知識加工、深度搜索和可視交互核心技術,形成涵蓋數(shù)十億實體規(guī)模的多源、多學科和多數(shù)據(jù)類型的跨媒體知識圖譜”[3]。因此,利用知識構建、知識挖掘、知識推理等技術,實現(xiàn)對教育領域模型的知識抽取、表達、融合、推理和利用,這是當前教育領域研究的重要課題。
二、教育領域模型構建現(xiàn)狀分析
領域模型構建是指利用建模技術對領域知識進行標簽化與序列化的過程,教育領域模型構建是指利用知識抽取、知識融合等技術對學科知識及知識之間關聯(lián)關系建立聯(lián)系的過程,其目的是為了讓知識序列化,以便更好地促進教與學。教育領域模型構建常用到的方法有概念圖(Concept Map)、知識地圖(Knowledge Map)和知識圖譜(Knowledge Graph),這三種方法都可以進行知識的表征與圖式,但這三個概念容易混淆,現(xiàn)在進行一下辨析。
概念圖最早是由Novak教授提出的組織和表征知識的工具,包括節(jié)點和連線兩部分,用節(jié)點表示概念,用連線表示概念之間的關聯(lián)關系[4]。概念圖包括命題、概念、交叉連接和層級結構四個要素。概念圖既能描述知識,還能對知識進行評價。Trowbridge等人利用概念圖對大學課程進行了評價,分析學生對同一節(jié)課的知識理解差異[5];Ruiz-Primo等人將概率圖作為評估工具,發(fā)現(xiàn)學生的概念圖被解釋為代表他(她)的記憶(認知結構)中概念組織的重要方面[6]。
知識地圖的概念最早是由Dansereau和Holley提出的一種知識的關系網(wǎng)絡[7],知識地圖能夠將零散的知識組織起來形成序列化的知識,促進學習者知識建構。知識地圖表示知識獲取路徑及知識間的關系,不僅可以表征知識體系結構,還能夠幫助學習者精準定位所需知識。知識地圖在教育領域主要應用在學科知識結構的體系化構建中。Kim認為知識地圖能夠建立知識的關聯(lián)關系,幫助知識結構化,便于知識理解[8];李艷紅等人認為,知識地圖能夠幫助教師重塑學習內容和學習資源,有效體現(xiàn)學科體系、學習目標、學習活動的關聯(lián)關系和層次關系[9];劉紅晶等人認為,知識地圖可以反映某個學科的知識結構,促進學習者生成關聯(lián)化和網(wǎng)絡化的學習思維[10]。
知識圖譜最初是以科學知識計量為對象,通過圖示化展現(xiàn)知識的結構關系,屬于科學計量學的研究范疇[11]。知識圖譜是結構化的知識語義網(wǎng)絡,圖譜中的節(jié)點表示實體,圖譜中的邊表示節(jié)點間的語義關系。三元組是知識圖譜的通用表達方法,即 G={E,R,K},其中,E是實體集合,R是關系集合,K是知識集合。Leo 等人認為,學科知識圖譜作為知識點與知識點以及知識點與教學資源之間建立連接的語義網(wǎng)絡,能夠在學習資料語義關聯(lián)、學習者模型構建、學習資源個性化推薦等方面發(fā)揮重要作用[12];李振等人認為,教育知識圖譜是一種以知識元為節(jié)點,根據(jù)其多維語義關系進行關聯(lián),在知識層面和認知層面上表示學科領域知識和學習者認知狀態(tài),可用于知識導航、認知診斷、資源聚合、路徑推薦的知識組織與認知表征工具[13];余勝泉等人認為,學科知識圖譜是基于知識之間的語義關系所形成的知識之間的邏輯關聯(lián)網(wǎng),在此基礎上,疊加教學目標、教學問題、認知狀態(tài),進而生成認知地圖[14]。
在通用領域,知識圖譜主要應用在大規(guī)模知識庫和智能搜索引擎上。大規(guī)模知識庫,知名的有Metaweb公司的Freebase知識庫、維基媒體基金會主持的Wikidata知識庫以及德國馬普所科研人員研發(fā)的YAGO綜合知識庫;搜索引擎,知名的有谷歌Google Search、微軟Bing Search和百度知心。在教育領域,美國的Knewton 公司利用知識圖譜構建了包含概念及其先決關系的跨學科知識體系,清華大學聯(lián)合微軟研究院開發(fā)了開放學術圖譜Open Academic Graph,北京師范大學余勝泉教授團隊研發(fā)了基于知識圖譜的“智慧學伴”[15]。
根據(jù)上述分析,本研究對概念圖、知識地圖和知識圖譜三個相似概念從概念內涵、組成要素、知識范圍、知識關系、應用領域五個維度進行了對比分析,系統(tǒng)梳理出三者的相似性和差異性,對比分析見表1。
綜上所述,知識圖譜相比概念圖、知識地圖,能夠表達更加廣泛的知識內容以及語義關聯(lián)關系,而且構建的自動化程度較高。但經(jīng)過文獻分析發(fā)現(xiàn),當前知識圖譜在知識內容表示、學習者能力刻畫、構建方法等方面仍存在以下問題:(1)在知識內容表示方面,現(xiàn)有知識圖譜還是集中在基本知識點的描述,知識內容分散,缺乏以學科關鍵詞為中心、其他關聯(lián)詞根據(jù)學科語義相關性結合在一起的知識單位——知識簇;(2)在能力刻畫方面,現(xiàn)有知識圖譜大多數(shù)是描述知識點內容與知識點之間的關聯(lián)關系,對學習者能力的刻畫還缺乏進一步研究;(3)在構建方法方面,現(xiàn)有知識圖譜大多數(shù)還是采用領域專家人工構建的方法來完成,缺乏借助機器學習、深度學習、自然語言處理等人工智能技術的自動構建。
三、教育知識圖譜模型構建
(一)教育知識圖譜概念界定
教育知識圖譜主要是利用知識圖譜的方法來描述教育領域知識及知識間關聯(lián)關系的集合。關于教育知識圖譜的概念,學界還沒有統(tǒng)一的定論,可以從教師教學、學生學習、學習服務的不同視角來剖析教育領域知識圖譜的內涵。
1. 教師教學的視角
教育領域知識圖譜是知識與知識間關系形成的網(wǎng)絡圖[16],是教師進行教學設計、組織教學活動的“課程標準”。教師根據(jù)群體學生共性特征,參考教育知識圖譜,設計符合大多數(shù)群體學生的教學安排,篩選適合絕大多數(shù)學習者的學習路徑,真正做到大規(guī)模教育背景下的個性化教學。
2. 學生學習的視角
教育領域知識圖譜是學生認知狀態(tài)的圖式體現(xiàn),是支撐學生開展高品質個性化學習的“行動指南”。依據(jù)教育領域知識圖譜,學生根據(jù)已有的知識水平、興趣愛好、學習方法,選擇個性化的學習路徑,完成學習活動。
3. 學習服務的視角
教育領域知識圖譜是個性化學習資源和學習路徑推薦的服務平臺[17],是構建個性化學習環(huán)境、開展個性化學習的“核心要素”。教育領域知識圖譜在表征領域知識與知識關系的基礎上,推理出知識之間前驅后繼的關系,依據(jù)學習者個性特征(學習方式、認知水平、知識水平),以圖式化的形式精準推薦學習資源與學習路徑。
綜上所述,本研究認為,教育知識圖譜是一種以知識簇為節(jié)點,以問題為線索,以能力培養(yǎng)為目標,將問題解決或任務完成可能的方法有序組織,將所涉及的知識與方法相關聯(lián),通過問題解決和任務完成評測學科能力。這些知識、問題、能力集合以及知識之間、問題之間、能力之間的關聯(lián)關系稱為教育知識圖譜。
(二)教育知識圖譜KQA模型構建
基于教育知識圖譜存在知識內容分散、能力刻畫不足、構建技術自動化程度低等問題,本研究設計了教育知識圖譜模型。學科教學的目的是通過學科知識的學習培養(yǎng)學生的核心素養(yǎng),即學科的思維品質和關鍵能力[18]。學科能力發(fā)展通過分解問題任務來實施,并通過問題任務的完成來評估[19]。在學科教學中,需要將知識映射為學科的問題或任務,并通過問題解決與任務達成來刻畫學科能力。知識、問題、能力及三者間的映射關系是教育知識圖譜模型構建的前提依據(jù),因此,本研究主要抽取“知識(Knowledge)”、“問題(Question)”、“能力(Ability)”三個關鍵詞縮寫,將該模型命名為教育知識圖譜KQA模型(簡稱“KQA模型”),如圖1所示。在所設計的模型中,教學組織者和學習者分別位于模型中的兩個頂端,由知識圖式、問題圖式、能力圖式三個層面以及知識內容、關聯(lián)關系、映射關系、學習路徑四個要素支撐并連接起整個教育知識圖譜KQA模型。
1. 模型解釋
模型的上頂點代表的是教學組織者,在教學中主要指教師,教師依據(jù)教育知識圖譜開展教學設計,組織教學活動。下頂點代表的是學習者,在教學中主要指學生,學生依據(jù)教育知識圖譜開展個性化學習。第一層級知識圖式的三個頂點分別是概念、公式、原理,在知識圖式上建立起概念、公式、原理之間的關聯(lián)關系,并完成知識與問題的映射。第二層級問題圖式的三個頂點分別是問題、任務、創(chuàng)客,教育領域的學科知識將轉化為學科需要解決的問題、任務和創(chuàng)客,在問題圖式上建立起三者之間的關聯(lián)關系,并完成問題與能力的映射。第三層級能力圖式的三個頂點分別是問題解決、批判性思維、創(chuàng)造性思維,通過問題完成或任務達成進行能力的刻畫,并在能力圖式上建立起三者之間的關聯(lián)關系。
2. 模型運作機制
教育知識圖譜KQA模型運作過程是一個動態(tài)平衡、循環(huán)迭代的過程,在三層圖式中,需要一定的運作機制作用于該模型,且機制之間相互影響,從而保證整個模型的正常運轉。本研究所提出的KQA模型主要包括三種運作機制:關聯(lián)機制、篩選機制和優(yōu)化機制,如圖2所示。關聯(lián)機制為知識與知識、問題與問題、能力與能力之間提供關聯(lián),并貫徹于教學活動的組織、開展、評價等各個環(huán)節(jié);篩選機制通過知識、問題、能力之間的關聯(lián)關系記錄學習路徑,篩選出群體學習路徑;優(yōu)化機制收集教學組織者和學習者利用模型開展教學活動的相關數(shù)據(jù),利用人工智能技術進行優(yōu)化,并重新組織關聯(lián)關系,確保KQA模型的迭代進化。
3. 模型三層圖式
教育領域學科的認識活動和問題解決活動可以概括為:學習理解活動、應用實踐活動和遷移創(chuàng)新活動[20]。學習理解活動的關鍵要素有記憶、說明、觀察、概括等,這些對應于知識理解層面;應用實踐活動的關鍵要素有推理、證明、設計、分析等,這些對應于問題解決層面;遷移創(chuàng)新活動的關鍵要素有問題解決、模型建立、批判思考、想象創(chuàng)造等,這些對應于能力應用層面。為此,本研究從知識層、問題層、能力層三層圖式構建了教育知識圖譜KQA模型。
(1)知識圖式
圖式是學習者以往習得知識的結構。教育知識圖譜的知識圖示是描述學科知識與知識關聯(lián)關系的語義網(wǎng)絡圖,將學科基本概念、公式、原理以知識簇的形式進行聚合,知識簇與知識簇關聯(lián)關系通過形式化語義網(wǎng)進行描述。知識圖示可以用通用三元組進行描述,其表示為:KG=(E,R,S),KG為知識圖式,E為實體集合,R為關系集合,S為三元組集合。
(2)問題圖式
用圖式知識來描述與問題和問題類型有關的知識,是對問題圖式較早的詮釋。問題圖式包括:特定類型的問題、解決問題的領域知識和解決問題的策略[21]。教育知識圖譜的問題圖式是學科問題及問題之間關聯(lián)關系的集合。問題圖式是連接知識圖式與能力圖式的紐帶,問題圖式梳理出學科核心問題集,并依據(jù)問題或任務的完成情況來評價學習者能力情況。問題圖示表示為:QG=(Qi,R,Qj),QG代表問題圖式,Qi是問題集中的第i個問題,Qj是問題集中的第j個問題,R是問題集中的關系集合。
(3)能力圖式
教育知識圖譜中的學科能力是指學習者開展學科知識學習和問題解決所需要的心理調節(jié)機制,其本質是結構化、系統(tǒng)化的學科技能及學科經(jīng)驗圖式。能力圖示是學習者能力的可視化刻畫,能力圖式以問題圖示為基礎,通過對問題與任務的完成情況的診斷與評測,進而對學科能力進行量化與評估。能力圖式是教育領域某個學科能力(學科核心素養(yǎng))及其關聯(lián)關系的集合。能力圖式表示為:AG=(Am,R,An),AG代表能力圖式,Am是能力庫中的第m類能力,An是能力庫中的第n類能力,R是能力庫中的關系集合。
4. 模型構成要素
KQA模型主要由知識內容、關聯(lián)關系、映射關系、學習路徑四大基本要素構成。
(1)知識內容
根據(jù)聯(lián)通主義理論,學習是知識結構中節(jié)點和關系重構的過程[22],知識內容是構成教育知識圖譜最基本的單位,包括知識簇、問題集和能力庫三部分。
知識簇是以教育領域基本概念、公式、原理為中心的知識詞聚合,展示和描述與知識詞相關的知識觀念網(wǎng)絡,關聯(lián)以該知識詞為中心的各個知識點的相關知識片段,形成基于詞的知識點的簇狀集聚[23]。
問題集包括教育領域的核心問題與典型任務,具體包括基本問題、組合問題和疑難問題三大類,基本問題通過篩選組合得到組合問題,組合問題通過凝練萃取得到疑難問題。問題集的構建是將知識體系的具體知識還原為需要其解決的問題或任務。問題集不僅要覆蓋全面,還要精準簡練。需要根據(jù)學科基本知識體系梳理學科內核問題集[24]。
能力庫主要包括教育領域學科核心素養(yǎng)指向的學科高階思維能力。布魯姆認為,高階認知指向分析、綜合、評價;安德森認為,分析、評價與創(chuàng)造是高階思維能力的核心要素[25];黃國禎認為,高階思維能力包括問題解決、批判性思維、團隊協(xié)作、溝通和創(chuàng)造性思維[26]。通過對國內外文獻的梳理,本研究認為學科能力主要包括問題解決、批判性思維和創(chuàng)造性思維三項核心能力。學科問題解決能力形成的關鍵是,要有應用知識解決問題的探究環(huán)境,讓學生有機會運用知識解決問題、完成任務。批判性思維能力形成的關鍵是讓學習者能夠運用批判性思維指導與規(guī)劃疑難問題的完成。系統(tǒng)思維能力形成的關鍵是,系統(tǒng)設計不同層次學科內核問題及任務,分層次提供應用體驗機會,全面系統(tǒng)監(jiān)測學習過程和水平,及時反饋評價結果,幫助學生有針對性地調整學習方式和過程[27]。
(2)關聯(lián)關系
知識構建的關鍵在于有意義學習,而有意義學習的關鍵是能夠將新知學習與已有知識之間建立聯(lián)系。教育知識圖譜中關聯(lián)關系主要包括知識與知識之間、問題與問題之間、能力與能力之間的關聯(lián)關系。
知識與知識之間的關聯(lián)關系主要存在于學科基本概念、公式和原理中。學科知識之間的關系常見有父子、兄弟、前后等關聯(lián)關系。問題與問題之間的關聯(lián)關系主要存在于基本問題、組合問題、疑難問題的組合和凝聚上,常見關聯(lián)關系包括一對多、多對一和多對多。能力與能力之間的關聯(lián)關系主要指問題解決能力與批判性思維能力之間的關聯(lián)關系和問題解決能力與創(chuàng)造性思維能力之間的關聯(lián)關系。問題解決能力是學科能力中的關鍵能力,學習者需要結合其他學習者的觀點,反思自己的問題解決方案,提出創(chuàng)新性的問題解決方案[28]。
(3)映射關系
本文構建的KQA模型,不僅能夠表示知識之間的關聯(lián)關系,還能刻畫教育領域的學科能力。但是,學科能力是一個較為抽象的概念,難以進行直接描述。如何對能力進行量化和評估,是一個較大的挑戰(zhàn)。要想刻畫能力,需要在學科能力與問題或者任務之間建立映射關系,即能力發(fā)展通過分解任務來實施,并通過任務的完成來評估。
KQA模型的映射關系包括知識映射問題和問題映射能力兩個方面。知識映射問題是指把教育學科中常見的基本概念、公示、原理映射為問題集中的基本問題、組合問題和疑難問題。問題映射能力是指把問題集中的問題與任務映射為學科應具備的能力,通過問題與任務的完成情況來測量能力的形成程度。映射關系如圖4所示。
圖4? ?KQA模型的映射關系
(4)學習路徑
關于學習路徑的概念界定,可以從知識學習和問題解決兩個視角對其進行內涵解析。從知識學習的視角來看,學習路徑是學習者在學習過程中選擇或被選擇的一系列概念和活動的序列集合[29]。從問題解決的視角來看,學習路徑是在智慧學習理念的指導下,以問題為線索,經(jīng)歷分析、構想、抉擇、評價、歸納等智慧學習過程所包含的學習活動的設計和對活動序列的組織[30]。綜合上述觀點,本研究認為,教育知識圖譜的學習路徑是學習者為達成能力目標,基于學科知識簇,以內核問題為線索,支持學習者經(jīng)歷問題發(fā)現(xiàn)、方案構想、方法抉擇、能力轉化等過程的問題解決或任務完成的序列集合。學科能力的量化是根據(jù)學科問題解決和任務完成情況進行評估。學習者為達成能力目標,需要從一個問題解決狀態(tài)到另一個問題解決狀態(tài),問題解決狀態(tài)之間存在若干個學科核心問題或任務。學科能力形成的關鍵是要有運用知識解決問題或完成任務的體驗環(huán)境,知識學習分為三種方式:聽講式、讀懂式、探究式,問題解決或任務完成可以通過提供聽講、讀懂、探究的體驗環(huán)境實現(xiàn)突破[31]。對每一個問題都會有三種可能的突破方式。總的來說,從一個問題解決狀態(tài)到另一個問題解決狀態(tài),就會存在多條學習路徑,學習路徑如圖5所示。
四、教育知識圖譜構建方法
知識圖譜構建主要研究如何從海量數(shù)據(jù)中抽取指定的實體,并根據(jù)實體信息構建結構化的實體與實體之間的關聯(lián)關系[32]。徐增林等人從知識抽取、知識表示、知識融合、知識推理四個方面提出了知識圖譜的構建方法[33];黃恒琪等人提出了一種自底向上的知識圖譜構建方法,包括數(shù)據(jù)獲取、知識抽取、知識融合、知識加工[34]。教育知識圖譜構建的關鍵在于,利用知識抽取、知識融合等技術抽取出教育領域中的實體,并建立實體間的關聯(lián)關系。教育領域知識來源廣泛,多數(shù)知識以非結構化數(shù)據(jù)和半結構化數(shù)據(jù)進行存儲,如何將這些數(shù)據(jù)利用自然語言技術識別出實體(數(shù)據(jù)獲?。┦墙逃R圖譜構建的首要任務;如何從龐雜的教育領域知識中自動抽取出教育領域的概念、公式、原理(實體抽取),并解決實體語義鏈接的問題(關系抽?。?,是教育知識圖譜構建的第二任務;由于教育領域知識存在知識質量良莠不齊、來自不同數(shù)據(jù)源的知識重復、層次結構缺失等問題,如何將來自不同知識庫的同一實體融合在一起(知識融合),是教育知識圖譜構建的第三任務;如何在已有知識庫基礎上進一步挖掘隱含的知識,從而豐富、擴展知識庫(知識推理),是教育知識圖譜構建的第四任務。通過對國內外文獻的分析,在KQA模型基礎上,本文利用人工智能技術中基于機器學習的實體抽取、關系抽取、實體對齊等方法,從數(shù)據(jù)獲取、知識抽取(實體抽取、關系抽?。⒅R融合、知識推理四個方面提出KQA模型的構建方法,教育知識圖譜KQA模型構建方法如圖6所示。
(一)數(shù)據(jù)獲取
教育領域知識的數(shù)據(jù)獲取來源主要有三類,第一類是非結構化的數(shù)據(jù),這類數(shù)據(jù)大多以文本形式進行存儲,如教學設計、導學案、試題庫等;第二類是半結構化的數(shù)據(jù),如專題網(wǎng)站、在線學習課程等;第三類是結構化的數(shù)據(jù),如專業(yè)教育機構開發(fā)的教學系統(tǒng)。結構化數(shù)據(jù)可以直接使用;非結構化數(shù)據(jù)需要進行實體識別處理;半結構化數(shù)據(jù)需要通過包裝器學習半結構化數(shù)據(jù)的抽取進行處理[35]。
(二)知識抽取
知識抽取是構建教育知識圖譜KQA模型的基礎,知識抽取包括實體抽取和關系抽取。
1. 實體抽取
實體抽取是指從教育領域知識庫中提煉基本概念、公式、原理和學科問題或任務的過程。實體抽取的常見方法有三種:基于規(guī)則的抽取、面向開放域的抽取和基于機器學習的抽取[36]?;谝?guī)則的抽取需要組織數(shù)量眾多的領域專家編寫實體抽取規(guī)則,覆蓋面不足;面向開放域的抽取需要數(shù)量巨大的原始語料,難以操作;基于機器學習的抽取是利用機器學習算法對原始語料進行訓練,將機器學習算法和規(guī)則模型相結合,不僅自動化程度高,而且還能提高準確性。
在本研究中,能力庫由于受教育領域知識影響較大,主觀性比較強,不適合利用機器學習技術進行自動抽取,需要組織教育領域學科專家、教研員、一線教師進行人工抽取。將利用基于機器學習的方法對知識簇和問題集進行實體抽取。知識簇的實體抽取采用條件隨機場模型(Conditional Random Fields,簡稱CRF)實現(xiàn)。假設需要標注的實體序列為X,狀態(tài)序列為Y,實體抽取的問題可以轉化為,求解P(Y/X)取最大值的狀態(tài)序列,在隨機變量X取值為x的條件下,隨機變量Y取值為y的條件概率計算公式如式(1)所示:
映射關系抽取采用開放信息抽取原型系統(tǒng)(TextRunner)進行抽取,人工標記訓練集,利用實體關系分類模型對開放數(shù)據(jù)進行分類,依據(jù)分類結果訓練貝葉斯模型來抽取映射關系,映射關系三元組包括{K,M,Q}和{Q,M,A},K代表知識集,M代表映射關系,Q代表問題集,A代表能力集。
(三)知識融合
知識融合是知識組織的高層次表現(xiàn)形式[37],知識融合最常用的是實體對齊技術。本研究采用基于機器學習的實體對齊方法,其基本流程為:(1)數(shù)據(jù)預處理:利用語法正規(guī)化和數(shù)據(jù)正規(guī)化對原始數(shù)據(jù)進行預處理;(2)分塊:從給定的實體對中,選出潛在匹配的候選項;(3)記錄鏈接:從屬性相似度和實體相似度記錄鏈接;(4)相似度計算:利用聚類算法計算相似度;(5)結果輸出:輸出知識融合結果。實體對齊流程如圖7所示。
(四)知識推理
本研究采用基于圖的推理中Path Ranking算法來實現(xiàn)教育知識圖譜的知識推理,挖掘知識圖譜中的學習路徑。其基本思想是,將教育知識圖譜的問題圖式視為圖,其中問題或任務為節(jié)點,關聯(lián)關系為邊,從初始問題解決狀態(tài)開始,在圖上隨機游走,如果能夠通過某個路徑到達目標問題解決狀態(tài),則挖掘出初始問題解決狀態(tài)和目標問題解決狀態(tài)的學習路徑。假設有任意關系路徑P=R1…Rl,指定一個種子節(jié)點S∈domain(P),一個路徑約束隨機行走定為hs,p。如果P是一個空路徑,則定義如式(7)所示:
五、結? ?語
教育領域模型是教育領域構建自適應系統(tǒng)的關鍵和基礎,也是該領域研究中長期存在的瓶頸問題。本研究針對知識內容粒度模糊、學習能力刻畫不足、構建方法效率低下等問題,從知識圖式、問題圖式、能力圖式三個層面,圍繞知識內容、關聯(lián)關系、映射關系、學習路徑四大關鍵要素,構建了教育知識圖譜KQA模型,為知識圖譜在教育領域的應用和智慧學習環(huán)境構建提供了基礎。一方面,該模型可以助力智慧教學的有效實施,智慧教學實施的關鍵在于精準確定教學目標和篩選、優(yōu)化適合課堂教學的群體學習路徑。教師依據(jù)教育知識圖譜KQA模型,可以清晰地了解學科知識、問題、能力的關聯(lián)關系,在此基礎上,依據(jù)學情分析,精準確定教學目標。教育知識圖譜匯聚了不同學科的共性學習路徑,教師可以根據(jù)學情分析,篩選、優(yōu)化群體學生學習路徑,支撐智慧教學的順利實施。另一方面,該模型可以助力智慧學習高效構建,智慧學習開展的關鍵在于能夠為學習者提供個性化的學習路徑,即向學習者推送最適合的學習資源、學習活動序列和學習任務等,促進學習者個性化學習。學習者依據(jù)KQA模型,借助知識簇聚合學科核心知識,以知識簇的形式推送學習內容,解決學習內容粒度較粗的問題;借助問題集中的基本問題、組合問題、疑難問題,以問題或任務形式倒掛學習資源,讓學習資源精準解決學習問題,促進智慧學習的高效構建。此外,該模型還可以為教育資源體系構建提供重要參考,資源體系是資源組織與存儲的結構方式,高品質的個性化學習離不開優(yōu)質教育資源的大力支持,離開了優(yōu)質資源的教師會出現(xiàn)“巧婦難為無米之炊”的困境。如何借助教育知識圖譜KQA模型,對資源學科分類、資源應用情境、資源適用對象、資源媒體格式、資源呈現(xiàn)形態(tài)進行分析,構建新型的教育資源體系,還需要深入探索。
[參考文獻]
[1] 中華人民共和國教育部.教育部關于印發(fā)《教育信息化2.0行動計劃》的通知[EB/OL].[2018-04-18].http://www.moe.gov.cn/srcsite/A16/s3342/201804/t20180425_334188.html.
[2] 姜強.自適應學習系統(tǒng)支持模型與實現(xiàn)機制研究[D].長春:東北師范大學,2012.
[3] 中華人民共和國國務院.新一代人工智能發(fā)展規(guī)劃[EB/OL].[2017-07-20].http://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm.
[4] NOVAK J D, GOWIN D B. Learning how to learn[M]. Cambridge: Cambridge University Press,1984.
[5] TROWBRIDGE J E, WANDERSEE J H. How do graphics presented during college biology lessons affect students' learning?[J]. Journal of college science teaching, 1996, 26(1):54-57.
[6] RUIZ-PRIMO M A, SHAVELSON R J. Problems and issues in the use of concept maps in science assessment[J]. Journal of research in science teaching, 1998, 33(6):569-600.
[7] HWA L J, AVIV S. Knowledge maps for e-learning [J]. Computers & education, 2012, 59(2):353-364.
[8] KIM S, SUH E, HWANG H. Building the knowledge map: an industrial case study[J]. Journal of knowledge management, 2003, 7(2):34-45.
[9] 李艷紅,趙波,甘健侯.基于知識地圖的MOOC課程開發(fā)[J].現(xiàn)代教育技術,2015,25(5):85-90.
[10] 劉紅晶,譚良.基于知識地圖的MOOC學習共同體的學習研究[J].中國遠程教育,2017(3):22-29,79-80.
[11] 陳悅,劉則淵.悄然興起的科學知識圖譜[J].科學學研究,2005(2):149-154.
[12] LEO Y, UREN V, MOTTA E. SemSearch: a search engine for the semantic web[J]. Lecture notes in computer science, 2006, (10):238-245.
[13] 李振,周東岱.教育知識圖譜的概念模型與構建方法研究[J].電化教育研究,2019,40(8):78-86,113.
[14] 余勝泉,李曉慶.區(qū)域性教育大數(shù)據(jù)總體架構與應用模型[J].中國電化教育,2019(1):18-27.
[15] 余勝泉,彭燕,盧宇.基于人工智能的育人助理系統(tǒng)——“AI好老師”的體系結構與功能[J].開放教育研究,2019,25(1):25-36.
[16] 楊開城.論課程的易理解性與知識建模技術[J].電化教育研究,2011(6):10-14.
[17] 李振,周東岱,王勇.“人工智能+”視域下的教育知識圖譜:內涵、技術框架與應用研究[J].遠程教育雜志,2019,37(4):42-53.
[18] 史寧中.推進基于學科核心素養(yǎng)的教學改革[J].中小學管理,2016(2):19-21.
[19] 姜強,趙蔚,劉紅霞,等.能力導向的個性化學習路徑生成及評測[J].現(xiàn)代遠程教育研究,2015(6):104-111.
[20] 王磊.學科能力構成及其表現(xiàn)研究——基于學習理解、應用實踐與遷移創(chuàng)新導向的多維整合模型[J].教育研究,2016,37(9):83-92,125.
[21] 陳剛,舒信隆.問題圖式在物理問題解決教學中的應用[J].課程·教材·教法,2009,29(7):57-61.
[22] 王佑鎂,祝智庭.從聯(lián)結主義到聯(lián)通主義:學習理論的新取向[J].中國電化教育,2006(3):5-9.
[23] 王華偉,周和玉,韋靚,郟林,張然,王海泉,于雷.基于領域知識詞網(wǎng)的學科知識簇實現(xiàn)初探——以武漢理工大學自動化學科知識簇建設為例[J].情報理論與實踐,2012,35(9):5-8.
[24] 鐘紹春,唐燁偉.人工智能時代教育創(chuàng)新發(fā)展的方向與路徑研究[J].電化教育研究,2018,39(10):15-20,40.
[25] 安德森.學習、教學和評估的分類學——布盧姆教育目標分類學(修訂版)[M].皮連生,譯.上海:華東師范大學出版社,2008:1-20.
[26] LAI C L, HWANG G J. Effects of mobile learning time on students' conception of collaboration, communication, complex problem-solving, meta-cognitive awareness and creativity[M]. Geneva:Inderscience Publishers, 2014.
[27] 鐘紹春,唐燁偉,王春暉.智慧教育的關鍵問題思考及建議[J].中國電化教育,2018(1):106-111,117.
[28] 王靖,崔鑫.深度學習動機、策略與高階思維能力關系模型構建研究[J].遠程教育雜志,2018,36(6):41-52.
[29] KARDAN A A, EBRAHIM M A, IMANI M B. A new personalized learning path generation method: ACO-Map[J]. Indian journal of scientific research, 2014, 5(1): 17-24.
[30] 趙琳,解月光,楊鑫,賈云,張琢.智慧課堂的“動態(tài)”學習路徑設計研究[J].中國電化教育,2017(11):1-6.
[31] 鐘紹春.構建信息時代教育新模式[J].電化教育研究,2019,40(4):23-29.
[32] 魏玉良.互聯(lián)網(wǎng)人物摘要知識圖譜構建方法研究[D].哈爾濱:哈爾濱工業(yè)大學,2019.
[33] 徐增林,盛泳潘,賀麗榮,王雅芳.知識圖譜技術綜述[J].電子科技大學學報,2016,45(4):589-606.
[34] 黃恒琪,于娟,廖曉,席運江.知識圖譜研究綜述[J].計算機系統(tǒng)應用,2019,28(6):1-12.
[35] 漆桂林,高桓,吳天星.知識圖譜研究進展[J].情報工程,2017,3(1):4-25.
[36] 孫鎮(zhèn),王惠臨.命名實體識別研究進展綜述[J].現(xiàn)代圖書情報技術,2010(6):42-47.
[37] 徐緒堪,房道偉,蔣勛,蘇新寧.知識組織中知識粒度化表示和規(guī)范化研究[J].圖書情報知識,2014(6):101-106,90.
[Abstract] As a core component of constructing adaptive learning system, domain model has attracted wide attention of researchers. In order to solve the problem of scattered knowledge content and insufficient ability description in existing educational domain models, this paper proposes a KQA model of educational knowledge map which can establish the mapping relationship among knowledge, problem and ability. This model consists of three schema of knowledge schema, problem schema and ability schema and four elements of knowledge content, association relationship, mapping relationship and learning path. Using the methods of entity extraction, relation extraction and entity alignment based on machine learning, this paper proposes the construction method of KQA model of educational knowledge map from four aspects: data acquisition, knowledge extraction, knowledge fusion and knowledge reasoning. This study provides a basis for the application of knowledge map in the field of education and is of great significance for the development of personalized learning.
[Keywords] Artificial Intelligence; Knowledge Map; Model Construction; Machine Learning; Learning Path; Adaptive Learning