董曉曉 顧恒年 周東岱
(東北師范大學(xué) 信息科學(xué)與技術(shù)學(xué)院,吉林 長春 130117)
近年來,隨著大數(shù)據(jù)、人工智能等技術(shù)的迅猛發(fā)展,尤其是深度學(xué)習(xí)、知識圖譜等新一代人工智能關(guān)鍵技術(shù)的回歸和突破性發(fā)展,成為助力教育信息化 向“人工智能+”轉(zhuǎn)型的核心驅(qū)動力。知識圖譜作為一種有效支撐知識組織與分析的技術(shù)手段,最初在醫(yī)學(xué)、金融等諸多領(lǐng)域取得了顯著成效,伴隨著“人工智能+教育”的發(fā)展需求,教育領(lǐng)域也開始重視知識圖譜對教育的賦能。2017年國務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》,明確提出要研究知識圖譜構(gòu)建與學(xué)習(xí)、知識演化與推理等關(guān)鍵技術(shù),構(gòu)建覆蓋數(shù)億級知識實體的多元化、多學(xué)科、多數(shù)據(jù)源的知識圖譜[1]。2018年國家自然科學(xué)基金委新增設(shè)F0701教育信息科學(xué)與技術(shù)研究方向,并將“教育知識圖譜構(gòu)建與導(dǎo)航學(xué)習(xí)”列為一項重要研究內(nèi)容[2]。任友群等研究者提出在人工智能時代背景下面向不同層次教育的知識圖譜是實現(xiàn)個性化教育的基礎(chǔ),是教育人工智能需要優(yōu)先開展的基礎(chǔ)性工作[3]。當(dāng)前我國知識圖譜研究勢頭方興未艾,然而已有研究多從技術(shù)方法視角切入研究知識圖譜的構(gòu)建技術(shù),對知識圖譜完整的生命周期缺乏系統(tǒng)性的梳理總結(jié)[4][5]?;诖?,本研究采用定量和定性相結(jié)合的方法,首先對國內(nèi)外知識圖譜研究的關(guān)注點、發(fā)展脈絡(luò)等內(nèi)容進行梳理與總結(jié),在此基礎(chǔ)上厘清知識圖譜構(gòu)建的完整生命周期,立足教育領(lǐng)域確定研究框架,并對教育領(lǐng)域知識圖譜的未來研究做出展望,以期促進我國教育知識圖譜研究的發(fā)展。
為有效獲取國內(nèi)外知識圖譜的高質(zhì)量研究文獻,研究以“知識圖譜”(knowledge graph)為關(guān)鍵詞在中英文權(quán)威數(shù)據(jù)庫檢索文獻。中文文獻以關(guān)鍵詞、篇名或摘要中含有“知識圖譜”為檢索規(guī)則在CSSCI期刊和核心期刊庫中進行文獻檢索;英文文獻以關(guān)鍵詞、標(biāo)題、主題、摘要中含有“knowledge graph”為檢索規(guī)則在SCI、SSCI、A & HCI、CPCI收錄的期刊論文和會議論文中進行文獻檢索。檢索時間跨度為2012年至2022年。由于研究者對知識圖譜的理解和界定不盡相同,本研究通過通讀摘要的方法對檢索的文獻進行再次篩選,以保證研究樣本與研究主題的相關(guān)度。
關(guān)鍵詞體現(xiàn)了研究的核心內(nèi)容,高頻關(guān)鍵詞則能代表該領(lǐng)域的研究核心關(guān)注點。表1顯示的是國內(nèi)外知識圖譜研究的高頻關(guān)鍵詞表。由表1可知,相關(guān)研究以知識圖譜為核心,與人工智能領(lǐng)域語義網(wǎng)絡(luò)、知識表示、表示學(xué)習(xí)等密切相關(guān),實體關(guān)系識別、命名實體識別、本體構(gòu)建等是知識圖譜研究關(guān)注的重點,自然語言處理、本體技術(shù)、深度學(xué)習(xí)算法等技術(shù)手段為知識圖譜構(gòu)建提供有力支持,問答系統(tǒng)、鏈路預(yù)測(學(xué)習(xí)路徑生成)等功能實現(xiàn)是知識圖譜應(yīng)用的主要方向。
表1 國內(nèi)外知識圖譜研究高頻關(guān)鍵詞表(前10)
自2012年知識圖譜這一概念出現(xiàn)后,迅速引發(fā)了社會各界對其廣泛關(guān)注。梳理知識圖譜的發(fā)展歷程,發(fā)現(xiàn)其起源于20世紀(jì)60年代的語義網(wǎng)絡(luò)(Semantic Network),發(fā)展于本體(Ontology)和語義網(wǎng)(Semantic Web)。2012年企業(yè)公司發(fā)布的知識圖譜再次將這個領(lǐng)域帶入聚光燈下,這時的知識圖譜實現(xiàn)了更加智能的信息獲取和處理,然而,構(gòu)建龐大而高質(zhì)量的知識圖譜并不容易。
對于知識圖譜的概念界定,眾多研究者從語義知識庫角度切入,認為知識圖譜本質(zhì)上是一種使用語義網(wǎng)絡(luò)結(jié)構(gòu)組織知識的知識庫,是對知識結(jié)構(gòu)的抽象表示。如有研究者認為知識圖譜由“實體1、關(guān)系、實體2”或“實體、屬性、屬性值”這樣的三元組構(gòu)成的結(jié)構(gòu)化語義網(wǎng)狀知識庫,還有研究者則認為知識圖譜是以圖的形式表現(xiàn)客觀世界中的實體(概念)及其之間關(guān)系的知識庫[6]。立足教育領(lǐng)域,可將教育領(lǐng)域知識圖譜理解為知識圖譜在教育領(lǐng)域的拓展應(yīng)用,其本質(zhì)是以圖的形式表示教育領(lǐng)域?qū)嶓w和實體關(guān)系的語義知識庫。
厘清知識圖譜的類型、邏輯結(jié)構(gòu)和技術(shù)架構(gòu)能夠幫助我們進一步認識知識圖譜。依據(jù)應(yīng)用范疇,知識圖譜通常被劃分為面向全領(lǐng)域信息的通用知識圖譜和面向特定領(lǐng)域信息的領(lǐng)域知識圖譜兩類,通用知識圖譜強調(diào)知識信息的廣度,領(lǐng)域知識圖譜關(guān)注知識信息的深度。教育領(lǐng)域有清晰的知識結(jié)構(gòu)和鮮明的領(lǐng)域特征,面向教育領(lǐng)域構(gòu)建的知識圖譜屬于領(lǐng)域知識圖譜。此外,在領(lǐng)域知識圖譜研究中,研究者依據(jù)圖譜表征的對象(靜態(tài)知識或動態(tài)活動)分為靜態(tài)圖譜和動態(tài)圖譜。從邏輯結(jié)構(gòu)看,主要由模式層和數(shù)據(jù)層構(gòu)成,模式是抽象概括的領(lǐng)域知識表示,確定知識圖譜的模式是領(lǐng)域知識圖譜構(gòu)建的核心。從構(gòu)建過程看,模式構(gòu)建、知識抽取、知識融合和知識更新是圖譜構(gòu)建的主要流程,但通用知識圖譜通常采用自底向上構(gòu)建,從底層數(shù)據(jù)中逐步歸納圖譜模式,而領(lǐng)域知識圖譜通常采用自頂向下構(gòu)建,即先構(gòu)建頂層模式后逐步向下形成圖譜。具體如圖1(見下頁)所示。
圖1 知識圖譜類型和構(gòu)建流程
1.模式定義
模式是知識圖譜的框架和抽象模型,是知識圖譜構(gòu)建的核心工作。不同類型的圖譜對模式的需求不同,通用知識圖譜關(guān)注知識覆蓋面的廣度,描述全面的通識性知識,通常從數(shù)據(jù)中全自動或半自動地抽取圖譜模式,該方法能夠節(jié)省一定的人力和時間,但存在準(zhǔn)確度不高的問題;領(lǐng)域知識圖譜面向特定領(lǐng)域,對領(lǐng)域內(nèi)容專業(yè)性和精確度要求較高,往往需要專家手工定義圖譜模式,但存在費時費力等問題。表2總結(jié)了當(dāng)前知識圖譜模式定義的典型方法。
表2 知識圖譜模式定義的研究成果
2.知識抽取
節(jié)點和邊是知識圖譜的主要構(gòu)成要素,節(jié)點表示真實世界中存在的概念或?qū)嶓w,邊表示實體及實體之間的關(guān)系,并通過屬性(值)用來描述實體的內(nèi)在屬性。因此,知識抽取內(nèi)容包括實體抽取、實體關(guān)系抽取和事件抽取。如表3(見下頁)所示。
表3 知識抽取的內(nèi)容和方法
實體抽取有基于詞典和規(guī)則[10]、基于統(tǒng)計機器學(xué)習(xí)[11]和基于神經(jīng)網(wǎng)絡(luò)[12]三種典型方法。其中基于詞典和規(guī)則的抽取方法主要由專家和語言學(xué)者手工來制定有效規(guī)則,準(zhǔn)確率高,但工作效率低;基于統(tǒng)計機器學(xué)習(xí)的抽取方法需要依據(jù)大量的特征標(biāo)注來保證抽取的準(zhǔn)確性,同樣需要耗費大量的人力物力;基于神經(jīng)網(wǎng)絡(luò)的抽取方法主要采用長短期神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)等與機器學(xué)習(xí)模型相結(jié)合進行實體抽取,不需要人工標(biāo)注,在大量公開數(shù)據(jù)集訓(xùn)練后能獲得較好的預(yù)測性能,在一定程度上解放了人力,但覆蓋的實體類型和實體關(guān)系相對簡單。
關(guān)系抽取有基于模板[13]、基于統(tǒng)計學(xué)習(xí)[14]、基于神經(jīng)網(wǎng)絡(luò)[15]和基于遠程監(jiān)督[16]四種典型方法。其中基于模板的抽取方法主要是基于模式(規(guī)則)、觸發(fā)詞或字符串挖掘關(guān)系,關(guān)系抽取準(zhǔn)確率高,但覆蓋范圍小,不適合所有關(guān)系或復(fù)雜關(guān)系的抽??;基于統(tǒng)計學(xué)習(xí)的抽取方法主要基于特征向量等方法從上下文信息、詞性和語法中抽取特征;基于神經(jīng)網(wǎng)絡(luò)的抽取方法主要基于遞歸神經(jīng)網(wǎng)絡(luò)、卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)等方法對復(fù)雜關(guān)系結(jié)構(gòu)進行特征組合,能夠在一定程度上避免特征不足的問題;基于遠程監(jiān)督的抽取方法通過融合上下位等方式解決抽取語料不足的問題,但是也造成了錯誤標(biāo)注和語義漂移等問題。
此外,針對事理知識圖譜的事件抽取是指將實體和實體關(guān)系同時抽取出來,除了傳統(tǒng)的基于模板的方法[17]和基于機器學(xué)習(xí)[18]的方法,目前主流的還有基于數(shù)據(jù)管道(pipeline)和基于聯(lián)合模型(joint model)的深度學(xué)習(xí)方法,其中基于聯(lián)合模型的方法具體又分為聯(lián)合推理(joint Inference)和聯(lián)合建模(joint modeling)兩種[19]。聯(lián)合推理借鑒集成學(xué)習(xí)的思想,基于整體優(yōu)化目標(biāo)整合各模型,通過整數(shù)規(guī)劃等方法進行優(yōu)化;聯(lián)合建模通過將事件結(jié)構(gòu)看作依存樹,并將抽取任務(wù)轉(zhuǎn)化為依存樹結(jié)構(gòu)預(yù)測問題。該方法能夠減少對外部工具的依賴,減免人工設(shè)計特征的工作量和誤差的累積傳播。
3.知識融合
經(jīng)由知識抽取獲取命名實體及實體關(guān)系后,往往可能會包含大量的冗余和錯誤信息,因此需要對其進行清理、整合等一系列相關(guān)處理,獲取高質(zhì)量信息,提高知識圖譜的置信度。實體鏈接和實體合并是知識融合的主要手段。
實體鏈接是一種從文本中抽取得到的實體正確鏈接到知識庫中對應(yīng)的條目或?qū)嶓w的操作流程,其關(guān)鍵技術(shù)是實體消歧和共指消解[20]。實體消歧專門用于解決同名實體產(chǎn)生歧義的問題,當(dāng)前主要采用空間向量模型[21]、語義模型[22]、社會網(wǎng)絡(luò)模型[23]等將指向同一個實體對象的所有指稱項都聚合在一起,通過相似度計算等方式消除歧義,但依然存在欠缺考慮語義關(guān)系、推廣性比較差等問題。共指消解則是針對同一個實體對象的不同描述(指稱項)合并到一起的過程,降低圖譜的冗余度。
實體合并主要有合并外部知識庫和合并關(guān)系數(shù)據(jù)庫兩類,既可以將構(gòu)建的知識體系以圖結(jié)構(gòu)存儲在圖形數(shù)據(jù)庫中,通過實體消歧進行合并,也可以將知識體系以關(guān)系型存儲在關(guān)系數(shù)據(jù)庫中,并通過數(shù)據(jù)庫技術(shù)進行合并。
4.知識更新
遵循事物發(fā)展規(guī)律對知識圖譜節(jié)點和關(guān)系的動態(tài)發(fā)展進行實時調(diào)整稱之為知識更新。知識圖譜構(gòu)建完成后并不是一成不變的,而是需要對知識圖譜中的節(jié)點和關(guān)系進行實時更新以實現(xiàn)知識圖譜的不斷完善。
當(dāng)前研究主要從知識圖譜的模式層更新和數(shù)據(jù)層更新兩個方向展開。在模式層更新方面有通過下載整體的結(jié)構(gòu)化數(shù)據(jù)并進行圖譜模式重塑的基于整體數(shù)據(jù)源的更新,也有基于眾包理念僅對新增知識進行的整理式更新。
知識圖譜的快速發(fā)展引發(fā)了各大領(lǐng)域的研究熱潮,諸多單位和研究者也開始立足于教育領(lǐng)域關(guān)注并開展教育知識圖譜相關(guān)研究。自適應(yīng)學(xué)習(xí)平臺Knewton構(gòu)建了一個學(xué)術(shù)概念交叉的知識圖譜[24],百度公司搭建了基礎(chǔ)教育知識圖譜來支持實現(xiàn)個性化學(xué)習(xí)路徑的生成,余勝泉等人提出通過學(xué)科教師融合領(lǐng)域知識來編制學(xué)科知識圖譜[25],華中師范大學(xué)開展了基于潛在語義分析的學(xué)科知識圖譜構(gòu)建研究[26],劉清堂等人建立了一種面向在線學(xué)習(xí)(E-learning)領(lǐng)域的知識元表征模型和基于語義場的Web資源語義聚合模型[27],李艷燕等人從智慧教育角度切入構(gòu)建學(xué)科知識圖譜[28],李振等人針對教育領(lǐng)域從知識和認知兩個方面構(gòu)建了教育知識圖譜[29],鐘卓等人進一步拓展了教育領(lǐng)域知識圖譜的語義信息,構(gòu)建“知識—問題—能力”圖譜[30]。盡管教育領(lǐng)域知識圖譜相關(guān)研究已經(jīng)取得豐碩的研究成果,但在圖譜模式構(gòu)建層面,已有教育領(lǐng)域知識圖譜概念的界定、知識表征的粒度尚未達成共識,且已有教育領(lǐng)域知識圖譜多聚焦于對知識點和知識點之間關(guān)系的表征,欠缺對思維能力的表征刻畫,此外,既有研究在構(gòu)建過程中或多或少地存在忽略教育領(lǐng)域特征融入等問題,導(dǎo)致構(gòu)建的圖譜領(lǐng)域性不強,應(yīng)用效果欠佳。
伴隨著教育活動的發(fā)展進步,人才培養(yǎng)更加關(guān)注學(xué)習(xí)者知識、能力和素質(zhì)的全方面發(fā)展,核心素養(yǎng)與學(xué)科能力培養(yǎng)成為國內(nèi)外基礎(chǔ)教育共同關(guān)注的研究熱點。促進核心素養(yǎng)發(fā)展和學(xué)科能力培養(yǎng)的學(xué)科知識體系不僅要包括學(xué)科基礎(chǔ)知識,還要包括學(xué)科思維,也就是要在學(xué)科基礎(chǔ)知識之上致力于學(xué)習(xí)者思維能力的培養(yǎng)。由此可知,面向教育領(lǐng)域的知識圖譜迫切需要建立一個系統(tǒng)、規(guī)范且以思維為主導(dǎo)的圖譜框架。
本研究設(shè)計了如圖2所示的教育領(lǐng)域知識圖譜研究框架,主要包括確定價值取向、定義圖譜模式、知識抽取、知識融合、知識更新和圖譜應(yīng)用六部分內(nèi)容。①厘清從知識習(xí)得走向思維發(fā)展的價值取向,并綜合考慮教師和學(xué)生的實際需求是保證研究順利開展的基礎(chǔ)。②在定義圖譜結(jié)構(gòu)過程中,首先依據(jù)學(xué)科課程標(biāo)準(zhǔn)和課程核心內(nèi)容確定學(xué)科核心概念形成知識庫,將其作為圖譜模式的最底層,然后圍繞學(xué)科核心概念抽取學(xué)習(xí)掌握核心概念的問題、任務(wù)和資源,組織形成問題資源庫,并與底層的核心概念進行映射,形成圖譜模式的中間層,最后通過解析核心概念和與之對應(yīng)的問題資源確定掌握核心概念、解決問題所經(jīng)歷的學(xué)習(xí)活動,通過問題解決活動過程發(fā)展思維能力,形成圖譜模式的思維能力頂層。③在定義好圖譜模式的基礎(chǔ)上,運用長短時記憶網(wǎng)絡(luò)+條件隨機場、并行化數(shù)據(jù)挖掘等方法從課程標(biāo)準(zhǔn)、教學(xué)設(shè)計等教育領(lǐng)域資源庫中進行知識抽取,明確實體和實體關(guān)系。④通過對實體、實體關(guān)系的向量化表示和相似度計算校驗知識抽取結(jié)果,人機協(xié)同完成知識融合工作。⑤邀請領(lǐng)域?qū)<液鸵痪€教師運用投票機制等手段完成模式層的更新;基于眾包理念邀請圖譜應(yīng)用者對實體和實體關(guān)系進行語義標(biāo)注,進而實現(xiàn)數(shù)據(jù)層的更新,兩者綜合實現(xiàn)知識更新。⑥圖譜應(yīng)用是將構(gòu)建的圖譜呈現(xiàn)給教師和學(xué)生進行應(yīng)用,具體實現(xiàn)的功能包括知識導(dǎo)航、資源聚類、認知診斷和學(xué)習(xí)推薦四方面。
圖2 教育領(lǐng)域知識圖譜研究框架
面向特定領(lǐng)域垂直構(gòu)建的領(lǐng)域知識圖譜關(guān)注知識信息的深度,領(lǐng)域特征信息的融入能夠有效助力領(lǐng)域知識圖譜應(yīng)用的精準(zhǔn)度。當(dāng)下金融、醫(yī)學(xué)、電商等領(lǐng)域已構(gòu)建出各具特色的知識圖譜,應(yīng)用效果良好。相關(guān)典型研究有金融領(lǐng)域圍繞金融風(fēng)控及精準(zhǔn)營銷等金融業(yè)務(wù)的核心問題構(gòu)建金融知識圖譜,以實現(xiàn)反欺詐與信用評估等功能;醫(yī)學(xué)領(lǐng)域圍繞疾病、藥物以及疾病與藥物的對應(yīng)關(guān)系等構(gòu)建醫(yī)藥知識圖譜,提高疾病—藥物的檢索效率和使用指導(dǎo),為病患提供更好的醫(yī)藥服務(wù)。
與其他領(lǐng)域相比,教育領(lǐng)域包含豐富的知識概念、知識關(guān)系,有獨特的教學(xué)目標(biāo)定位、教學(xué)內(nèi)容活動序列及教育價值追求,學(xué)科知識也通常隱藏著“價值旨趣+問題+方法(論)+研究結(jié)論”的生成邏輯,在教育領(lǐng)域知識融合指導(dǎo)的基礎(chǔ)上遵循學(xué)科特有的教學(xué)邏輯規(guī)律才能保證教學(xué)活動的有效開展[31][32]。既有的學(xué)科知識圖譜模式多關(guān)注學(xué)科顯性知識的組織與表征,欠缺對教學(xué)法等隱性知識的關(guān)注,也忽略了教與學(xué)邏輯規(guī)律對學(xué)科知識圖譜模式構(gòu)建的約束。因此,立足教育領(lǐng)域知識圖譜構(gòu)建的首要任務(wù)就是深度剖析教育領(lǐng)域特征,厘清構(gòu)建的目標(biāo)定位、范圍邊界和應(yīng)用需求,從教育領(lǐng)域特征入手明確教育知識圖譜模式構(gòu)建的切入點和關(guān)鍵點。
跨學(xué)科知識整合能力是21世紀(jì)創(chuàng)新型人才的必備能力,目前領(lǐng)域知識圖譜構(gòu)建缺乏對不同領(lǐng)域知識關(guān)聯(lián)與融合問題的考慮。當(dāng)下教育領(lǐng)域知識圖譜研究成果豐富,研究者從不同視角切入構(gòu)建圖譜,如針對知識點和知識關(guān)聯(lián)關(guān)系的學(xué)科知識圖譜、針對考試測試題構(gòu)建的試題圖譜、面向?qū)W習(xí)活動構(gòu)建的事理圖譜等,圖譜種類的多樣性在支持學(xué)習(xí)的同時,也會造成知識的冗余問題。因此面向教育領(lǐng)域不同學(xué)科知識圖譜的模式對齊與融合是教育領(lǐng)域知識圖譜的下一步研究重點。
與此同時,大數(shù)據(jù)時代的到來加速了知識信息的更新速度,知識圖譜的更新也是研究關(guān)注的重點。當(dāng)前知識圖譜更新多聚焦于人工手動實現(xiàn),耗時耗力,少量基于機器實現(xiàn)的自動更新存在精確度低等問題。教育領(lǐng)域存在諸如教學(xué)設(shè)計、教學(xué)任務(wù)單、教學(xué)音視頻、教學(xué)測試題等多樣化數(shù)據(jù),其復(fù)雜性在一定程度上也影響教育領(lǐng)域知識圖譜知識更新的準(zhǔn)確性。因此如何選擇深度學(xué)習(xí)、強化學(xué)習(xí)算法等更合適的技術(shù)手段以實現(xiàn)知識圖譜的自動更新,保證效率和精確度同步實現(xiàn)是研究的另一關(guān)注點。
知識圖譜的效果需要經(jīng)由實際應(yīng)用進行檢驗?,F(xiàn)階段,各領(lǐng)域知識圖譜構(gòu)建方法多樣,尚未形成標(biāo)準(zhǔn)化的發(fā)展趨勢,由此知識圖譜的應(yīng)用評估工作就顯得尤為重要。但目前知識圖譜應(yīng)用評估方面存在應(yīng)用平臺不足或搭建不完善、評價環(huán)節(jié)尚未達成統(tǒng)一、評價方法欠科學(xué)、評價標(biāo)準(zhǔn)空白等諸多問題。國內(nèi)外許多研究機構(gòu)開始探究知識圖譜的評估工作,典型代表有中國電子技術(shù)標(biāo)準(zhǔn)化研究院牽頭制訂的《信息技術(shù) 人工智能 知識圖譜技術(shù)框架(征求意見稿)》,從構(gòu)建技術(shù)角度給出標(biāo)準(zhǔn),對知識圖譜進行了規(guī)范;美國倫斯勒理工學(xué)院研制了知識圖譜測評系統(tǒng),主要是對多源異構(gòu)知識圖譜中存在的問題和錯誤進行檢測與評估。
評價是教學(xué)的風(fēng)向標(biāo)。有研究者從測評角度考慮構(gòu)建教育測評知識圖譜,但本質(zhì)也依舊是知識點和知識點之間的關(guān)系,構(gòu)建的測評知識圖譜尚不能達到評價診斷的作用。既有的教育領(lǐng)域知識圖譜相關(guān)研究,不論是在模式構(gòu)建層面還是技術(shù)層面,都處于小規(guī)模的理論討論階段,尚沒有考慮到基于知識圖譜的系統(tǒng)平臺開發(fā)與應(yīng)用評價。因此,考慮教育領(lǐng)域知識圖譜的應(yīng)用與評價是未來研究的關(guān)鍵點。立足教育領(lǐng)域,應(yīng)從開發(fā)搭建知識圖譜實際應(yīng)用平臺和建立健全知識圖譜標(biāo)準(zhǔn)化評估框架等方面開展知識圖譜的應(yīng)用與評價,以提高知識圖譜的質(zhì)量,促進其向標(biāo)準(zhǔn)化應(yīng)用方向發(fā)展。
近年來,“認知圖譜”一詞開始逐漸進入大眾視野,并迅速得到了研究者的廣泛關(guān)注。認知智能追求讓計算機學(xué)會讀懂語義,能夠進行學(xué)習(xí)判斷和邏輯推理,理解與解釋是認知智能的兩個核心。知識圖譜的出現(xiàn)能夠加速認知智能的發(fā)展,谷歌、微軟等公司都在知識圖譜基礎(chǔ)上探索認知智能的發(fā)展實現(xiàn)。2018年,中國計算機大會圍繞“認知圖譜與推理”舉辦主題論壇,就如何與知識圖譜相結(jié)合,構(gòu)建大規(guī)模、高質(zhì)量的認知圖譜展開深入探討。相關(guān)典型研究目前主要出現(xiàn)在電商領(lǐng)域,提出大規(guī)模電商認知圖譜,以解決當(dāng)下電商業(yè)務(wù)中存在的問答不準(zhǔn)確、重復(fù)推薦等問題,更好地滿足用戶需求。
認知主義學(xué)習(xí)理論提出學(xué)習(xí)者追求的學(xué)習(xí)結(jié)果體現(xiàn)在個體認知結(jié)構(gòu)的改變。建構(gòu)主義學(xué)習(xí)理論認為學(xué)習(xí)是學(xué)習(xí)者根據(jù)自身經(jīng)驗,通過同化與順應(yīng)對外部信息主要加工處理的過程,結(jié)果也體現(xiàn)在個體認知結(jié)構(gòu)的改變。當(dāng)下,教育領(lǐng)域研究者主要聚焦研究在知識圖譜基礎(chǔ)上運用深度學(xué)習(xí)算法對學(xué)習(xí)者的認知狀態(tài)進行診斷,以達到評估學(xué)習(xí)者認知能力水平的目標(biāo),相關(guān)典型研究如在知識圖譜基礎(chǔ)上構(gòu)建的學(xué)習(xí)認知地圖。該種方法構(gòu)建的學(xué)習(xí)者認知地圖實際上默認學(xué)習(xí)者知識結(jié)構(gòu)是固定不變的,但學(xué)習(xí)是一個不斷發(fā)展的過程,學(xué)習(xí)者的認知也是不斷發(fā)展的,因此,如何基于學(xué)習(xí)者個性特征構(gòu)建動態(tài)發(fā)展的學(xué)習(xí)認知圖譜是教育領(lǐng)域認知圖譜構(gòu)建亟須攻克的難題。