張金福, 劉 雪
(上海應(yīng)用技術(shù)大學(xué)經(jīng)濟(jì)與管理學(xué)院,上海 200235)
近年來,隨著人工智能技術(shù)和計算機(jī)圖形學(xué)的迅速發(fā)展,高校管理的信息化研究有了更多的技術(shù)支持與思路指引[1]。海量的高校管理數(shù)據(jù)是推進(jìn)教育智能化的基礎(chǔ)要素[2],高校管理過程具有時空跨度大、涉及范圍廣等特點(diǎn),在招生、教學(xué)、教師管理等方面產(chǎn)生了大量結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù),這些大規(guī)模數(shù)據(jù)進(jìn)行合理化利用,可為高校的科學(xué)管理與決策提供強(qiáng)有力的支撐。但這些復(fù)雜多形態(tài)的大數(shù)據(jù)存在碎片化、多源異構(gòu)且層次多維的特點(diǎn)[3],數(shù)據(jù)集聚程度低,難以實(shí)現(xiàn)豐富的語義表達(dá),無法滿足用戶獲取綜合知識信息的需求,阻礙了高校管理創(chuàng)新發(fā)展的進(jìn)程。因此,高校管理數(shù)據(jù)分析的關(guān)鍵是從這些海量的孤島數(shù)據(jù)中抽取出可用度高的信息,構(gòu)建一張相互關(guān)聯(lián)的信息結(jié)構(gòu)網(wǎng),有效架起高校管理數(shù)據(jù)孤島的關(guān)系橋梁,并通過對象之間的關(guān)系提供組織的整體視圖,加強(qiáng)頂層設(shè)計系統(tǒng)化,促進(jìn)高校管理的規(guī)范化和科學(xué)化。
作為語義網(wǎng)絡(luò)的數(shù)據(jù)處理與關(guān)聯(lián)分析的關(guān)鍵技術(shù),知識圖譜是一種對知識領(lǐng)域建模并使用圖形結(jié)構(gòu)數(shù)據(jù)模型或拓?fù)鋪砑蓴?shù)據(jù)的知識庫,憑借其強(qiáng)大的語義處理能力,對海量信息進(jìn)行知識抽取、融合和處理,形成結(jié)構(gòu)化的語義知識網(wǎng)絡(luò),增強(qiáng)其搜索引擎結(jié)果的正確反饋率[4]。通常用于描述存儲實(shí)體與實(shí)體之間相互關(guān)聯(lián),在實(shí)現(xiàn)知識問答、智能化語義搜索等領(lǐng)域起著的基礎(chǔ)和橋梁作用,已成為大數(shù)據(jù)時代工程與科學(xué)研究領(lǐng)域的前沿?zé)狳c(diǎn)方向。根據(jù)在知識表示、獲取與應(yīng)用方面的差異,可將知識圖譜劃分為通用知識圖譜(General-purpose Knowledge Graph:簡稱GKG)和領(lǐng)域知識圖譜(Domain-specific Knowledge Graph:簡稱DKG)兩大類。GKG的一些知名應(yīng)用案例主要有德國馬普研究研制的YAGO[5]、采用結(jié)構(gòu)化數(shù)據(jù)形式的Freebase[6]、2012 年發(fā)布的Google Knowledge Graph 以及國內(nèi)百度知心、搜狗知立方和復(fù)旦大學(xué)知識工場實(shí)驗(yàn)研發(fā)的CN-DBpedia 等[7],而聚焦于特定領(lǐng)域的領(lǐng)域知識圖譜也逐漸被重視,例如地理信息領(lǐng)域知識圖譜Geonames、“天眼查”的企業(yè)領(lǐng)域知識圖譜等[8]。
目前,國內(nèi)外已有研究將語義技術(shù)應(yīng)用于科研系統(tǒng)、機(jī)構(gòu)知識庫等領(lǐng)域,實(shí)現(xiàn)知識的關(guān)聯(lián)與挖掘。Pujara等[9]利用由MusicBrainz 音樂社區(qū),以及NELL項目中包含超過100 萬提取和70K 本體關(guān)系的真實(shí)提取集構(gòu)成的合成鏈接數(shù)據(jù)語料庫,使用概率軟邏輯(PSL),展示了如何將實(shí)體及其關(guān)系的不確定性提取轉(zhuǎn)化為知識圖。Liu 等[10]基于社會分類的協(xié)同特性,獲取企業(yè)知識資源的個體知識標(biāo)注數(shù)據(jù),并從標(biāo)簽中篩選出一些重要的主題,形成領(lǐng)域知識圖。然后將不同領(lǐng)域的主題進(jìn)行相似度關(guān)聯(lián),構(gòu)建企業(yè)知識圖譜。此外,很多學(xué)者對知識圖譜技術(shù)在網(wǎng)絡(luò)安全、網(wǎng)絡(luò)輿情[11]、應(yīng)急管理、地理信息領(lǐng)域和數(shù)字圖書館[12]等眾多垂直領(lǐng)域的應(yīng)用進(jìn)行了深入探究。例如,賈焰等[13]基于知識圖譜與網(wǎng)絡(luò)安全的概念來構(gòu)建網(wǎng)絡(luò)安全知識庫,并在此基礎(chǔ)上,提出了一個基于網(wǎng)絡(luò)安全知識庫的五元組模型;杜志強(qiáng)等[14]針對自然災(zāi)害應(yīng)急領(lǐng)域中存在的"數(shù)據(jù)-信息-知識"轉(zhuǎn)化能力不足問題,圍繞自然災(zāi)害事件、災(zāi)害應(yīng)急任務(wù)、災(zāi)害數(shù)據(jù)、模型方法4 個要素,提出了自上而下和自下而上相結(jié)合的自然災(zāi)害應(yīng)急知識圖譜構(gòu)建方法;張雪英等[15]結(jié)合地理知識的時空特征和知識圖譜的表達(dá)形式,提出了一種顧及時空特征的地理知識圖譜構(gòu)建方法;陳曉慧等[16]首先在解析COVID-19 病例數(shù)據(jù)基礎(chǔ)上,利用知識圖譜技術(shù)提出了構(gòu)建適應(yīng)多樣化描述方式的COVID-19 病例活動知識圖譜,兼顧時空和語義特征研究傳染病傳播過程;雷潔等[17]通過總結(jié)分析當(dāng)前科研檔案管理的技術(shù)與模式,構(gòu)建出科研檔案管理知識圖譜;甘容輝等[18]認(rèn)為全球高等教育已經(jīng)全面進(jìn)入信息化時代,智慧校園建設(shè)要緊跟信息技術(shù)的最新發(fā)展動態(tài),高校應(yīng)積極探索應(yīng)用新一代信息技術(shù),把握技術(shù)變革趨勢,聚力建設(shè)智慧校園,推動教育智慧化轉(zhuǎn)型。但當(dāng)前關(guān)于知識圖譜在高校管理領(lǐng)域的應(yīng)用研究仍然比較少,現(xiàn)有研究多是依托CNKI 期刊論文數(shù)據(jù)庫,使用文獻(xiàn)分析的方法,構(gòu)建和分析我國職業(yè)教育研究群體[19]、高等教育研究學(xué)術(shù)群體[20]、教育技術(shù)學(xué)術(shù)群體可視化知識圖譜[21]和教育技術(shù)學(xué)者合著網(wǎng)絡(luò)知識圖譜[22];從構(gòu)建技術(shù)上來看,袁滿等[23]人在對國內(nèi)外教育領(lǐng)域內(nèi)標(biāo)準(zhǔn)進(jìn)行研究的基礎(chǔ)上,以系統(tǒng)理論為依據(jù)提出并構(gòu)建出一個教育資源知識圖譜標(biāo)準(zhǔn)詞匯參考模型。楊博等[24]研究表明,相較于基于詞匯和規(guī)則的知識抽取,基于本體推理的抽取更有益于數(shù)據(jù)間隱含關(guān)系的挖掘和知識的融合。Kafkas S 等[25]基于本體論與統(tǒng)計方法相結(jié)合的方法,提出了一種利用文本語義間共現(xiàn)關(guān)系從文獻(xiàn)中挖掘基因-表型關(guān)聯(lián)的方法;陳曉燕等[26]以汽車領(lǐng)域評論語料為數(shù)據(jù)源,基于深度學(xué)習(xí)的領(lǐng)域本體構(gòu)建方法,搭建起汽車領(lǐng)域本體架構(gòu)。
基于領(lǐng)域知識圖譜構(gòu)建的理論基礎(chǔ)及相關(guān)技術(shù),本文旨在對我國高校管理數(shù)據(jù)知識圖譜的構(gòu)建進(jìn)行研究與設(shè)計,以深入揭示高校管理知識之間的關(guān)聯(lián)性、優(yōu)化高校管理知識資源檢索和深度推理進(jìn)程,為我國高校管理的知識研究提供理論研究框架,同時也為高校管理領(lǐng)域的精準(zhǔn)決策提供資源支撐。
高校管理知識圖譜是以高校管理過程中產(chǎn)生的數(shù)據(jù)為基礎(chǔ),以圖形化的直觀方式構(gòu)建網(wǎng)絡(luò)知識表達(dá)模型,可為高校管理數(shù)據(jù)之間的關(guān)聯(lián)分析與復(fù)雜語義關(guān)系推理提供技術(shù)支撐。知識圖譜可將分散的、關(guān)聯(lián)度低的數(shù)據(jù)整合到一起,形成龐大的知識網(wǎng)絡(luò),可以融合教師、校園地圖、學(xué)生與課程數(shù)據(jù)等與高校管理教學(xué)密切相關(guān)的數(shù)據(jù)資源,深入挖掘高校管理過程中數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系和整體教學(xué)狀況。
知識圖譜的構(gòu)建方式主要包括自上而下和自下而上2 種.前者主要是利用百度百科類網(wǎng)頁數(shù)據(jù),抽取本體與模式,加入知識庫中,如利用維基百科為數(shù)據(jù)源的Freebase項目。而自底向上的知識圖譜構(gòu)建,需要運(yùn)用一定的數(shù)據(jù)挖掘技術(shù),從已有開放性的數(shù)據(jù)源中提取出初始領(lǐng)域概念,再通過關(guān)聯(lián)規(guī)則構(gòu)建本體,篩選后再加入,實(shí)現(xiàn)原有知識庫的優(yōu)化擴(kuò)充[27]。如Google的Knowledge Vault和微軟的Satori知識庫,均是依托于開放性的海量網(wǎng)頁數(shù)據(jù),運(yùn)用自動抽取資源的方式來構(gòu)建、豐富和完善現(xiàn)有識庫的。
基于高校管理資源的領(lǐng)域性和特殊性,主要依據(jù)自下向上的知識圖譜構(gòu)建技術(shù)構(gòu)建了高校管理整體知識圖譜的框架如圖1 所示,框架圖自下而上主要包括4 個層級,分別為基礎(chǔ)數(shù)據(jù)層、圖譜構(gòu)建層、信息解析層和人機(jī)交互層。首先,從各高校網(wǎng)站抓取基礎(chǔ)數(shù)據(jù)資源,運(yùn)用知識抽取技術(shù)抽取從不同來源的數(shù)據(jù)資源中抽取數(shù)據(jù)集,形成高校管理的知識單元實(shí)體,將實(shí)體進(jìn)行知識融合用于實(shí)體間的關(guān)聯(lián)分析,通過挖掘知識間的隱含關(guān)系,從語義層面實(shí)現(xiàn)高校管理數(shù)據(jù)知識的組織表達(dá),形成高校管理的知識網(wǎng)絡(luò)。
圖1 高校管理知識圖譜整體框架
基礎(chǔ)數(shù)據(jù)層是構(gòu)建知識圖譜的核心工作,主要存儲大量高校管理數(shù)據(jù)資源,如位置數(shù)據(jù)、教師數(shù)據(jù)、課程數(shù)據(jù)、學(xué)生數(shù)據(jù)與學(xué)?;厩闆r介紹等各類型數(shù)據(jù)集,更重要的是,基礎(chǔ)數(shù)據(jù)層具備將不同結(jié)構(gòu)屬性的高校管理數(shù)據(jù)無縫銜接和一體化存儲管理的能力。由于高校管理數(shù)據(jù)具有相互交叉、重合度高的特點(diǎn),數(shù)據(jù)之間存在較強(qiáng)的依賴性,因此將基礎(chǔ)資源層的數(shù)據(jù)庫設(shè)計為空間圖形數(shù)據(jù)庫,兼具結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的存儲。基礎(chǔ)資源層是高校管理產(chǎn)生數(shù)據(jù)的存儲基礎(chǔ),為知識的提取提供了數(shù)據(jù)倉庫集。
知識單元層具有承上啟下的功能,高校管理數(shù)據(jù)知識獲取主要通過知識抽取規(guī)則,從基礎(chǔ)資源數(shù)據(jù)庫中獲取高校管理數(shù)據(jù)的屬性知識關(guān)系,著重于實(shí)體屬性之間的關(guān)聯(lián)分析,為高校管理的知識圖譜與本體構(gòu)建提供數(shù)據(jù)資源。知識單元層的工作主要分為兩部分,首先是構(gòu)建高校管理的本體,然后在本體的基礎(chǔ)上進(jìn)行知識規(guī)則抽取。
(1)高校管理本體構(gòu)建?;诟咝9芾淼膶I(yè)知識和數(shù)據(jù)資源,對高校管理的整體知識結(jié)構(gòu)進(jìn)行分析,確定高校管理的核心概念,從而形成概念體系。知識單元層采用自上而下的構(gòu)建方式,定義了類、屬性、實(shí)體,通過對高校管理的類、屬性及其之間的關(guān)系進(jìn)行分析,可構(gòu)建高校管理本體類目層次圖,如圖2 所示。最終形成高校管理的知識邏輯體系,呈現(xiàn)出具有樹形結(jié)構(gòu)的高校管理知識組織體系,即高校管理本體框架,高校管理的本體是開放集成的體系,從語義表達(dá)的層面來實(shí)現(xiàn)高校管理知識之間的關(guān)聯(lián)、共享與重復(fù)利用,在知識圖譜構(gòu)建過程中具有重要意義。
圖2 高校教育本體類目層次圖
(2)知識抽取。信息抽取是一種自動化地從半結(jié)構(gòu)化和無結(jié)構(gòu)數(shù)據(jù)中抽取實(shí)體、關(guān)系以及實(shí)體屬性等結(jié)構(gòu)化信息的技術(shù),涉及的關(guān)鍵技術(shù)包括:實(shí)體抽取、關(guān)系抽取和屬性抽?。?8]。
高校管理的基礎(chǔ)資源中包括結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)和空間位置數(shù)據(jù)。知識抽取建立在基礎(chǔ)資源數(shù)據(jù)庫的基礎(chǔ)上,首先對知識單元中的實(shí)體、屬性和關(guān)系進(jìn)行數(shù)據(jù)抽取,以此建立高校管理數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,基于高校管理的領(lǐng)域本體架構(gòu),采用機(jī)器學(xué)習(xí)中的多策略學(xué)習(xí)算法來自動獲取數(shù)據(jù)知識,利用多策略學(xué)習(xí)算法可以全面獲取知識并且可以剔除數(shù)據(jù)之間的冗余關(guān)系的特點(diǎn),通過抽取顯著性較強(qiáng)的知識特征,來概括表達(dá)整體與局部的關(guān)鍵信息。結(jié)構(gòu)化數(shù)據(jù)具有簡單易讀的數(shù)據(jù)結(jié)構(gòu),抽取容易且準(zhǔn)確率較高,可通過D2R 映射將數(shù)據(jù)直接映射到RDF中的類和屬性,從而構(gòu)建知識圖譜中的知識單元。半結(jié)構(gòu)化數(shù)據(jù)雖然是結(jié)構(gòu)化數(shù)據(jù)的一種表現(xiàn)形式,但不符合結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)模型結(jié)構(gòu),可通過Wrapper (數(shù)據(jù)包裝器)來進(jìn)行信息抽取,將數(shù)據(jù)還原為結(jié)構(gòu)化數(shù)據(jù),接下來對這兩類數(shù)據(jù)的抽取結(jié)果作統(tǒng)一處理,將其都加入種子集中。由于非結(jié)構(gòu)化數(shù)據(jù)是純文本數(shù)據(jù),可根據(jù)已有實(shí)體得出先驗(yàn)知識,再對未知文本進(jìn)行自動標(biāo)注,從無監(jiān)督學(xué)習(xí)或半監(jiān)督學(xué)習(xí)轉(zhuǎn)換為有監(jiān)督學(xué)習(xí),采用遠(yuǎn)程監(jiān)督和基于模式相結(jié)合的增量迭代抽取方式。遠(yuǎn)程監(jiān)督工作的前提是假設(shè)兩個不同實(shí)體間存在某種聯(lián)系,因此任何含有這兩個實(shí)體的不同的短語或者語句都可能表達(dá)同一關(guān)系,通過自動標(biāo)注種子集中的文本數(shù)據(jù)生產(chǎn)高質(zhì)量的工作模式,將這些模式學(xué)習(xí)的新知識加入種子集中。通過這一過程的不斷迭代,直到學(xué)習(xí)不出新知識,結(jié)束此次任務(wù)執(zhí)行。采用這種方式可完成高校管理知識單元的獲取。
(1)實(shí)體對齊。①通過知識抽取的關(guān)鍵技術(shù),從不同來源的數(shù)據(jù)集中抽取出相對孤立的知識結(jié)構(gòu)單元,得到很多分散、關(guān)聯(lián)度低的抽取圖譜。將這些孤立圖譜進(jìn)行集成整合和知識融合的集中處理,得到完整的高校管理知識圖譜??紤]到抽取數(shù)據(jù)來源范圍大,包括結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),多種類型數(shù)據(jù)之間融合分析也面臨很大的挑戰(zhàn),如實(shí)體命名不一致、多個實(shí)體對應(yīng)一個詞語、實(shí)體屬性值缺失、實(shí)體屬性異常、實(shí)體與屬性多對多映射等,②數(shù)據(jù)質(zhì)量也參差不齊,需要進(jìn)行數(shù)據(jù)清洗得到合理有效的數(shù)據(jù)集。實(shí)體對其在解決這些問題時有著突出的優(yōu)勢,實(shí)體對其可以識別過濾不同標(biāo)簽屬性,找出其在現(xiàn)實(shí)世界中對應(yīng)的唯一實(shí)體,并將實(shí)體集合融合為一個實(shí)體,并為其創(chuàng)建一個全局唯一標(biāo)識屬性值,將實(shí)體對象集成到知識圖譜中?,F(xiàn)階段,基于聚類的實(shí)體對其算法應(yīng)用比較廣泛,可以將具有相似屬性的實(shí)體劃分到一類集合中,在此基礎(chǔ)上進(jìn)行實(shí)體對齊。
(2)實(shí)體關(guān)聯(lián)構(gòu)建。實(shí)體關(guān)聯(lián)是知識圖譜構(gòu)建過程中的核心環(huán)節(jié),是進(jìn)行知識挖掘的重要基礎(chǔ)。
抽取出的實(shí)體(E1,E2,…)都具有一定的屬性值,如教師的屬性包括職稱、職務(wù)、年齡和學(xué)位等,以教師為例,實(shí)體屬性結(jié)構(gòu)圖如圖3 所示。
圖3 高校某教師實(shí)體屬性示意圖
具有相同屬性值的任何兩個實(shí)體都可以通過其之間的狀態(tài)或?qū)傩躁P(guān)系來建立聯(lián)系,形成多個三元組數(shù)據(jù)集,將具有關(guān)聯(lián)關(guān)系的多個實(shí)體進(jìn)行集合聚類,可以構(gòu)成具有多維度數(shù)據(jù)關(guān)系的可視化表達(dá)方式。圖4 即為高校部分實(shí)體關(guān)聯(lián)結(jié)構(gòu)圖。結(jié)合高校管理數(shù)據(jù)中的實(shí)體、屬性與關(guān)系的多樣性和異構(gòu)性,為了建立更為完整知識圖譜,對相對復(fù)雜的關(guān)聯(lián)規(guī)則除了要依賴高校管理的本體模型外,還需使用人工標(biāo)注與推理等方法來保證知識圖譜模型的精度。
圖4 高校部分實(shí)體關(guān)聯(lián)結(jié)構(gòu)圖
構(gòu)建了實(shí)體、屬性和關(guān)系的關(guān)聯(lián)之后,數(shù)據(jù)資源庫成為一個包括基礎(chǔ)數(shù)據(jù)、特色數(shù)據(jù)和高校管理數(shù)據(jù)等的一個富含語義關(guān)系的知識庫,可以滿足不同客戶的需求并為其提供各類高校管理知識服務(wù)。
在信息解析層通過實(shí)體對其和實(shí)體關(guān)聯(lián)等關(guān)鍵步驟,構(gòu)建了高校管理本體模型與富含語義關(guān)系的網(wǎng)絡(luò)知識庫,知識圖譜將高校管理中的實(shí)體及其屬性之間的關(guān)聯(lián)關(guān)系最大程度地展現(xiàn)出來,在此基礎(chǔ)上可以做語義搜索、輔助決策等很多應(yīng)用開發(fā)研究。
(1)高校管理知識檢索。知識圖譜的底層是一個龐大的關(guān)聯(lián)知識庫,可以完成對高校管理的基本搜索服務(wù),能對高校管理類專業(yè)術(shù)語進(jìn)行查詢并對不同術(shù)語之間進(jìn)行知識關(guān)聯(lián),用戶可以通過知識圖譜系統(tǒng)的搜索得到直觀的可視化知識地圖。例如在搜索框輸入“高等代數(shù)”這一關(guān)鍵詞,可以得到高等代數(shù)這門課程的相關(guān)知識,包括授課教師、學(xué)分、選修的學(xué)生和開設(shè)專業(yè)等相關(guān)實(shí)體以及實(shí)體之間的關(guān)系。這樣更有利于用戶更加直觀、快速獲取所需知識,降低獲取不同類型數(shù)據(jù)的時間成本。
(2)高校管理知識發(fā)現(xiàn)。在知識發(fā)現(xiàn)這一應(yīng)用場景下,以關(guān)鍵詞為驅(qū)動,可以實(shí)現(xiàn)以知識圖譜為基礎(chǔ)的具有相同屬性的知識單元的聚類關(guān)聯(lián)。例如,輸入教師A,知識圖譜會反饋一個以教師A為中心的可視化圖譜,呈放射狀分布,該教師的屬性展示為年齡、教授課程、職稱、碩/博導(dǎo)、研究領(lǐng)域與獲獎經(jīng)歷等,通過點(diǎn)擊“研究領(lǐng)域”與“發(fā)表論文”等關(guān)鍵屬性,可以發(fā)現(xiàn)教師A 擅長的研究方向、發(fā)表過的論文和指導(dǎo)過的學(xué)生,就能對該老師的科研水平有一個大致的判斷,這能對學(xué)生的研究生報考與研究生導(dǎo)師的選擇提供一個可參考的決策支持。
(3)高校管理建設(shè)指導(dǎo)。數(shù)字化表達(dá)是高校管理知識圖譜的重要應(yīng)用領(lǐng)域之一,可以對高校管理教學(xué)的建設(shè)與改革提供相關(guān)的輔助決策與指導(dǎo),包括高校新興學(xué)科籌建、教師崗位培訓(xùn)、學(xué)生培養(yǎng)計劃制定與完善、校園智慧智能化管理等,知識圖譜模型能將已有知識進(jìn)行關(guān)聯(lián)重建,形成新的知識表達(dá)[29]。構(gòu)建知識圖譜可以將校園信息、教師信息、專業(yè)信息與學(xué)生信息等不同類型數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析和統(tǒng)一處理,基于海量的高校管理數(shù)據(jù)分析形成全新的高校管理知識表達(dá)方法,可以挖掘更多高校管理過程中的問題,形成更科學(xué)、規(guī)范的決策。
大數(shù)據(jù)是推動高校管理全方位改革創(chuàng)新的重要力量,確立教育大數(shù)據(jù)的戰(zhàn)略地位,把握技術(shù)變革趨勢,聚力建設(shè)智慧校園,推動教育智慧化轉(zhuǎn)型,是新時代高校管理的重要趨勢[30]。本文旨在對高校管理知識圖譜的構(gòu)建進(jìn)行設(shè)計與研究,基于高校管理數(shù)據(jù)知識分布分散、異構(gòu)多樣、結(jié)構(gòu)復(fù)雜的特點(diǎn)[31],結(jié)合領(lǐng)域知識圖譜構(gòu)建的技術(shù)方法,解析數(shù)據(jù)層中豐富的實(shí)體概念及屬性關(guān)系,實(shí)現(xiàn)知識的抽取與知識融合,初步構(gòu)建了輕量級的高校管理知識圖譜體系架構(gòu);從語義關(guān)聯(lián)的角度實(shí)現(xiàn)高校知識資源的關(guān)聯(lián)和挖掘,促進(jìn)數(shù)據(jù)資源的交換共享、有效流通,為高校管理知識組織研究提供科學(xué)框架和奠定理論基礎(chǔ),拓展充分挖掘教育大數(shù)據(jù)潛在價值的思路,同時也期望為其他領(lǐng)域知識圖譜的構(gòu)建提供一定的參考價值和借鑒意義。
高校管理的知識信息在實(shí)際應(yīng)用中存在動態(tài)性,知識結(jié)構(gòu)隨著科學(xué)研究的深入會不斷更新和變化,產(chǎn)生的數(shù)據(jù)也會隨之實(shí)時更新,所以定期篩查高校管理本體結(jié)構(gòu)和知識庫信息,實(shí)現(xiàn)知識圖譜的迭代更新,對科學(xué)管理與決策有很大意義。關(guān)于高校管理知識圖譜的構(gòu)建還處于初步探索階段,本文研究目標(biāo)側(cè)重于對整體架構(gòu)進(jìn)行設(shè)計,其中各個層級的研究還不夠深入和完善,諸如只考慮了高校內(nèi)部的各類知識關(guān)聯(lián)而弱化了影響高校管理的復(fù)雜社會環(huán)境,語義關(guān)聯(lián)的組織和挖掘還不夠深入和詳盡,期望后續(xù)有更多的學(xué)者關(guān)注和深入在這一領(lǐng)域的研究。