摘要:針對(duì)高校計(jì)算機(jī)課程體系復(fù)雜性和多樣性的特點(diǎn),文章提出了一種基于知識(shí)圖譜的構(gòu)建與可視化方法。文章闡述了知識(shí)圖譜構(gòu)建的關(guān)鍵環(huán)節(jié),包括數(shù)據(jù)來源與處理、模式層構(gòu)建以及數(shù)據(jù)層構(gòu)建,并介紹了基于Neo4j圖數(shù)據(jù)庫的知識(shí)圖譜可視化技術(shù)。最后,通過實(shí)例展示了高校計(jì)算機(jī)課程體系的可視化效果,為課程體系的分析和優(yōu)化提供了有力工具。
關(guān)鍵詞:計(jì)算機(jī)課程體系;知識(shí)圖譜;可視化;Neo4j
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2024)23-0089-03
開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID)
0 引言
在信息時(shí)代背景下,高校計(jì)算機(jī)課程體系作為培養(yǎng)計(jì)算機(jī)專業(yè)人才的重要基石,其復(fù)雜性和多樣性日益凸顯。隨著計(jì)算機(jī)技術(shù)的快速發(fā)展和教育理念的更新,傳統(tǒng)的課程體系構(gòu)建方法在某些方面已難以滿足當(dāng)前教育需求。具體而言,傳統(tǒng)的課程體系往往缺乏系統(tǒng)性、動(dòng)態(tài)性和可視化表達(dá),難以全面、直觀地展示課程之間的邏輯關(guān)系、前后關(guān)系以及整體架構(gòu),在一定程度上限制了學(xué)生和教師對(duì)課程知識(shí)的理解和掌握。近年來,知識(shí)圖譜在教育領(lǐng)域展現(xiàn)出巨大的潛力,其本質(zhì)是通過圖的數(shù)據(jù)結(jié)構(gòu)來展示信息,節(jié)點(diǎn)代表實(shí)體,邊代表實(shí)體之間的關(guān)系,使得知識(shí)圖譜能夠直觀、全面地展示復(fù)雜的知識(shí)體系,具有結(jié)構(gòu)化、可擴(kuò)展性和可查詢性等特點(diǎn),使得其在教育領(lǐng)域具有廣泛的應(yīng)用價(jià)值。通過構(gòu)建課程體系知識(shí)圖譜,可以清晰地展示課程之間的邏輯關(guān)系、前后關(guān)系以及整體架構(gòu),為教師和學(xué)生提供更好的教學(xué)和學(xué)習(xí)支持。因此,本研究聚焦于高校計(jì)算機(jī)課程體系知識(shí)圖譜的構(gòu)建及可視化展示,力求構(gòu)建一個(gè)全面、準(zhǔn)確的高校計(jì)算機(jī)課程體系知識(shí)圖譜,以期為高校計(jì)算機(jī)課程體系的優(yōu)化和發(fā)展提供參考。
1 知識(shí)圖譜概述
知識(shí)圖譜作為一種新興的數(shù)據(jù)組織和表示方式,其本質(zhì)是一個(gè)語義網(wǎng)絡(luò),旨在描述客觀世界中的概念、實(shí)體、事件及其之間的關(guān)系,并對(duì)這些信息進(jìn)行語義建模。知識(shí)圖譜通過圖的數(shù)據(jù)結(jié)構(gòu)來展示信息,節(jié)點(diǎn)代表實(shí)體,邊則代表實(shí)體之間的關(guān)系,使得知識(shí)圖譜能夠直觀、全面地展示復(fù)雜的知識(shí)體系[1]。知識(shí)圖譜的構(gòu)建是一個(gè)多步驟的過程,主要包括數(shù)據(jù)收集、實(shí)體識(shí)別、關(guān)系抽取、知識(shí)融合與去重等環(huán)節(jié)。
知識(shí)圖譜的特點(diǎn)在于其結(jié)構(gòu)化、可擴(kuò)展性和可查詢性。結(jié)構(gòu)化使得知識(shí)圖譜能夠清晰地展示實(shí)體之間的關(guān)系,便于理解和利用;可擴(kuò)展性則允許研究者根據(jù)需求不斷擴(kuò)展知識(shí)圖譜的內(nèi)容;可查詢性則使得用戶能夠方便地查詢和獲取所需的信息。在教育領(lǐng)域,知識(shí)圖譜的應(yīng)用尤為廣泛,通過構(gòu)建課程體系知識(shí)圖譜,可以直觀地展示課程之間的邏輯關(guān)系、前后關(guān)系以及整體架構(gòu)。
2 高校計(jì)算機(jī)課程體系知識(shí)圖譜的構(gòu)建
2.1 數(shù)據(jù)層構(gòu)建
在構(gòu)建高校計(jì)算機(jī)課程體系知識(shí)圖譜的過程中,保證數(shù)據(jù)來源可靠與準(zhǔn)確是為了全面反映高校計(jì)算機(jī)課程體系,所以要從多個(gè)渠道收集相關(guān)數(shù)據(jù),主要包括國(guó)內(nèi)外代表性高校的官方網(wǎng)站、課程管理系統(tǒng)、教學(xué)大綱和培養(yǎng)方案等。
2.1.1 確定數(shù)據(jù)來源
國(guó)內(nèi)外具有代表性的高校作為數(shù)據(jù)源,這些高校在計(jì)算機(jī)科學(xué)領(lǐng)域具有較高的學(xué)術(shù)聲譽(yù)和豐富的教學(xué)資源,其課程體系能夠代表國(guó)內(nèi)外先進(jìn)水平。通過訪問各高校的官方網(wǎng)站和課程管理系統(tǒng),獲取最新的課程大綱、教學(xué)計(jì)劃、授課教師信息等數(shù)據(jù)。
2.1.2 數(shù)據(jù)預(yù)處理
由于收集到的數(shù)據(jù)格式各異、內(nèi)容繁雜,因此在進(jìn)行知識(shí)圖譜構(gòu)建之前,需要對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理[2]。數(shù)據(jù)預(yù)處理主要包括以下幾個(gè)步驟:①數(shù)據(jù)清洗。去除重復(fù)、錯(cuò)誤或無關(guān)的數(shù)據(jù)項(xiàng),確保數(shù)據(jù)的唯一性和準(zhǔn)確性。例如,在處理課程名稱時(shí),需要統(tǒng)一命名規(guī)則,避免同一門課程因命名不同而被識(shí)別為多個(gè)實(shí)體。②數(shù)據(jù)格式化。將不同來源的數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一的格式,便于后續(xù)處理和存儲(chǔ)。例如,將文本格式的教學(xué)大綱轉(zhuǎn)換為結(jié)構(gòu)化的XML或JSON格式,以便于提取實(shí)體和關(guān)系。③數(shù)據(jù)規(guī)范化。對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,確保不同來源的數(shù)據(jù)在語義上保持一致。例如,對(duì)于授課教師的姓名,需要統(tǒng)一規(guī)范為“姓+名”的格式,避免出現(xiàn)因姓名書寫不一致而導(dǎo)致的實(shí)體識(shí)別錯(cuò)誤。
2.2 模式層構(gòu)建
針對(duì)高校計(jì)算機(jī)課程體系知識(shí)圖譜的構(gòu)建,需要設(shè)計(jì)合理的模式層結(jié)構(gòu)來描述課程體系中的各個(gè)要素及其之間的關(guān)系。
2.2.1 定義實(shí)體類型與關(guān)鍵屬性
在高校計(jì)算機(jī)課程體系中,實(shí)體主要包括高校、課程、教師等,為了全面描述這些實(shí)體,需要定義它們的關(guān)鍵屬性。高校實(shí)體的關(guān)鍵屬性包括高校名稱、所在地區(qū)、辦學(xué)層次等,用于標(biāo)識(shí)不同高校及其在知識(shí)圖譜中的位置;課程實(shí)體的關(guān)鍵屬性包括課程名稱、課程編號(hào)、課程類型(必修/選修)、學(xué)時(shí)、學(xué)分、授課教師等,用于詳細(xì)描述每門課程的基本信息及其在課程體系中的地位和作用;教師實(shí)體的關(guān)鍵屬性包括教師姓名、職稱、研究方向等,用于標(biāo)識(shí)授課教師的身份和特長(zhǎng),以便學(xué)生了解教師的背景和教學(xué)特點(diǎn)[3]。
2.2.2 定義關(guān)系類型
在高校計(jì)算機(jī)課程體系中,實(shí)體之間的關(guān)系主要包括高校與課程的關(guān)系、課程與課程之間的關(guān)系以及課程與教師之間的關(guān)系等。為了準(zhǔn)確描述這些關(guān)系,需要定義相應(yīng)的關(guān)系類型(如表1所示)。其中高校與課程的關(guān)系為“開設(shè)”關(guān)系,表示某所高校開設(shè)了某門課程,用于連接高校實(shí)體和課程實(shí)體,反映高校在課程體系中的主體地位;課程與課程的關(guān)系為“先修”關(guān)系、“并行”關(guān)系和“后續(xù)”關(guān)系等,用于描述課程之間的學(xué)習(xí)順序和邏輯依賴關(guān)系。例如,“數(shù)據(jù)結(jié)構(gòu)”是“算法設(shè)計(jì)與分析”的先修課程,表示學(xué)生在學(xué)習(xí)“算法設(shè)計(jì)與分析”之前需要先掌握“數(shù)據(jù)結(jié)構(gòu)”的相關(guān)知識(shí);課程與教師的關(guān)系是“授課”關(guān)系,表示某門課程由某位教師負(fù)責(zé)授課,用于連接課程實(shí)體和教師實(shí)體,反映教師在課程體系中的教學(xué)角色。
2.2.3 使用RDF三元組形式表示實(shí)體、屬性和關(guān)系
RDF是一種用于描述網(wǎng)絡(luò)資源及其關(guān)系的標(biāo)準(zhǔn)數(shù)據(jù)模型,由節(jié)點(diǎn)(表示實(shí)體或概念)和邊(表示關(guān)系)組成。在定義了實(shí)體類型、關(guān)鍵屬性和關(guān)系類型之后,可以使用資源描述框架(RDF) 三元組的形式來表示這些實(shí)體、屬性和關(guān)系[4]。在高校計(jì)算機(jī)課程體系知識(shí)圖譜中,每個(gè)實(shí)體和關(guān)系都可以表示為一個(gè)RDF三元組(如圖1所示)。通過這種方式,可以將高校計(jì)算機(jī)課程體系中的各個(gè)要素及其之間的關(guān)系以結(jié)構(gòu)化的形式表示出來,為后續(xù)的知識(shí)圖譜構(gòu)建和可視化展示奠定基礎(chǔ)。
2.3 數(shù)據(jù)層構(gòu)建
數(shù)據(jù)層是知識(shí)圖譜的實(shí)際存儲(chǔ)層,包含圖譜中所有的實(shí)體、關(guān)系及屬性值等信息。在高校計(jì)算機(jī)課程體系知識(shí)圖譜的構(gòu)建過程中,數(shù)據(jù)層的構(gòu)建主要包括數(shù)據(jù)導(dǎo)入與存儲(chǔ)、實(shí)體與關(guān)系抽取以及知識(shí)融合與去重等步驟。
2.3.1 數(shù)據(jù)導(dǎo)入與存儲(chǔ)
將經(jīng)過預(yù)處理的數(shù)據(jù)導(dǎo)入到知識(shí)圖譜的存儲(chǔ)系統(tǒng)中,以便后續(xù)的處理和查詢。選擇Neo4j圖數(shù)據(jù)庫作為存儲(chǔ)工具,能夠高效地存儲(chǔ)和查詢圖結(jié)構(gòu)數(shù)據(jù),并支持復(fù)雜的數(shù)據(jù)關(guān)系表示和查詢操作。在數(shù)據(jù)導(dǎo)入過程中,需要將預(yù)處理后的數(shù)據(jù)集轉(zhuǎn)換為Neo4j能夠識(shí)別的格式(如CSV文件),并利用Neo4j提供的導(dǎo)入工具將數(shù)據(jù)批量導(dǎo)入到數(shù)據(jù)庫中,導(dǎo)入完成后就可以在Neo4j中看到高校計(jì)算機(jī)課程體系的初步知識(shí)圖譜結(jié)構(gòu)[5]。
2.3.2 實(shí)體與關(guān)系抽取
實(shí)體與關(guān)系抽取涉及從原始數(shù)據(jù)中識(shí)別出實(shí)體和關(guān)系,并將其以結(jié)構(gòu)化的形式表示出來。在高校計(jì)算機(jī)課程體系知識(shí)圖譜的構(gòu)建過程中,可采用多種技術(shù)手段來實(shí)現(xiàn)實(shí)體與關(guān)系的抽取。其一,基于規(guī)則的方法。根據(jù)數(shù)據(jù)的特點(diǎn)制定相應(yīng)的抽取規(guī)則,如通過正則表達(dá)式匹配課程名稱、通過關(guān)鍵詞匹配授課教師姓名等,該方法簡(jiǎn)單直接,但依賴于人工制定的規(guī)則,無法覆蓋所有數(shù)據(jù)情況[6]。其二,基于機(jī)器學(xué)習(xí)的方法。訓(xùn)練命名實(shí)體識(shí)別(NER) 和關(guān)系抽?。≧E) 模型來自動(dòng)識(shí)別文本中的實(shí)體和關(guān)系,可以利用深度學(xué)習(xí)算法,自動(dòng)學(xué)習(xí)文本中的特征表示和模式識(shí)別能力,從而提高實(shí)體與關(guān)系抽取的準(zhǔn)確性和泛化能力。然而,這種方法需要大量的標(biāo)注數(shù)據(jù)來訓(xùn)練模型,并且模型的性能會(huì)受到標(biāo)注數(shù)據(jù)質(zhì)量和數(shù)量的影響。其三,混合方法。為了兼顧準(zhǔn)確性和效率,采用混合方法來實(shí)現(xiàn)實(shí)體與關(guān)系的抽取,即首先利用基于規(guī)則的方法進(jìn)行初步抽取,然后再利用基于機(jī)器學(xué)習(xí)的方法對(duì)結(jié)果進(jìn)行修正和優(yōu)化,可以在保證準(zhǔn)確性的同時(shí)提高抽取效率。
2.3.3 知識(shí)融合與去重
由于數(shù)據(jù)來源多樣且可能存在重復(fù)和沖突的情況,因此在構(gòu)建知識(shí)圖譜之前,需要進(jìn)行知識(shí)融合與去重處理。在高校計(jì)算機(jī)課程體系知識(shí)圖譜的構(gòu)建過程中,可采用以下幾種方法進(jìn)行知識(shí)融合與去重處理:①實(shí)體對(duì)齊。針對(duì)不同數(shù)據(jù)源中出現(xiàn)的相同或相似實(shí)體(如課程名稱相同但編號(hào)不同的課程實(shí)體),運(yùn)用實(shí)體對(duì)齊技術(shù)將它們鏈接到同一個(gè)實(shí)體節(jié)點(diǎn)上,避免在知識(shí)圖譜中出現(xiàn)重復(fù)的實(shí)體節(jié)點(diǎn)并減少冗余信息。②屬性整合。針對(duì)同一個(gè)實(shí)體在不同數(shù)據(jù)源中出現(xiàn)的不同屬性值(如授課教師姓名書寫不一致的情況),運(yùn)用屬性整合技術(shù)將它們合并為一個(gè)統(tǒng)一的屬性值表示形式,確保實(shí)體屬性的準(zhǔn)確性和一致性,方便后續(xù)的數(shù)據(jù)查詢和分析操作。③沖突解決。針對(duì)不同數(shù)據(jù)源中出現(xiàn)的沖突信息(如課程學(xué)時(shí)在不同數(shù)據(jù)源中表示不一致的情況),可制定相應(yīng)的沖突解決規(guī)則,選擇其中一個(gè)可靠的數(shù)據(jù)源作為權(quán)威數(shù)據(jù)源,并優(yōu)先使用其提供的信息來構(gòu)建知識(shí)圖譜,從而減少因數(shù)據(jù)沖突而導(dǎo)致的不確定性和錯(cuò)誤。
3 高校計(jì)算機(jī)課程體系知識(shí)圖譜的可視化展示
3.1 可視化技術(shù)選擇與實(shí)現(xiàn)
在高校計(jì)算機(jī)課程體系知識(shí)圖譜的構(gòu)建中,可選擇Neo4j圖數(shù)據(jù)庫來實(shí)現(xiàn)知識(shí)圖譜的可視化展示。Neo4j作為NoSQL圖數(shù)據(jù)庫,專為處理具有復(fù)雜關(guān)系的數(shù)據(jù)而設(shè)計(jì),主要基于圖形結(jié)構(gòu)來存儲(chǔ)數(shù)據(jù),能夠高效地存儲(chǔ)和查詢實(shí)體之間的關(guān)系,非常適合用于構(gòu)建和展示知識(shí)圖譜。Neo4j提供了豐富的圖形查詢語言Cypher,使得數(shù)據(jù)查詢和可視化變得直觀和便捷。同時(shí),Neo4j圖數(shù)據(jù)庫內(nèi)置了強(qiáng)大的可視化工具如(Neo4j Browser) ,用戶能夠直接通過Web界面查看和交互圖形數(shù)據(jù)[7]。隨著數(shù)據(jù)量的增長(zhǎng)和需求的變化,可視化系統(tǒng)需要具備良好的可擴(kuò)展性和靈活性,Neo4j圖數(shù)據(jù)庫支持分布式部署和水平擴(kuò)展,能夠應(yīng)對(duì)大規(guī)模數(shù)據(jù)的可視化需求,同時(shí)Neo4j的圖形查詢語言Cypher提供了靈活的查詢能力,使得用戶可以根據(jù)不同的需求定制可視化展示方案。
3.2 可視化展示實(shí)例與分析
為了更直觀地展示高校計(jì)算機(jī)課程體系知識(shí)圖譜的結(jié)構(gòu)和特點(diǎn),可利用Neo4j Browser呈現(xiàn)整個(gè)計(jì)算機(jī)課程體系的架構(gòu)圖。在這個(gè)架構(gòu)圖中(如圖2所示),課程以節(jié)點(diǎn)的形式表示,課程之間的關(guān)系(如先修關(guān)系、支撐關(guān)系等)以邊的形式表示,不同的節(jié)點(diǎn)和邊通過顏色、大小、形狀等屬性進(jìn)行區(qū)分,以便于用戶快速識(shí)別和理解。例如,基礎(chǔ)課程可以用較大的節(jié)點(diǎn)表示,專業(yè)課程則可以用較小的節(jié)點(diǎn)表示;先修關(guān)系可以用實(shí)線表示,支撐關(guān)系則可以用虛線表示[8]。如此一來,用戶可以清晰地看到不同課程在整個(gè)體系中的位置和作用。
在可視化架構(gòu)圖中,核心課程通常具有較多的連接和較高的中心性,是整個(gè)課程體系的基礎(chǔ)和支撐,對(duì)于培養(yǎng)學(xué)生的核心能力和素質(zhì)具有重要作用。借助Neo4j的圖形查詢語言Cypher,可以輕松地找出這些核心課程并進(jìn)行高亮顯示,還可以分析課程之間的關(guān)鍵路徑,即學(xué)生完成學(xué)業(yè)所必須經(jīng)歷的一系列課程。在可視化展示中,關(guān)鍵路徑可以用粗線或不同顏色表示,以便于用戶識(shí)別和跟蹤。除了展示課程體系的結(jié)構(gòu)外,可視化工具還可以通過比較不同課程的教學(xué)單元和知識(shí)點(diǎn)之間的相似性,發(fā)現(xiàn)潛在的教學(xué)內(nèi)容重復(fù)問題。在Neo4j中,可以利用圖形查詢和聚類分析等方法來識(shí)別這些重復(fù)內(nèi)容,并在可視化展示中進(jìn)行標(biāo)注和提示。例如,對(duì)于重復(fù)出現(xiàn)的教學(xué)單元或知識(shí)點(diǎn),可以用相同的顏色或標(biāo)記進(jìn)行區(qū)分,并在旁邊附上詳細(xì)的重復(fù)說明和建議。
4 結(jié)束語
綜上所述,本文通過構(gòu)建高校計(jì)算機(jī)課程體系知識(shí)圖譜,實(shí)現(xiàn)了課程體系的直觀展示和深入分析。研究結(jié)果顯示,知識(shí)圖譜技術(shù)能夠有效地組織和表示復(fù)雜的課程體系,幫助教師和學(xué)生更好地理解和掌握課程知識(shí),進(jìn)而提升教學(xué)效果和學(xué)習(xí)效率。這一研究成果不僅豐富了知識(shí)圖譜在教育領(lǐng)域的應(yīng)用案例,還為高校課程體系的優(yōu)化和改革提供了新的理論和方法支持。展望未來,隨著教育數(shù)據(jù)的不斷積累和知識(shí)圖譜技術(shù)的持續(xù)發(fā)展,高校計(jì)算機(jī)課程體系知識(shí)圖譜的應(yīng)用前景將更加廣闊。一方面,可以進(jìn)一步挖掘知識(shí)圖譜在課程體系建設(shè)中的潛力,如利用知識(shí)圖譜進(jìn)行課程內(nèi)容的智能關(guān)聯(lián)和推薦,幫助教師優(yōu)化課程設(shè)計(jì)和教學(xué)內(nèi)容。另一方面,可以探索將知識(shí)圖譜應(yīng)用于個(gè)性化學(xué)習(xí)路徑推薦等領(lǐng)域,根據(jù)學(xué)生的學(xué)習(xí)需求和背景,為其量身定制合適的學(xué)習(xí)路徑和資源,從而進(jìn)一步提升學(xué)習(xí)效果和滿意度。
參考文獻(xiàn):
[1] 魏晗,陳剛,郭志剛.課程體系知識(shí)圖譜的構(gòu)建與應(yīng)用實(shí)踐[J].教育教學(xué)論壇,2023(20):10-13.
[2] 祝園園,葉茫,彭敏.高校計(jì)算機(jī)課程體系知識(shí)圖譜構(gòu)建及可視化[J].信息與電腦(理論版),2023,35(4):254-256.
[3] 朱嘉賢,宋向瑛.基于知識(shí)圖譜驅(qū)動(dòng)的程序類課程教育技術(shù)研究[J].現(xiàn)代計(jì)算機(jī),2021(20):108-112.
[4] 劉佳瑞.基于學(xué)科專業(yè)課程知識(shí)圖譜的智慧學(xué)習(xí)資源推薦研究[D].石家莊:河北經(jīng)貿(mào)大學(xué),2023.
[5] 宮兆坤.基于知識(shí)圖譜的中職Python教學(xué)案例設(shè)計(jì)與應(yīng)用[D].濟(jì)南:山東師范大學(xué),2023.
[6] 萬聰,王聰,徐長(zhǎng)明.工程教育認(rèn)證背景下以動(dòng)態(tài)知識(shí)圖譜為核心的高校教學(xué)模式探究[J].軟件導(dǎo)刊,2023,22(7):158-163.
[7] 丁國(guó)富,王淑營(yíng),馬術(shù)文,等.基于知識(shí)圖譜的產(chǎn)教融合課程體系建設(shè)模式探索[J].高等工程教育研究,2024(2):79-83,90.
[8] 封小霞.高職課程體系知識(shí)圖譜構(gòu)建及可視化研究[J].電腦知識(shí)與技術(shù),2024,20(9):39-42.
【通聯(lián)編輯:光文玲】