謝 麗
(廣州城市理工學院,廣東 廣州510800)
知識圖譜的誕生是為了讓機器具備認知的能力,其以圖的形式描述客觀世界中的實體及其間的關系,在智能搜索、智能問答、大數據分析、自然語言理解等領域展現出巨大的應用價值[1]。知識圖譜作為人工智能的一個分支,其具體方法大都來自計算機或人工智能的其他領域,涉及知識工程、自然語言處理、圖數據庫、機器學習等技術。
綜上所述,知識圖譜已經成為一門獨立學科,設置在我國新增的人工智能學科目錄下。在人工智能專業(yè)中開設知識圖譜課程,讓學生能夠從整體、全局和系統(tǒng)的視角看待和應用知識圖譜技術,并了解知識圖譜相關領域的最新進展,具有非常重要的作用和意義。本文從教學現狀的分析、教學目標的定位、教學內容的選擇、教學方法及考核方式的探究等方面闡述對知識圖譜課程的教學探索與實踐。
知識圖譜作為人工智能專業(yè)的一門重要基礎課,目前在高校開設本課程將面臨以下問題。
“知識圖譜”一詞誕生于2012年,谷歌將其應用于搜索引擎,以提高用戶的搜索質量。隨著人工智能技術的發(fā)展和應用,知識圖譜才逐漸成為關鍵技術之一。因此,目前還極少有適合用于本科教學的知識圖譜教材,也沒有統(tǒng)一的開發(fā)語言以及軟件平臺來輔助課程的教學。除此之外,人工智能專業(yè)是2017年教育部提出新工科建設之后高校才逐漸增設的,因而開設該課程的學校還相對較少,對該課程的教學經驗相對缺乏。
由于課程內容具有學科交叉性,學科覆蓋內容的知識較廣,且內容本身具有一定的理論深度,學生的學習難度加大,容易產生畏懼心理。此外,很多同學單純地“為學而學”,不知道怎樣將學到的知識加以應用,容易產生厭學心理。因此,怎樣在有限的學時中既有效地講授課程核心理論知識,又能夠聯系實際并實踐成為知識圖譜課程開展好壞的關鍵。
知識圖譜是結構化的語義知識庫,用于描述客觀世界中的實體及實體間的關系,其基本構成是“實體-關系-實體”三元組。實體指現實世界中具體或抽象的事物,如人、地方、組織機構、概念等;關系描述實體之間客觀存在的關聯,如人與人、人與物之間的關聯,概念與某個物體之間的關聯等。因此,以知識圖譜為核心建立一個具有語義處理能力與開放互聯的知識庫,可以在智能問答、自然語言理解、大數據分析、個性化推薦等領域產生重大應用價值。
學生通過該課程的學習,了解該領域的技術發(fā)展前沿、掌握知識圖譜的相關技術,并初步具備構建小型知識圖譜的能力,以及基于知識圖譜進行數據分析、文本分析的能力。
課程教學堅持以學生為本,教學相長的指導思想。針對知識圖譜課程的教學現狀、教學目標和學生已有的知識能力,明確相應的教學內容、教學方法及考核方式,減少學生因課程內容復雜而產生的畏懼心理、厭學心理,幫助學生切實地理解和掌握知識圖譜相關技術。
知識圖譜生命周期一般經歷:知識建模、知識獲取、知識融合、知識存儲和檢索、知識推理以及知識應用等階段[3]。因此,該課程的教學內容可以按照知識圖譜的生命周期進行講授,由簡到難,循序漸進地梳理知識圖譜的相關理論知識和基本方法[2]。具體的教學內容如下:
(1)知識圖譜概述,介紹知識圖譜的相關概念、發(fā)展歷程、典型的知識圖譜項目、應用價值以及學習知識圖譜所必需的基礎知識等。
(2)知識建模,介紹典型的知識表示方法,并以Protégé工具為例講解知識體系構建的具體實現過程。
(3)知識獲取,講授如何從不同的數據源(結構化數據、半結構化數據、非結構化數據)中采用不同的方法獲取知識。
(4)知識融合,講授如何將獲取到的知識進行融合并構建數據之間的關聯。
(5)知識存儲與檢索,介紹知識圖譜存儲的主要特點和難點、當前常用的幾種圖數據庫技術,并以Neo4j為例講授如何有效地存儲和檢索知識圖譜。
(6)知識推理,介紹如何從已有的知識庫中經過推理,挖掘出隱含的知識并建立實體間的新關聯。
(7)知識應用,基于知識圖譜的應用技術展開介紹,包括智能搜索、自動問答、圖譜可視化等。
知識圖譜是人工智能專業(yè)的核心課程之一,其內容是建立在自然語言理解、數據挖掘、機器學習、Python語言等基礎課程上,是具有更高層次的專業(yè)知識。因此,課程可安排在本科高年級階段的第6或者第7學期,分配32學時(2學分),其中理論教學占24學時,實驗教學占8學時。在教學過程中,可以試行講課與課堂討論、項目實踐、自學結合的教學方式[3]。具體如下:
(1)教師應仔細遴選教材,選取學生易于理解且易于實踐的書籍作為入門參考書。授課時從應用實例展開,通過問題引導、啟發(fā)、課堂討論等方式,激發(fā)學生的學習興趣并讓其積極參與到課堂中來,提高學生學習的積極主動性。
(2)選取典型章節(jié),增加項目教學的環(huán)節(jié),將本章的知識點都融入項目中。目前國內外很多研究機構都推出了面向大眾、開放的知識圖譜,如國外Freebase、Wikidata、國內OpenKG等,以及一些開源工具,適合初學者學習知識圖譜。因此,教師可從中選取難度適中的項目,也可由學生自己選擇和定制項目課題,再引導學生有步驟地完成,培養(yǎng)學生的動手能力和實踐精神。
(3)教師每年依據知識圖譜技術的發(fā)展,定期刪減陳舊的理論知識,增加新的理論和研究成果。制作和完善多媒體課件、教學項目內容、課外學習資料等,建設資源共享網站,讓學生可以利用網站共享資源完成自主學習,進一步增強學生學習的積極主動性,提高教學質量和學習效果。
考核屬于教學活動的一部分,在以期末考試成績和平時成績?yōu)橹鞯目己朔绞缴?,增加教學項目的考核內容。由于該課程的應用性較強,卷面考試成績只占50%,考查學生對基本內容的理解和掌握;平時成績占15%,包括作業(yè)、上課考勤等;教學項目考核占35%,從資料搜集與學習、項目的完成度、項目答辯和課程報告四個方面進行考核,貫穿課程教學的各個階段。這種考核方式有效地將理論與實踐結合,要求學生既要學好課程內容又需做好自己的教學項目,有助于提高學生的學習效果和培養(yǎng)學生的綜合素質能力。
知識圖譜是人工智能應用不可或缺的資源,其在問答系統(tǒng)、智能金融、智慧醫(yī)療等領域具有廣闊的應用場景,未來會有更多高校的人工智能專業(yè)開設知識圖譜課程。通過本課程的開展,讓學生對知識圖譜有一個較全面的認識并具備基本實踐能力,讓更多的學生可以在知識圖譜細分研究方向上更加深入地學習,是具有較大挑戰(zhàn)性的教學活動。本文分析了該課程的教學現狀,明確了教學目標、教學內容、教學方式及考核方式等方面的內容。此外,由于人工智能技術發(fā)展迅速,而知識圖譜課程在高校開展時間較短,所以還需要在實踐教學中繼續(xù)優(yōu)化課程內容,細化教學大綱,為培養(yǎng)我國人工智能專業(yè)人才打下良好的基礎。