王 慧,孫德紅
(閩南理工學(xué)院 信息管理學(xué)院,福建 石獅 362700)
在教育信息化改革不斷深入的時代背景下,在線教育實現(xiàn)了快速發(fā)展,信息化技術(shù)的應(yīng)用使其迎來了巨大的發(fā)展機遇,同時也為學(xué)習(xí)模式的創(chuàng)新發(fā)展指明了新的方向。受互聯(lián)網(wǎng)強大的信息傳輸功能影響,用戶可以選擇的學(xué)習(xí)資源更加豐富,學(xué)習(xí)活動的開展也不再局限于固定的時間和空間范圍內(nèi),不僅提高了用戶學(xué)習(xí)的積極性,而且優(yōu)質(zhì)學(xué)習(xí)資源的價值也實現(xiàn)了指導(dǎo)提升。因為在互聯(lián)網(wǎng)環(huán)境中資源的共享范圍更大,優(yōu)質(zhì)資源被重用的次數(shù)更高[1]。因此,學(xué)習(xí)者的學(xué)習(xí)積極性極大地提高,其能夠以自主意愿更加全面地了解所屬領(lǐng)域的知識內(nèi)容,在學(xué)習(xí)效率和學(xué)習(xí)效果上表現(xiàn)出驚人的成績[2]。但是,在線學(xué)習(xí)用戶數(shù)量的快速增長使得與之相關(guān)的產(chǎn)業(yè)鏈不斷優(yōu)化,以學(xué)習(xí)資源為產(chǎn)品的企業(yè)以爆炸式的趨勢快速發(fā)展,由此帶來的信息大爆炸也產(chǎn)生了一定的負面影響。因此,國內(nèi)學(xué)者針對資源信息過載這一情況展開研究。張曉丹[3]提出對改進的圖神經(jīng)網(wǎng)絡(luò)文本分類模型應(yīng)用進行研究,利用文本、句子及關(guān)鍵詞構(gòu)建拓撲關(guān)系圖和拓撲關(guān)系矩陣,采用馬爾科夫鏈采樣算法對層節(jié)點進行采樣,再利用多級降維方法實現(xiàn)特征降維,完成文本分類。該方法雖然能夠保證文本及文獻大數(shù)據(jù)得到有效的分類,但其分類的精準率較低。學(xué)習(xí)資源的個性化推薦成為現(xiàn)階段個性化學(xué)習(xí)的重要工具。與系統(tǒng)化教育相比,個性化學(xué)習(xí)更加注重對學(xué)習(xí)資源與用戶需求之間的匹配關(guān)系[4]。任蓓蓓等[5]提出基于深度學(xué)習(xí)的數(shù)字圖書館資源個性化推薦模型設(shè)計方法。通過深度學(xué)習(xí)算法,根據(jù)用戶特征、行為與偏好等信息對數(shù)字圖書館用戶進行建模,從而實現(xiàn)數(shù)字圖書館資源個性化推薦。但該方法對目標資源的定位需要用戶花費大量的時間,最終的定位結(jié)果也無法得到保障。
基于此,文中從用戶的角度出發(fā)[6],以用戶自身的偏好為基礎(chǔ),結(jié)合學(xué)習(xí)資源的知識點構(gòu)成,實現(xiàn)個性化的學(xué)習(xí)資源推薦,并通過試驗測試的方式與不同方法同時進行應(yīng)用分析,驗證了文中算法的有效性。
對用戶特征進行分析是掌握用戶的基礎(chǔ)學(xué)習(xí)情況和學(xué)習(xí)偏好的主要途徑[7],以此為基礎(chǔ)可以更好地確定用戶的學(xué)習(xí)目標,為學(xué)習(xí)資源的組織推薦提供依據(jù)。就現(xiàn)階段以E-learning為主要環(huán)境的學(xué)習(xí)而言,用戶學(xué)習(xí)的特征在學(xué)習(xí)過程的價值和重要性被放大[8],因此,文中在進行資源推薦之前,對用戶學(xué)習(xí)的內(nèi)部因素進行了充分了解,而該過程主要是通過對用戶在線學(xué)習(xí)行為特征分析實現(xiàn)的[9]。
一般情況下,學(xué)習(xí)行為的出現(xiàn)以目的性的形式存在,用戶為了達到某種學(xué)習(xí)效果,在學(xué)習(xí)活動過程中會通過優(yōu)化學(xué)習(xí)習(xí)慣、調(diào)節(jié)學(xué)習(xí)方式、選擇學(xué)習(xí)內(nèi)容的方式提高學(xué)習(xí)效率,而這一系列行為的出現(xiàn)都是以一定共性存在的[10]。為了切實實現(xiàn)對用戶行為特征的全面挖掘,文中對其進行分析。
如圖1所示,對用戶在線交流互動情況的分析與以教師面授學(xué)習(xí)為基礎(chǔ)的傳統(tǒng)教學(xué)模式不同,在線教學(xué)更加注重對課堂溝通、交流的應(yīng)用,媒體課件展示的方式也可以將知識點更加直觀地傳達至用戶[11]。當(dāng)在學(xué)習(xí)過程中出現(xiàn)不能理解的難點時,用戶可以通過線上交流的及時性特征實時提出自己的疑問。因此,文中以用戶在小組討論、主題討論、發(fā)布問題、回答問題等交互行為中的表現(xiàn)對其偏好以及主要問題進行采集。其次就是學(xué)生自主學(xué)習(xí)的意識。在學(xué)習(xí)過程中,用戶會根據(jù)自己的學(xué)習(xí)需求以及興趣趨向主動對相關(guān)知識內(nèi)容進行搜索和瀏覽[12],由此產(chǎn)生的點擊、收藏以及下載操作都會直接或間接地體現(xiàn)用戶的偏好。除此之外,用戶在知識社區(qū)、論壇的答疑解惑行為也是由用戶主觀能動性引起的,也可以在一定程度上反饋其偏好。用戶結(jié)合自身存在的不足,根據(jù)自己的實際情況對相應(yīng)的知識點進行重復(fù)學(xué)習(xí),該部分內(nèi)容也是資源推薦的重要組成部分之一。除了上述特征外,用戶自身對知識的掌握能力決定了推薦學(xué)習(xí)資源的難易程度。在學(xué)習(xí)目標的推動下,用戶對知識掌握能力可以實現(xiàn)不斷發(fā)展,但這種發(fā)展也是階段性的,因此,按照現(xiàn)階段用戶對知識的理解程度和深度對其進行資源推薦決定了最終用戶對其使用情況。
圖1 基于用戶特征的偏好挖掘方法
以此為基礎(chǔ),文中將用戶在學(xué)習(xí)過程中表現(xiàn)出的學(xué)習(xí)行為特征作為其偏好的判定依據(jù),并實現(xiàn)個性化學(xué)習(xí)資源推薦。
要實現(xiàn)對學(xué)習(xí)資源的有效推薦,僅考慮用戶的偏好是遠遠不夠的,在目前的教育環(huán)境中,學(xué)習(xí)資源無論是在結(jié)構(gòu)上還是表現(xiàn)形式上都呈現(xiàn)出明顯的復(fù)雜化和多樣化的趨勢,其中,表現(xiàn)形式就可以分為課件、案例、文獻、索引、網(wǎng)絡(luò)課程、試題、試卷、作業(yè)、文本等。在此背景下,通過改進圖神經(jīng)網(wǎng)絡(luò)實現(xiàn)以知識點為基礎(chǔ)的本體構(gòu)建。該過程以充分體現(xiàn)各級各類的學(xué)習(xí)資源數(shù)據(jù)共享價值為基本原則,對存在無序性、非結(jié)構(gòu)性的學(xué)習(xí)資源進行劃分,具體的劃分類別包括文本類資料、媒體類資料。其中,文本類資料包括課件、案例、試卷、輔助材料練習(xí)冊等;媒體資料包括視頻、動畫、音頻、文本、圖片等。對于部分難以直接界定其劃分類別的資源,利用改進的圖神經(jīng)網(wǎng)絡(luò)對其進行結(jié)構(gòu)重組,采用基于元數(shù)據(jù)的本體表示構(gòu)建方法解決圖神經(jīng)網(wǎng)絡(luò)中存在的知識領(lǐng)域定義模糊問題。
為此,首先構(gòu)建了學(xué)習(xí)資源模型,具體為
(1)
式中:γ為學(xué)習(xí)資源模型;xi為其知識點組成;sim(x1,x2,…,xi)為各知識點間的相似程度;p為資源中元數(shù)據(jù)占比。該模型主要用于學(xué)習(xí)資源中知識點的管理和檢索,利用知識點描述資源本體時,通過元數(shù)據(jù)建立本體與知識點之間的關(guān)聯(lián)關(guān)系,利用元數(shù)據(jù)屬性對不同類別的層次進行定義,構(gòu)建出包括父類(資料、動畫、課程類等)和子類(文本類、圖形類、視頻類、圖像類、音頻類等)的圖神經(jīng)網(wǎng)絡(luò)。此時學(xué)習(xí)資源本體的層次關(guān)系可以體現(xiàn)出資源在知識點構(gòu)成上的差別。為了關(guān)聯(lián)不同資源,將改進圖神經(jīng)網(wǎng)絡(luò)資源結(jié)構(gòu)中的知識點間關(guān)系設(shè)計為父子、參考、依賴、平行4種。其中,父子關(guān)系主要體現(xiàn)資源間的部分與整體性,依賴關(guān)系主要體現(xiàn)資源間的重疊性,平行關(guān)系主要體現(xiàn)資源間在知識點構(gòu)成上的獨立性。
在獲得用戶偏好信息和學(xué)習(xí)資源本體信息后,為了提高推薦結(jié)果的可靠性,分別對二者進行雙重聚類處理,即通過雙重聚類算法分別產(chǎn)生用戶聚類和學(xué)習(xí)資源聚類,對聚類結(jié)果進行匹配,確定最終的推薦內(nèi)容。
對于同屬于一個聚類中的用戶,其對學(xué)習(xí)資源的偏好具有更高的相似性。為了盡可能提高聚類中用戶對資源需求的一致性,文中確定聚類劃分的標準是以其對資源的評價結(jié)果為基礎(chǔ)設(shè)計的,用L表示用戶集合,用ln表示生成的n個用戶聚類。其具體計算方式為
L=l1∪l2∪…∪ln,
li∪lj=?.
(2)
由此生成n個用戶聚類,對應(yīng)的用戶聚類中心數(shù)量也為n,在每個聚類中心位置的用戶對學(xué)習(xí)資源的評分結(jié)果即為聚類用戶劃分的目標值。文中設(shè)置到聚類中心點的距離r不超過50%。對于學(xué)習(xí)資源的聚類也采用相同的方法。
在完成對用戶偏好以及學(xué)習(xí)資源的聚類處理后,通過計算二者的中心擬合度判斷資源是否滿足對應(yīng)用戶類的需求,其計算方式為
D=sim(Ol,Oz).
(3)
式中:Ol和Oz分別表示用戶和資源的聚類中心。在此基礎(chǔ)上,是否進行推薦的判定標準如表1所示。
表1 資源推薦判斷標準
按照表1設(shè)置的標準,確定是否需要進行推薦。對于需要進一步對知識點擬合度進行計算的資源,同樣按照表1的標準進行判定。
文中進行實驗的環(huán)境為Windows 10 64位操作系統(tǒng),CPU參數(shù)為Intel(R)Core(TM)i5-3470,系統(tǒng)的內(nèi)存空間為64 GB,使用的Matlab R為2020a版本。為了更加準確地驗證文中提出的算法,分別從可行性與有效性兩個角度進行測試。從某互聯(lián)網(wǎng)教育平臺中隨機選取10名學(xué)生參與實驗。參與實驗的10名學(xué)生均為在校大學(xué)生,其中,4名學(xué)生成績優(yōu)異,3名學(xué)生成績中等,3名學(xué)生成績中下。按照抽取順序?qū)?0名學(xué)生設(shè)置編號為1~10。實驗數(shù)據(jù)集以“人工智能”課程為基礎(chǔ)自主構(gòu)建,其中,分為試題和考試答題數(shù)據(jù)兩種類型,具體的實驗數(shù)據(jù)集設(shè)置如表2所示。
以表2中數(shù)據(jù)為基礎(chǔ),將所有試題的答案數(shù)據(jù)歸一化處理,并將主觀題的最終分數(shù)與客觀題的最終分數(shù)映射到[0,1]的區(qū)間范圍內(nèi)。與此同時,為了確保測試結(jié)果的可靠性,構(gòu)建了3個指標作為測試結(jié)果的評價依據(jù),分別為推薦精確率Precision(用P表示)、推薦內(nèi)容召回率Recall(用R表示)以及F1綜合評價指標,精準率、召回率、F1值越高越好。三者的計算方式為
(4)
(5)
(6)
式中:P表示推薦學(xué)習(xí)資源中知識點與實際學(xué)習(xí)需求一致的程度,也就是推薦精確率程度;R表示推薦學(xué)習(xí)資源中知識點與實際學(xué)習(xí)需求一致的比例;TP、FP和FN分別表示最終推薦內(nèi)容包含的知識點、需要的知識點以及不需要的知識點。
表2 實驗數(shù)據(jù)設(shè)置
為了確保后續(xù)指標計算結(jié)果的可靠性,對所有知識點對應(yīng)知識圖譜中的貢獻值進行分析,并得到了如表3所示的結(jié)果。
表3 知識點貢獻值統(tǒng)計
以此為基礎(chǔ),在10名參與實驗的學(xué)生中隨機抽取5名學(xué)生,從宏觀角度分析學(xué)生對于不同知識點的失分率,其結(jié)果如表4所示。然后對這5名學(xué)生完成推薦內(nèi)容學(xué)習(xí)后的知識點失分率再次進行計算,其結(jié)果如表5所示。
通過對比表4和表5不難看出,經(jīng)過學(xué)習(xí)推薦的內(nèi)容后,知識點的失分率呈現(xiàn)出明顯的下降趨勢,表明文中設(shè)計方法的推薦內(nèi)容對于學(xué)生的學(xué)習(xí)需求具有較強的判斷能力,推薦效果良好。
表4 學(xué)生對知識點的失分率統(tǒng)計
表5 學(xué)習(xí)推薦內(nèi)容后學(xué)生對知識點的失分率統(tǒng)計
為了驗證該方法的優(yōu)越性,分別采用SETB算法和TBTFIDF算法作為對照組,與文中推薦方法進行試驗測試。通過比較3種方法的推薦結(jié)果,對文中方法的有效性進行分析,得到實驗結(jié)果如表6所示。
表6 不同方法的推薦效果統(tǒng)計 %
從表6可以看出,與SETB算法和TBTFIDF算法相比,文中方法的推薦精度、推薦內(nèi)容的召回率以及F1綜合評價指標都表現(xiàn)出明顯優(yōu)勢,表明文中設(shè)計方法能夠?qū)崿F(xiàn)以學(xué)生需求為基礎(chǔ)進行個性化學(xué)習(xí)資源推薦,對提高學(xué)習(xí)效果具有明顯作用。
隨著現(xiàn)代通信及信息技術(shù)的不斷發(fā)展,資源的共享程度實現(xiàn)了全球化發(fā)展,與此同時,這種高度復(fù)合化的資源一方面豐富了學(xué)習(xí)的可利用資源,另一方面也對資源的選擇提出了更高要求。為此,如何充分結(jié)合資源自身的知識組成以及用戶的學(xué)習(xí)需求,實現(xiàn)高質(zhì)量的學(xué)習(xí)資源個性化推薦成為值得關(guān)注的重點問題之一。
文中基于改進圖神經(jīng)網(wǎng)絡(luò)和用戶偏好聚類的個性化學(xué)習(xí)資源推薦算法進行研究,以用戶行為為基礎(chǔ),挖掘用戶的偏好,并通過改進圖神經(jīng)網(wǎng)絡(luò)搭建學(xué)習(xí)資源的知識點架構(gòu),在聚類的基礎(chǔ)上實現(xiàn)二者之間的匹配關(guān)系,確定最終的推薦內(nèi)容。這種推薦方法在測試中取得了良好的效果。通過本研究,以期為提高學(xué)習(xí)資源的利用率,降低用戶在資源選擇中的時間成本提供有價值的幫助。