文∣蒲菊華 王鋆玙 熊璋
“互聯(lián)網(wǎng)+”戰(zhàn)略和教育信息化2.0 進(jìn)程的全面推進(jìn),使“互聯(lián)網(wǎng)+教育”的全新教學(xué)理念得以廣泛推廣,中華人民共和國教育部印發(fā)的《教育信息化2.0行動(dòng)計(jì)劃》提出要逐步發(fā)展在線教學(xué)模式。2020 年初爆發(fā)的新冠肺炎疫情為在線教育帶來了新的機(jī)遇與挑戰(zhàn)。據(jù)統(tǒng)計(jì),2020 年我國在線教育用戶規(guī)模增長至4.23億,占網(wǎng)民整體數(shù)量的46.8%。在政策支持、市場(chǎng)需求、技術(shù)革新等多方因素共同推動(dòng)下,我國以中小學(xué)生為服務(wù)主體的K12在線教育快速發(fā)展,已成為當(dāng)下的教育熱點(diǎn)。
為迎合在線學(xué)習(xí)的市場(chǎng)需求,大量優(yōu)質(zhì)在線學(xué)習(xí)平臺(tái)興起并快速發(fā)展,因其可以以低成本而獲得優(yōu)質(zhì)資源的契機(jī)而吸引了大量學(xué)習(xí)者,累積了包含各種粒度學(xué)習(xí)資源的海量數(shù)據(jù),同時(shí)也不可避免地造成了信息過載問題,增加了學(xué)習(xí)者進(jìn)行資源篩選的時(shí)間成本,使學(xué)習(xí)者難以獲取滿足個(gè)性化需求的匹配學(xué)習(xí)資源。統(tǒng)計(jì)數(shù)據(jù)顯示,截至2020年底,我國上線慕課數(shù)量已超過3.4萬門,而完課率卻低于5%。
“信息過載”問題對(duì)K12用戶群體的影響尤為嚴(yán)重,中小學(xué)生尤其是高年級(jí)學(xué)生課程多、日程滿,絕大部分時(shí)間被線下教育占據(jù),且中小學(xué)生對(duì)資源鑒別和自我認(rèn)知能力相對(duì)較低。對(duì)海量在線資源進(jìn)行篩選和對(duì)不匹配資源進(jìn)行試錯(cuò)所耗費(fèi)的時(shí)間與精力對(duì)K12在線教育目標(biāo)用戶群體而言是巨大的問題。
因此,在數(shù)據(jù)驅(qū)動(dòng)的背景下,利用云平臺(tái)、人工智能等前沿技術(shù),構(gòu)建針對(duì)中小學(xué)生在線學(xué)習(xí)需求的資源推薦系統(tǒng)是當(dāng)前的重要發(fā)展方向。根據(jù)學(xué)習(xí)者的知識(shí)背景、個(gè)性特征和學(xué)習(xí)環(huán)境,向?qū)W習(xí)者提供個(gè)性化的學(xué)習(xí)資源推薦服務(wù),幫助其進(jìn)行高效的過濾和匹配,進(jìn)而引導(dǎo)其學(xué)習(xí);以此為為提升中小學(xué)生自主學(xué)習(xí)意識(shí)和能力提供優(yōu)質(zhì)平臺(tái),全面提升用戶在線學(xué)習(xí)的效率和體驗(yàn)。
學(xué)習(xí)資源推薦過程可以概括為三個(gè)主要環(huán)節(jié):數(shù)據(jù)收集、特征挖掘及推薦結(jié)果生成。在線學(xué)習(xí)資源推薦系統(tǒng)首先從學(xué)習(xí)平臺(tái)中收集資源信息、學(xué)習(xí)者信息、學(xué)習(xí)者和資源間的交互日志(主要包括學(xué)習(xí)者的瀏覽、學(xué)習(xí)、答題行為)等多源數(shù)據(jù),然后充分挖掘資源和學(xué)習(xí)者的特征,最后根據(jù)學(xué)習(xí)者和資源的匹配程度自適應(yīng)地提供個(gè)性化推薦服務(wù)。
相較于發(fā)展相對(duì)成熟的電商推薦系統(tǒng)而言 ,學(xué)習(xí)資源推薦系統(tǒng)具有與其相似的模式和性質(zhì),故可以將學(xué)習(xí)資源推薦平臺(tái)中的學(xué)習(xí)資源類比電商推薦系統(tǒng)中的物品,學(xué)習(xí)者類比為用戶。因此,現(xiàn)有的在線學(xué)習(xí)推薦系統(tǒng)很多借鑒了電商平臺(tái)中的商品推薦的主流思想和方法,遷移使用其中的主流推薦模型。
目前,學(xué)習(xí)資源推薦系統(tǒng)使用最為廣泛的方法主要分為基于內(nèi)容[1][2]和基于協(xié)同過濾[3][4]的推薦。簡單來說,基于內(nèi)容的推薦依據(jù)學(xué)習(xí)資源本身的屬性計(jì)算資源間的相似度,然后根據(jù)學(xué)習(xí)者的學(xué)習(xí)歷史,推薦和學(xué)習(xí)者曾經(jīng)學(xué)習(xí)過的資源相似度最高的新資源;而基于協(xié)同過濾的推薦算法則利用統(tǒng)計(jì)數(shù)據(jù)和集體智慧,采取了“物以類聚,人以群分”的思想,大部分具有相似年齡層次、知識(shí)水平和興趣愛好的學(xué)習(xí)者所需求的學(xué)習(xí)資源也是相似的,資源推薦系統(tǒng)可以從大量學(xué)習(xí)者及資源交互數(shù)據(jù)中學(xué)習(xí)某種隱性模式。
近年來,許多技術(shù)人員嘗試對(duì)基于內(nèi)容或協(xié)同過濾的模型進(jìn)行改進(jìn)[5],或融合先進(jìn)技術(shù)提升課程推薦性能[6]。但這些方法仍存在一定的局限性,難以充分挖掘資源推薦場(chǎng)景下的某些重要固有特征或難以滿足更精細(xì)化的推薦需求。因此,我們有必要深度剖析在線學(xué)習(xí)資源推薦場(chǎng)景的特點(diǎn),進(jìn)而提出針對(duì)性的解決方案。
為充分挖掘在線學(xué)習(xí)資源推薦場(chǎng)景的獨(dú)有特征并滿足該場(chǎng)景下的一些精細(xì)化需求,我們針對(duì)在線學(xué)習(xí)資源推薦系統(tǒng)涉及的兩大主體,即學(xué)習(xí)資源和學(xué)習(xí)者,展開進(jìn)一步深入分析,總結(jié)出各自重要特點(diǎn)。
對(duì)學(xué)習(xí)資源而言,學(xué)習(xí)資源不是相互獨(dú)立的,不同學(xué)習(xí)資源之間可能存在復(fù)雜、隱性的依賴關(guān)系。以數(shù)學(xué)課程資源“基本初等函數(shù)”為例,其中包含多個(gè)視頻資源“指數(shù)函數(shù)” “對(duì)數(shù)函數(shù)”“冪函數(shù)”等,視頻資源間存在學(xué)習(xí)先后順序要求,但資源間的這種先后關(guān)系通常較為隱性,難以直接獲取。通過進(jìn)一步分析發(fā)現(xiàn),視頻資源中包含有更細(xì)粒度的概念,如“指數(shù)冪”“對(duì)數(shù)運(yùn)算”“換底公式”等,這些底層概念之間同樣存在固有的先決條件依賴,而底層概念間的這些先后關(guān)系也應(yīng)該被考慮和充分利用。
對(duì)學(xué)習(xí)者而言,雖然類似的學(xué)習(xí)群體可能有大體一致的學(xué)習(xí)需求,但對(duì)于每一個(gè)學(xué)習(xí)者個(gè)體而言,其學(xué)習(xí)目的和知識(shí)背景各不相同,且短期學(xué)習(xí)興趣可能發(fā)生動(dòng)態(tài)變化。而這種短期行為所體現(xiàn)的學(xué)習(xí)興趣可能對(duì)于下一個(gè)學(xué)習(xí)資源的選擇更為重要。具體來說,學(xué)習(xí)者在平臺(tái)上的學(xué)習(xí)行為呈現(xiàn)為按時(shí)間發(fā)展的順序模式,我們將用戶在較短的連續(xù)時(shí)間內(nèi)交互行為序列稱為一個(gè)會(huì)話。序列行為體現(xiàn)出三類特征:①學(xué)習(xí)者潛在學(xué)習(xí)偏好,即用戶在一個(gè)會(huì)話內(nèi)學(xué)習(xí)過的多個(gè)相似資源體現(xiàn)了其當(dāng)前的潛在學(xué)習(xí)目的;②時(shí)序依賴特征,即學(xué)習(xí)者學(xué)習(xí)過的部分資源間存在嚴(yán)格的時(shí)間先后順序,反映了某種隱性的依賴關(guān)系;③重復(fù)交互模式,即同一會(huì)話中學(xué)習(xí)者重復(fù)瀏覽或?qū)W習(xí)的資源體現(xiàn)出其較明確的意圖和強(qiáng)興趣。
因此,充分理解和利用序列行為中的此類特征,有助于理解學(xué)習(xí)者短期的興趣變化,從而實(shí)現(xiàn)對(duì)其上下文進(jìn)行更為精確建模表示,進(jìn)而實(shí)現(xiàn)更為精準(zhǔn)的學(xué)習(xí)資源推薦。
通過對(duì)在線學(xué)習(xí)資源推薦系統(tǒng)兩大主體的分析,我們發(fā)現(xiàn)將現(xiàn)有的基于內(nèi)容和協(xié)同過濾的推薦方法應(yīng)用于在線學(xué)習(xí)資源推薦中會(huì)面臨兩大挑戰(zhàn)。
第一,現(xiàn)有推薦方法忽略了學(xué)習(xí)資源之間的依賴關(guān)系。如前所述,學(xué)習(xí)資源間存在某些固有關(guān)系,而非完全獨(dú)立?,F(xiàn)實(shí)情況下,尤其是對(duì)于知識(shí)點(diǎn)體系較為龐大的基礎(chǔ)課程而言,許多資源之間存在先決條件依賴關(guān)系,即學(xué)生需要按照某種順序?qū)W習(xí)這些資源。這種依賴關(guān)系對(duì)于學(xué)習(xí)、組織、應(yīng)用和生成知識(shí)至關(guān)重要。
第二,現(xiàn)有推薦模型對(duì)學(xué)習(xí)者的個(gè)性化、動(dòng)態(tài)學(xué)習(xí)偏好建模困難。在線學(xué)習(xí)平臺(tái)面向的學(xué)習(xí)者通常具有較為明確的學(xué)習(xí)目的,對(duì)推薦內(nèi)容有較高的針對(duì)性和準(zhǔn)確性要求;同時(shí)每個(gè)學(xué)習(xí)者的知識(shí)背景、學(xué)習(xí)能力和學(xué)習(xí)目的各不相同,且K12階段教育涉及多方群體,各方評(píng)價(jià)標(biāo)準(zhǔn)各異,尤其是學(xué)生和家長對(duì)核心資源的質(zhì)量和匹配度要求較高?;趦?nèi)容和基于協(xié)同過濾的推薦模型建模是學(xué)習(xí)者長期的、靜態(tài)的偏好,忽略了其短期序列行為中的特征,難以捕捉用戶興趣的漂移和變化。
針對(duì)在線學(xué)習(xí)資源推薦系統(tǒng)面臨的上述挑戰(zhàn),本文融合“依賴關(guān)系”和“序列表示”,構(gòu)建一種新的學(xué)習(xí)資源推薦框架,充分考慮資源間的依賴關(guān)系和學(xué)習(xí)者的動(dòng)態(tài)偏好,以提升推薦性能。該框架主要由“資源依賴關(guān)系學(xué)習(xí)與挖掘模塊”“基于圖神經(jīng)網(wǎng)絡(luò)的序列表示模塊”“依賴關(guān)系與序列表示的融合”三部分構(gòu)成。
資源依賴關(guān)系學(xué)習(xí)與挖掘模塊是為了充分挖掘和利用資源間的關(guān)聯(lián)與依賴關(guān)系,以提升推薦效果和可解釋性,同時(shí)引導(dǎo)合理的學(xué)習(xí)路徑。
對(duì)于在線學(xué)習(xí)平臺(tái)而言,學(xué)習(xí)資源眾多,資源之間以及資源所蘊(yùn)含的概念之間的關(guān)系非常龐雜,不可能依據(jù)人工的方式來建立所有的此類關(guān)系,而且學(xué)習(xí)資源間的有些依賴關(guān)系也是難以直接獲取的。為此,我們考慮將學(xué)習(xí)資源映射到更細(xì)的概念維度,并通過學(xué)習(xí)概念圖進(jìn)一步推斷資源間的依賴關(guān)系。
以課程資源依賴為例,給定所有的課程,課程間的真實(shí)關(guān)系標(biāo)簽體現(xiàn)了兩個(gè)課程之間是否存在先后關(guān)系。理論上,存在先后關(guān)系用1表示,不存在先后關(guān)系用0表示。對(duì)于所有課程或?qū)W習(xí)資源間存在的海量復(fù)雜依賴關(guān)系,我們采用數(shù)據(jù)挖掘和模型訓(xùn)練的方式,將課程映射到通用概念空間,并利用表示學(xué)習(xí)的技術(shù)方法得到每門課程的概念表示向量,進(jìn)一步學(xué)習(xí)兩個(gè)概念對(duì)之間關(guān)系的有向權(quán)重,通過訓(xùn)練好的模型自動(dòng)推斷所有課程間的依賴關(guān)系。
基于圖神經(jīng)網(wǎng)絡(luò)的序列表示是為了充分挖掘?qū)W習(xí)者的知識(shí)背景,挖掘用戶行為序列中的動(dòng)態(tài)特征。
鑒于學(xué)習(xí)者偏好動(dòng)態(tài)變化的特點(diǎn),我們考慮采用圖神經(jīng)網(wǎng)絡(luò)對(duì)序列數(shù)據(jù)進(jìn)行建模,通過從學(xué)習(xí)者與學(xué)習(xí)資源交互(瀏覽、學(xué)習(xí)行為)序列中了解學(xué)習(xí)用戶當(dāng)前的學(xué)習(xí)興趣,并理解和建模學(xué)習(xí)者的興趣偏好隨時(shí)間的演變,從而用表示向量來刻畫學(xué)習(xí)者更精確、更動(dòng)態(tài)意圖,提供定制、及時(shí)的序列化資源推薦。
第一,根據(jù)學(xué)習(xí)者歷史學(xué)習(xí)行為數(shù)據(jù),分別基于單個(gè)序列和全部序列構(gòu)建會(huì)話圖和全局圖。第二,采用門控圖神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)圖中各個(gè)節(jié)點(diǎn)的向量表示。第三,基于各節(jié)點(diǎn)重要程度動(dòng)態(tài)融合節(jié)點(diǎn)表示當(dāng)前學(xué)習(xí)者的最終偏好。第四,通過計(jì)算學(xué)習(xí)者向量和資源向量間的相似性評(píng)分,向?qū)W習(xí)者推薦評(píng)分最高的前若干個(gè)學(xué)習(xí)資源。
本文進(jìn)一步融合上述資源依賴關(guān)系學(xué)習(xí)與挖掘模塊和基于圖神經(jīng)網(wǎng)絡(luò)的序列表示模塊,將學(xué)習(xí)到的依賴關(guān)系矩陣融合到序列推薦模型中,以提升推薦性能。
該框架考慮兩部分的融合,如圖1所示。
圖1 融合神經(jīng)網(wǎng)絡(luò)與依賴關(guān)系的推薦框架
一方面,模型將資源依賴矩陣融合到編碼器部分,在學(xué)習(xí)圖節(jié)點(diǎn)表示時(shí)充分考慮資源本身與其他資源之間的依賴關(guān)系;另一方面,模型將資源依賴矩陣嵌入到注意力網(wǎng)絡(luò)中,在為每個(gè)項(xiàng)目計(jì)算評(píng)分并生成推薦列表時(shí),將資源間的先決條件關(guān)系納入考慮。
綜上,以融合依賴關(guān)系和序列表示為思路構(gòu)建的學(xué)習(xí)資源推薦框架較好地解決了在線學(xué)習(xí)資源推薦面臨的挑戰(zhàn)。針對(duì)資源固有關(guān)系考慮不充分的問題,通過利用資源和概念間的映射關(guān)系進(jìn)行先決條件學(xué)習(xí),捕捉資源間依賴。針對(duì)學(xué)習(xí)者個(gè)性化學(xué)習(xí)目的及興趣表示不準(zhǔn)確的問題,從學(xué)習(xí)行為序列中挖掘?qū)W習(xí)者的潛在行為模式,并通過圖神經(jīng)網(wǎng)絡(luò)建模會(huì)話間復(fù)雜轉(zhuǎn)換來獲取學(xué)習(xí)者的動(dòng)態(tài)偏好變化,最終融合兩個(gè)模塊提供自適應(yīng)資源推薦。
該框架可以推廣于在線學(xué)習(xí)的各類學(xué)習(xí)資源,包括課程、視頻、知識(shí)點(diǎn)、習(xí)題等。以習(xí)題推薦為例,該框架首先通過資源依賴關(guān)系學(xué)習(xí)與挖掘模塊充分利用習(xí)題和知識(shí)間的映射關(guān)系,彌補(bǔ)傳統(tǒng)推薦模型對(duì)資源間固有關(guān)系的忽視,發(fā)現(xiàn)習(xí)題間潛在結(jié)構(gòu)或概念先后關(guān)系,保證推薦的習(xí)題具有典型代表性,且循序漸進(jìn),滿足先決條件順序要求。通過序列表示模型還可以根據(jù)學(xué)生歷史答題序列捕捉用戶動(dòng)態(tài)的知識(shí)狀態(tài)和學(xué)習(xí)能力變化,以生成更契合中小學(xué)生個(gè)體能力水平的精準(zhǔn)推薦。
為了解決典型推薦方法應(yīng)用于在線學(xué)習(xí)資源推薦面臨的兩大挑戰(zhàn),本文針對(duì)在線學(xué)習(xí)資源推薦的兩大主體,即資源和學(xué)習(xí)者的特點(diǎn),提出了一種融合依賴關(guān)系與序列表示的在線學(xué)習(xí)資源推薦框架。通過資源依賴關(guān)系的學(xué)習(xí)與挖掘模塊和基于圖神經(jīng)網(wǎng)絡(luò)的序列表示模塊,分別解決了對(duì)資源和對(duì)學(xué)習(xí)者的特征學(xué)習(xí)不充分的問題,最后融合兩部分進(jìn)行自適應(yīng)推薦,有效提升在線學(xué)習(xí)資源推薦的準(zhǔn)確性。