宋銀李, 孫瑜
(云南師范大學(xué) 信息學(xué)院,云南 昆明 650500)
推薦算法在數(shù)字化學(xué)習(xí)資源中的應(yīng)用在一定程度上能夠較為高效地推送學(xué)習(xí)資源.國(guó)外在20世紀(jì)90年代興起推薦算法研究,而國(guó)內(nèi)研究者從2000年才開始關(guān)注信息推薦技術(shù),最早在2002年將推薦算法引入網(wǎng)絡(luò)遠(yuǎn)程教育領(lǐng)域[1].研究者基于數(shù)字化學(xué)習(xí)資源推薦算法研究現(xiàn)狀、應(yīng)用趨勢(shì)、利弊及推薦服務(wù)中的推薦效果等視角,對(duì)其進(jìn)行文獻(xiàn)梳理[1-3],然而在推薦算法的研究進(jìn)程、熱點(diǎn)發(fā)展趨勢(shì)及算法研究?jī)?nèi)容等方面的系統(tǒng)性研究并不多.因此,本文采用CiteSpace及VOSviewer可視化軟件,基于關(guān)鍵詞共現(xiàn)分析及關(guān)鍵詞突現(xiàn)分析方法,以CNKI核心數(shù)據(jù)集為文獻(xiàn)數(shù)據(jù)來源,從多個(gè)維度透視數(shù)字化學(xué)習(xí)資源中推薦算法的最新研究進(jìn)程和熱點(diǎn),剖析其研究動(dòng)向與發(fā)展趨勢(shì),綜合得出未來國(guó)內(nèi)數(shù)字化學(xué)習(xí)資源推薦算法研究的相關(guān)啟示.
以CNKI數(shù)據(jù)庫(kù)核心合集(北大核心、CSSCI和CSCD)為數(shù)據(jù)來源,選取“數(shù)字化學(xué)習(xí)資源” “網(wǎng)絡(luò)學(xué)習(xí)資源”“在線學(xué)習(xí)資源”“學(xué)習(xí)資源”“推薦算法”“推薦技術(shù)”和“推薦方法”為檢索主題詞,檢索時(shí)間為2007-2021年,共檢索到1 012篇相關(guān)文獻(xiàn);對(duì)檢索結(jié)果進(jìn)行除重并刪除會(huì)議、個(gè)人學(xué)術(shù)成果介紹、書評(píng)及與數(shù)字化學(xué)習(xí)資源無關(guān)的文獻(xiàn),最終得到論文594篇.文獻(xiàn)發(fā)表情況如圖1所示.
圖1 2007-2021研究論文刊載情況
VOSviewer與CiteSpace是對(duì)研究主題進(jìn)行文獻(xiàn)計(jì)量統(tǒng)計(jì)分析的重要工具,VOSviewer在關(guān)鍵詞共現(xiàn)聚類技術(shù)方面有較為明顯的優(yōu)勢(shì)[4].CiteSpace能夠顯示當(dāng)前某一研究主題的研究熱點(diǎn)及過去產(chǎn)生的熱點(diǎn),從而分析未來該領(lǐng)域的發(fā)展趨勢(shì),對(duì)演化進(jìn)程及發(fā)展趨勢(shì)有較好的預(yù)判優(yōu)勢(shì)[5].由此,本文通過VOSviewer關(guān)鍵詞的共現(xiàn)聚類圖分析數(shù)字化學(xué)習(xí)資源推薦算法的研究熱點(diǎn),通過CiteSpace突現(xiàn)關(guān)鍵詞來研究數(shù)字化學(xué)習(xí)資源中推薦算法的發(fā)展趨勢(shì).
基于VOSviewer關(guān)鍵詞共現(xiàn)聚類對(duì)研究熱點(diǎn)進(jìn)行分析,將594篇文獻(xiàn)導(dǎo)入VOSviewer中共出現(xiàn)1 225個(gè)關(guān)鍵詞,關(guān)鍵詞合并處理后使用Network Visualization(網(wǎng)絡(luò)可視化)模塊來進(jìn)行關(guān)鍵詞的共現(xiàn)分析,得到關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖,并通過共現(xiàn)網(wǎng)絡(luò)圖分析得到高頻關(guān)鍵詞的聚類.
圖2是近15年國(guó)內(nèi)數(shù)字化學(xué)習(xí)資源推薦算法關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖.圖中節(jié)點(diǎn)越大代表關(guān)鍵詞頻次越高,節(jié)點(diǎn)間連線越粗則表示關(guān)鍵詞間聯(lián)系越緊密.
如圖2所示,經(jīng)過VOSviewer的關(guān)鍵詞共現(xiàn)處理,將關(guān)鍵詞整合為協(xié)同過濾、推薦算法、推薦模型、推薦系統(tǒng)及個(gè)性化推薦等5個(gè)聚類簇.為了便于理解與分析,特將各聚類簇的關(guān)鍵詞進(jìn)行合并整理成表1.根據(jù)圖2與表1中相關(guān)熱點(diǎn)分析,可看出國(guó)內(nèi)數(shù)字化學(xué)習(xí)資源推薦算法研究主要集中于模型構(gòu)建、算法實(shí)現(xiàn)及算法應(yīng)用等方面.
圖2 基于VOSviewer關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖
表1 數(shù)字化學(xué)習(xí)資源推薦算法熱點(diǎn)詞匯列表
通過對(duì)數(shù)字化學(xué)習(xí)資源推薦算法熱點(diǎn)詞匯的分析,歸納出以下研究熱點(diǎn):
(1)推薦算法中協(xié)同過濾技術(shù)的應(yīng)用
通過關(guān)鍵詞匯總分析可以看出,在協(xié)同過濾技術(shù)的成熟應(yīng)用、用戶相似度計(jì)算精準(zhǔn)度的提升和基于深度學(xué)習(xí)的協(xié)同過濾技術(shù)不斷發(fā)展的條件下,基于主題模型、混合推薦、基于知識(shí)圖譜協(xié)同過濾等研究均得到學(xué)者的廣泛關(guān)注[6-10].
(2)學(xué)習(xí)資源推薦算法的優(yōu)化和改進(jìn)
學(xué)習(xí)資源推薦算法的改進(jìn)與優(yōu)化具體指推薦精準(zhǔn)度的提升及算法與技術(shù)的融合優(yōu)化等方面的研究.該聚類關(guān)鍵節(jié)點(diǎn)普遍較大,說明研究熱點(diǎn)關(guān)注度較高.根據(jù)表1可知,當(dāng)前VIKOR及tf-idf等新興算法開始應(yīng)用于學(xué)習(xí)資源推薦算法中.從推薦效率提升方面來看,矩陣分解、評(píng)分預(yù)測(cè)、信任度和張量分解等是研究熱點(diǎn)[11-13].在算法不斷發(fā)展,技術(shù)不斷加強(qiáng)的條件下,基于標(biāo)簽推薦、社會(huì)網(wǎng)絡(luò)、聚類、神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、知識(shí)圖譜、混合推薦等技術(shù)與算法的多維度融合使用是學(xué)者關(guān)注的熱點(diǎn)[14-16].
(3)推薦模型中推薦算法的策略設(shè)計(jì)
推薦模型中推薦算法的策略設(shè)計(jì)主要是指推薦算法在推薦模型中是如何進(jìn)行推薦策略的設(shè)計(jì),如何根據(jù)推薦機(jī)制來選取算法從而構(gòu)建出符合需求的推薦模型.從表中可以看出推薦模型的構(gòu)建圍繞用戶屬性和用戶偏好挖掘、學(xué)習(xí)者特征分析、智能推薦及多元模型構(gòu)建等方面為研究者完善推薦模型的構(gòu)建與推薦策略的設(shè)計(jì)提供了參考依據(jù)[17-21].
(4)推薦系統(tǒng)中推薦算法的效果評(píng)價(jià)
推薦系統(tǒng)中推薦算法的效果評(píng)價(jià)是指推薦算法在推薦系統(tǒng)中是怎樣實(shí)現(xiàn)的,又是如何應(yīng)用及推薦效果如何進(jìn)行評(píng)價(jià)等方面的研究.當(dāng)前,推薦系統(tǒng)中基于用戶學(xué)習(xí)行為、學(xué)習(xí)者特征的數(shù)據(jù)挖掘、基于深度學(xué)習(xí)的推薦效果評(píng)價(jià)、推薦模型的改進(jìn)、推薦算法的優(yōu)化應(yīng)用與測(cè)評(píng)等方面是學(xué)者研究的熱點(diǎn)[22-25].
(5)個(gè)性化推薦中推薦算法的嵌入使用
個(gè)性化推薦中推薦算法的嵌入使用是指推薦算法在個(gè)性化推薦中如何嵌入使用、使用時(shí)融合了什么方法與技術(shù)以及針對(duì)不同的推薦對(duì)象如何使用等方面的研究.根據(jù)關(guān)鍵詞可得,目前基于關(guān)聯(lián)規(guī)則、情境感知、用戶畫像、相似性度量、社會(huì)化標(biāo)簽與標(biāo)注等技術(shù)與方法的嵌入使用能夠提升個(gè)性化推薦算法適用性.針對(duì)不同對(duì)象的推薦即基于學(xué)習(xí)資源推薦、知識(shí)推薦和好友推薦等方面的混合推薦是學(xué)者個(gè)性化推薦算法研究關(guān)注的熱點(diǎn)[16-30].
對(duì)所搜集的594篇文獻(xiàn)通過CiteSpaces關(guān)鍵詞突現(xiàn)圖譜分析出每個(gè)時(shí)期突現(xiàn)的關(guān)鍵詞并對(duì)其進(jìn)行匯總,根據(jù)突現(xiàn)關(guān)鍵詞的匯總結(jié)果,歸納出推薦算法的研究趨勢(shì).
突現(xiàn)關(guān)鍵詞主要是表示該課題在相當(dāng)長(zhǎng)的時(shí)期內(nèi)因其所涉及的研究課題而受到較高關(guān)注,反映其在該階段具有很強(qiáng)的發(fā)展?jié)摿εc科學(xué)研究?jī)r(jià)值;通過探索數(shù)字化學(xué)習(xí)資源推薦算法關(guān)鍵詞的突現(xiàn)分析,在一定程度上,可以揭示該研究領(lǐng)域主題的發(fā)展趨勢(shì),同時(shí)挖掘出潛在的、有價(jià)值的研究方向[31].本文對(duì)關(guān)鍵詞進(jìn)行分析,得到突現(xiàn)關(guān)鍵詞圖3和表2,圖3展示了排名前24位的突現(xiàn)詞,其通過時(shí)間順序來進(jìn)行排列,表2則劃分出不同的時(shí)期突現(xiàn)的關(guān)鍵詞.
圖3 數(shù)字化學(xué)習(xí)資源中推薦算法關(guān)鍵詞突出視圖
表2 數(shù)字化學(xué)習(xí)資源中推薦算法關(guān)鍵詞突現(xiàn)統(tǒng)計(jì)表
從表2中可以看出:
(1)2007-2009年的萌芽初創(chuàng)期,該階段的推薦算法在數(shù)字化學(xué)習(xí)資源中還處于初探階段,其研究主要關(guān)注學(xué)習(xí)過程中,用戶屬性、評(píng)論文本、卷積神經(jīng)網(wǎng)絡(luò)及tf-idf算法等在數(shù)字化學(xué)習(xí)資源中的初次使用情況,該階段主要是針對(duì)一些算法的使用狀態(tài)與適用性進(jìn)行探究.
(2)2010-2012年的探索規(guī)劃期,推薦算法開始集中于學(xué)習(xí)資源、個(gè)性化推薦、相似性等方面的探究.可以看出該階段推薦算法針對(duì)學(xué)習(xí)資源這一研究對(duì)象,將推薦算法與教學(xué)理論、知識(shí)點(diǎn)進(jìn)行相似度的關(guān)聯(lián),提升算法在學(xué)習(xí)資源推薦中的適用性,從而促進(jìn)數(shù)字化學(xué)習(xí)資源的個(gè)性化推薦.
(3)2013-2015年的應(yīng)用發(fā)展期,數(shù)字化學(xué)習(xí)資源推薦算法開始關(guān)注于標(biāo)簽、本體、社會(huì)化標(biāo)簽、社會(huì)網(wǎng)絡(luò)、個(gè)性化、服務(wù)推薦等幾方面的應(yīng)用,其中標(biāo)簽的突現(xiàn)強(qiáng)度最強(qiáng),可以看出在該階段,標(biāo)簽作為一種有效的信息表征方式,其在用戶偏好、資源特征表示方面均有一定的準(zhǔn)確性,社會(huì)化標(biāo)簽、社會(huì)網(wǎng)絡(luò)則進(jìn)一步完善標(biāo)簽描述的準(zhǔn)確性,讓大眾均參與其中,完善用戶學(xué)習(xí)行為及學(xué)習(xí)資源特征數(shù)據(jù),基于標(biāo)簽、社會(huì)化標(biāo)簽、社會(huì)網(wǎng)絡(luò)方法改善單一推薦,算法優(yōu)化應(yīng)用及提升學(xué)習(xí)服務(wù)推薦等方面是該階段研究的熱點(diǎn).
(4)2016-2018年的深入拓展期,學(xué)習(xí)資源推薦算法聚焦于貝葉斯網(wǎng)絡(luò)、好友推薦、興趣點(diǎn)推薦及排序?qū)W習(xí)等視角,在傳統(tǒng)推薦算法的基礎(chǔ)上分支出不同類型的推薦算法,基于傳統(tǒng)貝葉斯網(wǎng)絡(luò)改進(jìn)推薦算法預(yù)測(cè)精度,優(yōu)化推薦效率,基于興趣點(diǎn)和用戶特征混合推薦,優(yōu)化推薦算法的單一性,基于好友推薦和排序?qū)W習(xí)特定的推薦以改善推薦算法的數(shù)據(jù)稀疏及推薦準(zhǔn)確性等是研究的一大關(guān)注點(diǎn).
(5)2019-2021年的融合創(chuàng)新期,學(xué)習(xí)資源推薦算法呈現(xiàn)出豐富多元的局面,開始融合一些新的算法與技術(shù).其更多關(guān)注數(shù)據(jù)稀疏、混合推薦、深度神經(jīng)網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)和用戶畫像等方面的研究.從突現(xiàn)強(qiáng)度可以看出算法存在數(shù)據(jù)稀疏性、冷啟動(dòng)、算法固化及算法維度單一等多方面問題,不斷改進(jìn)與優(yōu)化算法是當(dāng)前較為關(guān)注的內(nèi)容,與其他算法與新技術(shù)的融合并提升算法的推薦效果與精準(zhǔn)度也是研究關(guān)注的方面.
綜上所述,從突現(xiàn)關(guān)鍵詞的演變,可以看出數(shù)字化學(xué)習(xí)資源推薦算法中推薦對(duì)象、教育理論的融合、推薦的技術(shù)提升、推薦的維度及推薦情景感知是未來研究關(guān)注的重點(diǎn)領(lǐng)域.
通過對(duì)國(guó)內(nèi)核心期刊近15年刊載的594篇數(shù)字化學(xué)習(xí)資源推薦算法研究文獻(xiàn)進(jìn)行了系統(tǒng)性的梳理,較為全面地展示了該研究領(lǐng)域的發(fā)展概貌.基于數(shù)字化學(xué)習(xí)資源推薦算法研究熱點(diǎn)與演化趨勢(shì),結(jié)合當(dāng)前數(shù)字化學(xué)習(xí)資源推薦算法的研究現(xiàn)狀,對(duì)未來數(shù)字化學(xué)習(xí)資源推薦算法研究發(fā)展做如下思考.
在線學(xué)習(xí)快速發(fā)展的背景下,面對(duì)海量的數(shù)字化學(xué)習(xí)資源,如何從網(wǎng)上獲取優(yōu)質(zhì)學(xué)習(xí)資源顯得尤為重要.在初探階段,數(shù)字化學(xué)習(xí)資源推薦算法更多關(guān)注算法的實(shí)現(xiàn)與應(yīng)用,大多采用了電子商務(wù)、新聞推薦等領(lǐng)域應(yīng)用較為成熟的推薦算法與技術(shù),不過在使用過程中出現(xiàn)推薦準(zhǔn)確度低及適用性差,推薦資源不滿足學(xué)習(xí)者需求等問題.這主要是因?yàn)榻逃I(lǐng)域與其他領(lǐng)域的差異性,從教育的視角來優(yōu)化與改進(jìn)算法,融入教育原理能為學(xué)習(xí)者提供個(gè)性化的學(xué)習(xí)資源推薦服務(wù),進(jìn)而更好地促進(jìn)個(gè)性化學(xué)習(xí)的發(fā)展.
當(dāng)下,教育領(lǐng)域?qū)W習(xí)資源推薦常用基于內(nèi)容、協(xié)同過濾及基于知識(shí)等三種推薦方法.不過在不同的推薦情形下,仍然會(huì)出現(xiàn)數(shù)據(jù)稀疏、冷啟動(dòng)、推薦內(nèi)容單一等問題[32].從不同維度對(duì)學(xué)習(xí)資源推薦算法進(jìn)行混合使用就顯得尤為重要[33-34].學(xué)習(xí)資源、學(xué)習(xí)伙伴和學(xué)習(xí)路徑的推薦分別從推薦算法、學(xué)習(xí)情景及推薦內(nèi)容等多個(gè)維度進(jìn)行融合,有助于學(xué)習(xí)資源多渠道推送.因此從算法推薦策略、推薦內(nèi)容及學(xué)習(xí)真實(shí)情景等多個(gè)維度進(jìn)行結(jié)合,更好地提高多元化學(xué)習(xí)服務(wù)的水平是未來研究的一大要點(diǎn).
以往的在線學(xué)習(xí)中數(shù)字化學(xué)習(xí)資源推送主要有Top-N推薦、關(guān)鍵字查詢及最新資源推薦等三種方式.其方式推薦效果不明顯,在后期的發(fā)展中融合個(gè)性化推薦技術(shù),并細(xì)分為基于關(guān)聯(lián)規(guī)則的推薦、內(nèi)容過濾推薦及協(xié)同過濾推薦等三種技術(shù)[35].三者結(jié)合使用,能根據(jù)用戶的個(gè)性化特征,如學(xué)習(xí)興趣、偏好及學(xué)習(xí)需求等主動(dòng)地向用戶推薦適合其學(xué)習(xí)需求的資源與信息.目前,越來越多的技術(shù)開始在學(xué)習(xí)資源推薦中融合使用,在一定程度上能夠提升推薦算法的精確度[36-40].如何根據(jù)學(xué)習(xí)者個(gè)性化特征、知識(shí)構(gòu)建程度、學(xué)習(xí)需求及技術(shù)的科學(xué)合理性來進(jìn)行融合,融入一些科學(xué)、適用及創(chuàng)新的技術(shù)以提升推薦效率,以便更好地推動(dòng)數(shù)字化學(xué)習(xí)資源推送服務(wù)的發(fā)展,仍是未來需要解決的問題.
推薦算法、推薦模型及推薦系統(tǒng)三者存在密不可分的關(guān)系.推薦模型能夠驗(yàn)證推薦算法的推薦效果;而推薦系統(tǒng)能夠?qū)崿F(xiàn)與檢測(cè)推薦模型的合理性及推薦算法的準(zhǔn)確性;推薦算法直接或間接受到推薦模型及推薦系統(tǒng)的影響,當(dāng)前的數(shù)字化學(xué)習(xí)資源推薦中反映出學(xué)習(xí)資源推薦模型缺少對(duì)學(xué)習(xí)資源及信息內(nèi)容本體結(jié)構(gòu)的關(guān)注[41],算法推薦效果不明顯、推薦精準(zhǔn)度低及推薦內(nèi)容單一化;推薦系統(tǒng)中數(shù)據(jù)稀疏及冷啟動(dòng),推薦策略固化,未能很好地滿足學(xué)習(xí)者按需推送的訴求.因此,應(yīng)加強(qiáng)算法、模型和系統(tǒng)間動(dòng)態(tài)改進(jìn)與應(yīng)用的關(guān)系,促進(jìn)推薦策略適用性,提升推薦系統(tǒng)的推薦效率與精準(zhǔn)度,從而進(jìn)一步推動(dòng)數(shù)字化學(xué)習(xí)資源的建設(shè)與發(fā)展.