林愿
摘要 在大數(shù)據(jù)背景下,海量的網(wǎng)絡(luò)資源的出現(xiàn),使得用戶在挑選學(xué)習(xí)資源時無從下手。為了幫助用戶找到自己真正需要的而且是適合自身的學(xué)習(xí)資源,有必要創(chuàng)建有效的學(xué)習(xí)資源在線推送平臺,這是當(dāng)前教育技術(shù)的研究熱點。當(dāng)前,學(xué)習(xí)資源在線推送算法主要有基于內(nèi)容的推送方法和基于協(xié)同過濾的推送方法,這兩種方法都存在不足之處。本文在綜合了協(xié)同過濾推送算法和基于內(nèi)容的推送算法的基礎(chǔ)上,結(jié)合學(xué)習(xí)過程中學(xué)習(xí)者的動態(tài)行為數(shù)據(jù),提出一種混合協(xié)同過濾的、能自適應(yīng)更新的智能化推送服務(wù)模型,將其應(yīng)用到在線學(xué)習(xí)資源系統(tǒng)中,以進一步提高學(xué)習(xí)資源推送的預(yù)測精度和覆蓋率,期望能對當(dāng)前的數(shù)字化學(xué)習(xí)資源建設(shè)提供借鑒和參考。
關(guān)鍵詞 大數(shù)據(jù) 學(xué)習(xí)資源 智能化 推送
中圖分類號:G642 文獻標(biāo)識碼:A DOI:10.16400/j.cnki.kjdkz.2018.02.034
0引言
當(dāng)前已進入大數(shù)據(jù)時代,在線學(xué)習(xí)成為趨勢。一方面,網(wǎng)絡(luò)上形形色色的學(xué)習(xí)資源信息量很大、更新速度也很快、共享性也很高。另一方面,網(wǎng)絡(luò)上的這些學(xué)習(xí)資源同時也存在過于分散、沒有組織性、梳理起來困難等問題,使得在線學(xué)習(xí)用戶在選擇網(wǎng)絡(luò)上的學(xué)習(xí)資源時,不知從何下手,迫切需要為用戶創(chuàng)建學(xué)習(xí)資源推薦平臺,以幫助用戶快速有效地找到合適的學(xué)習(xí)資源。因此,資源建設(shè)中學(xué)習(xí)資源的智能化推送服務(wù)成為大數(shù)據(jù)時代實現(xiàn)智能型在線學(xué)習(xí)的關(guān)鍵。
1學(xué)習(xí)資源智能化推送機制研究現(xiàn)狀
隨著全球網(wǎng)絡(luò)化的迅速發(fā)展,以及智能手機的普及,全球網(wǎng)絡(luò)數(shù)據(jù)量出現(xiàn)爆炸式增長,即所謂的“大數(shù)據(jù)”,簡單地說就是“巨量的資料”,“大數(shù)據(jù)”帶來的海量、高增長率和多樣化的信息資產(chǎn),必須要有新的處理模式、處理方法和處理能力才有可能與之適應(yīng)。所謂學(xué)習(xí)資源,通俗的來講,就是各種支持學(xué)習(xí)的資源,可以包括教學(xué)材料、相對應(yīng)的支持系統(tǒng)、相對應(yīng)的學(xué)習(xí)環(huán)境,甚至還包括能幫助個人有效學(xué)習(xí)和操作的任何因素。在人工智能與數(shù)據(jù)庫技術(shù)相結(jié)合的基礎(chǔ)上應(yīng)用人工智能、機器學(xué)習(xí)方法,可以識別和預(yù)測各種用戶的興趣或偏好,做到有針對性地、及時地、主動地推送用戶所需的信息,以滿足針對各種用戶的個性化需求。
目前國內(nèi)外較流行的學(xué)習(xí)資源推送服務(wù)模型主要有兩種:基于內(nèi)容的推送服務(wù)模型和基于協(xié)同過濾的推送服務(wù)模型。
具體來說,基于內(nèi)容的推送服務(wù)模型,以高校課程的推送算法為例,首先是收集用戶所學(xué)的專業(yè)、所從事的職業(yè)甚至是用戶的個人意愿等方面的個人信息,建立起與個人信息相對應(yīng)的特征模型。在完成這一步之后,再提取出所要選擇的課程的關(guān)鍵詞等特征信息,來確定這門課程所對應(yīng)的學(xué)習(xí)目的。最后,系統(tǒng)從用戶的歷史訪問數(shù)據(jù)合并當(dāng)前的操作日志,抽取出特征向量,通過運算建立起初始推送模型,最后將當(dāng)前的訪問序列與初始向量間的相似程度進行閾值比較,當(dāng)兩者相當(dāng)時,說明該用戶匹配到了與其興趣相似的課程,就可以進行相關(guān)在線學(xué)習(xí)課程的推送了。這種推送服務(wù)模型完全依賴于在線學(xué)習(xí)課程的關(guān)鍵詞、課程簡介等,因而存在以下問題:首先因為網(wǎng)絡(luò)課程的特征有限,其模型過度依賴于用戶瀏覽過的在線學(xué)習(xí)課程,所以很難提取到真正有效的特征項,系統(tǒng)很難得到最符合的用戶喜好課程信息,造成推送資源局限。
基于協(xié)同過濾的推送算法則與基于內(nèi)容的推送服務(wù)模型從原理到過程都不同,它主要是應(yīng)用人的興趣不是孤立的這一特點,首先根據(jù)用戶間的共同興趣而不是根據(jù)課程內(nèi)容來推送。根據(jù)用戶對該課程推薦項的評分值而不是課程內(nèi)容提出特征值進行數(shù)據(jù)處理,通過計算當(dāng)前用戶與其它用戶的相似度來預(yù)測并推薦用戶集。這種推送算法存在以下三個方面的問題:由于該算法是依賴于用戶的興趣評估數(shù)據(jù),會在課程評價方面存在稀疏問題;特別是一門新的課程首次在線出現(xiàn)時,還沒有任何用戶的評價,協(xié)同過濾沒有辦法對它進行預(yù)測和評價,因而不可能準(zhǔn)確地推送;如果用戶不了解課程的內(nèi)容,可能被推薦到已學(xué)過的內(nèi)容,影響推送的效果。
本文在綜合了協(xié)同過濾推送算法和基于內(nèi)容的推送算法的基礎(chǔ)上,結(jié)合學(xué)習(xí)過程中學(xué)習(xí)者的動態(tài)行為數(shù)據(jù),提出一種混合協(xié)同過濾的、并且能自適應(yīng)更新的智能化推送服務(wù)模型,將其應(yīng)用到在線學(xué)習(xí)資源系統(tǒng)中,以進一步提高學(xué)習(xí)資源推送的預(yù)測精度和覆蓋率。
2采取的方案
針對大數(shù)據(jù)背景下海量網(wǎng)絡(luò)學(xué)習(xí)資源需要組織、管理,以方便用戶選擇真正適合自己的資源,目前主要有基于內(nèi)容的推送算法和基于協(xié)同過濾的推送算法?;趦?nèi)容的推送算法依據(jù)的是課程關(guān)鍵詞、課程簡介等提取課程特征值,與學(xué)習(xí)主體完全脫離,存在推送不準(zhǔn)確的問題?;趨f(xié)同過濾的推送算法則完全不從內(nèi)容提取特征值,僅僅根據(jù)用戶對課程推薦項的評分值進行處理,也存在一些問題。如果能有機地將兩種推送算法結(jié)合起來,并把學(xué)習(xí)者在學(xué)習(xí)過程中產(chǎn)生的動態(tài)行為數(shù)據(jù)考慮進來,從而構(gòu)成一種能自適應(yīng)更新的混合協(xié)同過濾的智能化推送服務(wù)模型,提高學(xué)習(xí)資源推送服務(wù)的預(yù)測精度和覆蓋率。
本文依據(jù)社會需求,以教育信息化理論為理論依據(jù),對大數(shù)據(jù)環(huán)境下學(xué)習(xí)資源智能化推送服務(wù)機制進行研究和改進,課題研究主要采用文獻研究,實踐研究等方法,從理論研究入手,首先利用數(shù)據(jù)挖掘、語義分析等技術(shù)進行基于內(nèi)容的推送算法的研究;然后根據(jù)用戶對課程推薦項的評分值的高低,提取特征值進行數(shù)據(jù)處理,并計算當(dāng)前用戶與其它用戶的相似度,產(chǎn)生預(yù)測與推薦用戶集,進行基于協(xié)同過濾推送算法的研究。再將兩者與學(xué)習(xí)過程中學(xué)習(xí)者的動態(tài)行為數(shù)據(jù)有機結(jié)合,構(gòu)成一種能自適應(yīng)更新的混合協(xié)同過濾的智能化推送服務(wù)模型,以提高資源推送的預(yù)測精度和覆蓋率。具體方案實施首先采用探索性實驗,之后進行改進實驗;在本校的網(wǎng)絡(luò)教學(xué)平臺上進行新模型的實證研究,首先選擇“集成電路設(shè)計”這門課程試點,摸索經(jīng)驗,修訂模型,再在整個網(wǎng)絡(luò)教學(xué)平臺上推廣運行,并進一步總結(jié)經(jīng)驗完善推送服務(wù)模型,通過多次的師生實踐不斷總結(jié)和分析改正大數(shù)據(jù)環(huán)境下學(xué)習(xí)資源智能化推送服務(wù)模型的不足和缺陷。
(1)組織課題組成員廣泛鉆研國內(nèi)外與本課題有關(guān)的文獻資料,研究其新動向、新成果、新理論,準(zhǔn)備開題論證,修改課題數(shù)據(jù),擬立課題研究實施計劃。
(2)在本校將提出的混合協(xié)同過濾算法應(yīng)用于教學(xué)資料庫、網(wǎng)絡(luò)教學(xué)平臺等,按照課題研究實施計劃,在學(xué)生及任課老師等多個方面進行試驗和探索。
(3)在繼續(xù)前面試驗的同時,及時掌握反饋信息,做好總結(jié)、提高工作。
(4)組織課題組成員會議,進一步修改完善智能化推薦算
80
2018年/第5期/2月r中J法,通過反復(fù)的實踐不斷完善算法。
3研究內(nèi)容
(1)大數(shù)據(jù)環(huán)境下學(xué)習(xí)資源智能化推送服務(wù)的社會需求調(diào)查研究。
(2)大數(shù)據(jù)環(huán)境下基于混合協(xié)同過濾的學(xué)習(xí)資源推送服務(wù)的研究。
(3)隨學(xué)習(xí)者的動態(tài)行為數(shù)據(jù)自適應(yīng)更新的學(xué)習(xí)資源推送服務(wù)的研究。
(4)大數(shù)據(jù)環(huán)境下學(xué)習(xí)資源智能化推送服務(wù)模型構(gòu)建的研究。
(5)在本校網(wǎng)絡(luò)教學(xué)平臺上進行學(xué)習(xí)資源資源智能化推送服務(wù)模型的實證研究,首先選擇“集成電路設(shè)計”這門課程試點,摸索經(jīng)驗,修訂模型,再在整個網(wǎng)絡(luò)教學(xué)網(wǎng)絡(luò)平臺上推廣運行,進一步總結(jié)經(jīng)驗,完善推送服務(wù)模型。
4結(jié)束語
本論文通過調(diào)查大數(shù)據(jù)環(huán)境下學(xué)習(xí)資源智能化推送服務(wù)的社會需求,將目前存在的兩種主要的推送算法結(jié)合起來,揚長避短,并且與學(xué)習(xí)過程中學(xué)習(xí)者的動態(tài)行為數(shù)據(jù)有機結(jié)合,使其自適應(yīng)更新,構(gòu)成一種新的混合協(xié)同過濾的智能化推送服務(wù)模型,預(yù)計能顯著提高學(xué)習(xí)資源推送服務(wù)的預(yù)測精度和覆蓋率,能對當(dāng)前的數(shù)字化學(xué)習(xí)資源建設(shè)提供借鑒和參考,從而促進智能型在線學(xué)習(xí)的發(fā)展,完善教育信息化理論和產(chǎn)生一定的社會效益。