鄭蘇生 李銘 姚磊岳
摘? 要:個(gè)性化服務(wù)推薦一直是人工智能領(lǐng)域重點(diǎn)研究方向之一。對(duì)高校而言,如何通過(guò)對(duì)教育大數(shù)據(jù)的分析,建立起一套科學(xué)的、行之有效的、針對(duì)個(gè)體學(xué)生的差異化教學(xué)服務(wù)推薦方案,是提升高等教育教學(xué)質(zhì)量、實(shí)現(xiàn)差異化教學(xué)的重要研究?jī)?nèi)容。本文以江西科技學(xué)院所積累的大量教學(xué)過(guò)程數(shù)據(jù)為基礎(chǔ),將學(xué)生學(xué)習(xí)過(guò)程抽象為多維數(shù)據(jù)標(biāo)簽,利用既有深度學(xué)習(xí)網(wǎng)絡(luò),設(shè)計(jì)了一套以教學(xué)服務(wù)差異化推薦為主要目的的多特征融合服務(wù)推薦策略網(wǎng)絡(luò)模型。
關(guān)鍵詞:服務(wù)推薦;教學(xué)資源管理;深度學(xué)習(xí);人工智能
中圖分類(lèi)號(hào):TP391.41? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2019)24-0118-03
Abstract:Personalized service recommendation has been a hot research point of artificial intelligence. For colleges and universities,how to establish a set of scientific,effective and individualized teaching service recommendation scheme based on the analysis of education big data is an important research content to improve the teaching quality of higher education and realize differentiated teaching. Based on a large number of teaching process data accumulated by Jiangxi University of Technology,this paper abstracts students’learning process into multi-dimensional data labels,and designs a set of multi-feature fusion service recommendation strategy network model with the main purpose of teaching service differential recommendation by using the existing deep learning network.
Keywords:service recommendation;educational resource management;deep learning;artificial intelligence
0? 引? 言
中國(guó)教育科學(xué)研究院院長(zhǎng)田慧生指出,大數(shù)據(jù)及其技術(shù)為認(rèn)識(shí)和探索教育規(guī)律提供了前所未有的手段,對(duì)改變教與學(xué)的方式提供了強(qiáng)有力的支持,對(duì)教育研究、教育決策科學(xué)化水平的提升奠定了基礎(chǔ),并將全方位改變?nèi)藗兊墓ぷ鞣绞健⑺季S方式與生活方式[1]。高等教育大數(shù)據(jù)的服務(wù)價(jià)值體現(xiàn)在聚焦、診斷、服務(wù)于“人”的學(xué)習(xí)全過(guò)程,以促進(jìn)每個(gè)學(xué)習(xí)者的學(xué)習(xí)效率。越來(lái)越多的高校借助新的信息技術(shù),將提升學(xué)習(xí)者的能力與潛力、改善學(xué)習(xí)者的學(xué)習(xí)模式作為教育導(dǎo)向??梢灶A(yù)期:一個(gè)屬于教育的大數(shù)據(jù)時(shí)代即將到來(lái),它不僅影響學(xué)校內(nèi)部治理的改革,而且會(huì)驅(qū)動(dòng)整個(gè)教育領(lǐng)域的變革。然而,從整體上看,大數(shù)據(jù)及人工智能技術(shù)在教育決策、教學(xué)過(guò)程中的運(yùn)用還處于摸索和起步階段。一方面是由于教育管理本身的復(fù)雜性制約著人工智能技術(shù)在高等教育管理中的運(yùn)用;另一方面是由于高等教育“低頻高值(即:發(fā)生頻率低,包含價(jià)值高,如:專(zhuān)業(yè)選擇、導(dǎo)師選擇等)”的特點(diǎn),大大增加了技術(shù)應(yīng)用的難度。
鑒于上述背景,本文以江西科技學(xué)院為例,從其內(nèi)部所積累的大量教學(xué)過(guò)程數(shù)據(jù)以及市場(chǎng)就業(yè)需求相關(guān)數(shù)據(jù)出發(fā),探索并找到其關(guān)鍵點(diǎn)和核心,抽取特征并構(gòu)建特征矩陣,結(jié)合既有深度學(xué)習(xí)網(wǎng)絡(luò),為教學(xué)資源的合理、優(yōu)化配置設(shè)計(jì)了一套智能配置推薦網(wǎng)絡(luò)模型。
1? 本文方法及實(shí)現(xiàn)
基于統(tǒng)計(jì)學(xué)的推薦策略往往是尋找或建立特征模型,并設(shè)定閾值進(jìn)行分類(lèi)。而閾值的設(shè)定與選取往往依靠人工判斷,雖然通過(guò)嚴(yán)格和復(fù)雜的實(shí)驗(yàn)可以基本確定閾值,但其工作量大且繁復(fù)。同時(shí),由于受限于教育過(guò)程“低頻”的特點(diǎn),服務(wù)參照點(diǎn)少、服務(wù)信息容易被丟失,“低頻”服務(wù)推薦并不準(zhǔn)確。而對(duì)于深度學(xué)習(xí)而言,目前主流的“端到端”做法在輸入端沒(méi)有經(jīng)過(guò)任何處理,導(dǎo)致深度學(xué)習(xí)框架的訓(xùn)練對(duì)硬件性能依賴極大。同時(shí),為了提高預(yù)測(cè)準(zhǔn)確率,框架往往向著“深、更深”的方向擴(kuò)展,對(duì)算力要求巨大。本文研究擬融合經(jīng)典服務(wù)推薦特征,并通過(guò)插值算法構(gòu)建特征矩陣,結(jié)合深度學(xué)習(xí)技術(shù)實(shí)現(xiàn)“低頻高值”服務(wù)的精確推薦。
1.1? 主要研究問(wèn)題
教育資源配置中,“低頻高值”服務(wù)存在數(shù)據(jù)少、推薦精準(zhǔn)度低、特征選取復(fù)雜、參數(shù)調(diào)整困難等問(wèn)題。為實(shí)現(xiàn)可拓展的、普適性的、準(zhǔn)確率較高的“低頻高值”服務(wù)推薦模型,本文在研究過(guò)程中將服務(wù)推薦、服務(wù)計(jì)算領(lǐng)域的多種技術(shù)進(jìn)行融合、改進(jìn),并主要解決以下關(guān)鍵問(wèn)題。
1.1.1? 經(jīng)典特征改進(jìn)
除淺層特征外,絕大部分經(jīng)典手工特征已包含時(shí)序信息。在建模過(guò)程中,為使其與淺層特征共同構(gòu)建多維特征矩陣,在必要情況下,需要將經(jīng)典手工特征中的時(shí)域信息暫時(shí)剝離,并保證其特征的有效性。
1.1.2? 多維特征矩陣構(gòu)建
從理論上來(lái)說(shuō),特征越多對(duì)一個(gè)事物的描述則越為準(zhǔn)確。所以,將淺層特征與手工特征融合,并構(gòu)建多維特征矩陣是網(wǎng)絡(luò)模型成功的關(guān)鍵。然而,手工特征往往在設(shè)計(jì)過(guò)程中已包含淺層特征的全部或部分信息,如果不加區(qū)別地簡(jiǎn)單構(gòu)建特征矩陣,則有可能導(dǎo)致某一特征權(quán)重過(guò)大,從而導(dǎo)致服務(wù)推薦失準(zhǔn)。故如何提取表征性強(qiáng)且權(quán)重合理的特征構(gòu)建矩陣,是影響網(wǎng)絡(luò)模型結(jié)果的關(guān)鍵所在。
1.1.3? 基于教學(xué)管理過(guò)程中“低頻高值”服務(wù)推薦的深度學(xué)習(xí)網(wǎng)絡(luò)設(shè)計(jì)
根據(jù)服務(wù)的收、授雙方特點(diǎn),分別利用卷積神經(jīng)網(wǎng)絡(luò)(CNN)與循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)構(gòu)建基本預(yù)測(cè)模型,并在Softmax層設(shè)計(jì)融合策略,最終確定全連接層的一維參數(shù)向量,為準(zhǔn)確分類(lèi)提供保障。
1.2? 解決方案及模型構(gòu)建
如圖1所示,本文所設(shè)計(jì)網(wǎng)絡(luò)框架將主要分為四步:首先,將教育過(guò)程中的紛雜的數(shù)據(jù)進(jìn)行人工抽象并結(jié)構(gòu)化為多維數(shù)組,比如:學(xué)生興趣愛(ài)好、專(zhuān)業(yè)、層次(本科、專(zhuān)科)、課程成績(jī)、教學(xué)資源投入(生均經(jīng)費(fèi)、生均圖書(shū)、教師配比)等;其次,利用既往已經(jīng)積累的大數(shù)據(jù),構(gòu)建時(shí)間維度的特征舉證,并通過(guò)RNN網(wǎng)絡(luò)進(jìn)行訓(xùn)練并提煉RNN深度特征;再次,通過(guò)教育教學(xué)先驗(yàn)知識(shí),根據(jù)高等教育教學(xué)“投入-產(chǎn)出”比模型,構(gòu)建CNN網(wǎng)絡(luò),得到CNN深度特征;最后,融合深度特征,進(jìn)行資源分配策略推薦。
該網(wǎng)絡(luò)模型的主要?jiǎng)?chuàng)新在于:
(1)改變“端到端”的簡(jiǎn)單做法,通過(guò)輸入端的前期建模提取“語(yǔ)義級(jí)”參數(shù)。傳統(tǒng)“端到端”做法雖然能夠在最大程度上保留預(yù)測(cè)對(duì)象的信息特征,但會(huì)導(dǎo)致深度學(xué)習(xí)網(wǎng)絡(luò)越來(lái)越“深”,導(dǎo)致框架訓(xùn)練、參數(shù)調(diào)優(yōu)工作越來(lái)越繁雜。對(duì)前端語(yǔ)義級(jí)參數(shù)的提取不僅將大大降低深度學(xué)習(xí)網(wǎng)絡(luò)的訓(xùn)練、預(yù)測(cè)時(shí)間,而且可將無(wú)效的“雜音”參數(shù)提取出,從而提高算法的準(zhǔn)確性。
(2)通過(guò)基于上下文的插值算法增加“低頻交易”特征值,定義時(shí)間維度變長(zhǎng)的特征矩陣。對(duì)于“低頻高值”的服務(wù)推薦,影響準(zhǔn)確率最大的因素在于其“低頻”特點(diǎn),往往非常有限的交易變化在算法運(yùn)行過(guò)程中會(huì)被不斷弱化,甚至被程序忽略。本文設(shè)計(jì)的網(wǎng)絡(luò)模型結(jié)合上下文信息,實(shí)現(xiàn)低頻交易之間特征值的最大擬合,將預(yù)測(cè)無(wú)效的階躍信息轉(zhuǎn)化為趨勢(shì)可尋的線性信息。
(3)構(gòu)建針對(duì)服務(wù)推薦的多層異構(gòu)深度網(wǎng)絡(luò)框架。本文根據(jù)服務(wù)的收、授特點(diǎn),分別利用CNN網(wǎng)絡(luò)與RNN網(wǎng)絡(luò)構(gòu)建基本預(yù)測(cè)模型,并在最終預(yù)測(cè)之前進(jìn)行參數(shù)融合,最終實(shí)現(xiàn)了服務(wù)推薦的準(zhǔn)確預(yù)測(cè)。
1.3? 網(wǎng)絡(luò)模型技術(shù)可行性分析
1.3.1? 手工特征的有效選取與特征矩陣的構(gòu)建
基于服務(wù)推薦的多種經(jīng)典特征已在不同應(yīng)用領(lǐng)域達(dá)到了較好效果。同時(shí),本文收集的樣本數(shù)據(jù)能夠?yàn)闇\層特征選擇提供良好基礎(chǔ),使基本建模數(shù)據(jù)源有保障。
1.3.2? 服務(wù)推薦模型設(shè)計(jì)
本文擬采用的深度學(xué)習(xí)技術(shù),屬于預(yù)測(cè)分類(lèi)的手段,在結(jié)合前期工作成果后,能夠利用硬件算力減少人為閾值判斷與設(shè)定工作量,成果可期,技術(shù)選型可行。
1.3.3? 異構(gòu)深度學(xué)習(xí)網(wǎng)絡(luò)融合
深度學(xué)習(xí)技術(shù)在行為預(yù)測(cè)、趨勢(shì)預(yù)測(cè)中已取得了良好應(yīng)用效果。為提高預(yù)測(cè)準(zhǔn)確率,對(duì)不同目標(biāo)對(duì)象建立不同的網(wǎng)絡(luò)框架,并在最終預(yù)測(cè)之前進(jìn)行融合是行之有效的方法,且已經(jīng)在車(chē)流分析、人群聚集分析等場(chǎng)景得到驗(yàn)證。本文研究?jī)?nèi)容本質(zhì)上也可歸納為固定特征在時(shí)序緯度的預(yù)測(cè)與分類(lèi),在算法設(shè)計(jì)上可以借鑒相關(guān)領(lǐng)域的成功經(jīng)驗(yàn)。理論可行,有待研究驗(yàn)證。
2? 結(jié)? 論
本文的研究?jī)?nèi)容為服務(wù)計(jì)算、服務(wù)推薦、信息管理領(lǐng)域前沿內(nèi)容,成果能夠?qū)崿F(xiàn)“低頻”交易服務(wù)的精準(zhǔn)推薦。特別是基于上下文的差值以及多維特征矩陣的構(gòu)建,將實(shí)現(xiàn)深度學(xué)習(xí)框架輸入端參數(shù)數(shù)量級(jí)的有效下降,大大提高框架的訓(xùn)練速度,減輕深度框架的重量。本文所提網(wǎng)絡(luò)模型技術(shù)可行,可實(shí)現(xiàn)基于統(tǒng)計(jì)學(xué)模式識(shí)別方法與基于深度學(xué)習(xí)模式識(shí)別方法的融合與統(tǒng)一。在后續(xù)理論研究方面,將針對(duì)此問(wèn)題開(kāi)展深入研究,并通過(guò)仿真實(shí)驗(yàn)、試點(diǎn)使用驗(yàn)證效果。
參考文獻(xiàn):
[1] 孟祥武,劉樹(shù)棟,張玉潔,等.社會(huì)化推薦系統(tǒng)研究 [J].軟件學(xué)報(bào),2015,26(6):1356-1372.
[2] 王海艷,楊文彬,王隨昌,等.基于可信聯(lián)盟的服務(wù)推薦方法 [J].計(jì)算機(jī)學(xué)報(bào),2014,37(2):301-311.
[3] 朱強(qiáng),孫玉強(qiáng).一種基于信任度的協(xié)同過(guò)濾推薦方法 [J].清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,54(3):360-365.
[4] 胡勛,孟祥武,張玉潔,等.一種融合項(xiàng)目特征和移動(dòng)用戶信任關(guān)系的推薦算法 [J].軟件學(xué)報(bào),2014,25(8):1817-1830.
[5] 周超,李博.一種基于用戶信任網(wǎng)絡(luò)的推薦方法 [J].北京郵電大學(xué)學(xué)報(bào),2014,37(4):98-102.
[6] 鄒本友,李翠平,譚力文,等.基于用戶信任和張量分解的社會(huì)網(wǎng)絡(luò)推薦 [J].軟件學(xué)報(bào),2014,25(12):2852-2864.
[7] 李美子,黃震華,向陽(yáng),等.社交網(wǎng)絡(luò)中基于信任評(píng)估的推薦控制模型 [J].同濟(jì)大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,42(7):1117-1122.
[8] 張波,向陽(yáng),黃震華.一種社交網(wǎng)絡(luò)中的個(gè)體間推薦信任度計(jì)算方法 [J].南京航空航天大學(xué)學(xué)報(bào),2013,45(4):563-569.
作者簡(jiǎn)介:鄭蘇生(1978.01-),男,漢族,江西撫州人,講師,研究生,研究方向:工商管理;李銘(1985.07-),男,漢族,江西撫州人,助教,本科,研究方向:計(jì)算機(jī)網(wǎng)絡(luò);姚磊岳(1982.07-),男,漢族,江西南昌人,教授,研究生,研究方向:大數(shù)據(jù)挖掘與人工智能。