摘要:采用非負(fù)矩陣分解特征抽取方法對(duì)在線課程平臺(tái)所記錄的學(xué)習(xí)數(shù)據(jù)進(jìn)行降維與壓縮,提取影響在線課程平臺(tái)上學(xué)生學(xué)習(xí)質(zhì)量的主要特征群集。結(jié)合群集特征,根據(jù)學(xué)生個(gè)體的學(xué)習(xí)行為指標(biāo)及反映學(xué)生學(xué)習(xí)效果的特征指標(biāo)的權(quán)值大小,依次選取多級(jí)特征指標(biāo),形成教育特征群集網(wǎng)絡(luò),進(jìn)而分析可得影響教育個(gè)體質(zhì)量的核心特征指標(biāo)。
關(guān)鍵詞:特征抽??;非負(fù)矩陣分解;群集;特征指標(biāo)
0. 引言
國(guó)外學(xué)者較為重視在線課程平臺(tái)數(shù)據(jù)資源的研究,在Instructional quality of Massive Open Online Courses'—文中,分析了在線課程平臺(tái)教學(xué)設(shè)計(jì)的質(zhì)量,隨機(jī)抽取76個(gè)大規(guī)模開放在線課程的數(shù)據(jù)資源,分析和比較在線課程平臺(tái)的教學(xué)設(shè)計(jì)質(zhì)量。此外,還有一些研究者將注意力集中到在線課程學(xué)習(xí)平臺(tái)的學(xué)習(xí)評(píng)價(jià)和最終學(xué)分評(píng)定問題上,基于COURSERA等大型慕課平臺(tái)積累的學(xué)習(xí)數(shù)據(jù),對(duì)平臺(tái)的"學(xué)生互評(píng)"評(píng)價(jià)方式做了分析,論證其合理性和有效性。國(guó)內(nèi)關(guān)于在線課程平臺(tái)的數(shù)據(jù)資源的研究大多也集中在2012年之后。北京、上海、廣州等地已經(jīng)利用新的數(shù)據(jù)信息處理手段為用戶提供基本公共教育服務(wù)。如北京教育音像報(bào)刊總社在北京市教委的領(lǐng)導(dǎo)下,開發(fā)了“名師在線”服務(wù)平臺(tái),并可提供后臺(tái)數(shù)據(jù)分析報(bào)表。
本文針對(duì)教育個(gè)體學(xué)習(xí)特征的完整數(shù)據(jù)鏈,采用特征抽取方法提取出影響教育質(zhì)量的主要群集特征,構(gòu)建教育特征數(shù)據(jù)網(wǎng)絡(luò),并可進(jìn)一步分析得到影響教育個(gè)體質(zhì)量的核心特征。
1. 非負(fù)矩陣分解特征抽取
結(jié)合本文在線課程平臺(tái)教育特征數(shù)據(jù)群集分析問題,要求各學(xué)習(xí)特征節(jié)點(diǎn)隸屬于某個(gè)群集的程度值或權(quán)值,不能為負(fù)值,因此適用于非負(fù)矩陣分解(Non-negative Matrix Factorization, NMF)算法[1-2]。NMF方法是由Lee和Seung在《Nature》上提出, 它使分解后的所有分量均為非負(fù)值,能使數(shù)據(jù)的維數(shù)得到一定程度的約減,克服了傳統(tǒng)矩陣分解的很多問題,具有實(shí)現(xiàn)上的簡(jiǎn)便性、分解形式和分解結(jié)果上的可解釋性,以及占用存儲(chǔ)空間少等諸多優(yōu)點(diǎn)。
2. 群集特征分析
群集是指系統(tǒng)中相互吸引的高度聚集的狀態(tài)或現(xiàn)象,普遍存在于自然界和人類社會(huì)。在教育特征數(shù)據(jù)中,連接權(quán)重大的學(xué)習(xí)行為節(jié)點(diǎn)構(gòu)成群集,表示該學(xué)習(xí)行為相關(guān)性高。找出教育特征數(shù)據(jù)中的群集,即可找到表征學(xué)生學(xué)習(xí)個(gè)體行為的核心特征。
NMF方法中的V=WH,其中V是由m個(gè)學(xué)生樣本和其n個(gè)學(xué)習(xí)行為特征構(gòu)成的數(shù)據(jù)集矩陣,W是分解得到的大小為m*k的特征矩陣,H是分解出的大小為k*n的系數(shù)矩陣[3]。如對(duì)采集到的學(xué)生個(gè)體教育特征數(shù)據(jù)進(jìn)行NMF分解,得到3個(gè)群集特征的權(quán)值如圖1所示。
由學(xué)生個(gè)體行為及學(xué)習(xí)效果的指標(biāo)的權(quán)值大小,結(jié)合群集特征大小,可依次選取多級(jí)特征指標(biāo)形成教育特征群集網(wǎng)絡(luò)。
3. 教育特征群集網(wǎng)絡(luò)構(gòu)建
群集特征的差異表明,網(wǎng)絡(luò)呈現(xiàn)出明顯的層次拓?fù)浣Y(jié)構(gòu),大多數(shù)節(jié)點(diǎn)分別依附在若干個(gè)節(jié)點(diǎn)上,形成若干個(gè)小網(wǎng)絡(luò),小網(wǎng)絡(luò)經(jīng)過選擇性的互聯(lián)形成大網(wǎng)絡(luò)并產(chǎn)生少數(shù)幾個(gè)中心節(jié)點(diǎn),最后這幾個(gè)中心節(jié)點(diǎn)互聯(lián)成完整的網(wǎng)絡(luò)[4-6]。
將采集到的學(xué)生樣本的特征數(shù)據(jù)通過上節(jié)NMF方法分解,可得到的群集特征,結(jié)合學(xué)生個(gè)體的學(xué)習(xí)行為指標(biāo)和學(xué)習(xí)效果指標(biāo),可構(gòu)建學(xué)習(xí)教育特征網(wǎng)絡(luò)如圖2所示。
由圖2可知,節(jié)點(diǎn)1、3和節(jié)點(diǎn)4相關(guān)性較大,構(gòu)成一個(gè)群集特征,其中各節(jié)點(diǎn)分別對(duì)應(yīng)各教育個(gè)體的行為指標(biāo)特征或效果指標(biāo)特征。通過NMF分解得到的權(quán)重大小,可對(duì)節(jié)點(diǎn)1、3、4進(jìn)行權(quán)重排序,分析出更為重要的核心節(jié)點(diǎn)及所對(duì)應(yīng)的指標(biāo)。同理也可對(duì)位于同一個(gè)群集的節(jié)點(diǎn)2、5、6及節(jié)點(diǎn)7、8、9進(jìn)行分析,從而可得到影響教育個(gè)體質(zhì)量的核心特征指標(biāo)。
4. 結(jié)論
本文研究了基于NMF的特征抽取方法提取影響學(xué)生質(zhì)量的核心特征;根據(jù)這些反映個(gè)體質(zhì)量的群集特征的權(quán)值大小,可幫助教師分析學(xué)生個(gè)體學(xué)習(xí)質(zhì)量的核心指標(biāo),歸納在線教育環(huán)境下有效教學(xué)活動(dòng)發(fā)生的條件與關(guān)鍵要素,為構(gòu)建有效教學(xué)模式提供理論與實(shí)踐基礎(chǔ)。同時(shí),在此分析基礎(chǔ)上,可進(jìn)一步有效地設(shè)計(jì)規(guī)則來激發(fā)學(xué)生主體的主動(dòng)性、積極性,為學(xué)生提供更有針對(duì)性的教學(xué)干預(yù)。
參考文獻(xiàn):
[1]張小林,基于高斯混合模型和非負(fù)矩陣分解的復(fù)雜網(wǎng)絡(luò)社區(qū)檢測(cè)[D]. 西安電子科技大學(xué),2014.12. 33-42.
[2]李樂, 章毓晉. 非負(fù)矩陣分解算法綜述[J].電子學(xué)報(bào), 2008, 36(4): 737-743.
[3]Wang F., T Li, X. Wang, et al.. Community discovery using non-neg ative matrix factorization[J]. Data Mining and Knowledge Discovery, 2011, 22:493-521.
[4]徐曉,張清,張玉來,張世波.論復(fù)雜網(wǎng)絡(luò)理論在教育技術(shù)領(lǐng)域的應(yīng)用[J]. 寧波大學(xué)學(xué)報(bào)(教育科學(xué)版),2014,36(6):89-93.
[5]吳增海.社交網(wǎng)絡(luò)模型的研究[D].中國(guó)科學(xué)技術(shù)大學(xué), 2012,5:50-62.
[6]黃麗蒂.基于群集風(fēng)險(xiǎn)理論的體育建筑看臺(tái)安全設(shè)計(jì)研究[J]. 哈爾濱工業(yè)大學(xué),2014.7.23-43.
支撐項(xiàng)目:2017年武漢市教育局高校教學(xué)研究重點(diǎn)項(xiàng)目(2017008)
作者信息:周靜,湖北襄陽(yáng),副教授,博士,江漢大學(xué),數(shù)據(jù)挖掘與分析及計(jì)算機(jī)教育,湖北省武漢市沌口經(jīng)濟(jì)開發(fā)區(qū)江漢大學(xué)數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,430056。