吳東,陳長(zhǎng)江
(嶺南師范學(xué)院信息工程學(xué)院,湛江524048)
近年來(lái),我國(guó)以“三通兩平臺(tái)”為代表的教育信息化重點(diǎn)工程取得重大突破,成效顯著。其中,教育資源公共服務(wù)平臺(tái)實(shí)現(xiàn)跨越式發(fā)展,全國(guó)近42%的學(xué)校可應(yīng)用數(shù)字教育資源開(kāi)展教學(xué)[1]。這些數(shù)字教育資源的使用,也為實(shí)現(xiàn)《國(guó)家中長(zhǎng)期教育改革和發(fā)展規(guī)劃綱要(2010-2020)》提出的“尊重差異,滿足學(xué)生多樣化學(xué)習(xí)需要,發(fā)展每一個(gè)學(xué)生的優(yōu)良個(gè)性”的目標(biāo)提供了條件[2]。但是,平臺(tái)中資源的爆炸式增長(zhǎng)帶來(lái)了“信息過(guò)載”問(wèn)題,增加了師生使用教育資源平臺(tái)的復(fù)雜度,造成優(yōu)質(zhì)資源發(fā)現(xiàn)困難、利用率低,嚴(yán)重妨礙優(yōu)質(zhì)資源的有效共享和個(gè)性化使用。
因此,怎樣幫助廣大中小學(xué)學(xué)生及教師在教育資源公共服務(wù)平臺(tái)中快速找到合適的優(yōu)質(zhì)資源顯得尤為重要。個(gè)性化推薦是解決“信息過(guò)載”問(wèn)題的主要技術(shù),其廣泛應(yīng)用于電子商務(wù)、搜索引擎、在線資訊等領(lǐng)域,取得了巨大成功。目前,基于個(gè)性化推薦技術(shù)的學(xué)習(xí)資源推送是各教育資源公共服務(wù)平臺(tái)大力發(fā)展的基礎(chǔ)業(yè)務(wù),逐漸為解決“信息過(guò)載”問(wèn)題發(fā)揮著重要作用。然而,該技術(shù)仍存在數(shù)據(jù)稀疏、冷啟動(dòng)、多樣性差等不足,尚需做進(jìn)一步的改進(jìn)和完善。
當(dāng)前,中小學(xué)教師及學(xué)生在教育資源公共服務(wù)平臺(tái)中進(jìn)行教學(xué)和學(xué)習(xí)正趨向普及,他們必將在平臺(tái)中構(gòu)建出新的在線社交網(wǎng)絡(luò),“師-師”、“師-生”和“生-生”間的積極交互會(huì)在平臺(tái)中留下海量社交信息。在此背景下,我們擬將社交信息融入學(xué)習(xí)資源個(gè)性化推薦技術(shù),旨在利用師生在平臺(tái)中產(chǎn)生的各式社交信息去提升學(xué)習(xí)資源個(gè)性化推薦技術(shù)的性能,提出了一種基于社交關(guān)系的學(xué)習(xí)資源推薦算法RRSR(Resource Recommendation Method Based on Social Relationship)。實(shí)驗(yàn)結(jié)果表明,該方法能取得很好的準(zhǔn)確率,有望為學(xué)習(xí)資源推送的個(gè)性化和精準(zhǔn)化提供借鑒和參考。
自社交應(yīng)用蓬勃發(fā)展,逐步為人們構(gòu)建新型在線社交網(wǎng)絡(luò)起,國(guó)內(nèi)外研究人員就敏銳的意識(shí)到其對(duì)個(gè)性化推薦可能帶來(lái)不可估量的促進(jìn)作用,并開(kāi)展了階段性研究工作,在不同層面取得一定的成果。
早期,學(xué)術(shù)界和業(yè)界展開(kāi)對(duì)社交關(guān)系的深入研究,試圖挖掘各式社交關(guān)系在個(gè)性化推薦技術(shù)中所起的作用。好友關(guān)系是社交網(wǎng)絡(luò)中最普遍的一種關(guān)系,用戶的興趣愛(ài)好通常跟好友的極其相似,將好友感興趣的學(xué)習(xí)資源推薦給用戶往往都能得到該用戶的認(rèn)可。Swearingen 等人的工作就是利用好友關(guān)系進(jìn)行推薦的成功案例[3]。王福生等人把科研工作者之間的好友關(guān)系定義為科研合作關(guān)系,他們利用學(xué)術(shù)論文的署名來(lái)發(fā)現(xiàn)科研工作者之間的這種關(guān)系,并在構(gòu)建科研合作關(guān)系網(wǎng)的基礎(chǔ)上實(shí)現(xiàn)了科研學(xué)習(xí)資源的個(gè)性化推薦[4]。而葉小強(qiáng)等人則認(rèn)為用戶會(huì)根據(jù)自身愛(ài)好加入不同的興趣圈子或社區(qū),這就產(chǎn)生了用戶跟圈子或社區(qū)之間的群組關(guān)系,當(dāng)我們能夠?yàn)橛脩粽业綄?duì)應(yīng)的群組時(shí)就可找到跟用戶學(xué)習(xí)愛(ài)好相似的其他用戶,也就能實(shí)現(xiàn)學(xué)習(xí)資源的推薦[5]。
進(jìn)一步,學(xué)者發(fā)現(xiàn)用戶間除了存在雙方地位平等的社交關(guān)系外,還有其他不對(duì)等關(guān)系,如追隨關(guān)系、信任關(guān)系等。Duncan J.Watts 的研究結(jié)果表明,社交網(wǎng)絡(luò)中往往都存在意見(jiàn)領(lǐng)袖,他們發(fā)布的消息或評(píng)論通常都會(huì)得到大多數(shù)人的認(rèn)可,并影響著這些人關(guān)于某些事或物的態(tài)度[6]。當(dāng)這些人認(rèn)定能夠從意見(jiàn)領(lǐng)袖那里得到所需的信息后,他們就會(huì)長(zhǎng)期的追隨意見(jiàn)領(lǐng)袖,成為意見(jiàn)領(lǐng)袖的“粉絲”,形成較為穩(wěn)定的追隨關(guān)系。Esslimani、Brun 以及Cheon 等人紛紛提出各自的意見(jiàn)領(lǐng)袖識(shí)別及利用意見(jiàn)領(lǐng)袖實(shí)現(xiàn)學(xué)習(xí)資源推薦的算法[7]。而Massa 等人則發(fā)現(xiàn)用戶間的相似性跟他們的信任關(guān)系是正相關(guān)的,于是首次將信任關(guān)系引入個(gè)性化推薦技術(shù)中[8]。之后,微軟亞洲研究院的馬浩及南洋理工大學(xué)張杰團(tuán)隊(duì)在該領(lǐng)域展開(kāi)了一系列的研究,并取得了一系列成果[9]。
認(rèn)真分析社交網(wǎng)絡(luò)環(huán)境中個(gè)性化推薦的現(xiàn)有成果,我們發(fā)現(xiàn)學(xué)者探討了各式社交關(guān)系跟用戶歷史行為相似性之間的聯(lián)系,考證了社交關(guān)系替代相似性的可能,驗(yàn)證了利用社交關(guān)系進(jìn)行個(gè)性化推薦的切實(shí)可行。這些豐富的成果為推動(dòng)社交信息融入學(xué)習(xí)資源個(gè)性化推薦奠定了良好的基礎(chǔ)。
基于社交關(guān)系的推薦算法RRSR 能夠完成資源推薦的前提是,教育資源公共服務(wù)平臺(tái)中的用戶已經(jīng)互相交互、結(jié)交為好友,構(gòu)建了在線社交網(wǎng)絡(luò)。如圖1 所示,是基于社交關(guān)系的學(xué)習(xí)資源推薦算法RRSR 的示意圖。從示意圖可以看出,當(dāng)要為平臺(tái)中的某用戶推薦資源時(shí),RRSR 算法先從在線社交網(wǎng)絡(luò)中找出該用戶的好友,再根據(jù)好友對(duì)于資源的評(píng)分及用戶跟好友間的熟悉度、興趣相似度來(lái)預(yù)測(cè)該用戶對(duì)資源的評(píng)分,最后得出該用戶可能適用的Top-N 資源排行榜。
圖1 RRSR算法示意圖
定義1 社交網(wǎng)絡(luò)。由代表用戶的節(jié)點(diǎn)和節(jié)點(diǎn)間的關(guān)系構(gòu)成的一個(gè)無(wú)向帶權(quán)圖G 表示,記為G=(V,E,F,S)。其中,V 是社交網(wǎng)絡(luò)中的用戶節(jié)點(diǎn)集合,E 是節(jié)點(diǎn)間的邊集合,F(xiàn) 是用戶節(jié)點(diǎn)間的熟悉度集合,S 是用戶節(jié)點(diǎn)間的興趣相似度集合。
定義2 熟悉度。在社交網(wǎng)絡(luò)G 中,用戶節(jié)點(diǎn)u 跟v 之間的熟悉度用fu,v表示。
其中,in(u)表示用戶u 的好友集合。在社交網(wǎng)絡(luò)中,用戶相對(duì)更容易接納其熟悉的好友推薦的資源。越熟悉、關(guān)系越好的朋友給出的建議,越容易被用戶接納。
定義3 興趣相似度。在社交網(wǎng)絡(luò)G 中,用戶節(jié)點(diǎn)u 跟v 之間的興趣相似度用su,v表示。
其中,N(u)表示用戶u 曾使用的資源集合。在社交網(wǎng)絡(luò)中,跟用戶興趣最相近的好友推薦的資源,也更容易被該用戶接納。
定義4 基于社交關(guān)系的推薦。假設(shè)要預(yù)測(cè)用戶u對(duì)資源i 的評(píng)分ru,i,可根據(jù)公式(3)來(lái)進(jìn)行計(jì)算。評(píng)分ru,i越高,表示用戶u 對(duì)資源i 非常感興趣,最有可能使用該資源。從公式(3)可以看出,RRSR 算法不僅考慮了用戶跟好友的熟悉度,還考慮了用戶跟好友的興趣相似度。這相當(dāng)于為用戶找到了不僅熟悉且興趣相投的好友來(lái)為其推薦資源,較符合日常生活中人們獲取建議的行為,該資源有更大的可能被用戶所接納。
其中,rv,i是用戶u 的好友v 對(duì)資源i 的評(píng)分。
我們采用數(shù)據(jù)集LibraryThing[10]來(lái)進(jìn)行算法的推薦效果驗(yàn)證實(shí)驗(yàn)。該數(shù)據(jù)集中有73,882 個(gè)用戶和337,561 個(gè)資源,用戶對(duì)資源的評(píng)論共979,053 條。另外,用戶間的好友關(guān)系有120,536 條。
由于RRSR 算法的目的是預(yù)測(cè)目標(biāo)用戶對(duì)目標(biāo)資源的評(píng)分,所以在此采用平均絕對(duì)誤差MAE(Mean Absolute Error)和均方根誤差RMSE(Root Mean Squared Error)來(lái)評(píng)估推薦算法的性能。MAE 和RMSE 越小,推薦算法的性能越好。MAE 和RMSE 的計(jì)算公式如(4)和(5)所示:
其中,L 為用戶u 評(píng)分資源的個(gè)數(shù),ru,i為用戶的實(shí)際評(píng)分,為預(yù)測(cè)評(píng)分。考慮到RRSR 算法需要借助用戶的好友來(lái)完成評(píng)分預(yù)測(cè),因此我們主要探討了該算法的性能跟用戶好友數(shù)之間的關(guān)系,其結(jié)果如圖2 所示。當(dāng)用戶好友數(shù)小于30 時(shí),RRSR 算法的MAE 和RMSE 分別為1.583563 和1.805492,而當(dāng)用戶好友數(shù)大于120 時(shí),RRSR 算法的MAE 和RMSE 分別為1.253403 和1.429040。由此可以得知,隨著用戶好友數(shù)的增加,RRSR 算法的MAE 和RMSE 減小,說(shuō)明RRSR 算法的性能越好,推薦的資源越可能是適合用戶使用的。
圖2 RRSR算法的性能跟用戶好友數(shù)的關(guān)系
中小學(xué)教學(xué)平臺(tái)的普及使用增強(qiáng)了教學(xué)質(zhì)量,但平臺(tái)中資源的爆炸式增長(zhǎng)帶來(lái)了“信息過(guò)載”問(wèn)題??紤]到人們比較容易接受興趣相投的好友的建議,基于教學(xué)平臺(tái)中的社交關(guān)系設(shè)計(jì)了學(xué)習(xí)資源的推薦算法RRSR。實(shí)驗(yàn)結(jié)果表明,該算法的推薦性能會(huì)隨著用戶好友的增加而變強(qiáng)。研究成果有望在中小學(xué)教學(xué)平臺(tái)中使用,特別是隨著平臺(tái)中在線社交網(wǎng)絡(luò)的擴(kuò)大,用戶好友的不斷增加,這種基于社交關(guān)系的推薦算法將取得更好的效果。