張伊 張冰冰
摘要:如何面對(duì)海量的信息如何進(jìn)行過(guò)濾和篩選,并將用戶(hù)最想得到的信息進(jìn)行展現(xiàn),這已經(jīng)成為這個(gè)信息爆炸時(shí)代最重要的問(wèn)題之一。在此情景下,推薦系統(tǒng)應(yīng)運(yùn)而生。它不像搜索引擎一樣只是對(duì)用戶(hù)提供的顯式需求進(jìn)行被動(dòng)式的匹配,而是可以根據(jù)用戶(hù)潛在的興趣和愛(ài)好主動(dòng)地進(jìn)行信息推薦,從而最終提升用戶(hù)體驗(yàn)、提高服務(wù)質(zhì)量。
關(guān)鍵詞:推薦算法;數(shù)據(jù)挖掘;用戶(hù)興趣
一、引言
1.研究背景與意義
隨著網(wǎng)絡(luò)的高速發(fā)展,現(xiàn)在互聯(lián)網(wǎng)已經(jīng)從個(gè)人PC向移動(dòng)互聯(lián)網(wǎng)發(fā)展。在全世界范圍內(nèi),除了傳統(tǒng)的個(gè)人PC外,互聯(lián)網(wǎng)中有增加了大量的移動(dòng)終端,如智能手機(jī)、平板電腦、智能電視、智能汽車(chē)等各種設(shè)備都連到了互聯(lián)網(wǎng)當(dāng)中?;ヂ?lián)網(wǎng)中的各式終端在隨時(shí)隨地的獲取數(shù)據(jù)的同時(shí),也會(huì)產(chǎn)生新的數(shù)據(jù)。例如,剛過(guò)去的一分鐘內(nèi),淘寶賣(mài)出數(shù)以萬(wàn)計(jì)的商品,谷歌產(chǎn)生幾千萬(wàn)條的搜索查詢(xún)等等,新浪和騰訊微博發(fā)送數(shù)萬(wàn)條微博,幾萬(wàn)個(gè)應(yīng)用程序從蘋(píng)果應(yīng)用商店下載,這些都是海量數(shù)據(jù)的具體體現(xiàn)。目前,隨著移動(dòng)互聯(lián)網(wǎng)的廣泛運(yùn)行,產(chǎn)生的數(shù)據(jù)比以往任何時(shí)期都要多的多,互聯(lián)網(wǎng)中的數(shù)據(jù)呈現(xiàn)出爆炸式增長(zhǎng)的景象。大數(shù)據(jù)處理成為當(dāng)今信息領(lǐng)域中最熱門(mén)的項(xiàng)目之一。大數(shù)據(jù)處理通過(guò)運(yùn)行新工具、系統(tǒng)、機(jī)器學(xué)習(xí)等,把海量動(dòng)態(tài)的數(shù)據(jù)轉(zhuǎn)化為有價(jià)值的知識(shí),挖掘出數(shù)據(jù)背后隱藏的經(jīng)濟(jì)規(guī)律。
2.新的推薦系統(tǒng)
目前,個(gè)性化的智能推薦系統(tǒng)是當(dāng)今大數(shù)據(jù)處理發(fā)展的一個(gè)重要趨勢(shì)。個(gè)性化的智能推薦系統(tǒng)可以結(jié)合用戶(hù)的歷史瀏覽記錄,分析出用戶(hù)習(xí)慣、行為、興趣愛(ài)好等,再通過(guò)建立用戶(hù)興趣模型,從而為用戶(hù)推薦所感興趣的信息。在現(xiàn)今這個(gè)信息大爆炸的時(shí)代,用戶(hù)面對(duì)海量信息時(shí),往往不知改如何選擇,因此推薦系統(tǒng)得以產(chǎn)生并得以廣泛應(yīng)用。在現(xiàn)實(shí)中,用戶(hù)在互聯(lián)網(wǎng)上購(gòu)買(mǎi)書(shū)籍時(shí),推薦系統(tǒng)便可以可以向用戶(hù)推薦感興趣的書(shū)籍。例如,亞馬遜網(wǎng)站會(huì)根據(jù)用戶(hù)的書(shū)籍歷史購(gòu)買(mǎi)記錄,向用戶(hù)提供個(gè)性化的推薦服務(wù)。因?yàn)椴煌娜擞胁煌男愿裉攸c(diǎn)、興趣愛(ài)好,所以,推薦系統(tǒng)應(yīng)針對(duì)每個(gè)人提供個(gè)性化的智能推薦服務(wù)。
二、推薦系統(tǒng)的實(shí)現(xiàn)技術(shù)
1.動(dòng)態(tài)推薦系統(tǒng)
由于用戶(hù)的興趣是動(dòng)態(tài)變化,物品的屬性也并非是單一的,所以推薦系統(tǒng)也應(yīng)具備動(dòng)態(tài)特性。用戶(hù)的上下文,如地點(diǎn)、時(shí)間等,是動(dòng)態(tài)推薦系統(tǒng)中需要考慮的重要因素。上下文的變化往往意味著用戶(hù)興趣的變化。因此,結(jié)合用戶(hù)上下文的動(dòng)態(tài)推薦系統(tǒng)能夠在旅店、音樂(lè)、旅游景點(diǎn)等方面發(fā)揮出非常重要的作用。與傳統(tǒng)的推薦系相比統(tǒng),結(jié)合了用戶(hù)上下文具體環(huán)境的動(dòng)態(tài)推薦系統(tǒng)在評(píng)價(jià)指標(biāo):精度、錯(cuò)誤率、召回率都要好。
動(dòng)態(tài)推薦系統(tǒng)的關(guān)鍵,是要建立用戶(hù)的上下文和用戶(hù)興趣之間聯(lián)系模型。在日志記錄中,用戶(hù)的評(píng)分作為顯性的反饋數(shù)據(jù),往往只占有很少的一部分,日志中大量的數(shù)據(jù)是用戶(hù)瀏覽、評(píng)論等這樣的隱性用戶(hù)反饋數(shù)據(jù)。要建立上下文與用戶(hù)興趣之間的聯(lián)系模型,必須考慮到用戶(hù)評(píng)分時(shí)一些細(xì)節(jié),像在視頻網(wǎng)站,是陪朋友觀看還是獨(dú)立觀看,觀看時(shí)間,是否連續(xù)播放等上下文具體情境,但是有些數(shù)據(jù)描述的是現(xiàn)實(shí)生活中的環(huán)境,動(dòng)態(tài)推薦系統(tǒng)往往很難取得。用戶(hù)在進(jìn)行評(píng)分時(shí),是將多個(gè)環(huán)境因素考慮進(jìn)去,以時(shí)間,地點(diǎn)等因素尤為重要。動(dòng)態(tài)推薦系統(tǒng)應(yīng)該結(jié)合多個(gè)環(huán)境因素,向用戶(hù)提供與興趣最匹配的商品。
2.推薦系統(tǒng)的評(píng)價(jià)指標(biāo)
任何一個(gè)最終可以實(shí)際運(yùn)行的系統(tǒng),都繞不開(kāi)評(píng)估檢測(cè)。只有每項(xiàng)評(píng)價(jià)指標(biāo)都達(dá)到了目標(biāo)值時(shí),系統(tǒng)才算是一個(gè)合格的系統(tǒng)。不同的系統(tǒng)有著不同的評(píng)價(jià)指標(biāo),推薦系統(tǒng)的評(píng)價(jià)指標(biāo)主要有準(zhǔn)確度,覆蓋率,驚喜性,新穎性等。下面詳細(xì)介紹一下每個(gè)評(píng)價(jià)指標(biāo)。
準(zhǔn)確度在推薦系統(tǒng)中是最重要的一項(xiàng)指標(biāo),Top-N推薦系統(tǒng)和預(yù)測(cè)評(píng)分推薦系統(tǒng)在準(zhǔn)確度上各有各自的表現(xiàn)方式。Top-N推薦系統(tǒng)通過(guò)采用分析用戶(hù)的隱性反饋行為數(shù)據(jù),向用戶(hù)推薦N個(gè)可能感興趣的物品。在預(yù)測(cè)評(píng)分推薦系統(tǒng)中,采用的是平均絕對(duì)誤差或者絕對(duì)均方根誤差來(lái)進(jìn)行計(jì)算。
覆蓋率往往是用來(lái)解決推薦系統(tǒng)中所面臨的長(zhǎng)尾問(wèn)題,可以向感興趣的用戶(hù)推薦非熱賣(mài)的物品。例如,在許多電子商務(wù)網(wǎng)中,有一些冷門(mén)的商品評(píng)分很少,如果推薦系統(tǒng)向用戶(hù)推薦熱門(mén)的商品,那么該推薦系統(tǒng)的覆蓋率可能就會(huì)很低。
近幾年,新穎性和驚喜性越來(lái)越被人重視。驚喜性和新穎性可以反映出用戶(hù)對(duì)某些事物的特定需求。例如,一個(gè)喜愛(ài)電影的用戶(hù),如果推薦的是當(dāng)下熱門(mén)的電影,則用戶(hù)可能不會(huì)感到意外,因?yàn)橛脩?hù)可能已經(jīng)看過(guò)這些熱門(mén)電影。但是如果系統(tǒng)推薦了一些用戶(hù)沒(méi)有看過(guò)的且滿(mǎn)足用戶(hù)興趣愛(ài)好的電影,那么用戶(hù)在接受推薦時(shí)候,會(huì)有意外的感受。當(dāng)然并非只有最新的物品才具有新穎性和驚喜性,在用戶(hù)的認(rèn)識(shí)領(lǐng)域當(dāng)中,只要是用戶(hù)沒(méi)有接觸的物品皆有可能為用戶(hù)帶來(lái)驚喜。
三、小結(jié)
在互聯(lián)網(wǎng)蓬勃發(fā)展的背景下,信息數(shù)據(jù)也呈現(xiàn)出爆炸式的高速增長(zhǎng)??梢灶A(yù)見(jiàn)的是,在以后的一段時(shí)間內(nèi)向用戶(hù)提供高效、精準(zhǔn)的個(gè)性化推薦是其必然的發(fā)展趨勢(shì)。(作者單位:河南財(cái)經(jīng)政法大學(xué))
參考文獻(xiàn):
[1]李國(guó)杰.大數(shù)據(jù)研宄的科學(xué)價(jià)值.中國(guó)計(jì)算機(jī)學(xué)會(huì)通訊,2012,8(9):8-15.
[2]項(xiàng)亮.推薦系統(tǒng)實(shí)踐[M].北京:人民郵電出版社,2012,1-9
[3]艾瑞網(wǎng).2012-2013年中國(guó)移動(dòng)互聯(lián)網(wǎng)行業(yè)年度監(jiān)測(cè)報(bào)告簡(jiǎn)版.2013.
[4]劉建國(guó),周濤,汪秉宏.個(gè)性化推薦系統(tǒng)的研究進(jìn)展.自然科學(xué)進(jìn)展,2009,19(1):1-15.
[5]曾鳴.云商業(yè)的大創(chuàng)想.[EB/OL]:http://www.aliresearch.com/html/stopic/ayan13.html,March 9,2013
[6]朱郁筱,呂琳媛.推薦系統(tǒng)評(píng)價(jià)指標(biāo)綜述[J].電子科技大學(xué)學(xué)報(bào),2012:41(2),163-169
[7]項(xiàng)亮.動(dòng)態(tài)推薦系統(tǒng)關(guān)鍵技術(shù)研究[D].北京:中國(guó)科學(xué)院研究生院,2011,24-27
[8]李方濤.基于產(chǎn)品評(píng)論的情感分析研究[D].北京:清華大學(xué).2011.17-21