• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于用戶行為的推薦算法研究

    2017-09-09 06:16:00朱子江劉東劉壽強(qiáng)
    軟件導(dǎo)刊 2017年8期
    關(guān)鍵詞:用戶行為推薦系統(tǒng)關(guān)聯(lián)規(guī)則

    朱子江+劉東+劉壽強(qiáng)

    摘 要:推薦系統(tǒng)是對用戶的歷史行為進(jìn)行挖掘,對用戶興趣信息進(jìn)行建模,并對用戶未來行為進(jìn)行預(yù)測,從而建立用戶和內(nèi)容的關(guān)系,滿足用戶對商品的推薦需求的一種智能系統(tǒng)。通過對主要的推薦算法進(jìn)行比較分析,提出一種基于用戶行為的推薦算法,挖掘用戶瀏覽閱讀行為的關(guān)聯(lián)規(guī)則,模擬實(shí)現(xiàn)了基于用戶行為的智能推薦系統(tǒng),提高了推薦算法的有效性。

    關(guān)鍵詞:推薦系統(tǒng);關(guān)聯(lián)規(guī)則;用戶行為;數(shù)據(jù)挖據(jù)

    DOIDOI:10.11907/rjdk.171378

    中圖分類號:TP312

    文獻(xiàn)標(biāo)識碼:A 文章編號文章編號:1672-7800(2017)008-0043-03

    0 引言

    商家為了提高商品交易額,往往非常重視推薦活動,推薦方式豐富多彩。隨著電子商務(wù)平臺的出現(xiàn)和計算機(jī)技術(shù)發(fā)展,推薦方法升級到了智能推薦系統(tǒng)。智能推薦系統(tǒng)是建立在海量數(shù)據(jù)挖掘基礎(chǔ)上的一種商務(wù)智能平臺,在電子商務(wù)網(wǎng)站中為顧客購物提供決策支持和信息服務(wù),旨在根據(jù)顧客的購物信息和對所購商品的反饋信息推薦顧客需求的商品,以及具有相同效能不同種類的商品[1-3]。

    推薦系統(tǒng)主要由推薦候選對象、用戶、推薦算法3個要素組成[2],能否達(dá)到智能推薦效果的關(guān)鍵是推薦算法。推薦系統(tǒng)分為單一推薦模式和協(xié)同推薦模式。例如,利用顧客和顧客之間的相似度進(jìn)行推薦,或者利用商品與商品之間的相似度進(jìn)行推薦,均為單一推薦模式,而兩者相結(jié)合取其相應(yīng)比重進(jìn)行的推薦則為協(xié)同推薦模式。推薦系統(tǒng)的有效性取決于所采用的推薦算法。

    本文在分析推薦算法的基礎(chǔ)上,模擬實(shí)現(xiàn)了一種新的基于用戶行為的推薦系統(tǒng),同時根據(jù)協(xié)同推薦系統(tǒng)中存在的問題,結(jié)合實(shí)際提出了一種改進(jìn)算法和推薦策略。

    1 主要推薦算法

    推薦系統(tǒng)中比較關(guān)鍵的算法是相似度計算,有顧客與顧客之間的相似度計算,也有商品與商品之間的相似度計算。相似度計算函數(shù)要具有同樣的函數(shù)簽名、返回值為浮點(diǎn)數(shù)等特征,其返回數(shù)值越大表示相似度越大。目前主要的推薦算法有基于內(nèi)容的推薦、基于協(xié)同過濾的推薦、基于關(guān)聯(lián)規(guī)則的推薦、基于效用推薦、基于知識推薦等。

    由文獻(xiàn)[1]、[2]的研究可知:基于內(nèi)容的推薦算法優(yōu)點(diǎn)是用戶資料模型可隨用戶的偏好改變而發(fā)生變化,缺點(diǎn)是需要有用戶的歷史數(shù)據(jù);協(xié)同過濾推薦算法主要采用最近鄰技術(shù),最大優(yōu)點(diǎn)是能處理非結(jié)構(gòu)化數(shù)據(jù),能處理視頻、聲音等復(fù)雜推薦對象,但處理稀疏問題時精確度不高;基于關(guān)聯(lián)規(guī)則的推薦算法優(yōu)點(diǎn)是可以發(fā)現(xiàn)不同商品在銷售過程中的相關(guān)性,但關(guān)聯(lián)規(guī)則發(fā)現(xiàn)很耗時;基于效用推薦算法的優(yōu)點(diǎn)是它能把非產(chǎn)品的屬性考慮到效用計算中,但需要為每一個用戶創(chuàng)建一個效用函數(shù);基于知識的推薦算法能解釋需求和推薦之間的關(guān)系,但對用戶群具有局限性。

    綜上所述,各推薦方法優(yōu)點(diǎn)和缺點(diǎn)并存,由此可見,單一的推薦方法不能滿足推薦系統(tǒng)需求。實(shí)際應(yīng)用中,通過組合推薦的方法解決推薦系統(tǒng)運(yùn)行中所發(fā)現(xiàn)的問題,由此產(chǎn)生了基于內(nèi)容的協(xié)同過濾推薦方法。該方法通過基于內(nèi)容的算法產(chǎn)生一個推薦結(jié)果,再用協(xié)同過濾推薦算法產(chǎn)生一個推薦結(jié)果,將兩者根據(jù)某一權(quán)值進(jìn)行結(jié)合,得出一個新的推薦結(jié)果[4]。組合推薦理論方法很多,但在同一推薦系統(tǒng)中,對不同問題的推薦結(jié)果不一定都有效,組合推薦所要解決的問題就是盡可能地避免推薦算法各自的缺點(diǎn)。

    2 基于用戶行為的關(guān)聯(lián)規(guī)則推薦算法

    在電子商務(wù)或網(wǎng)絡(luò)瀏覽行為場景中,通過用戶對已購商品的評價來進(jìn)行推薦是比較普遍的做法,但用戶有時沒有給出評價。當(dāng)用戶只提供二元數(shù)據(jù)(購買與否或者是有沒有點(diǎn)擊過)時,就無法應(yīng)用基于評價的算法。這時可以采用關(guān)聯(lián)規(guī)則挖掘算法,即僅對最鄰近用戶的購買記錄分析,取得潛在的相似信息。當(dāng)用戶A在瀏覽某一商品S時,購買過商品S的鄰居用戶會將已買的商品推薦給用戶A,這種算法可以推薦給感興趣但從來沒有瀏覽過此商品的用戶。

    2.1 關(guān)聯(lián)規(guī)則

    以關(guān)聯(lián)規(guī)則[5-8]為基礎(chǔ)的推薦算法,把推薦對象作為規(guī)則體,把已購商品作為規(guī)則頭,對購買記錄進(jìn)行技術(shù)處理,發(fā)現(xiàn)最鄰近用戶以及商品購買習(xí)慣,挖掘出相關(guān)性。具體關(guān)聯(lián)規(guī)則應(yīng)用場景如表1所示。

    在上述場景中,商品1和商品2的余弦相關(guān)系數(shù)為: (1,0,0)·(0,1,1)||(1,0,0)||||(0,1,1)||=0(1)

    商品1和商品3的余弦相關(guān)系數(shù)為: (1,0,0)·(1,1,0)||(1,0,0)||||(1,1,0)||=12(2)

    商品2和商品3的余弦相關(guān)系數(shù)為:

    (0,1,1)·(1,1,0)||(0,1,1)||||(1,1,0)||=12(3)

    由公式(1)-(3)可推導(dǎo)出:瀏覽商品1的顧客會被推薦購買商品3,而瀏覽商品2的顧客會被推薦購買商品3,瀏覽了商品3的會被推薦購買商品1(并由1推薦2)。該模型只使用了每對項目間的一個參數(shù)(余弦相關(guān)系數(shù))產(chǎn)生推薦。因此,如果有n個商品,則需要計算和存儲 n(n-1)/2次余弦相關(guān)系數(shù)[9-11]。

    2.2 算法實(shí)現(xiàn)

    根據(jù)上述關(guān)聯(lián)規(guī)則并進(jìn)行改進(jìn),建立基于用戶行為的關(guān)聯(lián)規(guī)則推薦算法[9-12],算法流程如圖1所示。

    2.2.1 用戶行為記錄庫建立

    實(shí)驗數(shù)據(jù)取5個用戶和15種讀物作為樣本。用戶編號為0-4,讀物編號為:0理想國、1論語、2英語、3悲慘世界、 4大學(xué)、5中庸、6大千世界、7數(shù)學(xué)、8地理、9物理、10生物、11化學(xué)、12國富論、13模電、14信號系統(tǒng)。用戶行為標(biāo)記:讀過標(biāo)記為1,沒有讀標(biāo)記為0。構(gòu)建用戶行為數(shù)據(jù)樣本庫如表2所示。

    2.2.2 運(yùn)算矩陣建立

    建立用戶-讀物矩陣A1,讀物和用戶編號為從0開始的整數(shù),橫向15個,為讀物編號。

    2.2.3 矩陣運(yùn)算假設(shè)有用戶U想讀理想國和論語,當(dāng)選擇了理想國和論語這兩個讀物后(編號為0和1),系統(tǒng)開始進(jìn)行推薦運(yùn)算:在運(yùn)算矩陣A2中取理想國和論語這兩個列,第0列和第1列,然后進(jìn)行&(and)運(yùn)算得到右邊的列(第3列,理想國&論語),見矩陣A3。第1行、第2行、第3行的值都為1,則代表這個編號為1、2、3的用戶(下標(biāo)從第0行開始計算)曾同時閱讀過理想國和論語,即用戶U的鄰居用戶集為U鄰居{用戶1,用戶2,用戶3}。endprint

    2.2.4 鄰域矩陣

    由用戶U的鄰居用戶集U鄰居可知,有相同閱讀記錄的用戶行為具有一定的相似性。只要能知道用戶1、2、3還閱讀了其它讀物,然后按閱讀比率進(jìn)行統(tǒng)計,就可給用戶U進(jìn)行有效推薦[13]。

    用戶1、2、3還閱讀了哪些讀物可由運(yùn)算矩陣A2推導(dǎo)得知,見矩陣A4, 矩陣的每一行代表每個用戶的讀物記錄。

    設(shè)矩陣A4這3行分別為 T1、T2、T3,進(jìn)行與運(yùn)算(or)后,可以得出用戶1、2、3閱讀行為相似性矩陣T=T1|T2|T3 ,求得T=[1 1 1 0 0 0 0 0 0 0 1 0 1 0 0],即閱讀行為相似性矩陣T代表這3個用戶都閱讀了哪些讀物。對照讀物編號表,這3個用戶閱讀了0理想國、1論語、2英語、10生物、12國富論。

    由運(yùn)算矩陣A3可知,用戶U已經(jīng)選擇了理想國和論語,即用戶U的行為矩陣A=[1 1 0 0 0 0 0 0 0 0 0 0 0 0 0],通過矩陣減法可得用戶U的鄰域矩陣L=T-A=[0 0 1 0 0 0 0 0 0 0 1 0 1 0 0]。

    2.2.5 推薦結(jié)果

    由鄰域矩陣L對照讀物編號可知:2英語、10生物、12國富論3本讀物都可以作為用戶U的推薦讀物,這些數(shù)據(jù)來源于3個用戶的閱讀記錄。根據(jù)運(yùn)算矩陣A4閱讀記錄(0英語,1論語),統(tǒng)計這些用戶(1,2,3)閱讀2英語、10國富論、12生物的百分比,再根據(jù)百分比的高低向用戶U列出3本讀物的推薦強(qiáng)度(強(qiáng)烈推薦、首要推薦、次要推薦),提出推薦的有效性。

    由運(yùn)算矩陣A4可知:

    (1)2英語在矩陣第3列上,所有的位置都為1,表示閱讀過英語的鄰居用戶占100%。

    (2)10生物在矩陣第11列上,3個中有2個位置為1,表示閱讀過生物的鄰居用戶占67%。

    (3)12國富論在矩陣第13列上,3個位置只有一個1,表示閱讀過國富論的鄰居用戶占33%。

    綜上最終給用戶U的推薦結(jié)果為:強(qiáng)烈推薦—2英語,首要推薦—10生物,次要推薦—12國富論。

    實(shí)驗仿真結(jié)果如圖2所示。

    3 算法總結(jié)

    基于用戶行為的關(guān)聯(lián)規(guī)則推薦算法是通過加權(quán)和對最鄰域運(yùn)算得出的推薦結(jié)果,可以根據(jù)系統(tǒng)要求來限定推薦條件,從而實(shí)現(xiàn)項目的推薦。從實(shí)驗仿真結(jié)果來看,該算法在一個中小型系統(tǒng)中應(yīng)用完全沒有問題,而且推薦結(jié)果有效性高。對一些大型的具有上千萬用戶的商業(yè)網(wǎng)站應(yīng)用,將一個用戶和其他所有用戶進(jìn)行比較,然后再對每位用戶行為進(jìn)行比較,會使系統(tǒng)負(fù)荷非常大,為解決這一問題,目前最好的方法是對相似度進(jìn)行離線計算[13-14]。在針對大規(guī)模樣本數(shù)據(jù)集進(jìn)行推薦時,基于項目進(jìn)行過濾的方式明顯要比基于用戶行為的過濾更快,但它有離線計算、維護(hù)項目相似度列表等系統(tǒng)開銷。從推薦的有效性來看,基于用戶行為的推薦優(yōu)勢更明顯。

    4 結(jié)語

    智能推薦系統(tǒng)是未來電子商務(wù)和社交網(wǎng)絡(luò)發(fā)展的必然需要[15]。本文介紹和分析了一些主流的推薦算法,比較分析了各自的優(yōu)缺點(diǎn),結(jié)合實(shí)際情況,闡述了推薦技術(shù)應(yīng)用和需要改進(jìn)的問題。本文實(shí)現(xiàn)了基于用戶行為的關(guān)聯(lián)規(guī)則算法的推薦系統(tǒng),將用戶的隱形購買或瀏覽行為應(yīng)用到推薦系統(tǒng)上。

    參考文獻(xiàn):

    [1] 夏培勇.個性化推薦中的協(xié)同過濾算法[D].青島:中國海洋大學(xué),2011.

    [2] 夏小伍.基于信任模型的協(xié)同過濾推薦算法的研究[D].合肥:中國科技大學(xué),2011.

    [3] 王偉軍,宋梅青.一種面向用戶偏好定向挖掘的協(xié)同過濾個性化推薦算法[J]. 現(xiàn)代圖書情報技術(shù),2014(6):25-30.

    [4] 張春生,圖雅,翁慧,等.基于電子商務(wù)同類商品的推薦算法研究[J].計算機(jī)技術(shù)與發(fā)展,2016(5):17-21.

    [5] 陳潔敏,湯庸,李建國,等.個性化推薦算法研究[J].華南師范大學(xué)學(xué)報:自然科學(xué)版,2014(9):8-13.

    [6] 榮輝桂,火生旭,胡春華,等.基于用戶相似度的協(xié)同過濾推薦算法[J].通信學(xué)報,2014(2):16-24.

    [7] 王冰怡,劉楊,聶長新,等.基于用戶興趣三維建模的個性化推薦算法[J].計算機(jī)工程,2015(1):65-70.

    [8] 曹斌,龔佼蓉,彭宏杰,等.基于用戶閱讀時間-頻次行為的書籍推薦方法[J].計算機(jī)科學(xué),2015(11):36-54.

    [9] 高山,劉煒,崔勇,等.一種融合多種用戶行為的協(xié)同過濾推薦算法[J].計算機(jī)科學(xué),2016(9):227-231.

    [10] 杜彥永.基于用戶行為協(xié)同過濾推薦算法[D]. 淮南:安徽理工大學(xué),2015.

    [11] 胡亞慧,李石君,余偉,等.基于時空感知的用戶角色推理[J].電子與信息學(xué)報,2016(3):517-522.

    [12] 任帥,王浙明,王明敏.基于用戶行為模型和蟻群聚類的協(xié)同過濾推薦算法[J].微型電腦應(yīng)用,2014(3):5-8.

    [13] 孟祥武,劉樹棟,張玉潔,等.社會化推薦系統(tǒng)研究[J].軟件學(xué)報,2015(6):1356-1372.

    [14] 趙海燕,侯景德,陳慶奎.結(jié)合時間權(quán)重與信任關(guān)系的協(xié)同過濾推薦算法[J].計算機(jī)應(yīng)用研究,2015(5):3565-3568.

    [15] 李鵬澎,肖如良,鄧新國,等.一種融合引力影響的新的矩陣分解推薦方法[J].小型微型計算機(jī)系統(tǒng),2015(4):696-700.endprint

    猜你喜歡
    用戶行為推薦系統(tǒng)關(guān)聯(lián)規(guī)則
    電力高校圖書館轉(zhuǎn)型智庫服務(wù)的研究
    基于用戶偏好的信任網(wǎng)絡(luò)隨機(jī)游走推薦模型
    社會化媒體用戶使用動機(jī)與行為探析
    基于個性化的協(xié)同過濾圖書推薦算法研究
    個性化推薦系統(tǒng)關(guān)鍵算法探討
    關(guān)聯(lián)規(guī)則,數(shù)據(jù)分析的一把利器
    數(shù)據(jù)挖掘在高校課堂教學(xué)質(zhì)量評價體系中的應(yīng)用
    新媒體用戶行為模式分析
    淺談Mahout在個性化推薦系統(tǒng)中的應(yīng)用
    關(guān)聯(lián)規(guī)則挖掘Apriori算法的一種改進(jìn)
    中國市場(2016年36期)2016-10-19 04:10:44
    吉首市| 阳谷县| 阿尔山市| 灵山县| 商水县| 无为县| 吴江市| 出国| 错那县| 奎屯市| 增城市| 望江县| 静安区| 革吉县| 荣昌县| 永州市| 长顺县| 游戏| 嘉荫县| 铜陵市| 奉化市| 瓦房店市| 巴马| 湘乡市| 田东县| 扎兰屯市| 牙克石市| 东海县| 万州区| 万安县| 个旧市| 信阳市| 体育| 当阳市| 普陀区| 大同市| 长乐市| 辰溪县| 鄱阳县| 老河口市| 元江|