安政磊++姚文斌
摘要:伴隨隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,020餐飲領(lǐng)域發(fā)展迅速,然而平臺(tái)同質(zhì)化嚴(yán)重,個(gè)性化推薦已經(jīng)成為提升用戶體驗(yàn)和提高運(yùn)營水平的一種主要方式。而傳統(tǒng)的協(xié)同過濾方法在數(shù)據(jù)稀疏的情況下,用戶推薦準(zhǔn)確率不高。本文研究基于020餐飲行業(yè)背景,研究用戶的行為對(duì)購買意向的影響,綜合考慮購買行為、評(píng)價(jià)行,為等多種用戶行為,判斷用戶的興趣點(diǎn),從而確定用戶的購買意向,提出一種基于多種用戶行為的購買意向模型?;诖颂岢龌谫徺I意向的推薦方法。最后通過與傳統(tǒng)基于用戶的協(xié)同過濾算法進(jìn)行比較,確定了本文推薦方法的有效性。
關(guān)鍵詞:行為分析;個(gè)性化推薦;協(xié)同過濾;推薦模型
中圖分類號(hào):TP391.3
文獻(xiàn)標(biāo)識(shí)碼:A
DOI:10.3969/j.issn.1003-6970.2015.12.019
本文著錄格式:安政磊,姚文斌.一種基于用戶購買意向的個(gè)性化推薦模型[J].軟件,2015,36(12):80-82
0 引言
近兩年來,隨著瓦聯(lián)網(wǎng)的發(fā)展,020餐飲領(lǐng)域已經(jīng)成為一種重要的商務(wù)模式。在豐要大城市中迅速的擴(kuò)展開來。與此同時(shí),其中的推薦系統(tǒng)卻沒有跟隨發(fā)展,多數(shù)平臺(tái)還停留在用戶豐動(dòng)獲取商品信息的時(shí)代。這些平臺(tái)同質(zhì)化嚴(yán)重,全都標(biāo)榜以用戶為中心,然而由于原始的建站思路,并沒有完全應(yīng)用好快速發(fā)展的計(jì)算機(jī)技術(shù),導(dǎo)致發(fā)展上的瓶頸。
各種推薦系統(tǒng)層出不窮,推薦機(jī)制復(fù)雜多變。協(xié)同過濾算法已經(jīng)被廣泛的應(yīng)用到各個(gè)推薦系統(tǒng),但隨著用戶數(shù)量的增加和站點(diǎn)內(nèi)容結(jié)構(gòu)的日益復(fù)雜,協(xié)同過濾技術(shù)的一些缺點(diǎn)逐漸暴露出來,首要問題就是稀疏性,隨著用戶和項(xiàng)目的數(shù)量的增長,用戶相似性矩陣也會(huì)急劇擴(kuò)大。在維度巨大的相似矩陣并且用戶參與度不是很頻繁的情況下,推薦的可信度隨之降低。
目前多數(shù)協(xié)同算法研究和應(yīng)用都集中在傳統(tǒng)的電子商務(wù),對(duì)于基于餐飲行業(yè)的協(xié)同過濾算法的推薦研究較少。協(xié)同過濾算法的研究目標(biāo)豐要是商品。本文針對(duì)餐飲行業(yè)的特點(diǎn),研究的豐要原子單位是餐廳,考慮不同用戶行為對(duì)用戶的購買意向的影響,基于用戶的購買意向設(shè)計(jì)推薦算法,提高推薦準(zhǔn)確率。
1 用戶行為的研究分析
1.1 購買行為分析
相交于傳統(tǒng)電子商務(wù)的購買數(shù)據(jù),020餐飲行業(yè)的購買行為確實(shí)不少,但是對(duì)于準(zhǔn)確的分析用戶購買意向和購買行為之間的關(guān)系這項(xiàng)復(fù)雜的工作來說,在數(shù)量上還是有一定差距。而用戶的購買行為是用戶對(duì)某商品研究的結(jié)果,因此,用戶必然在前期進(jìn)行過一系列與該商品相關(guān)的用戶瀏覽行為,可見用戶的購買行為還和用戶的瀏覽行為緊密相關(guān)。為此需要建立基于PV興趣統(tǒng)計(jì)出的用戶購買行為模型,基于用戶的興趣發(fā)現(xiàn)用戶的購買意向。分析步驟如下:
Stepl:根據(jù)日志文件中瀏覽記錄的定義找到所有餐廳訪問的記錄,過濾沒有餐廳的瀏覽記錄。同時(shí),從數(shù)據(jù)庫獲取用戶的購買記錄。這兩種記錄作為本次分析的依據(jù)。
Step2:針對(duì)以上數(shù)據(jù),統(tǒng)計(jì)每個(gè)餐廳的訪問次數(shù)和購買次數(shù)。兩種數(shù)據(jù)對(duì)用戶的購買意向的影響的程度顯然不同,為了融合兩種數(shù)據(jù),為購買數(shù)據(jù)進(jìn)行加權(quán)分析,餐廳的購買數(shù)據(jù)加倍,將數(shù)據(jù)整合在一起。
Step3:根據(jù)商品的被訪問時(shí)間和餐廳商品數(shù)量,來確定用戶對(duì)某商品的購買意向。公式如1-1所示。
ti表示用戶瀏覽餐廳時(shí)間,Ci表示餐廳的商品數(shù)量。而現(xiàn)在多數(shù)平臺(tái)還有其他查看商品的具體信息的彈出框頁面以及能夠查看單獨(dú)商品評(píng)價(jià)和評(píng)分信息等。但是這些信息不具有代表性,所以行為分析時(shí)也對(duì)這些行為進(jìn)行忽略。
1.2 評(píng)價(jià)行為分析
評(píng)價(jià)行為是用戶購買意向的直接反饋,不僅是對(duì)本次購物感受的表達(dá),還能夠據(jù)此對(duì)用戶未來的購買意向作出判斷??梢酝ㄟ^對(duì)用戶評(píng)價(jià)的情感分析,獲取用戶的購買意向。
Stepl:建立基本語料庫,選取常見情感表達(dá)詞語,根據(jù)知網(wǎng)的基礎(chǔ)語料分析庫,將這些情感表達(dá)詞語分別按照褒義詞和貶義詞的分別放到positive和negative兩個(gè)集合中。
Step2:短語或句子分詞。對(duì)于020餐飲行業(yè)來說,這個(gè)領(lǐng)域內(nèi)的表達(dá)情感的詞語是有限的,且本文只針對(duì)用戶的感情詞匯進(jìn)行處理。這樣對(duì)評(píng)價(jià)樣本進(jìn)行分詞,達(dá)到能夠滿足區(qū)分用戶情感趨向的程度。采用字符匹配算法來進(jìn)行分詞。
Step3:詞語分類。為了構(gòu)造用戶評(píng)論的短語模型,需要對(duì)分詞進(jìn)行詞性分析,明確評(píng)價(jià)信息中的名詞、形容詞等詞性區(qū)別。
Step4:構(gòu)造評(píng)價(jià)內(nèi)容的短語模型。
Step5:計(jì)算短語的情感值。采用統(tǒng)計(jì)學(xué)方法,計(jì)算一個(gè)短語模型在positive和negative集合中的文本出現(xiàn)次數(shù),分別結(jié)尾GNumber和BNumber。情感值計(jì)算公式1-2所示。
Step6:根據(jù)用戶評(píng)價(jià)內(nèi)容分詞,采用單詞匹配分析算法,按照公式1-3計(jì)算整個(gè)評(píng)價(jià)內(nèi)容的購買意向值。
2 基于購買意向的推薦模型
2.1 購買意向模型
對(duì)用戶行為進(jìn)行分析,根據(jù)上節(jié)所述的用戶購買意向和用戶的購買行為以及用戶購買意向和評(píng)價(jià)行為的關(guān)系計(jì)算用戶的總體購買意向值。需要分別計(jì)算每個(gè)用戶對(duì)每個(gè)餐廳的購買意向值并求意向值之和,意向值之和定義為T。
T-upi+S
(1-4)
將購買意向值T作為計(jì)算用戶相似度的指標(biāo)。
2.2 基于購買意向的推薦模型
基于用戶購買意向模型中用戶購買意向的變化,構(gòu)建基于購買意向的推薦模型。
(1)循環(huán)更新待推薦用戶的購買意向值。
循環(huán)所有餐廳,通過購買行為計(jì)算當(dāng)前用戶u對(duì)第i個(gè)餐廳的購買意向度定義為Tupi(u,i),通過用戶評(píng)論計(jì)算出當(dāng)前用戶u對(duì)第i個(gè)餐廳的購買意向值Ts(u,i),計(jì)算用戶對(duì)該餐廳的購買意向總和,記為T(u),更新當(dāng)前用戶u對(duì)該餐廳的購買意向值。
(2)選擇該用戶u的購買意向最強(qiáng)的10個(gè)餐廳作為用戶u的向量。作為和其他用戶進(jìn)行比較相似度的來源。采用余弦相似度進(jìn)行用戶相似度的比較,選擇m個(gè)相似用戶,根據(jù)普通協(xié)同過濾算法,根據(jù)待選集合中用戶對(duì)餐廳的購買意向,得到中間推薦結(jié)果L1。
(3)對(duì)于選擇出來的10個(gè)餐廳,從高到低分別附上10到1之間的權(quán)重,根據(jù)數(shù)據(jù)庫內(nèi)定的餐廳類別進(jìn)行如下分析:1)統(tǒng)計(jì)每個(gè)類別的餐廳個(gè)數(shù);2)將每個(gè)類別餐廳的個(gè)數(shù)和每個(gè)類別中權(quán)值最大的餐廳的權(quán)值相乘得到各個(gè)類別的一個(gè)值;3)在該類別中選擇2k個(gè)同類餐廳作為中間推薦結(jié)果L:
(4)將中間推薦結(jié)果L1和L2求交運(yùn)算,當(dāng)最終結(jié)果不到k個(gè)時(shí),從L2剩余結(jié)果中在隨機(jī)補(bǔ)選兒個(gè),得到k個(gè)最終推薦結(jié)果
3 實(shí)驗(yàn)對(duì)比分析
3.1 實(shí)驗(yàn)對(duì)比標(biāo)準(zhǔn)
本文的豐要目的是為了完成用戶的推薦工作。針對(duì)推薦工作,有常用的兩個(gè)評(píng)價(jià)于段,分別是召回率(3-1)和準(zhǔn)確率(3-2)。
其中Tn代表數(shù)據(jù)集合中用戶u喜歡的物品的集合,Rn代表向用戶推薦的物品集合。
3.2 實(shí)驗(yàn)分析
根據(jù)以上模型和算法步驟,根據(jù)用戶日志文件和后臺(tái)數(shù)據(jù)庫提供數(shù)據(jù),設(shè)置取相似用戶數(shù)量取值范圍為[50,100],實(shí)驗(yàn)結(jié)果如圖l所示。
實(shí)驗(yàn)結(jié)果表明,基于用戶協(xié)同過濾算法和購買意向模型差距不是十分大,在開始時(shí)兩者兒乎準(zhǔn)確率同等大小。并且隨著召回率的增加,兩者的準(zhǔn)確率都在降低。區(qū)別是基于用戶的協(xié)同過濾算法在開始時(shí)下降明顯,而后者下降不是很明顯,出現(xiàn)這樣情況的原因可能是,基于購買意向模型的推薦算法綜合考慮了用戶的購買行為、瀏覽行為、評(píng)價(jià)行為對(duì)用戶的購買意向的影響,從而能夠比基于用戶的協(xié)同過濾算法在推薦任務(wù)上完成地稍微好一點(diǎn)。
4 結(jié)論
協(xié)同過濾技術(shù)已經(jīng)被廣泛應(yīng)用,但有很多還停留在最簡單的基于用戶的協(xié)同過濾,隨著用戶行為種類和數(shù)量的不斷增多,這些隱藏的行為比顯示的行為提供更多有關(guān)用戶購買意向的信息,然而很多現(xiàn)有的用戶網(wǎng)絡(luò)行為卻被推薦系統(tǒng)忽視。針對(duì)以上問題,本文從用戶行為角度出發(fā),并且抓住常見的隱式行為,分析用戶行為和用戶購買意向的關(guān)系,進(jìn)而根據(jù)用戶行為建立用戶行為和用戶購買意向的整合模型,根據(jù)這個(gè)模型設(shè)計(jì)出一套用戶推薦算法,經(jīng)實(shí)驗(yàn)證實(shí),該方法雖不能極大提高推薦效果,但確實(shí)在某些情況下提高了召回率和準(zhǔn)確率,為了更好地優(yōu)化推薦效果,還應(yīng)該繼續(xù)研究基于用戶行為的購買意向的優(yōu)化計(jì)算方法。