[摘 要] 電子商務(wù)個性化推薦系統(tǒng)是客戶關(guān)系管理的重要內(nèi)容。在分析現(xiàn)有電子商務(wù)推薦系統(tǒng)不足的基礎(chǔ)上,設(shè)計一種基于協(xié)同過濾的智能商務(wù)推薦系統(tǒng)。為客戶快捷便利地尋找到所需的商品信息,推薦合理的商品,實現(xiàn)客戶與商家的共贏。
[關(guān)鍵詞] 電子商務(wù);推薦系統(tǒng);協(xié)同過濾
[中圖分類號]F724.6[文獻(xiàn)標(biāo)識碼]A[文章編號]1673-0194(2008)21-0096-03
1 引 言
隨著電子商務(wù)的蓬勃發(fā)展,各大電子商務(wù)都在不斷推出各種商品, 電子商務(wù)網(wǎng)站為用戶提供的商品也越來越多,以滿足龐大客戶群的不同需求。然而,面對如此龐大而又需求迥異的客戶群,如何定位新產(chǎn)品的目標(biāo)市場并據(jù)此進(jìn)行更有效的市場營銷活動,同時提高服務(wù)效率和客戶滿意度,是電子商務(wù)著重關(guān)注的問題。電子商務(wù)將面臨前所未有的嚴(yán)峻考驗。
在這種情況下,電子商務(wù)個性化推薦系統(tǒng)應(yīng)運而生,它是根據(jù)用戶的興趣愛好,推薦符合用戶興趣愛好的產(chǎn)品,幫助用戶找到所需的商品。推薦系統(tǒng)作為能夠較好實現(xiàn)個性化服務(wù)的工具,不僅在科技文獻(xiàn)檢索等領(lǐng)域應(yīng)用甚廣,也同樣可以引入電子商務(wù)系統(tǒng),根據(jù)電子商務(wù)商品的特點,實現(xiàn)在線產(chǎn)品推薦,既可有效降低產(chǎn)品推廣成本,增大產(chǎn)品推薦成功率,同時還可以實現(xiàn)個性化服務(wù),提高客戶滿意度。有研究表明,在基于電子商務(wù)的銷售行業(yè)使用個性化推薦系統(tǒng)后,企業(yè)的銷售額將提高2%~8%[1]。
2 推薦系統(tǒng)與推薦算法簡介
電子商務(wù)推薦系統(tǒng)的定義為:“利用電子商務(wù)網(wǎng)站向客戶提供商品信息和建議,幫助用戶決定購買什么產(chǎn)品,模擬銷售人員幫助客戶完成購買過程”[1]。
推薦系統(tǒng)在電子商務(wù)活動中的作用包括[2]:
(1)幫助用戶檢索有用信息。
(2)促進(jìn)交叉銷售和向上銷售(提供客戶所追求的更好的商品或服務(wù)) 。
(3)提供個性化服務(wù)。
(4)提高客戶忠誠度。
2. 1協(xié)同過濾推薦算法
協(xié)同過濾技術(shù)是目前電子商務(wù)網(wǎng)站使用較多的一種推薦系統(tǒng)技術(shù),它不需要分析項目內(nèi)容,因為系統(tǒng)可以根據(jù)與使用者有相同興趣的社群成員曾利用的信息服務(wù)來作推薦;也就是說,它是依據(jù)其他成員的意見來為其目標(biāo)用戶推薦產(chǎn)品,因此推薦的產(chǎn)品可能與使用者從前的愛好大不相同,但是卻能挖掘出用戶的潛在需要,甚至是將瀏覽者變?yōu)榉?wù)利用者。協(xié)同過濾的優(yōu)勢是可以推薦新異商品,進(jìn)行興趣的發(fā)現(xiàn),它不需要領(lǐng)域知識,能進(jìn)行跨類型推薦,自適應(yīng)比較好,自動化程度也比較高[3]。
由于電子商務(wù)產(chǎn)品分類較明顯,且用戶經(jīng)常會對特定的一些商品感興趣,因此本模型中采用基于項目的協(xié)同過濾推薦算法。Item - based協(xié)同過濾算法是根據(jù)計算目標(biāo)項目和已評價項目的相似性,已相似度作為權(quán)重加權(quán)各已評價項目的評分得到預(yù)測項目預(yù)測值。它基于這樣一個假設(shè)[4]:如果用戶對一些項目的評分比較相似,則他們對其他項目的評分也比較相似,即一個用戶將更會喜歡那些和他已經(jīng)購買的項目相似的項目。相應(yīng)的,Item - based協(xié)同過濾推薦算法可以劃分為如下3個階段:
(1)數(shù)據(jù)表示:對用戶已經(jīng)購買過的商品進(jìn)行建模,從而可以有效度量項目之間的相似性。
(2)最近鄰查詢:搜索項目的最近鄰居。
(3)推薦產(chǎn)生:根據(jù)最近鄰居對給定項目上的評分值,預(yù)測對給定項目評分的預(yù)測,產(chǎn)生top - N商品推薦。
2. 2協(xié)同過濾推薦算法面臨的主要問題
隨著系統(tǒng)中用戶數(shù)目和商品數(shù)目的日益增加,系統(tǒng)結(jié)構(gòu)、內(nèi)容的復(fù)雜度日漸增強(qiáng),推薦算法也面臨一系列挑戰(zhàn):
(1)最初評價問題[5]:在協(xié)同過濾早期,系統(tǒng)中幾乎沒有任何用戶相關(guān)的評價信息,或是用戶的評價信息很少,那么在這個時候,由于系統(tǒng)沒有包含足夠的用戶偏好信息,無法形成鄰居群,因此就無法進(jìn)行推薦。
(2)用戶評分?jǐn)?shù)據(jù)的極端稀疏性:隨著系統(tǒng)規(guī)模的擴(kuò)大,用戶數(shù)目和項數(shù)目指數(shù)級增長,導(dǎo)致用戶評分?jǐn)?shù)據(jù)極端稀疏。在用戶評分?jǐn)?shù)據(jù)極端稀疏的情況下,協(xié)同過濾推薦算法無法對某些用戶產(chǎn)生任何推薦。同時,推薦算法的推薦精度也顯著下降。
(3)推薦算法的伸縮能力和實時性要求:最近鄰搜索的時間代價隨著用戶數(shù)量和項目數(shù)量的增加而急劇增加。推薦算法的推薦精度和伸縮能力是一對矛盾。一般而言,推薦算法產(chǎn)生推薦的時間越少,算法的伸縮能力越強(qiáng),但其推薦精度越低。
(4)可擴(kuò)展性:系統(tǒng)中用戶的增長和內(nèi)容的大量增加帶來的計算代價的復(fù)雜度不是線性的,很難滿足基于Web的推薦系統(tǒng)的實時性要求。
設(shè)計推薦算法需要同時考慮上述因素,在推薦算法的具體設(shè)計和實現(xiàn)上,以協(xié)同過濾技術(shù)為主,結(jié)合其他數(shù)據(jù)挖掘技術(shù)克服其缺陷,為用戶提供實時且精確的推薦。
3 電子商務(wù)推薦系統(tǒng)建模
3. 1用戶興趣信息的收集
通常的推薦系統(tǒng)都是建立在B/S模式下基于用戶行為產(chǎn)生的具有針對性的信息推送系統(tǒng),典型如基于Internet的各大電子商務(wù)網(wǎng)站,根據(jù)用戶點擊行為推測用戶偏好,從而在用戶瀏覽的過程中直接進(jìn)行產(chǎn)品推薦服務(wù)。因此基于Internet的推薦系統(tǒng)一般會根據(jù)用戶的瀏覽歷史、點擊行為以及購買記錄等來推測用戶行為和偏好,對于電子商務(wù)商品推薦而言,點擊、瀏覽等事件的發(fā)生相對較多,因此,客戶偏好的獲取一般包括兩種方式:①用戶主動描述:用戶主動描述是根據(jù)客戶本身的屬性:包括客戶的年齡、身份、婚姻狀況、所處行業(yè)、所任職位等,可以據(jù)此推測客戶可能產(chǎn)生的一些需求,從而及時為客戶提供服務(wù)。例如,適婚年齡的人很可能需要住房貸款、汽車貸款,有到了上大學(xué)年齡孩子的家庭很可能需要助學(xué)貸款。②用戶行為學(xué)習(xí):用戶行為學(xué)習(xí)則是從用戶以前訪問過的文檔集合以及訪問路徑中學(xué)習(xí)用戶的興趣特征。例如,客戶購買產(chǎn)品的刷卡記錄盡管不包括購買產(chǎn)品的具體種類、名稱,但是卻清楚地記錄著客戶刷卡的地點和金額,由此可以在一定程度上推測用戶的類型,及其消費水平和消費偏好。
綜上所述,因為電子商務(wù)推薦系統(tǒng)產(chǎn)生的推薦結(jié)果需要直接傳遞到客戶手中,所以電子商務(wù)推薦系統(tǒng)在系統(tǒng)架構(gòu)上要充分考慮上述因素,以協(xié)同過濾算法為主,為了克服協(xié)同過濾技術(shù)的缺陷,同時選擇合適的數(shù)據(jù)挖掘算法,以起到協(xié)助滿足客戶需求、更好地為客戶服務(wù)、發(fā)掘潛在客戶的作用。
3. 2基于協(xié)同過濾的電子商務(wù)推薦系統(tǒng)建模
電子商務(wù)推薦系統(tǒng)的基本功能為:分析顧客以往的行為,建立表示顧客行為的模型,并利用模型模擬商店銷售人員向用戶提供商品推薦,幫助用戶找到所需商品,從而順利完成購買過程。由此,要完成商品推薦,推薦系統(tǒng)需要知道用戶的興趣、偏好和訪問模式等信息。而在電子商務(wù)環(huán)境下,一方面商品的種類、數(shù)量會不斷地變化,另一方面用戶的興趣、瀏覽行為也是動態(tài)變化的。因此,電子商務(wù)推薦系統(tǒng)要具有較強(qiáng)的自適應(yīng)性。本文基于協(xié)同過濾和數(shù)據(jù)挖掘的思想,構(gòu)建基于協(xié)同過濾的電子商務(wù)系統(tǒng)如圖1所示。
本系統(tǒng)由用戶偏好信息庫、數(shù)據(jù)轉(zhuǎn)換模塊、用戶對項目評價信息庫、數(shù)據(jù)挖掘技術(shù)模塊、協(xié)同過濾技術(shù)模塊和生成推薦列表模塊組成,其功能描述如下:
(1)用戶偏好信息庫:用戶偏好信息庫是實現(xiàn)推薦系統(tǒng)的一個重要數(shù)據(jù)源,它自動記錄了顧客在購買過程中對網(wǎng)站的所有的瀏覽行為。包括以下信息:IP地址、請求時間、被請求文件的URL、HTTP版本號、返回碼和代理等。它定期地對Web服務(wù)器中的日志文件的內(nèi)容進(jìn)行采集和處理,更新用戶興趣信息庫的內(nèi)容,供數(shù)據(jù)轉(zhuǎn)換模塊使用。
(2)數(shù)據(jù)轉(zhuǎn)換模塊:負(fù)責(zé)從用戶偏好信息庫中提取、分解、合并相關(guān)的數(shù)據(jù),并進(jìn)行格式轉(zhuǎn)換,建立和維護(hù)數(shù)據(jù)集市、供數(shù)據(jù)挖掘算法模塊使用,為實現(xiàn)推薦任務(wù)提供必要的數(shù)據(jù)。
(3)數(shù)據(jù)挖掘技術(shù)模塊:根據(jù)顧客的需求、顧客偏好、產(chǎn)品關(guān)聯(lián)規(guī)則,并采用關(guān)聯(lián)規(guī)則算法對顧客購買行為或訪問行為的分析,為顧客提供個性化的產(chǎn)品推薦列表。
(4)用戶對項目評價信息庫:它記錄了顧客在購買過程中對已購買商品的評價值,形成用戶/項目評價矩陣,通??梢员硎緸橐粋€m×n的矩陣,即項目評估矩陣R,m為用戶數(shù),n是項數(shù),rij是第i個用戶對第j項的評估數(shù)值,如表1所示。
(5)協(xié)同過濾技術(shù)模塊:自主地接收用戶對項目評價信息庫的數(shù)據(jù),利用協(xié)同過濾算法尋找與目標(biāo)用戶有相同喜好的鄰居,然后根據(jù)目標(biāo)用戶的鄰居的偏好產(chǎn)生向目標(biāo)客戶的推薦,產(chǎn)生推薦列表。
(6)生成推薦列表模塊:為了提高推薦系統(tǒng)的推薦精度,本文將協(xié)同過濾技術(shù)和數(shù)據(jù)挖掘技術(shù)相結(jié)合,且以協(xié)同過濾技術(shù)為主,數(shù)據(jù)挖掘技術(shù)為輔。此模塊主要任務(wù)是接收協(xié)同過濾技術(shù)模塊和數(shù)據(jù)挖掘技術(shù)模塊產(chǎn)生的推薦列表,并將推薦列表以Web頁面和電子郵件的形式推薦給顧客。
3. 3推薦系統(tǒng)工作流程
當(dāng)用戶登錄電子商務(wù)網(wǎng)站時,推薦系統(tǒng)會識別客戶的身份信息(會員、游客)、訪問序列等信息,將用戶的標(biāo)志信息和推薦請求傳遞給用戶偏好信息庫和用戶對項目評價信息庫。①如果是未注冊的普通用戶,則系統(tǒng)還沒有用戶的有關(guān)信息,因而用戶偏好信息庫將收集顧客的基本特征及偏好信息,得到有關(guān)的用戶信息后,存儲在用戶偏好信息庫中。②如果用戶為注冊用戶,則系統(tǒng)中已存儲顧客的購買行為、偏好等信息,從而數(shù)據(jù)挖掘模塊和協(xié)同過濾模塊會根據(jù)用戶的推薦歷史信息、購買行為等信息,分別采用協(xié)同過濾算法和關(guān)聯(lián)規(guī)則算法協(xié)同為顧客進(jìn)行推薦服務(wù)。為了解決新商品推出時, 協(xié)同過濾算法中的冷起動將導(dǎo)致推薦系統(tǒng)不能推薦新商品的問題,本文采用關(guān)聯(lián)規(guī)則算法,根據(jù)產(chǎn)品屬性先將其進(jìn)行類別匹配,然后根據(jù)同類商品的目標(biāo)客戶,確定該新產(chǎn)品的目標(biāo)客戶; 另一方面可以根據(jù)不同商品交易歷史進(jìn)行產(chǎn)品組合分析,從而進(jìn)一步提高推薦精度。
用戶偏好信息庫和用戶對項目評價信息庫隨時監(jiān)聽用戶信息的變化或數(shù)據(jù)倉庫中顧客行為數(shù)據(jù)的變化,追蹤客戶偏好的變化,及時地更新客戶的個人偏好信息,以使推薦系統(tǒng)的推薦結(jié)果能真實地反映用戶最新的偏好。
4 結(jié)束語
在當(dāng)今電子商務(wù)飛速發(fā)展的過程中,設(shè)計與開發(fā)個性化推薦系統(tǒng)對提高電子商務(wù)的效率具有十分重要的價值。利用推薦系統(tǒng),電子商務(wù)網(wǎng)站一方面可以在現(xiàn)有客戶中及時發(fā)現(xiàn)其他產(chǎn)品的潛在客戶,有效地進(jìn)行一對一營銷,當(dāng)客戶屬性發(fā)生變化時,也可以及時發(fā)現(xiàn)其新的需求,主動服務(wù),同時可以根據(jù)現(xiàn)有客戶屬性,尋找市場上具有相似需求的客戶,積極開拓新市場;另一方面,根據(jù)客戶需求進(jìn)行進(jìn)一步的市場細(xì)分,有針對性地推出更能滿足客戶需求的新商品,實現(xiàn)客戶與商家雙贏。
主要參考文獻(xiàn)
[1] P Resnick,N R Varian. Recommender System[J]. Communication of the ACM,1997,40 (3): 56-58.
[2] J B Schafer,J A Kosntan,I J Ried. E-commerce Recommendation Application[J]. Data Mining and Knowledge Discovery,2001,10(8):68-70.
[3] 黎星星. 電子商務(wù)推薦系統(tǒng)研究[J]. 計算機(jī)工程與科學(xué),2004,26(5):7-10.
[4] B Swawar,G Karypis,J Konstan,et al. Item-based Collaborative Filtering Recommendation Algorithms[C]// Proceedings of the Tenth International World Wide Web Conference,2001:283-295.
[5] J L Herlocker,J A Konstan,L G Terveen. Evaluating Collaborative Filtering Recommendation System[J]. ACM Trans actions on Information System,2004,22(1):5-53.