姚 凱,涂 平,陳宇新,蘇 萌
1 中央財(cái)經(jīng)大學(xué) 商學(xué)院,北京 100081 2 北京大學(xué) 光華管理學(xué)院,北京 100871 3 上海紐約大學(xué) 商學(xué)部,上海 200122 4 北京百分點(diǎn)信息科技有限公司,北京 100101
探究基于多源大數(shù)據(jù)的個(gè)性化推薦系統(tǒng)對(duì)消費(fèi)者購物行為的影響。為了建立推薦系統(tǒng)與消費(fèi)者購物行為之間的因果關(guān)系,采用實(shí)地實(shí)驗(yàn)有效地避免傳統(tǒng)研究方法存在的內(nèi)生性問題,并具有較好的外部有效性。一方面,基于內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)構(gòu)造解釋性變量,探究?jī)?nèi)部數(shù)據(jù)特征和外部數(shù)據(jù)特征與推薦效果之間的關(guān)系;另一方面,通過檢驗(yàn)消費(fèi)者特征與內(nèi)外部數(shù)據(jù)的推薦效果間的交互效應(yīng),進(jìn)一步分析外部數(shù)據(jù)和內(nèi)部數(shù)據(jù)的推薦效果如何隨消費(fèi)者的特征變化,幫助企業(yè)更好地利用多源大數(shù)據(jù)提升推薦效果。
研究結(jié)果表明,基于內(nèi)部數(shù)據(jù)的推薦系統(tǒng)能夠顯著提升消費(fèi)者點(diǎn)擊個(gè)性化推薦商品的概率,可以降低消費(fèi)者決策時(shí)間,激勵(lì)消費(fèi)者瀏覽更多的商品。外部數(shù)據(jù)的推薦效果不僅與外部公司網(wǎng)站的用戶數(shù)量相關(guān),也會(huì)受到外部網(wǎng)站與當(dāng)前網(wǎng)站的關(guān)聯(lián)程度的影響。消費(fèi)者特征對(duì)基于內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)的推薦效果起調(diào)節(jié)作用,如果消費(fèi)者是當(dāng)前網(wǎng)站的老用戶,利用該消費(fèi)者在當(dāng)前網(wǎng)站的內(nèi)部數(shù)據(jù)提供個(gè)性化推薦的效果更佳。
通過分析基于多源大數(shù)據(jù)的推薦效果對(duì)消費(fèi)者購物行為的影響,進(jìn)一步完善個(gè)性化推薦領(lǐng)域的理論框架。研究結(jié)果對(duì)如何利用多源數(shù)據(jù)構(gòu)建更加有效的推薦系統(tǒng)具有重要指導(dǎo)價(jià)值,并為不同網(wǎng)站之間的數(shù)據(jù)共享機(jī)制提供重要的管理建議。
個(gè)性化推薦系統(tǒng)已成為各大電商平臺(tái)向消費(fèi)者提供個(gè)性化購物體驗(yàn)的重要工具之一,超過77%的電商平臺(tái)會(huì)對(duì)消費(fèi)者的歷史信息進(jìn)行分析,估計(jì)消費(fèi)者購物偏好并提供個(gè)性化推薦服務(wù)[1]。電商通過個(gè)性化推薦系統(tǒng),一方面可以提高消費(fèi)者的轉(zhuǎn)化率,另一方面能夠提升消費(fèi)者滿意度和忠誠度[2-3]。大數(shù)據(jù)時(shí)代,消費(fèi)者除在當(dāng)前網(wǎng)站上的消費(fèi)信息外,可能在其他網(wǎng)站也存在大量購物信息。特別是當(dāng)新的消費(fèi)者在當(dāng)前網(wǎng)站上沒有任何歷史信息時(shí),他們?cè)谄渌W(wǎng)站的偏好信息就顯得尤為重要[4]。即便消費(fèi)者在當(dāng)前網(wǎng)站沒有歷史數(shù)據(jù),電商也可以利用他們?cè)谄渌W(wǎng)站的數(shù)據(jù)估計(jì)消費(fèi)者購物偏好,提高當(dāng)前網(wǎng)站推薦商品的準(zhǔn)確性。
然而,由于電商之間存在相互競(jìng)爭(zhēng)或需要保護(hù)用戶隱私,外部電商通常不愿意將消費(fèi)者的數(shù)據(jù)分享給當(dāng)前電商。就本研究所了解的,目前還沒有利用消費(fèi)者在其他電商的網(wǎng)購數(shù)據(jù)為當(dāng)前電商網(wǎng)站提供個(gè)性化推薦的實(shí)證研究。本研究主要探討一種新型的推薦系統(tǒng)對(duì)消費(fèi)者購物行為的影響效果,該系統(tǒng)能夠使用消費(fèi)者在當(dāng)前電商網(wǎng)站的內(nèi)部數(shù)據(jù)(簡(jiǎn)稱內(nèi)部數(shù)據(jù))和其他電商網(wǎng)站的外部數(shù)據(jù)(簡(jiǎn)稱外部數(shù)據(jù)),為他們?cè)诋?dāng)前網(wǎng)站購物過程中提供個(gè)性化商品推薦服務(wù)。本研究通過實(shí)地實(shí)驗(yàn)探索該推薦系統(tǒng)對(duì)消費(fèi)者購物行為的影響,可以有效地避免傳統(tǒng)研究方法存在的內(nèi)生性問題以及缺乏外部有效性的缺點(diǎn)[5]。該研究基于消費(fèi)者在當(dāng)前網(wǎng)站和外部網(wǎng)站的多源大數(shù)據(jù)進(jìn)行建模分析,不但能夠探究?jī)?nèi)部數(shù)據(jù)和外部數(shù)據(jù)中影響推薦效果的主要因素,而且完善了推薦系統(tǒng)如何影響消費(fèi)者購買過程的理論體系,相關(guān)結(jié)論對(duì)電商的個(gè)性化營(yíng)銷和公司間制定數(shù)據(jù)共享策略具有重要的指導(dǎo)意義。
本研究探討的個(gè)性化商品推薦屬于個(gè)性化營(yíng)銷的研究范疇,已有大量關(guān)于個(gè)性化營(yíng)銷的研究主要關(guān)注公司與消費(fèi)者之間個(gè)性化互動(dòng)的效果。ANSARI et al.[6]提出一種優(yōu)化方法對(duì)郵件的布局和內(nèi)容進(jìn)行個(gè)性化變化,以提高消費(fèi)者點(diǎn)擊郵件中鏈接的概率;SIMESTER et al.[7]研究發(fā)現(xiàn),發(fā)送郵件的頻率對(duì)點(diǎn)擊率的影響隨消費(fèi)者特征的不同而發(fā)生變化;SAHNI et al.[8]發(fā)現(xiàn),促銷郵件確實(shí)能夠提高消費(fèi)者的總消費(fèi)金額,但大部分的收入不是來自促銷券,而是由于促銷郵件為公司產(chǎn)品起到了一種廣告效果,進(jìn)而提高了消費(fèi)者的消費(fèi)金額。與個(gè)性化郵件類似,在線精準(zhǔn)廣告也主要是通過分析消費(fèi)者數(shù)據(jù),為他們推送個(gè)性化的廣告,以吸引他們打開廣告鏈接并跳轉(zhuǎn)到對(duì)應(yīng)的網(wǎng)站去購買產(chǎn)品或者服務(wù)[9-10]。廣告主可以將消費(fèi)者的行為數(shù)據(jù)或者商品信息整合到個(gè)性化廣告系統(tǒng)中,提升廣告效果[11]。商家不僅可以通過在一個(gè)網(wǎng)站上打廣告提高營(yíng)業(yè)收入,還能通過廣告聯(lián)盟的方式獲得新的消費(fèi)者或保留現(xiàn)有的消費(fèi)者[12]。本研究與個(gè)性化郵件或個(gè)性化廣告的最大區(qū)別在于,這兩種個(gè)性化營(yíng)銷方式都是在消費(fèi)者離開商家的網(wǎng)站后為消費(fèi)者展示郵件或廣告。個(gè)性化郵件在消費(fèi)者離開商家網(wǎng)站后,通過郵件中的鏈接將消費(fèi)者重新跳轉(zhuǎn)到商家網(wǎng)站。在線精準(zhǔn)廣告是消費(fèi)者離開電商網(wǎng)站后,當(dāng)他們?cè)L問其他網(wǎng)站(如新聞網(wǎng)站、社交媒體網(wǎng)站)時(shí)為他們顯示之前在電商網(wǎng)站瀏覽的商品鏈接,以此跳轉(zhuǎn)回原電商網(wǎng)站[13]。而個(gè)性化推薦系統(tǒng)只為當(dāng)前正在訪問電商網(wǎng)站的消費(fèi)者提供決策支持服務(wù),并且推薦的內(nèi)容都是電商網(wǎng)站上自己銷售的商品[14]。
早期關(guān)于個(gè)性化推薦的研究主要關(guān)注對(duì)個(gè)性化推薦算法的改進(jìn),張莉等[15]對(duì)協(xié)同過濾算法進(jìn)行改進(jìn),取得比傳統(tǒng)的基于用戶的協(xié)同過濾算法更優(yōu)的推薦效果。為了深入了解推薦系統(tǒng)對(duì)消費(fèi)者購物行為的影響,SENECAL et al.[16]通過實(shí)驗(yàn)室實(shí)驗(yàn)發(fā)現(xiàn),推薦系統(tǒng)的有效性受到產(chǎn)品類型和網(wǎng)站間相對(duì)獨(dú)立性的影響。然而,這種實(shí)驗(yàn)室實(shí)驗(yàn)的方法得到的研究結(jié)果存在多方面的局限性,外部有效性較低,很難在實(shí)際應(yīng)用環(huán)境中得到一致的結(jié)果。此外,部分研究在分析推薦系統(tǒng)的作用時(shí),屏蔽控制組中消費(fèi)者瀏覽網(wǎng)頁中的推薦欄,造成研究結(jié)果出現(xiàn)偏差,因?yàn)橥扑]效果可能是由于是否在推薦欄區(qū)域顯示商品導(dǎo)致,而不是個(gè)性化推薦系統(tǒng)產(chǎn)生的影響[17]。PASSANT[18]使用關(guān)聯(lián)數(shù)據(jù)(多源數(shù)據(jù))提高消費(fèi)者的購物體驗(yàn)。但這種關(guān)聯(lián)數(shù)據(jù)需要采用統(tǒng)一的協(xié)議進(jìn)行存儲(chǔ),很少有商業(yè)公司采用這種協(xié)議[19],外部有效性較低。為了避免前人研究中存在的不足,本研究通過實(shí)地實(shí)驗(yàn)探究個(gè)性化推薦系統(tǒng)對(duì)消費(fèi)者購物行為的影響,提高研究結(jié)果的外部有效性。同時(shí),利用消費(fèi)者在當(dāng)前網(wǎng)站的內(nèi)部數(shù)據(jù)和其他網(wǎng)站的外部數(shù)據(jù)為消費(fèi)者提供個(gè)性化推薦服務(wù),結(jié)合消費(fèi)者行為理論深入探究該類推薦系統(tǒng)對(duì)消費(fèi)者購物行為的影響。
整個(gè)網(wǎng)購過程中,消費(fèi)者會(huì)在多個(gè)階段響應(yīng)電商網(wǎng)站上的個(gè)性化刺激,包括注意過程、認(rèn)知過程、決策結(jié)果[20]。前人研究主要通過實(shí)驗(yàn)室實(shí)驗(yàn)探究推薦系統(tǒng)對(duì)消費(fèi)者購物行為的影響,但在實(shí)際應(yīng)用過程中外部有效性較低[17,21]。本研究基于消費(fèi)者行為學(xué)相關(guān)理論,通過實(shí)地實(shí)驗(yàn)對(duì)推薦系統(tǒng)的效果進(jìn)行實(shí)證分析。自我是心理學(xué)的一個(gè)基本概念,并在該學(xué)科已被廣泛研究[22]。自我的一個(gè)重要性質(zhì)是自我參照效果,主要指人們對(duì)信息進(jìn)行編碼的結(jié)果取決于自我會(huì)多大程度在信息中得到暗示[23]。它有利于人們將記憶編碼得更加精細(xì),并且更容易檢索出來。在本研究的個(gè)性化推薦中,自我參照指消費(fèi)者以前在該網(wǎng)站的購物經(jīng)驗(yàn),這類信息在消費(fèi)者記憶中能夠長(zhǎng)期被獲取。BARGH[24]通過研究發(fā)現(xiàn),人的注意力會(huì)自發(fā)地關(guān)注與自我相關(guān)的信息。由于自我參照具有容易檢索的性質(zhì),使消費(fèi)者對(duì)自我參照相關(guān)的回憶速度更快[25]。因此,如果網(wǎng)頁個(gè)性化內(nèi)容與自我相關(guān),將降低消費(fèi)者的搜索成本,消費(fèi)者花費(fèi)在決策上的時(shí)間會(huì)較少。相對(duì)于普通的商品,個(gè)性化推薦系統(tǒng)推薦的商品主要基于消費(fèi)者的歷史購物數(shù)據(jù),與消費(fèi)者的自我相關(guān)程度更高。為了研究推薦系統(tǒng)對(duì)消費(fèi)者購物行為的影響,已有研究中將屏蔽推薦欄的實(shí)驗(yàn)組設(shè)定為控制組[17],這樣無法判斷是否是由于推薦欄這一網(wǎng)頁元素導(dǎo)致不同組中消費(fèi)者購物行為的差異。因此,本研究在控制組采用隨機(jī)推薦的方式,在網(wǎng)頁同樣位置顯示同樣數(shù)目的商品,避免結(jié)果出現(xiàn)偏差?;谧晕覅⒄绽碚?,本研究提出假設(shè)。
H1a與隨機(jī)推薦商品的方式相比,利用消費(fèi)者的內(nèi)部數(shù)據(jù)推薦個(gè)性化商品可以達(dá)到更高的點(diǎn)擊率。
H1b與隨機(jī)推薦商品的方式相比,如果消費(fèi)者看到的商品是基于內(nèi)部數(shù)據(jù)推薦產(chǎn)生的,他們花費(fèi)在決策上的時(shí)間更短,點(diǎn)擊推薦商品的速度更快。
除自我參照會(huì)影響消費(fèi)者購物過程外,商品間的差異性也會(huì)影響消費(fèi)者的決策過程[26]。如果消費(fèi)者連續(xù)瀏覽的商品之間的吸引力差異越小,他們終止當(dāng)前的搜索行為的可能性就會(huì)越低。本研究中,推薦系統(tǒng)利用消費(fèi)者歷史數(shù)據(jù)推薦與消費(fèi)者偏好相似的商品,這些商品之間的吸引力比較接近[27]。因此,消費(fèi)者在存在個(gè)性化推薦商品的情況下,吸引力相似的商品會(huì)造成消費(fèi)者搜索更多的商品。此外,已有研究表明,商品間差異性較小的情況下,消費(fèi)者難以得到他們比較喜歡的商品,并造成選擇延遲[28]。因此,本研究提出假設(shè)。
H2與隨機(jī)推薦商品的方式相比,消費(fèi)者在推薦系統(tǒng)協(xié)助下會(huì)瀏覽更多基于內(nèi)部數(shù)據(jù)產(chǎn)生的個(gè)性化網(wǎng)站內(nèi)容。
除了自身內(nèi)部數(shù)據(jù)源外,如果公司能從其他公司獲取消費(fèi)者的偏好信息,那么該公司將會(huì)獲得更全面的消費(fèi)者偏好,并提供更好的精準(zhǔn)營(yíng)銷服務(wù)[29]。大量研究表明,不同公司間的營(yíng)銷活動(dòng)存在相互影響。以此為基礎(chǔ),本研究主要探究利用外部數(shù)據(jù)在公司網(wǎng)站上提供個(gè)性化推薦服務(wù)如何影響消費(fèi)者在當(dāng)前公司的購物行為。CHEN et al.[30]的研究表明,如果公司與競(jìng)爭(zhēng)對(duì)手之間共享消費(fèi)者數(shù)據(jù),將會(huì)同時(shí)提高兩個(gè)公司獲得消費(fèi)者的能力,形成雙贏。消費(fèi)者觸及能力較弱的小公司也能在分享數(shù)據(jù)的過程中獲利。JENTZSCH et al.[31]認(rèn)為,外部數(shù)據(jù)的有效性取決于數(shù)據(jù)類型和消費(fèi)者的偏好。本研究中,基于外部數(shù)據(jù)的推薦系統(tǒng)的效果與外部公司的自身特征以及當(dāng)前公司與外部公司之間的關(guān)系密切相關(guān)。本研究利用公司擁有的消費(fèi)者數(shù)量衡量公司的市場(chǎng)影響力,公司的市場(chǎng)影響力越大,消費(fèi)者在網(wǎng)購過程中感知的風(fēng)險(xiǎn)越低,并且消費(fèi)者對(duì)該公司的忠誠度也越高[32]。消費(fèi)者對(duì)公司的忠誠度越高,購買該公司商品的概率也越高,即該公司的內(nèi)部數(shù)據(jù)更能夠反映消費(fèi)者偏好[33]。如果消費(fèi)者來自市場(chǎng)影響力大的外部公司,由于他們對(duì)于外部公司的忠誠度較高,所以消費(fèi)者點(diǎn)擊當(dāng)前網(wǎng)站商品的概率較低。但消費(fèi)者在外部公司的歷史數(shù)據(jù)能夠更好地代表消費(fèi)者的購物偏好,如果當(dāng)前網(wǎng)站利用這類消費(fèi)者在外部公司的歷史數(shù)據(jù)來為他們提供個(gè)性化推薦服務(wù),他們點(diǎn)擊個(gè)性化推薦商品的概率更高。因此,本研究提出假設(shè)。
H3根據(jù)外部公司市場(chǎng)影響力特征,如果消費(fèi)者數(shù)據(jù)來自市場(chǎng)影響力較大的外部公司,那么消費(fèi)者點(diǎn)擊當(dāng)前網(wǎng)站上商品的概率較低。但如果利用他們?cè)谕獠抗镜臄?shù)據(jù)提供個(gè)性化推薦服務(wù),消費(fèi)者點(diǎn)擊個(gè)性化推薦商品的概率較高。
外部數(shù)據(jù)的推薦效果,除與外部公司的特征緊密相關(guān)外,外部公司與當(dāng)前公司之間的關(guān)聯(lián)度也會(huì)影響最終推薦效果。WANG et al.[34]認(rèn)為,公司之間如果具有較強(qiáng)的網(wǎng)絡(luò)效應(yīng),消費(fèi)者在不同公司間的購買行為會(huì)相互影響。本研究使用兩個(gè)公司之間的共同用戶數(shù)量表示公司間的關(guān)聯(lián)度,如果兩個(gè)公司之間的關(guān)聯(lián)度越高,即兩個(gè)公司之間存在大量共同用戶,那么兩個(gè)公司為消費(fèi)者提供的商品或服務(wù)相似[35]。如果消費(fèi)者來自關(guān)聯(lián)度較高的外部公司,由于當(dāng)前網(wǎng)站提供的商品或服務(wù)與他之前瀏覽的網(wǎng)站內(nèi)容相似,那么當(dāng)前網(wǎng)站能夠提供與該消費(fèi)者之前偏好接近的商品。在這種情況下,消費(fèi)者點(diǎn)擊當(dāng)前網(wǎng)站上商品的概率較高。但如果使用該消費(fèi)者在外部網(wǎng)站的歷史數(shù)據(jù)提供個(gè)性化推薦服務(wù),該消費(fèi)者點(diǎn)擊由此產(chǎn)生的推薦結(jié)果的概率反而較低。由于消費(fèi)者是離開關(guān)聯(lián)度高的外部網(wǎng)站后來到當(dāng)前網(wǎng)站,表明該消費(fèi)者并不滿意外部網(wǎng)站的商品。而當(dāng)前網(wǎng)站與外部網(wǎng)站關(guān)聯(lián)度高,如果再用該消費(fèi)者不喜歡的偏好信息推薦商品,消費(fèi)者對(duì)推薦結(jié)果的點(diǎn)擊率會(huì)比較低。根據(jù)當(dāng)前公司與外部公司間的關(guān)系,本研究提出假設(shè)。
H4如果消費(fèi)者來自與當(dāng)前網(wǎng)站關(guān)聯(lián)度高的外部公司,他們點(diǎn)擊當(dāng)前網(wǎng)站商品的概率較高。如果利用他們?cè)谕獠烤W(wǎng)站的數(shù)據(jù)提供個(gè)性化推薦服務(wù),消費(fèi)者點(diǎn)擊由此產(chǎn)生的個(gè)性化推薦商品的概率較低。
個(gè)性化推薦是過去20年中計(jì)算機(jī)科學(xué)領(lǐng)域發(fā)展出來的一個(gè)熱門研究話題。然而,已有推薦系統(tǒng)的研究工作主要集中在開發(fā)和評(píng)估不同的個(gè)性化推薦算法,以此為消費(fèi)者產(chǎn)生個(gè)性化的商品建議[36-37]??紤]到各種個(gè)性化算法的有效性和流行程度,一種簡(jiǎn)單而被廣泛使用的推薦系統(tǒng)分類方法是將推薦算法分為基于內(nèi)容的推薦方法和基于協(xié)同過濾的推薦方法?;趦?nèi)容(content based, CB)的推薦系統(tǒng)利用產(chǎn)品信息(如商品名、書籍作者等)推薦與消費(fèi)者的偏好類似的其他商品?;趦?nèi)容的推薦系統(tǒng)在媒體或音樂這類網(wǎng)站被廣泛應(yīng)用,因?yàn)槠渲械纳唐肪哂写罅康男畔38],如Reel.com。與基于內(nèi)容的推薦方法相對(duì)立的是協(xié)同過濾方法(collaborative filtering,CF),該方法不依賴于產(chǎn)品的屬性信息,而是利用其他消費(fèi)者的偏好信息識(shí)別當(dāng)前消費(fèi)者有可能購買的商品[39-40]。具體地,有兩種協(xié)同過濾方法,即基于商品的協(xié)同過濾和基于用戶的協(xié)同過濾[41]。本研究采用基于用戶的協(xié)同過濾算法提供個(gè)性化推薦服務(wù),該方法的核心思想是利用消費(fèi)者的購物歷史信息計(jì)算用戶間的相似度,然后根據(jù)與當(dāng)前消費(fèi)者比較相似的其他消費(fèi)者的偏好信息估計(jì)當(dāng)前消費(fèi)者可能喜歡的商品,進(jìn)而為當(dāng)前消費(fèi)者生成個(gè)性化推薦商品??紤]到推薦系統(tǒng)的推薦過程較為復(fù)雜,為了使讀者更好地了解推薦系統(tǒng),本研究對(duì)個(gè)性化推薦產(chǎn)生過程和實(shí)驗(yàn)設(shè)計(jì)進(jìn)行簡(jiǎn)要描述。
圖1 亞馬遜網(wǎng)站的推薦欄Figure 1 Recommendation Bar of Amazon
通常情況下,消費(fèi)者在網(wǎng)站推薦欄內(nèi)看到的個(gè)性化推薦商品主要通過3個(gè)階段得到。第1階段,推薦請(qǐng)求階段,當(dāng)消費(fèi)者打開網(wǎng)頁時(shí),網(wǎng)頁中的腳本將為消費(fèi)者發(fā)送個(gè)性化商品推薦請(qǐng)求到服務(wù)器端的推薦系統(tǒng)。第2階段,推薦商品產(chǎn)生階段,推薦系統(tǒng)接收到請(qǐng)求之后,根據(jù)消費(fèi)者的偏好信息產(chǎn)生推薦結(jié)果并將結(jié)果返回剛才打開的網(wǎng)頁。第3階段,推薦曝光階段,推薦系統(tǒng)產(chǎn)生的個(gè)性化產(chǎn)品展示在網(wǎng)頁的推薦欄中。例如,圖1給出亞馬遜商品信息頁,消費(fèi)者在瀏覽商品信息的同時(shí),系統(tǒng)在商品下方會(huì)推薦消費(fèi)者可能喜歡的其他商品。本研究中,受屏幕大小的限制,實(shí)驗(yàn)中的消費(fèi)者只看到產(chǎn)品的描述信息,而看不到推薦欄。只有當(dāng)消費(fèi)者向下滑動(dòng)網(wǎng)頁時(shí),推薦欄才會(huì)出現(xiàn)在消費(fèi)者視野中。為了記錄消費(fèi)者是否看到推薦欄,網(wǎng)頁中的JavaScript腳本會(huì)在推薦欄出現(xiàn)在消費(fèi)者視野時(shí)發(fā)送一條信息到服務(wù)器,記錄推薦欄的曝光情況。如果消費(fèi)者在購物過程中沒有看到推薦欄,那么推薦系統(tǒng)對(duì)消費(fèi)者的購買行為不產(chǎn)生影響。最后是消費(fèi)者響應(yīng)階段,當(dāng)消費(fèi)者看到推薦欄中的商品后,他們可以選擇點(diǎn)擊喜歡的商品或?yàn)g覽網(wǎng)頁中的其他商品。如果消費(fèi)者點(diǎn)擊了推薦欄中的商品,他們將跳轉(zhuǎn)到商品介紹頁,并瀏覽該商品的詳細(xì)信息。消費(fèi)者可以購買他們喜歡的商品或離開該網(wǎng)站,消費(fèi)者的每個(gè)行為信息都會(huì)被記錄到服務(wù)器,每條記錄中包含了商品特征和時(shí)間戳等信息。
為了得到推薦系統(tǒng)影響消費(fèi)者購物行為的因果關(guān)系,本研究采用實(shí)地實(shí)驗(yàn)探究推薦系統(tǒng)對(duì)消費(fèi)者購物行為的影響,避免實(shí)驗(yàn)室實(shí)驗(yàn)缺乏外部有效性等問題。本研究使用Cookie ID標(biāo)識(shí)每個(gè)消費(fèi)者,使用Cookie的好處之一是即便消費(fèi)者沒有用自己的賬號(hào)登陸網(wǎng)站,推薦系統(tǒng)依然可以通過匿名的方式識(shí)別他們的歷史信息和偏好。此外,Cookie不包含消費(fèi)者的任何人口統(tǒng)計(jì)學(xué)信息(如姓名、住址等),有利于保護(hù)消費(fèi)者隱私。本實(shí)驗(yàn)部署在一個(gè)賣包的電商網(wǎng)站,該網(wǎng)站在實(shí)施實(shí)驗(yàn)前1個(gè)月平均每天有83 000位不同消費(fèi)者在網(wǎng)站上產(chǎn)生20萬次的點(diǎn)擊行為。實(shí)地實(shí)驗(yàn)部署在網(wǎng)站首頁,可以有效地控制內(nèi)生性問題。因?yàn)閷?shí)驗(yàn)中的推薦系統(tǒng)實(shí)時(shí)為消費(fèi)者提供個(gè)性化推薦商品,一旦消費(fèi)者在當(dāng)前購物過程中瀏覽過任何商品信息,消費(fèi)者的偏好便會(huì)被更新,后面看到的推薦商品也會(huì)隨之發(fā)生改變。所以,本研究將實(shí)驗(yàn)控制放在首頁,能夠在消費(fèi)者還沒有看過任何商品信息的情況下就使用歷史數(shù)據(jù)為他們提供商品推薦。除了使用消費(fèi)者在當(dāng)前網(wǎng)站的內(nèi)部數(shù)據(jù)提供個(gè)性化推薦服務(wù)外,本研究還使用消費(fèi)者在其他8個(gè)賣包網(wǎng)站的數(shù)據(jù)為消費(fèi)者在當(dāng)前網(wǎng)站產(chǎn)生個(gè)性化推薦商品。由于外部網(wǎng)站數(shù)據(jù)量較多,為了保證推薦速度,實(shí)驗(yàn)過程中,推薦系統(tǒng)只利用消費(fèi)者最近一次購物的網(wǎng)站數(shù)據(jù)提供個(gè)性化推薦服務(wù)。圖2給出實(shí)驗(yàn)期間在外部8個(gè)網(wǎng)站上存在消費(fèi)歷史數(shù)據(jù)的消費(fèi)者數(shù)量,縱軸用對(duì)數(shù)刻度表示不同網(wǎng)站的人數(shù),可以看到,來自第7個(gè)網(wǎng)站的消費(fèi)者最多,共1 851人,而來自第5個(gè)網(wǎng)站的消費(fèi)者最少,僅有41人。
當(dāng)消費(fèi)者訪問網(wǎng)站首頁時(shí),他們被隨機(jī)分配到不同的實(shí)驗(yàn)組中,本研究通過設(shè)置不同組中推薦系統(tǒng)使用的推薦算法操控實(shí)驗(yàn)。實(shí)驗(yàn)中,消費(fèi)者被隨機(jī)分為3組,每組中的推薦欄大小和位置相同,區(qū)別是推薦欄內(nèi)顯示的商品是根據(jù)不同的推薦規(guī)則產(chǎn)生。圖3為實(shí)驗(yàn)設(shè)計(jì)示意圖,第1組為隨機(jī)組,該組中消費(fèi)者看到的推薦結(jié)果使用隨機(jī)算法產(chǎn)生,即不使用個(gè)性化推薦。第2組中展示給消費(fèi)者的推薦結(jié)果由協(xié)同過濾算法產(chǎn)生,主要利用消費(fèi)者在當(dāng)前網(wǎng)站的內(nèi)部數(shù)據(jù)。第3組中,消費(fèi)者看到的個(gè)性化推薦結(jié)果通過基于內(nèi)容的推薦方法產(chǎn)生,主要利用消費(fèi)者在其他網(wǎng)站的外部數(shù)據(jù)。由于3個(gè)組中的推薦結(jié)果同時(shí)受數(shù)據(jù)源和推薦方法的影響,為了便于理解,下面對(duì)每個(gè)實(shí)驗(yàn)組中使用的推薦規(guī)則和數(shù)據(jù)源進(jìn)行詳細(xì)描述。
(1)隨機(jī)組。該組為實(shí)驗(yàn)中的第1組,也是該研究的控制組,該組中的推薦系統(tǒng)隨機(jī)選擇10個(gè)熱門商品推薦給消費(fèi)者,每次出現(xiàn)的商品和順序都不一樣。在正式開展實(shí)地實(shí)驗(yàn)前,本研究做了1次準(zhǔn)實(shí)驗(yàn),結(jié)果表明這種隨機(jī)推薦的方法比按照商品熱門程度推薦的方法效果好,而后者正是該網(wǎng)站以前推薦商品的慣用方式(按照商品熱門程度推薦,是按商品銷量排序,向消費(fèi)者推薦前10個(gè)商品,短期內(nèi)所推薦的商品和順序不變)。本研究將該組作為控制組,以此減少該實(shí)驗(yàn)對(duì)公司造成的損失。與已有研究中屏蔽控制組推薦欄的方式不同[17],本研究將隨機(jī)組作為控制組能夠排除是否顯示推薦欄這個(gè)網(wǎng)頁元素導(dǎo)致推薦效果的差異,最終得到推薦系統(tǒng)的真實(shí)作用。
(2)內(nèi)部數(shù)據(jù)組。第2個(gè)實(shí)驗(yàn)組中,本研究利用消費(fèi)者在當(dāng)前網(wǎng)站的內(nèi)部數(shù)據(jù)產(chǎn)生個(gè)性化推薦結(jié)果,采用協(xié)同過濾算法。首先根據(jù)消費(fèi)者的歷史購物數(shù)據(jù)計(jì)算消費(fèi)者之間的相似度,然后利用其他消費(fèi)者的偏好信息估計(jì)當(dāng)前消費(fèi)者可能喜歡的商品,進(jìn)而為當(dāng)前消費(fèi)者推薦商品。如果消費(fèi)者是第1次訪問當(dāng)前網(wǎng)站(即在當(dāng)前網(wǎng)站不存在任何歷史數(shù)據(jù))或協(xié)同過濾算法無法產(chǎn)生足夠的推薦商品,推薦系統(tǒng)將利用第1組中使用的隨機(jī)推薦的方法補(bǔ)充推薦結(jié)果,以保證不同實(shí)驗(yàn)組中推薦欄內(nèi)顯示的商品數(shù)量相等。
(3)外部數(shù)據(jù)組。第3個(gè)實(shí)驗(yàn)組中,推薦系統(tǒng)主要基于消費(fèi)者在其他網(wǎng)站的外部數(shù)據(jù)產(chǎn)生個(gè)性化推薦商品,采用基于內(nèi)容的個(gè)性化推薦算法。由于不同網(wǎng)站間消費(fèi)者不同,不能對(duì)消費(fèi)者的外部數(shù)據(jù)使用協(xié)同過濾算法。因此,本研究利用消費(fèi)者在外部網(wǎng)站的數(shù)據(jù)提供個(gè)性化推薦時(shí),使用基于內(nèi)容的推薦算法為消費(fèi)者在當(dāng)前網(wǎng)站提供個(gè)性化服務(wù)。基于內(nèi)容的推薦算法利用消費(fèi)者在外部網(wǎng)站瀏覽的商品屬性信息(如類別、品牌或名稱)推薦當(dāng)前網(wǎng)站上類似的商品。如果當(dāng)前網(wǎng)站上沒有找到相似的商品,借鑒第2組的解決方法,使用隨機(jī)推薦的方法對(duì)推薦結(jié)果進(jìn)行補(bǔ)充,保證各組中推薦欄內(nèi)顯示的商品數(shù)量相等。
表1 樣本描述性統(tǒng)計(jì)結(jié)果Table 1 Descriptive Statistics Results for Samples
本研究中的實(shí)地實(shí)驗(yàn)由一家提供推薦服務(wù)的第三方公司配合完成,該公司為超過1 000家在線零售商提供過推薦系統(tǒng)服務(wù)。目前,已有約6億個(gè)Cookie和超過300 TB(1 TB=1000 GB)的數(shù)據(jù)存儲(chǔ)在基于Hadoop分布式文件系統(tǒng)服務(wù)器。由于本研究中的數(shù)據(jù)量很大,為了有效地節(jié)省構(gòu)造變量的計(jì)算時(shí)間,使用數(shù)據(jù)倉庫管理工具Hive提取和構(gòu)造分析中需要的相關(guān)變量,分布式地使用數(shù)百臺(tái)服務(wù)器同時(shí)完成計(jì)算任務(wù),使需要很多天才能完成的計(jì)算任務(wù)縮減到幾個(gè)小時(shí)。
從2014年8月29日至2014年9月5日,實(shí)驗(yàn)在網(wǎng)站首頁持續(xù)開展8天,為了減小實(shí)驗(yàn)對(duì)電商造成的負(fù)面影響,實(shí)驗(yàn)過程中將該網(wǎng)站總用戶的20%隨機(jī)分配到3個(gè)實(shí)驗(yàn)組中,其他用戶繼續(xù)使用網(wǎng)站原有的推薦規(guī)則。如實(shí)驗(yàn)設(shè)計(jì)中所述,每位消費(fèi)者登陸到網(wǎng)站后會(huì)被隨機(jī)分配到3個(gè)實(shí)驗(yàn)組中,以此避免樣本選擇偏差。如果消費(fèi)者在試驗(yàn)期間多次訪問網(wǎng)站,該消費(fèi)者會(huì)被分配到之前的組中。然后,系統(tǒng)會(huì)記錄每位消費(fèi)者在網(wǎng)站的所有行為信息,保存到Hadoop數(shù)據(jù)倉庫中。實(shí)驗(yàn)中采集的數(shù)據(jù)主要由3個(gè)數(shù)據(jù)集構(gòu)成,第1個(gè)是產(chǎn)品信息數(shù)據(jù)集,包含每個(gè)產(chǎn)品的詳細(xì)信息,如產(chǎn)品ID、類別、品牌、名稱和價(jià)格等。第2個(gè)是點(diǎn)擊流數(shù)據(jù)集,記錄消費(fèi)者的每個(gè)在線行為,如瀏覽和購買行為。第3個(gè)是實(shí)驗(yàn)控制數(shù)據(jù)集,包含每個(gè)消費(fèi)者被分配到的實(shí)驗(yàn)組的具體信息,以此保證消費(fèi)者如果在實(shí)驗(yàn)期間再次返回網(wǎng)站,仍然會(huì)被分配到之前的實(shí)驗(yàn)組。在對(duì)消費(fèi)者行為分析和建模過程中,可以使用每個(gè)數(shù)據(jù)集的關(guān)鍵字將3個(gè)數(shù)據(jù)集整合起來構(gòu)造相應(yīng)的變量。例如,假設(shè)想得到每次會(huì)話期間每位消費(fèi)者的點(diǎn)擊行為,可以將實(shí)驗(yàn)控制數(shù)據(jù)集和點(diǎn)擊流數(shù)據(jù)集通過消費(fèi)者的Cookie ID和會(huì)話ID進(jìn)行整合,這樣就可以知道消費(fèi)者每次會(huì)話內(nèi)的點(diǎn)擊行為。如果希望比較不同實(shí)驗(yàn)組中每一位消費(fèi)者瀏覽或購買了多少產(chǎn)品,可以將這3個(gè)數(shù)據(jù)集合并,以滿足分析需求。詳細(xì)的變量構(gòu)建過程參考3.2。
盡管有些消費(fèi)者向服務(wù)器發(fā)送了推薦請(qǐng)求,但他們的網(wǎng)絡(luò)購物行為存在異常,如果忽略他們的影響,對(duì)推薦系統(tǒng)效果分析將會(huì)出現(xiàn)估計(jì)偏差。首先,部分消費(fèi)者雖然登錄了網(wǎng)站,但服務(wù)器上只有推薦請(qǐng)求的數(shù)據(jù),而沒有推薦結(jié)果被展示的數(shù)據(jù),因?yàn)檫@些消費(fèi)者在網(wǎng)頁完全打開之前就關(guān)閉了瀏覽器。其次,很多消費(fèi)者是通過搜索引擎登陸到當(dāng)前網(wǎng)站,可能除了當(dāng)前網(wǎng)站還有很多同類網(wǎng)站吸引消費(fèi)者,導(dǎo)致部分消費(fèi)者打開當(dāng)前網(wǎng)站后,沒有點(diǎn)擊任何商品就離開了當(dāng)前網(wǎng)站。最后,在實(shí)驗(yàn)期間,有些消費(fèi)者可能再次回到當(dāng)前網(wǎng)站,但他們上一次的網(wǎng)購數(shù)據(jù)會(huì)影響下一次購物的推薦結(jié)果。從DIAS et al.[2]的研究可知,推薦系統(tǒng)不僅提高了電商的收入,同時(shí)也刺激消費(fèi)者再次返回網(wǎng)站。如果忽略該影響,將會(huì)錯(cuò)誤地估計(jì)推薦系統(tǒng)對(duì)消費(fèi)者購物行為的真實(shí)影響。
然而,表1中的描述性統(tǒng)計(jì)結(jié)果無法清楚地解釋使用不同數(shù)據(jù)源的推薦系統(tǒng)與消費(fèi)者的購物行為之間的因果關(guān)系。因此,本研究基于消費(fèi)者在當(dāng)前網(wǎng)站和8個(gè)外部網(wǎng)站的數(shù)據(jù)構(gòu)建解釋變量,對(duì)消費(fèi)者網(wǎng)購行為進(jìn)行建模,深入剖析推薦系統(tǒng)如何影響消費(fèi)者購買行為。
為了更好地了解本研究中的數(shù)據(jù)結(jié)構(gòu),圖4舉例給出消費(fèi)者在購物過程中產(chǎn)生的點(diǎn)擊流數(shù)據(jù)。為了深入探究推薦系統(tǒng)對(duì)消費(fèi)者購物行為的影響,本研究對(duì)點(diǎn)擊流數(shù)據(jù)進(jìn)行處理,構(gòu)建下列變量用于建模分析。
注: H為首頁,C為點(diǎn)擊推薦欄,P為產(chǎn)品頁,O為訂購,E為退出。
①顯示,0-1變量,表示消費(fèi)者是否能夠看到推薦欄,如果消費(fèi)者能看到推薦欄,取值為1,否則取值為0。
②點(diǎn)擊,0-1變量,用來測(cè)量推薦系統(tǒng)有效性的主要因變量,如果消費(fèi)者點(diǎn)擊了推薦欄,取值為1,否則取值為0。
③老用戶,0-1變量,表示消費(fèi)者是否為當(dāng)前網(wǎng)站的老用戶,如果用戶是老用戶,取值為1,否則取值為0。
④商品數(shù)量,測(cè)量消費(fèi)者在網(wǎng)購這段時(shí)間內(nèi)瀏覽過多少個(gè)不同的商品。
⑤點(diǎn)擊速度,表示從消費(fèi)者看到推薦欄到點(diǎn)擊它之間等待的時(shí)間,消費(fèi)者可能在一次購物過程中多次看到推薦欄,點(diǎn)擊速度計(jì)算的是從消費(fèi)者看到推薦欄開始至消費(fèi)者最近一次點(diǎn)擊推薦欄的時(shí)間。因此需要對(duì)圖4中點(diǎn)擊數(shù)據(jù)流進(jìn)行拆分,得到該變量精確的測(cè)量值,這也是本研究用Hadoop集群進(jìn)行數(shù)據(jù)處理的重要原因之一。
為了判斷哪些因素影響推薦系統(tǒng)的有效性,本研究利用當(dāng)前網(wǎng)站的內(nèi)部數(shù)據(jù)和外部網(wǎng)站的數(shù)據(jù)構(gòu)建以下解釋變量。
①外部用戶,0-1變量,表示消費(fèi)者是否同時(shí)是外部網(wǎng)站的用戶。如果該用戶同時(shí)是外部網(wǎng)站用戶,取值為1,否則取值為0。
②最近訪問時(shí)間,表示消費(fèi)者最近一次訪問當(dāng)前網(wǎng)站到現(xiàn)在的時(shí)間長(zhǎng)度。
③訪問頻率,用消費(fèi)者訪問當(dāng)前網(wǎng)站的天數(shù)表示訪問頻率。
④外部公司影響力,表示外部公司的市場(chǎng)影響力,本研究用外部網(wǎng)站的用戶數(shù)量測(cè)量,為了避免該變量的估計(jì)系數(shù)太小,統(tǒng)計(jì)結(jié)果為真實(shí)人數(shù)除以1 000。
⑤外部公司關(guān)聯(lián)度,表示當(dāng)前公司與外部公司之間關(guān)聯(lián)程度,用兩個(gè)公司的共同用戶數(shù)量表示,為了避免該變量估計(jì)系數(shù)太小,統(tǒng)計(jì)結(jié)果為真實(shí)人數(shù)除以1 000。
⑥第i組,表示消費(fèi)者被分配到第i個(gè)組中,本研究中的i取值范圍為1、2、3,分別對(duì)應(yīng)隨機(jī)組、內(nèi)部數(shù)據(jù)組和外部數(shù)據(jù)組。在建模過程中,分別用啞變量隨機(jī)組、啞變量?jī)?nèi)部數(shù)據(jù)組和啞變量外部數(shù)據(jù)組表示消費(fèi)者屬于哪個(gè)組,用戶屬于該組取值為1,否則取值為0。
⑦星期幾,分類變量,用來指示當(dāng)天是一周內(nèi)的星期幾。
⑧小時(shí),表示消費(fèi)者在一天的具體訪問小時(shí)數(shù)。
表2給出相關(guān)變量的描述性統(tǒng)計(jì)結(jié)果,以消費(fèi)者每次會(huì)話為單位統(tǒng)計(jì)消費(fèi)者購買行為特征。由表2可知,消費(fèi)者看到推薦欄的概率均值為0.637,并且所有消費(fèi)者點(diǎn)擊推薦欄的概率均值為0.018,如果可以將消費(fèi)者看到推薦欄的概率提高一點(diǎn),相對(duì)于原來的情況,可以在很大程度上提高消費(fèi)者點(diǎn)擊推薦欄的概率。平均只有0.156的用戶在當(dāng)前網(wǎng)站存在歷史數(shù)據(jù),即如果可以使用消費(fèi)者的外部數(shù)據(jù)提供個(gè)性化推薦,將有很大一部分在當(dāng)前網(wǎng)站沒有歷史數(shù)據(jù)的消費(fèi)者可以從中受益。從消費(fèi)者的購物特點(diǎn)可知,消費(fèi)者平均瀏覽的商品個(gè)數(shù)為3.435個(gè),停留795.680秒。其中,只有0.109的用戶存在外部數(shù)據(jù),如果能夠獲取更多外部網(wǎng)站的數(shù)據(jù),擁有外部數(shù)據(jù)的人數(shù)將更多。老用戶平均最近購買時(shí)間為34.731天,平均訪問4.137次。外部公司的平均用戶數(shù)量為1 385 945人,外部網(wǎng)站與當(dāng)前網(wǎng)站的平均共同用戶數(shù)量為6 627人。
表2 變量描述性統(tǒng)計(jì)結(jié)果Table 2 Descriptive Statistics Results for Variables
推薦系統(tǒng)的主要作用是協(xié)助消費(fèi)者購買,為他們推薦與之偏好相關(guān)的商品。BARGH[24]認(rèn)為,人的注意力會(huì)自發(fā)地關(guān)注與自我關(guān)聯(lián)的信息。由于推薦系統(tǒng)的協(xié)助,消費(fèi)者看到的推薦商品與他們的偏好緊密相關(guān),這樣可以縮短消費(fèi)者決策時(shí)間,他們會(huì)在較短的時(shí)間內(nèi)給予反饋[17]。本研究中,消費(fèi)者的點(diǎn)擊速度通過消費(fèi)者看到推薦欄至消費(fèi)者點(diǎn)擊個(gè)性化推薦商品之間的時(shí)間測(cè)量。由于在一次購物過程中,消費(fèi)者可能多次點(diǎn)擊推薦欄,并且前一次點(diǎn)擊結(jié)果可能會(huì)影響下一次推薦結(jié)果。為了避免內(nèi)生性問題,本研究?jī)H測(cè)量消費(fèi)者在一個(gè)購物會(huì)話中第一次看到推薦欄的反饋時(shí)間。
圖5給出隨機(jī)組和內(nèi)部數(shù)據(jù)組中消費(fèi)者看到推薦欄中商品后的響應(yīng)速度,縱軸表示消費(fèi)者從看到推薦欄到點(diǎn)擊推薦欄的時(shí)間,單位為秒。隨機(jī)組(控制組)的平均響應(yīng)速度為106.024秒,比內(nèi)部數(shù)據(jù)組的平均響應(yīng)速度(84.469秒)更長(zhǎng),并且兩組之間的響應(yīng)速度存在顯著差異,p<0.010。由于內(nèi)部數(shù)據(jù)組中的個(gè)性化推薦系統(tǒng)根據(jù)消費(fèi)者歷史數(shù)據(jù)推薦商品,與消費(fèi)者自我相關(guān)程度高,使消費(fèi)者點(diǎn)擊推薦欄的響應(yīng)時(shí)間更短。因此,H1b得到驗(yàn)證。
圖5 響應(yīng)速度分析結(jié)果Figure 5 Analysis Results for Response Speed
商品間的差異性也會(huì)影響消費(fèi)者的決策過程,如果連續(xù)瀏覽的商品之間的吸引力差異較小,消費(fèi)者需要找更多的商品進(jìn)行對(duì)比,終止搜索過程的概率更低。本研究中,與控制組中隨機(jī)產(chǎn)生的推薦結(jié)果相比較,內(nèi)部數(shù)據(jù)組中使用個(gè)性化推薦算法產(chǎn)生與消費(fèi)者偏好接近的商品,所以推薦商品之間的差異性較小。因此,消費(fèi)者看到含有個(gè)性化推薦商品的推薦欄時(shí),比較難選出自己最喜歡的商品,所以他們會(huì)比較更多的商品。圖6給出消費(fèi)者瀏覽商品數(shù)量的分析結(jié)果,縱軸為消費(fèi)者瀏覽商品的數(shù)量。由圖6可知,在沒有點(diǎn)擊推薦欄內(nèi)商品的情況下,內(nèi)部數(shù)據(jù)組消費(fèi)者瀏覽的商品數(shù)量為2.503,隨機(jī)組消費(fèi)者瀏覽的商品數(shù)量為2.597,且兩組均值差異不顯著。然而,當(dāng)兩組消費(fèi)者點(diǎn)擊推薦欄中的商品后,如果他們點(diǎn)擊的商品是相似度較高的個(gè)性化推薦結(jié)果,內(nèi)部數(shù)據(jù)組消費(fèi)者會(huì)顯著地比隨機(jī)組消費(fèi)者瀏覽更多的商品,瀏覽的商品數(shù)量分別為7.455和6.572,p<0.010。因此,H2得到驗(yàn)證。
圖6 商品數(shù)量分析結(jié)果Figure 6 Analysis Results for Number of Products
除了研究基于內(nèi)部數(shù)據(jù)的推薦系統(tǒng)如何影響消費(fèi)者的購物行為,本研究也分析基于消費(fèi)者外部數(shù)據(jù)的推薦系統(tǒng)對(duì)他們?cè)诋?dāng)前網(wǎng)站上購物行為的影響。表3給出基于外部數(shù)據(jù)的推薦系統(tǒng)對(duì)消費(fèi)者購物行為的影響,因變量為消費(fèi)者點(diǎn)擊推薦商品。模型1檢驗(yàn)使用外部數(shù)據(jù)對(duì)推薦商品點(diǎn)擊率的影響,模型2檢驗(yàn)外部公司特征對(duì)外部數(shù)據(jù)推薦效果的影響,模型3在模型2的基礎(chǔ)上加入外部公司特征與外部數(shù)據(jù)組的交互項(xiàng),檢驗(yàn)外部公司特征對(duì)消費(fèi)者點(diǎn)擊率的影響。由模型1可知,外部數(shù)據(jù)組的系數(shù)為0.079,p<0.010,表明利用外部數(shù)據(jù)為消費(fèi)者提供個(gè)性化推薦,能夠顯著提高消費(fèi)者點(diǎn)擊推薦欄的概率。模型2中外部公司影響力的系數(shù)為-0.0003,p<0.100,即如果消費(fèi)者來自市場(chǎng)影響力大的外部公司,他們點(diǎn)擊當(dāng)前網(wǎng)站商品的概率較低。該結(jié)果可能的解釋是,若外部公司具有較高的市場(chǎng)影響力,消費(fèi)者對(duì)該企業(yè)的忠誠度更高,即他們選擇外部公司商品的概率更高,而點(diǎn)擊當(dāng)前網(wǎng)站上商品的概率較低。此外,外部公司關(guān)聯(lián)度的估計(jì)系數(shù)為0.064,p<0.100,表明如果消費(fèi)者來自與當(dāng)前網(wǎng)站的公司關(guān)聯(lián)度較高的外部網(wǎng)站,他們點(diǎn)擊當(dāng)前網(wǎng)站商品的概率較高。該結(jié)果的一種解釋為,由于外部網(wǎng)站的公司與當(dāng)前網(wǎng)站的公司關(guān)聯(lián)度高,當(dāng)前網(wǎng)站提供的商品與之前瀏覽的外部網(wǎng)站內(nèi)容相似。既然消費(fèi)者對(duì)外部網(wǎng)站的內(nèi)容感興趣,他們也很可能對(duì)當(dāng)前網(wǎng)站的商品感興趣。因此,如果消費(fèi)者來自與當(dāng)前網(wǎng)站關(guān)聯(lián)度高的外部網(wǎng)站,他們?cè)诋?dāng)前網(wǎng)站點(diǎn)擊商品的概率較高。
表3 外部數(shù)據(jù)推薦效果分析結(jié)果Table 3 Analysis Results of Recommendation Effectiveness for External Data
與模型2的結(jié)果相比,模型3中相同變量的估計(jì)系數(shù)符號(hào)保持一致。外部公司影響力與外部數(shù)據(jù)組的交互項(xiàng)系數(shù)為0.001,表示如果使用來自具有較高市場(chǎng)影響力的外部公司數(shù)據(jù)在當(dāng)前網(wǎng)站為消費(fèi)者提供個(gè)性化推薦服務(wù),有利于提高推薦系統(tǒng)推薦的商品的點(diǎn)擊率。雖然該結(jié)果與假設(shè)一致,但統(tǒng)計(jì)指標(biāo)不顯著,H3部分得到驗(yàn)證。外部公司關(guān)聯(lián)度與外部數(shù)據(jù)組的交互項(xiàng)系數(shù)為-0.120,p<0.100,表明如果推薦系統(tǒng)使用消費(fèi)者在關(guān)聯(lián)度高的外部網(wǎng)站數(shù)據(jù)產(chǎn)生個(gè)性化推薦商品,消費(fèi)者點(diǎn)擊推薦的概率反而較低。導(dǎo)致該結(jié)果的一種解釋為,既然消費(fèi)者已經(jīng)離開了與當(dāng)前網(wǎng)站相似的外部網(wǎng)站,說明外部網(wǎng)站的商品沒有滿足他們的偏好。倘若當(dāng)前網(wǎng)站仍然使用消費(fèi)者不滿意的商品信息推薦商品,他們點(diǎn)擊推薦欄的概率會(huì)較低。結(jié)合模型2中外部網(wǎng)站關(guān)聯(lián)度的估計(jì)結(jié)果可知,H4得到驗(yàn)證。
為了深入探究個(gè)性化推薦系統(tǒng)效果的影響因素,本研究利用Probit模型對(duì)消費(fèi)者的點(diǎn)擊行為進(jìn)行建模,表4給出分析結(jié)果,因變量為消費(fèi)者點(diǎn)擊推薦欄。模型4中僅包含消費(fèi)者分組信息,檢驗(yàn)使用不同數(shù)據(jù)對(duì)推薦效果的影響,可以發(fā)現(xiàn),內(nèi)部數(shù)據(jù)組和外部數(shù)據(jù)組消費(fèi)者點(diǎn)擊推薦欄的概率顯著高于沒有個(gè)性化推薦服務(wù)的隨機(jī)組消費(fèi)者。相對(duì)于隨機(jī)為消費(fèi)者推薦商品這一常用的策略,利用消費(fèi)者內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)都能顯著提高消費(fèi)者點(diǎn)擊個(gè)性化推薦商品的概率。因此,H1a得到驗(yàn)證。模型5控制了星期幾和小時(shí)的固定效應(yīng),與模型4相比發(fā)現(xiàn),內(nèi)部數(shù)據(jù)組的系數(shù)為0.228,外部數(shù)據(jù)組的系數(shù)為0.078,即內(nèi)部數(shù)據(jù)組的推薦效果整體優(yōu)于外部數(shù)據(jù)組。如表1所給出的,內(nèi)部數(shù)據(jù)組與外部數(shù)據(jù)組的點(diǎn)擊率分別為3.724%和2.668%,p<0.010。從表2外部用戶的統(tǒng)計(jì)結(jié)果可知,僅有10%左右的用戶有外部數(shù)據(jù)。所以,盡管使用外部數(shù)據(jù)推薦的效果比隨機(jī)推薦的效果好,但比使用內(nèi)部數(shù)據(jù)推薦的效果差。
模型6加入消費(fèi)者特征變量(僅有老用戶的相關(guān)數(shù)據(jù)),檢驗(yàn)推薦系統(tǒng)對(duì)不同消費(fèi)者購物行為的影響差異,老用戶的系數(shù)為0.372,p<0.010,即老用戶比新用戶點(diǎn)擊個(gè)性化推薦商品的概率更高。該結(jié)果表明,老用戶在網(wǎng)站上存在歷史信息,可以用來估計(jì)他們的購物偏好,提供更準(zhǔn)確的推薦結(jié)果。最近訪問時(shí)間的系數(shù)為-0.001,p<0.050,表明如果消費(fèi)者離開網(wǎng)站很長(zhǎng)一段時(shí)間,他們點(diǎn)擊推薦商品的概率較低。訪問頻率的系數(shù)為-0.002,表明如果消費(fèi)者訪問頻次太高,點(diǎn)擊推薦欄的概率會(huì)更低。一種可能的解釋是,這類消費(fèi)者對(duì)網(wǎng)站布局比較熟悉,能夠自己找到想要的商品,而不需要推薦欄,所以他們點(diǎn)擊推薦商品的概率較低。為了探究什么情況下內(nèi)部數(shù)據(jù)與外部數(shù)據(jù)的推薦效果有所差異,模型7將內(nèi)部數(shù)據(jù)組作為控制組進(jìn)行建模分析,探究消費(fèi)者異質(zhì)性如何影響不同數(shù)據(jù)源的推薦效果??梢园l(fā)現(xiàn),外部數(shù)據(jù)組的估計(jì)系數(shù)為-0.093,p<0.010,說明外部數(shù)據(jù)組消費(fèi)者比內(nèi)部數(shù)據(jù)組消費(fèi)者點(diǎn)擊個(gè)性化推薦欄的概率低;在模型中加入老用戶與外部數(shù)據(jù)組的交互項(xiàng),其系數(shù)為-0.219,p<0.010,表明如果消費(fèi)者是當(dāng)前網(wǎng)站的老用戶,使用他們的外部數(shù)據(jù)提供個(gè)性化推薦服務(wù),點(diǎn)擊推薦欄的概率較低。因此,公司在個(gè)性化實(shí)踐過程中需要考慮消費(fèi)者異質(zhì)性,結(jié)合數(shù)據(jù)源和用戶特征提供更精準(zhǔn)的個(gè)性化推薦服務(wù)。
本研究通過實(shí)地實(shí)驗(yàn),探究基于內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)的個(gè)性化推薦系統(tǒng)對(duì)消費(fèi)者購物行為的影響。一方面可以避免傳統(tǒng)實(shí)驗(yàn)室研究中外部有效性低的問題,另一方面可以得到推薦系統(tǒng)與消費(fèi)者購物行為之間的因果關(guān)系。
(1)根據(jù)消費(fèi)者在網(wǎng)站的內(nèi)部數(shù)據(jù)為消費(fèi)者產(chǎn)生的個(gè)性化推薦商品與消費(fèi)者自我相關(guān)程度高,因此消費(fèi)者點(diǎn)擊由此產(chǎn)生的推薦商品的概率比隨機(jī)推薦的商品更高。由于消費(fèi)者的注意力會(huì)自發(fā)關(guān)注與自我相關(guān)的內(nèi)容,花費(fèi)在決策上面的時(shí)間會(huì)更短,所以消費(fèi)者點(diǎn)擊個(gè)性化推薦的速度會(huì)更快。
表4 消費(fèi)者點(diǎn)擊行為分析結(jié)果Table 4 Analysis Results for Consumers′ Click Behaviors
(2)基于內(nèi)部數(shù)據(jù)推薦的個(gè)性化商品之間差異較小,消費(fèi)者需要對(duì)比更多的商品才會(huì)停止搜索過程。因此,為消費(fèi)者提供個(gè)性化推薦的情況下,消費(fèi)者會(huì)瀏覽更多的商品。
(3)外部數(shù)據(jù)對(duì)消費(fèi)者的推薦效果與外部公司的市場(chǎng)影響力密切相關(guān),如果外部公司的消費(fèi)者數(shù)量比較多,這類公司的消費(fèi)者在當(dāng)前網(wǎng)站點(diǎn)擊商品的概率相對(duì)較低。
(4)基于外部數(shù)據(jù)的推薦系統(tǒng)的效果與外部公司網(wǎng)站與當(dāng)前公司網(wǎng)站之間的相互關(guān)系有關(guān),如果外部公司網(wǎng)站與當(dāng)前公司網(wǎng)站存在大量共同用戶,來自這類外部公司的消費(fèi)者在當(dāng)前網(wǎng)站點(diǎn)擊的概率較高,但假如利用他們的外部數(shù)據(jù)產(chǎn)生個(gè)性化推薦,消費(fèi)者點(diǎn)擊推薦商品的概率反而更低。
(5)消費(fèi)者特征對(duì)基于內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)的推薦效果起調(diào)節(jié)作用。具體而言,不管是利用內(nèi)部數(shù)據(jù)還是外部數(shù)據(jù),消費(fèi)者點(diǎn)擊推薦商品的概率都會(huì)高于采用隨機(jī)推薦的結(jié)果。但如果消費(fèi)者是一位老用戶,利用該消費(fèi)者在網(wǎng)站的內(nèi)部數(shù)據(jù)提供個(gè)性化推薦服務(wù)取得的效果優(yōu)于利用他的外部數(shù)據(jù)推薦個(gè)性化商品的效果。
大量的已有研究通過實(shí)驗(yàn)室實(shí)驗(yàn)探究推薦對(duì)消費(fèi)者行為的影響,以此得到的研究結(jié)果外部有效性較低,實(shí)際應(yīng)用中容易出現(xiàn)偏差。本研究在實(shí)地實(shí)驗(yàn)過程中,將登陸網(wǎng)站之后的消費(fèi)者隨機(jī)分配到不同的實(shí)驗(yàn)組。即使消費(fèi)者多次訪問網(wǎng)站,依然將該消費(fèi)者分配在同一實(shí)驗(yàn)組內(nèi),避免結(jié)果出現(xiàn)偏差。已有利用多源數(shù)據(jù)構(gòu)造推薦系統(tǒng)的研究主要關(guān)注推薦算法的改進(jìn),沒有探索推薦系統(tǒng)對(duì)消費(fèi)者購物行為的影響。并且外部數(shù)據(jù)必須滿足一定格式要求,很難在實(shí)際應(yīng)用中推廣。本研究通過從內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)中構(gòu)造變量,解釋基于不同數(shù)據(jù)源的推薦系統(tǒng)如何影響消費(fèi)者的購物行為,一方面對(duì)前人實(shí)驗(yàn)室實(shí)驗(yàn)得出的結(jié)論進(jìn)行驗(yàn)證,另一方面通過分析外部公司特征如何影響基于外部數(shù)據(jù)的推薦系統(tǒng)的效果,填補(bǔ)個(gè)性化推薦研究在這方面的空白。此外,通過分析消費(fèi)者特征對(duì)不同數(shù)據(jù)源的推薦效果的調(diào)節(jié)作用,進(jìn)一步完善個(gè)性化推薦領(lǐng)域消費(fèi)者行為的理論框架。
目前雖然很多電子商務(wù)公司都為消費(fèi)者提供個(gè)性化推薦服務(wù),但尚不清楚個(gè)性化推薦如何影響消費(fèi)者的網(wǎng)購行為。依靠經(jīng)驗(yàn)或簡(jiǎn)單的統(tǒng)計(jì)數(shù)字判斷個(gè)性化推薦的作用,很可能會(huì)高估或低估個(gè)性化推薦的真實(shí)作用。本研究通過解決分析中存在的估計(jì)偏差,可以使公司改進(jìn)現(xiàn)有對(duì)推薦效果的統(tǒng)計(jì)指標(biāo),掌握推薦系統(tǒng)的真實(shí)效果。一方面,在評(píng)估推薦效果時(shí),需要過濾異常用戶和沒有看到推薦欄的用戶,否則會(huì)低估推薦效果。另一方面,消費(fèi)者多次訪問網(wǎng)站的情況會(huì)導(dǎo)致公司高估推薦系統(tǒng)的效果。此外,將消費(fèi)者特征引入模型分析推薦系統(tǒng)對(duì)消費(fèi)者購物行為的影響,可以幫助公司進(jìn)一步完善個(gè)性化推薦算法。在設(shè)計(jì)推薦系統(tǒng)時(shí)考慮消費(fèi)者訪問習(xí)慣,訪問網(wǎng)站頻繁的用戶點(diǎn)擊推薦欄的概率反而偏低,這類用戶對(duì)于網(wǎng)站內(nèi)容比較熟悉,可以不用依靠推薦系統(tǒng)就能找到自己需要的商品。
當(dāng)公司希望利用外部數(shù)據(jù)提升精準(zhǔn)營(yíng)銷的效果時(shí),本研究結(jié)果可以為公司在選擇外部數(shù)據(jù)和利用數(shù)據(jù)兩方面提供重要的指導(dǎo)。一方面,本研究在分析外部數(shù)據(jù)如何影響推薦系統(tǒng)效果的過程中加入外部公司特征,可以幫助公司明確外部公司數(shù)據(jù)的哪些特征對(duì)于提升自己個(gè)性化推薦服務(wù)的效果更好。公司在選擇外部數(shù)據(jù)時(shí),不僅要看外部企業(yè)消費(fèi)者的規(guī)模,還要看外部公司與當(dāng)前公司之間的共同用戶數(shù)量。另一方面,假如公司之間需要進(jìn)行數(shù)據(jù)交易,本研究結(jié)果可以對(duì)數(shù)據(jù)交易過程中的定價(jià)策略提供指導(dǎo),定價(jià)時(shí)要考慮公司自身的數(shù)據(jù)特點(diǎn),還要參考公司間的相互關(guān)聯(lián)程度,即一個(gè)公司的數(shù)據(jù)對(duì)于不同的公司作用也不同。此外,本研究通過分析消費(fèi)者對(duì)不同數(shù)據(jù)源推薦效果的調(diào)節(jié)作用,可以幫助公司進(jìn)一步改進(jìn)推薦系統(tǒng),根據(jù)消費(fèi)者特征選擇恰當(dāng)?shù)臄?shù)據(jù)源,以為消費(fèi)者提供個(gè)性化推薦服務(wù)。
雖然本研究有上述多方面的貢獻(xiàn),但也存在一些不足,需要在未來研究中改進(jìn)。①本研究在一家網(wǎng)上賣包的電商實(shí)施實(shí)地實(shí)驗(yàn),一定程度上限制了研究結(jié)果的外部有效性。未來研究可以部署該實(shí)地實(shí)驗(yàn)到其他行業(yè)的網(wǎng)站,如服裝或餐飲行業(yè)的網(wǎng)站,并與本研究結(jié)果進(jìn)行對(duì)比,以發(fā)現(xiàn)不同行業(yè)特點(diǎn)對(duì)研究結(jié)果的影響。②本研究只使用經(jīng)典的算法以避免由算法的特殊性帶來的系統(tǒng)性偏差,在實(shí)際的商業(yè)環(huán)境中,電商可以結(jié)合業(yè)務(wù)需求,使用更為復(fù)雜的推薦算法以獲得更高的性能。③為了避免實(shí)地實(shí)驗(yàn)對(duì)電商造成較大的損失,本研究的實(shí)地實(shí)驗(yàn)只持續(xù)了8天。未來可以開展更長(zhǎng)時(shí)間的實(shí)驗(yàn),研究結(jié)果的魯棒性會(huì)更高。④由于本研究使用Cookie ID識(shí)別同一消費(fèi)者在不同網(wǎng)站的網(wǎng)購行為信息,如果用戶使用多個(gè)終端設(shè)備(如手機(jī)、電腦)或多個(gè)瀏覽器訪問網(wǎng)站,會(huì)存在用戶的數(shù)據(jù)缺失,盡管這類用戶數(shù)量很少,但未來可以結(jié)合用戶登錄ID等方式,將同一消費(fèi)者在不同設(shè)備或渠道的數(shù)據(jù)進(jìn)行統(tǒng)一,獲取更全面的數(shù)據(jù),分析推薦系統(tǒng)對(duì)消費(fèi)者購物行為的影響。