潘禹辰 吳德勝
摘 要:Online-to-offline(O2O)作為一種融合線上線下雙渠道的新型商業(yè)模式,在近些年來已得到消費(fèi)者的廣泛接受和認(rèn)可。不同于傳統(tǒng)的互聯(lián)網(wǎng)商業(yè)模式,O2O服務(wù)的地理位置對用戶的服務(wù)選擇決策過程具有一定影響。這是因?yàn)镺2O服務(wù)不同于傳統(tǒng)電子商務(wù)服務(wù)的“線上購買的服務(wù)必須線下使用”這一特征所決定的。本文考慮O2O服務(wù)的專有特征,通過個(gè)性化推薦來探究O2O用戶的服務(wù)選擇決策行為特征。具體的,針對線上主觀服務(wù)口碑?dāng)?shù)據(jù)、線下客觀服務(wù)位置數(shù)據(jù)和二者融合數(shù)據(jù)分別設(shè)計(jì)了三種推薦算法。數(shù)據(jù)實(shí)驗(yàn)結(jié)果表明:用戶的O2O服務(wù)選擇決策是同時(shí)考慮服務(wù)的線上口碑和線下位置的多屬性決策過程。但在這一過程中,備選服務(wù)的地理位置對用戶的選擇決策具有更大的影響作用。
關(guān)鍵詞:O2O服務(wù);用戶行為特征;服務(wù)地理位置;個(gè)性化推薦
中圖分類號(hào):C931.6 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2097-0145(2022)01-0090-07 doi:10.11847/fj.41.1.90
Abstract:Online to offline (O2O) service, combining online and offline channels, has been accepted by customers in recent years. As the customer must enjoy the service, that he buys online, in the offline store, the location of the service has a big influence on his decision-making of service selection, which is different from traditional e-commerce. This study focuses on researching characteristics of customers’ decision-makings of O2O service selections with adoption of personalized recommendations. We propose three recommendation models respectively based on alternative services’ online comments, offline locations and combinations of them. Experimental results show that customers take both online word-of-mouth and offline locations of alternatives into considerations when selecting O2O services. However, it is worth note that the latter is more influential in this selection than the former.
Key words:O2O services; characteristics of customer behavior; service location; personalized recommendation
1 引言
近些年來,隨著線上電子商務(wù)市場的逐步飽和,一種全新的融合線上(online)、線下(offline)雙渠道的互聯(lián)網(wǎng)商業(yè)模式—O2O商業(yè)模式應(yīng)運(yùn)而生。相比于傳統(tǒng)的B2B和B2C等在內(nèi)的互聯(lián)網(wǎng)商業(yè)模式所提供的服務(wù)和商品,O2O用戶必須在線下體驗(yàn)他在線上所購買的O2O服務(wù)。因此,服務(wù)的地理位置在用戶的服務(wù)選擇決策中變得尤為重要。例如,用戶會(huì)傾向于那些距離他比較近的O2O服務(wù)[1]。盡管如此,服務(wù)的線上口碑已經(jīng)成為用戶在互聯(lián)網(wǎng)平臺(tái)進(jìn)行服務(wù)選擇決策過程中的重要參考因素之一。即便是在O2O商業(yè)模式下,服務(wù)口碑仍然對用戶的選擇決策具有重要的參考意義。
那么,用戶在O2O服務(wù)選擇決策過程中,是關(guān)注服務(wù)的線上評價(jià)還是服務(wù)的線下距離?如果都關(guān)注的話,哪個(gè)因素在該過程中更重要呢?本文的研究就是通過設(shè)計(jì)不同的O2O服務(wù)推薦算法,并通過觀察不同算法的推薦效果來分析O2O用戶的選擇決策行為特征。推薦系統(tǒng)是線上互聯(lián)網(wǎng)平臺(tái)解決用戶面對海量備選項(xiàng)目而產(chǎn)生選擇難問題的最有效的方法之一[2],它通過分析用戶在平臺(tái)上的交互行為,挖掘用戶的潛在偏好和興趣,向用戶推薦最可能符合他們興趣偏好的商品或服務(wù)[3]。
潘禹辰,等: 關(guān)注線上評價(jià)還是在意線下距離?——基于推薦效果的O2O商業(yè)模式下用戶選擇決策行為特征分析Vol.41, No.1工 程 管 理 科 技 前 沿2022年第1期
因此,本文分別基于服務(wù)的線上主觀評論信息、線下客觀地理特征和二者相融合所得到的三類數(shù)據(jù)構(gòu)建了三個(gè)新的推薦算法,分別為:基于用戶選擇行為的O2O服務(wù)推薦算法、基于地理位置特征的O2O服務(wù)推薦算法和基于線上線下信息融合的O2O服務(wù)推薦算法。其中基于用戶選擇行為的O2O服務(wù)推薦算法是在協(xié)同過濾架構(gòu)下對用戶偏好衡量方法進(jìn)行改進(jìn)。因此,該算法除了可以探究O2O用戶選擇決策行為特征之外,還可以在一定程度上解決稀疏數(shù)據(jù)環(huán)境下基于評分的協(xié)同過濾算法推薦效果差的問題。基于地理位置特征的O2O服務(wù)推薦算法是針對O2O服務(wù)不同于傳統(tǒng)電子商務(wù)服務(wù)所具有的距離敏感特征所設(shè)計(jì)的推薦算法?;诰€上線下信息融合的O2O服務(wù)推薦算法則是將上述兩種推薦算法進(jìn)行了融合,從而使得在推薦過程中不但考慮了備選服務(wù)的線上評價(jià)信息,還考慮它們的線下地理特征,并且可以根據(jù)模型中參數(shù)的最優(yōu)取值來分析二者在O2O服務(wù)選擇決策中的重要性。
2 文獻(xiàn)回顧
2.1 O2O服務(wù)
隨著大數(shù)據(jù)技術(shù)的推動(dòng)和發(fā)展,O2O商業(yè)模式正在逐漸改變著人們的生產(chǎn)和生活方式[4,5]。O2O服務(wù)平臺(tái)作為“橋梁”將線上用戶和線下商家通過電子憑證(如團(tuán)購劵)聯(lián)系在一起。關(guān)于O2O服務(wù)口碑的研究,Bock等[6]發(fā)現(xiàn)用戶對服務(wù)的線下認(rèn)知會(huì)影響他對該服務(wù)的線上選擇決策。相似地,Kwon和Lennon[7]通過實(shí)證探究同樣發(fā)現(xiàn)品牌的線下口碑會(huì)對該品牌的線上品牌形象以及線上用戶忠誠度產(chǎn)生一定影響。在O2O服務(wù)質(zhì)量方面,Yang等[8]提出了在人們的感知中,線上服務(wù)的購買欲望會(huì)受到線下服務(wù)質(zhì)量影響這一觀點(diǎn),并對影響程度進(jìn)行了度量。實(shí)際上,較高的服務(wù)質(zhì)量會(huì)有效提升用戶的品牌忠誠度,而這種忠誠度會(huì)在線上線下雙渠道產(chǎn)生相互影響[6]。即用戶線上購買的服務(wù)的質(zhì)量也會(huì)反過來影響他們線下購買該服務(wù)的決策[9]。然而,有關(guān)O2O用戶的服務(wù)選擇決策行為特征的相關(guān)研究還未曾報(bào)導(dǎo)。
2.2 用戶行為特征分析
在傳統(tǒng)電子商務(wù)平臺(tái)上的用戶行為特征分析方面,李治和孫銳[10]基于亞馬遜和京東兩個(gè)電子商務(wù)平臺(tái)數(shù)據(jù),研究電商平臺(tái)中推薦解釋對用戶行為意向的影響機(jī)制。研究結(jié)果表明當(dāng)用戶對服務(wù)信任度較高時(shí),推薦機(jī)制對用戶的商品選擇行為影響較低。反之,當(dāng)用戶對服務(wù)信任度較低時(shí),推薦機(jī)制可以顯著提高用戶的購買意向。Lin等[11]基于淘寶用戶數(shù)據(jù)的分析發(fā)現(xiàn)商家的服務(wù)態(tài)度對用戶的商品選擇決策行為具有十分重要的影響,其中惡劣的服務(wù)態(tài)度會(huì)導(dǎo)致用戶放棄本想購買的商品。Liou和Tzeng[12]則通過數(shù)據(jù)挖掘方法預(yù)測用戶在航班選擇中的決策行為特征,來幫助航空公司制定更加優(yōu)化的營銷策略。但是,我們發(fā)現(xiàn)在已有文獻(xiàn)中均很少涉及到有關(guān)O2O用戶的服務(wù)選擇決策行為特征研究。因此,本文通過觀察不同類別推薦算法的推薦測度來分析O2O用戶的選擇決策行為特征,以此補(bǔ)充行為特征分析的相關(guān)理論,拓展行為特征分析的應(yīng)用范圍。
2.3 個(gè)性化推薦算法
個(gè)性化推薦最早應(yīng)用于電子商務(wù)領(lǐng)域以用來解決信息過載問題[2,13]。推薦系統(tǒng)通過用戶在平臺(tái)上的服務(wù)交互行為,預(yù)測那些最可能滿足用戶需求、符合用戶偏好的服務(wù)并推薦給他們[13]。隨著推薦系統(tǒng)在亞馬遜和Netflix等互聯(lián)巨頭企業(yè)地成功應(yīng)用[14],個(gè)性化推薦技術(shù)逐步推廣到了醫(yī)療、教育、 文化和社交網(wǎng)絡(luò)等諸多領(lǐng)域[15]。在以上這些研究中,絕大多數(shù)研究是關(guān)于推薦系統(tǒng)的跨領(lǐng)域應(yīng)用和推薦準(zhǔn)確度這兩個(gè)方面[16,17]。而在近些年來,推薦多樣性開始成為眾多學(xué)者關(guān)注的一個(gè)話題:即在保證推薦準(zhǔn)確度不變或者較小損失的前提下,使得推薦的商品或服務(wù)盡可能地多樣化,從而增強(qiáng)新鮮感,提高用戶的滿意度,使得用戶對平臺(tái)的使用依賴性增強(qiáng)[18]。
3 模型設(shè)計(jì)
3.1 參數(shù)設(shè)定及數(shù)據(jù)預(yù)處理
3.2 基于用戶選擇行為的O2O服務(wù)推薦算法
無論是在傳統(tǒng)的電子商務(wù)推薦還是在O2O推薦中,數(shù)據(jù)稀疏性一直是推薦系統(tǒng)所面臨的最嚴(yán)峻的問題[19]。其實(shí),在海量的備選服務(wù)中,兩個(gè)用戶選擇了相同的服務(wù),即便他們給出不一致的評價(jià),也能反映二者的偏好存在著一定的相似性。也就是說,在“茫?!狈?wù)當(dāng)中兩個(gè)用戶都選擇了“你們”,即便他們對這些服務(wù)的使用感受存在一定分歧。但是,如此相似的服務(wù)選擇行為也足以說明二者之間較高的偏好相似性。
Pan等[20]在之前的研究中為了解決上述問題,提出了應(yīng)用Jaccard系數(shù)來計(jì)算兩個(gè)用戶基于服務(wù)選擇行為的偏好相似度。但是該系數(shù)存在過分“夸大”服務(wù)選擇行為,而忽視服務(wù)體驗(yàn)感受的問題。當(dāng)共同使用的服務(wù)分別在兩個(gè)用戶各自所使用的全部服務(wù)占有較高比例時(shí),計(jì)算結(jié)果存在偏好相似性的片面高估問題。其實(shí),用戶對服務(wù)的評價(jià)行為相比于選擇行為包含了更多、更豐富的可以用來衡量用戶偏好的有效信息。因此,數(shù)值評分是不能被完全摒棄的。綜合考慮上述分析,我們采用服務(wù)選擇行為為“主”,服務(wù)評價(jià)行為為“輔”的用戶偏好相似度衡量策略。具體計(jì)算如下
其中Oa、Ob和Oa,b分別代表用戶pa和pb各自使用服務(wù)的集合以及二者使用服務(wù)的交集。|A|則表示集合A中元素的個(gè)數(shù)。COSa,b為基于兩個(gè)用戶對共同使用服務(wù)的評分所計(jì)算得到的相似性,采用余弦相似度進(jìn)行衡量[21]。上述公式通過(1+COS),表現(xiàn)在衡量兩個(gè)用戶的偏好相似度過程中,基于評分的相似度以增強(qiáng)因子的方式存在。即兩個(gè)用戶所共同使用的服務(wù)在各自所使用的服務(wù)中占較大比例的同時(shí),如果他們還對這些服務(wù)給出了相似的評分,那么二者之間就具備較高的偏好相似度。即便他們對這些服務(wù)給出了不一致的評價(jià),二者的偏好相似度也主要是由他們共同選擇服務(wù)的情況所決定的。
基于(1)式,我們可以計(jì)算集合P中兩兩用戶的相似度(Sim),從而得到用戶相似度矩陣。進(jìn)而針對目標(biāo)用戶pa,我們將集合P中的其他用戶pi(pi∈P且i≠a)根據(jù)Sima,i(a≠i)進(jìn)行降序排列。排名越靠前的用戶與pa的偏好相似度越高,他們的O2O服務(wù)選擇行為對預(yù)測pa未來的服務(wù)選擇行為具有更強(qiáng)的參考價(jià)值。因此,我們選取前K個(gè)用戶作為pa的近鄰用戶群,記做集合Na。其中K的取值范圍通常根據(jù)|P|來確定,并且平臺(tái)可以根據(jù)推薦效果對K進(jìn)行調(diào)整。其中推薦算法研究中的K值通常設(shè)定為30[16]。
最后,我們根據(jù)近鄰用戶群的O2O服務(wù)選擇行為,來預(yù)測目標(biāo)用戶的服務(wù)選擇行為。我們將那些近鄰用戶所使用的且目標(biāo)用戶pa未使用過的服務(wù)定義為目標(biāo)用戶的備選服務(wù),這些服務(wù)所形成的集合記做AOa。那么,對其中的服務(wù)ok(ok∈AOa),通過(2)式計(jì)算該服務(wù)針對pa的推薦指數(shù)sprea,k。相類的,計(jì)算AOa中所有服務(wù)針對pa的推薦指數(shù),然后將備選服務(wù)根據(jù)該指數(shù)進(jìn)行降序排列,得到pa的個(gè)性化服務(wù)推薦列表。O2O服務(wù)平臺(tái)可以根據(jù)自己的實(shí)際需求將前n個(gè)服務(wù)推薦給pa。
3.3 基于地理位置特征的O2O服務(wù)推薦算法
用戶在選擇O2O服務(wù)時(shí),該服務(wù)提供商的地理位置是用戶的重要決策參考因素之一[22]。對于不同的用戶,由于他們的習(xí)慣地理位置(例如家庭住址、單位地址)不同,所以,他們的服務(wù)地理偏好也有所不同。而用戶使用的服務(wù)的地理位置可以一定程度上反映用戶不同的服務(wù)地理偏好,從而具備了個(gè)性化特征。為了避免用戶的習(xí)慣地理位置所帶來的片面性和有偏性,我們通過行為軌跡來衡量用戶的地理偏好。具體的,通過用戶所選擇的O2O服務(wù)的地理位置(經(jīng)緯度坐標(biāo))來計(jì)算用戶的地理偏好中心點(diǎn),計(jì)算公式如下
其中Oa為O2O用戶pa所使用的服務(wù)所形成的集合。在基于地理位置特征的O2O服務(wù)推薦算法中,備選服務(wù)為平臺(tái)上pa所未使用過的所有服務(wù),所形成的集合即O-Oa。針對該集合中任一O2O服務(wù)oj(oj∈O-Oa),采用Haversine方程計(jì)算該服務(wù)的地理位置與目標(biāo)用戶pa的地理偏好中心點(diǎn)的物理距離d。針對目標(biāo)用戶pa,他更愿意接受那些與他地理偏好中心點(diǎn)較近的備選服務(wù)。因此,將備選服務(wù)根據(jù)其與偏好中心點(diǎn)的距離進(jìn)行升序排序。從而得到基于地理位置特征的O2O服務(wù)推薦算法的推薦結(jié)果。相似的,運(yùn)營平臺(tái)可以根據(jù)商業(yè)需求將列表中的前n個(gè)服務(wù)推薦給用戶。相比于基于用戶選擇行為的O2O服務(wù)推薦算法,基于地理位置特征的推薦算法具有較低的時(shí)間復(fù)雜度和空間復(fù)雜度。然而,用戶的O2O服務(wù)選擇往往是一個(gè)綜合決策的過程。因此在下一節(jié)中,我們將以上兩種方法進(jìn)行融合,得到一種基于線上線下信息融合的O2O服務(wù)推薦算法。
3.4 線上線下信息融合的O2O服務(wù)推薦算法
通過以上兩個(gè)方法,針對目標(biāo)用戶pa,我們可以得到關(guān)于備選服務(wù)oj的兩個(gè)排序,分別記做RankBa,j(基于用戶選擇行為的推薦結(jié)果排序)和
RankLa,j(基于地理位置特征的推薦結(jié)果排序)。值得注意的是,在基于用戶選擇行為的推薦算法中,目標(biāo)用戶的備選服務(wù)為那些自己未選擇過且他的近鄰用戶選擇過的那些服務(wù),即集合AOa。但是,在基于地理位置特征的推薦算法中,備選服務(wù)為全部目標(biāo)用戶未選擇過的服務(wù),即集合O-Oa。易知AOa∈O-Oa。因此,在這部分算法中,備選服務(wù)oj屬于集合AOa。對于(O-Oa)-AOa集合中的服務(wù),我們將在后文進(jìn)行處理。為了體現(xiàn)O2O用戶在服務(wù)選擇決策過程中是綜合考慮服務(wù)的線上主觀評價(jià)信息以及線下客觀地理特征的這一特點(diǎn),我們將得到的兩個(gè)排序通過(4)式進(jìn)行融合,從而得到綜合推薦指標(biāo)RI。
其中α為權(quán)重調(diào)節(jié)參數(shù),其取值范圍為0到1區(qū)間。α的具體取值將在后文的參數(shù)實(shí)驗(yàn)中獲得。除此之外,為了保證那些在(O-Oa)-AOa中,且距離目標(biāo)用戶地理偏好中心點(diǎn)較近的服務(wù)能夠推薦給用戶,我們將那些在基于地理位置特征的推薦列表中前M%且在(O-Oa)-AOa中的那些服務(wù)的RankL直接作為RI參與到目標(biāo)用戶的服務(wù)推薦中。因此,我們對(4)式進(jìn)行拓展,得到如下公式
其中RM%a為關(guān)于目標(biāo)用戶pa的基于地理位置特征的推薦列表中排在前M%的O2O服務(wù),M的取值范圍為[0,100]。它的具體取值將在參數(shù)實(shí)驗(yàn)中獲得。
4 實(shí)驗(yàn)分析
4.1 實(shí)驗(yàn)數(shù)據(jù)
為了驗(yàn)證本研究所提出的推薦算法在傳統(tǒng)的電子商務(wù)推薦及O2O服務(wù)推薦中的有效性,我們采用準(zhǔn)確率(Pre)、召回率(Rec)和F-Score在兩個(gè)數(shù)據(jù)集上進(jìn)行算法的驗(yàn)證,分別為推薦算法研究中常用的MovieLens數(shù)據(jù)集[18]和本文作者所爬取和整理的O2O服務(wù)數(shù)據(jù)集。下面將對以上兩個(gè)數(shù)據(jù)集進(jìn)行介紹。
4.1.1 MovieLens數(shù)據(jù)集
本文實(shí)驗(yàn)部分所使用的是MovieLens數(shù)據(jù)集中的MovieLens 100K Dataset。該數(shù)據(jù)集來源于MovieLens網(wǎng)站從1997年4月22日至1998年4月22日期間的真實(shí)數(shù)據(jù)。它包含了所選出的943名用戶對1682部電影的100000個(gè)評分,評分的取值范圍為1、2、3、4和5。為了降低數(shù)據(jù)稀疏性,上述943名用戶均評價(jià)過至少20部電影。即便如此,該數(shù)據(jù)集的密度也僅為6.3%左右。除此之外,該數(shù)據(jù)集還包括了電影和用戶的部分屬性信息,如電影類型、用戶年齡、用戶性別、用戶職業(yè)和用戶居住地郵編等。上述屬性在實(shí)驗(yàn)中均未涉及。
4.1.2 O2O服務(wù)數(shù)據(jù)集
餐飲團(tuán)購服務(wù)作為出現(xiàn)最早、接受程度最高并受眾群體最廣的O2O服務(wù)已改變了人們傳統(tǒng)的餐飲消費(fèi)方式。O2O服務(wù)數(shù)據(jù)集由線上評論數(shù)據(jù)和線下地理數(shù)據(jù)組成。線上評論數(shù)據(jù)來源于大眾點(diǎn)評官網(wǎng)中用戶對餐飲團(tuán)購服務(wù)的評價(jià)信息。由于O2O服務(wù)具有地域特征,我們爬取了截止至2020年9月30日,大眾點(diǎn)評網(wǎng)站北京地區(qū)的餐飲團(tuán)購公開評論信息。共獲取1032874名用戶對12846家餐廳所給出的981910231條評論記錄。線下地理數(shù)據(jù)則由12846家餐廳的地理經(jīng)緯度坐標(biāo)組成。我們通過百度地圖(map.baidu.com)所提供的拾取坐標(biāo)系統(tǒng)來獲取以上餐廳的具體地理位置,并以經(jīng)緯度坐標(biāo)系來表示。通過初步的統(tǒng)計(jì)分析我們發(fā)現(xiàn),86.31%的用戶所選擇的超過80%的O2O服務(wù)均在他們的地理偏好中心點(diǎn)5公里以內(nèi),由此可見O2O服務(wù)的地理位置在用戶服務(wù)選擇決策過程中的重要性。
4.2 實(shí)驗(yàn)結(jié)果
4.2.1 實(shí)驗(yàn)設(shè)計(jì)
實(shí)驗(yàn)主要分為兩部分,分別是對比實(shí)驗(yàn)和參數(shù)調(diào)整實(shí)驗(yàn)。在對比實(shí)驗(yàn)部分,我們比較本文所提出的推薦算法與其他已存在的推薦算法的推薦效果,從而通過觀察新算法的優(yōu)勢和不足來分析O2O用戶的服務(wù)選擇決策行為特征。本文所提出的推薦算法包括基于用戶選擇行為的O2O服務(wù)推薦算法(C-R),基于地理位置特征的O2O服務(wù)推薦算法(L-R)和基于線上線下信息融合的O2O服務(wù)推薦算法(H-R)。為了驗(yàn)證地理位置對用戶O2O服務(wù)選擇決策的影響,我們將不考慮(O-Oa)-AOa中那些距離目標(biāo)用戶地理偏好中心點(diǎn)較近的服務(wù)的H-R算法記做H-R*。在對比實(shí)驗(yàn)中,相關(guān)參數(shù)均設(shè)置為中性值。我們選擇經(jīng)典的協(xié)同過濾推薦算法(CF)[23]和融合了前沿計(jì)算機(jī)技術(shù)的矩陣分解推薦算法(MF)[24]、神經(jīng)網(wǎng)絡(luò)推薦算法(NN)[25]和深度學(xué)習(xí)推薦算法(DL)[26]作為比較算法,以上四種比較算法均可以在MovieLens 100K和O2O數(shù)據(jù)集中使用。 在參數(shù)調(diào)整實(shí)驗(yàn)中,主要針對H-R算法中的α和M兩個(gè)參數(shù)進(jìn)行調(diào)整。通過觀察不同取值下的推薦效果來探尋兩個(gè)參數(shù)的最優(yōu)取值。并根據(jù)他們的最優(yōu)取值來分析O2O用戶的服務(wù)選擇決策行為特征。4.2.2 對比實(shí)驗(yàn)
在對比實(shí)驗(yàn)中,我們隨機(jī)抽取一部分?jǐn)?shù)據(jù)作為訓(xùn)練集,用作模型的輸入。其余數(shù)據(jù)作為測試集,用來驗(yàn)證算法的推薦效果。在訓(xùn)練集抽取過程中,我們以10%為步長,進(jìn)行9次抽取。即分別抽取10%到90%的數(shù)據(jù)作為訓(xùn)練集,其余數(shù)據(jù)作為測試集,進(jìn)行9組實(shí)驗(yàn)。在每組實(shí)驗(yàn)中,記錄本文算法與對比算法的推薦效果,從而進(jìn)行比較。
實(shí)驗(yàn)結(jié)果如圖1所示??傮w觀察可以發(fā)現(xiàn),隨著訓(xùn)練集密度的提升,所有算法的F-Score值均不斷增加。即隨著數(shù)據(jù)量的增大,實(shí)驗(yàn)中所包含的所有推薦算法的推薦效果均不斷提升。在包括推薦系統(tǒng)在內(nèi)的數(shù)據(jù)挖掘研究中,存在著一條相對客觀的規(guī)律:更多的數(shù)據(jù)包含了更多的信息,從而使得算法對未來的預(yù)測更為準(zhǔn)確。因此,這個(gè)現(xiàn)象說明了實(shí)驗(yàn)的可靠性,其中包括了算法的可用性和數(shù)據(jù)集的真實(shí)性。
觀察圖1(a)中,H-R、H-R*和L-R三個(gè)本文算法在O2O數(shù)據(jù)集上的推薦效果,可以發(fā)現(xiàn):(1)H-R和H-R*的推薦效果要明顯好于其他算法的推薦效果;(2)H-R的推薦效果要稍好于H-R*;(3)只考慮地理位置且算法復(fù)雜度相對較低的L-R竟然與那些融合了前沿計(jì)算機(jī)技術(shù)且算法復(fù)雜度相對較高的MF、DL和NN有著非常相近的推薦效果。實(shí)驗(yàn)結(jié)果(2)和(3)表明用戶的O2O服務(wù)選擇是一個(gè)距離敏感的決策過程,且服務(wù)的地理位置在決策過程中具有重要作用。實(shí)驗(yàn)結(jié)果(1)表明除了備選服務(wù)的線下地理特征,它們的線上口碑信息在用戶的服務(wù)選擇決策過程中也具有一定影響。因此,用戶的O2O服務(wù)選擇決策過程是一個(gè)融合了備選服務(wù)線上主觀評價(jià)信息和線下客觀地理信息的多屬性決策過程。
除此之外,觀察除了H-R、H-R*和L-R外,其余五個(gè)推薦算法在O2O數(shù)據(jù)集和MovieLens 100K上的推薦效果??梢园l(fā)現(xiàn)MF、DL和NN三種融合了前沿計(jì)算機(jī)技術(shù)的混合推薦算法相比于協(xié)同過濾架構(gòu)下的推薦算法,具有較為突出的推薦效果。這是因?yàn)樯鲜鋈N混合推薦算法均利用輸入數(shù)據(jù),對模型進(jìn)行反復(fù)訓(xùn)練,從而使得它們可以在有限的數(shù)據(jù)中,最大程度獲取用戶的偏好特征。相比而言,協(xié)同過濾架構(gòu)下的推薦算法效果相對較差。但是值得注意的是,本文所提出的C-R的推薦效果要好于CF。這說明在稀疏數(shù)據(jù)環(huán)境下,用戶的服務(wù)選擇行為相比于用戶的服務(wù)評價(jià)行為可以更好地衡量用戶之間的偏好相似度。值得注意的是,C-R相比于MF、DL和NN,具有較低的計(jì)算復(fù)雜性。因此,當(dāng)平臺(tái)面對大規(guī)模線上數(shù)據(jù)且運(yùn)算能力不足時(shí),C-R算法不失為一種很好的選擇。
4.2.3 參數(shù)實(shí)驗(yàn)
在參數(shù)實(shí)驗(yàn)部分,我們首先探索α的不同取值對H-R推薦效果的影響。我們分別在服務(wù)推薦數(shù)量為10和20的條件下,觀察在不同數(shù)據(jù)密度(20%、40%、60%和80%的數(shù)據(jù)作為訓(xùn)練集)中α以0.1為步長從0取值到1這個(gè)過程所得到11個(gè)實(shí)驗(yàn)結(jié)果。
實(shí)驗(yàn)結(jié)果如圖2所示。總體的,較高數(shù)據(jù)密度所對應(yīng)的曲線位于較低數(shù)據(jù)密度所對應(yīng)曲線的上方,即H-R的推薦效果隨著數(shù)據(jù)量的增加而提升,從而表明這部分實(shí)驗(yàn)的可靠性。具體的,所有曲線均呈現(xiàn)“倒U形”,且在絕大部分情況下,當(dāng)α=0.1時(shí)F-score達(dá)到最大值。α=0.1意味著在綜合推薦指標(biāo)RI的融合中,基于地理位置特征的推薦算法L-R所生成的備選服務(wù)排序占較大比重。因此,這個(gè)實(shí)驗(yàn)結(jié)果說明備選O2O服務(wù)的地理位置相比于服務(wù)的線上口碑在用戶的選擇決策過程中更加重要。但值得注意的是,α=0時(shí)的推薦效果與最優(yōu)推薦效果差距較大。這個(gè)現(xiàn)象表明:用戶在O2O服務(wù)的選擇決策過程中,服務(wù)的線上口碑對這一決策過程具有一定影響。這是因?yàn)橛脩粼趥鹘y(tǒng)線上平臺(tái)進(jìn)行商品或服務(wù)的選擇時(shí),已習(xí)慣于參考其他用戶給出的評論信息。因此,即便O2O商業(yè)模式與傳統(tǒng)電子商務(wù)模式存在較大區(qū)別,但是O2O服務(wù)平臺(tái)同樣作為線上平臺(tái),其包含的線上評論亦會(huì)對用戶的O2O服務(wù)選擇決策產(chǎn)生一定影響。因此,該實(shí)驗(yàn)結(jié)果再次證明:用戶的O2O服務(wù)選擇決策過程是一個(gè)融合了備選服務(wù)線上主觀評價(jià)信息和線下客觀地理信息的多屬性決策過程。但在這個(gè)過程中,備選服務(wù)的地理位置對用戶的決策具有較大的影響作用。
M是為了彌補(bǔ)H-R模型在備選服務(wù)的推薦排序過程中,遺漏了那些目標(biāo)用戶的近鄰用戶群體沒有選擇但是與目標(biāo)用戶地理偏好中心點(diǎn)較近的那些服務(wù)對算法推薦效果所造成的影響而設(shè)計(jì)的參數(shù)。這部分的實(shí)驗(yàn)設(shè)計(jì)與參數(shù)α調(diào)整實(shí)驗(yàn)相似。α在這部分實(shí)驗(yàn)中設(shè)定為前文實(shí)驗(yàn)所得到的最優(yōu)值,即0.1。
實(shí)驗(yàn)結(jié)果如圖3所示,圖中曲線均呈現(xiàn)“倒U型”,且在M取值為30時(shí),算法具有最佳的推薦效果。也就是說,在目標(biāo)用戶未選擇的服務(wù)中,將與他的地理偏好中心點(diǎn)距離較近的前30%的服務(wù)納入到他的備選服務(wù)參與到推薦過程中時(shí),算法具有最好的推薦效果。但是,根據(jù)距離將更多的服務(wù)列入目標(biāo)用戶的備選服務(wù)集合中時(shí)(M超過30),一些距離較遠(yuǎn)且與目標(biāo)用戶偏好相差較大的服務(wù)將會(huì)對算法的推薦效果產(chǎn)生消極影響。表現(xiàn)為當(dāng)M超過30時(shí),算法的推薦效果逐步下降。該實(shí)驗(yàn)在探尋到H-R中參數(shù)M最優(yōu)取值的同時(shí),實(shí)驗(yàn)結(jié)果再次說明了O2O服務(wù)的地理位置在用戶選擇決策過程中的重要性。
5 總結(jié)及展望
本文通過所設(shè)計(jì)的三種分別基于線上評價(jià)數(shù)據(jù)、線下地理數(shù)據(jù)和以上二者的融合推薦算法,探究用戶在O2O服務(wù)選擇決策過程中的行為特征。通過實(shí)驗(yàn)發(fā)現(xiàn),O2O服務(wù)的地理位置特征在用戶的服務(wù)選擇決策過程中具有重要影響,即用戶通常會(huì)選擇那些距離他較近的O2O服務(wù)。其次,服務(wù)的線上口碑也會(huì)對用戶的選擇決策產(chǎn)生一定影響。但是相比于服務(wù)的地理位置特征,它們線上口碑對用戶選擇決策所產(chǎn)生的影響相對較小。因此,以上結(jié)果表明:用戶的O2O服務(wù)選擇決策過程是融合了備選服務(wù)的線上口碑和線下地理特征的多屬性決策過程。在這個(gè)過程中,服務(wù)的地理特征占據(jù)主導(dǎo)地位。這是因?yàn)椤坝脩舯仨氁ゾ€下體驗(yàn)服務(wù)”這一O2O服務(wù)區(qū)別于傳統(tǒng)電子商務(wù)服務(wù)的特征所決定的。除此之外,本文所提出的推薦算法在解決稀疏數(shù)據(jù)環(huán)境下推薦難這個(gè)問題上也做出了一定的貢獻(xiàn)。
其實(shí),用戶的O2O服務(wù)選擇決策行為特征會(huì)根據(jù)時(shí)間發(fā)生轉(zhuǎn)移。除此之外,不排除一些饕餮用戶為了探尋感興趣的服務(wù)而忽視服務(wù)的地理位置。因此,后續(xù)研究會(huì)考慮用戶行為特征的時(shí)間變化,以及特殊用戶群體的行為特征分析。
參 考 文 獻(xiàn):
[1] Ardizzone A, Mortara A. Consumers motivations and daily deal promotions[J]. The Qualitative Report, 2014, 19(31): 1-15.
[2] 朱國瑋,周利.基于遺忘函數(shù)和領(lǐng)域最近鄰的混合推薦研究[J].管理科學(xué)學(xué)報(bào),2012,15(5):55-64.
[3] Li L, Chen J, Raghunathan S. Recommender system rethink: implications for an electronic marketplace with competing manufacturers[J]. Information Systems Research, 2018, 29(4): 1003-1023.
[4] 劉業(yè)政,孫見山,姜元春,等.大數(shù)據(jù)的價(jià)值發(fā)現(xiàn):4C模型[J].管理世界,2020,36(2):129-38,223.
[5] 陳國青,曾大軍,衛(wèi)強(qiáng),等.大數(shù)據(jù)環(huán)境下的決策范式轉(zhuǎn)變與使能創(chuàng)新[J].管理世界,2020,36(2):95-105,220.
[6] Bock G W, Lee J, Kuan H H, et al.. The progression of online trust in the multi-channel retailer context and the role of product uncertainty[J]. Decision Support Systems, 2012, 53(1): 97-107.
[7] Kwon W S, Lennon S J. What induces online loyalty? Online versus offline brand images[J]. Journal of Business Research, 2009, 62(5): 557-564.
[8] Yang S, Lu Y, Chau P Y K. Why do consumers adopt online channel? An empirical investigation of two channel extension mechanisms[J]. Decision Support Systems, 2013, 54(1): 858-869.
[9] Gallino S, Moreno A. Integration of online and offline channels in retail: the impact of sharing reliable inventory availability information[J]. Management Science, 2014, 60(6): 1434-1451.
[10] 李治,孫銳.推薦解釋對改變用戶行為意向的研究——基于傳播說服理論的視閾[J].中國軟科學(xué),2019,(6):176-184.
[11] Lin Z, Zhang Y, Tan Y. An empirical study of free product sampling and rating bias[J]. Information Systems Research, 2019, 30(1): 260-275.
[12] Liou J J H, Tzeng G H. A dominance-based rough set approach to customer behavior in the airline market[J]. Information Sciences, 2010, 180(11): 2230-2238.
[13] 陳梅梅,劉利梅,施馳瑋,等.推薦規(guī)模對個(gè)性化推薦系統(tǒng)用戶決策的影響研究[J].南開管理評論,2020,23(1):180-188.
[14] 姚凱,涂平,陳宇新,等.基于多源大數(shù)據(jù)的個(gè)性化推薦系統(tǒng)效果研究[J].管理科學(xué),2018,31(5):3-15.
[15] 尚燕敏,曹亞男,劉燕兵.基于異構(gòu)社交網(wǎng)絡(luò)信息和內(nèi)容信息的事件推薦[J].軟件學(xué)報(bào),2020,31(4):1212-1224.
[16] Siering M, Deokar A V, Janze C. Disentangling consumer recommendations: explaining and predicting airline recommendations based on online reviews[J]. Decision Support Systems, 2018, 107: 52-63.
[17] Li Y M, Lin L F, Ho C C. A social route recommender mechanism for store shopping support[J]. Decision Support Systems, 2017, 94(1): 97-108.
[18] Jiang H, Qi X, Sun H. Choice-based recommender systems: a unified approach to achieving relevancy and diversity[J]. Operations Research, 2014, 62(5): 973-993.
[19] Pan Y, Wu D. A novel recommendation model for online-to-offline service based on the customer network and service location[J]. Journal of Management Information Systems, 2020, 37(2): 563-593.
[20] Pan Y, Wu D, Olson D L. Online to offline (O2O) service recommendation method based on multi-dimensional similarity measurement[J]. Decision Support Systems, 2017, 103: 1-8.
[21] Adomavicius G, Zhang J. Classification, ranking, and top-K stability of recommendation algorithms[J]. INFORMS Journal on Computing, 2016, 28(1): 129-147.
[22] Li H, Shen Q, Bart Y. Local market characteristics and online-to-offline commerce: an empirical analysis of groupon[J]. Management Science, 2017, 64(4): 1477-1973.
[23] Lian D, Ge Y, Zhang F, et al.. Scalable content-aware collaborative filtering for location recommendation[J]. IEEE Transactions on Knowledge and Data Engineering, 2018, 30(6): 1122-1135.
[24] He Y, Wang C, Jiang C J. Correlated matrix factorization for recommendation with implicit feedback[J]. IEEE Transactions on Knowledge and Data Engineering, 2019, 31(3): 451-464.
[25] Zhang W, Du Y, Yoshida T, et al.. DeepRec: a deep neural network approach to recommendation with item embedding and weighted loss function[J]. Information Sciences, 2019, 470(1): 121-140.
[26] Guan Y, Wei Q, Chen G. Deep learning based personalized recommendation with Multi-view information integration[J]. Decision Support Systems, 2019, 118(1): 58-69.
3410500338281