慕善文 趙會群
摘要:精準(zhǔn)營銷可以幫助企業(yè)節(jié)約營銷成本、提升營銷效果,基于大數(shù)據(jù)的消費者行為分析也是大數(shù)據(jù)領(lǐng)域的一個熱點研究。為此,基于運營商大數(shù)據(jù)對汽車用戶精準(zhǔn)營銷算法進行研究,提出基于專家經(jīng)驗與統(tǒng)計學(xué)方法的精準(zhǔn)營銷算法。首先對用戶上網(wǎng)日志數(shù)據(jù)進行加工,得到用戶行為標(biāo)簽,然后根據(jù)專家經(jīng)驗與統(tǒng)計學(xué)公式計算用戶購車意向得分,輸出潛在購車客戶信息。通過在某運營商真實環(huán)境下進行實驗,驗證了算法的可行性與有效性。實驗結(jié)果表明,面向運營商大數(shù)據(jù)的汽車用戶精準(zhǔn)營銷算法成功率可達到5.98%,相比現(xiàn)有推薦算法效率明顯提升。
關(guān)鍵詞:運營商大數(shù)據(jù);專家經(jīng)驗;汽車營銷:精準(zhǔn)營銷
DOI: 10. 11907/rjdk.191273
開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):
中圖分類號:TP319
文獻標(biāo)識碼:A
文章編號:1672-7800( 2020)001-0148-04
0 引言
大數(shù)據(jù)目前已成為人們關(guān)注的熱點之一,隨著計算機技術(shù)的迅速發(fā)展,人們對大數(shù)據(jù)的分析也越來越深入,并將其應(yīng)用于各個領(lǐng)域,可以說如今人們已生活在一個大數(shù)據(jù)時代。為了適應(yīng)時代需求,各行業(yè)都發(fā)生了變革,營銷行業(yè)也是其中之一。傳統(tǒng)營銷模式在大數(shù)據(jù)的沖擊下正慢慢被精準(zhǔn)營銷取代。與傳統(tǒng)營銷模式相比,精準(zhǔn)營銷既能節(jié)省營銷成本,又能最大化營銷效果[1-3]。
出于保護用戶隱私等因素,通常企業(yè)不會公開自己的數(shù)據(jù),使得新客引入成為一個難題。傳統(tǒng)營銷模式存在新客戶增長速度緩慢且成本高昂等問題,長此以往不利于企業(yè)發(fā)展。運營商作為移動網(wǎng)絡(luò)的經(jīng)營者,擁有其它企業(yè)無法企及的海量數(shù)據(jù)資源[4-6]。企業(yè)利用通信運營商大數(shù)據(jù)進行精準(zhǔn)營銷有利于企業(yè)新客戶引入與老客戶復(fù)購。所以研究面向運營商大數(shù)據(jù)的精準(zhǔn)營銷算法對企業(yè)而言顯得尤為必要。
本文研究來自企業(yè)項目,基于運營商大數(shù)據(jù)構(gòu)建企業(yè)精準(zhǔn)營銷數(shù)據(jù)分析模型,在運營商大數(shù)據(jù)中篩選購車意向較高的用戶,以幫助汽車企業(yè)實現(xiàn)對用戶的精準(zhǔn)營銷。
1 相關(guān)研究
眾多學(xué)者針對基于大數(shù)據(jù)的精準(zhǔn)營銷進行研究,如Liu等[7]針對服裝企業(yè)營銷問題,基于4C理論構(gòu)建“人物”數(shù)據(jù)庫,通過挖掘數(shù)據(jù)庫對消費者進行細分,并在此基礎(chǔ)上,從營銷角度建立精準(zhǔn)的營銷細分模型;Zhang等[8]提出一種基于電信大數(shù)據(jù)挖掘的高檔汽車營銷模型以預(yù)測潛在的高端豪華車購買者,采用邏輯回歸算法與神經(jīng)網(wǎng)絡(luò)挖掘算法構(gòu)建預(yù)測模型。但由于運營商掌握的數(shù)據(jù)粒度無法像企業(yè)自身掌握的那么精細,可能使機器學(xué)習(xí)建模結(jié)果受到影響;Chen等[9]針對汽車銷售的個性化推薦需求,提出汽車個性化分析與推薦模型,根據(jù)用戶購車行為習(xí)慣建立評估算法,通過機器學(xué)習(xí)方法訓(xùn)練評估模型參數(shù),從而獲得用戶購車排名,并通過真實數(shù)據(jù)集測試了算法有效性。但其提出的極大似然估計評估模型,僅考慮了少量汽車選擇條件概率,從概率論角度評估模型的完備性不夠充分,評估效果自然會受到影響;Peng等[10]采用爬蟲技術(shù)對用戶瀏覽汽車網(wǎng)頁的行為進行收集分析,然后對收集到的信息進行順序化處理與清洗,在此基礎(chǔ)上使用Apriori算法挖掘用戶瀏覽網(wǎng)頁的行為關(guān)聯(lián)規(guī)則,從而為網(wǎng)站提供個性化的用戶信息,以便為用戶推薦感興趣的汽車信息;Oiao-man[11]介紹基于分布式處理技術(shù)的分析挖掘技術(shù),設(shè)計并實現(xiàn)了基于電信網(wǎng)絡(luò)包業(yè)務(wù)平臺的精準(zhǔn)營銷系統(tǒng)。該方案使用K-means劃分基于用戶的業(yè)務(wù)支付特征,Hadoop用于算法的并行實現(xiàn)?;贛 apReduce實現(xiàn)的精準(zhǔn)營銷應(yīng)用還有很多[12-15],借助MapReduce強大的批數(shù)據(jù)處理能力,可以很好地實現(xiàn)對數(shù)據(jù)的清洗任務(wù);文獻[16]-[18]介紹了基于貝葉斯推斷的推薦算法。
其中,本文研究方法與文獻[7]相似,都采用了大量專家經(jīng)驗,但研究領(lǐng)域不同,研究的數(shù)據(jù)也不同;本文研究與文獻[8]、[9]相比,優(yōu)勢在于本文研究重點是用戶行為分析,通過對用戶行為的分析計算意向性得分,通過處理用戶上網(wǎng)日志分析用戶行為,結(jié)果不受其它數(shù)據(jù)影響;文獻[10]與本文研究都是根據(jù)用戶瀏覽網(wǎng)頁的痕跡信息挖掘用戶喜好,推薦個性化服務(wù),但與本文研究不同的是,該研究僅使用傳統(tǒng)Apriori算法發(fā)現(xiàn)關(guān)聯(lián)規(guī)則,而沒有開發(fā)新的算法;與文獻[11]相比,本文算法的優(yōu)勢在于其是基于Spark實現(xiàn)的,計算速度更快;與文獻[16]-[18]相比,本文研究可以有效地克服冷啟動與數(shù)據(jù)稀疏問題。
2 汽車精準(zhǔn)營銷算法
設(shè)s表示用戶購車意向分?jǐn)?shù),be表示行為得分,p表示價格契合度,br表示品牌契合度,。表示汽車類APP偏好得分。s定義為:
s=be×p×br×a
根據(jù)專家經(jīng)驗.各因子對用戶購車行為影響大小的關(guān)系為be>p>br>a。be由用戶上網(wǎng)瀏覽痕跡計算得出,相比其它因子更能反映出用戶關(guān)注的內(nèi)容;其次是p,價格通常是用戶在購車過程中考慮的重要因素;然后是br,在用戶購車過程中,一般也會考慮汽車品牌;最后是a,用戶可以通過汽車類APP了解汽車信息,也可以通過其它渠道了解,加上汽車類APP種類繁多,大多存在購車功能,導(dǎo)致a相比其它因子對用戶購車意向影響較小。
行為是指用戶在汽車類APP上瀏覽時的操作,行為對用戶購車意向的影響稱為行為權(quán)重,記為w,根據(jù)專家經(jīng)驗得出不同行為權(quán)重大小關(guān)系為:提交個人信息獲取底價>查看經(jīng)銷商>車型對比>查看貸款購車>查看購車計算器>詢底價>預(yù)約試駕>提車。設(shè)t表示該行為發(fā)生的次數(shù),be定義為:
式(2)可以用JAVA Math類中的loglp方法實現(xiàn),利用該方法參數(shù)與1求和的自然對數(shù),可實現(xiàn)對數(shù)值的平滑處理。隨著某行為發(fā)生次數(shù)的增加,次數(shù)對行為得分的影響逐漸降低,行為得分保持平緩增長。
價格契合度表示用戶瀏覽汽車價格的穩(wěn)定性,價格契合度越高,表示用戶瀏覽汽車的價格越接近,越低則代表表示用戶瀏覽汽車的價格波動越大。通常價格契合度越高,用戶購車意向越強。p定義為:
品牌契合度反映用戶瀏覽汽車品牌的集中性。品牌契合度越高,說明用戶對某品牌的關(guān)注度越高,購買該品牌的意向越強烈。設(shè)用戶瀏覽車系對應(yīng)品牌的出現(xiàn)次數(shù)為bsi,用戶瀏覽的車系數(shù)量為bs,br定義為:
br=√bsi|bs
(6)
將汽車類APP分成兩類,一類是汽車愛好者類APP,一類是購車類APP。設(shè)購車類APP出現(xiàn)次數(shù)為at,APP出現(xiàn)總次數(shù)為sat,a定義為:
a=1+at/sat
(7)
根據(jù)以上分析,面向運營商大數(shù)據(jù)的汽車精準(zhǔn)營銷算法流程如圖1所示。
精準(zhǔn)營銷算法偽代碼為:
Input:用戶上網(wǎng)日志
Output:潛在購車用戶信息
1.begin
2.讀取行為權(quán)重和汽車信息;
3.廣播行為權(quán)重和汽車信息;
4.i=0:
5.repeat
6.獲取行為權(quán)重和汽車信息廣播值;
7.car= carlnfo;/*關(guān)聯(lián)汽車信息*/
8.w= behaviorWeight;
9.if(汽車價格不為O)then
10.do totaIPrice= totalPrice+ t*ori_price;/*總價*/
11. be=be+ w*loglp(t+1);/
12.
totalAudi= totalAudi+ audi;
13.
brandList= brandList+ hrand:
14. if(audi>l|| audi==l &t>1)then
15.
do avgPrice= totaIPrice/t;
16.
avgWeigPrice= sum( be*avgPrice) /smu( be);
17.
p=pow (0.5, abs (avgPrice - avgWeigPrice), avg-WeigPrice);
18.
br=sqrt( brandList.length/totaIAudi);
19.
if(是購車類APP) then
20. dox+x+t:
21.
a=l+x/t;
22.
s=be*p*br*a
23.
else
24. do delete midResult[i];
25. else
26. do delete midResult[i];
27. until i
28.文件輸出
29. end
3 實驗研究
3.1 數(shù)據(jù)準(zhǔn)備
實驗所需用戶上網(wǎng)日志樣例如圖2所示。
對圖2中數(shù)據(jù)進行預(yù)處理后,在HDFS上輸出的中間結(jié)果如圖3所示。其中,手機號已經(jīng)過脫敏處理,APP和行為均使用編碼代替。具體實驗環(huán)境如表1所示。
3.2 結(jié)果分析
通過兩組實驗驗證以上提出的算法。
第一組實驗選取5天的汽車用戶上網(wǎng)日志數(shù)據(jù),采用天數(shù)逐漸遞增的方式讀取數(shù)據(jù),即第一天讀取一天的數(shù)據(jù),第二天讀取前兩天的數(shù)據(jù),以此類推直到第五天讀取前五天數(shù)據(jù)。實驗數(shù)據(jù)集如表2所示。
分別在5個數(shù)據(jù)集上運行以上提出的精準(zhǔn)營銷算法,然后根據(jù)客戶實際需求,在每天輸出結(jié)果中取分?jǐn)?shù)最高的前1 000個用戶進行外呼營銷。同時,采用某運營商現(xiàn)有推薦算法篩選出1 000個用戶進行外呼營銷。二者成功用戶數(shù)對比如圖4所示。此處的成功是指利用營銷話術(shù)進行推薦后,成功要到用戶聯(lián)系方式。
從圖4可知,在5天的數(shù)據(jù)集中,面向運營商大數(shù)據(jù)的汽車精準(zhǔn)營銷算法的成功用戶有299人,成功率為5.98%,高于某運營商現(xiàn)有推薦算法,其成功用戶共有53人,成功率為1.06%。
根據(jù)程序輸出日志統(tǒng)計結(jié)果,算法在不同數(shù)據(jù)集下運行時長如圖5所示。
從圖5可知,面向運營商大數(shù)據(jù)的汽車精準(zhǔn)營銷算法處理20G數(shù)據(jù)量需要lOmin左右,隨著數(shù)據(jù)量的增加,消耗時間的增長趨勢減緩。目前在公司內(nèi),通常情況下采用7天數(shù)據(jù)運行一次算法,預(yù)計耗時0.5h以內(nèi)。在硬件資源固定的情況下,該時間可以被企業(yè)接受。
第二組對比實驗場景為汽車線上廣告。企業(yè)與某互聯(lián)網(wǎng)廣告平臺合作,進行汽車線上廣告營銷。合作方提供9 000個帶標(biāo)簽的運營商用戶信息,其中可以識別的特征有終端、話費、APP偏好、購物偏好等共52個,去除其中的無效特征,選擇其中的22個特征作為輸入,用這些數(shù)據(jù)分別訓(xùn)練Spark MLlib中的邏輯回歸算法與決策樹算法。分別采用面向運營商大數(shù)據(jù)的汽車精準(zhǔn)營銷算法與上述兩種算法篩選出100萬個用戶,對其進行互聯(lián)網(wǎng)廣告營銷,分別統(tǒng)計每種算法的廣告點擊率,實驗結(jié)果如表4所示。
面向運營商大數(shù)據(jù)的汽車精準(zhǔn)營銷算法優(yōu)勢在于對輸入數(shù)據(jù)的要求低于邏輯回歸算法和決策樹算法。主要體現(xiàn)在:
(1)面向運營商大數(shù)據(jù)的汽車精準(zhǔn)營銷算法對原始數(shù)據(jù)的加工次數(shù)少于邏輯回歸算法和決策樹算法,只需對用戶上網(wǎng)日志數(shù)據(jù)加工一次即可得到所需的輸人數(shù)據(jù),而邏輯回歸算法和決策樹算法需要消耗更多的集群資源與數(shù)據(jù)資源對其所需的特征數(shù)據(jù)作多次加工,導(dǎo)致企業(yè)營銷成本增加。
(2)邏輯回歸算法和決策樹算法非常依賴特征數(shù)據(jù)選取與訓(xùn)練數(shù)據(jù)集,若選擇無效特征或訓(xùn)練數(shù)據(jù)量不夠,都會影響算法準(zhǔn)確性。然而,面向運營商大數(shù)據(jù)的汽車精準(zhǔn)營銷算法通過用戶上網(wǎng)日志分析用戶行為,可以大大降低無效特征的影響;采用專家經(jīng)驗和統(tǒng)計學(xué)公式計算用戶購車意向得分,其結(jié)果不受訓(xùn)練數(shù)據(jù)量影響。
上述實驗結(jié)果充分表明面向運營商大數(shù)據(jù)的汽車精準(zhǔn)營銷算法具有一定的可行性與有效性。
4 結(jié)語
由于不同行業(yè)用戶需求的多樣性,提出一個普遍適用的精準(zhǔn)營銷算法是非常困難的。本文提出的面向運營商大數(shù)據(jù)的汽車精準(zhǔn)營銷算法結(jié)合了專家經(jīng)驗與統(tǒng)計學(xué)相關(guān)計算方法,可以幫助企業(yè)在運營商大數(shù)據(jù)中找到購車潛在客戶。主要工作為:①提出用戶購車意向分?jǐn)?shù)計算方法,該方法對于汽車行業(yè)的精準(zhǔn)營銷具有一定借鑒意義;②提出面向運營商大數(shù)據(jù)的汽車精準(zhǔn)營銷算法,基于算法實現(xiàn)的程序現(xiàn)已部署在運營商集群中,為合作企業(yè)帶來了一定收益。
然而,本文研究還有需要完善的地方,如需要進一步提升算法成功率與執(zhí)行效率。另外,提升算法在不同行業(yè)精準(zhǔn)營銷的適用性也是下一步研究的重點。
參考文獻:
[1] 嚴(yán)明.基于大數(shù)據(jù)的精準(zhǔn)營銷應(yīng)用研究[D].蘭州:蘭州交通大學(xué), 2016.
[2]林權(quán),盧軍,嚴(yán)雄偉.基于大數(shù)據(jù)的運營商精準(zhǔn)營銷系統(tǒng)應(yīng)用研究[J].電子測試,2016( Zl):51-54.
[3] 陳鵬.基于大數(shù)據(jù)的A房地產(chǎn)公司精準(zhǔn)營銷研究[D].大連:大連海事大學(xué),2016.
[4] 張云勇,電信運營商大數(shù)據(jù)發(fā)展建議[J].電信科學(xué),2018(1):103-108.
[5] 陳科帆,周洪成.電信運營商大數(shù)據(jù)資源變現(xiàn)模式及策略研究[J].移動通信,2016(1):63-67.
[6]李研,高書波,馮忠偉.基于運營商大數(shù)據(jù)技術(shù)的精準(zhǔn)營銷應(yīng)用研究[J].信息技術(shù),2017(5):178-180.
[7]LIUH,HUI L U. RUAN J, et al. Research on precision marketing seg-mentation model based on mining“persona”[J]. Journal of Silk,2015,52( 12):37-42.
[8]ZHANG H,ZHANG L, CHENC X. et al.A novel precision marketingmodel based on telecom big data analysis for luxury cars[C].Interna-tional Symposium on Communications&Information Technologies,2016:307-311.
[9]CHEN Z, FENC Y. LI H.A novel Top-K automohiles prohabilisticrecommendation model using user preference and user communitv[C]. 2014 IEEE llth International Conference on e-Business Engi- neering,2014: 105-111.
[10]PENG Y,YU K.User hehavior analysis of automobile websites basedon distrihuted computing and sequential pattern mining [Cl. 2016 IEEE International Conference on NetWork Infrastructure and DigitalContent.2016:84-88.
[11]LIU Q.Design and implementation of precision marketing system un—der cloud computing environment[C].2017 International Conferenceon Smart Grid and Electrical Automation. 2017: 231-234.
[12] 曾小青,張若欣,歐陽文光,等.大數(shù)據(jù)環(huán)境下精準(zhǔn)客戶定位的社交網(wǎng)絡(luò)分析[J].計算機工程與應(yīng)用,2017( 15):85-94.
[13] 盧坤.云平臺上日志存儲與分析系統(tǒng)關(guān)鍵技術(shù)研究[D].合肥:中國科學(xué)技術(shù)大學(xué),2015.
[14] 張韜.基于在線視頻用戶數(shù)據(jù)的DMP系統(tǒng)的設(shè)計與實現(xiàn)[D].北京:北京交通大學(xué),2016.
[15] 鄒倩穎,王小芳.改進遺傳算法在實體商業(yè)中精準(zhǔn)營銷研究與實現(xiàn)[J].現(xiàn)代電子技術(shù),2018,41( 13):185-189.
[16] 范敏.基于貝葉斯網(wǎng)絡(luò)的學(xué)習(xí)與決策方法研究及應(yīng)用[D].重慶:重慶大學(xué),2008.
[17] 吳瓊玲.貝葉斯網(wǎng)絡(luò)模型在旅游大數(shù)據(jù)分析中的應(yīng)用[D].哈爾濱:黑龍江大學(xué),2018.
[18]姚衡.基于貝葉斯網(wǎng)絡(luò)的大數(shù)據(jù)因果關(guān)系挖掘[D].昆明:云南財經(jīng)大學(xué),2016.
(責(zé)任編輯:黃?。?/p>
基金項目:國家自然科學(xué)基金項目( 61672041)
作者簡介:慕善文(1993-),男,北方工業(yè)大學(xué)信息學(xué)院碩士研究生,研究方向為大數(shù)據(jù)處理;趙會群(1960-),男,博士,北方工業(yè)大學(xué)信息學(xué)院教授,研究方向為軟件工程和大數(shù)據(jù)收理。