◆崔振浩 李真真 張愿 司晨雨
基于大數(shù)據(jù)的ToB客戶精準(zhǔn)營銷方法研究
◆崔振浩 李真真 張愿 司晨雨
(中移在線營銷服務(wù)中心 河南 450000)
在信息時代大數(shù)據(jù)的背景下,大數(shù)據(jù)已經(jīng)和ToB客戶營銷相融合,同時ToB市場進(jìn)入了快速發(fā)展期,為眾多企業(yè)帶來了更多的利潤增長點(diǎn)。由于ToB用戶數(shù)據(jù)信息較少,數(shù)據(jù)質(zhì)量較差,加上大數(shù)據(jù)呈現(xiàn)出據(jù)海量和復(fù)雜的趨勢,因此對客戶的信息的隱藏價值很難提取,挖掘數(shù)據(jù)價值的難度和成本進(jìn)一步加大。本文提出一種改進(jìn)的GBDT+LR算法,對營銷意向率較高的用戶進(jìn)行分類。用混沌粒子群的思想優(yōu)化GBDT+LR算法初始參數(shù)選取,并且運(yùn)用兩個ToB外呼營銷產(chǎn)品進(jìn)行比較驗證,實驗表明,本文算法在評價指標(biāo)方面有更高的得分。
ToB客戶營銷;粒子群算法;混沌理論;梯度提升樹
隨著社會的進(jìn)步發(fā)展,大數(shù)據(jù)、云計算已經(jīng)融入企業(yè)的經(jīng)營發(fā)展中,帶來了巨大的商業(yè)價值。同時企業(yè)之間的市場競爭更加嚴(yán)峻,企業(yè)在ToC市場空間趨于飽和的情況下尋求新的發(fā)展機(jī)遇,ToB類外呼營銷為企業(yè)帶來了新的利潤增長點(diǎn)的同時也帶來了新的風(fēng)險點(diǎn)[1]。隨著信息技術(shù)革新,企業(yè)面臨著更加海量的數(shù)據(jù),挖掘數(shù)據(jù)價值的難度和成本進(jìn)一步加大,尤其是個性化數(shù)據(jù)收集更加困難,獲取客戶的成本也越來越高,因此,企業(yè)比任何時候都需要基于數(shù)據(jù)驅(qū)動的精準(zhǔn)營銷。面對海量數(shù)據(jù),如何披沙瀝金,開展精準(zhǔn)營銷,是企業(yè)客戶迫切需要解決的難題[2]。
為增加ToB類精準(zhǔn)營銷的效率,國內(nèi)學(xué)者韓高等人基于logistic回歸算法篩選目標(biāo)客戶,提高了外呼效益并降低了被投訴風(fēng)險。算法利用后退逐步法的線性回歸算法,篩選外呼意向率高的用戶,但是ToB 用戶的特征信息比較少,logistic回歸算法沒有充分挖掘客戶信息[3],同時算法本身的準(zhǔn)確性存在一定的不足。在尋找算法最優(yōu)解方面國外學(xué)者M(jìn)alarvizhi K P等人,采用蟻群優(yōu)化算法尋找車聯(lián)網(wǎng)交通適配參數(shù),一定程度上提高了分配系統(tǒng)的性能,但是存在蟻群陷入局部極最優(yōu)解和收斂偏慢的不足[4]。
借鑒上述相關(guān)學(xué)者的研究,本文提出一種混沌粒子群改進(jìn)GBDT+LR的算法,通過混沌理論的思想優(yōu)化粒子群初始點(diǎn)的選擇和尋找最優(yōu)解的過程,對傳統(tǒng)的GBDT+LR進(jìn)行了改進(jìn)。解決了分類算法初始參數(shù)的選取問題,提高了算法的整體效率。在四川和飛速和江蘇企業(yè)寬帶產(chǎn)品中進(jìn)行算法比較,驗證本文算法的有效性。
與ToC業(yè)務(wù)不同,ToB業(yè)務(wù)的主要受眾是企業(yè)機(jī)構(gòu)的客戶群體,相較于C端用戶而言,B端客戶特點(diǎn)明顯:(1)服務(wù)產(chǎn)品單價高,利潤偏高,但客戶購買率偏低;(2)客戶數(shù)量遠(yuǎn)小于C端用戶,全國有工商注冊的法人機(jī)構(gòu)量級為4103萬;(3)整體上決策周期更長,且偏理性決策,因而,交易過程與服務(wù)周期較長。
其次,根據(jù)企業(yè)自身的經(jīng)營發(fā)展?fàn)顩r和信息化程度等因素,企業(yè)客戶需求呈現(xiàn)多樣化、等級化的特點(diǎn)。因此對用戶的區(qū)分的難度進(jìn)一步加大。本文首先對數(shù)據(jù)進(jìn)行融合提取,運(yùn)用機(jī)器學(xué)習(xí)算法來區(qū)分購買意向較高用戶和購買意向較低用戶。流程如圖1所示。
梯度提升樹(Gradient Boosting Decision Tree)是Friedman 提出的一種分類效果比較好的Boosting算法[5]?;舅枷胧峭ㄟ^算法迭代生成新的弱學(xué)習(xí)器,然后經(jīng)過公式計算不同弱學(xué)習(xí)器的權(quán)重累加得到一個強(qiáng)學(xué)習(xí)器,進(jìn)而對數(shù)據(jù)進(jìn)行預(yù)測。但不同的是GBDT要求弱學(xué)習(xí)器為CART模型,并且GBDT每個弱學(xué)習(xí)器訓(xùn)練的數(shù)據(jù)是前一個學(xué)習(xí)器預(yù)測結(jié)果的誤差,在誤差減小的梯度方向建立一個弱學(xué)習(xí)器,進(jìn)行不斷的迭代,從而通過線性組合基函數(shù)在訓(xùn)練中不斷減小誤差實現(xiàn)數(shù)據(jù)集的分類[6]。
圖1 外呼營銷數(shù)據(jù)處理流程圖
算法的損失函數(shù)如下:
則最優(yōu)解表示為:
對其進(jìn)行擴(kuò)展:
依據(jù)梯度下降計算學(xué)習(xí)率:
則:
在GBDT算法中,由M個弱學(xué)習(xí)器(決策樹)組成。那么使用GBDT進(jìn)行數(shù)據(jù)維度的擴(kuò)展,認(rèn)為每個樣本在決策樹落在決策樹的每個葉子上就屬于一個類別然后使用邏輯回歸[7]進(jìn)行數(shù)據(jù)預(yù)測,代入公式如下:
從而使用GBDT+LR對數(shù)據(jù)進(jìn)行預(yù)測。
GBDT+LR雖然在準(zhǔn)確率上有了明顯的提升。但是模型運(yùn)用了兩個算法,參數(shù)的尋優(yōu)過程中帶來了很大的計算量,如上文中邏輯回歸的學(xué)習(xí)率問題,GBDT算法中樹的最大深度,分類特征數(shù)等,尋常的網(wǎng)格搜索已滿足不了日益發(fā)展的生產(chǎn)的需要。粒子群優(yōu)化算法有著強(qiáng)大的全局搜索能力,因此本文提出將兩者結(jié)合構(gòu)建GPSO-GBDT+LR模型用于客戶精準(zhǔn)營銷。
算法中粒子的速度和位置參數(shù)計算如下:
實驗證明,PSO算法在大多問題解中具有很好的效果,但是在處理復(fù)雜問題的情況下容易陷入局部最優(yōu)解,并且初始粒子的選取對結(jié)果存在一定影響。因此本文對PSO算法進(jìn)行改進(jìn),對種群引入拓?fù)浣Y(jié)構(gòu)的思想,提出混沌粒子群優(yōu)化算法(GPSO),算法的評價指標(biāo)得到了提高。
混沌搜索策略中的混沌代表的一種狀態(tài),屬于拓?fù)渥兓T谙到y(tǒng)中表現(xiàn)混亂和隨機(jī)的一種現(xiàn)象,但是內(nèi)部存在著有序的規(guī)則,可以增加上文算法的對最優(yōu)解的全局搜索能力,同時混沌的運(yùn)動性是固定規(guī)則,不含有任何隨機(jī)的因素[9]。本采用混沌運(yùn)動獨(dú)特性的思想來提升隨機(jī)優(yōu)化算法的效率。
將得到的混沌向量利用下公式逆映射到原取值空間,其中代表區(qū)間上界,代表區(qū)間下界。
對群體最優(yōu)解進(jìn)行如上式混沌優(yōu)化搜索。
本文算法GPSO優(yōu)化GBDT+LR算法流程如下
Step 1:初始算法最大迭代次數(shù)和收斂精度,算法優(yōu)化的GBDT+LR的人工設(shè)置的參數(shù):學(xué)習(xí)率,最大數(shù)深度,學(xué)習(xí)器權(quán)重減系數(shù)等,混沌粒子群的種群規(guī)模等。
Step 2:根據(jù)(14),(15)混沌搜索初始化粒子群的速度和位置。
Step 3:粒子適應(yīng)度計算。
Step 4:根據(jù)計算的粒子的適應(yīng)度運(yùn)用公式(12),(13),更新相關(guān)位置和速度。
Step 5:最優(yōu)位置依據(jù)公式(14),(15)進(jìn)行混沌優(yōu)化。
Step 6:GBDT+LR參數(shù)是否優(yōu)化滿足迭代條件,若滿足算法結(jié)束,不滿足返回Step 3。
圖2 GPSO優(yōu)化GBDT+LR算法流程圖
傳統(tǒng)的GBDT+LR算法受初始參數(shù)的影響,并且GBDT算法運(yùn)行時間長,傳統(tǒng)的網(wǎng)格搜索法也達(dá)不到理想的程度。因此本文采用粒子群算法計算GBDT+LR算法的初始參數(shù),同時為減小粒子群容易在復(fù)雜問題時陷入局部極值的不足,加入混沌理論思想,對粒子群的粒子初始選擇和最優(yōu)參數(shù)的尋找進(jìn)行混沌優(yōu)化搜索,算法的運(yùn)行效率得到了進(jìn)一步的加強(qiáng)。
本文在四川、江蘇省份進(jìn)行實驗驗證。推薦的產(chǎn)品分別為四川和飛速、江蘇企業(yè)寬帶。正負(fù)樣本比例均為1:4。最大迭代次數(shù)80,慣性權(quán)重0.9,種群規(guī)模80,加速度系數(shù)為2,取5次實驗結(jié)果的平均值。實驗數(shù)據(jù)特征為工商數(shù)據(jù)集。包括經(jīng)營時長、注冊資金、行業(yè)門類、企業(yè)性質(zhì)、ARPU、是否樓宇、企業(yè)類別。評價指標(biāo)采用準(zhǔn)確率、精確率、召回率、AUC,其中AUC公式如下:
算法閾值選取0.3。
表1 產(chǎn)品算法對比表
圖3 和飛速AUC變化圖
圖4 企業(yè)寬帶AUC變化圖
可以看出本文算法在四個方面相對于邏輯回歸算法均取得了更優(yōu)的效果,對購買意向較高的用戶有更高的命中率。AUC值取得了理想的效果,說明本文算法更容易區(qū)分客戶之間的差異。證明本文算法通過對粒子群的粒子初始選擇和最優(yōu)參數(shù)的尋找過程進(jìn)行混沌理論優(yōu)化后,算法的整體效果得到了進(jìn)一步的加強(qiáng)。
本文針對ToB類營銷問題,和傳統(tǒng)的GBDT+LR算法受初始參數(shù)的影響,提出了一種基于混沌粒子群優(yōu)化GBDT+LR的算法。利用混沌算法的思想改進(jìn)粒子群算法進(jìn)而優(yōu)化GBDT+LR初始參數(shù)的選取,提高了算法的準(zhǔn)確率。采用四川和飛速與江蘇企業(yè)寬帶產(chǎn)品進(jìn)行和邏輯回歸算法驗證對比,結(jié)果表明本文算法在各方面有更高的效果。
[1]楊錦慧. 呼叫中心在線營銷運(yùn)營管理與營銷策略研究[D]. 北京郵電大學(xué),2009.
[2]Maulana A E,Nurulfirdausi K. Permissive, Aggressive or Apathetic? Indonesian Telemarketing Customer[J]. Procedia - Social and Behavioral Sciences,2015(169):69-74.
[3]韓高,朱正鍵,劉思泳. 基于Logistic回歸算法的外呼目標(biāo)客戶篩選方法[J]. 廣東通信技術(shù),2015(04):31-34.
[4] Malarvizhi K P,Devi G U,Gunasekaran M,et al. Ant colony optimization algorithm with Internet of Vehicles for Intelligent Traffic Control System[J]. Computer Networks,2018,144:154-162.
[5]Ding C,Cao X Y,Nass P.Applying gradient boosting decision trees to examine non-linear effects of the built environment on driving distance in Oslo[J].2018,110:107-117GBDT.
[6]Chang Y C,Chang K H,Wu g j.Application of eXtreme gradient boosting trees in the construction of credit risk assessment models for financial institutions[J]. Applied Soft Computing,2018,37:914-920.
[7]Ding C,Cao X Y,Nass P.Applying gradient boosting decision trees to examine non-linear effects of the built environment on driving distance in Oslo[J].2018(110):107-117.
[8]Alam S,Dobbie G,Rehman S U . Analysis of particle swarm optimization based hierarchical data clustering approaches[J]. Swarm and Evolutionary Computation,2015(25):36-51.
[9]Ravi V,Pradeepkumar D,Deb K . Financial time series prediction using hybrids of chaos theory, multi-layer perceptron and multi-objective evolutionary algorithms[J]. Swarm and Evolutionary Computation,2017(36):136-149.
[10]Klioutchnikov I,Sigova M,Beizerov N . Chaos Theory in Finance[J]. Procedia Computer Science,2017(119):368-375.