陳 云,張會(huì)榮,2,朱 萍
(1.上海財(cái)經(jīng)大學(xué) 公共經(jīng)濟(jì)與管理學(xué)院,上海 200433;2.云南曲靖師范學(xué)院 物理系,云南 曲靖 655000)
隨著信息技術(shù)的迅猛發(fā)展和企業(yè)競(jìng)爭(zhēng)的加劇,產(chǎn)品和服務(wù)的差異越來越小。以產(chǎn)品為中心、以市場(chǎng)為中心的企業(yè)管理理念逐漸被以客戶為中心所替代[1]??蛻絷P(guān)系管理強(qiáng)調(diào)的是企業(yè)與客戶長(zhǎng)期的價(jià)值互動(dòng)關(guān)系,最大化長(zhǎng)期互動(dòng)關(guān)系的效用,實(shí)現(xiàn)客戶與企業(yè)的雙贏??蛻舫蔀楣咀钪匾馁Y產(chǎn),成為市場(chǎng)競(jìng)爭(zhēng)的焦點(diǎn)。誰能掌握客戶的需求趨勢(shì)、加強(qiáng)與客戶的關(guān)系、優(yōu)先挖掘和管理客戶資源,誰就能獲得市場(chǎng)競(jìng)爭(zhēng)的優(yōu)勢(shì),在激烈的競(jìng)爭(zhēng)中立于不敗之地。
客戶生命周期價(jià)值計(jì)量,作為客戶關(guān)系管理研究的核心內(nèi)容之一,是企業(yè)識(shí)別價(jià)值客戶的最有效的依據(jù)。如果度量不準(zhǔn)確,企業(yè)將無法準(zhǔn)確定位價(jià)值客戶,更談不上對(duì)其進(jìn)行保留和發(fā)展,客戶長(zhǎng)期價(jià)值最大化目標(biāo)更是無法實(shí)現(xiàn)。
Barbara bond Jackson(1985)奠定了這一領(lǐng)域研究的基礎(chǔ),指出客戶生命周期價(jià)值有賴于客戶在生命周期的每一階段增加企業(yè)收益以及降低成本的能力[2]。Berger&Nasr(1998)在此基礎(chǔ)上引入客戶保持率參數(shù),使CLV計(jì)量模型有了更實(shí)際的應(yīng)用價(jià)值,公式如下[3]:
其中,π(i)是以時(shí)間i為自變量的客戶利潤(rùn)函數(shù);γ為客戶保持率;d為折現(xiàn)率;n客戶全生命周期時(shí)間。
然而目前利用此模型進(jìn)行客戶生命周期價(jià)值計(jì)量存在著以下問題:
首先,客戶保持率的估計(jì)通常以常量客戶保持率代替,或是僅以客戶在企業(yè)中所處的時(shí)間進(jìn)行粗略估算。
由于實(shí)際的客戶保持率與常量客戶保持率之間存在著較大的差異,用常量的客戶保持率來簡(jiǎn)單的估計(jì)實(shí)際客戶保持率會(huì)造成較大的誤差,從而使客戶生命周期價(jià)值的計(jì)量不準(zhǔn)確[4];若僅以客戶在企業(yè)中所處的時(shí)間對(duì)客戶保持率進(jìn)行估計(jì),雖可解決常量客戶保持率的問題,卻無法在客戶生存時(shí)間的分布未知的情況下較為精確地估計(jì)出客戶的動(dòng)態(tài)保持率。
其次,在對(duì)客戶全生命周期時(shí)間的估計(jì)中,現(xiàn)有文獻(xiàn)大多假定其為某個(gè)常量值,并根據(jù)經(jīng)驗(yàn)進(jìn)行估計(jì),缺乏科學(xué)性。
因此,在進(jìn)行客戶價(jià)值計(jì)量時(shí),如何對(duì)動(dòng)態(tài)的客戶保持率和客戶生命周期時(shí)間進(jìn)行較為精確的估計(jì),顯得尤為重要[5]。
生存時(shí)間是測(cè)量某事件出現(xiàn)的時(shí)間,生存時(shí)間的分布可用生存函數(shù)進(jìn)行描述[6]。將生存函數(shù)引到動(dòng)態(tài)的客戶保持率上,客戶保持率實(shí)際上就是客戶生命時(shí)間的分布。
因客戶生存數(shù)據(jù)包括許多協(xié)變量,且生存時(shí)間的分布未知,通過分析和比較發(fā)現(xiàn),比例危險(xiǎn)模型即Cox模型能很好地解決這一問題,運(yùn)用客戶的生存時(shí)間和客戶的屬性(如基本特征、行為屬性等)來估計(jì)生存函數(shù)/危險(xiǎn)函數(shù)。
比例危險(xiǎn)(Proportional Hazard,PH)模型具有如下性質(zhì):不同個(gè)體的危險(xiǎn)函數(shù)成比例,即兩個(gè)伴隨變量向量x1和x2下的危險(xiǎn)函數(shù)之比h(t|x1)/h(t|x2)不隨t的變化而變化。它以危險(xiǎn)函數(shù)作為因變量,公式如下:
其中,x=(x1,x2,……,xp)為協(xié)變量;β1(i=1,2,…,p)為回歸系數(shù);h0(t)是x=(x1,x2,……,xp)均為0時(shí)的個(gè)體基本危險(xiǎn)函數(shù)。
由危險(xiǎn)函數(shù)與生存函數(shù)的關(guān)系知,基于Cox模型的生存函數(shù)為:
其中,r(t)為時(shí)刻t永久性流失客戶的累積保持率;βj(j=1,2,…,p)為伴隨變量xj(j=1,2,…,p)的回歸系數(shù);r0(t)為時(shí)刻t永久性流失客戶的基準(zhǔn)累積保持率(即無風(fēng)險(xiǎn)下t時(shí)的客戶累積保持率)。此即為客戶在t時(shí)期的動(dòng)態(tài)保持率,可由Cox回歸分析得到。
對(duì)客戶生命周期時(shí)間進(jìn)行估計(jì)。典型客戶的客戶保持率下降到50%時(shí)所經(jīng)歷的時(shí)間段即為該客戶所在客戶群的平均全生命周期時(shí)間。如圖1:
圖1 客戶生命周期T的計(jì)算原理圖
設(shè)T為所要求的細(xì)分客戶的全生命周期時(shí)間,即典型客戶的累積保持率下降到50%時(shí)所經(jīng)歷的時(shí)間段;ta為恰好小于T的生存時(shí)間;tb為恰好大于T的生存時(shí)間;S(ta)、S(tb)分別為客戶在ta、tb的累積生存率,即累積客戶保持率。則由線性內(nèi)插法有:
由上述線性內(nèi)插法得到的T即為典型客戶的全生命周期時(shí)間。
假設(shè)客戶在生命周期中經(jīng)歷三個(gè)階段:發(fā)展期、成熟期、衰退期。對(duì)于t1和t2(客戶生命周期中各階段的轉(zhuǎn)折時(shí)點(diǎn))這兩個(gè)客戶生命周期中時(shí)間躍變點(diǎn)(如圖2)
圖2 客戶生命周期框架下的客戶利潤(rùn)曲線
相應(yīng)的利潤(rùn)函數(shù)如下:
本論文通過式(5)中求解下列兩方程來得到:
通過t1和t2這兩個(gè)時(shí)間躍變點(diǎn),可以很清楚地知道某客戶當(dāng)前所處在的生命階段,從而可以區(qū)別出CLV隨時(shí)間變化的不同階段,進(jìn)而使CLV模型的計(jì)算誤差大大減小。
根據(jù)上述方法求解客戶生命周期價(jià)值計(jì)量模型中各參數(shù),得到基于生存特征的CLV計(jì)量模型:
π1(t)、π2(t)和π3(t)為客戶分別在發(fā)展期、成熟期和衰退期的利潤(rùn)函數(shù),是對(duì)歷史客戶利潤(rùn)進(jìn)行擬合得到的函數(shù)??蛻衾麧?rùn)函數(shù)反映了客戶利潤(rùn)在客戶生命周期的變化趨勢(shì),是CLV模型中的一個(gè)重要參數(shù)。d為折現(xiàn)率。
r(t)為由Cox回歸模型得到的客戶保持率函數(shù)。令r(r,t+1)表示客戶在時(shí)間段[t,t+1]上的條件客戶保持率,r(t)表示客戶在時(shí)刻t的累積客戶保持率,是由動(dòng)態(tài)變量確定的各期客戶條件保持率之積,即:
當(dāng)客戶利潤(rùn)保持不變時(shí),累積客戶保持率越大,此客戶的生命周期價(jià)值就越大;反之,則越小。
T為客戶生命周期時(shí)間,由上述公式(3)求得的解。T越大,說明客戶生命周期時(shí)間越長(zhǎng),也即客戶在企業(yè)內(nèi)停留得越久,此客戶的生命周期價(jià)值也越大;反之,會(huì)越小。t1和t2分別為客戶由發(fā)展期進(jìn)入成熟期、由成熟期進(jìn)入衰退期的時(shí)間點(diǎn),分別由式(6)、式(7)求得。它們可很好地定位某當(dāng)前客戶生命周期的所處階段。
CLV模型的三個(gè)部分是隨著時(shí)間的推移逐漸地加入到客戶生命周期價(jià)值的計(jì)量中的,并且隨著時(shí)間的推移,三個(gè)部分在CLV模型中的比例會(huì)逐漸發(fā)生變化,直至客戶退出。
本案例所采用的數(shù)據(jù)集為某電信公司客戶數(shù)據(jù)記錄。抽取其中1000條記錄組成本次研究的樣本,對(duì)其進(jìn)行分析??蛻魯?shù)據(jù)包含 42個(gè)屬性,有 tenure、age、marital、address、ed、employ、retire、gender、custcat、ebill、internet、churn等。 其中churn為狀態(tài)變量,若其值為1,則表示該客戶在觀察期內(nèi)流失;若其值為0,則表示該客戶在觀察期結(jié)束時(shí)未流失,仍然在企業(yè)內(nèi)。
表1展示了全部屬性中的一部分(因?qū)傩暂^多,此處并未展示全部屬性):
表1 部分客戶屬性及其解釋
一般來說,原始數(shù)據(jù)是“臟”數(shù)據(jù),不可避免地存在著一些空缺值、噪聲數(shù)據(jù)、不正確數(shù)據(jù)等。直接采用“臟”數(shù)據(jù)進(jìn)行分析,可能使建模過程陷入混亂,導(dǎo)致不可靠的輸出,因此在對(duì)數(shù)據(jù)進(jìn)行建模分析之前,需要對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,如屬性規(guī)約、數(shù)據(jù)變換等。
通過對(duì)數(shù)據(jù)的預(yù)處理,刪除了具有較強(qiáng)相關(guān)性的11個(gè)屬性,其余31個(gè)屬性進(jìn)行生存分析。
采用Cox回歸分析法進(jìn)行生存分析。在對(duì)數(shù)據(jù)進(jìn)行模型建立前需要對(duì)成比例危險(xiǎn)性假設(shè)進(jìn)行檢驗(yàn)。運(yùn)用SPSS 13.0中的Analyze對(duì)各分層屬性進(jìn)行逐個(gè)檢驗(yàn),即在保持其他協(xié)變量不變的前提下,分別作出每層的累積危險(xiǎn)性與時(shí)間對(duì)數(shù)曲線,并根據(jù)以下依據(jù)進(jìn)行判別:若曲線之間是接近平行且垂直等距的,那么該協(xié)變量滿足PH假設(shè);若曲線之間相互交叉,則不滿足PH假設(shè)。
判別結(jié)果所有屬性都符合成比例危險(xiǎn)性的假設(shè),因此所有屬性都將進(jìn)入Cox回歸分析。
運(yùn)用SPSS 13.0進(jìn)行Cox回歸分析,得生存函數(shù)圖和累積危險(xiǎn)函數(shù)圖,分別如圖4、圖5所示:
圖4 生存函數(shù)圖
結(jié)果表明,在最初的10個(gè)月里,客戶的累積生存率基本為1,其累積危險(xiǎn)率基本為0,兩者在此期間沒有太大的波動(dòng)。表明在最初的10個(gè)月里,很少有客戶會(huì)離開該電信公司。在隨后的50個(gè)月里(由10個(gè)月到近60個(gè)月),客戶的生存率急速下降,到60個(gè)月幾乎為0,而累積危險(xiǎn)率也急速上升。表明此時(shí)間段客戶流失現(xiàn)象比較嚴(yán)重。60個(gè)月之后,客戶的累積保持率曲線趨于平緩,如圖4所示,這表明活過60個(gè)月的客戶以后存活機(jī)會(huì)趨向穩(wěn)定,但生存率非常低。
圖5 累積危險(xiǎn)函數(shù)圖
同時(shí),通過對(duì)數(shù)據(jù)的Cox回歸分析,得到進(jìn)入Cox回歸模型的屬性及其回歸系數(shù),如下表(表2)所示:
表2 方程中的變量
表2中,各協(xié)變量都是以0.05的顯著性水平以逐步向前最大似然法(LR)篩選出來的。
表2中,address變量的風(fēng)險(xiǎn)度為0.574,而回歸系數(shù)為負(fù),可認(rèn)為employ是一個(gè)保護(hù)變量,客戶在現(xiàn)在住處所待的年數(shù)越長(zhǎng),在該電信企業(yè)中存留的可能性也就越高。同時(shí),由表 2可知,address的風(fēng)險(xiǎn)度的 95%置信區(qū)間 (CI)為:[0.335,0.928]。其他各協(xié)變量的解釋以此類推。
故其危險(xiǎn)函數(shù)的回歸模型為:
其中,xi(i=1,2,…,7)依次表示表3中的協(xié)變量。如x1表示address、x2表示employ等;h(t)表示客戶在時(shí)刻t的流失概率,h0(t)表示當(dāng)所有危險(xiǎn)因素都不存在時(shí),時(shí)刻t的基準(zhǔn)流失概率。
由表3可知,對(duì)式(10)、式(11)所表示的模型進(jìn)行有效性檢驗(yàn),Sig.值多為0.000,以0.05檢驗(yàn)水平,拒絕無效假設(shè),因此該模型是有效的。
表3 模型系數(shù)檢驗(yàn)(Step:6)
客戶的動(dòng)態(tài)保持率函數(shù)如下所示:
其中,t>0,S(t)為客戶在時(shí)刻的累積保持率;為典型客戶在時(shí)刻的基準(zhǔn)累積保持率,可由生存表Survival Table查得。
假設(shè)有某客戶,其在現(xiàn)居住地已居住15年,在現(xiàn)被雇傭的公司待了10年,沒有ebill業(yè)務(wù),上個(gè)月的長(zhǎng)途花費(fèi)在取對(duì)數(shù)后為0.31,在除上個(gè)月的long distance、calling card花費(fèi)之外的從進(jìn)入該電信公司的所有的long distance、calling card花費(fèi)在取自然對(duì)數(shù)后分別為1.52和1.63,需要求出客戶在第13個(gè)月仍在該電信公司的可能性,或此客戶的累積保持率。
將各協(xié)變量的取值及基準(zhǔn)累積生存率代入式(11),有
此即為該客戶在此電信公司能留存 13個(gè)月的生存率。與其原值(0.72111)相比,預(yù)測(cè)值只和它相差約0.0066,即誤差百分比為0.9%。說明該模型的預(yù)測(cè)效果較好。
由Survival Table可知:
表4 Survival Table的一部分
t1=45,r(t1)=0.504,t2=46,r(t2)=0.479。則由線性內(nèi)插法知,當(dāng)r(T)=0.5時(shí),可得下式:
也即,
則,T≈45.2,即客戶的平均全生命周期時(shí)間約為45.2個(gè)月,約為3.8年。
假設(shè)該企業(yè)典型客戶生命周期利潤(rùn)函數(shù)如下:
由式(6)(7)可得,t1和t2分別為15個(gè)月(1.25年)和37個(gè)月(3.1年)。
根據(jù)基于生存特征的客戶生命周期價(jià)值計(jì)量模型,假設(shè)折現(xiàn)率為10%,則客戶的生命周期價(jià)值為:
對(duì)于該電信企業(yè),當(dāng)某客戶的具體屬性的取值已知時(shí),其在全生命周期下的CLV可由上式(14)求得。
本文通過引入生存函數(shù)中的Cox回歸模型,很好地解決了客戶的生存時(shí)間分布未知的情況下,如何求解客戶保持率的問題,并依據(jù)由此得到的客戶保持率估計(jì)出了典型客戶的全生命周期時(shí)間,最終得到了基于生存特征的CLV計(jì)量模型,并通過實(shí)例中分析驗(yàn)證了模型的可行性與適用性。
[1]Yun Chen,Guozheng,Zhang,Dengfeng,Hu,Shanshan,Wang.Customer Segmentation in Customer Relationship Management Based on Data Mining[J].IFIP International Federation for Information Processing(IFIP),2006,207.
[2]Barbara Bund Jackson.Building Customer Relationship that Last [J].Harvard Business Review,1985,(11~12).
[3]Berger,P.D.,Nasr,NI.Customer Lifetime Value:Marketing Model and Application[J].Journal of Interactive Marketing,1998,12(1).
[4]齊佳音,舒華英,客戶價(jià)值評(píng)價(jià)、建模及決策[M].北京:北京郵電大學(xué)出版社,2004.
[5]譚躍雄,周娜.基于動(dòng)態(tài)客戶保持的企業(yè)客戶生命周期價(jià)值模型研究[J].管理科學(xué),2004,(6).
[6]ELISA T.LEE.譯者:陳家鼎、戴中維.生存數(shù)據(jù)分析的統(tǒng)計(jì)方法[M].北京:中國(guó)統(tǒng)計(jì)出版社,1998.