劉彩芬等
摘 要:文章將數(shù)據(jù)挖掘技術(shù)引入電信行業(yè)客戶細(xì)分研究,在電信客戶樣本集中提煉出有價(jià)值的信息,為電信企業(yè)客戶個(gè)性化及差異化服務(wù)設(shè)計(jì)提供依據(jù)。首先采用因子分析的方法實(shí)現(xiàn)電信客戶樣本集的維度約減,然后采用K-均值聚類的方法,將客戶樣本劃分為互不相交的6個(gè)大類,在此基礎(chǔ)上,分析歸并形成三個(gè)特征消費(fèi)群,最后,從資費(fèi)套餐設(shè)置、客戶保有策略、新客戶挖掘的三個(gè)維度分析并給出具體的實(shí)施策略。
關(guān)鍵詞:因子分析 K-均值聚類 客戶細(xì)分
中圖分類號:F274,TP270 文獻(xiàn)標(biāo)識碼:A
文章編號:1004-4914(2015)01-059-03
一、引言
隨著3G網(wǎng)絡(luò)的普及,越來越多的消費(fèi)者依賴于移動(dòng)終端應(yīng)用,電信消費(fèi)的模式也面臨從基本的通話費(fèi)用為主向以流量為主的模式轉(zhuǎn)變。特別是4G時(shí)代的到來,各大電信運(yùn)營商開始了新一輪的市場份額搶奪戰(zhàn)。如何充分利用電信業(yè)交易數(shù)據(jù)、管理數(shù)據(jù),挖掘蘊(yùn)含的客戶信息,建立移動(dòng)應(yīng)用客戶細(xì)分模型,從而實(shí)現(xiàn)更加精準(zhǔn)的營銷,是目前亟待解決的熱點(diǎn)問題。
數(shù)據(jù)挖掘的方法使得客戶細(xì)分成為可能。其中,聚類分析是一種非監(jiān)督型的數(shù)據(jù)挖掘方法,該方法從樣本數(shù)據(jù)出發(fā),探索樣本間的相似性,并將最相似的對象聚集為同簇。聚類分析的方法以其易用魯棒的優(yōu)勢,在商業(yè)領(lǐng)域的應(yīng)用取得了顯著的成效,其中,孫金華{1}等人采用K均值聚類方法設(shè)計(jì)中小企業(yè)客戶細(xì)分模型,徐昆{2}采用改進(jìn)的K均值聚類算法實(shí)現(xiàn)快速消費(fèi)品企業(yè)資源的最優(yōu)化配置。趙銘等人{(lán)3}采用聚類的方法,有效地識別基金理財(cái)客戶,并據(jù)此制定出相應(yīng)的個(gè)性化營銷方案。針對電信客戶細(xì)分,陳治平等人{(lán)4}則采用多種數(shù)據(jù)挖掘方法實(shí)現(xiàn)電信客戶細(xì)分,實(shí)驗(yàn)表明K均值聚類在電信客戶細(xì)分應(yīng)用中的有效性,但研究并不是以客戶是否使用移動(dòng)網(wǎng)絡(luò)作為細(xì)分的標(biāo)準(zhǔn)。
以往的研究為移動(dòng)互聯(lián)網(wǎng)應(yīng)用背景下的電信客戶細(xì)分研究提供了可借鑒的寶貴思路。面對日趨激烈的電信業(yè)市場競爭,如何充分利用電信客戶大數(shù)據(jù)信息,從中挖掘?qū)氋F的知識,從而更加深入地了解客戶,在產(chǎn)品趨于同質(zhì)化的情況下,為客戶提供差異化、多元化的電信產(chǎn)品和服務(wù),最終實(shí)現(xiàn)有效的客戶引導(dǎo),并保留客戶,具有重要的研究意義。
本文采用因子分析的方法,對電信客戶數(shù)據(jù)進(jìn)行屬性的約減,在此基礎(chǔ)上,采用K均值聚類的方法,對用戶樣本集合實(shí)施無監(jiān)督的機(jī)器學(xué)習(xí),根據(jù)客戶是否傾向使用電子支付和無線應(yīng)用作為聚類評判依據(jù),構(gòu)造電信客戶細(xì)分模型;最后,針對該細(xì)分模型給出有效的營銷策略。
二、電信客戶細(xì)分實(shí)現(xiàn)過程
目前電信企業(yè)資費(fèi)套餐類型在不斷地調(diào)整以滿足各類客戶的需求,但是由于受地方經(jīng)濟(jì)發(fā)展差異、消費(fèi)水平不等、互聯(lián)網(wǎng)時(shí)代消費(fèi)客戶消費(fèi)模式轉(zhuǎn)變等復(fù)雜因素影響,電信運(yùn)營整體出現(xiàn)雜亂無章的現(xiàn)象。雖然電信業(yè)從過去的舊理念“客戶得到的產(chǎn)品是他們所想要的”已經(jīng)轉(zhuǎn)變成“客戶得到了他們所想要的”{5},但是如果不能對電信客戶實(shí)施細(xì)致且準(zhǔn)確地分類,電信企業(yè)仍然無法針對客戶未來的成本、收入以及交叉銷售績效進(jìn)行精準(zhǔn)的評估,難以推出合理的營銷策略從而提升老客戶的粘性,增加新客戶的種類和數(shù)量。
本文采用某電信公司客戶樣本集作為研究對象,該數(shù)據(jù)集中共有1000套客戶數(shù)據(jù),每套數(shù)據(jù)14個(gè)維度,分別為居住地、年齡、婚姻狀況、家庭月收入(百元)、受教育水平、性別、家庭人口、基本服務(wù)累計(jì)開通月數(shù)、是否申請無線轉(zhuǎn)移服務(wù)、上月基本費(fèi)用、上月限制性免費(fèi)服務(wù)項(xiàng)目的費(fèi)用、無線服務(wù)費(fèi)用、是否電子支付、客戶所申請的服務(wù)套餐類型。在對數(shù)據(jù)集進(jìn)行極值處理、正常值選擇、數(shù)據(jù)缺失處理等一系列的數(shù)據(jù)清洗準(zhǔn)備工作后,形成用于研究分析的記錄共計(jì)995套。
1.因子分析。因子分析的方法能夠在錯(cuò)綜復(fù)雜的指標(biāo)中找出少數(shù)具有代表性的公因子,并將同質(zhì)的變量歸入一個(gè)因子,原數(shù)據(jù)樣本集的大部分信息可以通過較少的幾個(gè)因子反映,從而減少分析指標(biāo)的個(gè)數(shù),同時(shí)還可檢驗(yàn)變量間關(guān)系的假設(shè)。因子分析可以在不損失數(shù)據(jù)集信息量的情況下,減少數(shù)據(jù)分析的屬性維度,是一種基于多元統(tǒng)計(jì)分析的有效的數(shù)據(jù)維度約減方法。
本文采用SPSS STATISTICS軟件實(shí)現(xiàn)因子分析。首先對原始數(shù)據(jù)集進(jìn)行標(biāo)準(zhǔn)化處理,從而消除量綱和數(shù)量級對數(shù)據(jù)分析帶來的影響。然后,對數(shù)據(jù)數(shù)據(jù)集合指標(biāo)間的依賴程度進(jìn)行假設(shè)檢驗(yàn),判斷樣本集合是否適合采用因子分析實(shí)現(xiàn)指標(biāo)約減,檢驗(yàn)結(jié)果如表1所示。其中,KMO (Kaiser-Meyer-Olkin)統(tǒng)計(jì)量為0.788,巴特利特(Bartlett)球形度檢驗(yàn)值為5075.634,對應(yīng)的sig值為0.000,小于0.05的顯著水平,表明樣本集合適合做因子分析。此外,指標(biāo)間的相關(guān)系數(shù)矩陣也表明變量間存在顯著的相關(guān)性。
采用主成分分析的方法提取公因子,根據(jù)特征值大于1的原則,提取了具有代表性的公因子。由于初始因子載荷矩陣中因子含義不突出,因此采用最大正交旋轉(zhuǎn)變換進(jìn)行因子旋轉(zhuǎn)變換。經(jīng)過5次迭代后收斂,得到旋轉(zhuǎn)后的因子載荷矩陣,最終確定5個(gè)公因子。這5個(gè)公因子累計(jì)方差貢獻(xiàn)率達(dá)到86%,可以代表原有數(shù)據(jù)集中的14個(gè)指標(biāo)表達(dá)的電信客戶信息。
公因子提取及旋轉(zhuǎn)實(shí)驗(yàn)結(jié)果見表2。其中,公因子1在無線費(fèi)用、無線服務(wù)、套餐類型、免費(fèi)部分的載荷較大,代表客戶網(wǎng)絡(luò)綜合服務(wù)應(yīng)用情況;公因子2在開通月數(shù)、基本費(fèi)用、年齡和收入的載荷較大,代表客戶基本信息和傳統(tǒng)的電信服務(wù)應(yīng)用情況;公因子3在家庭人數(shù)、婚姻狀況的載荷較大,代表電信客戶家庭基本情況;公因子4在電子支付、教育水平的載荷較大,代表電信客戶的教育程度;公因子5居住地和性別上有較大的載荷,代表地區(qū)和性別差異所構(gòu)成的影響因素。
2.k-均值聚類。在因子分析得到的五個(gè)公因子的基礎(chǔ)上,本文選取K-均值聚類方法實(shí)現(xiàn)電信客戶細(xì)分。K-均值是典型的基于劃分的聚類算法,該方法將樣本數(shù)據(jù)間的距離作為評價(jià)樣本是否相似的重要度量標(biāo)準(zhǔn),通常規(guī)定樣本間的距離越近表示其相似度越高,同時(shí)保證類別和類別之間的距離盡可能大,即類間具有較高的差異性。通過K-均值算法的計(jì)算,樣本集合中距離較近的數(shù)據(jù)信息歸集起來,形成一個(gè)數(shù)據(jù)類(簇)。由于K-均值聚類算法的具有高可靠性和精準(zhǔn)性,以及算法的復(fù)雜度較低等優(yōu)勢,成為目前主流的聚類算法之一。基于K-均值聚類的電信客戶細(xì)分,是一個(gè)將電信客戶樣本集合中相似對象聚集的過程,在非監(jiān)督學(xué)習(xí)過程結(jié)束后,客戶樣本集合被聚集成具有相似性的簇,而簇與簇之間有著明顯的差異。
在實(shí)現(xiàn)K-均值聚類分析前,首先要保證K值選取的科學(xué)性。本文采用系統(tǒng)聚類的方法對樣本實(shí)施類別的探索性實(shí)驗(yàn),從而確定K-均值聚類的K值,根據(jù)系統(tǒng)聚類譜系圖分析,確定K值的最優(yōu)取值為6。
本文采用SPSS STATISTICS實(shí)現(xiàn)聚類分析,在對樣本集合實(shí)施K-均值聚類分析后,樣本集合被聚集成為6個(gè)大類。為了研究每一類中的樣本是否采用電子支付和無線等網(wǎng)絡(luò)服務(wù)的客戶特征進(jìn)行分析,在SPSS STATISTICS中使用“選擇個(gè)案”功能,對每一類個(gè)案實(shí)施挑選并分析,并將結(jié)果導(dǎo)入至WINDOWS EXCEL中,運(yùn)用EXCEL的“篩選”功能對各類別中的因子進(jìn)行統(tǒng)計(jì)分析,分析結(jié)果見表3。
三、實(shí)驗(yàn)結(jié)果及分析決策
1.客戶細(xì)分特征描述。針對電信客戶信息實(shí)施聚類分析后,電信客戶樣本被劃分為互不相交的6個(gè)簇,對6個(gè)簇中的客戶進(jìn)行特征描述和分析,挖掘蘊(yùn)含在樣本集中的客戶使用無線網(wǎng)絡(luò)應(yīng)用與客戶細(xì)分群屬性之間的關(guān)系,有如下發(fā)現(xiàn):
第一類聚集為已婚中青年,女性居多,收入偏低,家庭人數(shù)多,開通電信服務(wù)的月份短,99.5%不使用無線網(wǎng)絡(luò)套餐服務(wù),93%未開通電子支付功能。
第二類聚集為未婚中年及老年,未呈現(xiàn)明顯的性別差異,中等收入,教育水平偏低,95.5%不使用無線網(wǎng)絡(luò)套餐服務(wù),90%未開通電子支付功能。
第三類聚集為已婚中年,未呈現(xiàn)明顯的性別差異,收入高,教育水平較高,50%使用無線網(wǎng)絡(luò)套餐服務(wù),90%開通了電子支付。
第四類聚集為未婚中年人,男性居多,中等收入,開通電信服務(wù)的月份短,100%使用無線網(wǎng)絡(luò)套餐服務(wù),且78%的人開通電子支付功能。
第五類聚集為已婚中老年人,女性居多,中等收入,教育程度高,開通電信服務(wù)的月份長,65.5%使用無線網(wǎng)絡(luò)套餐服務(wù),85%未開通電子支付功能。
第六類聚集為已婚中老年人,未呈現(xiàn)明顯的性別差異,收入偏低,教育程度偏低,開通電信服務(wù)的月份長,88%不使用無線網(wǎng)絡(luò)套餐服務(wù),89%未開通電子支付功能。
2.結(jié)論與電信套餐營銷策略?;谝蜃泳垲惙治龅碾娦趴蛻艏?xì)分結(jié)果,結(jié)合電信企業(yè)的業(yè)務(wù)需求,可將電信客戶進(jìn)一步劃分為普通消費(fèi)型客戶、移動(dòng)互聯(lián)網(wǎng)應(yīng)用潛在型客戶和移動(dòng)互聯(lián)網(wǎng)應(yīng)用穩(wěn)定型客戶。其中,聚類分析中的第一類、第二類和第六類為普通消費(fèi)型客戶,第三類和第五類為移動(dòng)互聯(lián)網(wǎng)應(yīng)用潛在型客戶,而第四類為移動(dòng)互聯(lián)網(wǎng)應(yīng)用穩(wěn)定型客戶。
普通消費(fèi)型客戶的特點(diǎn)體現(xiàn)為:收入偏低,家庭結(jié)構(gòu)不穩(wěn)定,基本不使用無線套餐服務(wù)和電子支付。針對這部分客戶實(shí)施電信營銷策略設(shè)計(jì)時(shí),資費(fèi)設(shè)置方面尤其要考慮經(jīng)濟(jì)實(shí)惠,在價(jià)格上體現(xiàn)充分的吸引力,此外,側(cè)重開展更多增值服務(wù)從而增加客戶粘性,提高保有率。對于普通消費(fèi)型客戶中的第一類客戶群,年輕人較多,可以相應(yīng)的推出相應(yīng)的購機(jī)送話費(fèi)補(bǔ)貼模式,或0元購機(jī)合約等計(jì)劃;此外,年輕人接受新鮮事物的欲望和能力強(qiáng),這類客戶過渡為移動(dòng)互聯(lián)網(wǎng)應(yīng)用型客戶的概率非常高,在營銷時(shí)側(cè)重針對移動(dòng)互聯(lián)網(wǎng)應(yīng)用服務(wù)的特點(diǎn)和類型的推廣,向其銷售包含流量的實(shí)惠型套餐類型。而在第六類中老年人居多,客戶開通使用時(shí)間長,是電信客戶的忠實(shí)用戶,在推出實(shí)惠型的套餐的基礎(chǔ)上,提供適合中老年用戶的增值服務(wù),尤其注重客戶服務(wù)的質(zhì)量,提升老客戶的滿意度,例如,針對中老年客戶記憶力逐漸下降,疾病增多等普遍存在問題,提供起居提醒、用藥提醒、緊急呼叫等多種增值服務(wù)功能。
移動(dòng)互聯(lián)網(wǎng)應(yīng)用潛在型客戶特點(diǎn)體現(xiàn)為:中高等收入,教育水平高,家庭結(jié)構(gòu)穩(wěn)定。這部分群體接受移動(dòng)互聯(lián)應(yīng)用等新事物、新技術(shù)能力強(qiáng),中高等的收入也為消費(fèi)更高級別電信套餐類型提供保障。樣本數(shù)據(jù)集也體現(xiàn)出,在這部分群體中使用無線套餐服務(wù)的樣本個(gè)體,其電信業(yè)務(wù)的消費(fèi)水平均很高的特點(diǎn)。這部分客戶是進(jìn)行無線互聯(lián)網(wǎng)應(yīng)用新客戶挖掘的主要營銷對象群體。因此,需設(shè)計(jì)多樣化的移動(dòng)互聯(lián)網(wǎng)應(yīng)用套餐包供這部分客戶選擇。這一群體中第五類女性偏多,使用電子支付的人數(shù)偏低,分析可能造成該因素的原因?yàn)榕越邮茈娮宇惍a(chǎn)品能力偏弱的特點(diǎn)。因此,營銷時(shí)更側(cè)重對移動(dòng)互聯(lián)網(wǎng)絡(luò)應(yīng)用安全性、使用方法的講解,從而消除其使用的安全性方面的顧慮,幫助其掌握移動(dòng)互聯(lián)應(yīng)用的方法。而第三類客戶群,其中90%的客戶開通了電子支付功能,體現(xiàn)了這部分群體有著明顯的移動(dòng)互聯(lián)網(wǎng)應(yīng)用需求,但卻只有50%的人使用無線套餐服務(wù),因此這部分客戶群體是實(shí)施移動(dòng)互聯(lián)應(yīng)用新客戶挖掘的巨大寶藏。
移動(dòng)互聯(lián)網(wǎng)應(yīng)用穩(wěn)定客戶特點(diǎn)體現(xiàn)為:教育水平高,收入穩(wěn)定,絕大多數(shù)人開通電子支付,是移動(dòng)互聯(lián)應(yīng)用的忠實(shí)客戶群。針對這類客戶,可以設(shè)計(jì)高端的移動(dòng)應(yīng)用大流量套餐包服務(wù)。例如,中國聯(lián)通推出國內(nèi)流量計(jì)費(fèi)達(dá)到600元后將不再收費(fèi),直至15GB后系統(tǒng)自動(dòng)關(guān)閉數(shù)據(jù)網(wǎng)絡(luò)的套餐服務(wù),從而滿足客戶對移動(dòng)互聯(lián)網(wǎng)服務(wù)應(yīng)用的需求。此外,這類客戶最有可能成為4G網(wǎng)絡(luò)應(yīng)用的先驅(qū),在營銷時(shí)重點(diǎn)向這類客戶推薦4G應(yīng)用的特點(diǎn)和優(yōu)勢,例如只要是使用4G套餐的客戶,可授權(quán)1~4個(gè)親友分享自己套餐內(nèi)的流量,只是每人每月收取10元功能費(fèi)等。同時(shí),樣本數(shù)據(jù)表明,這類客戶開通的月數(shù)短,體現(xiàn)出明顯的流動(dòng)性趨勢,因此需要提供良好的客戶服務(wù)實(shí)現(xiàn)客戶保持。
四、總結(jié)
針對電信行業(yè)目前市場狀況,尤其是4G時(shí)代的到來,如何針對客戶對移動(dòng)互聯(lián)網(wǎng)絡(luò)應(yīng)用的需求制定電信營銷方案是很有必要的。本文采用因子分析和K-均值聚類的方法,實(shí)現(xiàn)電信客戶群的細(xì)分,并根據(jù)細(xì)分結(jié)果,針對性地給出每一類客戶群的電信營銷策略。研究成果通過對顧客信息資源的整合,有效地將電信企業(yè)資源集中到最有價(jià)值的客戶,增加電信企業(yè)盈利和改善客戶關(guān)系,達(dá)到電信服務(wù)和營銷投資的最優(yōu)化效果。
[本項(xiàng)目受陜西省自然科學(xué)基金項(xiàng)目資助(項(xiàng)目編號2014JQ8367);西北大學(xué)大學(xué)生創(chuàng)新項(xiàng)目資助(2013西北大學(xué)大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目)]
注釋:
{1}孫金華,孟昭睿,謝彥麒.基于K-Means算法的中小企業(yè)客戶細(xì)分研究[J].電子商務(wù),2014(3):59-60
{2}徐昆.優(yōu)化的聚類分析在企業(yè)客戶細(xì)分中的應(yīng)用[J].經(jīng)濟(jì)論壇,2014(01):123-128
{3}趙銘,李雪,李秀婷,等.基于聚類分析的商業(yè)銀行基金客戶的分類研究[J].管理評論,2013(07):38-44
{4}陳治平,胡宇舟,顧學(xué)道.聚類算法在電信客戶細(xì)分中的應(yīng)用研究[J].計(jì)算機(jī)應(yīng)用.,2007,27(10):2566-2569.
{5}江哲雅.聚類挖掘在電信客戶分類中的研究與應(yīng)用[D].上海交通大學(xué),2013.
(作者單位:1.西北大學(xué)經(jīng)濟(jì)管理學(xué)院 陜西西安 710127;2.西北大學(xué)信息科學(xué)與技術(shù)學(xué)院 陜西西安 710127;3內(nèi)蒙古自治區(qū)農(nóng)村信用社聯(lián)合社 內(nèi)蒙古呼和浩特 010020;第一、二作者簡介:劉彩芬,西北大學(xué)經(jīng)濟(jì)管理學(xué)院,本科生;高原,西北大學(xué)經(jīng)濟(jì)管理學(xué)院,學(xué)院教學(xué)實(shí)驗(yàn)中心主任,副教授,研究方向:商務(wù)智能、金融數(shù)據(jù)挖掘)
(責(zé)編:若佳)