楊榮,張峻,冒蓉,楊進(jìn)
中國(guó)移動(dòng)通信集團(tuán)江蘇有限公司數(shù)字家庭運(yùn)營(yíng)中心
根據(jù)國(guó)內(nèi)三大運(yùn)營(yíng)商2018年年報(bào)顯示,截止到2018年年底,全國(guó)寬帶用戶已經(jīng)達(dá)到3.81億戶,寬帶新增市場(chǎng)已趨于飽和,面對(duì)新增市場(chǎng)的激烈競(jìng)爭(zhēng),存量用戶的保有顯得越來(lái)越重要。根據(jù)運(yùn)營(yíng)商之前的數(shù)據(jù)統(tǒng)計(jì),發(fā)展一戶新寬帶的成本是維系一戶老用戶的五倍。同時(shí),2019年國(guó)務(wù)院要求三家運(yùn)營(yíng)商提速降費(fèi),累計(jì)讓利達(dá)到1800億元,后期營(yíng)銷資源會(huì)越來(lái)越稀缺,如何最大限度地用好營(yíng)銷資源、降低用戶離網(wǎng)率,提高存量寬帶的質(zhì)態(tài),是三大運(yùn)營(yíng)商需要迫切關(guān)注的問(wèn)題。現(xiàn)階段,大數(shù)據(jù)技術(shù)已經(jīng)深入應(yīng)用到各個(gè)行業(yè),能夠有效指導(dǎo)各個(gè)行業(yè)生產(chǎn),通信運(yùn)營(yíng)商作為通信管道,在數(shù)據(jù)方面有著得天獨(dú)厚的優(yōu)勢(shì),如何基于大數(shù)據(jù)技術(shù)挖掘海量信息,并通過(guò)清洗、加工、計(jì)算,有效指導(dǎo)生產(chǎn),是各大運(yùn)營(yíng)商的研究重點(diǎn)。本文以華東地區(qū)S通信運(yùn)營(yíng)商(下文簡(jiǎn)稱S通信)為例,研究其如何通過(guò)大數(shù)據(jù)挖掘技術(shù),對(duì)存量寬帶質(zhì)態(tài)存在的問(wèn)題制定解決策略,有效提升存量寬帶質(zhì)態(tài)。
現(xiàn)在業(yè)內(nèi)普遍對(duì)大數(shù)據(jù)的定義是:一種規(guī)模大到在獲取、存儲(chǔ)、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和價(jià)值密度低四大特征。大數(shù)據(jù)四大特征,具體表現(xiàn)為:數(shù)據(jù)量大,近20年來(lái),全球信息量增長(zhǎng)了超過(guò)100倍;類型繁多,數(shù)據(jù)中90%為非結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)種類復(fù)雜,比如電子郵件、位置信息等;處理速度快,基于大數(shù)據(jù)技術(shù)的各種應(yīng)用,大數(shù)據(jù)處理的速度要求極為嚴(yán)格;價(jià)值密度低,有價(jià)值的信息被分散在各類數(shù)據(jù)中,尋找有價(jià)值的信息,則是大數(shù)據(jù)應(yīng)用的技術(shù)挑戰(zhàn)。
大數(shù)據(jù)關(guān)鍵技術(shù)是指從大數(shù)據(jù)采集開(kāi)始到存儲(chǔ)、分析再到應(yīng)用的一整套流程相關(guān)的技術(shù),是使用非傳統(tǒng)的工具對(duì)大量的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行處理,從而獲得分析和預(yù)測(cè)結(jié)果一系列的數(shù)據(jù)處理和分析技術(shù)。所以,大數(shù)據(jù)技術(shù)主要包括數(shù)據(jù)采集和預(yù)處理、數(shù)據(jù)存儲(chǔ)和管理、數(shù)據(jù)處理和分析、數(shù)據(jù)安全及隱私保護(hù)等幾個(gè)層面內(nèi)容。本文主要研究關(guān)于大數(shù)據(jù)處理和分析以及應(yīng)用方面,常用的數(shù)據(jù)處理和挖掘算法有C5.0算法、K-Means算法。
國(guó)外對(duì)大數(shù)據(jù)的研究理論非常豐富,同時(shí)已有很多典型應(yīng)用案例。2000年,國(guó)外學(xué)者莫澤等人通過(guò)運(yùn)用邏輯回歸、神經(jīng)網(wǎng)絡(luò)、決策樹(shù)等算法構(gòu)建了離網(wǎng)用戶預(yù)警模型。美國(guó)的蘭德布瑞吉,通過(guò)CART算法對(duì)紐英倫的一個(gè)通信運(yùn)營(yíng)的數(shù)據(jù)進(jìn)行分析,并建立了離網(wǎng)客戶模型。法國(guó)運(yùn)營(yíng)商“Orange”通過(guò)細(xì)分其用戶,從用戶的通話、數(shù)據(jù)記錄開(kāi)始分析,重點(diǎn)關(guān)注客戶的通話對(duì)象以及通話頻率,有效提高了用戶流失預(yù)測(cè)模型的精確性,另外還通過(guò)分析掉話率數(shù)據(jù),尋找超負(fù)荷運(yùn)行的網(wǎng)絡(luò)并進(jìn)行維護(hù)及擴(kuò)充。美國(guó)Verizon為充分挖掘、分析用戶數(shù)據(jù)信息成立精準(zhǔn)營(yíng)銷部門,洞察用戶需求以進(jìn)行精準(zhǔn)營(yíng)銷,為廣告投放提供數(shù)據(jù)支撐。
國(guó)內(nèi)對(duì)大數(shù)據(jù)的研究起步較晚,但隨著互聯(lián)網(wǎng)的快速發(fā)展迅速趕上。如朱珊珊使用K均值聚類算法細(xì)分通信客戶進(jìn)行,并通過(guò)細(xì)分的客戶群開(kāi)展基于精確營(yíng)銷的應(yīng)用。許乃利通過(guò)隨機(jī)森林的絡(luò)算法建立客戶流失預(yù)測(cè)模型,并通過(guò)流失特征找到潛在離網(wǎng)用戶開(kāi)展挽留行為。崔振通過(guò)采用大數(shù)據(jù)分析與挖掘方法識(shí)別虛假異常業(yè)務(wù),為大數(shù)據(jù)時(shí)代下如何開(kāi)展移動(dòng)通信行業(yè)的內(nèi)審管理做出了有益的探索和嘗試。
前期因?yàn)槭袌?chǎng)發(fā)展需要,S通信設(shè)計(jì)了大量的寬帶套餐和寬帶營(yíng)銷活動(dòng),此舉在促進(jìn)用戶新增和保有的同時(shí),也使得寬帶營(yíng)銷活動(dòng)到期保有工作變得異常復(fù)雜,營(yíng)銷活動(dòng)接盤比例偏低,裸開(kāi)寬帶套餐用戶不斷增加。S通信為做好寬帶到期接盤,投入了大量的營(yíng)銷成本,根據(jù)統(tǒng)計(jì),戶均接盤成本超過(guò)50元,并無(wú)法達(dá)到理想的營(yíng)銷效果,2018年8月,S通信寬帶營(yíng)銷活動(dòng)到期接盤率僅64.6%。
S通信處在華東地區(qū),經(jīng)濟(jì)高度發(fā)達(dá),寬帶市場(chǎng)已經(jīng)高度飽和,通信市場(chǎng)競(jìng)爭(zhēng)異常激烈。從對(duì)手的存量客戶中,挖掘新增客戶,已經(jīng)成為普遍的做法,出現(xiàn)了用戶離網(wǎng)率持續(xù)走高的情況,從圖1中數(shù)據(jù)可以看出,S通信2018年用戶離網(wǎng)率持續(xù)增高。
圖1 S通信2018年寬帶用戶月離網(wǎng)率
在激烈的市場(chǎng)競(jìng)爭(zhēng)環(huán)境下,S通信為了進(jìn)一步拓展市場(chǎng),不斷增加渠道代理商的發(fā)展寬帶新用戶的發(fā)展酬金和裝維酬金,高額的酬金使得部分代理商為了獲取新增用戶的酬金,發(fā)展虛假寬帶,誘導(dǎo)存量客戶停用老寬帶,通過(guò)換號(hào)改新增的方式,獲取公司發(fā)展酬金和裝維酬金,使?fàn)I銷資源無(wú)法獲得有效和充分利用。
前期的對(duì)于寬帶質(zhì)態(tài)的數(shù)據(jù)分析,都是通過(guò)采集寬帶用戶在B域里面的信息字段,如套餐類型、月消費(fèi)賬單、月補(bǔ)貼金額等字段,通過(guò)EXCEL、SPSS、SAS等分析工具進(jìn)行分析,存在信息采集量不全面,不能夠全面反映寬帶用戶真實(shí)情況的問(wèn)題,同時(shí)對(duì)于分析處理的結(jié)果,無(wú)法和實(shí)際的生產(chǎn)營(yíng)銷系統(tǒng)及時(shí)對(duì)接,不能讓分析的結(jié)果直接指導(dǎo)生產(chǎn)。
S通信于2012年開(kāi)始建設(shè)企業(yè)智慧中臺(tái),通過(guò)實(shí)施B(Business)、O(Operation)、M(Manage)三域數(shù)據(jù)融合和挖掘,形成超9PB的數(shù)據(jù)處理能力,成功建立從“采集、清洗到建模、應(yīng)用”的數(shù)據(jù)生產(chǎn)閉環(huán)流程。在架構(gòu)設(shè)計(jì)上,采用匯聚、存儲(chǔ)、服務(wù)多域的融合架構(gòu),解決了數(shù)據(jù)孤島問(wèn)題,實(shí)現(xiàn)跨域數(shù)據(jù)高度復(fù)用。建設(shè)數(shù)據(jù)能力開(kāi)放平臺(tái),提供給內(nèi)部各部門各系統(tǒng)使用,支撐公司管理決策、精確營(yíng)銷,實(shí)現(xiàn)能力共享。2015年通過(guò)部署智慧營(yíng)銷插件,采集用戶側(cè)網(wǎng)關(guān)信息,使得用戶的數(shù)據(jù)采集更加全面。如圖2所示。
圖2 S通信智慧中臺(tái)架構(gòu)總覽
針對(duì)S通信系統(tǒng)中存在的超過(guò)10萬(wàn)款營(yíng)銷活動(dòng)和1千款寬帶套餐,選取與用戶寬帶營(yíng)銷通過(guò)字段,精準(zhǔn)提取出S通信的寬帶營(yíng)銷活動(dòng)明細(xì)。字段主要采用和營(yíng)銷活動(dòng)捆綁的套餐活動(dòng)存在相關(guān)性的所有字段,逐個(gè)開(kāi)展字段審查,篩選存在相關(guān)性較大的特征字段,餐、月補(bǔ)貼金額、活動(dòng)周期、回報(bào)率等。
對(duì)采集來(lái)的信息經(jīng)過(guò)清理后,通過(guò)經(jīng)典的K-均值算法對(duì)營(yíng)銷活動(dòng)明細(xì)進(jìn)行聚類分析,根據(jù)寬帶套餐和寬帶營(yíng)銷活動(dòng),將寬帶營(yíng)銷活動(dòng)分為四級(jí),具體如表1所示。
表1 寬帶營(yíng)銷活動(dòng)到期分類輸出表
結(jié)合智慧中臺(tái)的數(shù)據(jù)標(biāo)簽功能,對(duì)寬帶到期用戶進(jìn)行畫像,生成共計(jì)126個(gè)客戶群,其中可對(duì)外輸出指導(dǎo)生產(chǎn)使用的客戶群共計(jì)57個(gè)。根據(jù)每個(gè)客戶群的特征,結(jié)合用戶之前的套餐、營(yíng)銷活動(dòng)以及當(dāng)前主推的政策,建立用戶每個(gè)客戶群專有的套餐升級(jí)、營(yíng)銷活動(dòng)接盤策略,并設(shè)計(jì)融合渠道、產(chǎn)品、時(shí)間等多維度的續(xù)費(fèi)引導(dǎo)場(chǎng)景,能夠覆蓋到用戶每個(gè)層面。比如,針對(duì)大流量加裝寬帶的年輕用戶,設(shè)計(jì)了線上實(shí)時(shí)精準(zhǔn)推送,當(dāng)目標(biāo)用戶登錄掌廳或者使用外部電渠充值時(shí)候,則會(huì)自動(dòng)在頁(yè)面提醒用戶接續(xù),并將當(dāng)前用戶賬號(hào)套餐和資費(fèi),以及接續(xù)后的資費(fèi)進(jìn)行對(duì)比,突顯資費(fèi)的優(yōu)惠性,以此來(lái)提高用戶續(xù)費(fèi)的積極性。
用戶離網(wǎng)分為用戶主動(dòng)離網(wǎng)(主動(dòng)關(guān)閉寬帶業(yè)務(wù))和用戶被動(dòng)離網(wǎng)(寬帶賬號(hào)的手機(jī)被銷戶),鑒于影響手機(jī)號(hào)碼銷戶的因素過(guò)多,全量信息難以采集,同時(shí)被動(dòng)離網(wǎng)用戶挽留工作也較難開(kāi)展,此次離網(wǎng)預(yù)警模型只針對(duì)主動(dòng)離網(wǎng)用戶進(jìn)行。另外,影響用戶主動(dòng)離網(wǎng)因素受區(qū)域市場(chǎng)環(huán)境影響較大,故需要針對(duì)S通信所服務(wù)的N個(gè)區(qū)域分別建模。數(shù)據(jù)主要從B域、O域系統(tǒng)中多個(gè)異構(gòu)的數(shù)據(jù)源進(jìn)行抽取、清洗、轉(zhuǎn)換、加載,結(jié)合智慧營(yíng)銷插件捕獲的用戶網(wǎng)關(guān)側(cè)信息,采用決策樹(shù)數(shù)據(jù)挖掘技術(shù),得出離網(wǎng)預(yù)警用戶的特征,并對(duì)這些特征進(jìn)行歸納、總結(jié),建立離網(wǎng)預(yù)警用戶識(shí)別模型,能夠準(zhǔn)確地識(shí)別出離網(wǎng)預(yù)警用戶。
取N個(gè)區(qū)域的X月的寬帶離網(wǎng)用戶及其近3月歷史數(shù)據(jù)和基礎(chǔ)屬性數(shù)據(jù)作為觀察數(shù)據(jù)。觀察數(shù)據(jù)維度包括:用戶基礎(chǔ)屬性、寬帶流量使用情況、消費(fèi)情況、是否撥打異網(wǎng)客戶、訪問(wèn)異網(wǎng)電渠、雙卡槽情況、互聯(lián)網(wǎng)電視使用情況、渠道使用、寬帶套餐、營(yíng)銷案周期、營(yíng)銷案實(shí)際返還金額、各區(qū)域營(yíng)銷案等。按照合適的比例,從X月寬帶狀態(tài)正常用戶中抽取部分用戶,將離網(wǎng)數(shù)據(jù)和狀態(tài)正常數(shù)據(jù)合并之后,再按7:3的比例拆分成訓(xùn)練集和測(cè)試集。對(duì)訓(xùn)練集采用分類預(yù)測(cè)模型中的C5.0決策樹(shù)算法構(gòu)建數(shù)據(jù)挖掘模型,再用測(cè)試集驗(yàn)證該模型的查全、查準(zhǔn)率。對(duì)全網(wǎng)寬帶用戶利用該模型輸出潛在寬帶離網(wǎng)的用戶明細(xì),模型輸出結(jié)果為潛在主動(dòng)寬帶離網(wǎng)的用戶及其離網(wǎng)概率。
最后,選取置信度大于70%,覆蓋用戶群大于500的模型規(guī)則,控制輸出S通信離網(wǎng)預(yù)警用戶數(shù),規(guī)模為30。同時(shí)設(shè)計(jì)離網(wǎng)預(yù)警用戶專有保有方案,安排各個(gè)區(qū)域的社區(qū)服務(wù)人員通過(guò)電話、上門等方式進(jìn)行保有,保有方案包括資費(fèi)優(yōu)惠保有、網(wǎng)絡(luò)優(yōu)先保證、以及家庭內(nèi)部組網(wǎng)升級(jí)等方式。
異常寬帶,是指寬帶網(wǎng)內(nèi)倒網(wǎng)用戶,主要是S通信的渠道代理商,為了套取公司新增用戶的酬金和裝維酬金,通過(guò)引導(dǎo)老用戶網(wǎng)內(nèi)倒網(wǎng),重新入戶,虛開(kāi)寬帶,產(chǎn)生裝機(jī)工單來(lái)獲得酬金。
為有效識(shí)別出網(wǎng)內(nèi)倒網(wǎng)寬帶用戶,僅通過(guò)現(xiàn)有的模式下采集用戶B域的話務(wù)、流量、賬單、套餐等信息難以識(shí)別倒網(wǎng)用戶,需要結(jié)合家庭網(wǎng)關(guān)智慧營(yíng)銷插件捕獲的用戶網(wǎng)關(guān)側(cè)的信息,比如網(wǎng)關(guān)捕獲的下掛終端串號(hào)信息、接入成員數(shù)、網(wǎng)關(guān)的上行鏈路、上網(wǎng)行為信息等。
對(duì)營(yíng)銷活動(dòng)到期未續(xù)費(fèi)離網(wǎng)用戶,綜合戶址信息、用戶V網(wǎng)成員信息、家庭網(wǎng)關(guān)采集的成員信息以及通話圈,建立家庭模型識(shí)別庫(kù),并和新入網(wǎng)寬帶用戶進(jìn)行比對(duì),如一個(gè)家庭號(hào)碼群中在30天內(nèi)同時(shí)出現(xiàn)寬帶離網(wǎng)和新增,則判定為疑似網(wǎng)內(nèi)倒網(wǎng)目標(biāo)用戶。
異常寬帶目標(biāo)群模型生成后,安排區(qū)域分公司通過(guò)外呼、實(shí)地檢查等方式,最終確定用戶是否存在網(wǎng)內(nèi)倒網(wǎng)的行為。確認(rèn)為倒網(wǎng)用戶的,扣除渠道發(fā)展傭金和新增裝機(jī)酬金。
自2019年1月,通過(guò)為各類寬帶到期用戶目標(biāo)群制定精準(zhǔn)的接續(xù)方案,S通信6月份寬帶續(xù)費(fèi)率已經(jīng)提升至70.1%,同時(shí)通過(guò)數(shù)據(jù)賦能渠道,S通信的電渠通過(guò)續(xù)費(fèi)目標(biāo)群采取精準(zhǔn)接盤方案以來(lái),電渠續(xù)費(fèi)量絕對(duì)值提升約1萬(wàn)戶/月,S通信客服熱線被叫渠道接入寬帶續(xù)費(fèi)目標(biāo)客戶群后,續(xù)費(fèi)量的絕對(duì)值增加1.2萬(wàn)/月,按照續(xù)費(fèi)酬金50元每戶結(jié)算,月節(jié)省營(yíng)銷酬金50*(1+1.2)=110萬(wàn)元。
通過(guò)分析制定離網(wǎng)預(yù)警模型,開(kāi)展預(yù)警用戶專項(xiàng)挽留活動(dòng),從2019年2月起,每月通過(guò)專項(xiàng)挽留活動(dòng)挽留離網(wǎng)用戶超過(guò)5萬(wàn)戶,離網(wǎng)率由2.21%降低到1.34%。同時(shí),在挽留客戶過(guò)程中,對(duì)質(zhì)差寬帶用戶進(jìn)行網(wǎng)絡(luò)升級(jí),月發(fā)展家庭組網(wǎng)戶超過(guò)1萬(wàn)戶。
S通信每月約識(shí)別疑似虛增倒網(wǎng)寬帶3萬(wàn)條/月,比如4月對(duì)某區(qū)域450條疑似倒網(wǎng)用戶進(jìn)行調(diào)查,經(jīng)過(guò)回訪、實(shí)地驗(yàn)證,共計(jì)有361起為網(wǎng)內(nèi)倒網(wǎng),準(zhǔn)確率為80%。每戶的新增酬金和裝機(jī)酬金約170元,后期通過(guò)進(jìn)一步擴(kuò)大核實(shí)范圍,預(yù)計(jì)可月節(jié)省酬金預(yù)計(jì)超過(guò)400萬(wàn)元。
本文從電信運(yùn)營(yíng)商的寬帶用戶質(zhì)態(tài)提升為出發(fā)點(diǎn),通過(guò)建設(shè)智慧中臺(tái),對(duì)當(dāng)前寬帶質(zhì)態(tài)存在的寬帶營(yíng)銷活動(dòng)到期接盤保有、寬帶用戶離網(wǎng)率增高和用戶網(wǎng)內(nèi)倒號(hào)使?fàn)I銷資源無(wú)法高效利用這三個(gè)問(wèn)題進(jìn)行的分析和研究,利用運(yùn)營(yíng)商自身的豐富數(shù)據(jù)資源,通過(guò)大數(shù)據(jù)技術(shù)分別給出了提升策略,有效提升了寬帶的質(zhì)態(tài),節(jié)省了大量的營(yíng)銷成本。