趙洪 沈建忠 王俊 張騁 瞿青
摘 要: 基于供電企業(yè)海量數(shù)據(jù),提煉客戶特征標(biāo)簽,多維呈現(xiàn)客戶畫像。并甄選影響電費(fèi)回收風(fēng)險(xiǎn)的特征指標(biāo),利用機(jī)器學(xué)習(xí)方法,構(gòu)建電費(fèi)回收風(fēng)險(xiǎn)預(yù)測(cè)模型,判斷用戶的電費(fèi)逾期風(fēng)險(xiǎn)等級(jí)。將模型結(jié)果及中間結(jié)果標(biāo)簽化,豐富客戶畫像,為業(yè)務(wù)人員提供全新認(rèn)知客戶的手段。
關(guān)鍵詞: 客戶畫像; 電費(fèi)回收風(fēng)險(xiǎn); 機(jī)器學(xué)習(xí); 特征標(biāo)簽
中圖分類號(hào): TG4 ? ? ?文獻(xiàn)標(biāo)志碼: A
Prediction Model of Electric Charge Recycling Risk Based on Customer
Portrait and Machine Learning Algorithm and Its Application
ZHAO Hong, SHEN Jianzhong, WANG Jun, ZHANG Cheng, ZHAI Qing
(State Grid Shanghai Electric Power Company, Shanghai 200122)
Abstract: Based on massive data of power supply companies, customer feature labels are extracted, and the customer portrait is presented in a multi-dimension. Features affecting the risk of recovering electric fees are selected to build a model which can evaluate the risk. Application of the model is tagged to enrich the customer portrait. It provides a new tool to understand customers.
Key words: Customer portrait; Recovering electric risk; Machine learning; Feature label
0 引言
國(guó)家電網(wǎng)《關(guān)于堅(jiān)持以客戶為中心進(jìn)一步提升優(yōu)質(zhì)服務(wù)水平的意見》明確提出客戶是電網(wǎng)服務(wù)的核心。在新階段利用新方法解決服務(wù)短板,持續(xù)服務(wù)創(chuàng)新,是供電企業(yè)發(fā)展的必由之路。因此如何依托海量業(yè)務(wù)數(shù)據(jù),以客戶為中心整合信息、抽象需求、挖掘數(shù)據(jù)價(jià)值、開展數(shù)字化營(yíng)銷,成為供電企業(yè)提升客戶體驗(yàn)、拓展市場(chǎng)份額的關(guān)鍵。
標(biāo)簽提取是客戶畫像的重要技術(shù)手段,其將客戶行為及屬性在企業(yè)關(guān)注的業(yè)務(wù)維度上進(jìn)行投影并系統(tǒng)固化,實(shí)現(xiàn)客戶隱形特征的顯性化、標(biāo)準(zhǔn)化抽象。電費(fèi)回收業(yè)務(wù)是供電企業(yè)營(yíng)銷的重點(diǎn)業(yè)務(wù)。本文以客戶畫像理論結(jié)合機(jī)器學(xué)習(xí)算法為技術(shù)路線,開展電費(fèi)回收風(fēng)險(xiǎn)防控研究實(shí)踐。
1 數(shù)字化營(yíng)銷環(huán)境下的客戶畫像應(yīng)用概述
近年來,以互聯(lián)網(wǎng)為代表的各項(xiàng)新技術(shù)蓬勃發(fā)展,各行業(yè)數(shù)據(jù)呈現(xiàn)海量化、多樣化、價(jià)值化等趨勢(shì),數(shù)字化營(yíng)銷成為各個(gè)行業(yè)的必然選擇。數(shù)字化營(yíng)銷的核心是實(shí)現(xiàn)營(yíng)銷的精準(zhǔn)化,而以客戶為中心的客戶畫像體系,則是挖掘客戶特征、發(fā)現(xiàn)潛在價(jià)值、識(shí)別隱性風(fēng)險(xiǎn),開展精準(zhǔn)營(yíng)銷的重要基礎(chǔ)。
國(guó)內(nèi)已有多領(lǐng)域開展了基于客戶畫像的實(shí)踐應(yīng)用:中國(guó)移動(dòng)通過分析客戶消費(fèi)行為建立客戶畫像,實(shí)現(xiàn)客戶分層,開展有針對(duì)性的營(yíng)銷活動(dòng);淘寶通過買家與平臺(tái)的各項(xiàng)交互信息建立買家特征標(biāo)簽,為賣家提供時(shí)段、地域、消費(fèi)層次等多角度客戶立體畫像,支撐平臺(tái)賣家各項(xiàng)運(yùn)營(yíng)活動(dòng)。
對(duì)于電網(wǎng)行業(yè),構(gòu)建電力客戶畫像應(yīng)用即為:結(jié)合電網(wǎng)業(yè)務(wù)特點(diǎn)及其他行業(yè)客戶標(biāo)簽實(shí)踐經(jīng)驗(yàn),利用數(shù)據(jù)挖掘手段,從企業(yè)內(nèi)沉淀的海量業(yè)務(wù)數(shù)據(jù)中提煉價(jià)值信息,固化為用戶標(biāo)簽,方便業(yè)務(wù)人員快速、客觀的感知客戶特征,精準(zhǔn)有效地展開相關(guān)營(yíng)銷活動(dòng)。
2 電費(fèi)風(fēng)險(xiǎn)防控背景及現(xiàn)狀分析
電費(fèi)回收是電力營(yíng)銷重點(diǎn)業(yè)務(wù),是供電企業(yè)主要利潤(rùn)來源,直接影響企業(yè)的經(jīng)濟(jì)效益。而在實(shí)際工作流程中,先用電后付費(fèi)的業(yè)務(wù)模式使電費(fèi)回收成為電力營(yíng)銷的最末一環(huán);同時(shí)供電企業(yè)承擔(dān)著保障民生的重大社會(huì)責(zé)任,對(duì)違約客戶的制裁手段有嚴(yán)格的控制。客觀上造成了用戶電費(fèi)違約成本過低的現(xiàn)狀,增大電費(fèi)回收的難度和風(fēng)險(xiǎn)。
隨著市場(chǎng)經(jīng)濟(jì)發(fā)展,用電需求增大,為降低經(jīng)營(yíng)風(fēng)險(xiǎn),供電企業(yè)采取各項(xiàng)措施加強(qiáng)電費(fèi)回收工作,如:創(chuàng)新線上繳費(fèi)方式、預(yù)付費(fèi)表推廣、成立專門電費(fèi)催繳班組等,在很大程度上改善了電費(fèi)回收情況。但電費(fèi)風(fēng)險(xiǎn)識(shí)別仍然依賴業(yè)務(wù)人員主觀感知,缺乏以數(shù)據(jù)為基礎(chǔ)的客觀、標(biāo)準(zhǔn)化手段,嚴(yán)重影響電費(fèi)回收工作的進(jìn)一步提升。
隨著新技術(shù)的推廣,供電企業(yè)逐漸引進(jìn)多種先進(jìn)手段深化各項(xiàng)工作。如,利用數(shù)據(jù)挖掘分析用戶用電消費(fèi)習(xí)慣、異常行為[1-2],基于用戶特征進(jìn)行客戶信用評(píng)估等[3]。本文以標(biāo)簽分析手段及數(shù)據(jù)挖掘技術(shù)為支撐,以業(yè)務(wù)系統(tǒng)現(xiàn)有的數(shù)據(jù)為基礎(chǔ),結(jié)合專家經(jīng)驗(yàn),利用機(jī)器學(xué)習(xí)方法構(gòu)建電費(fèi)風(fēng)險(xiǎn)預(yù)測(cè)模型,預(yù)測(cè)用戶未來電費(fèi)逾期概率,生成客戶電費(fèi)回收風(fēng)險(xiǎn)評(píng)價(jià)標(biāo)簽,提出風(fēng)險(xiǎn)用戶清單;支撐催費(fèi)資源優(yōu)化配置,為電費(fèi)風(fēng)險(xiǎn)防控等業(yè)務(wù)深化提供現(xiàn)實(shí)指導(dǎo)。
3 電費(fèi)風(fēng)險(xiǎn)預(yù)測(cè)建模
電費(fèi)風(fēng)險(xiǎn)預(yù)測(cè)模型是對(duì)客戶能否按時(shí)、足額繳納電費(fèi)風(fēng)險(xiǎn)的預(yù)測(cè),主要根據(jù)客戶的繳費(fèi)行為評(píng)估電費(fèi)繳費(fèi)風(fēng)險(xiǎn)。首先結(jié)合業(yè)務(wù)調(diào)研梳理能夠反映客戶繳費(fèi)、欠費(fèi)的業(yè)務(wù)指標(biāo)作為模型的指標(biāo)體系;其后運(yùn)用數(shù)據(jù)挖掘手段進(jìn)行數(shù)據(jù)準(zhǔn)備,提煉有效的樣本集;而后利用機(jī)器學(xué)習(xí)方法建模,模擬電費(fèi)風(fēng)險(xiǎn)影響指標(biāo)與是否逾期之間的規(guī)律;最后通過該模型識(shí)別客戶未來的電費(fèi)逾期風(fēng)險(xiǎn)。
由于不同類型客戶的用電、繳費(fèi)行為差異較大,結(jié)合業(yè)務(wù)實(shí)踐經(jīng)驗(yàn),以A、B區(qū)域用電客戶為研究對(duì)象,預(yù)先基于電壓、容量、地區(qū)等特征進(jìn)行分層,并選定高壓用戶和低壓且容量100 kW以上用戶(以下簡(jiǎn)稱低壓大量用戶)作為電費(fèi)回收風(fēng)險(xiǎn)研究的重點(diǎn)用戶群。
3.1 電費(fèi)風(fēng)險(xiǎn)指標(biāo)體系
通過業(yè)務(wù)調(diào)研、規(guī)則歸納等途徑,深入理解電費(fèi)回收的營(yíng)銷機(jī)制與業(yè)務(wù)邏輯,最終確立衡量客戶電費(fèi)風(fēng)險(xiǎn)的特征維度如表1所示。
除高壓客戶和低壓大量客戶需分別建模外,還需對(duì)不同繳費(fèi)類型(分次劃撥或按月結(jié)算)用戶分別建模。因?yàn)椋阂?、兩類用戶模型入?yún)⒉煌?。相?duì)按月結(jié)算用戶,分次劃撥用戶還需考察計(jì)劃電費(fèi)的繳費(fèi)和逾期行為特征。二、不同繳費(fèi)類型下,部分指標(biāo)對(duì)用戶逾期行為的影響程度差異較大。以繳費(fèi)方式為例,當(dāng)是金融機(jī)構(gòu)代扣時(shí),A地區(qū)高壓按月結(jié)算用戶逾期率65%,分次劃撥用戶逾期率47%。
3.2 數(shù)據(jù)準(zhǔn)備
3.2.1 數(shù)據(jù)預(yù)處理
表1中大部分指標(biāo)不能從業(yè)務(wù)系統(tǒng)的直接提取,需根據(jù)業(yè)務(wù)基礎(chǔ)數(shù)據(jù)加工合成,其中涉及的基礎(chǔ)信息如表2所示。
獲取以上數(shù)據(jù)后,需進(jìn)行數(shù)據(jù)預(yù)處理。包括數(shù)據(jù)校驗(yàn)、缺失值和異常值處理,指標(biāo)加工。
數(shù)據(jù)校驗(yàn):數(shù)據(jù)質(zhì)量檢驗(yàn)如完整性,有效性。如檢查客戶編號(hào)是否唯一,指標(biāo)數(shù)據(jù)范圍是否在預(yù)期范圍內(nèi)等。
缺失值處理:對(duì)缺失信息嚴(yán)重的樣本,缺失個(gè)數(shù)占總指標(biāo)數(shù)的一半以上,可以直接剔除。在缺失信息不嚴(yán)重的樣本中,需結(jié)合業(yè)務(wù)具體分析。
離群值/異常值處理:根據(jù)指標(biāo)數(shù)據(jù)分布進(jìn)行識(shí)別??赏ㄟ^對(duì)數(shù)變換等方式消除異常值。其他情況,或用3個(gè)標(biāo)準(zhǔn)差的最大值或最小值替換。
指標(biāo)加工:數(shù)值型指標(biāo),遵循規(guī)則計(jì)算。分類型指標(biāo)如行業(yè)、地理分布等分組過多,直接輸入模型,將導(dǎo)致信息稀釋,指標(biāo)預(yù)測(cè)能力削弱。因此需減少組別,具體方法有:業(yè)務(wù)相似項(xiàng)合并、聚類、WOE化等。在指標(biāo)加工過程中,可能生成新的缺失值、異常值,具體處理規(guī)則參考上文方法。
3.2.2 特征選擇
根據(jù)表1可合成特征維度50余個(gè)。為避免信息冗余,提高模型計(jì)算復(fù)雜度,需開展特征選擇,生成相對(duì)小而優(yōu)的特征集,本文以IV值為主要特征篩選方法。IV值即信息的價(jià)值指標(biāo),反映特征對(duì)目標(biāo)的影響程度,值越大對(duì)目標(biāo)的預(yù)測(cè)能力越強(qiáng),如式(1)、式(2)。WOEi=ln(pyipni)
(1)
IV=∑(pyi-pni)·WOEi
(2)其中,pyi表示分組i中逾期客戶占所有逾期客戶的比例,pni表示分組i中正??蛻粽妓姓?蛻舻谋壤?。從公式1、2可知,WOEi描述了變量在分組i,判斷個(gè)體是否會(huì)逾期所起到影響方向和大小,IV值能避免WOE中負(fù)值的出現(xiàn),還能體現(xiàn)各分組在整體中的占比,較全面衡量指標(biāo)對(duì)目標(biāo)變量的預(yù)測(cè)能力。
同時(shí)在模型訓(xùn)練過程中配合逐步回歸法和信息增益法篩選特征變量,比如對(duì)高壓按月結(jié)算用戶進(jìn)行特征選擇后,最終將入?yún)⒆兞坑?5個(gè)減到13個(gè),極大降低了模型復(fù)雜度。
3.3 建模和性能評(píng)估
3.3.1 建模方法選擇
電費(fèi)風(fēng)險(xiǎn)預(yù)測(cè)模型判斷用戶是否逾期繳費(fèi)的過程是典型的二分類模型。邏輯斯特模型是應(yīng)用最廣泛的分類模型,式見(3)。當(dāng)Y為0時(shí)表示未逾期,逾期風(fēng)險(xiǎn)概率為0;當(dāng)Y為1時(shí)表示電費(fèi)逾期繳費(fèi),逾期風(fēng)險(xiǎn)概率為1。模型根據(jù)歷史繳費(fèi)行為判斷客戶逾期的概率。該概率可根據(jù)設(shè)定閾值判定是否逾期,也可將逾期概率轉(zhuǎn)化為風(fēng)險(xiǎn)評(píng)分,風(fēng)險(xiǎn)評(píng)分越高逾期風(fēng)險(xiǎn)等級(jí)越高,反之越低,如式(3)。p(Y=1|X)=11+e-(β0+β1x1+…+βnxn)
(3) ?常用的分類模型除邏輯斯特模型外還有:決策樹、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、樸素貝葉斯等。為避免單一分類器可能陷入的泛化能力不強(qiáng)、局部擬合等問題,盡量保證預(yù)測(cè)結(jié)果的準(zhǔn)確性和穩(wěn)定性,本文選擇決策樹、隨機(jī)森林、支持向量機(jī)等模型作為性能比較的參考模型。
3.3.2 模型評(píng)價(jià)標(biāo)準(zhǔn)
評(píng)價(jià)模型的擬合效果,通過偽R方統(tǒng)計(jì)量表示,其含義為因變量的總變異被模型的自變量解釋的比例。
Nagelkerke-R2是對(duì)Cox&Snell-R2的修正,取值范圍在[0,1],越接近1模型的擬合程度越高。Nagelkerke-R2大于0.4,表示模型擬合效果好,Nagelkerke-R2大于0.5,表示模型擬合效果非常好,如式(4)、式(5)。
Cox&Snell-R2=1-Ln(L0)Ln(L)2n=1-e2nLn(Ln(L0))-Ln(Ln(L))
(4)
Nagelkerke-R2=Cox&Snell-R21-(Ln(L0))2n
(5)
其中L0為僅含截距項(xiàng)模型的似然值,L為包含截距項(xiàng)與相關(guān)變量模型的似然值,取對(duì)數(shù)后分別表示模型的總平方和與殘差平方和。
評(píng)價(jià)模型對(duì)目標(biāo)客戶的預(yù)測(cè)能力,通過混淆矩陣來計(jì)算。實(shí)際工作中,希望知道目標(biāo)樣本實(shí)際預(yù)測(cè)對(duì)了多少。為此引入混淆矩陣,即預(yù)測(cè)結(jié)果與實(shí)際結(jié)果對(duì)比矩陣如表3所示。
實(shí)際業(yè)務(wù)中,TPR越大越好,F(xiàn)PR越小越好。反映如圖1所示。
即曲線越在紅線上方越好。AUC值為ROC曲線下的區(qū)域面積,AUC值越大分類效果越好,一般認(rèn)為AUC值大于0.75時(shí),擬合模型是有效的。
3.4 模型訓(xùn)練和結(jié)果分析
3.4.1 模型性能比較
以某市A地區(qū)2016年6-12月的歷史數(shù)據(jù)為訓(xùn)練集,以邏輯斯特、決策樹、隨機(jī)森林、支持向量機(jī)為模型,預(yù)測(cè)2017年的各月份客戶電費(fèi)逾期情況。評(píng)價(jià)標(biāo)準(zhǔn)參考預(yù)測(cè)逾期客戶的覆蓋率和精確率。
以高壓分次劃撥用戶的預(yù)測(cè)效果對(duì)比為例,從覆蓋率看,決策樹表現(xiàn)最好,平均為0.70,明顯高于其他模型。其次是邏輯斯特模型,平均覆蓋率為0.62,隨機(jī)森林和支持向量機(jī)表現(xiàn)一般。從精確率方面看,決策樹表現(xiàn)最差,平均低于0.60。而其他模型的精確率變化趨同,平均在0.80左右。
在精確率和覆蓋率的取值方面,更看重精確率。因此,決策樹的總體預(yù)測(cè)效果最差。邏輯斯特模型,隨機(jī)森林,支持向量機(jī)的預(yù)測(cè)效果大致在相似水平,表明邏輯斯特模型的沒有陷入明顯的局部擬合。此外邏輯斯特模型解釋能力強(qiáng),最終選擇其作為本文的應(yīng)用模型,如圖2所示。
3.4.2 預(yù)測(cè)結(jié)果分析
A地區(qū)高壓用戶
以某市A地區(qū)2016年6-12月的高壓按月結(jié)算用戶和分次劃撥用戶的歷史數(shù)據(jù)生成訓(xùn)練樣本,分別建立邏輯斯特模型,預(yù)測(cè)2017年各月份的客戶電費(fèi)逾期情況。從結(jié)果來看,按月結(jié)算用戶和分次劃撥用戶的模型的Nagelkerke-R2值分別為0.72和0.56,均在0.5以上,表明模型的擬合效果非常好。預(yù)測(cè)結(jié)果的AUC值分別為0.96和0.94,表明模型非常準(zhǔn)確,結(jié)果的覆蓋率和精確率如圖2所示。
其中高壓按月結(jié)算用戶的預(yù)測(cè)效果較好,對(duì)逾期客戶的覆蓋率和精確率的取值基本都在0.82以上。分次劃撥用戶的預(yù)測(cè)效果相對(duì)較差,平均覆蓋率和精確率分別為0.61和0.8。
在綜合統(tǒng)計(jì)兩模型的預(yù)測(cè)結(jié)果后得到高壓用戶(包括按月結(jié)算用戶和分次劃撥用戶)的預(yù)測(cè)精度:平均覆蓋率和精確率為0.74和0.85,總體效果已達(dá)到較高水平。
A地區(qū)低壓大量用戶
同樣梳理A區(qū)低壓大量中按月結(jié)算用戶和分次劃撥用戶的歷史數(shù)據(jù),預(yù)測(cè)2017年各月的客戶電費(fèi)逾期情況。兩類用戶數(shù)據(jù)分別用邏輯斯特模型訓(xùn)練可得:按月結(jié)算用戶和分次劃撥用戶的模型的Nagelkerke-R2值分別為0.65和0.55,表明模型擬合效果很好。預(yù)測(cè)結(jié)果的AUC值都為0.93,表明模型非常準(zhǔn)確,結(jié)果的覆蓋率和精確率見圖4。其中低壓大量按月結(jié)算用戶的預(yù)測(cè)效果較好,覆蓋率和精確率的取值基本都在0.83以上。分次劃撥用戶的預(yù)測(cè)效果相對(duì)較差,平均覆蓋率約0.52,平均精確率約0.77。
與高壓用戶的情況類似,低壓大量用戶分次劃撥用戶也相對(duì)較差,綜合統(tǒng)計(jì)兩模型的預(yù)測(cè)結(jié)果,得到低壓大量用戶的結(jié)果并沒有因此而嚴(yán)重降低。低壓大量用戶的平均覆蓋率為精確率分別為0.75和 0.87,與 A區(qū)高壓用戶的預(yù)測(cè)結(jié)果在相似水平,如圖4所示。
綜上可知,模型對(duì)高壓用戶和低壓大量用電用戶的綜合預(yù)測(cè)能力優(yōu)秀,平均精確率都在0.8以上,覆蓋率在0.75左右。在不同類型用戶的模型中,分次劃撥用戶的模型擬合效果明顯差于按月結(jié)算用戶,分次劃撥用戶訓(xùn)練模型的Nagelkerke-R2值在0.55左右,而按月結(jié)算用戶的均在0.65左右,有的超過0.7。
結(jié)果匯總和分析
對(duì)B地區(qū)用戶也進(jìn)行上述訓(xùn)練,最后對(duì)A、B地區(qū)高壓客戶預(yù)測(cè)結(jié)果匯總統(tǒng)計(jì)如表4所示。
平均覆蓋率和精確率分別為0.67和0.8,總體水平較好。
同樣對(duì)A、B地區(qū)的低壓大量用戶的預(yù)測(cè)結(jié)果進(jìn)行匯總見表4。平均覆蓋率和精確率分別為0.69和0.82。總體覆蓋率中等偏上,精確率仍保持較高水平。
4 模型成果輸出及應(yīng)用
通過主題研究實(shí)踐,剖析客戶深層業(yè)務(wù)特征,生成:繳費(fèi)渠道偏好、高頻逾期行業(yè)、異常電量波動(dòng)、回款時(shí)長(zhǎng)異動(dòng)、區(qū)域聚類、客戶逾期風(fēng)險(xiǎn)等級(jí)等復(fù)雜標(biāo)簽,服務(wù)于多類業(yè)務(wù)場(chǎng)景。如:在客戶電費(fèi)回收風(fēng)險(xiǎn)管理中,客戶逾期風(fēng)險(xiǎn)等級(jí)標(biāo)簽有效提高電費(fèi)回收風(fēng)險(xiǎn)識(shí)別速度及精確率,將原有事中、事后風(fēng)控提升為事前、事中、事后的全過程風(fēng)控,支撐催費(fèi)等業(yè)務(wù)資源優(yōu)化配置;在業(yè)務(wù)定向推廣中,利用客戶屬性及渠道標(biāo)簽,細(xì)化客戶分層,有利于建立客戶與線上繳費(fèi)渠道、電子賬單訂閱等業(yè)務(wù)的關(guān)聯(lián)關(guān)系,便于相關(guān)業(yè)務(wù)的目標(biāo)客戶群選取;在營(yíng)業(yè)客服業(yè)務(wù)中,集成客戶畫像信息于營(yíng)業(yè)受理界面,對(duì)客戶歷史業(yè)務(wù)、電量波動(dòng)、繳費(fèi)渠道偏好等標(biāo)簽進(jìn)行展現(xiàn),幫助業(yè)務(wù)受理人員快速把握客戶特點(diǎn),提升客戶的服務(wù)體驗(yàn)。
5 總結(jié)
通過實(shí)踐研究,證明數(shù)據(jù)挖掘及客戶畫像技術(shù)在電費(fèi)回收業(yè)務(wù)方向應(yīng)用的可行性和有效性。
在建模過程中,基于業(yè)務(wù)實(shí)踐開展了諸如專家調(diào)研等多種方式的數(shù)據(jù)特征工程,并依托業(yè)務(wù)數(shù)據(jù)通過機(jī)器學(xué)習(xí)方法建模。實(shí)現(xiàn)專家經(jīng)驗(yàn)、業(yè)務(wù)數(shù)據(jù)、算法的結(jié)合及業(yè)務(wù)經(jīng)驗(yàn)的模型固化及沉淀。
以標(biāo)準(zhǔn)化模型開展客戶電費(fèi)回收風(fēng)險(xiǎn)評(píng)估,使科學(xué)化、自動(dòng)化的系統(tǒng)評(píng)估替代傳統(tǒng)人工評(píng)估。極大的提升了風(fēng)險(xiǎn)判別效率,實(shí)現(xiàn)了重點(diǎn)客戶群體的電費(fèi)風(fēng)險(xiǎn)評(píng)估的標(biāo)準(zhǔn)化高效全覆蓋。
通過主題研究,運(yùn)用數(shù)據(jù)挖掘技術(shù),提煉了公司數(shù)據(jù)價(jià)值,實(shí)現(xiàn)了客戶消費(fèi)行為和需求特征等隱性信息的顯性“標(biāo)簽化”。為業(yè)務(wù)人員提供了全新的認(rèn)知客戶手段和工具。
參考文獻(xiàn)
[1] 肖乃慎,李博,等. 大數(shù)據(jù)背景下的電網(wǎng)客戶用電行為分析系統(tǒng)設(shè)計(jì)[J].電子設(shè)計(jì)工程,2016(9):61-63.
[2] 魏瑤,朱偉義,等. 基于數(shù)據(jù)挖掘技術(shù)的用電異常分析系統(tǒng)設(shè)計(jì)[J].電力信息與通信,2014(5):.
[3] 裘華東,徐瑩,等,基于標(biāo)簽庫(kù)系統(tǒng)的電力企業(yè)客戶畫像構(gòu)建與信用評(píng)估及電費(fèi)風(fēng)險(xiǎn)防控應(yīng)用[J].電信科學(xué),2017,6:206-213.
[4] 馬姆杜·雷法特. 信用風(fēng)險(xiǎn)評(píng)分卡研究:基于SAS的開發(fā)與實(shí)施[M]. 出版社及城市,2013.
[5] 劉彪,劉金長(zhǎng). 基于用戶畫像分析預(yù)測(cè)電費(fèi)敏感型客戶的建模實(shí)踐[J]. 電力大數(shù)據(jù),2017(8):19-24.
[6] 姚旭,王曉丹. 特征選擇方法綜述[J]. 控制與決策,2012(2):161-165;
[7] 張?jiān)娷?,陳豐,等. 基于電力大數(shù)據(jù)的客戶立體畫像構(gòu)建及應(yīng)用研究[J]. 電力系統(tǒng),2018(4):18-25.
[8] 賴成光,陳曉宏. 基于隨機(jī)森林的洪災(zāi)風(fēng)險(xiǎn)評(píng)價(jià)模型及其應(yīng)用[J]. 水利學(xué)報(bào),2015(1):58-65.
[9] 張宇,張之明. 一種基于C5.0決策樹的客戶流失預(yù)測(cè)模型研究[J]. 統(tǒng)計(jì)與信息論壇,2015(1):89-94.
[10] 孫麗弘. 基于移動(dòng)數(shù)據(jù)業(yè)務(wù)大數(shù)據(jù)應(yīng)用的用戶行為標(biāo)簽庫(kù)模型[J]. 現(xiàn)代電信科技,2016(8):5-9.
(收稿日期: 2018.10.31)
作者簡(jiǎn)介:趙 洪(1976-),女,研究方向:電力營(yíng)銷管理。
沈建忠(1973-),男,研究方向:營(yíng)銷管理與現(xiàn)代服務(wù)體系。
王 ?。?980-),男,研究方向:電力營(yíng)銷。
張 騁(1972-),男,研究方向:營(yíng)銷管理、客戶服務(wù)。
瞿 青(1979-),女,研究方向:“互聯(lián)網(wǎng)+”營(yíng)銷服務(wù)。文章編號(hào):1007-757X(2020)02-0093-04