向博文 胡振華 申美惠
摘 要:目前,我國個(gè)人信用理論主要集中應(yīng)用在金融行業(yè),電信行業(yè)的信用管理和實(shí)踐應(yīng)用仍處于探索階段。該文以中國電信某省C網(wǎng)個(gè)人客戶為研究分析對象,將主成分分析法和熵值法相結(jié)合建立客戶信用評估模型,從而更加科學(xué)合理地得到了用戶的信用分?jǐn)?shù)。
關(guān)鍵詞:電信客戶 信用評估 主成分分析法 熵值法
中圖分類號:F626 文獻(xiàn)標(biāo)識碼:A 文章編號:1674-098X(2015)12(a)-0023-03
Abstract:At present, the personal credit theory mainly used in the financial industry, the credit management and application practice of the telecommunications industry is still in the exploratory stage. This credit evaluation model use together Principal Component Analysis (PCA) with Entropy Method, based on individual customer data of China telecom C network.
Key Words:The telecom customer; Credit evaluation; PCA; Entropy method
電信行業(yè)作為信息服務(wù)業(yè)的支柱行業(yè),優(yōu)質(zhì)客戶資源的爭奪已然成為了一場不見硝煙的戰(zhàn)爭。作為客戶管理的重點(diǎn),客戶信用的評估與管理越來越得到各大運(yùn)營商的重視。
國外對信用評估的研究已發(fā)展到相當(dāng)高的水平,有些評估方法、技術(shù)、模型已經(jīng)得到學(xué)術(shù)界的認(rèn)可,被廣泛應(yīng)用[1-3]。而國內(nèi)對信用評估技術(shù)的研究還處在起步階段[4-7],客戶信用管理及評估,還沒有形成完整的科學(xué)研究方法和理論。電信行業(yè)的客戶信用評價(jià)的研究尚處于起步階段,各運(yùn)營商之間、運(yùn)營商集團(tuán)內(nèi)部沒有形成統(tǒng)一的評價(jià)方法論。
該文致力于研究一種較為精準(zhǔn)的電信客戶信用評估方法,將主成分分析法和熵值法結(jié)合使用建立信用評估模型,克服使用單一方法帶來的缺陷不足,從而更為科學(xué)全面地對客戶信用進(jìn)行評分評級,并針對不同的信用等級提出差異化授信服務(wù)建議,實(shí)現(xiàn)運(yùn)營中的服務(wù)最優(yōu)化、利益最大化、風(fēng)險(xiǎn)最小化。
1 信用評估模型的指標(biāo)體系
綜合考慮電信行業(yè)個(gè)人客戶信用的各種影響因素,同時(shí)借鑒國內(nèi)外有關(guān)文獻(xiàn)的評估指標(biāo)設(shè)計(jì)[8-10],在國內(nèi)外學(xué)者的信用評估指標(biāo)體系研究成果的基礎(chǔ)上[11],本文建立了專門針對電信行業(yè)設(shè)計(jì)了一個(gè)個(gè)人客戶信用評估指標(biāo)體系。該評估指標(biāo)體系包括社會(huì)屬性、違約成本、通信需求和支付能力四個(gè)維度的指標(biāo),并且選擇“30天內(nèi)是否復(fù)機(jī)”作為驗(yàn)證變量,如表1所示。
2 信用評估模型設(shè)計(jì)
評估指標(biāo)體系中設(shè)計(jì)的變量指標(biāo),是根據(jù)文獻(xiàn)資料、業(yè)務(wù)常規(guī)和經(jīng)驗(yàn)確定的,主觀性較強(qiáng)、缺乏嚴(yán)謹(jǐn)?shù)目茖W(xué)論證。因此,首先利用主成分分析法,找出每個(gè)維度內(nèi)的顯著變量、剔除非顯著影響變量、排除變量間的相關(guān)性影響,從而計(jì)算出評價(jià)對象各個(gè)維度分?jǐn)?shù)。確定主成分,一般取累計(jì)方差貢獻(xiàn)率超過85%的前p個(gè)作為主成分。累計(jì)方差貢獻(xiàn)率計(jì)算公式:
然后,利用熵值法計(jì)算維度的權(quán)重,其本質(zhì)是通過各指標(biāo)的信息價(jià)值系數(shù)來計(jì)算權(quán)重,價(jià)值系數(shù)越高,其對評價(jià)結(jié)果的貢獻(xiàn)就越大。第項(xiàng)指標(biāo)的權(quán)重為:
3 信用評估模型的實(shí)證分析
該文建模工具采用SAS 9.3,針對某省中國電信某省4 000條用戶數(shù)據(jù)進(jìn)行建模評估分析。
3.1 利用主成分分析法計(jì)算維度分?jǐn)?shù)
該模型變量分3個(gè)維度,共16個(gè)輸入變量。其中每個(gè)維度所包含的具體變量情況各有不同,因此需要對每個(gè)維度進(jìn)行具體分析,分別計(jì)算各維度得分。
3.1.1 計(jì)算通信需求的維度得分
根據(jù)特征值大于1及累計(jì)貢獻(xiàn)率大于85%的標(biāo)準(zhǔn),選擇前3個(gè)主成分來代替原有的11個(gè)變量。通信需求得分= 0.722×F1+0.1045×F2+0.0658×F3。
3.1.2 計(jì)算支付能力的維度得分
根據(jù)特征值大于1及累計(jì)貢獻(xiàn)率大于85%的標(biāo)準(zhǔn),選擇前2個(gè)主成分來代替原有的3個(gè)變量。支付能力得分= 0.777×F1+0.1869×F2。
3.1.3 計(jì)算社會(huì)屬性的維度得分
社會(huì)屬性維度內(nèi)只包含Age年齡一個(gè)變量,且該變量為分類型變量,分為A-F共6類。
根據(jù)線性函數(shù)轉(zhuǎn)換公式如下:
Age變量用戶得分如表2所示。
3.1.4 計(jì)算違約成本的維度得分
違約成本維度內(nèi)只包含R3A_Pay_Amt近三月平均繳費(fèi)金額一個(gè)變量,且該變量為數(shù)值型變量。因此,該變量經(jīng)過標(biāo)準(zhǔn)化后的數(shù)據(jù)即可作為此維度的得分。
3.1.5 各維度信息效用
通過以上對輸入變量4個(gè)維度的計(jì)算,得到所有用戶4個(gè)維度的信用得分情況,如表3所示。
3.2 利用熵值法計(jì)算維度權(quán)重
該文信用評估模型的熵值法計(jì)算維度權(quán)重步驟,采用SAS編程來實(shí)現(xiàn)。
對信息效用值進(jìn)行公式2的計(jì)算,從而到得到各維度的權(quán)重,如表4所示。
3.3 計(jì)算用戶信用分?jǐn)?shù)
根據(jù)公式3,計(jì)算用戶的信用綜合評分。同時(shí)為了便于對分?jǐn)?shù)的觀察和理解,將用戶信用的分?jǐn)?shù)歸一到[0,1]區(qū)間。結(jié)果如表5所示。
4 信用評估模型的效果評估
按照公式3信用評估模型,是典型的無監(jiān)督模型。從以下兩點(diǎn)對模型的效果進(jìn)行評估。
4.1 用戶信用分?jǐn)?shù)分布評估
對4 000個(gè)建模用戶的信用綜合評分結(jié)果分布情況進(jìn)行統(tǒng)計(jì)分析,結(jié)果如透視圖1所示,其中橫坐標(biāo)表示用戶信用分?jǐn)?shù)。
通過對柱狀圖結(jié)果進(jìn)行觀察,得出用戶的信用評分呈現(xiàn)合理的長尾正態(tài)分布形態(tài),即信用較好用戶的信用評分集中在高分值,信用較差用戶的信用評分分散在低分值的尾部。這表明信用差的用戶與信用好的用戶在信用評分上差異明顯。
用戶信用分?jǐn)?shù)分布合理性的驗(yàn)證,可以表明用戶信用分?jǐn)?shù)可以很好地區(qū)分用戶的信用狀態(tài)。
4.2 通過驗(yàn)證變量效果評估
該文信用評估模型使用“用戶30天內(nèi)是否復(fù)機(jī)”作為模型效果驗(yàn)證變量。通過探討用戶信用分?jǐn)?shù)與驗(yàn)證變量之間的關(guān)系,觀察復(fù)機(jī)率的提升度,實(shí)現(xiàn)對模型效果的評估。結(jié)果如圖2所示。
如上圖結(jié)果,按照用戶信用評分由高到低排序,比較不同信用評分用戶中30天復(fù)機(jī)率的大小。發(fā)現(xiàn)不同信用分?jǐn)?shù)用戶的復(fù)機(jī)率的提升度均大于1,且信用評分最高的前70%用戶的30天復(fù)機(jī)率比正常情況下的平均復(fù)機(jī)率高20%。說明信用評分能較好并且正確地反映用戶信用的好壞。
5 信用評估模型的結(jié)果分析
模型的信用分?jǐn)?shù)分布在0.11~0.71之間,且大致呈現(xiàn)正態(tài)分布,中間信用分?jǐn)?shù)的用戶多,較大信用分?jǐn)?shù)和較小信用分?jǐn)?shù)的用戶較少。結(jié)果與統(tǒng)計(jì)學(xué)常識和業(yè)務(wù)實(shí)際情況相符合。
同時(shí)將用戶的變量屬性與分?jǐn)?shù)結(jié)合分析,發(fā)現(xiàn)信用分?jǐn)?shù)結(jié)果所反映出的信用事實(shí)與變量探索階段的結(jié)論相一致。通過模型結(jié)果分析,總結(jié)信用較好的用戶的特征如下。
(1)年齡集中在26~39、43~49階段,即中年用戶。
(2)支付能力處于中等及中等水平以上。
(3)通信需求大,通信行為活躍。
總體可以概括為,信用較好用戶多為支付能力穩(wěn)定、通信需求強(qiáng)烈的中年客戶群體。這一部分用戶是營銷和維護(hù)的重點(diǎn)客戶群。
通過進(jìn)一步挖掘分析,發(fā)現(xiàn)這部分用戶一般有固定的工作、具有穩(wěn)定的經(jīng)濟(jì)來源、存在一定的交往交際圈、對個(gè)人行為信用較為重視,因此在實(shí)際中具有良好的信用度。
參考文獻(xiàn)
[1] Bell T. Neural nets or the logit model: a comparison of each models ability to predict commercial bank failures[J]. Intelligent Systems in Accounting:Finance and Management, 1997(63):249-264.
[2] Tam K Y, Kiang M. Managerial applications of neural networks: the case of bank failure predictions [J].Management Sciences, 1992(38):926-947.
[3] Bell T. Neural nets or the logit model: a comparison of each models ability to predict commercial bank failures[J].Intelligent Systems in Accounting:Finance and Management,1997(63):249-264.
[4] 王海軍,范靜珥,佟元琪.基于AHP法的農(nóng)戶小額信用貸款風(fēng)險(xiǎn)評價(jià)的研究-以吉林省農(nóng)村信用社為例[J].吉林農(nóng)業(yè),2009(24):89-91.
[5] 譚民俊,王雄,岳意定.FPR-UTAH評價(jià)方法在農(nóng)戶小額信貸信用評級中的應(yīng)用[J].系統(tǒng)工程,2013(5):55-59.
[6] 王穎.中國農(nóng)戶小額信貸信用風(fēng)險(xiǎn)評估研究-基于模糊綜合評價(jià)模型[J].金融與統(tǒng)籌城鄉(xiāng),2010(8):60-62.
[7] 劉志戈.農(nóng)戶信用征集與評價(jià)機(jī)制探析[J].金融理論與實(shí)踐,2008(12):48-51.
[8] 吳沖,張曉東,田海霞,等.基于模糊神經(jīng)網(wǎng)絡(luò)的商業(yè)銀行信用風(fēng)險(xiǎn)評估模型研究[J].管理觀察,2009(3):187-189.
[9] 吳沖,王螢,郭英見.基于支持向量機(jī)的個(gè)人信用評估模型研究[J].運(yùn)籌與管理,2008(4):96-99.
[10] 陳良維.決策樹算法在農(nóng)戶小額貸款中的應(yīng)用研究[J].計(jì)算機(jī)工程與應(yīng)用,2008(31):242-244.
[11] 張博文.電信運(yùn)營客戶信用評分建模研究[J].信息科技,2009(10):113-114.
[12] 龐素琳,鞏吉璋.C5.0分類算法及在銀行個(gè)人信用評級中的應(yīng)用[J].系統(tǒng)工程理論與實(shí)踐,2009(12):94-104.
[13] 蔡麗艷,馮憲彬,丁蕊.基于決策樹的農(nóng)戶小額貸款信用評估模型研究[J].安徽農(nóng)業(yè)科學(xué),2011(2):1215-1217.