趙雁航,劉昌興,周 陽,馮 博,魏 迪
(中國移動通信集團(tuán)吉林有限公司網(wǎng)絡(luò)優(yōu)化中心 吉林 長春 130000)
在本次研究中,我們選取了影響用戶感知最為重要的視頻、語音、網(wǎng)絡(luò)三個維度來搭建用戶的感知評價體系,首先選取WGCNA(加權(quán)基因共表達(dá)網(wǎng)絡(luò)法)算法,從海量的用戶感知類指標(biāo)中選取能夠全面而又客觀的反映用戶感知情況的9項重點(diǎn)指標(biāo)(每個維度選取連接度最高的前3項),并利用熵權(quán)法分別賦予該9項指標(biāo)不同的權(quán)重,然后通過PCA(主成分分析)算法將每個維度的3項指標(biāo)降至一維,同理利用熵權(quán)法給每個維度賦予不同的權(quán)值,最終將維度權(quán)值和子項權(quán)值的乘積作為每項指標(biāo)的末端權(quán)值,然后通過k-means聚類算法來確定每一類指標(biāo)的感知得分的閾值,最終用單項得分乘以對應(yīng)權(quán)值得到單用戶的感知得分,通過用戶的感知得分確定出質(zhì)差用戶并進(jìn)行精準(zhǔn)營銷,并通過關(guān)聯(lián)質(zhì)差用戶和網(wǎng)元定位出感知差問題小區(qū),從而進(jìn)行相對應(yīng)的網(wǎng)絡(luò)優(yōu)化措施,從而提升用戶感知[1]。
搭建用戶感知評價體系,第一步就是指標(biāo)的選取,所以當(dāng)面對海量的用戶感知類指標(biāo)時,哪些指標(biāo)能夠客觀而又全面的代表用戶的真實(shí)感知情況是面臨的第一個問題,本文選取了WGCNA算法進(jìn)行指標(biāo)的選取,這是一種生物信息學(xué)的算法,其目的是探索基因網(wǎng)絡(luò)中的核心基因以及各基因之間的關(guān)系,以此來挑選核心基因,算法基于數(shù)據(jù)客觀計算得到指標(biāo)重要性(連接度表征重要性)從而進(jìn)行指標(biāo)選擇,指標(biāo)的重要性體現(xiàn)為該指標(biāo)的變化對網(wǎng)絡(luò)整體的影響,等于該指標(biāo)與網(wǎng)絡(luò)中其它每個指標(biāo)的全面相似性的總和。因此可以將基因模塊類比為用戶的感知指標(biāo)項,將基因網(wǎng)絡(luò)類比為用戶感知指標(biāo)集合,于是挑選影響用戶感知核心指標(biāo)的過程,就可以類比為利用WGCNA算法尋找核心基因的過程,本文最終通過WGCNA算法為視頻、語音、網(wǎng)頁三個維度分別選取連接度最高的3項指標(biāo)。
選取完關(guān)鍵指標(biāo)之后,每個指標(biāo)的重要程度是不同的,哪些指標(biāo)影響程度大?哪些指標(biāo)影響程度小呢?在這里我們引入了信息論里面熵的概念,信息是系統(tǒng)有序程度的度量,而熵是系統(tǒng)無序程度的度量,那么對于某項指標(biāo)來說,就可以用其熵值來判斷其離散程度,指標(biāo)離散程度越大,該指標(biāo)對綜合評價體系的影響就越大,那么權(quán)重就越大。首先,通過PCA算法將每個維度的3項指標(biāo)降維至一維,通過熵權(quán)法確定出每個維度的維度權(quán)值,同理利用熵權(quán)法為同一個維度內(nèi)的不同指標(biāo)賦予不同的子項權(quán)值,最終每項指標(biāo)的末端權(quán)值即為維度權(quán)值和子項權(quán)值的乘積,本文選取了全省2萬用戶的話單數(shù)據(jù)作為樣本數(shù)據(jù),通過熵權(quán)法計算,最終得到各項指標(biāo)的權(quán)值詳情見表1。
表1 各項指標(biāo)的權(quán)值
利用K-Means聚類算法,設(shè)置4個聚類中心,將每個聚類中心作為一個數(shù)據(jù)切分點(diǎn),因此每個指標(biāo)均可劃分為5個得分區(qū)間,對應(yīng)的將用戶每個維度的指標(biāo)均劃分成5個級別,根據(jù)指標(biāo)的好壞,賦予基礎(chǔ)分1、2、3、4、5分,對于同一個得分區(qū)間內(nèi)的用戶,為了區(qū)分其感知的不同,再利用線性插值算法,讓離散的得分能連續(xù)化。
根據(jù)前文利用k-means聚類算法確定的每項指標(biāo)的子項得分,與對應(yīng)的指標(biāo)末端權(quán)值進(jìn)行乘積運(yùn)算,最終將9項指標(biāo)的得分進(jìn)行求和,從而得到單用戶的感知得分。本文通過對全省1800萬用戶進(jìn)行感知打分,根據(jù)用戶得分的分布情況,定義1周內(nèi)任意5d感知得分均小于2.5分的用戶為質(zhì)差用戶,從而得出全省26萬質(zhì)差用戶,然后根據(jù)用戶的話單信息對用戶和小區(qū)進(jìn)行相關(guān)關(guān)聯(lián),定位出2500多個感知差的問題小區(qū),經(jīng)過現(xiàn)場驗證,問題小區(qū)命中率高達(dá)80.17%[2-3]。
本文主要是利用智能算法,對用戶感知類的多維指標(biāo)數(shù)據(jù),進(jìn)行了數(shù)據(jù)分析與挖掘。最終確立了一個客觀完善的用戶感知情況綜合評價體系。并進(jìn)一步的,利用機(jī)器學(xué)習(xí)算法,將感知情況與小區(qū)KPI指標(biāo)進(jìn)行了關(guān)聯(lián),找出了造成用戶感知情況差的關(guān)鍵KPI指標(biāo),為現(xiàn)網(wǎng)優(yōu)化工作提供了有力的支撐。