韋媚 覃艷梅 韋志瑜
摘 要:在5G+B(北斗)+AICDE(人工智能、物聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)、邊緣計(jì)算)的移動(dòng)互聯(lián)網(wǎng)時(shí)代,各企業(yè)對(duì)供應(yīng)商、代理商的管理工作尤為關(guān)鍵,這涉及一系列風(fēng)險(xiǎn)防控。如何高效識(shí)別代理商的異常行為,一直是代理商風(fēng)險(xiǎn)管控的重點(diǎn)。因此,文章開展了基于代理商風(fēng)險(xiǎn)管控的異常行為識(shí)別的研究,高度重視風(fēng)險(xiǎn)管控,將管理問題技術(shù)化,為技術(shù)人員提供方案指導(dǎo),為管理人員提供模型支持,為領(lǐng)導(dǎo)階層提供決策支撐。
關(guān)鍵詞:代理商;風(fēng)險(xiǎn)管控;異常行為;行為識(shí)別;風(fēng)險(xiǎn)管理
0 引言
隨著時(shí)代的變遷與新型技術(shù)的開發(fā),電信/移動(dòng)運(yùn)營商的業(yè)務(wù)不斷推陳出新。為了滿足各類業(yè)務(wù)開發(fā)、推廣等方面的需求,運(yùn)營商的IT支撐平臺(tái)越做越龐大,內(nèi)部關(guān)系也越來越復(fù)雜。一些不法分子試圖尋找運(yùn)營商在業(yè)務(wù)方面的規(guī)則或者平臺(tái)管理方面的漏洞,非授權(quán)地占用或者無底線地倒賣資源,或發(fā)展虛假用戶并為虛假用戶辦理業(yè)務(wù)套取相關(guān)業(yè)務(wù)的傭金,極大地危害著公司利益。所有的這些行為,極大地危害著運(yùn)營商的利益,是對(duì)法律的挑戰(zhàn),極大地影響了運(yùn)營商的正常運(yùn)營。電信管理論壇“Revenue Assurance Survey 2016”顯示,歐美電信運(yùn)營商的平均收入流失率為1.5%,而中國運(yùn)營商由于客戶服務(wù)的標(biāo)準(zhǔn)要求更高,違規(guī)套利犯罪成本低,收入流失比例遠(yuǎn)遠(yuǎn)高于歐美。因此,亟須一種方法,找到藏匿在正常用戶群體的風(fēng)險(xiǎn)用戶,以供后續(xù)進(jìn)一步分析其行為,挖掘深層次的風(fēng)險(xiǎn)。
為了應(yīng)對(duì)不法分子的非法侵占,運(yùn)營商采取了一系列的措施來圍追堵截。常見的措施包括:(1)基于規(guī)則的欺詐行為檢測方法。該方法是先制定行為檢測的規(guī)則與欺詐門限的閾值,對(duì)所有疑似不法分子進(jìn)行識(shí)別。(2)基于裙帶關(guān)聯(lián)的用戶識(shí)別方法。在確定不法分子的基礎(chǔ)上,梳理出與不法分子有交易或信息交互的用戶,然后按照一定的規(guī)則來過濾高風(fēng)險(xiǎn)用戶,進(jìn)而發(fā)現(xiàn)不法分子。
1 欺詐風(fēng)險(xiǎn)識(shí)別與定位思路
首先利用用戶價(jià)值分析法獲取存在風(fēng)險(xiǎn)的目標(biāo),同時(shí)基于價(jià)值和業(yè)務(wù)指標(biāo)將風(fēng)險(xiǎn)目標(biāo)進(jìn)行分群,每一群代表了某一類具備相似特征的風(fēng)險(xiǎn)目標(biāo)。通過價(jià)值分析分群后,能夠在很大程度上區(qū)分出正常行為和風(fēng)險(xiǎn)目標(biāo),可以顯著提升后續(xù)處理所需數(shù)據(jù)的數(shù)據(jù)質(zhì)量,并降低在確定參數(shù)權(quán)重過程中的運(yùn)算層數(shù)和運(yùn)算量。
在通過用戶價(jià)值分析法獲取風(fēng)險(xiǎn)目標(biāo)分群數(shù)據(jù)后,則使用異常行為檢測法,對(duì)每個(gè)風(fēng)險(xiǎn)目標(biāo)的業(yè)務(wù)受理動(dòng)作進(jìn)行數(shù)據(jù)采集和分析,包括業(yè)務(wù)受理時(shí)間、渠道、參數(shù)、受理用戶信息、受理產(chǎn)品等信息,從而檢測風(fēng)險(xiǎn)目標(biāo)使用外掛程序、網(wǎng)絡(luò)爬蟲等先進(jìn)“作案”手法盜取用戶信息、批量受理資金倒掛產(chǎn)品等非法行為。
在確定風(fēng)險(xiǎn)目標(biāo)具體違規(guī)套利手段的檢測過程中,除了使用基于風(fēng)險(xiǎn)目標(biāo)本身業(yè)務(wù)受理數(shù)據(jù)的特征刻畫和自學(xué)習(xí),還可通過不同風(fēng)險(xiǎn)等級(jí)的風(fēng)險(xiǎn)目標(biāo)集群間業(yè)務(wù)特征的對(duì)照,進(jìn)一步優(yōu)化特征權(quán)重和特征值,提高預(yù)測命中率、預(yù)測覆蓋率和預(yù)測準(zhǔn)確率。
2 基于風(fēng)險(xiǎn)管控的欺詐行為識(shí)別
2.1 基于用戶價(jià)值的行為分析與用戶定位
簡而言之,所謂的用戶價(jià)值是指在一定的時(shí)間或特定的窗口周期內(nèi),借助于一些特定的方式或手段(如點(diǎn)對(duì)點(diǎn)付費(fèi)、精神領(lǐng)袖的言論號(hào)召、企業(yè)品牌的口碑推廣等),用戶為移動(dòng)運(yùn)營商所貢獻(xiàn)的價(jià)值總和。用戶價(jià)值是衡量用戶級(jí)別的關(guān)鍵,是企業(yè)維系用戶與向用戶提供服務(wù)的重要依據(jù)。
基于價(jià)值分析的風(fēng)險(xiǎn)用戶識(shí)別,主要包括以下步驟。
(1)全面分析用戶價(jià)值,構(gòu)建相應(yīng)的評(píng)價(jià)體系。按照常規(guī)的理解,用戶價(jià)值可簡單地按照“用戶收益減去用戶成本”計(jì)算,其中,用戶收益是用戶出賬收入的累加,而用戶成本則是各類支出(包括網(wǎng)間結(jié)算的累計(jì)支出、SP累計(jì)結(jié)算支出、營銷活動(dòng)的成本累計(jì)支持等)。
(2)引入考核指標(biāo),對(duì)用戶價(jià)值進(jìn)行量化。按照費(fèi)用的統(tǒng)計(jì)維度,用戶收益主要包括兩個(gè)方面:消費(fèi)本身的價(jià)值(比如話費(fèi)充值)、消費(fèi)衍生的價(jià)值(如基于活動(dòng)訂購業(yè)務(wù)或購買終端)。按照費(fèi)用的統(tǒng)計(jì)渠道,用戶成本主要包括三類:基于營銷活動(dòng)的成本、基于用戶發(fā)展的成本、基于費(fèi)用結(jié)算的成本。
(3)使用一定的規(guī)則,統(tǒng)計(jì)用戶在生命周期內(nèi)的價(jià)值??梢圆捎?G+AICDE的技術(shù)對(duì)用戶價(jià)值進(jìn)行全面分析與統(tǒng)計(jì),比如使用AI技術(shù)分析用戶的行為特征,使用大數(shù)據(jù)技術(shù)對(duì)用戶進(jìn)行畫像分析,使用云計(jì)算分析用戶的業(yè)務(wù)需求等。
(4)基于用戶價(jià)值和分析體系,獲取用戶的利潤貢獻(xiàn)率。所謂的利潤貢獻(xiàn)率是指用戶價(jià)值在運(yùn)營商整個(gè)利潤池里的比例,計(jì)算公式為:利潤貢獻(xiàn)率=用戶價(jià)值總和/運(yùn)營商業(yè)務(wù)利潤總和×100%[1]。
(5)細(xì)化用戶價(jià)值的成分,開展聚類分析。此處用戶價(jià)值的組成成分包括諸多指標(biāo),比如話費(fèi)充值的本金,運(yùn)營商對(duì)用戶的饋贈(zèng)費(fèi)、酬金,服務(wù)提供商的業(yè)務(wù)結(jié)算,業(yè)務(wù)在不同運(yùn)營商之間的網(wǎng)間結(jié)算等。
(6)引入貢獻(xiàn)利潤率指標(biāo),按照貢獻(xiàn)利潤率對(duì)用戶進(jìn)行排序,找出貢獻(xiàn)利潤率低的客戶群體,剔除該群體。貢獻(xiàn)利潤率是基于投入與產(chǎn)出的關(guān)系來確定的,比如,可以把產(chǎn)出/成本低于1/3的群體,定為貢獻(xiàn)利潤率低的群體。當(dāng)然,閾值的設(shè)定,可根據(jù)實(shí)際情況、區(qū)域特征、業(yè)務(wù)性質(zhì)等方面進(jìn)行綜合評(píng)價(jià)。
(7)基于用戶行為,對(duì)低價(jià)值客戶實(shí)施二次聚類分析。其中,用戶行為的范圍較為廣泛,內(nèi)容包括業(yè)務(wù)使用行為、繳費(fèi)行為、推廣行為等。
(8)設(shè)定一系列具有風(fēng)險(xiǎn)的場景,基于場景的應(yīng)用,實(shí)施用戶群體的歸類或分類。相應(yīng)的場景包括使用超高酬金進(jìn)行套利、倒賣營銷資源獲利等。
2.2 異常行為檢測
步驟1:數(shù)據(jù)預(yù)處理。采用大數(shù)據(jù)的kafka stream流處理技術(shù)按照時(shí)間窗口實(shí)時(shí)提取4A權(quán)限日志、服務(wù)日志等信息并進(jìn)行時(shí)序處理、數(shù)據(jù)清洗,剔除白名單用戶[2]。
步驟2:特征提取。具體內(nèi)容包括:(1)用戶特征刻畫。建立用戶ID編碼、用戶的城市、不同類型業(yè)務(wù)操作的量、 10分鐘窗口操作量、不同地市業(yè)務(wù)量等。(2)業(yè)務(wù)特征。建立業(yè)務(wù)ID編碼、業(yè)務(wù)描述文本編碼、業(yè)務(wù)類型分類等特征。(3)Categorical feature-Embedding。城市、服務(wù)器IP、用戶IP、DOW等都是類別特征。對(duì)這些特征的常規(guī)處理是one-hot編碼[3],會(huì)造成特征維度高且稀疏。Embedding將類別特征隨機(jī)映射為連續(xù)的高密度低維向量,可以提高模型的效率。(4)特征值轉(zhuǎn)換。由于不同操作員賬號(hào)、不同業(yè)務(wù)操作類型、不同時(shí)間段對(duì)應(yīng)的業(yè)務(wù)操作數(shù)據(jù)量差異較大,在使用深度學(xué)習(xí)算法預(yù)測前需要先對(duì)特征數(shù)據(jù)進(jìn)行歸一化處理,在項(xiàng)目預(yù)研中嘗試多種方法,其中采用均值和標(biāo)準(zhǔn)差的歸一化方式效果最佳(見表1)。
步驟3:智能分析。采取“無監(jiān)督”+“有監(jiān)督”組合模式[4],無監(jiān)督模型可有效預(yù)測未知異常,有監(jiān)督模型根據(jù)標(biāo)注的數(shù)據(jù)預(yù)測相似異常。
針對(duì)千萬級(jí)的樣本數(shù)據(jù),深度學(xué)習(xí)模型的表現(xiàn)優(yōu)于機(jī)器學(xué)習(xí)算法(回歸等)。經(jīng)統(tǒng)計(jì)每天ESB服務(wù)總線產(chǎn)生約億條級(jí)別日志,采用前饋神經(jīng)網(wǎng)絡(luò)AutoEncoder算法訓(xùn)練無監(jiān)督模型,針對(duì)千萬級(jí)樣本數(shù)據(jù)中少量異常樣本數(shù)據(jù),模型能夠最大完好擬合大部分正常樣本,而少量異常樣本擬合較差,因此將損失值較大的樣本作為異常數(shù)據(jù)輸出。
針對(duì)無監(jiān)督模型,嘗試選取MLP、AutoEncoder、孤立森林等多種深度學(xué)習(xí)或機(jī)器學(xué)習(xí)算法,經(jīng)測驗(yàn)其中孤立森林算法結(jié)果的召回率60%,AutoEncoder結(jié)果召回率100%,無監(jiān)督模型中深度學(xué)習(xí)AutoEncoder算法效果最優(yōu)。
在有監(jiān)督模型中,選取了邏輯回歸、決策樹、支持向量機(jī)、隨機(jī)森林多種機(jī)器學(xué)習(xí)算法,經(jīng)測試隨機(jī)森林和決策樹算法較優(yōu),采用隨機(jī)森林作為有監(jiān)督算法模型。
3 結(jié)語
就生產(chǎn)企業(yè)而言,對(duì)供應(yīng)商的日常管理與風(fēng)險(xiǎn)監(jiān)控,是一個(gè)長期的過程。管理的手段創(chuàng)新是企業(yè)向數(shù)字化、智能化、科學(xué)化轉(zhuǎn)型的必要經(jīng)歷。本文的研究主旨在于將管理問題技術(shù)化,采用IT化手段來實(shí)現(xiàn),用新型技術(shù)來識(shí)別管理風(fēng)險(xiǎn)。后期,將主要從兩個(gè)方面開展工作。一方面,對(duì)現(xiàn)有的識(shí)別方案進(jìn)行優(yōu)化與完善,讓當(dāng)前方案具有更大的應(yīng)用場景和適用范圍,力爭將現(xiàn)有的方案固化為相應(yīng)的模型或系統(tǒng)。另一方面,選取一定的企業(yè)進(jìn)行試點(diǎn)應(yīng)用,用現(xiàn)實(shí)案例來檢查方案的質(zhì)量,讓更多的企業(yè)從中受益,實(shí)現(xiàn)方案的價(jià)值最大化。
作者簡介:韋媚(1986—),女,廣西南寧人,工程師,學(xué)士;研究方向:IT應(yīng)用,項(xiàng)目管理,大數(shù)據(jù)應(yīng)用,風(fēng)險(xiǎn)稽核等。
[參考文獻(xiàn)]
[1]張小明.風(fēng)險(xiǎn)防控思維下的應(yīng)急治理研究[J].中國應(yīng)急管理,2021(3):48-51.
[2]朱有祥,張彤.推行“精準(zhǔn)化”風(fēng)險(xiǎn)管控模式—山東省青島市李滄區(qū)指導(dǎo)小微企業(yè)建立雙重預(yù)防機(jī)制記事[J].中國應(yīng)急管理,2021(3):88-89.
[3]趙研.基于自適應(yīng)巡視算法的工業(yè)物聯(lián)網(wǎng)異常行為檢測[J].移動(dòng)通信,2021(3):100-103.
[4]周啟清,陳香蹀.供應(yīng)鏈金融反保理業(yè)務(wù)風(fēng)險(xiǎn)評(píng)價(jià)與管控[J].金融經(jīng)濟(jì),2021(3):67-73.
(編輯?姚 鑫)
Research on the abnormal behavior identification of agent risk management
and control under the background of Internet
Wei Mei, Qin Yanmei, Wei Zhiyu
(China Mobile Communication Group Guangxi Co., Ltd., Nanning 450000, China)
Abstract:In the era of 5G + B (Beidou) + AICDE (Artificial Intelligence, the Internet of Things, Cloud Computing, Big Data, Edge Computing), the management work of the enterprises to the agents and suppliers is very important and it is related to a series of risk prevention and control. How to effectively identify the abnormal behavior of agents has always been the focus of agent risk management and control. Therefore, this paper conducts research on the abnormal behavior identification of agent risk management and control, attaches great importance to risk management and control, makes management problems technical, provides scheme guidance for technical personnel, provides mode; support for management personnel and provides decision support for leaders.
Key words:agent; risk control; abnormal behavior; behavior recognition; risk management