韋媚 覃艷梅 韋志瑜
摘 要:在5G+B(北斗)+AICDE(人工智能、物聯(lián)網(wǎng)、云計算、大數(shù)據(jù)、邊緣計算)的移動互聯(lián)網(wǎng)時代,各企業(yè)對供應商、代理商的管理工作尤為關鍵,這涉及一系列風險防控。如何高效識別代理商的異常行為,一直是代理商風險管控的重點。因此,文章開展了基于代理商風險管控的異常行為識別的研究,高度重視風險管控,將管理問題技術化,為技術人員提供方案指導,為管理人員提供模型支持,為領導階層提供決策支撐。
關鍵詞:代理商;風險管控;異常行為;行為識別;風險管理
0 引言
隨著時代的變遷與新型技術的開發(fā),電信/移動運營商的業(yè)務不斷推陳出新。為了滿足各類業(yè)務開發(fā)、推廣等方面的需求,運營商的IT支撐平臺越做越龐大,內部關系也越來越復雜。一些不法分子試圖尋找運營商在業(yè)務方面的規(guī)則或者平臺管理方面的漏洞,非授權地占用或者無底線地倒賣資源,或發(fā)展虛假用戶并為虛假用戶辦理業(yè)務套取相關業(yè)務的傭金,極大地危害著公司利益。所有的這些行為,極大地危害著運營商的利益,是對法律的挑戰(zhàn),極大地影響了運營商的正常運營。電信管理論壇“Revenue Assurance Survey 2016”顯示,歐美電信運營商的平均收入流失率為1.5%,而中國運營商由于客戶服務的標準要求更高,違規(guī)套利犯罪成本低,收入流失比例遠遠高于歐美。因此,亟須一種方法,找到藏匿在正常用戶群體的風險用戶,以供后續(xù)進一步分析其行為,挖掘深層次的風險。
為了應對不法分子的非法侵占,運營商采取了一系列的措施來圍追堵截。常見的措施包括:(1)基于規(guī)則的欺詐行為檢測方法。該方法是先制定行為檢測的規(guī)則與欺詐門限的閾值,對所有疑似不法分子進行識別。(2)基于裙帶關聯(lián)的用戶識別方法。在確定不法分子的基礎上,梳理出與不法分子有交易或信息交互的用戶,然后按照一定的規(guī)則來過濾高風險用戶,進而發(fā)現(xiàn)不法分子。
1 欺詐風險識別與定位思路
首先利用用戶價值分析法獲取存在風險的目標,同時基于價值和業(yè)務指標將風險目標進行分群,每一群代表了某一類具備相似特征的風險目標。通過價值分析分群后,能夠在很大程度上區(qū)分出正常行為和風險目標,可以顯著提升后續(xù)處理所需數(shù)據(jù)的數(shù)據(jù)質量,并降低在確定參數(shù)權重過程中的運算層數(shù)和運算量。
在通過用戶價值分析法獲取風險目標分群數(shù)據(jù)后,則使用異常行為檢測法,對每個風險目標的業(yè)務受理動作進行數(shù)據(jù)采集和分析,包括業(yè)務受理時間、渠道、參數(shù)、受理用戶信息、受理產(chǎn)品等信息,從而檢測風險目標使用外掛程序、網(wǎng)絡爬蟲等先進“作案”手法盜取用戶信息、批量受理資金倒掛產(chǎn)品等非法行為。
在確定風險目標具體違規(guī)套利手段的檢測過程中,除了使用基于風險目標本身業(yè)務受理數(shù)據(jù)的特征刻畫和自學習,還可通過不同風險等級的風險目標集群間業(yè)務特征的對照,進一步優(yōu)化特征權重和特征值,提高預測命中率、預測覆蓋率和預測準確率。
2 基于風險管控的欺詐行為識別
2.1 基于用戶價值的行為分析與用戶定位
簡而言之,所謂的用戶價值是指在一定的時間或特定的窗口周期內,借助于一些特定的方式或手段(如點對點付費、精神領袖的言論號召、企業(yè)品牌的口碑推廣等),用戶為移動運營商所貢獻的價值總和。用戶價值是衡量用戶級別的關鍵,是企業(yè)維系用戶與向用戶提供服務的重要依據(jù)。
基于價值分析的風險用戶識別,主要包括以下步驟。
(1)全面分析用戶價值,構建相應的評價體系。按照常規(guī)的理解,用戶價值可簡單地按照“用戶收益減去用戶成本”計算,其中,用戶收益是用戶出賬收入的累加,而用戶成本則是各類支出(包括網(wǎng)間結算的累計支出、SP累計結算支出、營銷活動的成本累計支持等)。
(2)引入考核指標,對用戶價值進行量化。按照費用的統(tǒng)計維度,用戶收益主要包括兩個方面:消費本身的價值(比如話費充值)、消費衍生的價值(如基于活動訂購業(yè)務或購買終端)。按照費用的統(tǒng)計渠道,用戶成本主要包括三類:基于營銷活動的成本、基于用戶發(fā)展的成本、基于費用結算的成本。
(3)使用一定的規(guī)則,統(tǒng)計用戶在生命周期內的價值??梢圆捎?G+AICDE的技術對用戶價值進行全面分析與統(tǒng)計,比如使用AI技術分析用戶的行為特征,使用大數(shù)據(jù)技術對用戶進行畫像分析,使用云計算分析用戶的業(yè)務需求等。
(4)基于用戶價值和分析體系,獲取用戶的利潤貢獻率。所謂的利潤貢獻率是指用戶價值在運營商整個利潤池里的比例,計算公式為:利潤貢獻率=用戶價值總和/運營商業(yè)務利潤總和×100%[1]。
(5)細化用戶價值的成分,開展聚類分析。此處用戶價值的組成成分包括諸多指標,比如話費充值的本金,運營商對用戶的饋贈費、酬金,服務提供商的業(yè)務結算,業(yè)務在不同運營商之間的網(wǎng)間結算等。
(6)引入貢獻利潤率指標,按照貢獻利潤率對用戶進行排序,找出貢獻利潤率低的客戶群體,剔除該群體。貢獻利潤率是基于投入與產(chǎn)出的關系來確定的,比如,可以把產(chǎn)出/成本低于1/3的群體,定為貢獻利潤率低的群體。當然,閾值的設定,可根據(jù)實際情況、區(qū)域特征、業(yè)務性質等方面進行綜合評價。
(7)基于用戶行為,對低價值客戶實施二次聚類分析。其中,用戶行為的范圍較為廣泛,內容包括業(yè)務使用行為、繳費行為、推廣行為等。
(8)設定一系列具有風險的場景,基于場景的應用,實施用戶群體的歸類或分類。相應的場景包括使用超高酬金進行套利、倒賣營銷資源獲利等。
2.2 異常行為檢測
步驟1:數(shù)據(jù)預處理。采用大數(shù)據(jù)的kafka stream流處理技術按照時間窗口實時提取4A權限日志、服務日志等信息并進行時序處理、數(shù)據(jù)清洗,剔除白名單用戶[2]。
步驟2:特征提取。具體內容包括:(1)用戶特征刻畫。建立用戶ID編碼、用戶的城市、不同類型業(yè)務操作的量、 10分鐘窗口操作量、不同地市業(yè)務量等。(2)業(yè)務特征。建立業(yè)務ID編碼、業(yè)務描述文本編碼、業(yè)務類型分類等特征。(3)Categorical feature-Embedding。城市、服務器IP、用戶IP、DOW等都是類別特征。對這些特征的常規(guī)處理是one-hot編碼[3],會造成特征維度高且稀疏。Embedding將類別特征隨機映射為連續(xù)的高密度低維向量,可以提高模型的效率。(4)特征值轉換。由于不同操作員賬號、不同業(yè)務操作類型、不同時間段對應的業(yè)務操作數(shù)據(jù)量差異較大,在使用深度學習算法預測前需要先對特征數(shù)據(jù)進行歸一化處理,在項目預研中嘗試多種方法,其中采用均值和標準差的歸一化方式效果最佳(見表1)。
步驟3:智能分析。采取“無監(jiān)督”+“有監(jiān)督”組合模式[4],無監(jiān)督模型可有效預測未知異常,有監(jiān)督模型根據(jù)標注的數(shù)據(jù)預測相似異常。
針對千萬級的樣本數(shù)據(jù),深度學習模型的表現(xiàn)優(yōu)于機器學習算法(回歸等)。經(jīng)統(tǒng)計每天ESB服務總線產(chǎn)生約億條級別日志,采用前饋神經(jīng)網(wǎng)絡AutoEncoder算法訓練無監(jiān)督模型,針對千萬級樣本數(shù)據(jù)中少量異常樣本數(shù)據(jù),模型能夠最大完好擬合大部分正常樣本,而少量異常樣本擬合較差,因此將損失值較大的樣本作為異常數(shù)據(jù)輸出。
針對無監(jiān)督模型,嘗試選取MLP、AutoEncoder、孤立森林等多種深度學習或機器學習算法,經(jīng)測驗其中孤立森林算法結果的召回率60%,AutoEncoder結果召回率100%,無監(jiān)督模型中深度學習AutoEncoder算法效果最優(yōu)。
在有監(jiān)督模型中,選取了邏輯回歸、決策樹、支持向量機、隨機森林多種機器學習算法,經(jīng)測試隨機森林和決策樹算法較優(yōu),采用隨機森林作為有監(jiān)督算法模型。
3 結語
就生產(chǎn)企業(yè)而言,對供應商的日常管理與風險監(jiān)控,是一個長期的過程。管理的手段創(chuàng)新是企業(yè)向數(shù)字化、智能化、科學化轉型的必要經(jīng)歷。本文的研究主旨在于將管理問題技術化,采用IT化手段來實現(xiàn),用新型技術來識別管理風險。后期,將主要從兩個方面開展工作。一方面,對現(xiàn)有的識別方案進行優(yōu)化與完善,讓當前方案具有更大的應用場景和適用范圍,力爭將現(xiàn)有的方案固化為相應的模型或系統(tǒng)。另一方面,選取一定的企業(yè)進行試點應用,用現(xiàn)實案例來檢查方案的質量,讓更多的企業(yè)從中受益,實現(xiàn)方案的價值最大化。
作者簡介:韋媚(1986—),女,廣西南寧人,工程師,學士;研究方向:IT應用,項目管理,大數(shù)據(jù)應用,風險稽核等。
[參考文獻]
[1]張小明.風險防控思維下的應急治理研究[J].中國應急管理,2021(3):48-51.
[2]朱有祥,張彤.推行“精準化”風險管控模式—山東省青島市李滄區(qū)指導小微企業(yè)建立雙重預防機制記事[J].中國應急管理,2021(3):88-89.
[3]趙研.基于自適應巡視算法的工業(yè)物聯(lián)網(wǎng)異常行為檢測[J].移動通信,2021(3):100-103.
[4]周啟清,陳香蹀.供應鏈金融反保理業(yè)務風險評價與管控[J].金融經(jīng)濟,2021(3):67-73.
(編輯?姚 鑫)
Research on the abnormal behavior identification of agent risk management
and control under the background of Internet
Wei Mei, Qin Yanmei, Wei Zhiyu
(China Mobile Communication Group Guangxi Co., Ltd., Nanning 450000, China)
Abstract:In the era of 5G + B (Beidou) + AICDE (Artificial Intelligence, the Internet of Things, Cloud Computing, Big Data, Edge Computing), the management work of the enterprises to the agents and suppliers is very important and it is related to a series of risk prevention and control. How to effectively identify the abnormal behavior of agents has always been the focus of agent risk management and control. Therefore, this paper conducts research on the abnormal behavior identification of agent risk management and control, attaches great importance to risk management and control, makes management problems technical, provides scheme guidance for technical personnel, provides mode; support for management personnel and provides decision support for leaders.
Key words:agent; risk control; abnormal behavior; behavior recognition; risk management