吳越 張林翔 陳玉蘭 蔣偉
摘要:針對ATM交易系統(tǒng)產(chǎn)生的交易數(shù)據(jù),對交易時(shí)刻、交易量、交易成功率和響應(yīng)時(shí)間進(jìn)行person相關(guān)性分析,提取ATM應(yīng)用系統(tǒng)的交易狀態(tài)特征參數(shù)。對時(shí)刻-交易量進(jìn)行方差分析并利用3σ準(zhǔn)則提取異常點(diǎn),對成功率-響應(yīng)時(shí)間引入K-means聚類對異常點(diǎn)進(jìn)行分級。由此找出交易量、交易成功率和響應(yīng)時(shí)間的異常值,進(jìn)而建立ATM 異常檢測系統(tǒng)。
關(guān)鍵詞:相關(guān)性分析;方差分析;K-means聚類
引言
ATM提供提款、存款、轉(zhuǎn)賬等銀行柜臺服務(wù),提升了銀行的工作效率,給群眾帶來了很大的便利。但隨著商業(yè)銀行 ATM 業(yè)務(wù)的快速發(fā)展,銀行承擔(dān)的確保 ATM 交易系統(tǒng)穩(wěn)定運(yùn)行的壓力越來越大,ATM的維護(hù)管理和數(shù)據(jù)安全顯得十分重要,交易系統(tǒng)的性能管理成為一大關(guān)鍵問題。
因此,ATM交易狀態(tài)的故障發(fā)現(xiàn)與異常數(shù)據(jù)檢測成為我們的研究問題。本文的主要研究內(nèi)容是根據(jù)匯總信息包含的四個指標(biāo)(交易時(shí)刻,交易量,交易成功率,交易響應(yīng)時(shí)間),選擇、提取、分析ATM 交易狀態(tài)的特征參數(shù),并設(shè)計(jì)一套交易狀態(tài)異常檢測方案,以實(shí)現(xiàn)故障場景的正確判斷與及時(shí)報(bào)警。
1 數(shù)據(jù)來源與處理
1.1 數(shù)據(jù)來源
本文數(shù)據(jù)采用 2017 年“深圳杯”數(shù)學(xué)建模挑戰(zhàn)賽提供的從1月23日至4月23日某商業(yè)銀行 ATM 應(yīng)用系統(tǒng)某分行的交易統(tǒng)計(jì)數(shù)據(jù)。
1.2 數(shù)據(jù)預(yù)處理
首先對每分鐘對各分行的交易信息進(jìn)行匯總統(tǒng)計(jì),包括交易時(shí)刻,交易量、交易成功率、交易響應(yīng)時(shí)間 4個指標(biāo)。其次對所給數(shù)據(jù)進(jìn)行了缺失填補(bǔ),并去除不符合實(shí)際的數(shù)據(jù)。
(1)數(shù)據(jù)分段處理
首先根據(jù)數(shù)據(jù)做出累計(jì)交易量與日期之間的關(guān)系,發(fā)現(xiàn)1月23日至1月27日,由于春節(jié)前夕導(dǎo)致ATM交易量明顯增長。1月28至2月5日,由于處在春節(jié)期間,銀行的日均累計(jì)交易量明顯低于平時(shí)。而其余時(shí)間段的累計(jì)日交易量波動范圍較小、較平穩(wěn),具有研究價(jià)值。因此本文主要對2月5日后的數(shù)據(jù)進(jìn)行交易狀態(tài)特征分析。
(2)工作日與非工作日比較
根據(jù)數(shù)據(jù)分別繪制非工作日與工作日的時(shí)刻-交易量的關(guān)系,觀察發(fā)現(xiàn)交易量與時(shí)刻的圖像呈“雙峰型”分布。交易量在0-420 min處于較低水平,420-1260處于較高水平。根據(jù)實(shí)際情況分析,即在0:00-7:00時(shí)刻,由于夜間人流量少,故導(dǎo)致交易量較低。而在7:00-21:00時(shí),該時(shí)間段為工作階段,人們活動量大,故交易量持續(xù)穩(wěn)定的處于較高水平。
分析比較工作日與非工作日,發(fā)現(xiàn)工作日與非工作日的每一時(shí)刻交易量相差小,僅在某個高峰段的存在微小差異。從整體上看,工作日和非工作日的單日交易量不存在明顯差別,因此本文不對工作日與非工作日的數(shù)據(jù)進(jìn)行區(qū)分。
2 交易狀態(tài)相關(guān)指標(biāo)分析
對日期、時(shí)刻、交易量、成功率和響應(yīng)時(shí)間進(jìn)行Pearson相關(guān)性分析,進(jìn)行初步的數(shù)據(jù)相關(guān)性觀察,為下一步提取特征參數(shù)做準(zhǔn)備。利用SPSS,得出4個變量間的相關(guān)性:
1)交易量與時(shí)刻存在正相關(guān);
2)成功率與響應(yīng)時(shí)間存在負(fù)相關(guān)。即數(shù)據(jù)中心后端系統(tǒng)處理異常,導(dǎo)致交易失敗則響應(yīng)時(shí)間加長。
3 交易狀態(tài)異常檢測方案
3.1交易量的聚類分析
由于春節(jié)后每天各時(shí)刻的交易量與平均值有較大的差異,求出每天的交易量平均值與各時(shí)刻的關(guān)系,觀察表明春節(jié)后每天各時(shí)刻的交易量與均值的差異近似服從正態(tài)分布,因此我們利用方差分析法,將差值較大的交易量定義為異常值。并引入 準(zhǔn)則,將 作為其置信區(qū)間,從而判斷并提取異常點(diǎn),通過以 為置信區(qū)間,將每天交易量與均值的差值在 之外的值標(biāo)記為異常點(diǎn),
即可對交易是否出現(xiàn)異常進(jìn)行檢測。根據(jù)某一時(shí)刻算出理交易量,此時(shí)對應(yīng)時(shí)刻的實(shí)際交易量若在置信區(qū)間內(nèi),則交易正常。否則,交易異常。
3.2基于K-means聚類分析的成功率和響應(yīng)時(shí)間異常檢測
根據(jù)匯總成功率-響應(yīng)時(shí)間的數(shù)據(jù),通過SPSS,對三月份的成功率-響應(yīng)時(shí)間的數(shù)據(jù)進(jìn)行K-means聚類處理,可得三類聚類中心,如圖1
根據(jù)聚類結(jié)果,三類聚類中心分別為(0.83,142.95)(0.95,12288.29)(0.41,79947.34)。我們將這三類異常程度定義為 “穩(wěn)定”“臨界異常”“異?!?個程度。分析最終的聚類結(jié)果,則可判斷出第一類紅色區(qū)域的點(diǎn)為代表交易處于臨界異常,第二類綠色區(qū)域表示交易異常狀態(tài),成功率低且響應(yīng)時(shí)間長。第三類藍(lán)色區(qū)域成功率較高且響應(yīng)時(shí)間低,為正常點(diǎn)集中區(qū)域。
4 結(jié)論
本文首先對 ATM應(yīng)用系統(tǒng)的交易狀態(tài)特征參數(shù)進(jìn)行提取,探討ATM交易各指標(biāo)之間的關(guān)聯(lián)性。進(jìn)而建立了ATM交易狀態(tài)異常檢測模型。基于方差分析法以及 準(zhǔn)則,能夠有效的找出交易量異常點(diǎn)。利用k-means 聚類分析可區(qū)分出數(shù)據(jù)交易成功率和響應(yīng)時(shí)間異常點(diǎn)并對異常程度進(jìn)行分級。本文設(shè)計(jì)的一套交易狀態(tài)異常監(jiān)測方案,能盡可能實(shí)現(xiàn)對ATM交易系統(tǒng)異常的及時(shí)報(bào)警,減少虛警誤報(bào),使ATM 交易系統(tǒng)的性能管理問題有了一定的突破。從而提高銀行自動系統(tǒng)的工作效率,保障系統(tǒng)的暢通,便利ATM的使用者,使得ATM的服務(wù)便利性發(fā)揮到最大。
參考文獻(xiàn)
[1]孫博,康銳,張叔農(nóng).基于特征參數(shù)趨勢進(jìn)化的故障診斷和預(yù)測方法[J].航空動力學(xué)報(bào),2008(02):393-398.
[2]楊志浩.聚類分析算法研究改進(jìn)及其在ATM選址中的應(yīng)用[D].鞍山:遼寧科技大學(xué),2014.
[3]丁智國.流數(shù)據(jù)在線異常檢測方法研究[D].上海大學(xué) ,2015
[4]李一,蔡禮淵.ATM交易狀態(tài)特征分析與異常檢驗(yàn)[J].成都工業(yè)學(xué)院學(xué)報(bào),2018.21(1).
作者簡介:吳越(1998-),福建人,本科生;
蔣偉(1982-),重慶人,副教授,研究方向:數(shù)學(xué)建模與圖像處理。