嚴宇平,吳廣財,江疆
(廣東電網(wǎng)有限責任公司信息中心廣東廣州510620)
單變量回歸確定移動平均權重算法在話務量預測中的應用研究
嚴宇平,吳廣財,江疆
(廣東電網(wǎng)有限責任公司信息中心廣東廣州510620)
話務量是客服中心運營管理的重要方面,呼叫中心的高效率運作是電網(wǎng)系統(tǒng)客戶滿意度以及大規(guī)模停電預警及突發(fā)狀況處理的重要保證,而坐席人員排班又是呼叫中心運作的重要問題??茖W合理的坐席安排能更好地提高呼叫中心的運作效率,不僅降低了呼叫中心的運營成本,從而提升電力呼叫中心的服務水平。本文提出在移動平均法中引入加權,利用預測期與歷史各期的單變量回歸,將系數(shù)作歸一化處理作為權重,進行話務量的預測。文章以真實場景中的實驗結果證明了本文所提方法的有效性。
話務量預測;單變量回歸;加權移動平均;權重計算法
客服中心作為客戶與企業(yè)直接聯(lián)系的樞紐,其利用通信手段和計算機技術,為客戶得到企業(yè)更完善服務,為企業(yè)獲得更廣泛的客戶接觸,宣傳企業(yè)形象提供了高效直接的服務手段。為了客服中心以最有效地運營成本提供最優(yōu)質的服務水平,高效、科學地控制座席排班作為常見的客服中心運營管理手段,已經成為客服中心行業(yè)的一個共識。而座席排班管理是基于話務量預測的。合理準確的話務量預測不僅為排班管理提供量化基礎,還能及時了解業(yè)務發(fā)展趨勢,降低因呼損帶來的企業(yè)形象的損失。
因此,根據(jù)話務量歷史及相關業(yè)務場景對客服中心話務量的變化趨勢進行預測,對企業(yè)運營管理來說顯得尤為重要。
預測方法一般可分為定性預測與定量預測。定性預測是利用經驗、直覺做出的猜測,帶有較大的主觀性。定量預測是指運用統(tǒng)計方法建立統(tǒng)計模型,對歷史統(tǒng)計數(shù)據(jù)進行分析,從而對未來做出預測。過往對話務量的研究主要采取神經網(wǎng)絡時間序列[1-3],本次研究提出在加權移動平均預測法中,引入一種以單變量回歸計算權重的方法,以此作為加權的權重。
在客服中心管理體系中,一般采用時間序列或占比測算等方法預測話務量,兩者的首要考慮因素是用戶量及其發(fā)展趨勢。
占比測算方法的基本原理是預測年末用戶數(shù),以當前用戶發(fā)展趨勢逆向推測各月的用戶數(shù),結合歷史用戶撥打率作為參考,據(jù)此估算各月話務總量。而預測“天”-“時段”等不同時間粒度時,則是以歷史各天、各時段占全月話務總量的比例,并結合用戶撥打率的變化趨勢加以微調,最終得出不同時間粒度下的話務量預測。
時間序列方法,一般僅考慮往前N期的話務量,并結合歷史同期等因素作為建立話務量預測模型的基礎。時間序列預測模型是預測話務量常用的方法,主要有時間序列回歸預測法、移動平均預測法等。回歸預測是將話務量的歷史數(shù)據(jù)看作時間序列,利用數(shù)理統(tǒng)計方法進行回歸處理,擬合統(tǒng)計模型,預測未來發(fā)展趨勢;移動平均預測是利用加權平均數(shù)對話務量的時間序列進行平滑修勻,增強近期作用,并適當考慮遠期影響。
基本思路:以歷史前7期的話務量作為移動平均預測法的輸入,利用預測期與歷史各期的單變量回歸模型,輸出其回歸系數(shù),最終將7期的回歸系數(shù)歸一化作為加權移動平均預測法的權重,加以考慮實際話務量變化中周末與工作日的周期性,最終作為話務量預測值。
2.1歷史前7期的選擇
歷史話務中明顯地表現(xiàn)出按星期為周期的話務量變化(見圖1):周六、日兩天的話務量明顯比一般工作日(周一~周五)的低,從中位數(shù)看僅約一半。
圖1 一周各天的話務量變化趨勢圖Fig.1Each day of a week traffic trend chart
因此在考慮歷史前7期的選擇時,有意識地將前7期按照星期值從小到大排序(周日~周六分別用1~7表示)。得到的前7期對應星期值的權重,最終作為加權移動平均預測的權重,公式為:
其中:xi表示對應星期值的話務量,i=1,2,…,7,分別表示周日~周六;ωi表示對應星期值的權重,i=1,2,…,7,分別表示周日~周六。
2.2單變量回歸方法計算初始權重
確定加權移動平均的輸入變量后,利用歷史話務量數(shù)據(jù)及單變量回歸方法計算回歸系數(shù)。
單變量回歸公式為:
其中:xi表示對應星期值的話務量,i=1,2,…,7,分別表示周日~周六;表示對應星期值歸一化后的權重,i=1,2,…,7,分別表示周日~周六。
利用普通最小二乘估計(Ordinary Least Square Estimation,OLSE),得到的參數(shù)估計:
2.3初始權重歸一化并計算話務量預測值
為使初始的回歸系數(shù)作為權重輸入加權移動平均方法,需要對權重進行歸一化處理。
歸一化公式:
其中:ωi表示最終的權重值計算得到權重后,應用公式(1)計算話務量預測值。
2.4周期調整
由于話務量存在明顯的星期性周期,因此在周末、工作日分別乘以調整因子,得到最終的話務量預測。
其中:mweekdauy表示歷史所有工作日的話務量中位數(shù);
mweekend表示歷史所有周末的話務量中位數(shù);
mall表示歷史所有話務量記錄的中位數(shù)。
以某電力企業(yè)的歷史話務量數(shù)據(jù)對上述方法進行模型建設,并以后續(xù)一個月的話務量進行驗證。其實驗步驟如下:
1)選取2013年1~10月份,共10個月的每日話務量數(shù)據(jù)作為建模樣本數(shù)據(jù),選取2013年11月的數(shù)據(jù)作為驗證數(shù)據(jù);
2)經數(shù)據(jù)處理,形成以每日話務量數(shù)據(jù)為因變量,往前7天的數(shù)據(jù)作為自變量的數(shù)據(jù)寬表;去除1月1日-1月7日的數(shù)據(jù)(不足“前7天”數(shù)據(jù));
3)應用單變量回歸模型,獲取回歸系數(shù);重復多次,獲取多次回歸系數(shù),取多次平均值作為輸出;
4)應用歸一化算法,計算前7天的權重;
5)計算所有數(shù)據(jù)的中位數(shù)、周末的中位數(shù)、工作日的中位數(shù),計算星期調整因子;
6)應用預測算法,計算2013年11月的話務量預測值。
結果如圖2、3所示。
圖2 2013年11月的話務量趨勢圖Fig.2In November 2013 traffic trend chart
圖3 2013年11月話務量預測誤差百分比示意圖誤差平均值:-3.5%Fig.3In November 2013,traffic prediction error percentage schematic diagram Error:the average-3.5%
從結果來看,算法較好地擬合了星期周期的規(guī)律。然而在部分日期出現(xiàn)突降或突增時候,算法不能及時預測到變化,存在一定的局限性。
經研究分析認為,這是由于種種不可預見的原因,包括但不限于政策變化導致的話務量激增、突發(fā)天氣事件導致的故障停電等造成的數(shù)據(jù)急劇波動,這類數(shù)據(jù)對于模型的預測精度造成較大影響。在模型驗證過程中,對數(shù)據(jù)的處理包括:
1)平滑因政策原因導致的話務量激增,使其在政策開始2)剔除因突發(fā)天氣事件等引起的故障停電事件的話務記錄。
實施階段造成的話務量激增平滑到實施一段時間后較穩(wěn)定的趨勢;
本次研究提出單變量回歸權重計算法,并利用歸一化的思想計算出加權移動平均預測法的權重,較好地處理了話務量在不同時間段(工作日與周末)的變化關系,計算速度快,易于理解。但研究中發(fā)現(xiàn),算法尚未考慮用戶行為習慣的變化、停電事件的發(fā)生、天氣和突發(fā)天氣事件、未辦結業(yè)務等對話務量造成的影響,導致算法對于話務量發(fā)生劇烈波動時的靈敏度不足。后續(xù)的工作與研究中,將采用回歸預測、模糊預測、神經網(wǎng)絡預測等算法研究突變事件等對話務量的影響。
[1]杜守國,姜鋒.大型電話咨詢中心來電量預測模型和分析[J].計算機應用與軟件,2012(9):126-128.
[2]鄧波,李健,孫濤,等.基于神經網(wǎng)絡的話務量預測[J].成都信息工程學院學報,2008(9):518-521.
[3]董云耀,楊望書.基于時間序列趨勢模型的研究與應用[J].杭州電子科技大學學報,2008(1):64-68.
[4]劉童,孫吉貴,張永剛,等.用周期模型和近鄰算法預測話務量時間序列[J].吉林大學學報:信息科技版,2007(3):239-245.
[5]楊帆,王志堅,婁淵勝.時間序列趨勢分析方法的一種改進[J].計算機技術與發(fā)展,2006(5):82-84.
[6]彭宇,雷苗,郭嘉,等.基于先驗知識的移動通信話務量預測[J].電子學報,2011(1):190-194.
The research of the application in teletraffic prediction using weighted moving average method based on univariate regression
YAN Yu-ping,WU Guang-cai,JIANG Jiang
(Guangdong Power Grid Limited Liability Company,Guangzhou 510620,China)
Teletraffic is an important part in operation management of the call center.Forecasting of the teletraffic is an effective way to improve service levels of the call center.In this paper,we propose to use weighted moving average for teletraffic forecasting.The coefficients are calculated by univariate regression on data from predictive and historical period,and then these coefficients are normalized for teletracffic forecasting as weights of weighted moving average method.Experiments on real world data show the effectiveness of our method.
teletraffic forecasting;univariate regression;weighted moving average;weighting method
TN99
A
1674-6236(2015)22-0044-03
2015-01-16稿件編號:201501125
嚴宇平(1985—),男,廣東韶關人,碩士,工程師。研究方向:電力信息系統(tǒng)建設與管理、電力數(shù)據(jù)分析及應用。