嚴(yán)宇平,吳廣財,江疆
(廣東電網(wǎng)有限責(zé)任公司信息中心廣東廣州510620)
單變量回歸確定移動平均權(quán)重算法在話務(wù)量預(yù)測中的應(yīng)用研究
嚴(yán)宇平,吳廣財,江疆
(廣東電網(wǎng)有限責(zé)任公司信息中心廣東廣州510620)
話務(wù)量是客服中心運(yùn)營管理的重要方面,呼叫中心的高效率運(yùn)作是電網(wǎng)系統(tǒng)客戶滿意度以及大規(guī)模停電預(yù)警及突發(fā)狀況處理的重要保證,而坐席人員排班又是呼叫中心運(yùn)作的重要問題??茖W(xué)合理的坐席安排能更好地提高呼叫中心的運(yùn)作效率,不僅降低了呼叫中心的運(yùn)營成本,從而提升電力呼叫中心的服務(wù)水平。本文提出在移動平均法中引入加權(quán),利用預(yù)測期與歷史各期的單變量回歸,將系數(shù)作歸一化處理作為權(quán)重,進(jìn)行話務(wù)量的預(yù)測。文章以真實(shí)場景中的實(shí)驗(yàn)結(jié)果證明了本文所提方法的有效性。
話務(wù)量預(yù)測;單變量回歸;加權(quán)移動平均;權(quán)重計(jì)算法
客服中心作為客戶與企業(yè)直接聯(lián)系的樞紐,其利用通信手段和計(jì)算機(jī)技術(shù),為客戶得到企業(yè)更完善服務(wù),為企業(yè)獲得更廣泛的客戶接觸,宣傳企業(yè)形象提供了高效直接的服務(wù)手段。為了客服中心以最有效地運(yùn)營成本提供最優(yōu)質(zhì)的服務(wù)水平,高效、科學(xué)地控制座席排班作為常見的客服中心運(yùn)營管理手段,已經(jīng)成為客服中心行業(yè)的一個共識。而座席排班管理是基于話務(wù)量預(yù)測的。合理準(zhǔn)確的話務(wù)量預(yù)測不僅為排班管理提供量化基礎(chǔ),還能及時了解業(yè)務(wù)發(fā)展趨勢,降低因呼損帶來的企業(yè)形象的損失。
因此,根據(jù)話務(wù)量歷史及相關(guān)業(yè)務(wù)場景對客服中心話務(wù)量的變化趨勢進(jìn)行預(yù)測,對企業(yè)運(yùn)營管理來說顯得尤為重要。
預(yù)測方法一般可分為定性預(yù)測與定量預(yù)測。定性預(yù)測是利用經(jīng)驗(yàn)、直覺做出的猜測,帶有較大的主觀性。定量預(yù)測是指運(yùn)用統(tǒng)計(jì)方法建立統(tǒng)計(jì)模型,對歷史統(tǒng)計(jì)數(shù)據(jù)進(jìn)行分析,從而對未來做出預(yù)測。過往對話務(wù)量的研究主要采取神經(jīng)網(wǎng)絡(luò)時間序列[1-3],本次研究提出在加權(quán)移動平均預(yù)測法中,引入一種以單變量回歸計(jì)算權(quán)重的方法,以此作為加權(quán)的權(quán)重。
在客服中心管理體系中,一般采用時間序列或占比測算等方法預(yù)測話務(wù)量,兩者的首要考慮因素是用戶量及其發(fā)展趨勢。
占比測算方法的基本原理是預(yù)測年末用戶數(shù),以當(dāng)前用戶發(fā)展趨勢逆向推測各月的用戶數(shù),結(jié)合歷史用戶撥打率作為參考,據(jù)此估算各月話務(wù)總量。而預(yù)測“天”-“時段”等不同時間粒度時,則是以歷史各天、各時段占全月話務(wù)總量的比例,并結(jié)合用戶撥打率的變化趨勢加以微調(diào),最終得出不同時間粒度下的話務(wù)量預(yù)測。
時間序列方法,一般僅考慮往前N期的話務(wù)量,并結(jié)合歷史同期等因素作為建立話務(wù)量預(yù)測模型的基礎(chǔ)。時間序列預(yù)測模型是預(yù)測話務(wù)量常用的方法,主要有時間序列回歸預(yù)測法、移動平均預(yù)測法等。回歸預(yù)測是將話務(wù)量的歷史數(shù)據(jù)看作時間序列,利用數(shù)理統(tǒng)計(jì)方法進(jìn)行回歸處理,擬合統(tǒng)計(jì)模型,預(yù)測未來發(fā)展趨勢;移動平均預(yù)測是利用加權(quán)平均數(shù)對話務(wù)量的時間序列進(jìn)行平滑修勻,增強(qiáng)近期作用,并適當(dāng)考慮遠(yuǎn)期影響。
基本思路:以歷史前7期的話務(wù)量作為移動平均預(yù)測法的輸入,利用預(yù)測期與歷史各期的單變量回歸模型,輸出其回歸系數(shù),最終將7期的回歸系數(shù)歸一化作為加權(quán)移動平均預(yù)測法的權(quán)重,加以考慮實(shí)際話務(wù)量變化中周末與工作日的周期性,最終作為話務(wù)量預(yù)測值。
2.1歷史前7期的選擇
歷史話務(wù)中明顯地表現(xiàn)出按星期為周期的話務(wù)量變化(見圖1):周六、日兩天的話務(wù)量明顯比一般工作日(周一~周五)的低,從中位數(shù)看僅約一半。
圖1 一周各天的話務(wù)量變化趨勢圖Fig.1Each day of a week traffic trend chart
因此在考慮歷史前7期的選擇時,有意識地將前7期按照星期值從小到大排序(周日~周六分別用1~7表示)。得到的前7期對應(yīng)星期值的權(quán)重,最終作為加權(quán)移動平均預(yù)測的權(quán)重,公式為:
其中:xi表示對應(yīng)星期值的話務(wù)量,i=1,2,…,7,分別表示周日~周六;ωi表示對應(yīng)星期值的權(quán)重,i=1,2,…,7,分別表示周日~周六。
2.2單變量回歸方法計(jì)算初始權(quán)重
確定加權(quán)移動平均的輸入變量后,利用歷史話務(wù)量數(shù)據(jù)及單變量回歸方法計(jì)算回歸系數(shù)。
單變量回歸公式為:
其中:xi表示對應(yīng)星期值的話務(wù)量,i=1,2,…,7,分別表示周日~周六;表示對應(yīng)星期值歸一化后的權(quán)重,i=1,2,…,7,分別表示周日~周六。
利用普通最小二乘估計(jì)(Ordinary Least Square Estimation,OLSE),得到的參數(shù)估計(jì):
2.3初始權(quán)重歸一化并計(jì)算話務(wù)量預(yù)測值
為使初始的回歸系數(shù)作為權(quán)重輸入加權(quán)移動平均方法,需要對權(quán)重進(jìn)行歸一化處理。
歸一化公式:
其中:ωi表示最終的權(quán)重值計(jì)算得到權(quán)重后,應(yīng)用公式(1)計(jì)算話務(wù)量預(yù)測值。
2.4周期調(diào)整
由于話務(wù)量存在明顯的星期性周期,因此在周末、工作日分別乘以調(diào)整因子,得到最終的話務(wù)量預(yù)測。
其中:mweekdauy表示歷史所有工作日的話務(wù)量中位數(shù);
mweekend表示歷史所有周末的話務(wù)量中位數(shù);
mall表示歷史所有話務(wù)量記錄的中位數(shù)。
以某電力企業(yè)的歷史話務(wù)量數(shù)據(jù)對上述方法進(jìn)行模型建設(shè),并以后續(xù)一個月的話務(wù)量進(jìn)行驗(yàn)證。其實(shí)驗(yàn)步驟如下:
1)選取2013年1~10月份,共10個月的每日話務(wù)量數(shù)據(jù)作為建模樣本數(shù)據(jù),選取2013年11月的數(shù)據(jù)作為驗(yàn)證數(shù)據(jù);
2)經(jīng)數(shù)據(jù)處理,形成以每日話務(wù)量數(shù)據(jù)為因變量,往前7天的數(shù)據(jù)作為自變量的數(shù)據(jù)寬表;去除1月1日-1月7日的數(shù)據(jù)(不足“前7天”數(shù)據(jù));
3)應(yīng)用單變量回歸模型,獲取回歸系數(shù);重復(fù)多次,獲取多次回歸系數(shù),取多次平均值作為輸出;
4)應(yīng)用歸一化算法,計(jì)算前7天的權(quán)重;
5)計(jì)算所有數(shù)據(jù)的中位數(shù)、周末的中位數(shù)、工作日的中位數(shù),計(jì)算星期調(diào)整因子;
6)應(yīng)用預(yù)測算法,計(jì)算2013年11月的話務(wù)量預(yù)測值。
結(jié)果如圖2、3所示。
圖2 2013年11月的話務(wù)量趨勢圖Fig.2In November 2013 traffic trend chart
圖3 2013年11月話務(wù)量預(yù)測誤差百分比示意圖誤差平均值:-3.5%Fig.3In November 2013,traffic prediction error percentage schematic diagram Error:the average-3.5%
從結(jié)果來看,算法較好地擬合了星期周期的規(guī)律。然而在部分日期出現(xiàn)突降或突增時候,算法不能及時預(yù)測到變化,存在一定的局限性。
經(jīng)研究分析認(rèn)為,這是由于種種不可預(yù)見的原因,包括但不限于政策變化導(dǎo)致的話務(wù)量激增、突發(fā)天氣事件導(dǎo)致的故障停電等造成的數(shù)據(jù)急劇波動,這類數(shù)據(jù)對于模型的預(yù)測精度造成較大影響。在模型驗(yàn)證過程中,對數(shù)據(jù)的處理包括:
1)平滑因政策原因?qū)е碌脑拕?wù)量激增,使其在政策開始2)剔除因突發(fā)天氣事件等引起的故障停電事件的話務(wù)記錄。
實(shí)施階段造成的話務(wù)量激增平滑到實(shí)施一段時間后較穩(wěn)定的趨勢;
本次研究提出單變量回歸權(quán)重計(jì)算法,并利用歸一化的思想計(jì)算出加權(quán)移動平均預(yù)測法的權(quán)重,較好地處理了話務(wù)量在不同時間段(工作日與周末)的變化關(guān)系,計(jì)算速度快,易于理解。但研究中發(fā)現(xiàn),算法尚未考慮用戶行為習(xí)慣的變化、停電事件的發(fā)生、天氣和突發(fā)天氣事件、未辦結(jié)業(yè)務(wù)等對話務(wù)量造成的影響,導(dǎo)致算法對于話務(wù)量發(fā)生劇烈波動時的靈敏度不足。后續(xù)的工作與研究中,將采用回歸預(yù)測、模糊預(yù)測、神經(jīng)網(wǎng)絡(luò)預(yù)測等算法研究突變事件等對話務(wù)量的影響。
[1]杜守國,姜鋒.大型電話咨詢中心來電量預(yù)測模型和分析[J].計(jì)算機(jī)應(yīng)用與軟件,2012(9):126-128.
[2]鄧波,李健,孫濤,等.基于神經(jīng)網(wǎng)絡(luò)的話務(wù)量預(yù)測[J].成都信息工程學(xué)院學(xué)報,2008(9):518-521.
[3]董云耀,楊望書.基于時間序列趨勢模型的研究與應(yīng)用[J].杭州電子科技大學(xué)學(xué)報,2008(1):64-68.
[4]劉童,孫吉貴,張永剛,等.用周期模型和近鄰算法預(yù)測話務(wù)量時間序列[J].吉林大學(xué)學(xué)報:信息科技版,2007(3):239-245.
[5]楊帆,王志堅(jiān),婁淵勝.時間序列趨勢分析方法的一種改進(jìn)[J].計(jì)算機(jī)技術(shù)與發(fā)展,2006(5):82-84.
[6]彭宇,雷苗,郭嘉,等.基于先驗(yàn)知識的移動通信話務(wù)量預(yù)測[J].電子學(xué)報,2011(1):190-194.
The research of the application in teletraffic prediction using weighted moving average method based on univariate regression
YAN Yu-ping,WU Guang-cai,JIANG Jiang
(Guangdong Power Grid Limited Liability Company,Guangzhou 510620,China)
Teletraffic is an important part in operation management of the call center.Forecasting of the teletraffic is an effective way to improve service levels of the call center.In this paper,we propose to use weighted moving average for teletraffic forecasting.The coefficients are calculated by univariate regression on data from predictive and historical period,and then these coefficients are normalized for teletracffic forecasting as weights of weighted moving average method.Experiments on real world data show the effectiveness of our method.
teletraffic forecasting;univariate regression;weighted moving average;weighting method
TN99
A
1674-6236(2015)22-0044-03
2015-01-16稿件編號:201501125
嚴(yán)宇平(1985—),男,廣東韶關(guān)人,碩士,工程師。研究方向:電力信息系統(tǒng)建設(shè)與管理、電力數(shù)據(jù)分析及應(yīng)用。