摘 要:隨著業(yè)務(wù)增多,信用卡呼叫中心的IVR菜單結(jié)構(gòu)正在變得越來(lái)越復(fù)雜,給用戶(hù)訪(fǎng)問(wèn)帶來(lái)不便。與以往需要改變IVR菜單結(jié)構(gòu)的優(yōu)化方法不同,本文提出一種結(jié)合用戶(hù)訪(fǎng)問(wèn)特征的IVR優(yōu)化方法。通過(guò)從用戶(hù)訪(fǎng)問(wèn)偏好、信用卡中心IVR業(yè)務(wù)使用影響因素、企業(yè)推送信息三個(gè)方面抽取用戶(hù)訪(fǎng)問(wèn)特征,使用隨機(jī)森林建立分類(lèi)器得到預(yù)測(cè)結(jié)果,并按預(yù)測(cè)概率取TOP N進(jìn)行推薦。通過(guò)實(shí)驗(yàn),該方法可以使用戶(hù)在信用卡中心IVR系統(tǒng)內(nèi)停留時(shí)間有顯著縮短,并且效果穩(wěn)定。
關(guān)鍵詞:信用卡呼叫中心 IVR優(yōu)化 用戶(hù)訪(fǎng)問(wèn)特征 隨機(jī)森林
一、引言
呼叫中心(Call Center)扮演了企業(yè)與用戶(hù)的交流平臺(tái),實(shí)現(xiàn)了24 h隨時(shí)提供服務(wù)的可能。交互式語(yǔ)音平臺(tái)IVR(Interactive Voice Response)是呼叫中心中重要的組成部分。在國(guó)內(nèi)建成的呼叫中心中,以電信,金融行業(yè)所占比重最大,超過(guò)市場(chǎng)規(guī)模的30%。目前國(guó)內(nèi)各大銀行的信用卡中心面對(duì)不同用戶(hù),均采用統(tǒng)一的IVR熱線(xiàn)語(yǔ)音流程。這種模式的優(yōu)點(diǎn)在于標(biāo)準(zhǔn)化:無(wú)論各類(lèi)用戶(hù),無(wú)論用戶(hù)身處何地,聽(tīng)到語(yǔ)音均為一致,有利于用戶(hù)感知。缺點(diǎn)在于隨著業(yè)務(wù)逐漸復(fù)雜化,菜單變得過(guò)度繁雜,結(jié)構(gòu)層次過(guò)多,用戶(hù)操作繁瑣,最終不得不選擇人工服務(wù)或者索性?huà)鞌嚯娫?huà),違背了IVR提高呼叫中心效率的初衷。在各家信用卡中心同質(zhì)化競(jìng)爭(zhēng)嚴(yán)重的今天,通過(guò)優(yōu)化用戶(hù)的IVR體驗(yàn),對(duì)客戶(hù)維護(hù)工作具有重要意義。隨著研究深入,學(xué)者們發(fā)現(xiàn)設(shè)計(jì)個(gè)性化,扁平化的IVR流程,是IVR優(yōu)化的關(guān)鍵?,F(xiàn)有的IVR個(gè)性化可以分為兩大類(lèi),一類(lèi)是用戶(hù)主動(dòng)設(shè)置自己喜歡的IVR菜單,然而現(xiàn)實(shí)情況下用戶(hù)使用率不高。另一類(lèi)是使用IVR中用戶(hù)的使用記錄來(lái)設(shè)計(jì)個(gè)性化菜單,該類(lèi)方法雖然應(yīng)用范圍廣泛,同時(shí)也存在破壞原有IVR菜單的排列結(jié)構(gòu)和業(yè)務(wù)邏輯,造成熟練用戶(hù)使用體驗(yàn)的下降的缺點(diǎn)。隨著互聯(lián)網(wǎng)迅速的發(fā)展,推薦技術(shù)已經(jīng)成為解決信息過(guò)載問(wèn)題的重要工具。它通過(guò)用戶(hù)行為特征對(duì)用戶(hù)興趣傾向和使用行為進(jìn)行建模,使用機(jī)器學(xué)習(xí)方法來(lái)挖掘推薦信息,進(jìn)而提供個(gè)性化服務(wù)。IVR現(xiàn)存的問(wèn)題,本質(zhì)上是由于語(yǔ)音交互方式的限制而造成的信息過(guò)載問(wèn)題,因此同樣適用于推薦技術(shù)?;诖?,本文設(shè)計(jì)了一種通過(guò)用戶(hù)訪(fǎng)問(wèn)特征來(lái)優(yōu)化信用卡中心IVR的方法。首先篩選業(yè)務(wù)節(jié)點(diǎn)作為預(yù)測(cè)目標(biāo),在分析信用卡用戶(hù)IVR使用行為的基礎(chǔ)上,挖掘用戶(hù)訪(fǎng)問(wèn)IVR功能節(jié)點(diǎn)的特征,利用特征預(yù)測(cè)用戶(hù)訪(fǎng)問(wèn)的IVR節(jié)點(diǎn),然后在傳統(tǒng)IVR菜單播報(bào)之前進(jìn)行播報(bào)。
二、相關(guān)研究
1. IVR優(yōu)化的相關(guān)研究。為了加快用戶(hù)尋找目標(biāo)節(jié)點(diǎn)的效率,進(jìn)而降低用戶(hù)在IVR的停留時(shí)間,國(guó)內(nèi)外學(xué)者開(kāi)展了廣泛的研究和討論,提出了各種優(yōu)化方法,其中包括:定義節(jié)點(diǎn)的用戶(hù)訪(fǎng)問(wèn)概率,并以此對(duì)菜單進(jìn)行排序;利用關(guān)聯(lián)性分析算法對(duì)IVR用戶(hù)按鍵記錄進(jìn)行分析,得到IVR菜單節(jié)點(diǎn)間的關(guān)聯(lián)關(guān)系,并重新編排菜單;分析客戶(hù)致電查詢(xún)的原因,并使用其改進(jìn)菜單節(jié)點(diǎn)的關(guān)聯(lián)設(shè)置;將IVR菜單節(jié)點(diǎn)在語(yǔ)音樹(shù)中的播報(bào)權(quán)限開(kāi)放給用戶(hù),讓其可以自主在公司網(wǎng)站上進(jìn)行更改;將用戶(hù)劃分群組,針對(duì)每個(gè)群組提取熱門(mén)的菜單節(jié)點(diǎn),將其設(shè)置到IVR菜單的前置位置等。
2.信用卡中心IVR用戶(hù)訪(fǎng)問(wèn)行為。在傳統(tǒng)IVR優(yōu)化的方法中,對(duì)用戶(hù)來(lái)電目的和訪(fǎng)問(wèn)行為的研究較少。屠丹旎提出按IVR用戶(hù)群來(lái)設(shè)計(jì)個(gè)性化IVR,分別按用戶(hù)屬性,按業(yè)務(wù)屬性,按收到特殊消息對(duì)用戶(hù)進(jìn)行劃分,并歸納了引起用戶(hù)致電呼叫中心的原因:(1)用戶(hù)對(duì)IVR特定業(yè)務(wù)的使用偏好;(2)用戶(hù)基本屬性和用戶(hù)在IVR某項(xiàng)業(yè)務(wù)上的行為特征影響其對(duì)IVR特定業(yè)務(wù)的點(diǎn)擊興趣;(3)用戶(hù)收到的企業(yè)推送信息內(nèi)容引發(fā)用戶(hù)訪(fǎng)問(wèn)興趣。馮帥總結(jié)國(guó)內(nèi)信用卡中心IVR業(yè)務(wù)基礎(chǔ)上,將信用卡呼叫中心IVR業(yè)務(wù)分為激活服務(wù)、密碼服務(wù)、額度服務(wù)、賬單服務(wù)、分期服務(wù)、積分服務(wù)6大類(lèi)。針對(duì)不同服務(wù)類(lèi)型的呼叫影響因素,需要構(gòu)建不同的信用卡持卡人特征。杜云生以客戶(hù)關(guān)系管理中的RFM模型為基礎(chǔ),將信用卡持卡人的逾期風(fēng)險(xiǎn)和套現(xiàn)風(fēng)險(xiǎn)作為細(xì)分變量引入,選取信用卡持卡人的五類(lèi)交易數(shù)據(jù),即最近消費(fèi)時(shí)間、消費(fèi)頻率、總消費(fèi)金額、拖欠總金額和疑似套現(xiàn)總金額五類(lèi)數(shù)據(jù),經(jīng)過(guò)處理后形成信用卡持卡人的5類(lèi)交易特征。趙琦研究發(fā)現(xiàn)人口統(tǒng)計(jì)因素中性別、年齡、學(xué)歷、職業(yè)和收入情況的不同對(duì)信用卡分期付款消費(fèi)傾向均有顯著影響。用戶(hù)申請(qǐng)信用和額度的調(diào)整意味著用戶(hù)信用風(fēng)險(xiǎn)的調(diào)整,方匡南等實(shí)證發(fā)現(xiàn)職業(yè)、年齡、家庭人口數(shù)、月刷卡額、學(xué)歷、家庭月收入對(duì)信用風(fēng)險(xiǎn)有顯著影響,而性別、婚姻狀況等對(duì)信用風(fēng)險(xiǎn)影響不顯著。張曉蕾發(fā)現(xiàn)單次消費(fèi)分期金額、消費(fèi)商品所屬行業(yè)對(duì)信用卡分期業(yè)務(wù)違約有影響。積分服務(wù)方面,馬莎莎使用解釋水平理論,通過(guò)實(shí)驗(yàn)發(fā)現(xiàn)兌換時(shí)間距離和兌換物品類(lèi)別是決定用戶(hù)短期兌換選擇行為的主要因素。以上研究從各個(gè)角度反應(yīng)了用戶(hù)使用信用卡IVR相關(guān)業(yè)務(wù)的影響特征,但尚沒(méi)有統(tǒng)一的描述框架。
3. IVR訪(fǎng)問(wèn)節(jié)點(diǎn)預(yù)測(cè)方法。最初的IVR訪(fǎng)問(wèn)節(jié)點(diǎn)預(yù)測(cè)方法主要使用關(guān)聯(lián)推薦或者熱度排序,僅僅使用用戶(hù)在IVR中的按鍵記錄作為數(shù)據(jù)來(lái)源。本文將研究問(wèn)題轉(zhuǎn)化為對(duì)特定的時(shí)間下的用戶(hù),在用戶(hù)特征下訪(fǎng)問(wèn)目標(biāo)節(jié)點(diǎn)的預(yù)測(cè)問(wèn)題,需要采用分類(lèi)或回歸模型。分類(lèi)模型在信用卡用戶(hù)行為分析方面使用廣泛。張濤使用BP神經(jīng)網(wǎng)絡(luò)對(duì)信用卡客戶(hù)的忠誠(chéng)度進(jìn)行預(yù)測(cè),并抽取了用戶(hù)忠誠(chéng)度規(guī)則。劉魯軍使用邏輯回歸對(duì)信用卡客戶(hù)的激活行為進(jìn)行預(yù)測(cè)。邵帥使用銀行卡用戶(hù)行為數(shù)據(jù)設(shè)計(jì)了組合型并行化Item-Based改進(jìn)推薦算法,進(jìn)而對(duì)對(duì)商戶(hù)進(jìn)行推薦,并引入遺忘曲線(xiàn)和空間參數(shù)優(yōu)化推薦結(jié)果。
4.文獻(xiàn)評(píng)述?,F(xiàn)有的IVR個(gè)性化方法通常只考慮了用戶(hù)在IVR系統(tǒng)中的歷史行為,然而實(shí)際上IVR節(jié)點(diǎn)通常涉及具體的業(yè)務(wù)內(nèi)容,用戶(hù)對(duì)于呼叫中心的訪(fǎng)問(wèn)通常是帶有特定業(yè)務(wù)目標(biāo)。除了呼叫中心訪(fǎng)問(wèn)的歷史數(shù)據(jù)以外,用戶(hù)在其他業(yè)務(wù)相關(guān)系統(tǒng)內(nèi)留存有大量使用記錄。因此,結(jié)合信用卡的具體業(yè)務(wù)來(lái)分析用戶(hù)的行為,將有效提升用戶(hù)訪(fǎng)問(wèn)節(jié)點(diǎn)的預(yù)測(cè)準(zhǔn)確度。此外,傳統(tǒng)的IVR優(yōu)化算法將會(huì)改變?cè)械腎VR菜單結(jié)構(gòu),造成原本熟悉菜單結(jié)構(gòu)的用戶(hù)使用不便。本文通過(guò)用戶(hù)訪(fǎng)問(wèn)特征進(jìn)行節(jié)點(diǎn)預(yù)測(cè)的優(yōu)化方法,可以有效避免這一問(wèn)題。
三、信用卡IVR優(yōu)化方法
基于用戶(hù)訪(fǎng)問(wèn)預(yù)測(cè)的信用卡IVR優(yōu)化模型由以下幾部分構(gòu)成:(1)目標(biāo)節(jié)點(diǎn)篩選。(2)信用卡IVR用戶(hù)節(jié)點(diǎn)訪(fǎng)問(wèn)特征定義。(3)分類(lèi)方法的選取。
1.訪(fǎng)問(wèn)節(jié)點(diǎn)的篩選。IVR菜單節(jié)點(diǎn)分為引導(dǎo)節(jié)點(diǎn)以及功能節(jié)點(diǎn)兩類(lèi),引導(dǎo)節(jié)點(diǎn)往往起著串聯(lián)上下層級(jí)的IVR菜單,細(xì)分業(yè)務(wù)功能,提供邏輯順序的作用。功能節(jié)點(diǎn)則提供具體的業(yè)務(wù)功能,可以分為業(yè)務(wù)辦理和業(yè)務(wù)查詢(xún)兩類(lèi)。用戶(hù)呼入IVR時(shí)一般帶有特定的業(yè)務(wù)目標(biāo),是用戶(hù)訪(fǎng)問(wèn)IVR的最終目標(biāo)。因此本方法的預(yù)測(cè)目標(biāo)應(yīng)當(dāng)是具體的功能節(jié)點(diǎn)而非引導(dǎo)節(jié)點(diǎn)。
2.信用卡IVR用戶(hù)訪(fǎng)問(wèn)行為特征。用戶(hù)對(duì)信用卡的訪(fǎng)問(wèn)行為主要受到三方面因素的影響:(1)用戶(hù)的訪(fǎng)問(wèn)偏好;(2)信用卡IVR的特定業(yè)務(wù);(3)企業(yè)推送信息。
2.1用戶(hù)一段時(shí)間內(nèi)對(duì)于不同節(jié)點(diǎn)的訪(fǎng)問(wèn)量代表了該用戶(hù)對(duì)于不同訪(fǎng)問(wèn)節(jié)點(diǎn)的訪(fǎng)問(wèn)偏好,用戶(hù)的訪(fǎng)問(wèn)偏好會(huì)隨時(shí)間改變。定義一段時(shí)間內(nèi)用戶(hù)對(duì)節(jié)點(diǎn)訪(fǎng)問(wèn)次數(shù)和用戶(hù)訪(fǎng)問(wèn)總次數(shù)為用戶(hù)對(duì)該節(jié)點(diǎn)的訪(fǎng)問(wèn)熱度。用戶(hù)呼入日期前一周節(jié)點(diǎn)的訪(fǎng)問(wèn)熱度來(lái)衡量用戶(hù)短期偏好,取前3個(gè)月的節(jié)點(diǎn)訪(fǎng)問(wèn)熱度來(lái)衡量長(zhǎng)期變化。
2.2信用卡IVR業(yè)務(wù)分為激活業(yè)務(wù)、密碼業(yè)務(wù)、額度業(yè)務(wù)、分期業(yè)務(wù)、積分業(yè)務(wù)、賬單業(yè)務(wù)6大類(lèi),下面將分別對(duì)各類(lèi)業(yè)務(wù)的影響因素展開(kāi)討論:
2.2.1激活服務(wù):用戶(hù)使用激活業(yè)務(wù)主要受到信用卡激活狀態(tài)和鎖定狀態(tài)的影響,可以直接呼入前的信用卡狀態(tài)作為特征。
2.2.2密碼服務(wù):用戶(hù)選擇密碼服務(wù)通常有兩種情況,一種是剛剛激活信用卡以后,用戶(hù)需要設(shè)置或者驗(yàn)證密碼,可以使用距離開(kāi)卡的時(shí)間長(zhǎng)度衡量這種影響。另一種可能情況是用戶(hù)出現(xiàn)密碼遺忘。用戶(hù)出現(xiàn)密碼遺忘的原因很多,本文選擇兩種常見(jiàn)因素,即長(zhǎng)期未使用該信用卡或者擁有多張相同銀行的信用卡。定義距離上一次使用該賬戶(hù)交易的時(shí)間和該用戶(hù)下賬戶(hù)數(shù)量表示這兩種特征。
2.2.3額度服務(wù):用戶(hù)訪(fǎng)問(wèn)額度業(yè)務(wù)的常見(jiàn)場(chǎng)景一般有兩類(lèi):一類(lèi)是用戶(hù)在信用卡激活后查詢(xún)或更改自身額度,另一類(lèi)是用戶(hù)有繼續(xù)擴(kuò)大信用卡透支的傾向。第一類(lèi)場(chǎng)景選擇距離賬戶(hù)激活日期的時(shí)間作為特征,第二類(lèi)場(chǎng)景則需要衡量用戶(hù)擴(kuò)大透支的傾向。沈紅波通過(guò)實(shí)證分析發(fā)現(xiàn),年齡,婚姻狀況,持卡人收入,性別,工作年限,賬戶(hù)賬齡,信用額度使用率都會(huì)對(duì)用戶(hù)透支行為產(chǎn)生影響,本文也采用這些特征來(lái)描述用戶(hù)的調(diào)整額度的傾向。
2.2.4分期服務(wù):以往研究發(fā)現(xiàn)人口統(tǒng)計(jì)因素中性別、年齡、學(xué)歷、職業(yè)和收入對(duì)信用卡分期付款傾向均有顯著影響;另外使用需求和滿(mǎn)意度因素對(duì)分期付款傾向有正向顯著影響;風(fēng)險(xiǎn)知覺(jué)有顯著負(fù)向影響。為了衡量用戶(hù)的使用需求,本文采用月內(nèi)最大單筆消費(fèi)發(fā)生額和當(dāng)月賬單總額。用戶(hù)對(duì)分期越滿(mǎn)意,則越傾向采用分期方式,定義用戶(hù)分期數(shù):
風(fēng)險(xiǎn)知覺(jué)是用戶(hù)主觀的心理狀態(tài),使用用戶(hù)分期比例來(lái)衡量用戶(hù)的分期風(fēng)險(xiǎn)。
2.2.5積分服務(wù):積分到期時(shí)間、可兌換額度、兌換方式是影響用戶(hù)使用積分兌換活動(dòng)的主要因素,其中兌換方式分為純積分兌換和積分加現(xiàn)金兌換。研究發(fā)現(xiàn)用戶(hù)的兌換行為偏好純積分類(lèi)型兌換。
2.2.6賬單服務(wù):消費(fèi)日,賬單日,還款日構(gòu)成信用卡用戶(hù)的循環(huán)信用周期,其中的每個(gè)節(jié)點(diǎn)都會(huì)對(duì)用戶(hù)賬單產(chǎn)生影響,進(jìn)而促使用戶(hù)訪(fǎng)問(wèn)賬單業(yè)務(wù)。本文選取前3日消費(fèi)額和前3日消費(fèi)次數(shù)描述用戶(hù)的消費(fèi)特征。選擇呼入日期距離賬單日天數(shù)可以描述賬單訪(fǎng)問(wèn)特征。因此選擇上次還款額、距離上次還款日期天數(shù)描述還款特征。
2.3企業(yè)推送信息特征:短信通知是信用卡呼叫中心服務(wù)用戶(hù)的重要手段。S-O-R(stimulus-organism-response)模型[9]是認(rèn)知心理學(xué)的重要模型,表明環(huán)境刺激(S)會(huì)激起用戶(hù)(O)內(nèi)在心理狀態(tài)的變化從而產(chǎn)生對(duì)外反應(yīng)(R)。該理論表明了企業(yè)推送信息(S)的確會(huì)影響到用戶(hù)的IVR點(diǎn)擊節(jié)點(diǎn)(R)。S-O-R模型只能定性的說(shuō)明了企業(yè)推送信息對(duì)于用戶(hù)在IVR中選擇節(jié)點(diǎn)的影響,我們還需要定量計(jì)算推送信息的實(shí)際影響程度才能構(gòu)建該特征。因?yàn)榄h(huán)境刺激作用于用戶(hù)(O),難以直接計(jì)算影響,因此我們提出刺激強(qiáng)度來(lái)替代性地模擬這種影響。信用卡中心的通知短信是根據(jù)具體業(yè)務(wù)功能進(jìn)行編排的,短信內(nèi)容一般會(huì)涉及到具體業(yè)務(wù),我們可以根據(jù)常識(shí),人工標(biāo)注該短信刺激的業(yè)務(wù)節(jié)點(diǎn),得到該短信和各節(jié)點(diǎn)的相關(guān)性向量。同時(shí)用戶(hù)對(duì)各節(jié)點(diǎn)的短期訪(fǎng)問(wèn)熱度代表用戶(hù)的興趣,可以作為用戶(hù)對(duì)個(gè)節(jié)點(diǎn)興趣的興趣向量B。通過(guò)計(jì)算兩個(gè)向量的余弦相似度M,可以近似該短信對(duì)該用戶(hù)的影響強(qiáng)度。A*M則可以表示該短信對(duì)該用戶(hù)的實(shí)際影響。
假設(shè)企業(yè)推送的各條信息對(duì)用戶(hù)的影響相互獨(dú)立,用戶(hù)每天收到N條短信,則可以通過(guò)簡(jiǎn)單相加得到每天的短信對(duì)信用卡用戶(hù)訪(fǎng)問(wèn)節(jié)點(diǎn)刺激強(qiáng)度的影響,定義為短信-節(jié)點(diǎn)刺激強(qiáng)度。
3.用戶(hù)訪(fǎng)問(wèn)節(jié)點(diǎn)的優(yōu)化方法。隨機(jī)森林運(yùn)用Bagging方法結(jié)合隨機(jī)子空間的方式提取特征的思想,是由一組隨機(jī)生成決策樹(shù)組成的分類(lèi)器。當(dāng)一位用戶(hù)的特征值向量輸入到訓(xùn)練好的隨機(jī)森林后,里面的每棵決策樹(shù)都獨(dú)立地對(duì)該用戶(hù)進(jìn)行判斷,根據(jù)多數(shù)表決原則決定該用戶(hù)的最終分類(lèi)。相比于其他分類(lèi)算法例如決策樹(shù)、LR等,隨機(jī)森林算法有以下幾大優(yōu)勢(shì):(1)IVR用戶(hù)具有不同的背景,使用習(xí)慣也各不相同,因而提取的特征值的個(gè)體差異會(huì)較大,單個(gè)特征值對(duì)預(yù)測(cè)的貢獻(xiàn)不會(huì)十分顯著。隨機(jī)森林算法對(duì)每個(gè)指標(biāo)的要求不是很高,每個(gè)指標(biāo)都只需要包含少量區(qū)分信息即可。(2)用戶(hù)對(duì)于各項(xiàng)業(yè)務(wù)訪(fǎng)問(wèn)特征之間很可能會(huì)存在一些潛在的相關(guān)性,但對(duì)這些相關(guān)性又很難進(jìn)行準(zhǔn)確衡量,所以那些對(duì)特征之間相關(guān)性十分敏感的算法會(huì)不適合。隨機(jī)森林對(duì)于特征之間的多重共線(xiàn)性不敏感,運(yùn)用到本次分類(lèi)研究中比較合適。(3)隨機(jī)森林算法的魯棒性較強(qiáng),由于IVR用戶(hù)中不可避免存在重復(fù)呼入,錯(cuò)誤點(diǎn)擊等噪音數(shù)據(jù),選擇隨機(jī)森林算法可以很好地避免這些數(shù)據(jù)的影響。因此,本文選用隨機(jī)森林作為分類(lèi)預(yù)測(cè)階段的分類(lèi)器。
四、實(shí)驗(yàn)及結(jié)果分析
1.原始數(shù)據(jù)及預(yù)處理。本文所使用的原始數(shù)據(jù)來(lái)自某銀行信用卡中心2015年10月到2016年5月的運(yùn)營(yíng)記錄。選取50000個(gè)信用卡賬戶(hù),以及賬戶(hù)所關(guān)聯(lián)的用戶(hù)屬性數(shù)據(jù),IVR來(lái)電歷史記錄數(shù)據(jù),額度及調(diào)整記錄數(shù)據(jù),交易記錄數(shù)據(jù),還款記錄,辦理分期記錄數(shù)據(jù),積分兌換數(shù)據(jù),短信發(fā)送數(shù)據(jù)等,如表2所示。
由于用戶(hù)的IVR來(lái)電日志包含了所有按鍵節(jié)點(diǎn),因此,需要查詢(xún)每一通來(lái)電記錄,去除中的引導(dǎo)節(jié)點(diǎn)。其次,依據(jù)節(jié)點(diǎn)的訪(fǎng)問(wèn)時(shí)間戳去除重復(fù)的按鍵記錄。如果用戶(hù)在一次訪(fǎng)問(wèn)中辦理了多個(gè)業(yè)務(wù)節(jié)點(diǎn),提取其中第一個(gè)業(yè)務(wù)節(jié)點(diǎn)。將數(shù)據(jù)處理形成(呼入日期,信用卡號(hào), IVR訪(fǎng)問(wèn)節(jié)點(diǎn))的三元組結(jié)構(gòu)作為基本的用戶(hù)IVR節(jié)點(diǎn)訪(fǎng)問(wèn)單元,最終構(gòu)建了842792條用戶(hù)IVR來(lái)電數(shù)據(jù)。然后對(duì)基本單元關(guān)聯(lián)的其他運(yùn)營(yíng)記錄進(jìn)行ETL處理,得到最終的分類(lèi)輸入特征集合。
2.目標(biāo)節(jié)點(diǎn)篩選和業(yè)務(wù)劃分。刪除中間引導(dǎo)節(jié)點(diǎn)后,該信用卡IVR菜單一共有 32個(gè)業(yè)務(wù)節(jié)點(diǎn),如圖2所示,各個(gè)節(jié)點(diǎn)的訪(fǎng)問(wèn)量呈現(xiàn)明顯的長(zhǎng)尾分布。其中前25個(gè)節(jié)點(diǎn)的訪(fǎng)問(wèn)量占到總訪(fǎng)問(wèn)量的98.23%。訪(fǎng)問(wèn)量前5的節(jié)點(diǎn)分別是查詢(xún)密碼重置,交易密碼重置,修改交易密碼,延遲還款申請(qǐng),設(shè)置憑密功能。
然后按照菜單結(jié)構(gòu)內(nèi)各個(gè)節(jié)點(diǎn)分布情況和節(jié)點(diǎn)名稱(chēng),對(duì)各個(gè)訪(fǎng)問(wèn)節(jié)點(diǎn)進(jìn)行業(yè)務(wù)劃分。從業(yè)務(wù)分布可以看到賬單類(lèi)業(yè)務(wù)比例最大,在6種業(yè)務(wù)分類(lèi)外的其他業(yè)務(wù)比例很小,而且訪(fǎng)問(wèn)量也很小。因此,即使沒(méi)有設(shè)計(jì)預(yù)測(cè)該類(lèi)業(yè)務(wù)訪(fǎng)問(wèn)的特征也不會(huì)造成很大影響。
3.實(shí)驗(yàn)設(shè)置和評(píng)價(jià)方法。本文將展開(kāi)兩組實(shí)驗(yàn):(1)通過(guò)建立分類(lèi)器驗(yàn)證提出方法的預(yù)測(cè)效果,并檢驗(yàn)?zāi)P偷姆€(wěn)定性和各個(gè)特征的重要程度。預(yù)測(cè)準(zhǔn)確性的評(píng)價(jià)方法一般采用準(zhǔn)確率、召回率和F值。本實(shí)驗(yàn)利用基于python的scikit-learn包實(shí)現(xiàn)隨機(jī)森林算法。該包可以提供各種特征的重要性分析,也可以將多分類(lèi)結(jié)果按預(yù)測(cè)的概率分布輸出,可以很方便地按照預(yù)測(cè)準(zhǔn)確率調(diào)整預(yù)測(cè)節(jié)點(diǎn)的個(gè)數(shù)。(2)通過(guò)對(duì)比推薦前后用戶(hù)在IVR中實(shí)際的停留時(shí)間,來(lái)檢驗(yàn)優(yōu)化方法在實(shí)際運(yùn)行環(huán)境中的效果。
4.優(yōu)化效果及分析。將表1所示特征輸入分類(lèi)器,采用4折交叉驗(yàn)證計(jì)算平均F值。由于各目標(biāo)節(jié)點(diǎn)的訪(fǎng)問(wèn)量存在明顯差異,類(lèi)別不平衡嚴(yán)重,因此對(duì)訪(fǎng)問(wèn)量占比小于20%的類(lèi)別進(jìn)行10倍重復(fù)采樣。分類(lèi)器參數(shù)均選擇默認(rèn)參數(shù)。分別使用1到4月份數(shù)據(jù)作為訓(xùn)練集,5月數(shù)據(jù)作為測(cè)試集,預(yù)測(cè)結(jié)果如表2所示。由表可見(jiàn)該預(yù)測(cè)模型準(zhǔn)確率波動(dòng)較小,說(shuō)明表1中所提取的特征并沒(méi)有隨時(shí)間變化而失效,顯示出模型的穩(wěn)健性。
在實(shí)際的IVR推薦中,我們可以提取TOP N個(gè)預(yù)測(cè)結(jié)果,因此需要對(duì)預(yù)測(cè)結(jié)果進(jìn)行篩選。使用4月份數(shù)據(jù)訓(xùn)練出分類(lèi)模型,我們按分類(lèi)結(jié)果的概率分布大小分別計(jì)算取前1,前2一直到到前5個(gè)預(yù)測(cè)節(jié)點(diǎn)下的準(zhǔn)確率變化情況,如表5所示。
當(dāng)取前5個(gè)預(yù)測(cè)節(jié)點(diǎn)時(shí),預(yù)測(cè)準(zhǔn)確率已經(jīng)超過(guò)85%,已經(jīng)屬于較高的預(yù)測(cè)準(zhǔn)確度,可以作為實(shí)際推薦使用。因此,按預(yù)測(cè)概率大小排序,選取預(yù)測(cè)節(jié)點(diǎn)的TOP 5個(gè)節(jié)點(diǎn)數(shù)作為推薦節(jié)點(diǎn),并按照概率分布大小排序。為了評(píng)估模型中特征的重要性,將各特征按照重要性排序后取前5個(gè)和最后5個(gè)節(jié)點(diǎn)如表6所示。其中賬戶(hù)開(kāi)通時(shí)間是唯一重要性大于10%的特征。說(shuō)明新用戶(hù)在申請(qǐng)到賬戶(hù)后,來(lái)電目的往往會(huì)集中于密碼或激活類(lèi)的業(yè)務(wù)節(jié)點(diǎn),因此相關(guān)性會(huì)比較大。信息刺激強(qiáng)度也排在前5位之中,說(shuō)明企業(yè)推送短信的確對(duì)于用戶(hù)的IVR撥打和點(diǎn)擊行為有較強(qiáng)的引導(dǎo)作用。而性別、年齡、收入等用戶(hù)屬性對(duì)用戶(hù)訪(fǎng)問(wèn)節(jié)點(diǎn)的預(yù)測(cè)。
使用本文提出的優(yōu)化方法,在該信用卡中心IVR系統(tǒng)內(nèi)進(jìn)行了線(xiàn)上測(cè)試。并在上線(xiàn)一個(gè)月后隨機(jī)抽取了500通訪(fǎng)問(wèn)電話(huà),同時(shí)從上線(xiàn)之前的系統(tǒng)數(shù)據(jù)中隨機(jī)抽取500通訪(fǎng)問(wèn)電話(huà),分別計(jì)算用戶(hù)的平均停留時(shí)間和標(biāo)準(zhǔn)差。因?yàn)榧夹g(shù)原因,用戶(hù)在IVR系統(tǒng)中停留的時(shí)間無(wú)法單獨(dú)提取,有一部分人工服務(wù)的時(shí)間也被計(jì)算在內(nèi)。但是該優(yōu)化方案對(duì)于用戶(hù)的轉(zhuǎn)人工行為并沒(méi)有直接影響,因此可以假設(shè)500通訪(fǎng)問(wèn)電話(huà)中人工服務(wù)的比例和時(shí)間是接近的,不會(huì)對(duì)結(jié)果造成明顯影響。由表7可見(jiàn),加入推薦后用戶(hù)在系統(tǒng)內(nèi)的平均停留時(shí)間縮短了15.26秒,占優(yōu)化前總時(shí)間的9.3%,優(yōu)化效果明顯。然而標(biāo)準(zhǔn)差在優(yōu)化后有所擴(kuò)大,可能原因是一些用戶(hù)沒(méi)有習(xí)慣于這種個(gè)性化的語(yǔ)音播報(bào)而迅速掛斷了電話(huà),使重播率有所上升?;蚴遣糠钟脩?hù)在推薦節(jié)點(diǎn)內(nèi)沒(méi)有找到自己需要的業(yè)務(wù)節(jié)點(diǎn),進(jìn)而重新進(jìn)入原IVR語(yǔ)音,導(dǎo)致時(shí)間的延長(zhǎng)。
五、結(jié)語(yǔ)
信用卡呼叫中心IVR是用戶(hù)訪(fǎng)問(wèn)信用卡業(yè)務(wù)的重要渠道,個(gè)性化IVR可以幫助用戶(hù)減少停留時(shí)間,優(yōu)化用戶(hù)體驗(yàn)。本文設(shè)計(jì)了一種使用用戶(hù)訪(fǎng)問(wèn)特征的IVR優(yōu)化方法,該方法比較于傳統(tǒng)的IVR個(gè)性化方法,有以下幾點(diǎn)優(yōu)勢(shì):(1)使用呼叫中心和相關(guān)業(yè)務(wù)系統(tǒng)內(nèi)大量用戶(hù)行為記錄對(duì)用戶(hù)訪(fǎng)問(wèn)目標(biāo)進(jìn)行預(yù)測(cè),最大程度利用現(xiàn)有信息,可解釋性強(qiáng),個(gè)性化程度更高。(2)在進(jìn)入傳統(tǒng)IVR菜單之前加入推薦層,不需要破壞原有IVR菜單結(jié)構(gòu),即使推薦結(jié)果沒(méi)有命中,用戶(hù)可以重新進(jìn)入熟悉的傳統(tǒng)IVR菜單。實(shí)驗(yàn)結(jié)果表明預(yù)測(cè)準(zhǔn)確率達(dá)到理想水平,優(yōu)化后的用戶(hù)平均停留時(shí)間有了明顯縮短。下一步研究應(yīng)當(dāng)推廣預(yù)測(cè)推薦技術(shù)到呼叫中心的更多環(huán)節(jié)中,例如外呼營(yíng)銷(xiāo)以及客服的人工服務(wù),以達(dá)到呼叫中心服務(wù)的進(jìn)一步個(gè)性化,提高呼叫中心整體運(yùn)作效率。
參考文獻(xiàn):
[1].李大川.呼叫中心業(yè)務(wù)流不均衡問(wèn)題研究[D].北京郵電大學(xué)博士研究生學(xué)位論文,2008.
[2].韓湧.IVR自助系統(tǒng)中的用戶(hù)行為分析系統(tǒng)的研究與設(shè)計(jì)[D],上海交通大學(xué)工程碩士論文,2013.
[3].羅來(lái)鵬.基于關(guān)聯(lián)模式的電信客戶(hù)致電實(shí)證分析.中原工學(xué)院學(xué)報(bào)[J],2014,25(6):85-88.
[4].黃志軍.外包呼叫中心配置型個(gè)性化IVR業(yè)務(wù)的研究.無(wú)線(xiàn)互聯(lián)科技[J],2013,6: 155-156.
[5].屠丹旎.從傳統(tǒng)走向個(gè)性的IVR 轉(zhuǎn)型方案的研究.新技術(shù)[J], 2012,15:71-72.
[6].楊海威.IVR智能管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D],北京工業(yè)大學(xué)碩士研究生學(xué)位論文,2014.
[7].翟曉芳,劉全明等.基于轉(zhuǎn)發(fā)層次分析的新浪微博熱度預(yù)測(cè)研究.計(jì)算機(jī)工程[J],2015,41(7):31-35.
[8].牟穎,王俊峰,謝傳柳等.大型呼叫中心話(huà)務(wù)量預(yù)測(cè).計(jì)算機(jī)工程與設(shè)計(jì)[J]2010, 21: 4686-4689+4719.
[9].Amy Wenxuan Ding, Shibo Li, Patrali Chatterjee.Learning User Real-Time Intent for Optimal Dynamic Web Page Transformation.[J] Information Systems Research,2015,26(2):339–359.
[10].杜云生.信用卡消費(fèi)市場(chǎng)細(xì)分研究[D].北京理工大學(xué)博士研究生學(xué)位論文,2014.
[11].趙琦.信用卡分期付款消費(fèi)傾向影響因素的實(shí)證研究[D].湖南大學(xué)碩士研究生學(xué)位論文,2009.
[12].方匡南,吳見(jiàn)彬,朱建平,謝邦昌.信貸信息不對(duì)稱(chēng)下的信用卡信用風(fēng)險(xiǎn)研究.經(jīng)濟(jì)研究[J],2010,1: 97-107.
[13].張曉蕾.信用卡分期業(yè)務(wù)違約的影響因素及研究--A銀行廣州分行信用卡業(yè)務(wù)為例[D].暨南大學(xué)碩士學(xué)位論文,2014.
[14].馬莎莎.兌換方式和距離對(duì)回報(bào)計(jì)劃參與的影響研究[D]西安工業(yè)大學(xué)碩士研究生學(xué)位論文,2014.
[15].張濤.商業(yè)銀行信用卡客戶(hù)忠誠(chéng)度預(yù)測(cè)問(wèn)題研究[D].清華大學(xué)碩士研究生學(xué)位論文,2008.
[16].邵帥.基于海量銀行卡用戶(hù)行為的推薦算法研究[D].大連理工大學(xué)碩士研究生學(xué)位論文,2015.
[17].劉魯軍.基于數(shù)據(jù)挖掘的信用卡客戶(hù)激活與響應(yīng)度研究[D].山東大學(xué)碩士研究生學(xué)位論文,2011.
[18].馮帥.交通銀行信用卡坐席系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D].北京交通大學(xué)碩士研究生學(xué)位論文,2013.