鐘劍鋒, 孫 鐸, 賀 瑩, 王 峭
(廣東粵海水務(wù)投資有限公司, 廣東 深圳 518021)
隨著機器學習理論研究的突破以及計算機性能的大幅提升,各個領(lǐng)域不斷出現(xiàn)的SOTA算法為人工智能技術(shù)在某個具體場景應(yīng)用落地提供了可能。智能語音融合了智能語音識別(ASR)、語音自動生成(TTS)、自然語言處理(NLP)等人工智能技術(shù),主要應(yīng)用在語音客服領(lǐng)域。相比于傳統(tǒng)的以人工為基礎(chǔ)的客服應(yīng)用,智能語音客服應(yīng)用具有7×24小時不間斷服務(wù)、運營成本低、服務(wù)質(zhì)量高、服務(wù)過程可追溯等優(yōu)點,受到以提高客服質(zhì)量、降低客服運營成本為目的的公司的關(guān)注。
目前,智能語音技術(shù)在市場上得到了廣泛應(yīng)用與認可,許多公司已經(jīng)建成或者正在建設(shè)智能語音客服系統(tǒng)。例如,廣西12328交通運輸服務(wù)監(jiān)督電話正在進行基于智能語音技術(shù)的升級改造[1],電信公司推出了智能語音客服“小萬”,鐵路智能語音客服系統(tǒng)已經(jīng)在上海展開試點并取得了較好的應(yīng)用效果[2]。建設(shè)以智能語音技術(shù)為基礎(chǔ)的智能語音客服系統(tǒng)正在成為客服領(lǐng)域的必然趨勢。本文以正在建設(shè)中的廣東粵海水務(wù)投資有限公司(以下簡稱粵海水務(wù))智能語音客服系統(tǒng)項目為例,分析智能語音客服在水務(wù)行業(yè)的實踐應(yīng)用,希望為相似系統(tǒng)項目建設(shè)提供借鑒。
目前粵海水務(wù)客服主要存在以下問題:客服工作全部由人工完成,其中大部分客服工作都比較重復(fù)固定,員工積極性不高,且業(yè)務(wù)培訓周期長,難以深入了解業(yè)務(wù),無法提供給客戶專業(yè)性的解答;按鍵式交互自助語音系統(tǒng)的服務(wù)效率有極限,無法跟上快速增加的來電咨詢數(shù)量需求,當客戶無法快速得到服務(wù)時便會轉(zhuǎn)向人工服務(wù),導(dǎo)致人工座席話務(wù)量增大,影響客戶服務(wù)體驗;人員流動性大,運營管理人工成本高,影響了服務(wù)質(zhì)量。因此,完成智能語音客服系統(tǒng)建設(shè)十分有必要。
為了克服上述水務(wù)行業(yè)客服領(lǐng)域的通病,給用戶提供優(yōu)質(zhì)的業(yè)務(wù)咨詢服務(wù),其他水務(wù)公司也做出了許多努力,紛紛投身水務(wù)客服智能化項目建設(shè)的浪潮中。杭州蕭山供水有限公司與相關(guān)企業(yè)合作,建設(shè)具有智能IVR互動式語音應(yīng)答和智能語音服務(wù)兩個核心功能的智能語音服務(wù)系統(tǒng)[3]。北京市水務(wù)信息管理中心通過將智能語音識別技術(shù)應(yīng)用到北京市河長制管理工作中,構(gòu)建了北京市河長制智能語音交互系統(tǒng),提高了各級河長和巡查人員的工作效率[4]。此外,武漢、深圳、福州、重慶等城市的水務(wù)公司也積極開展了許多智能化項目的探索。
通過本項目建設(shè),提供智能語音機器人客戶服務(wù),搭建企業(yè)客戶服務(wù)知識庫,提升客戶服務(wù)水平,減少人工重復(fù)工作。
搭建本地語音識別引擎、語音合成引擎、自然語言處理引擎并提供智能機器人、知識庫等功能的智能語音客服系統(tǒng),實現(xiàn)客服機器人與用戶交互。具體過程如下。
(1)機器人“聽懂”
當用戶撥打熱線接入后,首先通過語音識別引擎對用戶進行語音識別,將語言轉(zhuǎn)換成文字。
(2)機器人“理解”
通過自然語言處理引擎對識別的文字進行語義理解,獲得用戶的真實意圖。
(3)機器人“思考”
在得到用戶真實意圖之后,通過智能機器人的對話流程,從知識庫中獲取相應(yīng)的回復(fù)答案。
(4)機器人“說話”
最后通過智能語音合成引擎將回復(fù)答案從文本轉(zhuǎn)回語音,播放給用戶,實現(xiàn)語音機器人與用戶的交流。
系統(tǒng)邏輯結(jié)構(gòu)如圖1所示。為了保證系統(tǒng)的訪問速度,語音識別引擎、語音合成引擎、自然語言處理引擎、機器人、知識庫模塊以私有化的形式部署在本地,并以WebSocket接口的形式被調(diào)用??紤]到智能語音技術(shù)是本項目的難點和核心,因此選擇與國內(nèi)智能語音技術(shù)方面領(lǐng)先的企業(yè)合作,并結(jié)合具體的業(yè)務(wù)場景需求進行個性化定制來提升服務(wù)質(zhì)量。
圖1 系統(tǒng)邏輯結(jié)構(gòu)Fig.1 Logical structure of the system
2.3.1語音識別引擎
語音識別引擎主要有語音采集和語音轉(zhuǎn)寫兩部分功能,其中語音采集決定了要處理的音頻的特征,并根據(jù)音頻的特征設(shè)計模型進行語音轉(zhuǎn)寫。語音識別引擎主要包含以下功能。
(1)文本時間戳:音頻轉(zhuǎn)換結(jié)果生成特定的時間戳,通過搜索文本即可快速找到對應(yīng)的原始音頻。
(2)智能斷句:通過提取上下文相關(guān)語義特征,并結(jié)合語音特征,智能斷句及添加標點符號,提升輸出文本的可閱讀性。
(3)中英文混合識別:支持在中文句子中識別夾帶的英文字母、數(shù)字等,從而實現(xiàn)中、英文以及數(shù)字的混合識別。
(4)即時輸出識別結(jié)果:連續(xù)識別語音流內(nèi)容即時輸出結(jié)果,并可根據(jù)上下文語言模型自動校正。
(5)自動靜音檢測:對輸入語音流進行靜音檢測,提高識別效率和準確率。
2.3.2語音合成引擎
語音合成引擎通過模型學習對分詞模型算法進行優(yōu)化,通過分詞模型對轉(zhuǎn)換的文本進行識別,再使用語音合成技術(shù)實現(xiàn)文本轉(zhuǎn)化為語音。語音合成引擎主要功能有:支持多種音頻格式、多種人聲音色輸出,處理不同采樣率頻率的音頻,支持音頻語速、音高、音量調(diào)節(jié)等。
2.3.3自然語言處理引擎
自然語言處理引擎將語義泛化能力、用戶意圖識別、多輪對話等人機互動體驗相關(guān)能力整體聚合成高效人機協(xié)同的智能化引擎,基于深度學習算法,并結(jié)合高精度業(yè)務(wù)專家的規(guī)則理解和模型理解進行輸出。自然語言處理引擎主要功能有對話管理、詞庫管理、語料庫管理、機器自學習、數(shù)據(jù)監(jiān)控等。
2.3.4機器人
機器人作為擬人的客服,其核心作用是處理人機對話流程。對于呼叫中心,機器人扮演語音客服的角色。對于微信營業(yè)廳和網(wǎng)上營業(yè)廳,機器人扮演文本客服的角色。針對流程性的業(yè)務(wù),例如通過語音辦理某業(yè)務(wù),機器人按照提前設(shè)置好的流程引導(dǎo)客戶辦理業(yè)務(wù)。由于客戶需求的多元化,機器人包含多種流程,主要有咨詢類、資訊類、客服類、任務(wù)類等。機器人不僅可以替代人工回答客戶問題,幫助客戶辦理業(yè)務(wù),還具有人工外呼的作用。當有對外營銷的需求時,例如客戶滿意度調(diào)查、政策通知等,可以基于設(shè)計好的話術(shù)模板設(shè)置定時定量的機器人進行外呼工作。
2.3.5知識庫
知識庫主要實現(xiàn)的功能是對全部的企業(yè)服務(wù)知識進行分門別類的存儲、檢索和搜索,并與其他系統(tǒng)進行集成。根據(jù)咨詢的業(yè)務(wù)分類轉(zhuǎn)接到相關(guān)業(yè)務(wù)知識庫進行回答,當知識庫無法及時準確回答時轉(zhuǎn)接到人工,由人工客服進行回復(fù),同時記錄下會話數(shù)據(jù)用于知識庫更新和智能客服優(yōu)化訓練。
2.4.1部署方案
網(wǎng)絡(luò)拓撲結(jié)構(gòu)如圖2所示。采用集中式的本地化中心建設(shè)模式,即所有設(shè)備都放置在中心機房中。Freeswitch服務(wù)器與電信運營商實現(xiàn)電話通信,采用MSTP協(xié)議。語音接入平臺為語音網(wǎng)關(guān)+軟交換模式,采用SIP協(xié)議對接。服務(wù)器需要安裝基于 docker容器化的虛擬機,運行的操作系統(tǒng)支持CentOS7.2及以上版本系統(tǒng)。客戶端采用 B/S 結(jié)構(gòu), 客戶端操作系統(tǒng)全面兼容 WinXP/7/8/10等。瀏覽器全面兼容Chrome瀏覽器。
圖2 網(wǎng)絡(luò)拓撲結(jié)構(gòu)Fig.2 Topology of network
2.4.2數(shù)據(jù)接口
根據(jù)合作方企業(yè)提供的數(shù)據(jù)調(diào)用接口,采用Restful接口模式進行數(shù)據(jù)的集成交換,報文使用json格式,單次傳輸?shù)臄?shù)據(jù)量不超過1 000條。調(diào)用時需在請求頭傳入appKey、version、timestamp和signature用于權(quán)限校驗,采用SHA256加密算法進行加密API認證。外呼機器人的數(shù)據(jù)接口包括創(chuàng)建任務(wù)、任務(wù)導(dǎo)入客戶、啟動任務(wù)、信息回調(diào)等模塊。呼入機器人的數(shù)據(jù)接口包括身份確認、城市水司確認、停水通知、水費查詢、消息對接、信息回調(diào)等模塊。
外呼機器人數(shù)據(jù)流向如圖3所示,以“停水通知”外呼場景為例,其流程如下。
圖3 外呼機器人數(shù)據(jù)流向Fig.3 Data flow of call-out robot
(1)在獲取基礎(chǔ)信息(例如線路信息、機器人話術(shù))后,需要調(diào)用創(chuàng)建任務(wù)接口,創(chuàng)建“停水通知”任務(wù)。
(2)創(chuàng)建任務(wù)完成后,需要通過向任務(wù)中導(dǎo)入客戶接口向該任務(wù)中導(dǎo)入需要外呼的客戶。
(3)導(dǎo)入客戶完成后,需要通過啟動任務(wù)接口啟動該任務(wù)。
(4)每一通通話完成之后,都會通過回調(diào)接口,將外呼的會話歷史等數(shù)據(jù)回調(diào)給后臺。
以用戶呼入后通過智能客服系統(tǒng)查詢水費為例,數(shù)據(jù)流向如圖4所示,接口參數(shù)如圖5所示。
圖4 查詢水費數(shù)據(jù)流向Fig.4 Data flow of querying water bill
圖5 查詢水費參數(shù)詳情Fig.5 Parameter details of querying water rate
智能客服識別用戶查詢水費意圖后,自動向業(yè)務(wù)中臺發(fā)送水費查詢請求,業(yè)務(wù)中臺接受請求后搜索數(shù)據(jù)庫并返回查詢結(jié)果至智能客服,智能客服按照規(guī)則解析報文并向用戶播報。
2.4.3業(yè)務(wù)中臺
信息化是實現(xiàn)高效數(shù)據(jù)管理的強大保證和支撐。通過集成式開發(fā),將機器人管理、話術(shù)管理、知識庫管理等功能統(tǒng)一顯示于業(yè)務(wù)中臺的頁面中,實現(xiàn)高效的數(shù)據(jù)整合和對業(yè)務(wù)過程的動態(tài)管理,能夠快速支持準確、實時的數(shù)據(jù)決策。業(yè)務(wù)中臺如圖6所示。
圖6 業(yè)務(wù)中臺Fig.6 Service center
外呼機器人模塊提供創(chuàng)建外呼任務(wù)、一鍵導(dǎo)入客戶、自動重撥等功能。在線智能客服機器人提供多輪對話管理、意圖庫管理、知識庫管理、話術(shù)管理等功能。知識庫已梳理水務(wù)相關(guān)問題149條、語料7 000余條。以話術(shù)模板配置為例,通過可視化的流程配置界面,梳理用戶對話場景,使用拖拉拽的形式建立用戶節(jié)點和機器人節(jié)點。用戶節(jié)點即識別用戶話術(shù)的節(jié)點可接入后臺知識庫,機器人節(jié)點即機器人播放話術(shù)的節(jié)點。圖7所示為用戶詢問開具增值稅發(fā)票和增值稅發(fā)票遺失的話術(shù)。
圖7 話術(shù)模板Fig.7 Speech template
以用戶撥打熱線電話呼入為例,轉(zhuǎn)人工流程如圖8所示。盡管智能客服能夠替代大部分的客服工作,但由于存在機器人并發(fā)數(shù)量有限、機器人無法100%回答客戶提出的問題等情況,人工客服依舊必不可少。用戶呼入后,若機器人并發(fā)數(shù)已滿則轉(zhuǎn)入人工,否則進行人機交互。在人機交互的過程中若發(fā)生客戶要求轉(zhuǎn)人工、機器人無法回答客戶問題等突發(fā)情況,機器人自動轉(zhuǎn)接人工客服。在轉(zhuǎn)接人工客服時播放“正在為您轉(zhuǎn)接人工客服,請稍等”的等待音頻。若人工坐席客服空閑則進行人工客服服務(wù),否則繼續(xù)等待直到人工客服坐席空閑;若超過等待時間則播放“目前人工坐席全忙,請稍后再撥”的音頻,并且機器人掛機。
圖8 轉(zhuǎn)人工流程Fig.8 Process of switching to manual service
將智能語音技術(shù)應(yīng)用于水務(wù)客服領(lǐng)域,能夠減輕人工客服壓力,提升服務(wù)效率,為用戶打造更為流暢和更加便捷的業(yè)務(wù)咨詢、辦理體驗。目前項目已完成智能語音客服系統(tǒng)開發(fā)工作,后續(xù)將結(jié)合水務(wù)行業(yè)的特點,進一步完善水務(wù)專業(yè)領(lǐng)域知識庫,滿足用戶個性化需求,提高粵語識別的準確度,同時接入微信營業(yè)廳和網(wǎng)上營業(yè)廳等來源的服務(wù)請求,建設(shè)全媒體渠道的統(tǒng)一坐席門戶。