廣東電網(wǎng)有限責(zé)任公司客戶(hù)服務(wù)中心 劉振華 康峰 蘇立偉 譚火超 蘇春明
傳統(tǒng)電力客服會(huì)話(huà)正確復(fù)述次數(shù)較低,問(wèn)題識(shí)別能力隨之下降,設(shè)計(jì)電力智能客服實(shí)現(xiàn)技術(shù)。提取電力會(huì)話(huà)語(yǔ)義特征,分類(lèi)識(shí)別各類(lèi)語(yǔ)義;進(jìn)行會(huì)話(huà)語(yǔ)義相似度計(jì)算,利用相似函數(shù)歸一化處理語(yǔ)義相似度;糾正智能會(huì)話(huà)相似詞匯,消除相似會(huì)話(huà)的識(shí)別誤差。實(shí)驗(yàn)采用對(duì)比實(shí)驗(yàn)的方式,驗(yàn)證了電力智能客服實(shí)現(xiàn)技術(shù)的效果更佳。
隨著互聯(lián)網(wǎng)的發(fā)展,人們的生活方式不斷受到影響,網(wǎng)絡(luò)服務(wù)也已經(jīng)成為現(xiàn)代人的主要服務(wù)模式,智能客服作為新時(shí)代下,網(wǎng)絡(luò)的智能化產(chǎn)物,逐漸深入各個(gè)領(lǐng)域,在電力方向發(fā)展是研究者的新方向[1]。傳統(tǒng)電力客服在識(shí)別問(wèn)題方面較為復(fù)雜,正確復(fù)述次數(shù)較低,而造成這一現(xiàn)象的主要原因即為,傳統(tǒng)電力客服對(duì)語(yǔ)義識(shí)別不清晰,相關(guān)語(yǔ)義分類(lèi)不明確,相似度計(jì)算效果差等因素[2-3]。本文將就此,摒棄以上缺點(diǎn),研究電力智能客服實(shí)現(xiàn)技術(shù),首先,提取用戶(hù)會(huì)話(huà)的語(yǔ)義特征,進(jìn)行智能化識(shí)別;其次,計(jì)算用戶(hù)會(huì)話(huà)中的語(yǔ)義相似度,保證智能客服對(duì)各個(gè)語(yǔ)義相似度進(jìn)行精準(zhǔn)地區(qū)分;最后,糾正會(huì)話(huà)中的相似度詞匯,消除相似語(yǔ)句的識(shí)別誤差(如圖1所示)。根據(jù)以上方法,本文認(rèn)為,可以滿(mǎn)足用戶(hù)需求,為提高電力用戶(hù)的服務(wù)質(zhì)量創(chuàng)造條件[4]。
圖1 傳統(tǒng)電力客服會(huì)話(huà)系統(tǒng)Fig.1 Traditional electric customer service conversation system
會(huì)話(huà)的語(yǔ)義特征,表示會(huì)話(huà)互動(dòng)問(wèn)答的類(lèi)型。本文設(shè)計(jì)的智能客服重點(diǎn)在于:解決用戶(hù)的電力問(wèn)題,本文對(duì)會(huì)話(huà)語(yǔ)義特征結(jié)構(gòu)進(jìn)行提取,并作出說(shuō)明。語(yǔ)義特征分類(lèi)如表1所示。
表1 會(huì)話(huà)語(yǔ)義分類(lèi)特征Tab.1 Conversational semantic classification characteristics
問(wèn)題類(lèi)由用戶(hù)產(chǎn)生,用戶(hù)進(jìn)行信息咨詢(xún),答案類(lèi)對(duì)應(yīng)問(wèn)題類(lèi),由智能客服問(wèn)答系統(tǒng)提供,用于回答顧客問(wèn)題,問(wèn)題類(lèi)主要分兩種,一般問(wèn)句和議價(jià)的問(wèn)句。陳述類(lèi)只是簡(jiǎn)單的觀點(diǎn)陳述,因在信息咨詢(xún)中,地位處于次要,所以不對(duì)其進(jìn)行更深層的處理。陳述類(lèi)目的多樣,無(wú)明確問(wèn)答關(guān)系,主要為情感或者觀點(diǎn)的表述。反饋類(lèi)對(duì)應(yīng)稱(chēng)述類(lèi),由買(mǎi)賣(mài)雙方在肯定或者否定對(duì)方情感或者觀點(diǎn)產(chǎn)生,抑或者為虛擬詞,無(wú)明顯語(yǔ)義。祈使類(lèi)于買(mǎi)賣(mài)雙方請(qǐng)求或者要求對(duì)方產(chǎn)生某種動(dòng)作時(shí)產(chǎn)生,招呼類(lèi)產(chǎn)生于問(wèn)答開(kāi)始前相互致意或者問(wèn)答結(jié)束時(shí)雙方表示感謝,其他為噪聲類(lèi),主要為軟件自動(dòng)答復(fù)類(lèi)問(wèn)題,或者嚴(yán)重偏離主題的對(duì)話(huà)內(nèi)容。
由表1可知,本文設(shè)計(jì)的會(huì)話(huà)語(yǔ)義分類(lèi)中,需要智能客服認(rèn)可相關(guān)語(yǔ)義,進(jìn)而識(shí)別、理解整個(gè)電力通話(huà)過(guò)程中的問(wèn)題。本文設(shè)計(jì)的方法中,用戶(hù)發(fā)送的問(wèn)題,均會(huì)有一個(gè)相對(duì)應(yīng)的答案,這個(gè)答案是通過(guò)智能客服對(duì)上下文的聯(lián)系,得出相關(guān)答案。通過(guò)分類(lèi)不同類(lèi)型的會(huì)話(huà)語(yǔ)義特征,可以提高智能客服識(shí)別電力問(wèn)題的能力,進(jìn)而提高智能客服的識(shí)別能力[5]。
通過(guò)對(duì)會(huì)話(huà)語(yǔ)義的特征提取,基本可以提取出相似語(yǔ)義,進(jìn)而計(jì)算會(huì)話(huà)中的語(yǔ)義相似度[6-7]。智能客服對(duì)語(yǔ)義有著不同的理解,需要對(duì)其下達(dá)一個(gè)短語(yǔ)指令,使其可以在不依賴(lài)其他詞的情況下,了解用戶(hù)提出的會(huì)話(huà)含義。因此在本文設(shè)計(jì)中,設(shè)計(jì)了智能客服訓(xùn)練部分,訓(xùn)練智能客服的詞向量,如表2所示:
表2 智能客服訓(xùn)練的詞向量Tab.2 Word vector of smart customer service training
如表2所示,根據(jù)此電力詞向量的訓(xùn)練,基本可以得出電力語(yǔ)義相似度的詞量,計(jì)算公式如下:
式(1)中,sigmoid(x)為語(yǔ)義相似度系數(shù);e-x為相似詞向量?;诖说贸龅暮瘮?shù)關(guān)系如圖2所示。
圖2 電力詞匯Sigmoid函數(shù)圖像Fig.2 Image of Sigmoid function of power vocabulary
由圖2可知,電力詞匯Sigmoid函數(shù)圖像可歸一化到處理語(yǔ)義相似度,在[0.1-0.3]范圍內(nèi),相似的語(yǔ)義判別效果較好。在[0.4-0.6]范圍內(nèi),語(yǔ)義相似度的判定能力較弱。
基于語(yǔ)義相似度計(jì)算,本文將糾正相似度詞匯分為兩部分。(1)相似電力文本預(yù)處理層,包括電力詞匯的校正。集中的句子一般會(huì)成對(duì)出現(xiàn),語(yǔ)義相近的詞匯分別用Sentence L和Sentence S表示。為了減少相似詞匯對(duì)智能客服的影響,本文通過(guò)分類(lèi)校正方式,校正電力詞匯結(jié)果。在糾正的電力詞向量表中,每個(gè)詞對(duì)應(yīng)一個(gè)64維的電力詞向量,通過(guò)電力詞向量表,找到與其相對(duì)應(yīng)的糾正答案[8]。(2)將電力詞向量輸入到智能客服的系統(tǒng)中,根據(jù)電力詞匯的語(yǔ)義差異,將兩個(gè)電力詞匯合并,進(jìn)而糾正相似度詞匯,進(jìn)一步提高電力智能客服的識(shí)別能力[9]。
本次實(shí)驗(yàn)的數(shù)據(jù)集采用某電力公司提供的智能客服數(shù)據(jù)集,此數(shù)據(jù)集中共有5082對(duì)英文句子,分為相似語(yǔ)義與不相似語(yǔ)義兩類(lèi),即為正負(fù)樣本,正樣本3902對(duì),負(fù)樣本1900對(duì)。此數(shù)據(jù)集是根據(jù)網(wǎng)絡(luò)收集,包括電力熱點(diǎn)話(huà)題,驗(yàn)證本文設(shè)計(jì)的智能客服正確復(fù)述效果。
本文對(duì)電力智能客服的會(huì)話(huà)進(jìn)行采樣,采樣得出樣本30492對(duì),其中正負(fù)樣本數(shù)保持不變,按照6∶1的方式劃分采樣樣本,分別提取出5082對(duì)英文句子,將這類(lèi)句子列為測(cè)試集,并打亂順序,剩余部分組成訓(xùn)練集,得出樣本數(shù)據(jù)集的劃分如表3所示。
表3 數(shù)據(jù)集劃分表Tab.3 Data set partition table
如表3所示,將數(shù)據(jù)集劃分為訓(xùn)練集與測(cè)試集,測(cè)試集即為本文的被測(cè)樣本,訓(xùn)練集為訓(xùn)練樣本。據(jù)此設(shè)置的實(shí)驗(yàn)參數(shù)如表4所示。
如表4所示,為本次實(shí)驗(yàn)的基本參數(shù),實(shí)驗(yàn)指標(biāo)包括實(shí)驗(yàn)環(huán)境、批次、實(shí)驗(yàn)輪次、詞向量維度、激活函數(shù)、損失函數(shù)、優(yōu)化器。根據(jù)此指標(biāo),設(shè)置相應(yīng)函數(shù),帶入到實(shí)驗(yàn)中,得出結(jié)果如下[10]。
表4 實(shí)驗(yàn)基本參數(shù)Tab.4 Basic parameters of the experiment
將5082個(gè)測(cè)試樣本通過(guò)測(cè)試集,最終定位64位詞向量,分為6輪次得到傳統(tǒng)技術(shù)與本文設(shè)計(jì)技術(shù)的復(fù)述次數(shù),結(jié)果如表5所示。
表5 兩種技術(shù)復(fù)述次數(shù)結(jié)果Tab.5 Results of the number of repetitions of the two technologies
如表5所示,經(jīng)過(guò)6輪次的實(shí)驗(yàn),在兩種智能客服的總復(fù)述次數(shù)相同的條件下,傳統(tǒng)客服正確復(fù)述次數(shù)與總復(fù)述次數(shù)相差200-2000條,復(fù)述效果差,識(shí)別能力相應(yīng)下降;而本文設(shè)計(jì)的智能客服正確復(fù)述次數(shù)與總復(fù)述次數(shù)相差僅在0-10條左右,復(fù)述效果更佳,識(shí)別能力較強(qiáng),符合本文研究目的。
近年來(lái),網(wǎng)絡(luò)的興起,不僅帶給人們新的音視頻觀感,并且?guī)?dòng)智能化的發(fā)展,使智能化逐漸滲透進(jìn)各個(gè)領(lǐng)域。由于傳統(tǒng)客服識(shí)別效果不佳,導(dǎo)致客服行業(yè)與人們的矛盾增加。因此本文設(shè)計(jì)了電力智能客服實(shí)現(xiàn)技術(shù),提取電力會(huì)話(huà)語(yǔ)義特征,對(duì)會(huì)話(huà)語(yǔ)義進(jìn)行相似度計(jì)算,糾正了智能會(huì)話(huà)相似詞匯,提高智能客服識(shí)別電力問(wèn)題的能力。采用某電力公司提供的智能客服數(shù)據(jù)集進(jìn)行對(duì)比分析,驗(yàn)證了本文設(shè)計(jì)的智能客服正確復(fù)述效果,為電力智能化發(fā)展創(chuàng)造價(jià)值。