張 靖,方 銳,周 婕,張 迪
(國網(wǎng)安徽省電力有限公司信息通信分公司,安徽合肥 230000)
當前,電力公司的營銷服務主要包括95598 電話、掌上電力、電e 寶、微信公眾號與營業(yè)廳現(xiàn)場等多種方式[1-5]。其中線下服務渠道人員成本較高,且服務范圍有限;而線上服務渠道僅限于客戶業(yè)務的線上自助辦理,故無法提供實時在線的人工客服功能。以某省公司為例,該省營銷服務中心的人工客服坐席有20 余人,服務方式仍為線上通話,基本可滿足話務需求。但其一對一的服務模式不僅時效性較差,且還無法提供圖片等多媒體交互方式[6-11]。隨著線上咨詢工單數(shù)量的迅速增加,現(xiàn)有客服人員的規(guī)模與工作模式已難以滿足客戶日益增長的服務訴求。因此,亟需增加多元化的在線互動服務模式。即通過拓展文字、圖片等交互手段來實現(xiàn)一對多的服務方式,進而提高人工坐席的工作效率,并提升客服人員的服務質(zhì)量。
知識圖譜(Knowledge Graph)是實現(xiàn)電力服務智能化中智能問答及搜索的關鍵技術。該技術是一種由節(jié)點和邊組成的語義網(wǎng)絡,其特點是規(guī)模龐大、數(shù)據(jù)稀疏,還可根據(jù)系統(tǒng)需求不斷增長數(shù)據(jù)量。因此,如何實現(xiàn)大規(guī)模的數(shù)據(jù)存儲,并在海量噪聲數(shù)據(jù)下完成對知識圖譜的查詢是智能化服務的關鍵。該文基于知識圖譜設計了線上電力服務系統(tǒng),同時對其數(shù)據(jù)存儲架構設計、查詢方法進行了深入研究。
文中基于軟件工程理論的指導進行了系統(tǒng)設計。在該理論下,需要通過詳細的需求分析將系統(tǒng)的相關功能轉(zhuǎn)化為軟件技術可實現(xiàn)的模塊。
根據(jù)前期調(diào)研,參與電力智能化服務業(yè)務的人員主要可分為三類,其各自的角色定義如表1所示。
表1 智能化服務的角色定義
為實現(xiàn)電力服務的智能化,設計了系統(tǒng)功能模塊,具體如圖1 所示。
圖1 系統(tǒng)功能模塊設計
各模塊的功能如下:
1)在線服務接入
該模塊主要用于實現(xiàn)在線會話流程的創(chuàng)建、會話服務的分派與人工服務的接入等。同時還可智能化判斷客戶接入的優(yōu)先級,并完成對客戶排隊策略的控制,從而進行智能化的服務引導。
2)人工交互管理
該模塊主要負責線上人工服務對接與在線業(yè)務受理。具體服務包括智能識別用戶需求、實現(xiàn)會話控制和及時完成在線交互等。此外其還能為客戶提供智能化的問答內(nèi)容推薦,并進行服務指導。最終,再根據(jù)用戶的需求完成電力報修、工單生成等服務。
3)知識圖譜管理
該模塊是實現(xiàn)系統(tǒng)智能化的核心模塊。文中依據(jù)電網(wǎng)運行、用電服務過程中積累的結構化或非結構化數(shù)據(jù)進行規(guī)律性組織,進而構建知識圖譜并輔助客服人員對線上業(yè)務加以辦理。在該模塊中,首先需完成知識圖譜的建模,包括概念定義、屬性定義及關系規(guī)約的建立;其次,進行結構化數(shù)據(jù)的架構,實現(xiàn)知識圖譜的高效存儲;最后,實現(xiàn)對知識圖譜的模糊、精準、關聯(lián)及推薦等多維度搜索。
4)系統(tǒng)支撐管理
該模塊主要實現(xiàn)對系統(tǒng)運行狀態(tài)、數(shù)據(jù)、服務及告警的智能化監(jiān)控;并對系統(tǒng)的運行參數(shù)、用戶權限等進行設置與管理??蛻羰褂么四K能夠查詢用戶信息、用電量、電費、繳費記錄及停電公告等。
該文基于FastDFS 文件系統(tǒng)實現(xiàn)了知識圖譜的分布式存儲,而如何快速、有效地完成知識圖譜查詢是提升電力服務系統(tǒng)效率的關鍵。因此,文中引入了一種分布式知識圖譜查詢的方法[12-13]。
知識圖譜的本質(zhì)是一張具備頂點標簽的實體網(wǎng)絡,在FastDFS 文件系統(tǒng)上,通過圖的數(shù)據(jù)結構進行存儲。因此,知識圖譜的查詢可轉(zhuǎn)化為數(shù)學中的子圖匹配問題[14-15]。首先,以無向圖表示知識圖譜過程的表達式如下:
式中,v、u表示知識圖譜的頂點,V、E、T和L分別是頂點、邊、頂點類型與標簽類型的集合。記全量的知識圖譜、查詢的子圖分別為G=(VG、EG、T、L)和Q=(VQ、EQ、T、L)。
在查詢過程中,還需定義Q、G之間的相似度。則此時需引入鄰域向量:
式中,q∈V,m為Q的頂點個數(shù)。φQ的計算方式如下:
式中,lu,v是兩個頂點間的最短路徑長度,nu,v則是最短路徑的數(shù)量,α為取值在[0,1]之間的調(diào)節(jié)因子。
基于式(2)的定義,對于查詢頂點qi,可得到其與匹配頂點鄰域向量間的相似度:
其中,f是圖的一個嵌入。而Θ 的定義方式如下:
圖2 給出了算法對于圖譜的查詢示意,已知Q找到了兩個嵌入f1和f2。通過式(2)的鄰域計算與式(4)相似度對比,得到f1(q3)為更優(yōu)匹配點。
圖2 查詢圖與查詢結果
為避免采用枚舉法(Enumeration Method)來求解子圖匹配的問題,該文對每個待搜索的頂點均進行了篩選,并在G中提取高質(zhì)量頂點,以縮小搜索空間。對于嵌入f,將其代價C分解可得:
文中設計的電力服務系統(tǒng)預計用戶規(guī)模為2 500 萬,并根據(jù)通用估算公式:并發(fā)數(shù)=(用戶總量/統(tǒng)計時間)×影響因子=(25 000 000/(8×60×60))×1≈868,估算出系統(tǒng)的并發(fā)用戶量約為1 000 個。因此,服務系統(tǒng)的知識圖譜建設需求如表2 所示。
表2 系統(tǒng)建設需求
經(jīng)前期的數(shù)據(jù)庫設計,知識圖譜共包含84 張數(shù)據(jù)表,涉及795 個字段。其中包括了電力服務的知識、問題與素材等數(shù)據(jù),后續(xù)每年的增長量為110 GB。為滿足上述需求,并保證知識圖譜的存儲、查詢及擴增效率,采用分布式的文件架構FastDFS 實現(xiàn)存儲,具體架構如圖3 所示[16]。
圖3 系統(tǒng)硬件架構
根據(jù)FastDFS 架構,系統(tǒng)中部署了3 臺追蹤服務器(Tracker)并開啟22122 端口偵聽,進而保證客戶端(Client)可通過專用的API 接口找到對應的存儲服務器(Storage)。同時,還使用了9 臺Storage 來保存知識圖譜的元數(shù)據(jù)。且將這9 臺Storage 分成3 個集群(Group),每個集群有3 臺Storage。所有的Storage 均默認開啟23000 端口以監(jiān)聽服務端請求。此外Storage 及Tracker 的單機配置一致,具體如表3 所示。
表3 單臺服務器配置
系統(tǒng)實現(xiàn)時,其他相關技術參數(shù)如表4 所示。
表4 知識圖譜管理后臺技術實現(xiàn)參數(shù)
在系統(tǒng)實現(xiàn)后,需對上文知識圖譜查詢方法的查找效率進行驗證。文中使用RDF-3X、NESS 算法與該文方法進行對比,算法的相關特性對比如表5所示。
表5 3種算法相關特性對比
從表中可以看出,相較于現(xiàn)有算法,該文算法可完全支持知識圖譜的近似匹配,且對于數(shù)據(jù)的組織形式要求也較低,故其應用場景更為廣泛。在進行查詢測試時,結合電力服務場景設計了100 個查詢實例,測試結果如表6 所示。
表6 查詢測試結果
從表中可以看出,3 種算法的匹配精度在相同空間復雜度下基本一致,但該文算法相較RDF-3X、NESS 分別提升了0.88%及1.71%。該文算法的提升主要體現(xiàn)在知識圖譜的查詢效率上,相較于RDF-3X和NESS算法,用時分別降低了85.59%和73.71%。
最后,對系統(tǒng)數(shù)據(jù)庫后臺的相關性能進行了普通黑盒測試和業(yè)務高峰下的壓力實驗,結果如表7所示。
表7 壓力測試結果
作為對比,該文通過斷開部分Storage 和Tracker間的通信,來模擬采用集中式存儲文件系統(tǒng)的SQL響應和知識圖譜查詢時間,具體結果如表8 所示。
表8 集中式存儲文件系統(tǒng)的測試結果
根據(jù)表7、8 可知,該文算法采用分布式存儲對系統(tǒng)的數(shù)據(jù)架構優(yōu)化后,在業(yè)務高峰時期,系統(tǒng)數(shù)據(jù)庫的SQL 平均響應時間從22.3 s 降低到9.3 s,降低了58.3%;知識圖譜的查詢時間從26.2 s 降低到2.18 s,降低了91.7%。
該文以提升電力營銷服務的智能化水平為目的,整合現(xiàn)有的營銷服務體系,設計了電力服務平臺。文中對知識圖譜的存儲、查詢兩項關鍵技術進行了研究,保障了系統(tǒng)在高并發(fā)下的運行效率和后期數(shù)據(jù)增長的可擴展性。系統(tǒng)的設計和實現(xiàn)可以進一步提高電力公司業(yè)務辦理效率,提升服務管控水平。