沈云輝,賴燕梅,何 娟
(1.廣東工業(yè)大學(xué)機(jī)電工程學(xué)院,廣州 510000;2.首都師范大學(xué)文學(xué)院北京100089;3.中山大學(xué)管理學(xué)院,廣州 510000)
云是一個(gè)資源池,它包含大量虛擬資源(硬件、開發(fā)平臺(tái)和I/O服務(wù)),用戶可以對(duì)這些資源進(jìn)行配置。這個(gè)資源池的調(diào)用通?;跍?zhǔn)時(shí)、收費(fèi)模式管理,它最顯著的特性是軟件即服務(wù)(SaaS)[1]。本文中機(jī)器人采用“機(jī)器人+云計(jì)算”模式,機(jī)器人的操作系統(tǒng)和數(shù)據(jù)庫部署在云端,它可以調(diào)用API來實(shí)現(xiàn)語音識(shí)別、人臉識(shí)別和語義識(shí)別。機(jī)器人的發(fā)展日新月異,人類不僅希望單個(gè)機(jī)器人能夠獨(dú)立完成高復(fù)雜度的任務(wù),也希望機(jī)器人能夠合作完成任務(wù)。多機(jī)器人協(xié)調(diào)在智能農(nóng)業(yè)、搜救、運(yùn)輸?shù)阮I(lǐng)域得到了廣泛地應(yīng)用[2]。此外,云機(jī)器人和自動(dòng)化研究[3]為多機(jī)器人協(xié)調(diào)在客戶服務(wù)中的應(yīng)用提供了現(xiàn)實(shí)的可能性。
本文將重點(diǎn)關(guān)注商業(yè)客戶服務(wù),重點(diǎn)介紹多機(jī)器人協(xié)作對(duì)客戶服務(wù)的貢獻(xiàn)。在商業(yè)交易過程中,商場(chǎng)服務(wù)機(jī)器人充當(dāng)購物助手,這些機(jī)器人可以利用云服務(wù)技術(shù)實(shí)現(xiàn)信息的共享。機(jī)器人還可以收集顧客的信息,判斷他們對(duì)商品的喜好,然后給顧客及時(shí)有效的建議。該技術(shù)將有助于為客戶提供個(gè)性化服務(wù)。同時(shí),多機(jī)器人協(xié)作的應(yīng)用也為傳統(tǒng)商店的轉(zhuǎn)型以及傳統(tǒng)商店的體驗(yàn)與電子商務(wù)功能相結(jié)合提供了一些可能性[4]。
機(jī)器人的協(xié)同通常分為合作協(xié)同和競(jìng)爭(zhēng)協(xié)同。合作協(xié)同是建立在分工的基礎(chǔ)上的,通過對(duì)任務(wù)的分工,將群體機(jī)器人分為若干個(gè)子群。根據(jù)協(xié)同方式進(jìn)一步細(xì)化為合作協(xié)作和競(jìng)爭(zhēng)協(xié)同[5]。競(jìng)爭(zhēng)協(xié)同則是通過允許多個(gè)機(jī)器人擁有同一個(gè)任務(wù)或目標(biāo),建立承包機(jī)制。
隨著近年許多研究者將研究重點(diǎn)轉(zhuǎn)移到如何使多機(jī)器人更好地進(jìn)行協(xié)調(diào)的研究上,多機(jī)器人系統(tǒng)和多移動(dòng)機(jī)器人系統(tǒng)(MRSs)的研究在規(guī)模和重要性上都有很大的提高[6]。而當(dāng)許多機(jī)器人一起工作,通信往往受到網(wǎng)絡(luò)的限制,杰弗里·霍林格[7]和桑吉夫·辛格證明即時(shí)協(xié)調(diào)的滾動(dòng)規(guī)劃可以包含周期性約束,從而使與需要連續(xù)連接的算法相比有了顯著的改進(jìn),并為機(jī)器人提供一個(gè)實(shí)現(xiàn)更好地實(shí)時(shí)信息交換的基礎(chǔ)。近年來,在機(jī)器人的發(fā)展中,關(guān)于機(jī)器人的協(xié)同控制實(shí)驗(yàn),曹永康等[8]人通過結(jié)合理論在多輪式移動(dòng)機(jī)器人平臺(tái)上進(jìn)行應(yīng)用分布式協(xié)作控制策略,探索分布式共識(shí)算法的有效性,同時(shí)避免了集中式協(xié)同控制方案易受通信范圍和帶寬限制以及對(duì)團(tuán)隊(duì)領(lǐng)導(dǎo)或集中站的干擾,不能擴(kuò)展到團(tuán)隊(duì)中的所有機(jī)器人的弊端[8]。在最新的研究中,關(guān)于如何將多機(jī)器人彼此協(xié)同共識(shí)控制問題上,傅勤等[9]將Lyapunov泛函方法應(yīng)用于具有分布參數(shù)模型的多智能體系統(tǒng),并在適當(dāng)?shù)腟obole空間上解決這種多智能體系統(tǒng)的共識(shí)控制問題,進(jìn)一步為機(jī)器人的協(xié)同工作方向打下基礎(chǔ)。
本文所涉及的客戶服務(wù)是人工智能客戶服務(wù)。人工智能客戶服務(wù)是指機(jī)器人通過語音與客戶進(jìn)行溝通,記住客戶的記錄,通過語義分析了解用戶的意圖,與用戶進(jìn)行友好的溝通,為客戶提供必要的客戶信息和其他相關(guān)服務(wù)所需的信息。人工智能客服是針對(duì)客戶需求的創(chuàng)新服務(wù)。
基于多機(jī)器人協(xié)作方法的客戶服務(wù)系統(tǒng)框架如圖1所示。包括組織層、客戶端層、應(yīng)用層、公有云服務(wù)層和私有云服務(wù)層、場(chǎng)景分類層和交互信息共享層。
圖1 多機(jī)器人協(xié)同系統(tǒng)結(jié)構(gòu)圖
組織層包括企業(yè)、商店和酒店,以及為公眾提供服務(wù)的醫(yī)院和政府機(jī)構(gòu)??蛻舳藢邮墙M織層的客戶。應(yīng)用場(chǎng)景分類層的功能是通過客戶端與機(jī)器人之間的對(duì)話記錄來區(qū)分對(duì)話場(chǎng)景。組織(機(jī)器人所有者)可以根據(jù)所屬行業(yè)為機(jī)器人選擇場(chǎng)景。例如,商店選擇的交互場(chǎng)景是購物,酒店選擇的交互場(chǎng)景是酒店。當(dāng)對(duì)話場(chǎng)景確定后,機(jī)器人的交互狀態(tài)將切換到相應(yīng)的場(chǎng)景狀態(tài)模式,提高語義識(shí)別程度,優(yōu)化交互體驗(yàn)。應(yīng)用層主要描述了那些機(jī)器人的協(xié)同方法??紤]到場(chǎng)景的分類,機(jī)器人會(huì)根據(jù)場(chǎng)景的知識(shí)庫與客戶進(jìn)行溝通。機(jī)器人通過與其他機(jī)器人共享云數(shù)據(jù)庫,保存客戶的信息,包括客戶的人臉或聲紋,以及每次與客戶交互的交互狀態(tài)。例如,如果一個(gè)人與機(jī)器人A進(jìn)行了交流,然后這個(gè)人遇到了機(jī)器人B。當(dāng)機(jī)器人B在另一個(gè)地方識(shí)別到這個(gè)人的人臉或者聲音信息時(shí),機(jī)器人B會(huì)首先識(shí)別出這個(gè)人。機(jī)器人B會(huì)下載他與機(jī)器人A通信時(shí)生成的數(shù)據(jù)。在分析他和其他機(jī)器人的交互信息的基礎(chǔ)上與他展開對(duì)話。
為了清晰描述數(shù)據(jù)在機(jī)器人之間的傳遞和狀態(tài)的繼承,本文提出的框架數(shù)據(jù)流程如圖2所示。圖中,顧客A分別與2個(gè)不同的機(jī)器人交流如何到達(dá)酒店??蛻鬉首先與機(jī)器人B溝通。機(jī)器人B收到客戶的問題,通過步驟B1和B2得到答案。最后,機(jī)器人B給出了客戶A的答案,同時(shí)通過步驟D1和D2保存客戶的口語對(duì)話狀態(tài)和數(shù)據(jù)。一段時(shí)間后,客戶A遇到了機(jī)器人C,機(jī)器人C獲得機(jī)器人B的口語對(duì)話狀態(tài)以及在識(shí)別到客戶A身份ID后從云服務(wù)獲得客戶數(shù)據(jù)。機(jī)器人C立即知道客戶要去酒店,即使客戶沒有告訴機(jī)器人C去酒店,機(jī)器人C會(huì)直接告訴客戶怎么去酒店。這樣縮短了客戶端A獲取目標(biāo)信息的交互時(shí)間。交互信息共享機(jī)制是一種機(jī)器人與商家之間管理信息的一種機(jī)制。特別地,他為每個(gè)組織(商家)提供1個(gè)帳戶和密碼來管理他們的數(shù)據(jù)。組織(商家)可以直接管理他們的信息是公開的還是只對(duì)他們自己開放。同時(shí),為了保證客戶信息的安全和隱私,未經(jīng)客戶允許,客戶的信息不會(huì)被保存。當(dāng)機(jī)器人保存客戶的面部數(shù)據(jù)時(shí),他會(huì)嘗試獲得客戶的許可,然后保存數(shù)據(jù)。公共云服務(wù)層一般是指Microsoft Azure、Amazon Web services等云服務(wù),均包括很多API。通過調(diào)用這些API來獲取人臉識(shí)別、語音識(shí)別等其它功能。云機(jī)器人不僅可以降低成本,還可以優(yōu)化資源分配。私有云服務(wù)是存儲(chǔ)和管理商家和客戶的信息,通過機(jī)器人合作系統(tǒng)的配合為客戶提供個(gè)性化的服務(wù)。當(dāng)用戶與機(jī)器人交互時(shí),獲得用戶的許可后,將信息保存到云端,包括用戶的身份ID、聊天記錄、購物信息、位置等。同時(shí),如果商家需要,還可以將商店中出售的商品、折扣促銷信息、組織位置等信息保存在私有云中。在與客戶溝通時(shí),機(jī)器人可以根據(jù)客戶的歷史購買記錄推薦相關(guān)產(chǎn)品或配件產(chǎn)品。如果機(jī)器人屬于同一個(gè)商業(yè)圈(聯(lián)盟),他們可以提出互補(bǔ)或相關(guān)的產(chǎn)品建議。
圖2 多機(jī)器人協(xié)同框架工作流程圖
多機(jī)器人協(xié)作是一項(xiàng)應(yīng)用于機(jī)器人路徑規(guī)劃、搜索等其他領(lǐng)域的成熟技術(shù)。本文展示了多機(jī)器人協(xié)作在服務(wù)機(jī)器人中的應(yīng)用。正如語音交互機(jī)器人是基于云服務(wù)的,也是云機(jī)器人的一種。他們的系統(tǒng)和數(shù)據(jù)庫是共享的,因此機(jī)器人協(xié)作是會(huì)話狀態(tài)的連接和繼承。可以使用對(duì)話狀態(tài)跟蹤技術(shù)。早期口語對(duì)話系統(tǒng)使用提前制定的規(guī)則[10],這種技術(shù)的優(yōu)點(diǎn)是,它不依賴于大量的數(shù)據(jù)來實(shí)現(xiàn),只提供規(guī)則就可以不斷改善,但它依賴于大量的人力且應(yīng)用范圍是非常狹窄的。隨后,在對(duì)話狀態(tài)跟蹤中使用生成模型[11],通過對(duì)收集到的對(duì)話行為和潛在意圖進(jìn)行統(tǒng)計(jì)分析,可以得到上下文。與生成模型不同,對(duì)話狀態(tài)跟蹤的判別模型通過時(shí)間遞歸神經(jīng)網(wǎng)絡(luò)(RNN)中的長(zhǎng)短期記憶(LSTM)選擇性地保留交互語料庫,提高了識(shí)別的準(zhǔn)確性[12]。
首先,對(duì)固定場(chǎng)景建立特殊的場(chǎng)景模型。場(chǎng)景模型包含場(chǎng)景的獨(dú)有特征,這些特征設(shè)置成像插槽一樣。例如,機(jī)票購買的場(chǎng)景模型:對(duì)話狀態(tài)列出并編碼購票時(shí)間、購票號(hào)碼、購票數(shù)量、購票地點(diǎn),當(dāng)客戶查詢購票信息時(shí),機(jī)器人通過自動(dòng)語音識(shí)別(ASR)識(shí)別購票信息,然后通過使用自然語言工具包(NLTK)(一種自然語言預(yù)處理方案)進(jìn)行預(yù)處理生成的文本。機(jī)器人會(huì)根據(jù)設(shè)定的條件積極引導(dǎo)交互的詢問問題,像插槽一樣去填充場(chǎng)景模型所需的信息。因?yàn)闄C(jī)器人使用云操作系統(tǒng),當(dāng)客戶端I與機(jī)器人A通信并離開時(shí),交互不會(huì)消失,而是掛起(保存)并綁定到客戶的ID。所以當(dāng)客戶I再次和機(jī)器人對(duì)話時(shí),即使不是機(jī)器人A,假設(shè)是機(jī)器人B,那么機(jī)器人B就可以讀取上次客戶I和機(jī)器人A的數(shù)據(jù)并繼續(xù)對(duì)話。
本文提出的框架涉及到私有云中的許多不同信息,包括來自組織者例如商場(chǎng)、酒店、銀行等和用戶的信息。在隱私安全越來越受到重視的時(shí)代,如何做好個(gè)性化服務(wù)和信息安全是一個(gè)巨大的考驗(yàn)。本文所述的系統(tǒng)將根據(jù)對(duì)應(yīng)用戶的信息分別管理和存儲(chǔ)在每個(gè)組織者知識(shí)庫中,每個(gè)組織都有自己唯一的賬號(hào)和密碼管理,與此同時(shí),系統(tǒng)都有自己的客戶(組織者)操作終端,移動(dòng)電話應(yīng)用操作終端,可以隨時(shí)上傳和更新數(shù)據(jù)。這個(gè)知識(shí)庫的架構(gòu)如圖3所示。圖中,以酒店及商場(chǎng)的個(gè)性化知識(shí)構(gòu)建為例,有3種方法可以為數(shù)據(jù)源構(gòu)建知識(shí)庫。第1種方式是組織者使用終端(APP、Web)編輯和上傳私有數(shù)據(jù);第2種方法是從公有云服務(wù)導(dǎo)入通用數(shù)據(jù)。這2種方法可以準(zhǔn)確的添加大量的數(shù)據(jù),但是也有不足之處。第1種缺乏效率,第2種缺乏時(shí)效性。第3種是收集大量機(jī)器人和客戶的交互數(shù)據(jù),包括分詞后詞向量表達(dá)和詞性標(biāo)注,然后利用深度神經(jīng)網(wǎng)絡(luò)(DNN)對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練和處理,最后將分析結(jié)果上傳到云端。知識(shí)庫中存儲(chǔ)的數(shù)據(jù)主要基于服務(wù)數(shù)據(jù),商戶的信息是否可以被其他商戶訪問由信息提供者決定,從而保證商戶信息隱私,提高客戶服務(wù)水平。
圖3 構(gòu)建知識(shí)庫的工作流程
本文提出了一種基于多機(jī)器人協(xié)作方式的個(gè)性化客戶服務(wù)系統(tǒng),該系統(tǒng)有效地管理和使用了機(jī)器人信息、組織信息和客戶信息,同時(shí)保護(hù)了客戶和企業(yè)信息的隱私。在為客戶提供個(gè)性化服務(wù)和個(gè)性化推薦的同時(shí),也為企業(yè)節(jié)約了人力資源成本。同時(shí),個(gè)性化知識(shí)庫添加數(shù)據(jù)的方式有3種,為組織開展大數(shù)據(jù)分析提供有針對(duì)性的、實(shí)時(shí)的高數(shù)據(jù)源,為了解客戶和升級(jí)服務(wù)奠定了基礎(chǔ)。對(duì)話狀態(tài)跟蹤技術(shù)將機(jī)器人協(xié)作的方法應(yīng)用于語音交互服務(wù)領(lǐng)域,使客戶體驗(yàn)到不間斷的交互環(huán)境。這種互動(dòng)將完全與最后的互動(dòng)相聯(lián)系,在一定程度上消除了顧客與機(jī)器人之間機(jī)械的和不協(xié)調(diào)的互動(dòng)感。雖然機(jī)器人的語音識(shí)別正確率仍然不高,而且只是暫時(shí)支持在會(huì)場(chǎng)等嘈雜場(chǎng)所進(jìn)行單人對(duì)話。在未來,我們將嘗試設(shè)計(jì)機(jī)器人與多個(gè)交互對(duì)象交互,這樣機(jī)器人就可以同時(shí)與一群人交互。