鐘立華 趙海強 陳思民
摘 要:在線識別是現(xiàn)今使用率最高的語音識別方式,只占用小小的存儲空間,就能實現(xiàn)大數(shù)據(jù)的語音識別功能。本文借助微信公眾平臺的語音識別引擎設(shè)計并制作了一款語音機器人,經(jīng)驗證具有良好的性能,如能實現(xiàn)產(chǎn)品化,將具有重大的市場價值。
關(guān)鍵詞:語音識別 機器人 微信公眾平臺
中圖分類號:TP393 文獻標識碼:A 文章編號:1672-3791(2018)01(c)-0019-02
Abstract: The on-line identification is nowadays the highest utilization way of speech recognition, only take up the small storage space, can achieve large data of speech recognition.In this paper, with the aid of WeChat public speech recognition engine platform was designed and built a robot voice, verified and has good performance.If you can realize the transition, will have great market value.
Key Words: Speech recognition; Robot; WeChat public platform
現(xiàn)階段的語音識別技術(shù),主要分為在線識別、離線識別和離在線混合識別三種識別方式[1]??梢哉f它們各有千秋,而在線識別是現(xiàn)今使用率最高的語音識別方式[2]。在微信公眾平臺中也有一套相當出色并支持在線識別的語音識別引擎,本文借助該套語音識別引擎完成了語音機器人的核心部分,整體框架如圖1所示。
微信用戶可以通過手機、電腦的微信終端向微信公眾平臺發(fā)送語音信息,該信息通過微信服務(wù)器調(diào)用微信語音識別高級接口進行語音識別,并且把所得的識別結(jié)果轉(zhuǎn)發(fā)到該公眾平臺開發(fā)者的服務(wù)器上,服務(wù)器可在接收到信息后,提取識別結(jié)果,再將識別結(jié)果上傳到機器人服務(wù)器。機器人服務(wù)器根據(jù)上傳的信息,在大數(shù)據(jù)庫中配對出最佳的回復(fù)結(jié)果并將結(jié)果響應(yīng)給開發(fā)者服務(wù)器。服務(wù)器再把所得的回復(fù)結(jié)果存儲至數(shù)據(jù)庫,等待語音機器人的請求。這時語音機器人只需要通過網(wǎng)絡(luò)向開發(fā)者服務(wù)器發(fā)送請求語音識別結(jié)果的請求,開發(fā)者服務(wù)器響應(yīng)請求后,提取數(shù)據(jù)庫中的機器人的回復(fù)結(jié)果,回調(diào)給機器人,機器人再將結(jié)果通過UART等通信方式發(fā)送給語音合成模塊,就能將機器人所做出的回答合成語音并輸出。因為客戶端會不間斷地向開發(fā)者服務(wù)器發(fā)送請求,所以為了不重復(fù)合成同樣結(jié)果的語音,必須保證每個語音識別結(jié)果,只對應(yīng)一次語音合成輸出。在傳輸結(jié)果的同時,會附帶上驗證實時性和一次性的驗證信息,語音合成模塊只會合成通過驗證的回復(fù)結(jié)果。
這樣設(shè)計的好處是,用戶既可以通過機器人本身的語音識別系統(tǒng)來進行語音的對話溝通,也可以通過微信公眾平臺發(fā)送語音信息,間接地與語音機器人進行語音對話。原因在于,機器人本身的語音識別系統(tǒng)詞匯量有限,識別率會隨著距離的增大而降低,極大地影響了用戶與機器人的交互體驗;而使用微信公眾平臺與機器人進行溝通,能夠無限地延長用戶與機器人的交互距離和提高語音的識別率,并且使用的是輕量級的語音識別,降低機器人對語音識別的運算負擔(dān),響應(yīng)速度極快,能夠提供更好的實時性語音對話。
另外這可以讓機器人更加具有創(chuàng)新性,一般的語音機器人只能進行一對一語音交流,很難滿足一對多的語音交流方式,而將機器人與微信公眾平臺的結(jié)合,能夠使得機器人有了一對多的交互模式,相當于給機器人添加了更多的耳朵去聆聽人們的心聲。這樣人們就能更好地去認識和了解這個機器人,借助互聯(lián)網(wǎng)的特性,機器人也能夠和廣大的粉絲進行互動。除了可以通過文本和語音的方式與機器人互動以外,還可以給機器人發(fā)送表情、圖片、小視頻、定位等,只要微信支持的功能,用戶都可以發(fā)送給機器人。機器人可以通過對表情、圖片等進行分析和理解后,回復(fù)相應(yīng)的文本、語音、表情或者圖片,甚至是音樂或者是視頻,可以逗你樂、陪你聊天、播報新聞、講笑話、講故事等。
此外,它還具有良好的擴展性和相當大的發(fā)展?jié)摿?。除了簡單的語音交互,在智能控制方面,還可以作為家居智能管家,幫助控制家里的每一個角落;在商業(yè)市場上,微信公眾平臺支持微商平臺和微信支付方式,為產(chǎn)品的銷售提供了極大的方便;并且語音機器人能夠充當大批的客服人員,節(jié)省人力成本,為客戶提供語音咨詢服務(wù),能夠更快、更好地解決用戶的問題。
語音機器人與微信公眾平臺有機地結(jié)合,能夠更好地擴展機器人的服務(wù)范圍和工作能力,賦予了機器人更多的功能和商業(yè)價值,刷新了更加智能的互聯(lián)網(wǎng)時代。
參考文獻
[1] 易偉.微信公眾平臺服務(wù)號開發(fā)[M].北京:機械工業(yè)出版社,2014.
[2] 閆小坤,周濤.微信公眾平臺開發(fā)基礎(chǔ)與實戰(zhàn)[M].北京:機械工業(yè)出版社,2014.