[陸小慧 劉勇]
本文研究涉及人工智能范疇下的認(rèn)知智能里的一個(gè)子領(lǐng)域:智能問(wèn)答(Intelligent question and answer,IQA)技術(shù)領(lǐng)域。
智能問(wèn)答(IQA)系統(tǒng)基于語(yǔ)料來(lái)對(duì)用戶指令進(jìn)行分析處理。傳統(tǒng)機(jī)器人只能處理預(yù)先設(shè)定好的用戶指令,本研究引入智能問(wèn)答控制系統(tǒng),與用戶進(jìn)行語(yǔ)音交互,分析用戶語(yǔ)音,反饋并完成對(duì)應(yīng)的用戶指令,高效、科學(xué)地解決了現(xiàn)有機(jī)器人無(wú)法根據(jù)用戶指令進(jìn)行工作這一問(wèn)題。進(jìn)一步的,我們將該智能問(wèn)答控制系統(tǒng)模塊化,可以集成進(jìn)各類電氣設(shè)備中,賦予它們具有智能交互的能力。
智能問(wèn)答(IQA)是人工智能認(rèn)知智能范疇的一個(gè)子領(lǐng)域。具有人工智能的智能問(wèn)答系統(tǒng)以一問(wèn)一答形式,精確的定位用戶所需要的提問(wèn)知識(shí),通過(guò)與用戶進(jìn)行交互,為用戶提供個(gè)性化的信息服務(wù)。
比如,現(xiàn)有家用掃地機(jī)器人,沒(méi)有配置智能問(wèn)答系統(tǒng),只能根據(jù)全屋掃描后形成的繪制地圖工作。當(dāng)我們將具有本研究的人工智能智能問(wèn)答系統(tǒng)集成到掃地機(jī)器人后,掃地機(jī)器人可以對(duì)主人的語(yǔ)音指令進(jìn)行識(shí)別、反饋、執(zhí)行。如,主人要求:請(qǐng)將客廳打掃一下,那么掃地機(jī)器人識(shí)別后將會(huì)并且只會(huì)將客廳進(jìn)行打掃,而不會(huì)打掃其它房間。
比如,現(xiàn)有家政擦窗機(jī)器人,沒(méi)有配置智能問(wèn)答系統(tǒng),只能按照預(yù)定程序進(jìn)行工作。當(dāng)我們將具有本研究的人工智能智能問(wèn)答系統(tǒng)集成到擦窗機(jī)器人后,擦窗機(jī)器人可以對(duì)主人的語(yǔ)音指令進(jìn)行識(shí)別、反饋、執(zhí)行。如,主人要求:請(qǐng)將客廳窗戶擦3 遍,那么擦窗機(jī)器人識(shí)別后將會(huì)并且只會(huì)將客廳的窗戶擦掃3 遍,而不會(huì)處理其它任務(wù)。
比如,現(xiàn)有液晶顯示器,沒(méi)有配置智能問(wèn)答系統(tǒng),不能進(jìn)行任何智能操作。當(dāng)我們將具有本研究的人工智能智能問(wèn)答系統(tǒng)集成到液晶顯示器后,液晶顯示器可以對(duì)主人的語(yǔ)音指令進(jìn)行識(shí)別、反饋、執(zhí)行。如,主人要求:請(qǐng)你將亮度調(diào)高10 尼特,那么液晶顯示器識(shí)別后將會(huì)將亮度調(diào)高10 尼特。
比如,現(xiàn)有家用電冰箱,沒(méi)有配置智能問(wèn)答系統(tǒng),不能進(jìn)行任何智能操作。當(dāng)我們將具有本研究的人工智能智能問(wèn)答系統(tǒng)集成到電冰箱后,電冰箱可以對(duì)主人的語(yǔ)音指令進(jìn)行識(shí)別、反饋、執(zhí)行。如,主人要求:請(qǐng)你將速凍箱調(diào)低2 攝氏度,那么電冰箱識(shí)別后將會(huì)將速凍箱的溫度調(diào)低2 攝氏度。
問(wèn)答語(yǔ)句(Frequently Asked Questions,F(xiàn)AQ),即常用問(wèn)答對(duì),一個(gè)問(wèn)答語(yǔ)句由一個(gè)標(biāo)準(zhǔn)問(wèn)句和一個(gè)與之對(duì)應(yīng)的標(biāo)準(zhǔn)答句組成。
本文主要解決的技術(shù)問(wèn)題是:在傳統(tǒng)機(jī)器人或電氣設(shè)備中,引入或集成具有人工智能的智能問(wèn)答系統(tǒng)模塊;該系統(tǒng)模塊訓(xùn)練生成用戶問(wèn)答語(yǔ)句的指令和答案,并通過(guò)不斷的迭代訓(xùn)練以更匹配用戶的使用習(xí)慣。它能使得機(jī)器人或電氣設(shè)備能與用戶進(jìn)行語(yǔ)音交互的同時(shí),完成用戶指令的動(dòng)作。增強(qiáng)機(jī)器人或電氣設(shè)備處理用戶語(yǔ)音指令的能力,同時(shí)讓機(jī)器人或電氣設(shè)備顯得更加的人性化,提高用戶體驗(yàn)。
當(dāng)前,沒(méi)有其他方案支持靈活、方便地?cái)U(kuò)展機(jī)器人或電氣設(shè)備回答用戶指令與完成動(dòng)作的能力。
本文研究所述的方法包括一些元素,例如:智能問(wèn)答系統(tǒng)、語(yǔ)音控制、機(jī)器人或電器設(shè)備。
具有人工智能的智能問(wèn)答控制系統(tǒng)具體實(shí)施如圖1所示。
圖1 人工智能的智能問(wèn)答控制系統(tǒng)
語(yǔ)音采集和播放模塊:用于采集拾取用戶的語(yǔ)音,播放反饋結(jié)果語(yǔ)音。
智能問(wèn)答系統(tǒng):能夠?qū)⒂脩糨斎氲恼Z(yǔ)音與文字進(jìn)行識(shí)別和生成,基于文字語(yǔ)料來(lái)對(duì)用戶指令進(jìn)行分析、處理、反饋結(jié)果的系統(tǒng)。
接口:調(diào)用外部第三方系統(tǒng)的接口,以獲得相關(guān)的數(shù)據(jù)。
語(yǔ)音控制、智能問(wèn)答系統(tǒng)、機(jī)器人關(guān)系圖,如圖2 所示。
圖2 人工智能的智能問(wèn)答控制業(yè)務(wù)系統(tǒng)流程圖
智能問(wèn)答系統(tǒng)上下文關(guān)系如附圖3 所示。
圖3 智能問(wèn)答上下文關(guān)系圖
這當(dāng)中,數(shù)據(jù)層的語(yǔ)料庫(kù)是非常重要的基礎(chǔ)數(shù)據(jù),語(yǔ)料的來(lái)源有多種,如垂直爬蟲(chóng)爬取、人工維護(hù)錄入、數(shù)據(jù)廠家獲取、第三方開(kāi)放平臺(tái)接口等等。而具體到語(yǔ)料中的問(wèn)答語(yǔ)句,一個(gè)行業(yè)的問(wèn)答語(yǔ)句的數(shù)量并不算多,一般在200~500 條之間。這些問(wèn)答語(yǔ)句都有相對(duì)固定的答案,可以解答基礎(chǔ)的業(yè)務(wù)問(wèn)題。同時(shí),在智能問(wèn)答系統(tǒng)中內(nèi)置應(yīng)用程序,調(diào)用外部第三方的接口,解答差別化的業(yè)務(wù)問(wèn)題。
本文研究的關(guān)鍵點(diǎn)在于利用智能問(wèn)答系統(tǒng)擴(kuò)展機(jī)器人接收動(dòng)作指令的能力。同時(shí)利用智能問(wèn)答系統(tǒng),讓機(jī)器人既可以與用戶語(yǔ)音交互,又能完成指令動(dòng)作。
本文研究是利用智能問(wèn)答系統(tǒng)來(lái)擴(kuò)展傳統(tǒng)機(jī)器人或電氣設(shè)備完成動(dòng)作的能力。
操作步驟如下:
(1)智能問(wèn)答系統(tǒng)對(duì)用戶指令轉(zhuǎn)成文字,進(jìn)行語(yǔ)義理解;
(2)智能問(wèn)答系統(tǒng)根據(jù)語(yǔ)義生成對(duì)應(yīng)的答案,并轉(zhuǎn)化成語(yǔ)音,機(jī)器人與用戶完成語(yǔ)音交互;
(3)通過(guò)答案匹配到對(duì)應(yīng)的執(zhí)行指令,發(fā)送給機(jī)器人或電氣設(shè)備,機(jī)器人或電氣設(shè)備完成動(dòng)作。
(4)對(duì)于不在語(yǔ)料庫(kù)里但合理的用戶請(qǐng)求,智能問(wèn)答系統(tǒng)會(huì)對(duì)用戶請(qǐng)求按照關(guān)鍵字進(jìn)行歸一化處理,以適配機(jī)器人或電氣設(shè)備已有能力。如果指令不在機(jī)器人或電氣設(shè)備工作能力范圍,則反饋無(wú)法執(zhí)行用戶指令并請(qǐng)用戶重新下達(dá)請(qǐng)求。
(5)當(dāng)智能問(wèn)答系統(tǒng)對(duì)用戶指令轉(zhuǎn)成文字失敗,會(huì)提請(qǐng)用戶再說(shuō)一次,或者請(qǐng)用戶換個(gè)方式說(shuō)出指令,或者提醒用戶怎么說(shuō)出(智能問(wèn)答系統(tǒng)可以預(yù)設(shè)一些提問(wèn)給用戶作為參考)。
(6)機(jī)器人或電氣設(shè)備和用戶可以進(jìn)行頻繁交互,完成用戶的指令,提高用戶體驗(yàn)。
顯而易見(jiàn)的,對(duì)照現(xiàn)有技術(shù),本文研究可以使得傳統(tǒng)機(jī)器人或電氣設(shè)備能夠有較大幅度提升用戶體驗(yàn)。同時(shí)讓機(jī)器人或電氣設(shè)備顯得更加的人性化。業(yè)內(nèi)沒(méi)有類似的解決方案。
實(shí)例:家用掃地機(jī)器人場(chǎng)景,帶定位功能
步驟1,對(duì)掃地機(jī)器人進(jìn)行命名,如:小興,綁定其唯一設(shè)備ID;
步驟2,增加問(wèn)答語(yǔ)句,如:全屋打掃,綁定預(yù)設(shè)全屋打掃指令001;
步驟3,增加問(wèn)答語(yǔ)句,如:廚房——好的,綁定機(jī)器人區(qū)域打掃指令002;
步驟4,增加問(wèn)答語(yǔ)句,如:客廳——好的,綁定機(jī)器人區(qū)域打掃指令003;
步驟5,用戶說(shuō):小興,把家里打掃一下。智能系統(tǒng)完成用戶語(yǔ)音轉(zhuǎn)文字,并找到問(wèn)答語(yǔ)句,完成文字轉(zhuǎn)語(yǔ)音,機(jī)器人回答:全部打掃嗎?用戶說(shuō):是的。智能系統(tǒng)完成用戶語(yǔ)音轉(zhuǎn)文字,并找到問(wèn)答語(yǔ)句,完成文字轉(zhuǎn)語(yǔ)音,機(jī)器人回答:好的,并完成指令001,全屋打掃。
步驟6,用戶說(shuō):小興,把家里打掃一下。智能系統(tǒng)完成用戶語(yǔ)音轉(zhuǎn)文字,并找到問(wèn)答語(yǔ)句,完成文字轉(zhuǎn)語(yǔ)音,機(jī)器人回答:全部打掃嗎?用戶說(shuō):打掃客廳。智能系統(tǒng)完成用戶語(yǔ)音轉(zhuǎn)文字,并找到問(wèn)答語(yǔ)句,完成文字轉(zhuǎn)語(yǔ)音,機(jī)器人回答:好的,并完成指令003,打掃客廳。
說(shuō)明:可持續(xù)維護(hù)問(wèn)答語(yǔ)句,并綁定指令,注意:指令必須是機(jī)器人能識(shí)別的指令。
傳統(tǒng)機(jī)器人或電氣設(shè)備,只能處理預(yù)先設(shè)定好的用戶指令。
本文研究了一種系統(tǒng),在傳統(tǒng)機(jī)器人或電氣設(shè)備中引入或集成具有人工智能的智能問(wèn)答系統(tǒng)模塊;該系統(tǒng)模塊訓(xùn)練生成用戶問(wèn)答語(yǔ)句的指令和答案,并通過(guò)不斷的迭代訓(xùn)練以更匹配用戶的使用習(xí)慣。它能使得機(jī)器人或電氣設(shè)備能與用戶進(jìn)行語(yǔ)音交互的同時(shí),完成用戶指令的動(dòng)作。這樣,增強(qiáng)了機(jī)器人或電氣設(shè)備處理用戶語(yǔ)音指令的能力,同時(shí)讓機(jī)器人或電氣設(shè)備顯得更加的人性化,提高用戶體驗(yàn)。