伍玉 毛明海
摘要
語音識別的救援機(jī)器人聽覺導(dǎo)航系統(tǒng),為救援工作提供了非常大的幫助作用,尤其是在火災(zāi)救援中,可彌補(bǔ)其它傳感器的缺陷。因此,本文針對語音識別的救援機(jī)器人聽覺導(dǎo)航方法做出了進(jìn)一步探究,希望救援機(jī)器人聽覺導(dǎo)航系統(tǒng)能夠在救援中發(fā)揮更大的價值作用。
【關(guān)鍵詞】語音識別 救援機(jī)器人 聽覺 導(dǎo)航
在有地震以及火災(zāi)發(fā)生之后,最迫切的任務(wù)便是在廢墟當(dāng)中進(jìn)行緊急搜救。其中,搜救的過程存在很多的危險(xiǎn),為救援人員帶來了很大的阻礙和困難,妨礙了救援工作的快速進(jìn)展。但是,利用救援機(jī)器人,可幫助救援人員實(shí)施相關(guān)的搜救工作,起到的效果非常理想。
1語音識別模塊
例如:在救火的過程中,對于語音識別移動機(jī)器人識聽覺導(dǎo)航系統(tǒng)的應(yīng)用,會起到關(guān)鍵性的作用,火災(zāi)通常會發(fā)生在建筑物內(nèi),因?yàn)閴w倒塌以及濃煙等因素,會對救援人員的工作造成很大的阻礙。盡管有救援機(jī)器人的幫助,但因?yàn)檫@些因素,機(jī)器人不能利用視覺傳感器,超聲波以及紅外線等傳感器對建筑物內(nèi)部的呼叫目標(biāo)進(jìn)行找尋。所以,通過語音識別當(dāng)中的聽覺導(dǎo)航技術(shù),會幫助機(jī)器人找到呼叫的目標(biāo),對救援工作起到的意義是十分重大的。聽覺傳感器的出現(xiàn),將視覺傳感器等在現(xiàn)場不能穿透障礙物的局限性進(jìn)行了彌補(bǔ)和突破,在語音識別基礎(chǔ)之上的聽覺導(dǎo)航技術(shù),又將語音識別技術(shù)加入了其中,這樣機(jī)器人只需要對特定聲音進(jìn)行追尋,例如:救命、help等詞語,便可對目標(biāo)進(jìn)行搜尋,對于其他的聲音不會有任何的反應(yīng)。
例如:創(chuàng)意之星的救援機(jī)器人內(nèi)部應(yīng)用了ARM10 MultiFlex2-PXA270控制卡當(dāng)中,有嵌入式語音識別功能技術(shù)。其中,需要在模塊屬性對話框當(dāng)中,添加救命、help等詞語的純文本格式,便可進(jìn)行對外界輸入源信號的識別和對比,如圖1所示。為了將識別的靈敏度進(jìn)行提升,在該系統(tǒng)當(dāng)中將助聽器設(shè)置在了麥克風(fēng)前端,這樣聲音的識別范圍便擴(kuò)大了很多,可達(dá)到lOm的范圍。
2聽覺導(dǎo)航模塊
在救援機(jī)器人當(dāng)中,如果只有語言識別輸入,并不能實(shí)現(xiàn)雙耳聽音以及辨別方向的能力,為了對這一問題進(jìn)行解決,可添加兩處麥克風(fēng),這樣便可對聲源進(jìn)行定位,同時為了將定位的精準(zhǔn)程度進(jìn)行提升,可將膠質(zhì)的耳廓安裝在麥克風(fēng)的外部。
救援機(jī)器人系統(tǒng)的內(nèi)部控制原理為:如右側(cè)有聲源聲音信號發(fā)出時,右側(cè)的麥克風(fēng)會比左側(cè)麥克風(fēng)距離聲源更近一些。因此,接收的信號會更強(qiáng)一些。之后,將聲音信號進(jìn)行轉(zhuǎn)化,使其成為電信號之后。便可得到聲強(qiáng)I2>I1。
因?yàn)镮2>I1,所以u2>U1,那么左邊電動機(jī)當(dāng)中的驅(qū)動電壓會大于右輪當(dāng)中的電動機(jī)驅(qū)動電壓,左輪向聲源進(jìn)行運(yùn)動的速度會更快一些,實(shí)現(xiàn)了機(jī)器人對聲源的導(dǎo)航以及轉(zhuǎn)向。如果機(jī)器人正對聲源進(jìn)行運(yùn)動,兩個麥克風(fēng)會一同接收到聲音信號,并且聲音的強(qiáng)度都是相同的,所以左右兩個輪子的驅(qū)動電壓便也相同,機(jī)器人會向正前方的目標(biāo)前進(jìn)。由于機(jī)器人可結(jié)合左右麥克風(fēng)接收到的信號強(qiáng)度差進(jìn)行移動,使得機(jī)器人可對自身的方向進(jìn)行實(shí)時控制。并且在前進(jìn)時會對移動方向進(jìn)行不斷的調(diào)整,實(shí)現(xiàn)了在聽覺導(dǎo)航控制技術(shù)上的方向控制,最終到達(dá)需要救援的目標(biāo)處。在運(yùn)動的過程當(dāng)中,如果由于回聲或者一些其他干擾因素,使得救援機(jī)器人的運(yùn)動方向產(chǎn)生了偏差,機(jī)器人會對方向進(jìn)行糾正。其原理為:在機(jī)器人行為控制方式執(zhí)行過程有些不穩(wěn)定的基礎(chǔ)上,整體行為當(dāng)中的自適應(yīng)性特征是非常穩(wěn)定的。
3語音識別的聽覺導(dǎo)航
前向麥克風(fēng)當(dāng)中的語音識別技術(shù),可對機(jī)器人針對走或者不走的問題進(jìn)行確定,在左右兩側(cè)麥克風(fēng)當(dāng)中會有定位導(dǎo)航系統(tǒng),并且決定機(jī)器要追蹤的具體走向。
內(nèi)部系統(tǒng)的實(shí)際工作流程為:其一,會對左右兩個麥克風(fēng)的語音輸入進(jìn)行持續(xù)掃描。在對10次采樣的樣本平均值進(jìn)行分析之后,將其在兩個變量當(dāng)中進(jìn)行存儲。因?yàn)閷π盘栠M(jìn)行采樣的時間會特別短暫,并不會對語音信號識別功能造成任何的影響。如果語音信號是系統(tǒng)原本便設(shè)置好的詞語,那么在對左右傳聲器輸入信號的大小進(jìn)行判斷時,便會對機(jī)器人的移動路徑以及具體方向進(jìn)行確定。如果語音信號當(dāng)中的語音詞語并不是系統(tǒng)預(yù)設(shè)好的,那么系統(tǒng)便會繼續(xù)進(jìn)行掃描工作,等待有特定詞匯信號的輸入。
當(dāng)信號處于斷續(xù)進(jìn)行輸入的狀態(tài)時,聲音導(dǎo)航方向會向前進(jìn)行3S,之后便會停止,繼續(xù)對下一次的呼叫信號進(jìn)行掃描等待。
4實(shí)驗(yàn)結(jié)果分析
實(shí)驗(yàn)一應(yīng)用的是90度的循聲導(dǎo)航控制實(shí)驗(yàn),其聲源是利用手機(jī)發(fā)出的不間斷生源;實(shí)驗(yàn)二應(yīng)用的是180度的循聲導(dǎo)航控制實(shí)驗(yàn),發(fā)出聲音的聲源為手機(jī)發(fā)出的斷續(xù)聲音。最終的實(shí)驗(yàn)結(jié)果為,在語音識別技術(shù)基礎(chǔ)之上的救援機(jī)器人聽覺導(dǎo)航系統(tǒng),針對發(fā)出的特定語言會立即進(jìn)行精準(zhǔn)的跟蹤和定位,救援效果十分理想,加之視覺傳感器以及接觸傳感器的配合,救援機(jī)器人的實(shí)用性得到了顯著的提升。
5結(jié)束語
總之,在各項(xiàng)工作中,對于救援機(jī)器人的應(yīng)用,會為相關(guān)的救援工作提供非常大的幫助作用。因此,對于語音識別的救援機(jī)器人聽覺導(dǎo)航技術(shù),還要進(jìn)行進(jìn)一步的探究,以便最大程度的發(fā)揮出救援機(jī)器人的價值。
參考文獻(xiàn)
[1]鄭家風(fēng),田思慶.基于改進(jìn)蟻群算法的煤礦救援機(jī)器人全局路徑規(guī)劃研究[J],電腦知識與技術(shù),2 01 8,14 (24):171-172+184.
[2]古順東,陳紫娟,陳珂,柯文德,一種差速驅(qū)動的探險(xiǎn)救援機(jī)器人研制[J].廣東石油化工學(xué)院學(xué)報(bào),201 8,28 (03): 53-57.
[3]孫昊,劉作軍,楊鵬,董愛龍.基于語音識別的救援機(jī)器人聽覺導(dǎo)航方法[J].北京科技大學(xué)學(xué)報(bào),2012,34 (01):71-75.