鐘修皓,王曉虹,劉文壯,張 錫,張 彤
(遼寧石油化工大學 計算機與通信工程學院,遼寧 撫順 113001)
近年來隨著人工智能技術(shù)、計算機技術(shù)等相關(guān)技術(shù)的發(fā)展,對移動機器人的研究越來越多。智能語音巡檢機器人可有效地應用在石化、油田、核工業(yè)等行業(yè)中,尤其在管道、罐體塔體等人員不方便到達的區(qū)域,智能語音機器人可以發(fā)揮其優(yōu)勢。本系統(tǒng)可以通過語音來指揮現(xiàn)場的巡檢機器人進行圖像采集、準確的測試周圍環(huán)境相關(guān)參數(shù)、全方位查看容器內(nèi)部的損傷等情況,從而可以減少意外事故的發(fā)生。與常規(guī)的無損檢測設備相比,系統(tǒng)引入了多傳感器系統(tǒng)的智能語音機器人,在檢測靈活性和可靠性上有不可比擬的優(yōu)勢。而且,系統(tǒng)檢測的數(shù)據(jù)的準確性非常高。經(jīng)過現(xiàn)場實驗表明,該系統(tǒng)智能化程度高,運動穩(wěn)定可靠,本系統(tǒng)具有很高的推廣價值,有廣闊的應用前景。目前,國內(nèi)外對環(huán)境、設備等的安全監(jiān)測問題一直是重要的研究方向。
本系統(tǒng)的基本功能是采用智能語音機器人對監(jiān)測介質(zhì)的指標數(shù)據(jù)進行監(jiān)測,通過USB攝像頭全方位采集對象的重要部位圖像,通過運行客戶端、建立連接,由此不斷獲取服務器傳回的視頻信息,得到直觀的介質(zhì)實際情況。通過各種傳感器獲得當前介質(zhì)的重要信息,并且通過這些重要信息對監(jiān)測對象進行危險系數(shù)評估,從而為監(jiān)測對象的安全運行提供精確和有力的技術(shù)支撐。
智能語音機器人主要是通過語音識別進行控制行走。機器人的控制主要是通過語音識別指令,機器人再根據(jù)指令執(zhí)行相應的動作,控制是通過附加在MCU上的語音模塊來實現(xiàn)??蛻舳吮O(jiān)控為用戶提供遠程視頻監(jiān)控服務,進一步擴展了視頻監(jiān)控的使用范圍。將PC機通過IP網(wǎng)絡與服務器相連,可以遠程播放。
系統(tǒng)功能結(jié)構(gòu)圖如圖1所示,系統(tǒng)主要包括視頻采集模塊、指標體系數(shù)據(jù)采集模塊、機器人控制模塊、中控端控制模塊、移動終端控制模塊、數(shù)據(jù)處理模塊、語音識別模塊、通信模塊等。
系統(tǒng)的每個模塊都包含一個或多個線程,有些線程在系統(tǒng)運行之初就開始運行(如視頻采集線程);有些線程在一定的條件下才被啟動。系統(tǒng)可以通過多線程函數(shù)在一定條件下實現(xiàn)相關(guān)線程的阻塞或喚醒,從而只運行那些有用的線程,使系統(tǒng)的效率大大增加。
圖1 系統(tǒng)功能圖Fig.1 System function diagram
智能語音巡檢機器人系統(tǒng)采用的硬件平臺是基于ARM體系結(jié)構(gòu),采用Samsung S3c6410嵌入式微處理器。系統(tǒng)采用兩層架構(gòu),上層以S3C6410為核心,負責圖像采集等工作,并將圖像通過Wi-Fi方式發(fā)送給PC機,通過語音模塊來完成語音的采集、識別、命令發(fā)送。下層以直流電機驅(qū)動板為核心,控制機器人的運動以及傳感器數(shù)據(jù)處理。系統(tǒng)的硬件框圖如圖2所示,以ARM 6410處理器為核心,外圍連接各種傳感器模塊、語音模塊、直流電機模塊、視頻采集模塊、無線傳輸模塊等。
圖2 系統(tǒng)硬件結(jié)構(gòu)圖Fig.2 Hardware structure of the system
Video4Linux(簡稱V4L),是Linux中關(guān)于視頻設備的內(nèi)核驅(qū)動[1-2]。Video4Linux是為市場現(xiàn)在常見的電視捕獲卡、并口及USB口的攝像頭提供統(tǒng)一的編程接口。同時也提供無線電通信和文字電視廣播解碼和垂直消隱的數(shù)據(jù)接口。攝像頭安裝在云臺上,通過程序可控制攝像頭的位置,進而控制攝像的角度,采集到不同角度的圖片。根據(jù)Video4Linux標準接口編程,再對采集的圖像進行閥值比較,判斷圖像是否變化,從而決定是否需要存入圖像緩沖區(qū)。
為了進一步提高視頻數(shù)據(jù)的傳輸速度和實時性,采集視頻時利用視頻設備的雙緩沖達到邊傳輸邊采集的效果。同時設計一個內(nèi)存緩沖池,視頻采集圖像經(jīng)過JPEG壓縮后將數(shù)據(jù)保存到緩沖池中,視頻傳輸?shù)臄?shù)據(jù)從該緩沖中獲取。
系統(tǒng)安裝了各種傳感器(如溫濕度傳感器、氣體傳感器、紅外傳感器、煙霧傳感器等)來采集相應的數(shù)據(jù)作為監(jiān)測被控對象的重要指標。如溫濕度傳感器通過IIC總線與MCU相連,采取GPIO靜態(tài)驅(qū)動方式,全量程校準,全靜態(tài)時序控制,測量結(jié)果精確。煙霧傳感器使用MCU的外部中斷,在驅(qū)動需要預熱,當檢測到有危險氣體的,觸發(fā)外部中斷,開始報警。
本系統(tǒng)中的無限傳輸采用的是Wi-Fi技術(shù)。相比于其他無線通信技術(shù),Wi-Fi的覆蓋半徑則可達300英尺左右約合100 m,其覆蓋范圍比較廣。數(shù)Wi-Fi據(jù)傳輸速度快,可以達到11 mbps。這些都很適用于本系統(tǒng),特別是在報警的時候,可以及時將相關(guān)的重要數(shù)據(jù)傳回到中控端和移動終端[3-4]。
2.4.1 語音模塊設計思路
在此系統(tǒng)中,將語音模塊直接接到ARM6410上,并通過此主板對機器人進行語音控制,這樣,就能更便捷地控制機器人而不會像使用PC控制那么繁瑣。在實現(xiàn)中,會采用一種語音識別平臺,通過該平臺對語音數(shù)據(jù)進行識別,使用開發(fā)板的串口連接并且驅(qū)動機器人。
2.4.2 語音模塊架構(gòu)
語音模塊作為本系統(tǒng)的主要特色,此處主要采用基于ARM11的語音識別技術(shù)[5-6]。由于本系統(tǒng)采用S3C6410作為MCU,其主頻達到667 MHz,并且具有豐富的接口。智能語音巡檢機器人主要由開發(fā)板的麥克風接口對語音進行采集,通過此處的語音模塊對采集的語音數(shù)據(jù)進行處理,然后通過內(nèi)部編程由串口向機器人發(fā)送相關(guān)的指令來驅(qū)動電機,從而實現(xiàn)機器人的前進、后退、左轉(zhuǎn)、右轉(zhuǎn)等語音控制。
2.4.3 實現(xiàn)流程
語音識別的過程是將人類的自然語言轉(zhuǎn)化數(shù)據(jù)信息的過程,語音識別技術(shù)也可以簡單描述為Voice-Instructions的識別。語音識別處理的過程為控制著通過麥克風等輸入設備輸入語音信號,然后語音模塊通過接收器接收語音信號,然后將信號信息傳入語音識別平臺,由該平臺將語音數(shù)據(jù)信息進行相關(guān)的處理,從而實現(xiàn)對機器人的控制。實現(xiàn)流程如圖3所示。
移動機器人上層采用語音控制,下層的硬件采用直流電機控制機器人的動作。硬件驅(qū)動板主要采用雙Ha橋直流電機驅(qū)動芯片,它具有帶載能力強的特點。LKV-HM3.0雙H橋直流電機驅(qū)動板采用ST公司的L298N典型雙H橋直流電機驅(qū)動芯片,可用于驅(qū)動直流電機或雙極性步進電機,此驅(qū)動板的特點是體積小,重量輕,具有強大的驅(qū)動能力。
移動機器人下層控制主要由電機的開關(guān)控制、電機轉(zhuǎn)向控制、電機轉(zhuǎn)速控制組合起來的。通過PWD的調(diào)速來控制機器人的左轉(zhuǎn)、右轉(zhuǎn)、后退、前進、轉(zhuǎn)彎等動作。
圖3 語音識別流程Fig.3 Speech recognition process
文中研究設計了智能語音機器人系統(tǒng)。系統(tǒng)在以S3C6410為核心的嵌入式硬件平臺上構(gòu)建了一個適合本系統(tǒng)開發(fā)要求的嵌入式Linux系統(tǒng)軟件平臺。系統(tǒng)使用USB攝像頭進行圖像采集;攝像頭帶云臺,可控制攝像的角度;采用無線數(shù)據(jù)傳輸方式;主板采用S3C6410處理芯片,可以輕松應對視頻采集,視頻處理,無線傳輸?shù)裙δ?。而且可擴展能力強,多種傳感器模塊,并支持傳感器擴展,Linux操作系統(tǒng)支持。系統(tǒng)的適用性很強,可隨時調(diào)整攝像頭的位置,拍攝不同角度的畫面,并且可隨時調(diào)節(jié)畫面的亮度和對比度,這使系統(tǒng)的使用更靈活。系統(tǒng)采用語音來控制機器人的行動,從而可靈活地顯示當前監(jiān)測對象的現(xiàn)場情況,尤其是人工不易到達的區(qū)域,系統(tǒng)準確性高,適用性強。但是語音識別模塊然目前還存在識別率不夠高的問題,還需要進一步去設計和改進。
[1]張永強,趙永勇,李崇德.嵌入式遠程視頻采集系統(tǒng)的設計與實現(xiàn)[J].現(xiàn)代電子技術(shù),2006(4):75-77.ZHANG Yang-qiang,ZHAO Yong-yong,LI Chong-de.The design and implementation of embedded remote video acquisition system[J].The Modern Electronic Technology,2006(4):75-77.
[2]劉潔瑜,王黎明,錢培賢,等.基于MJPEG2000嵌入式網(wǎng)絡視頻采集壓縮系統(tǒng)的設計與實現(xiàn)[J].微電子學與計算機,2004,21(12):168-173.LIU Jie-yu,WANG Li-ming,QIAN Pei-xian,et al.The design and implementation of embedded network video collection and compression system Based MJPEG2000[J].Microelectronics and Computer,2004,21(12):168-173.
[3]俞輝.嵌入式Linux程序設計案與實驗教程[M].北京:機械工業(yè)出版社,2009.
[4]陳卓,王田,梁新元.嵌入式系統(tǒng)開發(fā)[M].北京:電子工業(yè)出版社,2009.
[5]蔚健,劉志勤.基于ARM11的智能語音識別機器人教學平臺設計[J].軟件導刊,2013,12(5):96-98.WEI Jian,LIU Zhi-qin.The design of intelligent speech recognition robot teaching platform based on ARM11[J].Software Tribune,2013,12(5):96-98.
[6]賈艷麗,楊明剛.景點智能語音導航器設計[J].微型機與應用,2012,31(15):21-23.JIA Yan-li,YANG Ming-gang.The design attractions intelligent voice navigation device[J].Micro Computer and Application,2012,31(15):21-23.