王俊力,馮錫煒,孟菲
(遼寧石油化工大學(xué)計算機與通信工程學(xué)院,遼寧撫順113001)
石油石化設(shè)備巡檢小車語音識別與控制系統(tǒng)設(shè)計與實現(xiàn)
王俊力,馮錫煒,孟菲
(遼寧石油化工大學(xué)計算機與通信工程學(xué)院,遼寧撫順113001)
基于語音識別技術(shù)及控制技術(shù),實現(xiàn)在石油石化設(shè)備工作環(huán)境下語音口令實時控制巡檢設(shè)備、優(yōu)化硬件設(shè)施以獲最佳性能、提高石油石化設(shè)備的安全性能,降低安全隱患等目標。采用STM32系列芯片及LD3320語音識別芯片組成語音巡檢小車控制芯片組,語音識別算法來分析口令傳遞給控制芯片,進而通過控制電機和舵機驅(qū)動小車模型運動,最終實現(xiàn)整個模型系統(tǒng)的語言識別與控制。通過在不同場地模擬多種不同石油石化設(shè)備工作環(huán)境,對語音識別精確率進行分析。得出巡檢小車語音識別與控制系統(tǒng)可以達到預(yù)期目標的結(jié)論。
石油石化設(shè)備;語音識別;巡檢小車模型;自動控制
石油石化行業(yè)生產(chǎn)設(shè)備具有數(shù)量多、工藝復(fù)雜、壓力容器集中、生產(chǎn)連續(xù)性強、火災(zāi)危險性大以及意外事故頻發(fā)等特點,一直是高風(fēng)險集中的場所。而該環(huán)境下的工作人員活動空間狹窄且工作時工作人員需要進行設(shè)備調(diào)整[1],所以大型巡檢設(shè)備無法進入場地或沒有足夠的時間去采集相關(guān)需求信息一直是業(yè)界為之頭疼的問題。為了解決這些問題,結(jié)合當(dāng)今人工智能技術(shù)飛速發(fā)展(如視頻圖像處理、音頻處理等技術(shù)都已經(jīng)廣泛應(yīng)用在日常的生活和工作之中)[2],文中主要的解決方法是通過設(shè)計一個不用手去進行遙控操作的設(shè)備,去完成相關(guān)功能[3-4]。
與機器通過語音進行交流,是人們一直以來的夢想,同時也更便捷。本文采用LD3320語音識別模塊及配套的運動系統(tǒng),實現(xiàn)對小車的運動狀態(tài)(前進、后退和轉(zhuǎn)向等動作)的控制,進而實現(xiàn)不用手去進行遙控操作的目標。
語音控制系統(tǒng)的軟件部份包括LD3320語音識別程序和小車運動系統(tǒng)控制程序兩部分。LD3320最多可支持動態(tài)編輯50條關(guān)鍵詞語列表,利用語音的頻譜特征(個人發(fā)音器官特性和發(fā)音習(xí)慣特性表現(xiàn))在聲紋頻譜中的各種現(xiàn)象[5]。通過麥克風(fēng)采集出來并識別成相應(yīng)的文字符號最后將結(jié)果輸出[6]。軟件設(shè)置“指令口令”、“垃圾口令”和“前綴觸發(fā)口令”來提高其語音識別的精度。LD3320經(jīng)過通過初始化以后通過MIC接受外部的語音信息,這個過程進行計時(計時可以由使用者自行設(shè)定,本文設(shè)定為10秒)如果計時結(jié)束時沒有接收到聲音,則返回到接受口令,如果接受到聲音則進行響應(yīng)的算法匹配中。在算法匹配的過程中如果匹配到最佳結(jié)果,則將這一結(jié)果發(fā)送給對應(yīng)的STM32F103Z芯片中。如果匹配失敗則返回到接受口令重新接受口令。圖1為語音識別程序流程圖。
圖1 語音識別程序流程
對于LD3320語音模塊,從麥克風(fēng)收集到的語音信息有兩種,分別是對整個系統(tǒng)有用的“指令口令”和對整個系統(tǒng)運行無用的“垃圾口令”。例如,當(dāng)用戶說出“前進”(qianjin)口令,LD3320成功接收并處理,將響應(yīng)的指令發(fā)送給其所在的STM32F103Z芯片[7]。整個語音識別的過程包括語音識別程序的初始化、使用ASR和預(yù)設(shè)的識別關(guān)鍵字列表共同對用戶語音信息進行判斷[8-9]。若識別過程成功則發(fā)送信息給下一個模塊;若識別過程不成功則繼續(xù)循環(huán)該過程。表1為語音識別關(guān)鍵詞列表。
表1 語音識別關(guān)鍵詞列表
為了提高語音識別的準確率,除了系統(tǒng)中的“垃圾口令”判斷響應(yīng)機制外,還添加了“前綴觸發(fā)口令”模式,該模式用戶可以根據(jù)自身所在的環(huán)境考慮是否啟用。當(dāng)用戶啟用該功能時須在使用某項功能前加入用戶自定義的語句。例如,用戶事先定義了“轉(zhuǎn)向左”(zhuan xiang zuo)則在使用轉(zhuǎn)彎角度功能的時候需要說出“轉(zhuǎn)向左三十”(zhuan xiang zuo san shi),小車模型才能夠進行相應(yīng)功能的響應(yīng)。表2為語音前綴觸發(fā)口令關(guān)鍵詞表。
表2 語音前綴觸發(fā)口令關(guān)鍵詞表
該芯片進行處理后將該口令轉(zhuǎn)化為標記語句[10]。首先儲存在寄存器中,再通過通用異步收發(fā)傳輸器(UART)通信方式,將語音部份識別的信息發(fā)送給控制步進電機的STM32F103R模塊、并存在對應(yīng)模塊的寄存器中,通過讀取寄存器中的內(nèi)容,進而控制步進電機的移動。若是垃圾詞匯則經(jīng)LD3320所在的STM32F103Z模塊判斷后[11],不進行響應(yīng)。
在控制舵機及步進電機方面,采用了脈沖寬度調(diào)制(PWM)與連接舵機及步進電機的電調(diào)及解碼器進行信息通信,利用其所在的STM32F103R芯片輸出的數(shù)字信號來對模擬電路進行控制,進而調(diào)節(jié)步進電機的速度和前進方向及舵機的擺動方向。其輸出的是一個方波信號,信號的頻率是由其預(yù)分頻器所決定[12]。圖2為舵機及步進電機程序流程。
圖2 舵機及步進電機程序流程
語音控制小車模型的硬件處理芯片由兩個微控制器STM32系列微控制器(型號分別為STM32F103Z和STM32F103R)組成,兩個芯片分別連接語音識別模塊LD3320和方向舵機及步進電機,構(gòu)成整個小車模型的硬件系統(tǒng)[13]。其中型號為STM32F103Z微控制器與LD3320語音識別模塊進行連接,微控制器通過串行外設(shè)接口(SPI)通信手段和LD3320語音識別模塊進行數(shù)據(jù)傳輸,從而得到用戶的口令并進行下一步的判斷;另一個由型號為STM32F103R微控制器與方向舵機及步進電機連接。微控制器通過脈沖寬度調(diào)制(PWM)通信方式進行控制信號的傳輸,方向舵機及步進電機接收到信號后,將信號處理后使方向舵機及步進電機及時響應(yīng)相應(yīng)運動。圖3為硬件系統(tǒng)方案設(shè)計。
圖3 硬件系統(tǒng)方案設(shè)計
LD3320模塊內(nèi)部,由LD3320芯片、麥克風(fēng)及配套電路組成[14-15]。工作原理為:首先麥克風(fēng)接收到使用者的語音指令,轉(zhuǎn)化為電信號通過電路傳送到語音識別芯片LD3320中[16-17]。LD3320將該信號進行處理匹配后將語音識別結(jié)果通過串行外設(shè)接口(SPI)傳輸?shù)絊TM32F103Z微控制器里[18];經(jīng)過STM32F103Z處理后,和口令表中的命令進行匹配,將響應(yīng)的信息通過線纜方式傳輸?shù)絊TM32F103R微控制器里。
圖4 語音識別工作原理
STM32F103R微控制器從STM32F103Z接受到信號后,進行信號判斷得到對應(yīng)的口令動作,將動作信息通過脈沖寬度調(diào)制(PWM)方式發(fā)送信號到方向舵機及步進電機。進而對小車的運動狀態(tài)進行控制[19-20]。
為了試驗系統(tǒng)在實驗室和非實驗室環(huán)境的工作能力,實驗采用兩個環(huán)境,分別在室內(nèi)實驗室及室外操場,通過在室外操場實驗?zāi)M系統(tǒng)在石油化工企業(yè)環(huán)境下的工作狀態(tài),進行了語音識別功能的測試。
實驗采用計算機播放錄音的模式,將已錄好的相同音量在不同距離依次播放前進(qian jin)、加速(jia su)、后退(hou tui)、左轉(zhuǎn)三十(zuo zhuan san shi)、右轉(zhuǎn)四十五(you zhuan sishiwu)、減速(jian su)等6個指令口令和語氣音啊(a)、語氣音哈(ha)、語氣音(si)3個垃圾口令進行效果測試。在1.0m、1.5m、2.0m、2.5m和3.0 m五個距離段進行各200次實驗,統(tǒng)計正確識別率、未識別率和誤識別率。表3為語音命令識別率,數(shù)據(jù)如表3所示。
表3 語音命令識別率
文中結(jié)合語音識別與小車運動系統(tǒng)控制技術(shù)實現(xiàn)了對小車的非特定語音控制。其主要是將語音系統(tǒng)信息采集的語音模擬信號識別成相應(yīng)的文字符號,最后將結(jié)果輸出使相關(guān)設(shè)備進行響應(yīng)。小車的功能還有很大的改造空間,比如在雜音下更加準確的識別語句及對長語句進行識別、分段等。
作為解放石油石化工作人員勞動力的研究,從我國石油石化設(shè)備系統(tǒng)的實際出發(fā),通過語音方式控制小車的行進軌跡,進而通過搭載在小車上的傳感器得到響應(yīng)參數(shù),提供相關(guān)設(shè)備及設(shè)備周邊環(huán)境的參數(shù),為石油石化設(shè)備安全巡檢人員提供相關(guān)決策信息,進一步完善的災(zāi)害響應(yīng)機制,為我們的石油石化行業(yè)提供更加人性化的設(shè)備與服務(wù)。
[1]馬昆,任予鑫,秦奮勇.基于語音識別的綜采自動化遠程控制系統(tǒng)研究[J].價值工程,2014(30):223-224.
[2]羅憲華,徐海明.基于特定人的語音情感識別系統(tǒng)構(gòu)建[J].中國人民公安大學(xué)學(xué)報(自然科學(xué)版),2015(4):72-75.
[3]周璐璐,鄧江洪.一種機器人智能語音識別算法研究[J].計算機測量與控制,2014,22(10):3267-3273.
[4]趙甜甜,王夢嬌,謝韜.基于LD3320的語音識別車配虛擬人系統(tǒng)的設(shè)計[J].信息化建設(shè),2016(4):329.
[5]林暖輝,張偉頌,徐毓文.淺議聲紋鑒定中噪聲對語音頻譜特征的影響及降噪處理[J].黑龍江科技信息,2015(36):129-130.
[6]馬玉志,吳登娥.非特定人語音控制系統(tǒng)在家用電器中的應(yīng)用[J].無線互聯(lián)科技,2015(18):137-138.
[7]高遠,祝玲,鐘坤芳.語音與遠程控制在汽車空調(diào)系統(tǒng)中的應(yīng)用[J].科技與企業(yè),2015(24):98.
[8]趙海君.語音識別的SVM模型選擇分析[J].電腦知識與技術(shù),2015,11(25):133-134.
[9]呂威,高飛燕.基于STM32的語音識別協(xié)助監(jiān)護系統(tǒng)[J].科技創(chuàng)新與應(yīng)用,2015(34):72.
[10]王江南,張福轉(zhuǎn),孔慶波,等.用于模擬飛行指揮系統(tǒng)的語音識別模塊[J].兵工自動化,2015,34(12):29-32.
[11]杜希棟,王志偉,潘黎,等.基于LD3320的非特定語音控制小車設(shè)計[J].信息技術(shù),2015(1):53-55.
[12]梁漢泉,陳錦彪.基于語音控制的人機交互智能系統(tǒng)研究[J].新技術(shù)新工藝,2015(9):84-86.
[13]馬帥旗,張偉.基于語音識別的機車自動過分相裝置的研制[J].陜西理工學(xué)院學(xué)報(自然科學(xué)版),2014,30(6):30-34.
[14]湯莉莉,馬仟,黃偉,等.語音無線遙控智能小車設(shè)計[J].無線電工程,2014,44(12):66-69.
[15]鄧寶安,呂志剛,杜曉斌.基于MCS-51單片機的新型門禁控制器設(shè)計[J].電子設(shè)計工程,2015,23(24):103-105.
[16]毛麗民,盧振利,謝新明,等.基于語音交互功能的醫(yī)療服務(wù)機器人控制系統(tǒng)設(shè)計[J].高技術(shù)通訊,2014,24(7):745-751.
[17]熊志輝,王仁波.基于STM32的智能學(xué)習(xí)臺燈設(shè)計[J].電子世界,2016(8):160-161.
[18]易群,李彩麗.基于單片機的語音錄放硬件電路設(shè)計與研究[J].機電信息,2015(36):130-131.
[19]蔣冬清,王一舒.LD3320語音芯片與單片機的通訊分析[J].科技創(chuàng)新與應(yīng)用,2016(3):75.
[20]陳免慧,沈煒.嵌入式語音系統(tǒng)信息采集算法研究[J].工業(yè)控制計算機,2015,28(12):64-65.
Petroleum and petrochemical equipment inspection car voice recognition and control system
WANG Jun?li,F(xiàn)ENG Xi?wei,MENG Fei
(School of Computer and Communication Engineering,Liaoning Shihua University,F(xiàn)ushun113001,China)
Based on speech recognition and control technology,in order to achieve real-time voice password control inspection equipment,optimize hardware facilitiesfor maximum performance in petroleum and petrochemical equipment working environment,eventually to improve the safety performance of petroleum and petrochemical equipment,the target of reducing the potential safety hazard.Using STM32 series chips and LD3320 speech recognition chip of speech inspection car control chipset,speech recognition algorithm to analyze the password is passed to the control chip,and then by controlling the movement of motor and steering gear to car model,finally realizes the whole model system of the speech recognition and control.Through simulating different petroleum and petrochemical equipment working environment in the different sites,analyzing the speech recognition accuracy.Thus,the inspection car voice recognition and control system can achieve the anticipated goal.
petroleum and petrochemical equipment;speech recognition;inspection car model;automatic control
TN6
A
1674-6236(2017)22-0074-04
2016-09-26稿件編號:201609230
遼寧省普通高等學(xué)校本科教育教學(xué)改革研究項目(UPRP20140914);遼寧省教育科學(xué)“十三五”規(guī)劃立項課題(JG16DB253)
王俊力(1995—),男,遼寧錦州人。研究方向:模式識別。