王春榮,黃凌山,熊昌炯,夏爾冬,鄭飛杰
(1.三明學(xué)院 機(jī)電工程學(xué)院,福建 三明 365004;2.機(jī)械現(xiàn)代設(shè)計(jì)制造技術(shù)福建省高校工程研究中心,福建 三明 365004;3.綠色鑄鍛及其高端零部件制造福建省2011協(xié)同創(chuàng)新中心,福建 三明 365004;4.福建省鑄鍛零部件工程技術(shù)研究中心,福建 三明 365004)
基于STM32的智能答疑機(jī)器人設(shè)計(jì)
王春榮1,2,3,4,黃凌山1,熊昌炯1,2,3,4,夏爾冬1,2,3,4,鄭飛杰1,2,3,4
(1.三明學(xué)院 機(jī)電工程學(xué)院,福建 三明 365004;2.機(jī)械現(xiàn)代設(shè)計(jì)制造技術(shù)福建省高校工程研究中心,福建 三明 365004;3.綠色鑄鍛及其高端零部件制造福建省2011協(xié)同創(chuàng)新中心,福建 三明 365004;4.福建省鑄鍛零部件工程技術(shù)研究中心,福建 三明 365004)
研究了一種具有語音識(shí)別技術(shù)的智能機(jī)器人,以PRO/E對(duì)答疑機(jī)器人進(jìn)行三維建模,STM32為機(jī)器人的控制系統(tǒng)核心,設(shè)計(jì)答疑機(jī)器人所需要的各個(gè)電源轉(zhuǎn)換模塊。答疑機(jī)器人能通過LD3320對(duì)接收到的語音進(jìn)行識(shí)別處理,并根據(jù)識(shí)別結(jié)果發(fā)出相應(yīng)解答以及配合一定的動(dòng)作。為提高機(jī)器人的語音識(shí)別效果,利用卡爾曼算法進(jìn)行降噪處理。通過實(shí)驗(yàn)表明,卡爾曼算法具有一定的降噪作用,該系統(tǒng)能移植到各種示教機(jī)器人、迎賓機(jī)器人以及智能玩具等。
機(jī)器人;STM32;語音識(shí)別
隨著計(jì)算機(jī)技術(shù)的發(fā)展,人們對(duì)人工智能的開發(fā)越來越深入,其中包括各種各樣的智能探測(cè)機(jī)器人、高精度室內(nèi)、室外定位機(jī)器人以及工業(yè)機(jī)械手等。但是人們發(fā)現(xiàn)語言是人與人工智能最簡(jiǎn)單、最迅速、最直接的交流方式,語音控制[1-2]就是實(shí)現(xiàn)人機(jī)對(duì)話的基本方法。國內(nèi)外有許多研究機(jī)構(gòu)和學(xué)者對(duì)語音機(jī)器人做出了相應(yīng)的研究,如國外的IBM、微軟、三星等都對(duì)語音識(shí)別技術(shù)投入大量的研究經(jīng)費(fèi),國內(nèi)的清華大學(xué)、北京大學(xué)、中科院聲學(xué)所等也對(duì)語音識(shí)別技術(shù)展開的相關(guān)的研究,如清華大學(xué)的鄧侃等[3]利用神經(jīng)網(wǎng)絡(luò)算法對(duì)語音識(shí)別技術(shù)進(jìn)行的研究,宋青松等[4]提出了一種對(duì)孤立語音識(shí)別降維方法,文獻(xiàn)[5]采用動(dòng)態(tài)時(shí)間規(guī)整對(duì)語音識(shí)別進(jìn)行了研究等,但是將語音識(shí)別技術(shù)應(yīng)用于課堂答疑機(jī)器人的研究還比較少。
因此本文設(shè)計(jì)了一種語音答疑機(jī)器人,通過提問者發(fā)出語音,從而機(jī)器人對(duì)語音做出識(shí)別,并控制機(jī)器人完成一定的動(dòng)作以及發(fā)出相應(yīng)的解答聲音。
利用PRO/E對(duì)答疑機(jī)器人的面部進(jìn)行三維實(shí)體建模,機(jī)器人的機(jī)械本體包括眉毛、眼睛、眼瞼、鼻子以及下巴等。其中眉毛具有兩個(gè)自由度(旋轉(zhuǎn))、眼臉具有兩自由度(水平與垂直轉(zhuǎn)動(dòng))下巴具有一個(gè)自由度 (上下運(yùn)動(dòng)),9個(gè)自由度均以12V直流電機(jī)作為驅(qū)動(dòng)控制。本文所設(shè)計(jì)的答疑機(jī)器人機(jī)械結(jié)構(gòu)本體如圖1所示。
圖1 答疑機(jī)器人
2.1 STM32簡(jiǎn)介
STM32F103ZET6[6-7]是一種高性能、低功耗、抗干擾能力強(qiáng)、運(yùn)算速度快、成本低的嵌入式處理器。工作頻率可達(dá)72MHz、內(nèi)置Flash存儲(chǔ)器可達(dá)512K、具有7個(gè)定時(shí)/計(jì)數(shù)器、3個(gè)USART接口、I2C接口以及SPI接口等眾多資源,并且可以使用KeilC軟件利用C語言進(jìn)行編程,無需操作系統(tǒng)具有極大的方便性。STM32F103ZET6最小系統(tǒng)電路圖,如圖2所示。
圖2 STM32F103ZET6最小系統(tǒng)
2.2控制系統(tǒng)原理
本文采用STM32的TIMERS產(chǎn)生PWM信號(hào),用于控制眉毛、眼睛、眼瞼、鼻子以及嘴巴等關(guān)節(jié)處的12V電機(jī),實(shí)現(xiàn)答疑機(jī)器人的臉部表情,總體的硬件控制框圖,如圖3所示。
圖3 硬件控制框圖
2.3電源模塊的設(shè)計(jì)
⑴5V電壓源設(shè)計(jì)
STM32F103ZET6正常工作電壓為 5 V,選擇SPD10-24S05為其提供電壓。SPD10-24S05的基本參數(shù):輸入電壓范圍:18~36 V;輸出:5 V,2A;輸出電壓精度:+1.0%;源效應(yīng):+0.2%;負(fù)載效應(yīng):+ 0.5%;隔離電壓:2500 V(普通型);開關(guān)頻率:300 kHz。SPD10-24S05精度高,穩(wěn)定性好,能提供穩(wěn)定的工作電壓。電路圖如圖4所示。
⑵12V電壓源設(shè)計(jì)
MC33063是Motololar公司的產(chǎn)品。主要用做汽車電子設(shè)備的電源變換??捎米錾龎鹤儞Q,也可用于降壓變換。輸入電壓從5~40V,可適用于絕大多數(shù)的汽車蓄電池。輸出電壓由用戶自己設(shè)計(jì),幾乎適用于所有的電子設(shè)備。輸出電流最高可達(dá)1A。效率較高,較為理想情況下,效率可高于85%。圖5為24V轉(zhuǎn)12V的降壓設(shè)計(jì),提供電機(jī)正常工作所需的電壓。
(3)3.3V電壓源設(shè)計(jì)
REG117是一款可以輸出高精度電壓的三端穩(wěn)壓器,具有輸出電流最高可達(dá)1A、過熱保護(hù)、限流保護(hù)等特點(diǎn),電路圖如圖6所示。為語音芯片LD3320提供3.3V的電壓,圖中的C23電容,對(duì)輸入的瞬時(shí)過電流可以起到抑制作用;同理,的C29對(duì)負(fù)載的高頻相應(yīng)也具有一定的改善作用。
圖4 24V轉(zhuǎn)5V
圖5 24V轉(zhuǎn)125V
圖6 5V轉(zhuǎn)3.3V
(4)LD3320模塊設(shè)計(jì)
LD3320[8-9]是一款功能強(qiáng)大的非特定人語音識(shí)別芯片,支持SPI通信與并行通信,具有高準(zhǔn)確度、無需錄音訓(xùn)練等優(yōu)點(diǎn),其電路圖如圖7所示。
語音機(jī)器人的系統(tǒng)軟件是利用KEIL編程軟件編寫的,KEIL能夠兼容ANSI標(biāo)準(zhǔn)的C語言的編程,其使用操作方便、功能適用、技術(shù)支持性能好,它能夠在Windows軟件系統(tǒng)的平臺(tái)下正常運(yùn)作,編寫并編制C語言代碼;在工程之中能夠搜集到全部的源文件,在這個(gè)平臺(tái)中能夠執(zhí)行并實(shí)施“文件的編輯”和“工程的構(gòu)筑”;能生成“hex”格式的文件下載到單片機(jī)中運(yùn)行,并且可以在Proteus軟件中實(shí)現(xiàn)仿真等特點(diǎn)。
圖7 LD3320控制電路
采用中斷方式進(jìn)行工作,程序流程為STM32初始化、LD3320初始化、采集語音信號(hào)、語音識(shí)別、根據(jù)識(shí)別信息相應(yīng)中斷從而產(chǎn)生相應(yīng)的動(dòng)作與應(yīng)答。程序流程圖,如圖8所示。
為了提高機(jī)器人的語音識(shí)別效率,采用了卡爾曼算法對(duì)語音進(jìn)行濾波降噪處理??柭鼮V波算法是一種以最小均方誤差來做預(yù)測(cè),能對(duì)語音信號(hào)做線性無偏估計(jì)。提取了在安靜環(huán)境下所識(shí)別的到的語音,圖9所示,對(duì)其進(jìn)行加噪以驗(yàn)證卡爾曼算法的降噪效果,如圖10所示,而圖11為經(jīng)過卡爾曼濾波算法處理后的語音。分析實(shí)驗(yàn)結(jié)果可知,卡爾曼濾波算法能對(duì)語音具有一定的降噪作用,提高機(jī)器人的語音識(shí)別效果。
圖8 程序流程圖
圖9 原始純凈語音
圖10 加噪語音
基于語音機(jī)器人是當(dāng)前的研究熱點(diǎn),將語音識(shí)別技術(shù)與課堂答疑相結(jié)合,采用PRO/E對(duì)答疑機(jī)器人進(jìn)行三維建模,以STM32F103ZET6為核心控制器,設(shè)計(jì)了STM32、LD3320以及電機(jī)所需的電源轉(zhuǎn)換模塊,并通過軟件實(shí)現(xiàn)機(jī)器人具有非特定的語音識(shí)別。教師可以事先把一些難題、學(xué)生比較薄弱的知識(shí)點(diǎn),詳細(xì)講解錄音之后存儲(chǔ)到答疑機(jī)器人里,之后學(xué)生可以在課余時(shí)間與答疑機(jī)器人進(jìn)行交流,對(duì)薄弱的知識(shí)點(diǎn)進(jìn)一步鞏固,這不僅解決了大學(xué)里下課難找到任課老師請(qǐng)假問題,而且還能激起學(xué)生的學(xué)習(xí)興趣。此外,該系統(tǒng)具有可移植性,可以用在各種智能機(jī)器人上,因此本文所設(shè)計(jì)的語音機(jī)器人具有低成本,可以被廣泛應(yīng)用。
圖11 濾波處理后語音
[1]張汝波,劉冠群.移動(dòng)機(jī)器人語音控制技術(shù)研究與實(shí)現(xiàn)[J].華中科技大學(xué)學(xué)報(bào),2013,10(41):348-351.
[2]何湘智.語音控制的應(yīng)用研究[D].長(zhǎng)沙:國防科學(xué)技術(shù)大學(xué),2002.
[3]鄧侃,歐智堅(jiān).深層神經(jīng)網(wǎng)絡(luò)語音識(shí)別自適應(yīng)方法研究[J].計(jì)算機(jī)應(yīng)用研究,2016(7):1-6.
[4]宋青松,田正鑫,孫文磊,等.用于孤立數(shù)字語音識(shí)別的一種組合降維方法[J].西安交通大學(xué)學(xué)報(bào),2016(6):1-5.
[5]宋亞男,林錫海,徐榮華,等.機(jī)器人語音識(shí)別實(shí)驗(yàn)設(shè)計(jì)與實(shí)現(xiàn)[J].實(shí)驗(yàn)技術(shù)與管理,2013(2):36-38.
[6]饒連周,林惠川,謝金濤,等.基于STM32F103VC和CAN總線的汽車儀表系統(tǒng)的設(shè)計(jì)[J].三明學(xué)院學(xué)報(bào),2014,29 (2):56-60.
[7]張旭,元學(xué)廣.基于STM32電力數(shù)據(jù)采集系統(tǒng)的設(shè)計(jì)[J].電子測(cè)量技術(shù)2011,33(11):90-94.
[8]杜希棟,王志偉.基于 LD3320的非特定語音控制小車設(shè)計(jì)[J].信息技術(shù),2011(1):53-55.
[9]施艷艷,于文英,楊凌霄.空調(diào)的非特定語音辨識(shí)與控制[J].河南師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2015(3):51-55.
(責(zé)任編輯:朱聯(lián)九)
Intelligent Voice of the Robot Design Based on STM32
WANG Chun-rong1,2,3,4,HUANG Ling-shan1,XIONG Chang-jiong1,2,3,4,XIA Er-dong1,2,3,4,ZHENG Fei-jie1,2,3,4
(1.School of Mechanical&Electronic Engineering,Sanming University,Sanming 365004,China;2.Engineering Research Center in Fujian Province University for Modern Mechanical Design and Manufacturing Technology,Sanming 365004,China;3.Collaborative Innovation Center of Green Casting-Forging Industry and High-End Parts in Fujian Province,Sanming 365004,China 4.Engineering Technology Research Center of Casting-Forging Parts Manufacturing in Fujian Province,Sanming 365004,China)
A kind of speech recognition technology robot was studied. The three-dimensional mode of answering robot was established by Proe/E and the control system was consisted of STM32. The power conversion module of answering robot was designed. According to the received speech, the corresponding solutions and a certain action are obtained by the answering robot for the questioner. In order to improve the effect of speech recognition, the Kalman algorithm was used to noise reduction processing. The experiment results show that kalman algorithm has the effect of noise reduction, which,therefore, can be transplanted into all kinds of teaching robots, robot receptionists and intelligent toys.
robot; STM32; speech recognition
TP242.6
A
1673-4343(2016)04-0067-05
10.14098/j.cn35-1288/z.2016.04.011
2016-02-23
大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目(201311311029);三明市科技項(xiàng)目(2014-G-6);福建省教育廳科技項(xiàng)目(JA14293);福建省教育廳科技項(xiàng)目(JK2015046);福建省自然科學(xué)基金項(xiàng)目(2016J01741)
王春榮,男,福建漳州人,講師。主要研究方向:機(jī)器人控制技術(shù)。