曾容
【摘要】目前,聲控技術(shù)在多領(lǐng)域廣泛的應(yīng)用。特別是一些具有語音控制功能的設(shè)備儀器越來越受到人們的青睞,它讓人們的日常消費生活變得更加方便快捷。本文闡述了在語音無線遙控小車在硬件設(shè)計方面以意法半導(dǎo)體(STM)公司的STM32F103ZET6單片機作為語音無線遙控和智能小車的控制電路板的核心進行硬件系統(tǒng)的設(shè)計
【關(guān)鍵詞】智能小車;語音無線遙控系統(tǒng);硬件;設(shè)計
1語音無線遙控器的設(shè)計原理
語音無線遙控器結(jié)構(gòu)主要由STM32F103ZET6核心控制板模塊、SD卡存儲器模塊、語音識別模塊和NRF24L01無線模塊組成。其中語音識別模塊是由語音輸人與輸出模塊、語音識別芯片組成。所有的模塊都是通過串行SPI方式與核心控制板相連,并由它控制。結(jié)構(gòu)原理框圖如圖3.1所示。
語音無線遙控器的工作原理如下:通過麥克風(fēng)發(fā)出控制指令控制,語音識別模塊識別,產(chǎn)生一個32位控制碼取決于控制信號由單片機的SD存儲模塊匹配“【關(guān)鍵詞】列表”,然后由語音識別模塊揚聲器說話的聲音播放出來,然后MCU發(fā)送控制信號以控制無線傳輸模塊發(fā)送到控制碼以無線電波的形式,由一個小的車接收的車輛控制單元的后MCU處理和控制小車產(chǎn)生預(yù)期的作用。它接收到的語音命令,通過語音識別處理的麥克風(fēng),和將識別結(jié)果作為二進制碼到中央控制器,用于處理輸出。
2 語音識別模塊設(shè)計
LD3320芯片是一個“語音識別”專用芯片。這種芯片融合了語音識別處理器和一些包括AD,DA轉(zhuǎn)換器,音頻輸出接口,麥克風(fēng)插孔等外部電路。注重節(jié)能減排和芯片設(shè)計效率,該芯片不需要任何外部援助,如閃存,RAM等,直接集成在可實施的語音識別/語音/互動功能的現(xiàn)有產(chǎn)品,并確定關(guān)鍵詞的列表可以在任何動態(tài)編輯。目前,語音識別芯片,通常是基于特定人的語音識別技術(shù),芯片不能被修改,以確定工廠出廠后的條目只能識別進入識別預(yù)制之前。本文采用語音識別芯片LD3320作為研究的系統(tǒng),制定語音識別解決方案。ICRoute產(chǎn)生LD3320是基于語音識別技術(shù),語音識別/聲音芯片的非特定的人。外圍只需要低級單片機水平,讓MCU控制芯片LD3320,麥克風(fēng)連接到AD引腳,就能達到語音識別功能。LD3320具有高效的非特定人語音識別搜索引擎和完整的特征庫。LD3320語音識別有高達94%準確率,而且無需語音訓(xùn)練。LD3320模塊原理圖如圖3.3所示。
2.1 語音識別芯片LD3320的工作原理
LD3320語音識別芯片采用的就是ASR技術(shù),LD3320的語音識別進程,首先對由麥克風(fēng)輸入的語音進行頻譜分析。讓語音與關(guān)鍵詞列表的詞進行比較,最后最相近的關(guān)鍵詞作為識別結(jié)果。
語音識別芯片LD3320采用ASR技術(shù),提供了一種脫離各種各樣操作方式只用語音來控制系統(tǒng)的操作,這樣使得操作更簡單、快速和自然。使用者只需要以字符串的形式把識別的關(guān)鍵詞語傳送進芯片,就可以讓識別立即生效,例如,使用者編程時,簡單地通過設(shè)置芯片的寄存器,把諸如“關(guān)燈”這樣的關(guān)鍵詞語的內(nèi)容動態(tài)地傳人芯片中,芯片就可以識別所設(shè)定的關(guān)鍵詞語了,關(guān)鍵詞就是由漢語拼音組成。LD3320的語音識別系統(tǒng)可以隨著程序,在運行時動態(tài)地更改關(guān)鍵詞語列表的內(nèi)容,應(yīng)用到多種不同的場景,而且不需要語音訓(xùn)練。
2.2 語音識別技術(shù)
語音識別(ASR)技術(shù)是基于“關(guān)鍵詞語列表”的識別技術(shù),它是對大量的語音數(shù)據(jù)經(jīng)語言學(xué)家語音模型分析,建立數(shù)學(xué)模型,并經(jīng)過反復(fù)訓(xùn)練提取基元語音的細節(jié)特征,以及提取各基元間的特征差異,得到在統(tǒng)計概率最優(yōu)化意義上的各個基元語音特征,再利用算法以及語音模型轉(zhuǎn)換成硬件芯片并廣泛應(yīng)用在嵌入式系統(tǒng)中。ASR技術(shù)的每次語音識別的過程就是把使用者說出的語音內(nèi)容,利用頻譜轉(zhuǎn)換為語音特征,再將這個轉(zhuǎn)換后的語音特征和“關(guān)鍵詞語列表”中的條目一一進行匹配,匹配到與列表中最相近的就作為識別結(jié)果。如ASR技術(shù)在語音控制的手機應(yīng)用中,這個“關(guān)鍵詞語列表”的內(nèi)容手機中各個應(yīng)用的名稱,不論這個識別列表的內(nèi)容是什么,只需要使用者設(shè)置相關(guān)的寄存器,就可以把相應(yīng)的待識別條目內(nèi)容以字符形式傳遞給識別引擎,就能達到識別的目的[14]。
2.3 LD3320的用戶使用模式
LD3320具有兩種識別模式,分別是“觸發(fā)識別模式”和“循環(huán)識別模式”。兩種不同的識別模式可以通過編程設(shè)置。觸發(fā)識別模式:通過按鍵讓MCU開啟定時識別過程(比如5 s),在這個定時過程中使用者說出要識別列表中的語音關(guān)鍵詞語。直到整個識別過程結(jié)束后,使用者才能再一次觸發(fā)識別[15]。循環(huán)識別模式:MCU 反復(fù)開啟識別過程,如果聲音輸入就不會產(chǎn)生識別結(jié)果,每次識別都有一個定時的識別過程;如果產(chǎn)生了識別結(jié)果,則根據(jù)識別列表的作相應(yīng)處理后(比如播放語音),才允許開啟下一個識別過程。
3主控制器模塊
無線語音遙控系統(tǒng)跟智能小車系統(tǒng)所采用的核心控制器都是ST公司的STM32F103ZET6這一款芯片。其電路圖附錄A所示。該芯片基于ARM Cortex—M3 32位的RISC內(nèi)核,工作頻率最高可達72 MHz,內(nèi)置高速存儲器(256 KB 的閃存和20 KB 的SRAM)。STM32系列提供了全新的32位產(chǎn)品選項,具有高性能、實時、低功耗、低電壓等特性,同時讓高集成度和易于開發(fā)的優(yōu)勢結(jié)合在一起,將32位MCU世界的性能和功效引向一個新的級別。
4 存儲模塊
一般的芯片里面都沒有足夠的儲存空間,然而語音數(shù)據(jù)又必須有個地方存儲,才能正常的播報出來。本系統(tǒng)采用了通用的SD卡模塊,可以隨意擴張內(nèi)存。最主要作用用來保存剪輯的或自己錄制與制作的MP3格式的語音材料,存儲模塊的電路圖如圖3.5所示。
5無線模塊
1、nRF24.L01是一款新型單片射頻收發(fā)器件,工作于2.4 GHz~2.5 GHz ISM頻段,里面有頻率合成器、功率放大器、晶體振蕩器、調(diào)制器等功能模塊,并融合了增強型ShockBurst技術(shù),可通過程序進行配置輸出功率和通信頻道[18]。nRF24L01是低功耗,在以-6 dBm的功率發(fā)射時,也只有9 mA的工作電流;接收的時候,只有12.3 mA工作電流,大量的低功率工作模式(掉電和空閑模式)使設(shè)計節(jié)能更方便。
2、發(fā)射數(shù)據(jù):將nRF24L01設(shè)置為發(fā)射模式,利用SPI協(xié)議把接收地址和數(shù)據(jù)寫到nRF24L01緩存區(qū),CSN為低時才能連續(xù)寫入數(shù)據(jù),發(fā)射時只要配置一次發(fā)射地址就可以,再保持CE為至少10μs高電平和延遲130μs,這樣就能發(fā)射數(shù)據(jù)[19]。
3、接收數(shù)據(jù):將nRF24L01配置為接收模式,延遲130μs,則就為接收狀態(tài),這時只要等待數(shù)據(jù)的到來。當接收到正確地址和CRC時,數(shù)據(jù)包就會被存儲在RX FIFO中,同時RX_DR中斷標志位被置高,IRQ被置低,中斷發(fā)生,MCU這時就會去讀數(shù)據(jù),這樣就接收到數(shù)據(jù)了[20]。
4、無線模塊由STM32F103ZET6直接控制,該單片機通過SPI與nRF24L01相連,其電路圖如圖3.6所示。