• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    DSP語音識別電梯控制系統(tǒng)的設(shè)計和實現(xiàn)

    2011-06-30 07:55:00陳衛(wèi)兵何必都黃永坤鄒豪杰張洪波
    關(guān)鍵詞:端點寄存器電梯

    陳衛(wèi)兵,何必都,黃永坤,鄒豪杰,張洪波

    (湖南工業(yè)大學(xué) 計算機(jī)與通信學(xué)院,湖南 株洲 412007)

    0 引言

    語音識別是將原始語音經(jīng)過預(yù)處理后進(jìn)行特征提取,再與事先經(jīng)測試和訓(xùn)練后所得并存儲到計算機(jī)的標(biāo)準(zhǔn)參考模型進(jìn)行比較,最后得出判定和識別結(jié)果。20年來,語音識別技術(shù)取得了較大發(fā)展,它經(jīng)歷了從孤立詞、小詞匯量、特定人到大詞匯量、非特定人的發(fā)展歷程[1]。但語音識別的計算量較大,難以實時實現(xiàn),此問題制約著它在各個領(lǐng)域內(nèi)的應(yīng)用。目前,隨著數(shù)字信號處理(digital signal processing,DSP)專用集成電路技術(shù)的迅速發(fā)展[2-3],語音識別,尤其是計算量較小的非特定人的孤立詞識別的實時實現(xiàn)成為可能。

    電梯行業(yè)中,傳統(tǒng)的電梯控制器要求人們通過按電梯的樓層按鈕來確定需要到達(dá)的區(qū)域。當(dāng)電梯中人數(shù)較多、較擁擠時,按鍵很不方便??紤]到語音的非接觸傳輸特點,將語音識別和控制技術(shù)用于電梯中,將使傳統(tǒng)的電梯更加人性化、便捷化。因此,本文擬以TMS320C6713 DSP芯片作為系統(tǒng)運算控制中心,TLV320AIC23B芯片作為語音輸入、輸出的模擬前端,EP2C5Q208C8 FPGA芯片作為系統(tǒng)IO擴(kuò)展,將這3個部分有機(jī)結(jié)合,開發(fā)基于非特定人、孤立詞、小詞匯量的嵌入式語音識別電梯控制系統(tǒng),以解決多人乘坐電梯時按鍵不方便的問題。

    1 系統(tǒng)設(shè)計方案

    圖1 系統(tǒng)總體結(jié)構(gòu)框圖Fig.1 Block diagram for the overall system

    從圖1可看出,所設(shè)計的語言識別控制系統(tǒng)主要由TMS320C6713 DSP語音識別處理芯片、TLV320AIC23B語音輸入/輸出的模擬前端芯片、電梯控制接口擴(kuò)展FPGA芯片和其他輔助芯片(外部儲存器SDRAM選用MT48LC4M16A2,大小為64 MB,對應(yīng)地址為:0x80000000H~0x82FFFFFFH。

    FALSH采用AM29LV800B,大小為2 MB,對應(yīng)地址為0x90000000H~0x90200000 H組成。TMS320C6713為高性能32位浮點DSP,適用于專業(yè)音頻信號處理,主頻達(dá)300 MHz,處理速度達(dá)2400 MIPS/1800 MFLOPS,能滿足快速運算和處理時間的語音識別要求。

    TI公司的TLV320AIC23B是一款集成ADC(application data center),DAC(digital analog canverter)于一體的模擬接口電路,采用先進(jìn)的Sigma-delta過采樣技術(shù),可在8 kB~96 kB采樣率范圍內(nèi)提供16,20,24,32 位采樣,ADC和DAC的信噪比可分別達(dá)90 dB和100 dB。其與外圍音頻輸入設(shè)備的接口電路如圖2所示。

    圖2 音頻輸入電路Fig.2 Audio input circuit

    TMS320C6713與TLV320AIC23B連接方式見圖3。

    圖3 TMS320C6713與TLV320AIC23B硬件連接Fig.3 The hardware connection between TMS320C6713 and TLV320AIC23B

    TLV320AIC23B的控制口用于設(shè)置其工作參數(shù),采用I2C總線口1實現(xiàn);數(shù)據(jù)口用于傳輸TLC320AD50B的A/D,D/A數(shù)據(jù),TLV320AIC23B的數(shù)據(jù)口與TMS320C6713的McBsp0接口連接,用于芯片間的數(shù)據(jù)交換。

    2 算法及軟件實現(xiàn)

    2.1 語音識別算法

    語音識別系統(tǒng)的總體方案見圖4。

    圖 4 語音識別方案Fig.4 The program of speech recognition

    語音識別系統(tǒng)首先將收集到的語音信號進(jìn)行預(yù)處理,包括預(yù)加重、加窗、端點檢測等;然后進(jìn)行特征提取,即從語音波形中提取出隨時間變化的語音特征序列;最后,將其訓(xùn)練為聲學(xué)模型,并且在模式匹配中運用識別算法進(jìn)行匹配,得到最佳識別結(jié)果。

    2.2 端點檢測

    端點檢測之前先對采集到的語音信號進(jìn)行預(yù)加重,以去除語音信號中的低頻噪聲,然后選用hamming窗做加窗處理。主要依據(jù)為hamming窗主瓣比矩形窗的主瓣寬度大1倍,同時其帶外衰減也比矩形窗大1倍多,因而不會損失信號中的高頻成分。加窗后將語音信號分割為幀。

    端點檢測就是從含噪聲的信號中檢測出說話人語音信號的起始點和結(jié)束點。只有正確檢測出語音信息段才能正確地進(jìn)行語音處理。端點檢測的時域處理方法是:首先在當(dāng)前環(huán)境情況下,采集一段無聲語音,求出平均過零率。由于采集聲音信號的最初的短時段為無語音段,僅有均勻分布的背景噪聲信號。這樣就可以用已知為“靜態(tài)”的最初幾幀(一般取10幀)信號計算其過零率閾值,以此作為無語音段,當(dāng)過零率變化時作為語音的起始。語音結(jié)束點的獲得方法與此相同,從后向前搜索,當(dāng)超過過零率的變化時作為語音的結(jié)束。

    2.3 特征提取

    特征參數(shù)提取[4]是指從語音信號中抽取有效的語音信號特征,提取算法如下:

    1)對信號進(jìn)行短時傅里葉變換得到頻譜。

    2)求頻譜幅度的平方得到能量譜,再用一組三角形濾波器在頻域內(nèi)對能量譜進(jìn)行帶通濾波;設(shè)濾波器數(shù)為M,濾波后得到的輸出為X(k),k=1,2,…,M。

    3)對濾波器組的輸出取對數(shù),然后對它做2M點逆離散傅里葉變換,得到Mel頻率倒譜系數(shù)(mel frequency cepstrum coefficient,MFCC)。因為對稱性的關(guān)系,變換式可簡化表示為:

    式中L 為MFCC系數(shù)的個數(shù),本系統(tǒng)取24個。

    2.4 模板匹配

    采用動態(tài)時間彎折(dynamic time warping,DTW)算法[5]進(jìn)行模板匹配:假設(shè)參考模板的MFCC系數(shù)向量序列為X=(x1, x2,…, xi),輸入語音的MFCC系數(shù)向量序列為Y=(y1, y2,…, yj),i≠j。DTW 算法就是要尋找一個最佳的時間規(guī)正函數(shù),使待測語音的時間軸j非線性地映射到參考模板的時間軸i上,因而總的累計差值最小。算法過程如圖5所示。

    圖5 DTW算法過程Fig.5DTW algorithm process

    圖5中曲線連接起來的點就是模板與待測語音信號間的距離d(xi(n),yj(n)),亦稱為局部匹配距離。DTW 算法就是通過局部優(yōu)化的方法實現(xiàn)加權(quán)距離總和最小,也就是相似度最大,即

    2.5 軟件實現(xiàn)

    軟件設(shè)計以TI DSP/BIOS實時多任務(wù)操作系統(tǒng)為軟件設(shè)計基礎(chǔ),采用圖像界面配置DSP/BIOS,在開發(fā)環(huán)境中自動生成.cmd文件。使用TI的TMS320C6000 Chip Support LibraryAPI Reference Guide進(jìn)行EMIF,McBsp,PLL等初始化操作。通過I2C總線端口1配置TLV320AIC23B芯片,McBsp0口與TLV320AIC23B相連實現(xiàn)語音信號采集。端點檢測、MFCC和DTW模板匹配用C語言編寫。系統(tǒng)實現(xiàn)的主流程見圖6。

    圖6 程序主框圖Fig.6 The block diagram of main program

    TLV320AIC23 內(nèi)部有11個16位寄存器,這16位控制字中,B[15~9]為寄存器的地址,B[8~0]為要寫入寄存器的數(shù)據(jù)。寫入11個寄存器的數(shù)值如下:左聲道輸入控制=0x17;右聲道輸入控制=0x17;左耳機(jī)通道控制=0x7F;右耳機(jī)通道控制=0x7F;模擬音頻通道控制=0x1C;數(shù)字音頻通道控制=0x1;啟動控制=0;數(shù)字音頻格式=0x4F;樣本速率控制=0x3F;數(shù)字界面激活=0x01;初始化寄存器=0。設(shè)置完成后,啟動A/D 轉(zhuǎn)換,將轉(zhuǎn)換后的數(shù)據(jù)存儲在DSP的內(nèi)部存儲器中,每次采樣128點。數(shù)據(jù)采集流程見圖7。

    圖7 音頻數(shù)據(jù)采集Fig.7 Audio data acquisition

    3 測試結(jié)果

    每次測試的采樣數(shù)為128點,采樣頻率設(shè)為44.1 kHz,樣本大小為16位。在類似電梯的環(huán)境中進(jìn)行測試,所得結(jié)果見表1。

    從表1中可以看出,所設(shè)計的控制系統(tǒng)總的平均識別率大于80%。且女性的測試結(jié)果普遍比男性好,這應(yīng)該歸屬于男性聲音中濁音分量比女性重,導(dǎo)致在系統(tǒng)識別時難度加大。

    表1 語音識別電梯控制測試結(jié)果Table 1Test results of elevator speech recognition control

    4 結(jié)語

    本研究是在以TMS320c6713為控制核心,TLV320AIC23B芯片為語音輸入、輸出的模擬前端,EP2C5Q208C8 FPGA芯片為系統(tǒng)IO擴(kuò)展的情況下,設(shè)計和實現(xiàn)了非特定人、孤立詞、小詞匯量的嵌入式語音識別電梯控制系統(tǒng)。測試結(jié)果表明:所設(shè)計的系統(tǒng)的識別和控制效率達(dá)80%以上,該系統(tǒng)具有較好的應(yīng)用前景。

    [1]趙 力.語音信號處理[M].北京:機(jī)械工業(yè)出版社,2009:114-117.Zhao Li.Speech Signal Processing[M].Beijing:Mechanical Industry Press,2009:114-117.

    [2]周 霖.DSP通信工程技術(shù)應(yīng)用[M].北京:國防工業(yè)出版社,2004:145-189.Zhou Lin.DSP Communications Engineering Technology[M].Beijing:National Defence Industry Press,2004:145-189.

    [3]鄒 彥.DSP原理及應(yīng)用[M].北京:電子工業(yè)出版社,2005:114-117.ZouYan.DSP Principles and Applications[M].Beijing:Electronic Industry Press,2005:114-117.

    [4]侯雪梅,田 磊.基于Mel倒頻特征和RBF網(wǎng)絡(luò)的孤立詞語音識別方法[J].西安郵電學(xué)院學(xué)報,2008,13(3):114-117.Hou Xuemei, Tian Lei.Speech Recognition Method of Isolated Words Based on Mel Cpestrum Feature and RBF Neural Network[J].Journal of Xi’an University of Post and Telecommunications,2008,13(3):114-117.

    [5]萬 春.基于DTW的語音識別應(yīng)用系統(tǒng)研究與實現(xiàn)[J].集美大學(xué)學(xué)報,2002,7(2):104-108.Wan Chun.Research and Application of DTW-Based Speech Recognition[J].Journal of Jimei University,2002,7 (2):104-108.

    猜你喜歡
    端點寄存器電梯
    非特征端點條件下PM函數(shù)的迭代根
    Lite寄存器模型的設(shè)計與實現(xiàn)
    不等式求解過程中端點的確定
    被困電梯以后
    分簇結(jié)構(gòu)向量寄存器分配策略研究*
    參數(shù)型Marcinkiewicz積分算子及其交換子的加權(quán)端點估計
    電梯不吃人
    基丁能雖匹配延拓法LMD端點效應(yīng)處理
    被困電梯,我不怕
    乘電梯
    小說月刊(2015年4期)2015-04-18 13:55:18
    库伦旗| 和林格尔县| 榆中县| 沿河| 商水县| 新河县| 莱州市| 鞍山市| 米易县| 图片| 梅河口市| 兴国县| 长顺县| 清苑县| 安吉县| 驻马店市| 海宁市| 来凤县| 枞阳县| 龙游县| 淮南市| 政和县| 平潭县| 荥阳市| 辽阳县| 铁力市| 泌阳县| 锡林浩特市| 仁寿县| 施甸县| 萨迦县| 石棉县| 荥阳市| 来宾市| 突泉县| 疏勒县| 渝北区| 连云港市| 泊头市| 习水县| 泰和县|