房鑫坤
(廣東省廣州生態(tài)環(huán)境監(jiān)測(cè)中心站 廣東省廣州市 511400)
語音在人類社會(huì)中歷史悠久且存在廣泛,是人類社會(huì)最基本、最常見的交流工具。生理上的語音是由聲道中源信號(hào)激發(fā)而產(chǎn)生的[1]。隨著人類科技的發(fā)展,語音識(shí)別技術(shù)也逐漸應(yīng)用到各類生產(chǎn)生活相關(guān)的設(shè)備中?,F(xiàn)在,語音識(shí)別系統(tǒng)已經(jīng)許多領(lǐng)域得到應(yīng)用,以實(shí)現(xiàn)各種任務(wù)的自動(dòng)化,如航班預(yù)訂、銀行業(yè)務(wù)、天氣信息等[2]。但在環(huán)境監(jiān)測(cè)領(lǐng)域中,語音識(shí)別技術(shù)還未普及。一方面,隨著環(huán)境監(jiān)測(cè)設(shè)備的不斷完善和升級(jí),環(huán)境監(jiān)測(cè)設(shè)備的功能越來越全面,操作界面和按鈕也越來越復(fù)雜;另一方面,運(yùn)維人員在檢查和操作環(huán)境監(jiān)測(cè)設(shè)備時(shí),仍舊需要進(jìn)行大量手動(dòng)操作來實(shí)現(xiàn)各項(xiàng)功能。為環(huán)境監(jiān)測(cè)設(shè)備增加語音識(shí)別功能,或許能夠減輕運(yùn)維人員的繁瑣操作,從而實(shí)現(xiàn)設(shè)備的智能化應(yīng)用。基于這種現(xiàn)狀,本文嘗試?yán)肁rduino平臺(tái)設(shè)計(jì)并成功制作了一個(gè)語音識(shí)別設(shè)備,它具有語音識(shí)別、溫濕度測(cè)量、光線檢測(cè)等功能。該設(shè)備的成功設(shè)計(jì)說明語音識(shí)別功能或許可以作為一種功能模塊加入到環(huán)境監(jiān)測(cè)設(shè)備中,幫助操作人員更高效地工作。
本文其余部分如下:第2部分將詳細(xì)介紹語音識(shí)別技術(shù)和環(huán)境監(jiān)測(cè)設(shè)備的相關(guān)背景,第3部分將介紹基于Arduino的語音識(shí)別設(shè)備,第4部分將對(duì)語音識(shí)別功能可行性進(jìn)行總結(jié),探討語音識(shí)別技術(shù)在環(huán)境監(jiān)測(cè)設(shè)備中應(yīng)用的可行性。
近年來,語音識(shí)別技術(shù)已經(jīng)成為許多行業(yè)中的熱門話題,被認(rèn)為是人與機(jī)器溝通的橋梁[3]。語音識(shí)別系統(tǒng)有四個(gè)主要組成部分:信息源、語言通道、發(fā)音通道和聲學(xué)通道。圖1為一個(gè)普通語音識(shí)別模型的識(shí)別體系結(jié)構(gòu)。
圖1:語音識(shí)別模型的結(jié)構(gòu)
語音識(shí)別系統(tǒng)的建立,是基于如下數(shù)學(xué)公式:
通過公式(1)和公式(2)我們可以得到公式(3):
其中,
W是說話者想表達(dá)的一系列詞語。
Arduino是由Massimo Banzi于2005年發(fā)明的一個(gè)方便靈活的面向工程師的開源電子原型平臺(tái)。Arduino電路板是采用多種微處理器和控制器設(shè)計(jì)的。這些板配有一組數(shù)字和模擬I/O引腳,連接各種擴(kuò)展板或面包板和其他電路。這些板有串行通信接口,包括一些型號(hào)上的通用串行總線(USB),用于從個(gè)人電腦加載程序。微控制器通常使用C/ c++編程語言。圖2顯示了一個(gè)典型的Arduino設(shè)備的結(jié)構(gòu)。
圖2:Arduino的結(jié)構(gòu)
Arduino是一個(gè)易于使用的開源硬件產(chǎn)品,界面豐富。Arduino可以支持SPI、IIC和UART串行通信。它還可以通過控制燈光、馬達(dá)和其他設(shè)備,通過各種傳感器感知環(huán)境,以反饋和影響環(huán)境。它沒有復(fù)雜的單片機(jī)底層代碼,沒有難懂的匯編,只有簡(jiǎn)單實(shí)用的功能。Arduino只有一個(gè)簡(jiǎn)單的編程環(huán)境IDE,有很大的自由度,因此它可以有非常高的性能。標(biāo)準(zhǔn)化的界面格局為它的不斷優(yōu)化奠定了堅(jiān)實(shí)的基礎(chǔ)。
無論是科學(xué)家、政策制定者還是普通公眾,都在關(guān)注著環(huán)境監(jiān)測(cè)領(lǐng)域的各項(xiàng)成果[4]。隨著科技的不斷發(fā)展,環(huán)境監(jiān)測(cè)領(lǐng)域不斷涌現(xiàn)出新的環(huán)境監(jiān)測(cè)設(shè)備,例如熱電(Thermo Electron)公司開發(fā)出42i、43i、48i、49i、146i等一系列空氣污染物監(jiān)測(cè)儀器及動(dòng)態(tài)校準(zhǔn)儀器。隨著居民對(duì)環(huán)境質(zhì)量的不斷重視,環(huán)境監(jiān)測(cè)設(shè)備的需求量也不斷增大。相關(guān)統(tǒng)計(jì)顯示,我國環(huán)境監(jiān)測(cè)設(shè)備2016年銷售額已達(dá)64億人民幣,且仍呈增長(zhǎng)趨勢(shì)[5]。面對(duì)不斷增長(zhǎng)的需求,如何將環(huán)境監(jiān)測(cè)設(shè)備進(jìn)行改進(jìn)成了人們關(guān)注的熱點(diǎn),而語音識(shí)別這一智能化功能便是一個(gè)很好的切入點(diǎn),能夠?yàn)榄h(huán)境監(jiān)測(cè)設(shè)備的智能化操作提供可能。
最終完成的設(shè)備功能包括語音識(shí)別,溫濕度檢測(cè),光強(qiáng)檢測(cè),語音控制小燈泡開關(guān)。
組件包括:Arduino UNO、LD3320、SYN6288、DHT11、PT550、繼電器模塊、LED、揚(yáng)聲器。圖3 (a)-(g)顯示了該裝置的組成部分。
圖3
LD3320是一種特殊的芯片,它集成了一個(gè)語音識(shí)別處理器和一些外部電路,包括AD/DA轉(zhuǎn)換器、麥克風(fēng)接口、音頻輸出接口,該芯片不需要任何外部輔助芯片如Flash、RAM等,而是把這些功能直接集成在現(xiàn)有產(chǎn)品中,可執(zhí)行語音識(shí)別、播放聲音和人機(jī)對(duì)話功能,此外,關(guān)鍵字列表的識(shí)別可以是任何動(dòng)態(tài)編輯。SYN6288是一款語音合成芯片,通過異步串口接收用于合成的文本,實(shí)現(xiàn)文本與語音的轉(zhuǎn)換。DHT11溫濕度傳感器是具有校準(zhǔn)數(shù)字信號(hào)輸出的溫度和濕度傳感器。PT550模塊可以檢測(cè)光強(qiáng),并將模擬電壓信號(hào)反射回Arduino控制器,可以通過設(shè)置電壓水平的閾值來觸發(fā)其他單元。
在軟件部分,本實(shí)驗(yàn)將語音識(shí)別功能分為初始化模塊、溫度感應(yīng)模塊、光源開關(guān)模塊、光照感應(yīng)模塊和語音識(shí)別模塊。初始化模塊中包含TimeOne、avr/wdt、Syn6288、DHT等頭文件,同時(shí)定義相關(guān)語音指令,并對(duì)Arduino的相應(yīng)端口進(jìn)行定義。通過switch函數(shù)執(zhí)行不同的功能模塊,最終實(shí)現(xiàn)了語音響應(yīng)、溫濕度讀取及播報(bào)、光強(qiáng)讀取及播報(bào)、錯(cuò)誤提示等功能。相關(guān)代碼及演示視頻不對(duì)外公布,如有需要可與作者聯(lián)系。
圖4顯示了基于Arduino的語音識(shí)別設(shè)備的外觀及構(gòu)造。語音識(shí)別設(shè)備的功能可以通過圖5所示的流程圖來體現(xiàn)。
圖4:語音識(shí)別設(shè)備外觀與構(gòu)造
圖5:語音識(shí)別設(shè)備框圖
在應(yīng)用過程中,將該語音識(shí)別設(shè)備命名為“小寶”。當(dāng)用戶想要激活這個(gè)設(shè)備時(shí),只需要叫它的名字,它就會(huì)回答用戶。激活設(shè)備后,用戶可以向語音識(shí)別設(shè)備發(fā)出不同指令,如“當(dāng)前的溫度和濕度怎么樣?”,或者“現(xiàn)在需要開燈嗎?”,語音識(shí)別設(shè)備通過溫濕度傳感器和光強(qiáng)傳感器獲取環(huán)境數(shù)據(jù),閾值判斷后會(huì)給用戶答案,執(zhí)行對(duì)應(yīng)功能。當(dāng)用戶給出錯(cuò)誤的指令,設(shè)備會(huì)語音播報(bào)錯(cuò)誤提示。試驗(yàn)測(cè)得該設(shè)備語音識(shí)別成功率如表1所示。
表1:語音識(shí)別成功率
考慮到語音識(shí)別設(shè)備的現(xiàn)實(shí)價(jià)值,本文認(rèn)為將語音識(shí)別技術(shù)應(yīng)用到環(huán)境監(jiān)測(cè)設(shè)備中具有可期的前景,主要原因有三個(gè):
(1)語音識(shí)別技術(shù)相對(duì)成熟,已有理論數(shù)學(xué)模型,且其余領(lǐng)域的成功產(chǎn)品也可為環(huán)境監(jiān)測(cè)設(shè)備相關(guān)技術(shù)提供參考;
(2)語音識(shí)別功能可以實(shí)現(xiàn)人對(duì)環(huán)境監(jiān)測(cè)設(shè)備的智能操作,節(jié)約運(yùn)行維護(hù)時(shí)間且避免繁瑣操作;
(3)可促進(jìn)環(huán)境監(jiān)測(cè)設(shè)備面板布局進(jìn)一步改善及功能按鈕進(jìn)一步優(yōu)化。
雖然語音識(shí)別技術(shù)在環(huán)境監(jiān)測(cè)設(shè)備中有一定的應(yīng)用價(jià)值,但相關(guān)技術(shù)的應(yīng)用仍然存在一些問題,例如:
(1)現(xiàn)有的語音識(shí)別技術(shù)的識(shí)別率不高且提升困難;
(2)大多數(shù)語音識(shí)別技術(shù)只能識(shí)別一種語言;
(3)環(huán)境監(jiān)測(cè)設(shè)備的運(yùn)行維護(hù)已有成熟規(guī)范,增加語音識(shí)別功能后仍需花費(fèi)時(shí)間完成對(duì)新設(shè)備操作規(guī)范的編寫。
總而言之,語音識(shí)別功能與環(huán)境監(jiān)測(cè)設(shè)備的結(jié)合或許可以成為環(huán)境監(jiān)測(cè)設(shè)備下一步改進(jìn)的方向,但實(shí)際應(yīng)用過程中仍會(huì)面臨相當(dāng)多的困難,這需要我們進(jìn)一步研究并找出解決問題的方案。