陳愛武郭丙琴李 榮
(1. 湖南科技學(xué)院 電子與信息工程學(xué)院, 湖南 永州,425199;2. 湖南科技學(xué)院 教學(xué)質(zhì)量管理處, 湖南 永州,425199)
基于病蟲害聲音識別的自動混藥系統(tǒng)研究*
陳愛武1郭丙琴2李 榮1
(1. 湖南科技學(xué)院 電子與信息工程學(xué)院, 湖南 永州,425199;2. 湖南科技學(xué)院 教學(xué)質(zhì)量管理處, 湖南 永州,425199)
近年來,中國的農(nóng)業(yè)機(jī)械化技術(shù)有了明顯的進(jìn)步,農(nóng)業(yè)自動噴霧技術(shù)從常量噴霧轉(zhuǎn)變?yōu)樽兞繃婌F,實(shí)現(xiàn)了自動混藥和減少了農(nóng)藥殘余問題。但目前的自動在線混藥技術(shù)主要集中在機(jī)械設(shè)備和精度方面的研究,如微流量計(jì)設(shè)計(jì)、流量精度控制等,很少考慮病蟲害。在此基礎(chǔ)上,該文提出了一種基于聲學(xué)事件識別方法的在線變量噴霧系統(tǒng),該方法運(yùn)用了匹配追蹤(Matching Pursuit, MP)算法實(shí)現(xiàn)病蟲害及自然背景等事件的識別,并通過識別結(jié)果進(jìn)行在線混藥的技術(shù)。實(shí)驗(yàn)結(jié)果證明了該方法的可行性。
聲學(xué)事件;變量噴霧; MP算法
隨著信息技術(shù)、計(jì)算機(jī)技術(shù)和傳感網(wǎng)絡(luò)等技術(shù)的快速發(fā)展,音視頻等信號處理技術(shù)在工業(yè)、農(nóng)業(yè)等領(lǐng)域有了較廣泛的應(yīng)用[1,2],如通過音頻事件識別進(jìn)行野生動物監(jiān)控、通過環(huán)境聲音分類來分析自然環(huán)境[3]等等。我國的農(nóng)業(yè)現(xiàn)代化總體水平處于發(fā)展階段,農(nóng)業(yè)機(jī)械技術(shù)處于發(fā)達(dá)國家20世紀(jì)50~60年代的水平[4],落后歐美發(fā)達(dá)國家30~50年。由于農(nóng)業(yè)自動化水平不高,農(nóng)藥的噴灑技術(shù)也相對落后,國內(nèi)農(nóng)藥噴霧很大部分是依靠個人的感知或先驗(yàn)知識進(jìn)行混藥,農(nóng)藥的有效利用率僅為20%~40%[5],很難做到根據(jù)病蟲害實(shí)際情況進(jìn)行噴藥,這樣不僅影響到病蟲害的防治效果,也容易造成農(nóng)藥殘留,對人畜和環(huán)境帶來影響。
目前,國內(nèi)農(nóng)藥噴霧技術(shù)已從常量噴霧技術(shù)轉(zhuǎn)變?yōu)樽兞繃婌F技術(shù),如靜電噴霧、仿形噴霧、自動對靶噴霧、變量噴霧技術(shù)[6]等,這種按需噴藥技術(shù)在很大程度上改變了農(nóng)業(yè)噴霧的觀念,但國內(nèi)對變量噴霧技術(shù)的研究主要集中在機(jī)械設(shè)備自動化和流量控制精度等方面,很少涉及到病蟲害本身。國外雖有基于視頻及圖像處理的變量噴霧系統(tǒng),但視頻信號處理因計(jì)算量較大,成本高,且容易受到光線等天氣因素的影響,所以,視頻或圖像信號處理在農(nóng)業(yè)方面的應(yīng)用并不廣泛。在此基礎(chǔ)上,本文提出一種基于音頻事件識別方法的變量噴霧技術(shù)。由于音頻信號獲取方便,且性能穩(wěn)定,歐美等許多國家已經(jīng)有基于音頻事件識別的廣泛應(yīng)用,如通過對急救車、消防車及警匪車的報(bào)警聲音識別來對交通進(jìn)行調(diào)控、通過對火車站等公共場所的哭喊聲、槍炮聲和尖叫聲等聲音識別開發(fā)出安全監(jiān)控系統(tǒng)等。聲學(xué)事件識別方面的文獻(xiàn)較多,如Chu,Selina等作者提出的環(huán)境聲音分類研究[7],Abcouchacra等在2007年提出了識別30秒自然聲音方法[8];Valero等在2012年采用分層的方法對環(huán)境噪音進(jìn)行識別[9];Zhuang,Xiaodan等人實(shí)現(xiàn)了環(huán)境聲音識別[10];齊曉旭提出的場景依賴的音頻分析[11]等等。本文提出的基于病蟲害聲音識別的方法是識別混雜在復(fù)雜背景音中的病蟲害聲音,識別方法采用了信號稀疏表示的匹配追蹤算法。
農(nóng)藥變量噴霧系統(tǒng)由電路、機(jī)械和控制三個部分組成,電路裝置包括模擬、數(shù)字信號通道、恒溫電路和驅(qū)動模塊等,機(jī)械設(shè)備包括噴油器、流量計(jì)等設(shè)備,控制部分的實(shí)現(xiàn)使用虛擬儀器公司的工控機(jī)、PXI-6221采集卡和NI-LabVIEW8.5版本軟件平臺,PXI-6221是NI公司推出的M系列低價(jià)位多功能數(shù)據(jù)采集卡,它具有2路模擬輸出,16路模擬輸入,24路數(shù)字I/O,分辨率為16bit,采樣率為250ks/s。
變量噴霧系統(tǒng)可以任意設(shè)定流量值,在實(shí)際處理過程總是對采集到的電壓值進(jìn)行處理,電壓值需要根據(jù)流量以及占空比關(guān)系進(jìn)行標(biāo)定。本項(xiàng)目其他論文已有相關(guān)內(nèi)容,在此不做詳細(xì)說明[12],系統(tǒng)框圖如圖1所示。
圖1 農(nóng)藥變量噴霧系統(tǒng)
2.1 MP算法實(shí)現(xiàn)
現(xiàn)實(shí)環(huán)境的音頻事件識別并不是一件容易的事情,因?yàn)橐纛l事件總是混疊在復(fù)雜的背景聲中,目前文獻(xiàn)提供的相關(guān)的音頻事件的識別率也并不算高,如Pasquale Foggia等 (2015)提出一種短時(shí)特征和長時(shí)特征及聽覺字典的方法對玻璃破碎聲(Glass breaking)、槍炮聲(Gunshot)及尖叫聲(Scream)三類音頻事件進(jìn)行識別,其識別率分別是93.6%、81.6%、79.3%。音頻事件識別一般包括特征提取、模型訓(xùn)練和判決等三個步驟。音頻信號不同于語音信號,語音信號雖屬于隨機(jī)信號,但語音信號具有短暫平穩(wěn)性特征,且有固有的基音、共振峰等特性,所以語音信號的識別目前已經(jīng)有非常高的識別率。而音頻信號具有類似噪聲的平坦譜特征,且現(xiàn)實(shí)環(huán)境的音頻信號復(fù)雜多變,很難找到一種能有效區(qū)分多種音頻信號的特征,所以提高音頻信號的識別就要對音頻特征進(jìn)行研究,目前常用于語音信號識別的特征如梅爾頻率倒譜系數(shù)(Mel-Frequency Cepstral Coefficient,MFCC),短時(shí)能量、過零率、頻譜質(zhì)心(Spectral Centroid)、子帶能量(Sub-band Energy)等,這些特征也常用于音頻信號識別,另外像Gabor原子、深度神經(jīng)網(wǎng)絡(luò)(DNN)等方法在音頻信號識別上都有不錯的表現(xiàn)。本文采用匹配追蹤(Matching Pursuit, MP)算法[13],匹配追蹤是一種經(jīng)典的信號稀疏表示方法,其表示形式如(1)式所示。
其中 D ∈ ?M×N( M ? N ), y ∈ ?M, x ∈ ?N。y是觀察信號,即是被稀疏的信號,D通常被稱為字典,因?yàn)镸?N,所以是過完備的字典。D={φ1, φ2,…,φγ}中每一列數(shù)據(jù)φγ稱為原子,該方法的目的是將高維的信號空間表示低維的信號空間,即信號的稀疏表示,如式(2)所示。
這里的Γ的是參數(shù)集,γφ是原子,信號χ的近似分解可表示如式所示。
R(m)表示殘余量,只要給出χ,m和D,MP追蹤法的目的就是找到索引值γi和計(jì)算αγi,(其中i=1,2,…,m ),最小化殘余量R(m)。在迭代算法開始時(shí)設(shè)定,x(0)=0,和R(0)=x。
MP算法是一種貪婪搜索法,最初,MP算法計(jì)算信號χ里字典原子的所有的內(nèi)積,選最大的內(nèi)積的原子為第一個元素,所以原子選擇的標(biāo)準(zhǔn)可表示(4)式
在第一次迭代后,信號χ減去原子0γφ并獲得殘余量(0)R,所以
2.2 MP算法字典選擇
在MP算法中,目的是使用MP作為一個工具用來提取特征,MP算法選擇原子的原理是消除最大的信號殘余能量,也就是在每次分解過程中選擇信號中最有用的原子進(jìn)行分解。那么怎樣選擇MP算法的原子呢?MP分解算法中有不同的原子字典及其性能,如傅里葉變換、Haar字典和Gabor字典等,Gabor字典是MP算法最優(yōu)的字典之一[14],因?yàn)镚abor原子由于有良好的時(shí)-頻特性,一個Gabor原子的實(shí)部可以表示為一個服從高斯分布的能量包絡(luò)和一個余弦函數(shù)的乘積。
其中,n為時(shí)間索引,u為時(shí)域上的能量中心位置,s為時(shí)域能力的衰減速率,控制原子的長度,φ為相位偏移角度,w為原子中心頻率,尺度參數(shù)au,s,φ,w將每個原子規(guī)整到單位能量,即那么通過MP算法可得到音頻特征的時(shí)域、頻域和位置方面的信息,從理論上說可以大大提高特征的區(qū)分性。
3.1 實(shí)驗(yàn)數(shù)據(jù)和實(shí)驗(yàn)平臺
本文的實(shí)驗(yàn)平臺是使用Matlab R2016a,PC機(jī)為DELL臺式電腦,CPU為四核Intel i7-2600,主頻為3.4G Hz,操作系統(tǒng)為64位Win7家庭版,PC機(jī)器內(nèi)存為8G。實(shí)驗(yàn)數(shù)據(jù)為真實(shí)環(huán)境中錄制、專業(yè)音效數(shù)據(jù)庫和音效下載網(wǎng)站下載,錄音設(shè)備采用SONY ICD-UX560F數(shù)碼錄音棒,樣本采用16位量化誤差,采樣率為16K Hz。實(shí)驗(yàn)數(shù)據(jù)分布如表3-1所示。
表3-1 實(shí)驗(yàn)數(shù)據(jù)
3.2 實(shí)驗(yàn)結(jié)果分析
音頻數(shù)據(jù)統(tǒng)一以30ms為幀長,幀移為10ms,加漢明窗濾波,求得信號頻譜,并將不同的其他普特征如譜質(zhì)心,基頻等拼接成23維特征,分類器采用高斯混合模型(Gaussian Mixture Model, GMM),高斯混合度設(shè)置8,實(shí)驗(yàn)采用2-折交叉驗(yàn)證,即將所有數(shù)據(jù)隨機(jī)平均分成2份,每份中每個音效類包括100 個樣本。在第一次實(shí)驗(yàn)中,使用第一份作為訓(xùn)練數(shù)據(jù),第二份作為測試數(shù)據(jù);在第二次實(shí)驗(yàn)中,使用第二份作為訓(xùn)練數(shù)據(jù),第一份作為測試數(shù)據(jù)。實(shí)驗(yàn)結(jié)果為兩次實(shí)驗(yàn)分類結(jié)果的加和。分實(shí)驗(yàn)結(jié)果對風(fēng)聲等非平穩(wěn)信號的識別結(jié)果較差,但對這類類似的病蟲害發(fā)出的聲音還是有相當(dāng)好的識別結(jié)果,如表3-2所示。
表3-2 分類結(jié)果混淆表
從表3-2的識別結(jié)果可以看出,病蟲害從4類背景音中的識別率為97.5%,可說明該方法可以檢測出是否有病蟲害,病蟲害的分布,為自動混藥提供依據(jù)。
本論文提出了一種基于病蟲害聲音識別的在線自動噴霧技術(shù)的方法,該方法是識別混雜在不同背景音下的病蟲害發(fā)出來的聲學(xué)事件,并根據(jù)識別結(jié)果分析病蟲害的分布情況,該方法提取了4類不同的背景聲音及病蟲害的MP特征,并通過GMM模型對新特征進(jìn)行分類和識別,實(shí)驗(yàn)結(jié)果表明病蟲害的識別率為97.5%,證明了該方法可以實(shí)現(xiàn)農(nóng)藥自動在線混藥技術(shù)。
[1]Srbinovska M, Gavrovski C, Dimcev V, Krkoleva A, Borozan V. Environmental parameters monitoring in precision agriculture using wireless sensor networks[J]. Journal of Cleaner Production. 2015,88:297-307.
[2]Ramirez-Villegas J, Lamanna C, van Wijk M, Corner-Dolloff C, Rosenstock T, Girvetz E. Evidence and risk-based planning for a climate-smart agriculture[J]. 2016.
[3]Ma L, Milner B, Smith D. Acoustic environment classification[J]. ACM Transactions on Speech and Language Processing (TSLP). 2006,3(2):1-22.
[4]胡建軍, 雷廷宙, 何曉峰, 李在峰,劉軍偉, 王志偉, et al. 小麥秸稈顆粒燃料冷態(tài)壓縮成型參數(shù)試驗(yàn)研究[J]. 太陽能學(xué)報(bào). 2008,29(2):241-5.
[5]劉俊展, 王小夢, 劉悅上, 劉玉洪.植保機(jī)械發(fā)展現(xiàn)狀及趨勢[J]. 現(xiàn)代農(nóng)業(yè)科技. 2010(17):255.
[6]陳愛武, 劉志壯. 基于 LabVIEW 農(nóng)作物變量噴霧算法研究[J]. 農(nóng)機(jī)化研究. 2013,35(9):44-7.
[7]Chu S, Narayanan S, Kuo C-CJ, editors. Content analysis for acoustic environment classification in mobile robots. AAAI Fall Symposium, Aurally Informed Performance: Integrating Machine Listening and Auditory Presentation in Robotic Systems; 2006.
[8]Abouchacra K, ??TOWSKI T, Gothie J. Detection and recognition of natural sounds[J]. Archives of Acoustics. 2007,32(3):603-16.
[9]Valero X, Alías F. Hierarchical classification of environmental noise sources considering the acoustic signature of vehicle pass-bys[J]. Archives of Acoustics. 2012,37(4):423-34.
[10]Zhuang X, Zhou X, Hasegawa-Johnson MA, Huang TS. Real-world acoustic event detection[J]. Pattern Recognition Letters. 2010,31(12):1543-51.
[11]齊曉旭. 場景依賴的關(guān)鍵音頻事件檢測 [D].北京郵電大學(xué),2013.
[12]陳愛武, 劉志壯, 郭丙琴. 基于LabVIEW 的微流量控制系統(tǒng)的研究[J]. 控制工程. 2014,21(2):168.
[13]Mallat SG, Zhang Z. Matching p u r s u i t s w i t h t i m e-f r e q u e n c y dictionaries[J]. Signal Processing, IEEE Transactions on. 1993,41(12):3397-3415.
[14]Chu S, Narayanan S, Kuo C-C. Environmental sound recognition with time–frequency audio features[J]. Audio, Speech, and Language Processing, IEEE Transactions on. 2009,17(6):1142-1158.
Study on the Automatic Pesticide Mixed System Based on the Acoustic Recognition of Pests
CHEN Ai-wu,GUO Bing-qin,Li Rong
(1.Hunan University of Science and Engineering, School of Electronics and Information Engineering, Yongzhou, Hunan 425199 2.Hunan University of Science and Engineering, Teaching Quality Management Office, Yongzhou, Hunan 425199)
China's agriculture mechanization technology has made a significant progress in recent years. To achieve the on-line pesticide-mixture technology and reduce pesticide residues, the spray technology has been changed from the constant one to the variable one. However, the researches of the automatic liquid-mixture systems are mainly concentrated in the mechanical equipment currently, such as the research of micro-flow meter design and the flow accuracy control and so on while there is little concern on the distribution of the pests. On this basis, this paper proposes a new idea of pesticidemixture based on the recognition of acoustic events of pests, and the Matching Pursuit algorithm is also proposed to identify the pests and the environment sound in the study. The results show the feasibility of the proposed method.
acoustic events; the variable spray; the MP algorithm
S499
A
1674-3083(2016)05-0011-04
2016-10-08
湖南省科學(xué)技術(shù)廳科技計(jì)劃項(xiàng)目:變量噴霧系統(tǒng)嵌入式實(shí)施中的關(guān)鍵問題研究(2014FJ3143);2015年永州市科技計(jì)劃項(xiàng)目(永科發(fā)〔2015〕9號,No.22)。
陳愛武(1976-),男,湖南邵陽人,副高職稱,在讀博士研究生,Email: aiwu_chen@163.com。