代雨婷,周 博,王 俊
電子鼻技術(shù)在棉花早期棉鈴蟲蟲害檢測中的應(yīng)用
代雨婷1,周 博2,王 俊1※
(1. 浙江大學(xué)生物系統(tǒng)工程與食品科學(xué)學(xué)院,杭州 310058;2. 鹽城工學(xué)院機(jī)械工程學(xué)院,鹽城 224051)
為了更好地獲取棉花蟲害信息,該文使用電子鼻和氣質(zhì)聯(lián)用技術(shù)對受到不同數(shù)量棉鈴蟲早期危害的棉花進(jìn)行檢測?;跉赓|(zhì)聯(lián)用技術(shù)獲得了棉花揮發(fā)物的成分和含量,基于電子鼻響應(yīng)曲線提取了穩(wěn)定值、面積值、平均微分值、小波能量值和多項(xiàng)式擬合曲線參數(shù)值5種特征值,篩選出3種較優(yōu)單特征:穩(wěn)定值、平均微分值和面積值,之后基于多特征分別使用多層感知神經(jīng)網(wǎng)絡(luò)、徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)和極限學(xué)習(xí)機(jī)3種神經(jīng)網(wǎng)絡(luò)方法進(jìn)行分類分析。最后采用支持向量機(jī)回歸分別基于3種較優(yōu)單特征及多特征對危害棉花的棉鈴蟲數(shù)量進(jìn)行回歸預(yù)測。結(jié)果表明:多特征的分類效果優(yōu)于單特征,基于多特征“穩(wěn)定值和平均微分值”和極限學(xué)習(xí)機(jī)分類效果最好,訓(xùn)練集和測試集的分類正確率均達(dá)到100%。多特征的預(yù)測能力優(yōu)于單特征,基于多特征“面積值和平均微分值”的回歸模型預(yù)測效果最佳,訓(xùn)練集回歸模型的決定系數(shù)(2)和均方根誤差(RMSE)分別為0.994 0和0.086 0,測試集回歸模型的2和RMSE分別為0.923 0和0.370 9,電子鼻對棉花早期棉鈴蟲蟲害具有較好的區(qū)分和預(yù)測能力,電子鼻在棉花早期棉鈴蟲蟲害中的檢測具有一定的應(yīng)用潛力。
電子鼻;神經(jīng)網(wǎng)絡(luò);預(yù)測;棉花;棉鈴蟲;特征選擇
棉鈴蟲是棉花的三大主要害蟲之一[1],常以幼蟲鉆蛀蕾鈴為害,引起棉鈴腐爛或造成僵瓣,給棉花生產(chǎn)造成巨大損失。因此,對其進(jìn)行檢測并及時(shí)防治對于提高棉花生產(chǎn)和質(zhì)量具有重要意義。然而傳統(tǒng)方法如聲學(xué)檢測法[2]、圖像識(shí)別法[3]和光譜成像技術(shù)[4]等在復(fù)雜的棉田環(huán)境中的使用具有局限性。已有大量研究表明,植物在遭受蟲害時(shí)揮發(fā)物會(huì)發(fā)生變化[5-6],并且遭受蟲害的情況不同,揮發(fā)物有所差異[7-8]。因此,可以考慮通過植物揮發(fā)物的檢測來對棉花的棉鈴蟲蟲害情況進(jìn)行判斷,而電子鼻是一種分析、識(shí)別和檢測復(fù)雜氣味和大多數(shù)揮發(fā)性成分的儀器,具有快速、無損等優(yōu)點(diǎn)[9],是實(shí)現(xiàn)植物揮發(fā)物檢測的較佳手段之一。
隨著電子鼻技術(shù)不斷發(fā)展和完善,電子鼻在食品[10-11]、農(nóng)業(yè)[12-14]、醫(yī)藥[15-16]、環(huán)境[17-18]等方面有不少應(yīng)用和研究成果。目前,國外已經(jīng)有一些研究者將電子鼻用于棉花蟲害的檢測,并且取得了初步性的成果,但是仍然存在對棉花受蟲害情況診斷準(zhǔn)確率不高的問題[19-21]。特征提取是影響電子鼻識(shí)別準(zhǔn)確率的關(guān)鍵因素之一,特征提取是基于一組特征參數(shù)進(jìn)行的,為了提高電子鼻的蟲害識(shí)別準(zhǔn)確率,可以對特征參數(shù)的提取進(jìn)行優(yōu)化[22-24]。本文針對棉花受到不同數(shù)量棉鈴蟲的早期危害進(jìn)行研究,采用電子鼻和氣質(zhì)聯(lián)用技術(shù)對受蟲害棉花進(jìn)行檢測,氣質(zhì)聯(lián)用技術(shù)與電子鼻相結(jié)合,可更加可靠地實(shí)現(xiàn)對揮發(fā)物的檢測。為了提高電子鼻識(shí)別蟲害的準(zhǔn)確率,分別采用不同種類的單特征參數(shù)和多特征參數(shù)進(jìn)行電子鼻的蟲害區(qū)分能力和預(yù)測能力的研究,探索電子鼻技術(shù)在棉花棉鈴蟲蟲害檢測中應(yīng)用的可行性。
試驗(yàn)材料:本試驗(yàn)所采用的棉花品種為冀棉14號(hào),棉花種于大小24 cm(直徑)×19 cm(盆高)的花盆中,普通泥土和營養(yǎng)土比例為1:1[25],生長于室外自然條件,不施農(nóng)藥,定期澆水,將液體肥(海博氏超濃縮深海全營養(yǎng)促長精華,購于四川海博氏生物科技有限公司)按1:1 000的體積比溶于水,分別于棉花幼苗期、蕾期和花鈴期按需施肥,待棉花長出棉鈴時(shí)用于試驗(yàn),約為12周。
本試驗(yàn)采用的2齡棉鈴蟲由河南省濟(jì)源白云實(shí)業(yè)有限公司提供,試驗(yàn)前,將棉鈴蟲置于溫度(26±1)℃、相對濕度40%~50%的環(huán)境中,使其盡快恢復(fù)正常的生長發(fā)育。
本試驗(yàn)采用的電子鼻為PEN3型電子鼻系統(tǒng)(德國Airsense公司),該電子鼻的氣體傳感器陣列由10個(gè)金屬氧化物半導(dǎo)體傳感器組成,不同傳感器對不同類型的揮發(fā)物靈敏性不同,具體如表1。本試驗(yàn)使用的氣相色譜-質(zhì)譜聯(lián)用儀(GC-MS)為安捷倫7890A型號(hào)的氣相色譜和5975C型號(hào)的質(zhì)譜。
表1 PEN3型電子鼻傳感器組成及主要特性
1.3.1 電子鼻檢測方法
為了探究電子鼻對受到不同數(shù)量棉鈴蟲危害的棉花的響應(yīng),試驗(yàn)組安排如下:對照組(健康棉花)、“一株棉花+1條棉鈴蟲”、“一株棉花+2條棉鈴蟲”和“一株棉花+3條棉鈴蟲”,共4組,每組處理設(shè)置20個(gè)重復(fù)樣品,共80盆棉花用于試驗(yàn)。試驗(yàn)前,使棉鈴蟲饑餓24 h。分別按照試驗(yàn)組安排于8:00將相應(yīng)數(shù)量棉鈴蟲放置于棉花植株上,之后立即采用保鮮袋(60 cm×40 cm)將棉花植株套住,采用棉線將保鮮袋底部扎住,保證頂空氣體穩(wěn)定,棉花受棉鈴蟲危害6 h后進(jìn)行檢測,棉鈴蟲低齡幼蟲(2齡)和短時(shí)間侵染(6 h)的設(shè)置是為了實(shí)現(xiàn)早期檢測。電子鼻的檢測參數(shù)為:清洗傳感器時(shí)間60 s,速率為600 mL/min,檢測時(shí)間為90 s,速率為400 mL/min。
1.3.2 氣相色譜-質(zhì)譜聯(lián)用技術(shù)檢測方法
棉花揮發(fā)物的收集:采用吹掃捕集裝置收集揮發(fā)物,采用保鮮袋完全包裹住棉花植株的花盆和土壤,試驗(yàn)組安排同電子鼻試驗(yàn),每組處理設(shè)置3個(gè)重復(fù)樣品。接蟲后將棉花植株放入吹掃捕集裝置,待裝置收集6 h后,取下吸附柱進(jìn)行檢測。
揮發(fā)物檢測:取下吸附柱后,使用0.3 mL的二氯甲烷溶液分3次進(jìn)行淋洗,共0.9 mL,在淋洗后的溶液加入10L體積分?jǐn)?shù)為5×10-3L/L的乙酸辛酯(溶質(zhì))二氯甲烷(溶劑)溶液作為內(nèi)標(biāo)物,取樣針取2L溶液進(jìn)樣檢測。
色譜檢測條件:采用HP-5MS色譜柱(30 m× 0.25 mm×0.25m),載氣為氦氣,流速2 mL/min。升溫程序:初始溫度50 ℃保持2 min,以5 ℃/min的速率升溫至180 ℃,保持0.1 min,然后以10 ℃/min的速率升溫至250 ℃,保持20 min。質(zhì)譜條件:離子化方式為電子轟擊式電離(EI),電子能量為70 eV,四極桿溫度為150 ℃,離子源溫度為230 ℃,接口溫度為280 ℃,質(zhì)量范圍為30~50 amu。
電子鼻數(shù)據(jù)分析:從電子鼻傳感器曲線中提取5種特征值:穩(wěn)定值(85 s響應(yīng)值)、面積值、平均微分值、小波能量值和多項(xiàng)式擬合曲線參數(shù)值,采用主成分分析(principle component analysis,PCA)對5種特征值進(jìn)行初步分析,再分別基于多層感知器神經(jīng)網(wǎng)絡(luò)[26](multi-layer perceptron neural network,MLPNN)、徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)[27](radial basis function neural network,RBFNN)和極限學(xué)習(xí)機(jī)[28](extreme learning machine,ELM)對5種特征值的分類效果進(jìn)行分析,這3種神經(jīng)網(wǎng)絡(luò)目前應(yīng)用廣泛且各有特點(diǎn),MLPNN具有較好的泛化能力和容錯(cuò)能力,RNFNN具有較好的收斂性和較快的學(xué)習(xí)速度,而ELM相比傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)可在保證學(xué)習(xí)精度的情況下具有更快的學(xué)習(xí)速度,這3種神經(jīng)網(wǎng)絡(luò)方法均可用于非線性分類,并且MLPNN和RBFNN均可直接在IBM SPSS Statistic 24.0軟件(美國SPSS公司)上運(yùn)行,方便易操作,因此選取這3種神經(jīng)網(wǎng)絡(luò)方法用于本試驗(yàn)的結(jié)果分析。篩選出穩(wěn)定值、面積值和平均微分值3種較優(yōu)特征值,將3種特征進(jìn)行隨機(jī)組合,在此基礎(chǔ)上再進(jìn)行分類分析。最后采用支持向量機(jī)回歸[29](support vector machine regression,SVR)分別基于3種較優(yōu)單特征值和多特征值建立危害棉花的棉鈴蟲數(shù)量的回歸預(yù)測模型,選出較優(yōu)的回歸模型。
揮發(fā)物的定性和定量分析:未知化合物的定性主要通過NIST質(zhì)譜庫進(jìn)行檢索,并與發(fā)表文獻(xiàn)比較,未知化合物使用內(nèi)標(biāo)法進(jìn)行定量,定量計(jì)算如公式(1)~(2)所示。
式中0和分別為內(nèi)標(biāo)物和未知化合物的質(zhì)量,g。0和0分別為內(nèi)標(biāo)物的體積(L)和密度(g/cm3),均已知,即0可知。為未知揮發(fā)物經(jīng)GC-MS檢測后在GC-MS圖譜中的峰面積,0為內(nèi)標(biāo)物在GC-MS圖譜中的峰面積。經(jīng)檢索和計(jì)算后得出健康組棉花和各蟲害組棉花的揮發(fā)物的主要成分和含量,進(jìn)行比較分析。
經(jīng)氣質(zhì)聯(lián)用技術(shù)檢測發(fā)現(xiàn),健康棉花和受蟲害棉花的揮發(fā)物共有約40種,包括萜烯類16種,質(zhì)量占比4.58%~14.21%,芳香族化合物16種,質(zhì)量占比85.27%~94.61%,烷烴、酸類、酯類和醇類7種,質(zhì)量占比0.4%~2.6%。表2為主要的代表性揮發(fā)物,采用最小顯著差數(shù)法(least significant difference, LSD)進(jìn)行多重比較,揮發(fā)物含量平均值后的字母代表不同的顯著性,字母相同,則為差異不顯著(>0.05)[25]。
由表2可得,對照組棉花和受蟲害棉花組的揮發(fā)物在成分和含量上均存在差異,特別是1,4-二甲基苯和2-甲基萘等芳香族化合物以及-蒎烯、-石竹烯和花側(cè)柏烯等萜烯類化合物存在顯著差異,而受不同數(shù)量棉鈴蟲危害的棉花的揮發(fā)物在成分組成上差異較小,但在含量上有一定差異,受蟲害棉花釋放的揮發(fā)物總量普遍顯著高于對照組健康棉花釋放的揮發(fā)物總量。并且由表中可以看出,有些化合物僅在健康棉花中出現(xiàn)或僅在受蟲害棉花中出現(xiàn),如2-甲基萘和棕櫚酸在受蟲害的棉花中是新產(chǎn)生的,-石竹烯在受蟲害的棉花中不再產(chǎn)生,推測棉花在受蟲害后合成了一些新的化合物用于啟動(dòng)防御機(jī)制,以及棉花受蟲害后某些化合物減少了合成和釋放。總的來看,健康棉花和受蟲害棉花的揮發(fā)物存在差別,受不同數(shù)量棉鈴蟲危害的棉花揮發(fā)物也有一定差異,而電子鼻作為一種基于揮發(fā)物檢測的技術(shù),在棉花的棉鈴蟲蟲害檢測上具有一定潛力。
表2 基于氣質(zhì)聯(lián)用技術(shù)的健康棉花和受蟲害棉花的主要揮發(fā)物
注:平均值后的相同字母表示差異不顯著(>0.05)。
Note: Means followed by the same letter are not significantly different (>0.05).
圖1為不同數(shù)量棉鈴蟲危害棉花的電子鼻傳感器響應(yīng)曲線,圖1a~圖1d分別為健康棉花以及棉花受1條、2條或3條棉鈴蟲危害的電子鼻傳感器響應(yīng)曲線,橫軸為檢測時(shí)間0~90 s,縱軸為電子鼻的響應(yīng)值。從圖1中可以看出,各棉花樣品的電子鼻傳感器響應(yīng)曲線存在差異性。首先,健康棉花與受蟲害棉花對于電子鼻傳感器的響應(yīng)不同,對于健康棉花(圖1a),傳感器S2、S6和S8響應(yīng)差異較小,且S1、S3和S5響應(yīng)值變化較小,而對于受蟲害棉花(圖1b-圖1d),傳感器S2的響應(yīng)值明顯高于S6和S8,且S1、S3和S5傳感器響應(yīng)值變化較大。由表1可知,S1、S3和S5對芳香族化合物靈敏,根據(jù)氣質(zhì)聯(lián)用儀分析結(jié)果,健康棉花和受蟲害棉花的芳香族類化合物確實(shí)存在差異,主要是1,4-二甲基苯和2-甲基萘等芳香族化合物存在差異,這也說明了電子鼻結(jié)果的可靠性。其次,受不同數(shù)量棉鈴蟲危害的棉花的電子鼻傳感器響應(yīng)也存在差異,隨著對棉花危害的棉鈴蟲的數(shù)量的增加,傳感器S2的響應(yīng)值也逐漸增大,這與S2傳感器的廣譜響應(yīng)性有關(guān),根據(jù)氣質(zhì)聯(lián)用檢測結(jié)果,棉花受害后揮發(fā)物釋放總量增加,并且棉鈴蟲數(shù)量增加后,棉花釋放總量有所增加(參照總量平均值),這說明電子鼻檢測結(jié)果和氣質(zhì)聯(lián)用結(jié)果基本保持一致。傳感器S1、S3和S5的響應(yīng)值變化逐漸增加,說明不同數(shù)量棉鈴蟲危害棉花的芳香族類化合物也有所差異,這與上述氣質(zhì)聯(lián)用儀檢測的結(jié)果一致。由以上各樣品的電子鼻傳感器的響應(yīng)曲線差異分析可以表明,電子鼻在棉鈴蟲危害棉花的檢測上具有可行性。
注:G和G0分別為傳感器檢測樣品氣體和潔凈空氣時(shí)的電阻值,S1~S10分別為電子鼻的10個(gè)傳感器。
本文從電子鼻的傳感器曲線中提取了5種特征值,采用主成分分析方法對5種特征值的區(qū)分效果進(jìn)行初步分析,圖2a~圖2e分別為基于穩(wěn)定值、平均微分值、面積值、小波能量值和多項(xiàng)式擬合曲線參數(shù)值的分析結(jié)果,圖中不同的棉花受害組以相應(yīng)的棉鈴蟲害蟲數(shù)進(jìn)行標(biāo)示。5種特征值圖2a~圖2e第一主成分和第二主成分之和分別為83.01%、97.18%、88.58%、88.38%和77.09%,前4種特征值的第一主成分和第二主成分之和都較大,而多項(xiàng)式擬合參數(shù)值的兩主成分之和較小,說明前4種特征值可以用來代表電子鼻信號(hào)對棉花受不同數(shù)量蟲害的區(qū)分情況,而多項(xiàng)式擬合曲線參數(shù)值不能很好的代表電子鼻信息。從圖2中可以看出,基于穩(wěn)定值,面積值和小波能量值的區(qū)分效果比較相似,健康棉花組和受蟲害棉花組可以明顯區(qū)分,但各棉花受不同數(shù)量棉鈴蟲危害組存在重疊。說明這3種特征值有利于表達(dá)健康棉花組和受蟲害棉花組的信息差異性,但是不足以表達(dá)各棉花受不同數(shù)量棉鈴蟲危害組的信息差異性。基于平均微分值,健康棉花組和各棉花受害組都可以明顯區(qū)分,說明平均微分值能充分體現(xiàn)各試驗(yàn)組之間的信息差異性。而基于多項(xiàng)式擬合曲線參數(shù)值,各試驗(yàn)組均有重疊,說明多項(xiàng)式擬合曲線參數(shù)值對各試驗(yàn)組的差異性的表達(dá)能力較差,不適用于后續(xù)分析。因此,初步分析認(rèn)為平均微分值、穩(wěn)定值、面積值和小波能量值適用于后續(xù)分析,而多項(xiàng)式擬合曲線參數(shù)值對電子鼻信息的代表性較差。
圖2 基于5種特征值的棉花受不同數(shù)量棉鈴蟲危害的主成分分析結(jié)果圖
2.4.1 基于單特征值的分類模型構(gòu)建
由以上主成分分析結(jié)果可以看出,棉花受不同數(shù)量蟲害組仍不能明顯區(qū)分。為了對棉花受不同數(shù)量棉鈴蟲危害進(jìn)行更好的區(qū)分,分別基于3種神經(jīng)網(wǎng)絡(luò)方法和5種特征值進(jìn)行分類分析。分析時(shí),將4組棉花樣本(共80個(gè)樣本)分為訓(xùn)練集和測試集,其中每組14個(gè)樣本作為訓(xùn)練集,6個(gè)樣本作為測試集,因此56個(gè)訓(xùn)練集樣本和24個(gè)測試集樣本用于4分類模型的構(gòu)建和測試,表3為分類結(jié)果。
表3 基于3種神經(jīng)網(wǎng)絡(luò)和5種單特征值的棉花受不同數(shù)量棉鈴蟲危害的分類結(jié)果
由表3可以看出,從分類方法上來看,在3種神經(jīng)網(wǎng)絡(luò)方法中,MLPNN方法下基于各特征值下的訓(xùn)練集和測試集的分類正確率總體最高,訓(xùn)練集的分類正確率均在90%以上,測試集的分類正確率均在85%以上,說明MLPNN方法比較適用于本試驗(yàn)數(shù)據(jù)集的分類分析。而基于RBFNN方法各特征值下的訓(xùn)練集和測試集的分類正確率總體最低,且各特征值下的測試集的分類正確率均低于70%,因此認(rèn)為RBFNN方法不適用于本試驗(yàn)的棉花受不同數(shù)量棉鈴蟲危害的分類分析。從各特征值上來看,基于穩(wěn)定值和平均微分值的平均分類正確率相對高,而基于多項(xiàng)式擬合曲線參數(shù)值的平均分類正確率總體最差,基于面積值的的平均分類正確率與基于小波能量值的平均分類正確率較為相當(dāng),基于面積值的平均分類正確率稍高于基于小波能量值的分類正確率,這與主成分分析的結(jié)果基本一致,也進(jìn)一步說明穩(wěn)定值、平均微分值和面積值能夠更好地代表電子鼻檢測棉花蟲害的信息,可以作為今后電子鼻實(shí)際應(yīng)用中采用特征值種類的參考。總體來看,在MLPNN方法下基于各特征值的分類效果總體最好,穩(wěn)定值、平均微分值和面積值在5種特征值中分類效果相對較好。
2.4.2 基于多特征值的分類模型優(yōu)化
根據(jù)單特征值的分類結(jié)果來看,穩(wěn)定值、平均微分值和面積值的總體分類效果在5種特征值中相對較好,但是仍然需要進(jìn)行優(yōu)化。為了更好的表達(dá)棉花受蟲害的揮發(fā)物的電子鼻信號(hào),考慮綜合采用穩(wěn)定值、平均微分值和面積值3種特征值用于分類分析,即將穩(wěn)定值、平均微分值和面積值3個(gè)特征值進(jìn)行兩兩組合和3項(xiàng)組合,再進(jìn)行分類分析。在組合各類特征值前探究了傳感器陣列的交叉敏感性對多特征值分類效果的影響,因此進(jìn)行了傳感器陣列優(yōu)化的預(yù)試驗(yàn),傳感器陣列優(yōu)化方法采用了因子載荷分析和方差分析,結(jié)果發(fā)現(xiàn)傳感器陣列優(yōu)化前后,基于多特征值的分類效果沒有較大提升或者反而下降,原因可能為傳感器陣列優(yōu)化后,有用信息可能也被丟失,造成分類效果提升少或下降。因此本試驗(yàn)中可忽略不同傳感器交叉敏感性的影響,考慮直接組合不同類的特征值,不進(jìn)行傳感器陣列的優(yōu)化,簡化試驗(yàn)分析過程。根據(jù)表3中的結(jié)果,由于基于RBFNN方法的分類表現(xiàn)較差,因此僅將MLPNN方法和ELM方法用于下一步的分類分析,構(gòu)建分類模型時(shí)采用的訓(xùn)練集和測試集的設(shè)置同采用單特征值時(shí)進(jìn)行分類分析時(shí)的設(shè)置相同。表4為基于2種神經(jīng)網(wǎng)絡(luò)方法和3種特征值組合對棉花受不同數(shù)量棉鈴蟲危害的分類結(jié)果。
由表4可以看出,總體來看,與單特征值相比,基于2種神經(jīng)網(wǎng)絡(luò)方法的多特征值的分類正確率均有較大提高。2種神經(jīng)網(wǎng)絡(luò)方法中,基于MLPNN方法各多特征值的分類表現(xiàn)仍然優(yōu)于基于ELM方法的分類表現(xiàn),訓(xùn)練集的分類正確率均在99%以上,測試集的分類正確率均在90%以上?;贓LM方法,與單特征值相比,各多特征值的測試集的分類正確率有較大提高,均在85%以上??傮w來看,分類正確率較高的分別為基于ELM方法及“穩(wěn)定值+平均微分值”、基于MLPNN方法及“穩(wěn)定值+平均微分值+面積值”和基于MLPNN方法及“面積值+平均微分值”。因此,可以認(rèn)為基于多特征值可以提高電子鼻對棉花受不同數(shù)量棉鈴蟲危害的分類效果。雖然將各單特征值組合后,數(shù)據(jù)集變大,但是電子鼻數(shù)據(jù)集本就是小樣本數(shù)據(jù),組合后的數(shù)據(jù)集采用神經(jīng)網(wǎng)絡(luò)方法進(jìn)行分析仍然能較快的得到分析結(jié)果,而且由于組合后的特征綜合了電子鼻傳感器響應(yīng)曲線的各類信息,加大了各棉花受不同數(shù)量棉鈴蟲危害組的信息差異性,因此顯著提高了電子鼻對棉花受不同數(shù)量棉鈴蟲危害組的分類正確率。由以上分析表明,多特征值更適合用于表達(dá)棉花蟲害揮發(fā)物的電子鼻信號(hào),更適合用于棉花受不同數(shù)量棉鈴蟲危害的分類分析。
表4 基于3種神經(jīng)網(wǎng)絡(luò)和多特征值的棉花受不同數(shù)量棉鈴蟲危害的分類結(jié)果
2.5.1 基于單特征值構(gòu)建危害棉花的棉鈴蟲數(shù)量的預(yù)測模型
根據(jù)電子鼻對棉花受不同數(shù)量棉鈴蟲危害的分類結(jié)果,證明電子鼻在識(shí)別健康棉花和受蟲害棉花以及識(shí)別不同棉鈴蟲數(shù)量具有可行性。為了對電子鼻在預(yù)測危害棉花的棉鈴蟲數(shù)量的可行性進(jìn)行研究,采用支持向量機(jī)回歸方法建立電子鼻信號(hào)和棉鈴蟲數(shù)量的回歸模型。自變量為電子鼻結(jié)果特征值,因變量為棉鈴蟲數(shù)量。共有80個(gè)棉花樣本,每組14個(gè)樣本作為訓(xùn)練集,6個(gè)樣本作為測試集。分別采用電子鼻檢測結(jié)果的穩(wěn)定值、平均微分值和面積值作為自變量建立回歸模型,表5為基于各特征值建立的回歸模型的訓(xùn)練集和預(yù)測集的預(yù)測效果。
使用決定系數(shù)2和均方根誤差RMSE評價(jià)回歸模型的優(yōu)劣,由表5可以看出,基于單特征值的訓(xùn)練集的回歸模型預(yù)測效果均較好,2分別為0.982 3,0.995 7和0.905 7,且RMSE較小,但是基于各特征值的測試集的回歸模型預(yù)測效果有限,2分別為0.674 2,0.723 6和0.781 4,且RMSE較大,訓(xùn)練集和測試集的回歸模型預(yù)測效果差異較大,說明基于單特征值建立的回歸預(yù)測模型容易出現(xiàn)過擬合問題,回歸模型效果預(yù)測效果不佳??傮w上,基于單特征值建立的回歸模型預(yù)測效果排序?yàn)椋好娣e值>平均微分值>穩(wěn)定值,推測原因可能為面積值和平均微分值都表達(dá)的是電子傳感器整條曲線的信息,較為全面,且不易受到極端值的影響,而穩(wěn)定值采用的是曲線上的某一點(diǎn)的值,易受到極端值的影響,會(huì)導(dǎo)致回歸模型的預(yù)測效果較差。因此認(rèn)為基于電子鼻檢測結(jié)果的單特征值對危害棉花的棉鈴蟲數(shù)量進(jìn)行預(yù)測不太理想,仍然需要對回歸模型進(jìn)行優(yōu)化。
表5 基于支持向量機(jī)回歸和單特征值建立的回歸模型預(yù)測棉鈴蟲數(shù)量結(jié)果
2.5.2 基于多特征值對危害棉花的棉鈴蟲數(shù)量的預(yù)測模型的優(yōu)化
由于采用電子鼻檢測結(jié)果的單特征值對棉鈴蟲數(shù)量預(yù)測的效果并不理想,嘗試采用電子鼻檢測結(jié)果的多特征值對棉鈴蟲數(shù)量進(jìn)行預(yù)測。采用支持向量機(jī)回歸建立回歸模型時(shí),分別將穩(wěn)定值、平均微分值和面積值進(jìn)行兩兩組合和三項(xiàng)組合作為自變量,棉鈴蟲數(shù)量作為因變量,訓(xùn)練集和測試集的分布與采用單特征值建立回歸模型時(shí)相同,仍然采用2和RMSE作為回歸模型的評價(jià)指標(biāo),分析模型預(yù)測效果。表6為基于多特征值和支持向量機(jī)回歸建立的回歸模型的訓(xùn)練集和測試集的預(yù)測效果。
由表6可以看出,基于多特征值建立的測試集的回歸模型的預(yù)測效果相比各單特征值下建立的測試集的回歸模型的預(yù)測效果明顯提高,2均在0.8以上,且RMSE較小,說明采用多特征值可以提高棉鈴蟲數(shù)量預(yù)測的效果。由表6可知基于“面積值+平均微分值”建立的回歸模型預(yù)測效果最佳,訓(xùn)練集的回歸模型的2和RMSE分別為0.994 0、0.086 0,測試集的回歸模型的2和RMSE分別為0.923 0和0.370 9,基于其他組合特征值建立的回歸模型預(yù)測效果均不如“面積值+平均微分值”,比如基于“穩(wěn)定值+平均微分值+面積值”建立的回歸模型的預(yù)測效果反而不如“面積值+平均微分值”,可能的原因是穩(wěn)定值容易將極端值帶入數(shù)據(jù)集中,在加入“面積值+平均微分值”的組合特征后,破壞了原本回歸模型的穩(wěn)定性,降低了原本回歸模型的預(yù)測效果。而由表5可知,基于單特征值建立的回歸模型平均預(yù)測效果排序?yàn)椋好娣e值>平均微分值>穩(wěn)定值,根據(jù)表6中各特征組合的回歸模型預(yù)測效果比較,推測單特征值的預(yù)測效果越好,用于特征值組合后對組合后特征的預(yù)測效果提升越大,單特征值的預(yù)測效果越差,用于特征值組合后,對組合后特征預(yù)測效果提升越小或者反而會(huì)造成預(yù)測效果下降。
表6 基于支持向量機(jī)回歸和多特征值建立的回歸模型預(yù)測棉鈴蟲數(shù)量結(jié)果
本試驗(yàn)采用電子鼻和氣質(zhì)聯(lián)用技術(shù)對受不同數(shù)量棉鈴蟲早期危害的棉花進(jìn)行檢測,對電子鼻傳感器與棉花揮發(fā)物的響應(yīng)關(guān)系進(jìn)行了闡述,對如何提高電子鼻對棉花蟲害的識(shí)別能力進(jìn)行了研究,分別從電子鼻傳感器響應(yīng)曲線中提取5種特征值:穩(wěn)定值、面積值、平均微分值、小波能量值和多項(xiàng)式曲線擬合參數(shù)值。分別基于多層感知器神經(jīng)網(wǎng)絡(luò)、徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)和極限學(xué)習(xí)機(jī)3種神經(jīng)網(wǎng)絡(luò)對5種特征值的分類正確率進(jìn)行了考察,優(yōu)選出穩(wěn)定值、面積值和平均微分值。分別對穩(wěn)定值、面積值和平均微分值3種單特征值和多特征值進(jìn)行分類和預(yù)測能力的研究,結(jié)果發(fā)現(xiàn):
1)多特征值的分類能力普遍優(yōu)于單特征值的分類能力,基于多特征值“穩(wěn)定值+平均微分值”和極限學(xué)習(xí)機(jī)(ELM)對棉花受不同數(shù)量棉鈴蟲危害的分類能力最佳,訓(xùn)練集和測試集的分類正確率均可達(dá)到100%。
2)基于多特征值建立的回歸模型的預(yù)測效果普遍優(yōu)于單特征值建立的回歸模型預(yù)測效果,基于多特征值“面積值+平均微分值”和支持向量機(jī)建立的回歸模型對危害棉花的棉鈴蟲數(shù)量預(yù)測效果最佳,訓(xùn)練集回歸模型的2和RMSE分別為0.994 0、0.086 0,測試集回歸模型的2和RMSE分別為0.923 0和0.370 9。
結(jié)果表明,電子鼻在棉花的早期棉鈴蟲蟲害檢測上具有可行性,并且通過特征值優(yōu)化和特征值組合可以提高電子鼻對受棉鈴蟲蟲害棉花的識(shí)別準(zhǔn)確率和預(yù)測效果,為電子鼻在棉花蟲害檢測中的應(yīng)用提供了思路。
[1]曾娟,陸宴輝,簡良,等. 中國病蟲草害調(diào)查診斷與決策支持系統(tǒng)[M]. 北京:中國農(nóng)業(yè)出版社,2017:1-232.
[2]Mankin R W, Hagstrum, D W, Smith M T, et al. Perspective and promise: A century of insect acoustic detection and monitoring[J]American Entomologist, 2011, 57(1): 30-44.
[3]翟治芬,徐哲,周新群,等. 基于樸素貝葉斯分類器的棉花盲椿象危害等級(jí)識(shí)別[J]. 農(nóng)業(yè)工程學(xué)報(bào),2015,31(1):204-211.
Zhai Zhifen, Xu Zhe, Zhou Xinqun, et al. Recognition of hazard grade for cotton blind stinkbug based on Naive Bayesian classifier[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015, 31(1): 204-211. (in Chinese with English abstract)
[4]張軍國,韓歡慶,胡春鶴,等. 基于無人機(jī)多光譜圖像的云南松蟲害區(qū)域識(shí)別方法[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2018,49(5):249-255.
Zhang Junguo, Han Huanqing, Hu Chunhe, et al. Identification method of pinus yunnanensis pest area based on UAV multispectral images[J]. Transaction of the Chinese Society for Agricultural Machinery, 2018, 49(5): 249-255. (in Chinese with English abstract)
[5]Anastasaki E, Balayannis G, Papanikolaou N E, et al. Oviposition induced volatiles in tomato plants[J]Phytochemistry Letters, 2015, 13: 262-266.
[6]Erb M, Veyrat N, Robert C A M, et al. Indole is an essential herbivore-induced volatile priming signal in maize[J]Nature Communications, 2015, 6: 1-10.
[7]Silva D B, Weldegergis B T, Van Loon J J A, et al. Qualitative and quantitative differences in herbivore-Induced plant volatile blends from tomato plants Infested by either tuta absoluta or bemisia tabaci[J]Journal of Chemical Ecology, 2017, 43(1): 53-65.
[8]Clavijo McCormick A, Boeckler G A, K?llner T G, et al. The timing of herbivore-induced volatile emission in black poplar () and the influence of herbivore age and identity affect the value of individual volatiles as cues for herbivore enemies[J]BMC Plant Biology, 2014, 14: 1-13.
[9]Hu W W, Wan L T, Jian Y Y, et al. Electronic noses: From advanced materials to sensors aided with data processing[J]Advanced Materials Technologies, 2019, 4: 1-38.
[10]Ramirez H L, Soriano A, Gomez S, et al. Evaluation of the food sniffer electronic nose for assessing the shelf life of fresh pork meat compared to physicochemical measurements of meat quality[J]European Food Research and Technology, 2018, 244(6): 1047-1055.
[11]Kodogiannis V. Application of an electronic nose coupled with fuzzy-wavelet network for the detection of meat spoilage[J]Food and Bioprocess Technology, 2017, 10(4): 730-749.
[12]程紹明,王俊,王永維,等. 基于電子鼻技術(shù)的番茄苗早疫病病害快速檢測研究[J]. 科技通報(bào),2013,29(7):68-77.
Chen Shaoming, Wang Jun, Wang Yongwei, et al. Research on distinguishing tomato seedling infected with early blight disease by electronic nose[J]. Bulletin of Science and Technology, 2013, 29(7): 68-77. (in Chinese with English abstract)
[13]Xu S, Zhou Z Y, Li K L, et al. Recognition of the duration and prediction of insect prevalence of stored rough rice infested by the red flour beetle () using an electronic nose[J]. Sensors, 2017, 17(4): 1-9.
[14]林振華,姜水,張紅梅,等.基于金屬氧化物傳感器陣列的小麥霉變程度檢測[J].傳感技術(shù)學(xué)報(bào),2018,31(7):1017-1023.
Lin Zhenhua, Jiang Shui, Zhang Hongmei, et al. Detection of moldy wheat using MOS sensor array in electronic nose[J]. Chinese journal of Sensor and Actuators, 2018, 31(7): 1017-1023. (in Chinese with English abstract)
[15]Schuermans V N E, Li Z Y, Jongen A, et al. Pilot study: Detection of gastric cancer from exhaled air analyzed with an electronic nose in Chinese patients[J]Surgical Innovation, 2018, 25(5): 429-434.
[16]Altomare D F, Porcelli F, Picciariello A, et al. The use of the PEN3 e-nose in the screening of colorectal cancer and polyps[J]Techniques in Coloproctology, 2016, 20(6): 405-409.
[17]Pace C, Khalaf W, Latino M, et al. E-nose development for safety monitoring applications in refinery environment[J]. Procedia Engineering, 2012, 47: 1267-1270.
[18]Blanco-Rodríguez A, Camara V F, Campo F, et al. Development of an electronic nose to characterize odours emitted from different stages in a wastewater treatment plant[J]Water Research, 2018, 134: 92-100.
[19]Henderson W G, Khalilian A, Han Y J, et al. Detecting stink bugs/damage in cotton utilizing a portable electronic nose[J]Computers and Electronics in Agriculture, 2010, 70(1): 157-162.
[20]Degenhardt D C, Greene J K, Khalilian A. Temporal dynamics and electronic nose detection of stink bug-induced volatile emissions from cotton bolls[J]Psyche, 2012, 2012: 1-9.
[21]Lampson B D, Han Y J, Khalilian A, et al. Development of a portable electronic nose for detection of pests and plant damage[J]Computers and Electronics in Agriculture, 2014, 108: 87-94.
[22]Yan J, Guo X Z, Duan S K, et al. Electronic nose feature extraction methods: A review[J]Sensors, 2015, 15(11): 27804-27831.
[23]Sun Y B, Wang J, Cheng S M. Discrimination among tea plants either with different invasive severities or different invasive times using MOS electronic nose combined with a new feature extraction method[J]Computers and Electronics in Agriculture, 2017, 143: 293-301.
[24]Yan J, Tian F C, He Q H, et al. Feature extraction from sensor data for detection of wound pathogen based on electronic nose[J]Sensors and Materials, 2012, 24(2): 57-73.
[25]Magalh?es D M, Borges M, Laumann R A, et al. Influence of multiple- and single-species infestations on herbivore- induced cotton volatiles and anthonomus grandis behaviour[J]Journal of Pest Science, 2018, 91(3): 1019-1032.
[26]Rao M R N, Sridhar G R, Madhu K, et al. A clinical decision support system using multi-layer perceptron neural network to predict quality of life in diabetes[J]. Diabetes & Metabolic Syndrome, 2010, 4(1): 57-59.
[27]Yin Y, Zhao Y Z. A feature selection strategy of E-nose data based on PCA coupled with Wilks Λ-statistic for discrimination of vinegar samples[J]. Journal of Food Measurement and Characterization, 2019, 13(3): 2406-2416.
[28]Du D D, Xu M, Wang J, et al. Tracing internal quality and aroma of a red-fleshed kiwifruit during ripening by means of GC-MS and E-nose[J]Rsc Advances, 2019, 9(37): 21164-21174.
[29]Sun Y B, Wang J, Sun L, et al. Evaluation of E-nose data analyses for discrimination of tea plants with different damage types[J]Journal of Plant Diseases and Protection, 2019, 126(1): 29-38.
Application of electronic nose in detection of cotton bollworm infestation at an early stage
Dai Yuting1, Zhou Bo2, Wang Jun1※
(1,,310058,;2.,,224051,)
Cotton bollborm is one of the main pests of cotton. Cotton is under threat of yield loss and poor quality because of the cotton bollworm. However, cotton bolworms tend to hide in the cotton plants so that there are limitations for conventional detection methods, such as acoustic signal method, image recognition method and spectral imaging technology. A lot of researches have shown that volatile organic compounds (VOCs) released by plants will change when they are attacked by pests. So it is possible to get the cotton bollworm damage information by detecting the volatiles. Currently, gas chromatograph-mass spectrometer (GC-MS) can accurately detect the composition and content of volatile matter. However, this method has some disadvantages in practical application, such as time-consuming, high cost and inconvenience. The electronic nose is composed of sensor array, which is an instrument to analyze, identify and detect most of the volatiles. In this study, electronic nose was used to detect the cotton plants infested with cotton bollworm of different amounts at an early stage. The volatile organic compounds (VOCs) in cotton were analyzed by GC-MS. The plant height of cotton used in the study was 50-70 cm, and the boll period was about 12 weeks. Cotton bollworms used in the study were at second-instar. The VOCs emitted by the undamaged and damaged cotton plants detected by GC-MS were different, which indicated that electronic nose had potential in the application of cotton bollworm detection. The curve of electronic nose sensor was obtained for cotton plants infected by different numbers of cotton bollworm. Then five kinds of feature parameters were extracted from the curves of electronic nose sensors : stable value, area value, mean differential value, wavelet energy value and the coefficients of the fitted quadratic polynomial function. Feature parameters were selected based on three kinds of neural network methods: multilayer perceptron neural network (MLPNN), radial basis neural network (RBFNN) and extreme learning machine (ELM). Then stable value, area value and mean differential value were selected because of their better classification performance among the five kinds of feature parameters. Multiple-features were combinations of single-features. The classification analysis was carried out based on multiple-features and three kinds of neural network methods. And support vector machine regression (SVR) models were established based on single-features and multiple-features, respectively. The results showed that the classification performance of multiple-features was better than that of single-features. The classification performance was best based on “stable value and mean differential value” features and ELM. The classification accuracy of training set and test set based on “stable value and mean differential value” features were both 100%. The regression models based on multiple-features were better than that based on single-features. And the regression model was the best based on “area value and mean differential value” features. The coefficient of determination (2) and root mean square error (RMSE) of the regression model based on the training set of “area value and mean differential value” were 0.994 0 and 0.086 0. The2and RMSE of the regression model based on the test set of “area value and mean differential value” were 0.923 0 and 0.370 9. The results show that feature election and multiple-features can improve the classification performance of the electronic nose for infested cotton plants. It can be concluded that electronic nose has strong potential for the application of detection of cotton plants infested with cotton bollworm at an early stage.
electronic nose; neural network; prediction; cotton plants; cotton bollworm; feature election
代雨婷,周 博,王 俊. 電子鼻技術(shù)在棉花早期棉鈴蟲蟲害檢測中的應(yīng)用[J]. 農(nóng)業(yè)工程學(xué)報(bào),2020,36(3):313-320.doi:10.11975/j.issn.1002-6819.2020.03.038 http://www.tcsae.org
Dai Yuting, Zhou Bo, Wang Jun. Application of electronic nose in detection of cotton bollworm infestation at an early stage[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2020, 36(3): 313-320. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2020.03.038 http://www.tcsae.org
2019-09-26
2020-01-30
國家自然科學(xué)基金資助項(xiàng)目(31671583)
代雨婷,主要從事電子鼻在棉花蟲害檢測中的應(yīng)用。Email:2994636283@qq.com
王 俊,教授,博士生導(dǎo)師,主要從事電子鼻電子舌技術(shù)開發(fā)及其智能檢測應(yīng)用。Email:jwang@zju.edu.cn
10.11975/j.issn.1002-6819.2020.03.038
S224.3
A
1002-6819(2020)-03-0313-08