中圖分類號:S220 文獻(xiàn)標(biāo)志碼:A 文章編號:1008-0864(2025)07-0122-11
Identification of 5 Common PesticidesUsed in Flue-tobacco Field Production Based on Hyperspectral Technology
YANGGuotao1,ZHANGShijie2,CHENChao,LIUYun2,HEChen1, NINGYinghao',ZHANG Qing1* (1.ZhengzhouTobaccoResearch InstituteofChina NationalTobaccoCorp,Zhengzhou450ool,China;.Baoji TobaccoCompany of Shaanxi Province,Shaanxi Baoji 721oo4,China;3.China National Tobacco Coporationof Shaanxi District, Xi'an ,China)
Abstract:Torapidlyandaccuratelyobtain thepesticide typesused intobacco field production,andto improve the scientificand targeted management of tobacco field pesticide applications,hyperspectral imaging technology was applied.By comparing the spectral curves offresh tobacco leaves 48 h after spraying with 5common pesticides,the spectral differences were analyzed.Various combinations of spectral preprocessing methods,feature wavelength extraction methods,and pattern recognition techniques were tested to evaluate model accuracy.The results showed that,in the75O\~875nm spectral range,the spectral curves of fresh tobacco leaves treated with the 5 pesticides exhibited distinct reflectance diferences.Acrossthefull spectral range,thecombinationof standard normal variate (SNV) transformation and least squares support vector machine (LSSVM) models,as well as the combination of second derivative preprocessingandrandom forest models,bothachieved high recognition accuracy,with the testset accuracy reaching 98.58 % .The continuous projection algorithm outperformed the competitive adaptive reweighting samplingalgorithmin dimensionalityreduction.Inthefeaturewavelengthrange,thecombinationofsecond derivative preprocessing,continuous projection algorithm,and random forest models achieved the best performance, with the training set accuracy reaching 100.00% and the test set accuracy at 98.22% .Thenumber of feature wavelengths was17,and the single-sample detection time was 1O.28 ms.This method could rapidlyand accurately identify the types of5commonpesticides usedin tobacco production.Aboveresultsprovided technicalsupportforthe management of pesticide applicationin tobacco field production. Key words:tobacco field production;hyperspectral imaging;pesticide identification;random forest
農(nóng)藥由一種或多種化學(xué)物質(zhì)組成,既可以人工合成,也可以來源于生物或其他天然物質(zhì),主要用于預(yù)防、消滅或控制農(nóng)業(yè)和林業(yè)生產(chǎn)中的害蟲、病菌、雜草等有害生物,同時(shí)也能調(diào)節(jié)植物和昆蟲的生長。由于農(nóng)藥具有高效、快速和使用簡便等特點(diǎn),在現(xiàn)代農(nóng)業(yè)有害生物綜合防治體系中具有重要作用。煙草作為特殊的葉用類經(jīng)濟(jì)作物,為降低煙葉田間病蟲害的影響,農(nóng)藥的施用不可避免,但所帶來的農(nóng)藥殘留問題不容忽視[-2]。煙草行業(yè)雖已經(jīng)制定農(nóng)藥合理使用相關(guān)標(biāo)準(zhǔn)對農(nóng)藥安全間隔期、最大使用次數(shù)等提出嚴(yán)格要求3,但由于農(nóng)藥種類繁多,產(chǎn)區(qū)難以準(zhǔn)確獲取煙農(nóng)田間用藥種類,導(dǎo)致農(nóng)藥安全間隔期難以判定,煙葉生產(chǎn)田間用藥管控效果不佳。目前,農(nóng)業(yè)生產(chǎn)的農(nóng)藥檢測主要采用化學(xué)分析45、膠體金免疫層析等方法],但上述方法受檢測效率和檢測成本等因素制約,難以在煙葉生產(chǎn)田間應(yīng)用。
高光譜成像(hyperspectral imaging,HSI)作為新興光學(xué)技術(shù),能夠在較窄的波段范圍內(nèi)得到數(shù)十個(gè)到幾百個(gè)波段的高光譜圖像,獲取不同樣品的特征信息,具有測定速度快、數(shù)據(jù)信息量大、圖譜合一等優(yōu)點(diǎn)。近年來,HSI被廣泛應(yīng)用于農(nóng)產(chǎn)品品質(zhì)和安全性檢測。孫杰利用熒光高光譜技術(shù)采集了干紅茶噴灑6種農(nóng)藥的熒光高光譜數(shù)據(jù),數(shù)據(jù)經(jīng)過多重散射校正預(yù)處理和競爭性自適應(yīng)重加權(quán)采樣聯(lián)合連續(xù)投影算法降維后,建立了一維卷積神經(jīng)網(wǎng)絡(luò)聯(lián)用隨機(jī)森林的紅茶農(nóng)藥殘留識別模型,測試集準(zhǔn)確率達(dá)到 99.05% 。Sun等利用高光譜技術(shù)獲取生菜葉片高光譜數(shù)據(jù)并建模,建立了最小二乘支持向量回歸模型,能夠有效識別生菜混合農(nóng)藥殘留,預(yù)測準(zhǔn)確率達(dá)93.86% 。吉海彥等利用高光譜成像儀采集菠菜葉片光譜數(shù)據(jù),采用卡方檢驗(yàn)特征選擇算法篩選出8個(gè)特征波長,再利用支持向量機(jī)建立識別模型,模型預(yù)測準(zhǔn)確率達(dá) 99.30% 。在煙草領(lǐng)域,高光譜技術(shù)主要應(yīng)用于煙葉成分檢測、煙葉成熟度識別[2]、煙草病害識別[13]及煙葉分級[4]等領(lǐng)域,尚未有高光譜技術(shù)在煙葉田間用藥種類識別、殘留檢測等方面的報(bào)道。因此,本研究提出了一種基于高光譜成像技術(shù)的5種煙草常用農(nóng)藥識別方法,以期為產(chǎn)區(qū)煙葉田間用藥監(jiān)管提供技術(shù)支持。
1材料與方法
1.1試驗(yàn)材料
試驗(yàn)所用烤煙品種為秦?zé)?9,種植于陜西省寶雞市煙草科技示范園 (34°54′13.594\"N, 106°45′1.145\"E 。所選農(nóng)藥為高效氯氟氰菊酯、吡蟲啉、三唑酮、多菌靈和甲基硫菌靈5種,均為市場采購,具體農(nóng)藥有效成分含量、品牌和劑型詳見表1。
1.2儀器設(shè)備
應(yīng)用的實(shí)驗(yàn)室級高光譜分析系統(tǒng)購自深圳海譜納米光學(xué)有限公司,該系統(tǒng)主要由光譜相機(jī)、暗箱、主機(jī)和顯示屏幾部分組成,如圖1所示。該高光譜相機(jī)是基于微機(jī)電系統(tǒng)芯片技術(shù)(MEMSChip)的新一代高光譜相機(jī),光譜范圍為 515~915nm ,光譜分辨率為 4.0nm ,光譜通道101個(gè)。為避免外部環(huán)境光源干擾,該系統(tǒng)配備暗箱,暗箱內(nèi)配置鹵素光源,光源強(qiáng)度 (0~12V 可調(diào)節(jié),光照均勻度 395% 。
1.3試驗(yàn)方法
1.3.1煙葉樣品制備在煙葉采烤前3d,挑選無明顯缺陷、生長狀況基本一致的中部煙葉300片作為試驗(yàn)樣本,并進(jìn)行編號。田間試驗(yàn)以清水為對照(CK),5種農(nóng)藥按照推薦用量(表1)稀釋后用電動(dòng)噴霧槍均勻噴灑在煙葉表面,每種農(nóng)藥處理50片。經(jīng)過 48h 吸收后,采摘并采集鮮煙葉的高光譜圖像數(shù)據(jù)。
1.3.2煙葉樣品高光譜數(shù)據(jù)采集在樣品掃描之前,預(yù)熱 30min 以穩(wěn)定高光譜成像系統(tǒng),光源電壓設(shè)置為9V,曝光時(shí)間 30ms 。通過重復(fù)捕獲標(biāo)準(zhǔn)色卡5次并從中選擇9個(gè)色標(biāo),然后比較這5次捕獲中收集的數(shù)據(jù)的一致性,確定高光譜系統(tǒng)的穩(wěn)定性。待系統(tǒng)穩(wěn)定后,先掃描標(biāo)準(zhǔn)白板( 99% 反射率)和用蓋子完全關(guān)閉透鏡( 0% 反射率),分別獲得白色和黑色背景圖像;然后打開暗箱,將煙葉樣品放置在暗箱中進(jìn)行高光譜圖像采集。
1.3.3煙葉光譜數(shù)據(jù)提取采集的煙葉高光譜圖像先通過基于具有最大差異的波長分割高光譜圖像,剔除葉脈和背景,完成煙葉片區(qū)域的提取。最后,通過公式(1將原始圖像校正成反射圖像。
式中, IN 是校準(zhǔn)的反射率圖像; Is 是原始高光譜圖像; IR 是白色背景圖像; ID 是黑色背景圖像; m 是標(biāo)準(zhǔn)白板的平均反射率。
在每片煙葉上選擇4個(gè)感興趣區(qū)域(均勻分布于葉脈兩側(cè)的中部),每個(gè)感興趣區(qū)域作為1個(gè)樣本數(shù)據(jù)。圖像校準(zhǔn)后,提取感興趣區(qū)域內(nèi)的光譜信息,并平均為1個(gè)光譜代表1個(gè)樣本。按照公式(2)計(jì)算各區(qū)域內(nèi)的平均光譜作為樣本光譜數(shù)據(jù)。
式中, s 為感興趣區(qū)域中像素點(diǎn)個(gè)數(shù); Ixy 為第 i 個(gè)波段下 (x,y) 點(diǎn)的光譜值; 為感興趣區(qū)域第 i 波段下的平均光譜值。
1.3.4光譜預(yù)處理煙葉內(nèi)部損傷、蟲害、高光譜成像系統(tǒng)本身的誤差以及環(huán)境因素通常會影響校準(zhǔn)樣本的質(zhì)量,因此,有必要執(zhí)行異常樣本檢測,以最小化這些因素的影響。在本研究中,結(jié)合主成分分析(principal component analysis,PCA)和馬氏距離(Mahalanobisdistance,MD)檢測離群樣本[15],PCA用于降低數(shù)據(jù)的維數(shù)并消除數(shù)據(jù)中的重疊區(qū)域,MD用于檢測異常值。采用基于聯(lián)合x-y 距離的樣本集劃分方法(sample set partitioningbasedonjointx-ydistances,SPXY)對訓(xùn)練集和測試集進(jìn)行劃分,以確保所選樣本子集能夠盡可能地反映原始數(shù)據(jù)集的特性,同時(shí)降低數(shù)據(jù)集的規(guī)模和復(fù)雜性,從而提高后續(xù)分析和建模的效率[7]。
光譜數(shù)據(jù)不僅包含樣品本身的物理和化學(xué)信息,還包含其他不相關(guān)的信息和噪聲,如設(shè)備電氣噪聲、樣品背景和采集過程中的雜散光[18],因此,需要對光譜進(jìn)行預(yù)處理,以減少影響因素,提高模型的性能[19]。本研究使用的預(yù)處理方法包括基線的一階導(dǎo)數(shù)(firstderivative,D1)和二階導(dǎo)數(shù)(second derivative,D2)、多重散射校正(multiplescatteringcorrection,MSC)2o]以及用于散射校正的標(biāo)準(zhǔn)正態(tài)變換(standardnormalvariate,SNV)?;€校正用于消除儀器背景和漂移的影響21]。散射校正可消除由樣品中不均勻的顆粒分布和顆粒尺寸差異引起的散射。應(yīng)用平滑可有效減少隨機(jī)噪聲的影響[22]。
1.3.5分類模型通過最小二乘支持向量機(jī)(least squares support vector machine,LSSVM)[23]和隨機(jī)森林(randomforest,RF)算法分別建立光譜(原始光譜和預(yù)處理光譜)與測量參數(shù)之間的線性定量關(guān)系。LSSVM通過引人等式約束來替代標(biāo)準(zhǔn)支持向量機(jī)(support vectormachine,SVM)中的不等式約束,從而實(shí)現(xiàn)了對SVM的改進(jìn),既繼承了SVM的所有優(yōu)勢,還可將原本的凸二次規(guī)劃問題重新構(gòu)建為線性方程組,從而顯著降低了計(jì)算復(fù)雜度,提升了分類速度[24]。RF是一種集成學(xué)習(xí)方法,結(jié)合多個(gè)決策樹來進(jìn)行預(yù)測,以其魯棒性、準(zhǔn)確性和處理高維數(shù)據(jù)的能力而聞名,廣泛用于各種領(lǐng)域的分類、回歸和特征選擇任務(wù)[25]。RF中的每個(gè)決策樹都在數(shù)據(jù)的隨機(jī)子集上進(jìn)行訓(xùn)練,最終預(yù)測是通過聚合各個(gè)樹的預(yù)測來獲得的。
本研究利用準(zhǔn)確率對預(yù)測模型進(jìn)行評價(jià),準(zhǔn)確率是指判別正確結(jié)果占總樣本的百分比,根據(jù)公式(3)進(jìn)行計(jì)算。
式中,Accuracy代表最終計(jì)算得出的準(zhǔn)確率;TP代表模型正確預(yù)測為正類別的樣本數(shù)量;TN代表模型正確預(yù)測為負(fù)類別的樣本數(shù)量;FP代表模型錯(cuò)誤地將負(fù)類別樣本預(yù)測為正類別的數(shù)量;FN代表模型錯(cuò)誤地將正類別樣本預(yù)測為負(fù)類別
的數(shù)量。
1.3.6特征波長選擇高光譜圖像中總是存在冗余信息和多重共線性問題,這對模型預(yù)測的準(zhǔn)確性和魯棒性以及預(yù)測效率都有負(fù)面影響[2]。因此,本研究采用連續(xù)投影算法(successiveprojectionsalgorithm,SPA)[26-27]以及競爭性自適應(yīng)重新加權(quán)采樣(competitiveadaptivereweightedsampling,CARS)2來選擇信息波長。
2 結(jié)果與分析
2.1 數(shù)據(jù)集劃分
試驗(yàn)所用煙葉數(shù)據(jù)包含樣本1200個(gè),每個(gè)樣本包含101個(gè)波段數(shù)據(jù)。由于環(huán)境等因素影響,光譜數(shù)據(jù)前后波段有較大噪聲,試驗(yàn)中截取中間81個(gè)波段數(shù)據(jù)參與模型構(gòu)建。使用PCA-MD方法進(jìn)行奇異樣本檢測,共剔除奇異樣本24個(gè),結(jié)果如圖2所示,即最終參與模型構(gòu)建的樣本數(shù)據(jù)為1181個(gè),每個(gè)樣本包含81個(gè)波段數(shù)據(jù)。
使用SPXY方法進(jìn)行數(shù)據(jù)集劃分,結(jié)果如表2所示,其中,訓(xùn)練集樣本數(shù)量為900,測試集樣本量為281。
2.2不同農(nóng)藥殘留的煙葉光譜分析
由圖3不同農(nóng)藥殘留樣本的平均光譜曲線可以看出,在波長 550~650nm ,無農(nóng)藥組的平均反射率顯著高于含有農(nóng)藥組別,5種農(nóng)藥組別之間在平均反射率上也呈現(xiàn)出一定的差異。在波長750~875nm ,6個(gè)組別的平均反射率可以被分為3個(gè)明顯的梯度。其中,無農(nóng)藥組反射率最高,約為0.70,構(gòu)成了第1梯隊(duì);第2梯隊(duì)包括含有甲基硫菌靈、高效氯氟氰菊酯、三唑酮和多菌靈殘留物的組別,平均反射率約為0.65;含有吡蟲啉殘留物的組別反射率最低,約為0.60,構(gòu)成了第3梯隊(duì)。此外,各組在平均光譜上也表現(xiàn)出細(xì)微差異。綜上可知,利用光譜數(shù)據(jù)構(gòu)建模型以判斷煙葉用藥種類是完全可行的。
2.3基于全波長的用藥種類預(yù)測
分別以原始和預(yù)處理光譜作為輸入,以農(nóng)藥殘留類別作為輸出,建立LSSVM和RF模型。通過比較各模型的分類性能,確定最佳的光譜預(yù)處理和模式識別方法。
2.3.1最小二乘支持向量機(jī) γ 和 σ2 是LSSVM中2個(gè)重要參數(shù),為使模型的分類效果最佳,采用遺傳算法(geneticalgorithm,GA)確定最優(yōu)參數(shù)組合。使用不同種預(yù)處理方法對光譜數(shù)據(jù)進(jìn)行處理,建立模型并進(jìn)行預(yù)測,由表3各模型判別效果可知,基于原始數(shù)據(jù)的LSSVM模型,訓(xùn)練集準(zhǔn)確率為 92.32% ,測試集準(zhǔn)確率為 89.50% 。經(jīng)過SNV預(yù)處理的光譜建立的LSSVM模型表現(xiàn)最好,訓(xùn)練集準(zhǔn)確率為 99.67% ,測試集準(zhǔn)確率為 98.58% ,相較基于原始光譜下的LSSVM,準(zhǔn)確率分別提升7.35和9.08個(gè)百分點(diǎn)。經(jīng)過MSC預(yù)處理的光譜建立的模型準(zhǔn)確率也有較高的提升,訓(xùn)練集準(zhǔn)確率為 96.40% ,測試集準(zhǔn)確率為 94.77% ,準(zhǔn)確率分別提升4.08和5.27個(gè)百分點(diǎn)。經(jīng)D1和D2預(yù)處理的光譜建立的模型準(zhǔn)確率也有小幅提升。根據(jù)測試結(jié)果,綜合模型復(fù)雜度和準(zhǔn)確率,確定LSSVM模型的最佳預(yù)處理方法為SNV,其模型準(zhǔn)確率為訓(xùn)練集 99.67% ,測試集 98.58% ,模型結(jié)果見圖4。由圖4可知,LSSVM模型訓(xùn)練集和測試集在識別農(nóng)藥類別2(吡蟲啉)和5(甲基硫菌靈)時(shí),均出現(xiàn)了個(gè)別誤判情況,但總體上模型預(yù)測準(zhǔn)確率保持了較高的水準(zhǔn)。
2.3.2RF模型以原始光譜數(shù)據(jù)作為輸入,建立RF模型,結(jié)果如圖5所示,模型訓(xùn)練集準(zhǔn)確率為99.89% ,測試集準(zhǔn)確率為 63.35% ,存在明顯過擬合現(xiàn)象,通過調(diào)整超參數(shù),模型過擬合現(xiàn)象沒有得到明顯改善。
通過對原始光譜數(shù)據(jù)進(jìn)行預(yù)處理,將預(yù)處理后數(shù)據(jù)作為輸入,建立RF模型,預(yù)測結(jié)果如表4所示。從表中可以看出,D1和D2的處理方式顯著改善了模型的過擬合現(xiàn)象,同時(shí)模型準(zhǔn)確率也達(dá)到了極高水平,訓(xùn)練集準(zhǔn)確率均為 100.00% ,測試集準(zhǔn)確率分別為 97.55% 和 98.58% 。其他預(yù)處理方法雖然對過擬合現(xiàn)象也有一定的改善作用,但仍存在過擬合現(xiàn)象。
在綜合考量模型復(fù)雜度和準(zhǔn)確率之后,最終選擇D2作為基于RF的煙葉用藥種類的最佳預(yù)處理方法。經(jīng)過D2預(yù)處理,模型的性能表現(xiàn)卓越,訓(xùn)練集準(zhǔn)確率達(dá)到 100.00% ,測試集準(zhǔn)確率高達(dá)98.58% (圖6),充分證明了D2預(yù)處理方法在RF模型中的有效性。
對全光譜數(shù)據(jù)建立LSSVM、RF2種模型,篩選最佳預(yù)處理及模式識別算法組合,2種組合方式均有良好的識別效果。SNV-LSSVM模型準(zhǔn)確率為訓(xùn)練集 99.67% ,測試集 98.58% ,D2-RF模型準(zhǔn)確率為訓(xùn)練集 100.00% ,測試集 98.58% 。
2.4煙葉用藥種類檢測模型優(yōu)化
高光譜數(shù)據(jù)有高維的特點(diǎn),數(shù)據(jù)包含大量冗余信息,使用全波段數(shù)據(jù)建模,存在建模變量多、數(shù)據(jù)計(jì)算量大等問題,可能導(dǎo)致所建立的模型效率及穩(wěn)定性降低。本研究采用連續(xù)投影算法(SPA)、競爭性自適應(yīng)重新加權(quán)采樣(CARS)進(jìn)行特征波長提取,篩選出5種農(nóng)藥類型密切相關(guān)的波段參與建模,提高模型速度和穩(wěn)定性。
2.4.1基于SPA的特征選擇采用SPA對預(yù)處理后鮮煙葉樣本光譜數(shù)據(jù)進(jìn)行特征選擇,對篩選出的特征變量建立模型并進(jìn)行預(yù)測。經(jīng)過SNV預(yù)處理后,針對SPA算法的特征變量選擇如圖7所示。在此模型中,特征變量的數(shù)量為19,且這些變量的分布相對集中。模型在訓(xùn)練集上的準(zhǔn)確率達(dá)到 86.78% ,在測試集上的準(zhǔn)確率為 81.14% ,與全光譜數(shù)據(jù)LSSVM模型相比,其準(zhǔn)確率在訓(xùn)練集和測試集上分別降低12.89和17.44個(gè)百分點(diǎn),模型性能下降嚴(yán)重。
針對RF模型,采用經(jīng)D2預(yù)處理后的光譜數(shù)據(jù)進(jìn)行特征變量選擇,篩選出的特征變量數(shù)量為17,這些特征變量在光譜數(shù)據(jù)中的分布相對分散,模型預(yù)測結(jié)果如圖8所示。從圖8可以看出,D2-SPA-RF模型訓(xùn)練集的準(zhǔn)確率達(dá)到100.00% ,測試集的準(zhǔn)確率高達(dá) 98.22% ,基本達(dá)到了全光譜D2-RF模型預(yù)測精度,表明D2-SPA-RF模型在煙葉用藥種類識別中具有良好的性能。
2.4.2基于CARS的特征選擇采用CARS對預(yù)處理后煙葉樣本光譜數(shù)據(jù)進(jìn)行特征選擇,對篩選出的特征變量建立模型并進(jìn)行預(yù)測。針對LSSVM模型,經(jīng)SNV預(yù)處理后,CARS特征變量選擇結(jié)果如圖9所示,特征變量數(shù)量為43個(gè);模型預(yù)測結(jié)果如圖10所示,訓(xùn)練集準(zhǔn)確率為 98.56% ,測試集準(zhǔn)確率為 98.58% ,整體預(yù)測效果良好,基本達(dá)到全光譜LSSVM模型效果。
針對RF模型,經(jīng)D2預(yù)處理后,CARS特征變量選擇結(jié)果如圖11所示,特征變量數(shù)量為44個(gè),模型預(yù)測結(jié)果如圖12,訓(xùn)練集準(zhǔn)確率為 100.00% ,測試集準(zhǔn)確率為 99.64% ,整體預(yù)測效果良好,基本達(dá)到全光譜RF模型效果。
2.4.3模型比較分析從表5可以看出,原始光譜數(shù)據(jù)經(jīng)過SPA和CARS降維后,D2-SPA-RF、SNV-CARS-LSSVM和D2-CARS-RF模型測試集的準(zhǔn)確率基本達(dá)到全譜段的效果,其中D2-CARS-RF測試精度表現(xiàn)最優(yōu)異,所需特征數(shù)量為44個(gè),測試集準(zhǔn)確率達(dá)到了 99.64% 。從運(yùn)算時(shí)間看,原始光譜數(shù)據(jù)經(jīng)過SPA和CARS降維后,模型運(yùn)算效率均有提升,其中D2-SPA-RF表現(xiàn)優(yōu)異,所需特征數(shù)量為17個(gè),單樣本檢測時(shí)間為 10.28ms 。由于高光譜檢測所需的特征數(shù)量越多,樣本檢測耗費(fèi)的時(shí)間越長,綜合模型測試集準(zhǔn)確率和單樣本檢測時(shí)間,D2-SPA-RF表現(xiàn)最佳,雖然測試集準(zhǔn)確率略低,但也達(dá)到 98.22% ,但所需特征數(shù)量降低至17個(gè),單樣本檢測時(shí)間由 38.06ms 降至10.28ms,具有更高的檢測效能。
3討論
本研究通過高光譜圖像技術(shù)結(jié)合RF算法,成功實(shí)現(xiàn)了對田間鮮煙葉用藥種類的快速、精準(zhǔn)識別。研究結(jié)果表明,經(jīng)過D2和SNV預(yù)處理后,LSSVM和RF模型在測試集上的準(zhǔn)確率均達(dá)到98.58% ,顯示出優(yōu)異的分類性能。進(jìn)一步通過CARS和SPA算法進(jìn)行特征波長選擇發(fā)現(xiàn),SPA算法在降維效果上優(yōu)于CARS算法,最終構(gòu)建的D2-SPA-RF模型在訓(xùn)練集和測試集上的準(zhǔn)確率分別為 100.00% 和 98.22% ,單樣本檢測時(shí)間僅為10.28ms ,表現(xiàn)出較高的檢測精度和效率。這一結(jié)果與 ΔZhu 等的研究結(jié)果一致,SPA算法在高光譜數(shù)據(jù)降維中具有顯著優(yōu)勢,能夠有效提高模型的識別速度和穩(wěn)定性。
本研究將PCA-MD方法應(yīng)用于異常樣本的剔除,并結(jié)合多種預(yù)處理算法(D1、D2、MSC、SNV)對高光譜數(shù)據(jù)進(jìn)行優(yōu)化,顯著提升了數(shù)據(jù)質(zhì)量。此外,本研究將RF算法應(yīng)用于煙葉田間用藥種類的識別,相較于Sampaio等[30所用的SVM和PLS-DA方法,RF算法在處理高維數(shù)據(jù)時(shí)表現(xiàn)出更強(qiáng)的魯棒性和泛化能力。盡管本研究構(gòu)建的模型具有較高的識別精度,但其性能可能受到不同種植區(qū)域、煙葉品種以及環(huán)境因素的影響。Garcia-Vera等31指出,不同地區(qū)的土壤成分和氣候條件可能導(dǎo)致農(nóng)作物光譜特征的差異,從而影響模型的識別效果。因此,未來研究應(yīng)進(jìn)一步擴(kuò)大樣本范圍,增加不同種植區(qū)域和煙葉品種的樣本數(shù)量,以驗(yàn)證模型的穩(wěn)定性和普適性。此外,結(jié)合深度學(xué)習(xí)技術(shù)(如卷積神經(jīng)網(wǎng)絡(luò))可能進(jìn)一步提升模型的識別精度和效率,為現(xiàn)代煙草農(nóng)業(yè)的精準(zhǔn)監(jiān)管提供更強(qiáng)大的技術(shù)支持。
參考文獻(xiàn)
[1]司曉喜,劉志華,李中昌,等.5種農(nóng)藥在采收前和初烤后的煙 葉及土壤中的殘留量變化[J].煙草科技,2016,49(7):44-50. SIXX,LIU ZH,LI ZC,et al. Residues of five pesticides in tobacco leavesbefore harvesting and after flue-curingand soils [J].Tob. Sci. Technol.,2016,49(7): 44-50.
[2]羅華元,王紹坤,常壽榮,等.12種農(nóng)藥在煙葉中殘留及煙氣 中轉(zhuǎn)移試驗(yàn)初報(bào)[J].云南農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2010, 25(5): 636-641. LUOHY,WANGSK,CHANGSR,etal..Determinationof 12 pesticides residues in tobacco leaf and shifting to smoke[J]. J.YunnanAgric.Univ.(Nat.Sci.),2010,25(5):636-641.
[3]王剛,孔凡玉,劉建利,等.煙草田間農(nóng)藥合理使用規(guī)程:YC/T 371—2010[S].北京:中國標(biāo)準(zhǔn)出版社,2011.
[4]熊巍,張海燕,靳冬梅,等.UPLC-MS/MS同時(shí)測定煙草中5種 新煙堿殺蟲劑殘留[J].湖南農(nóng)業(yè)科學(xué),2021(2):91-95. XIONGW,ZHANGHY,JINDM,etal..Determinationoffive performance liquid chromatography tandem mass spectrometry [J]. Hunan Agric.Sci.,2021(2): 91-95.
[5]許泳吉,劉云云,韓瑋,等.固相萃取-高效液相色譜法同時(shí)測 定煙草中吡蟲啉和多菌靈[J].青島科技大學(xué)學(xué)報(bào)(自然科學(xué) 版),2016,37(1): 26-31. XUYJ,LIUYY,HANW,etal..Simultaneous detectionof carbendazim and imidacloprid in tobacco with solid-phase extraction and high-performance liquid chromatography [J].J. Qingdao Univ.Sci. Technol. (Nat. Sci.),2016,37(1):26-31.
[6]王或婕,馮德建,馮雙,等.吡蟲啉和啶蟲胱膠體金免疫層 析法試紙條性能評估及應(yīng)用效果探究[J].食品安全質(zhì)量檢 測學(xué)報(bào),2024,15(3):133-139. WANG Y J,F(xiàn)ENG DJ,F(xiàn)ENG S,et al..Performance evaluation and application effect study of colloidal gold immunochromatographictest strips for imidaclopridand acetamiprid[J].J.Food Saf.Qual.,2024,15(3):133-139.
[7]樓小華,高川川,朱文靜,等.膠體金免疫層析法快速檢測煙 草中吡蟲啉殘留[J].食品安全質(zhì)量檢測學(xué)報(bào),2017,8(5):1739- 1744. LOUXH,GAOCC,ZHUWJ,etal..Rapid detectionof imidacloprid residues in tobacco leafby coloidal gold immunochromatographic assay [J]. J.Food Saf. Qual., 2017, 8 (5): 1739-1744.
[8]孫杰.基于熒光高光譜技術(shù)的紅茶農(nóng)藥殘留檢測[D].成都: 四川農(nóng)業(yè)大學(xué),2023. SUN J. Detection of pesticide residues in black tea based on fluorescence hyperspectral technology [D]. Chengdu: Sichuan Agricultural University,2023.
[9]SUNJ,CONGSL,MAO HP,etal..Quantitativedetectionof mixed pesticide residue of lettuce leaves based on hyperspectral technique[J/OL].J.Food Process Eng.,2018,41(2):12654 [2024-05-16]. https://doi.org/10.1111/jfpe.12654.
[10]吉海彥,任占奇,饒震紅.高光譜成像技術(shù)鑒別菠菜葉片農(nóng)藥 殘留種類[J].發(fā)光學(xué)報(bào),2018,39(12):1778-1784. JI HY,REN Z Q,RAO Z H. Identification of pesticide residue types in spinach leaves based on hyperspectral imaging [J]. Chin. J. Lumin.,2018,39(12):1778-1784.
[11]LU X C, ZHAO C,QIN Y Q,et al.. The application of hyperspectral images in the classification of fresh leaves' maturity for flue-curing tobacco [J/OL]. Processes,2023,11(4): 1249 [2024-05-06]. htps://doi.org/10.3390/pr11041249.
[12]JIAFF,HAN S,CHANG D,et al..Monitoring flue-cured tobacco leaf chlorophyll content under diffrent light qualities byhyperspectral reflectance [J].Am.J. Plant Sci.,2O2o,11(8): 1217-1234.
[13]潘兆杰,孫根云,張愛竹,等.基于波段選擇的煙草病害檢測 模型[J].光譜學(xué)與光譜分析,2023,43(4):1023-1029. PANZ J,SUN GY,ZHANG A Z, et al.. Tobacco disease detection model based on band selection [J]. Spectrosc.Spectr. Anal.,2023,43(4): 1023-1029.
[14]張慧,張文偉,張永毅,等.基于高光譜與紋理融合的烤煙分 類方法研究[J].中國煙草學(xué)報(bào),2022,28(3):72-80. ZHANG H, ZHANG W W, ZHANG Y Y,et al..Research on classification method offlue-cured tobaccobased on fusion of hyperspectral and texture features[J].Acta Tab.Sin.,2022,28 (3) 72-80.
[15]MARK H.Use of Mahalanobis distances to evaluate sample preparation methods for near-infrared reflectance analysis [J]. Anal.Chem.,2002,59(5): 790-795.
[16]GALVAORKH,ARAUJO MCU,JOSEGE,etal..A method for calibration and validation subset partitioning [J]. Talanta,2005,67(4): 736-740.
[17]RINNAN?,VANDEN BERGF,ENGELSENSB.Reviewof the most common pre-processing techniques for near-infrared spectra [J].Trends Anal.Chem.,2009,28(10): 1201-1222.
[18]ENGEL J, GERRETZEN J, SZYMANSKA E,et al..Breaking with trendsin pre-processing[J]. TrendsAnal.Chem.,2013, 50:96-106.
[19]RINNAN A.Pre-processing in vibrational spectroscopy-when, why and how [J].Anal.Meth.,2014,6(18): 7124-7129.
[20]LEE LC,LIONG CY,JEMAIN AA.A contemporary review ondata preprocessing (DP)practice strategy in ATR-FTIR spectrum [J]. Chemom.Intell.Lab.Syst.,2017,163:64-75.
[21]WAN X H,LI G,ZHANG MQ,et al..A review on the strategies for reducing the non-linearity caused by scattering onspectrochemical quantitative analysis of complex solutions [J].Appl. Spectro.Rev.,2020,55(5): 351-377.
[22]唐杰,羅彥波,李翔宇,等.基于近紅外光譜數(shù)據(jù)的一維卷積神 經(jīng)網(wǎng)絡(luò)模型研究[J].光譜學(xué)與光譜分析,2024,44(3):731-736. TANGJ,LUOYB,LIXY,etal..Study on one-dimensional convolutional neural network model based on near-infrared spectroscopy data [J].Spectro.Spectr.Anal.,2024,44(3): 731-736.
[23]李國厚,李澤旭,金松林,等.混合卷積神經(jīng)網(wǎng)絡(luò)用于高光譜 小麥品種鑒別[J].光譜學(xué)與光譜分析,2024,44(3):807-813. LIGH,LI Z X,JIN SL,et al..Mix convolutional neural networksfor hyperspectral wheat varietydiscrimination [J]. Spectro.Spectr.Anal.,2024,44(3): 807-813.
[24]KEYC,SHI ZK,LIPJ,et al.. Lithological classification and analysisusingHyperion hyperspectral dataand random forest method[J]. Acta Petrol. Sin.,2018,34(7): 2181-2188.
[25]ARAUJO M C U,SALDANHA T C B, GALVAO R K H, et al.. The successive projections algorithm for variable selection in spectroscopic multicomponent analysis [J]. Chemom. Intell. Lab.Syst.,2001,57(2):65-73.
[26]MOREIRAEDT,PONTESMJC,GALVAORKH,etal.. Nearinfrared reflectance spectrometry classification of cigarettes using the successiveprojections algorithm for variable selection [J].Talanta,2009,79(5):1260-1264.
[27]SOARESSFC,GOMESAA,ARAUJO MCU,et al.. The successive projections algorithm [J]. Trends Anal.Chem., 2013,42:84-98.
[28]LIHD,LIANGYZ,XU QS,et al..Key wavelengths screening using competitive adaptive reweighted sampling method formultivariate calibration[J].Anal.Chim.Acta,2009, 648(1):77-84.
[29]ZHU HY, CHU BQ, ZHANG C,et al..Hyperspectral imaging forpresymptomaticdetection of tobaccodiseasewith successiveprojectionsalgorithm and machine-learning classifiers[J/OL].Sci.Rep.,2017,7(1): 4125 [2024-05-06].https:// doi.org/10.13031/aim.20162460422.
[30]SAMPAIO P S,CASTANHO A,ALMEIDA A S,etal.. Identification of rice flour types with near-infrared spectroscopy associated with PLS-DA and SVM methods[J].Eur.Food Res. Technol.,2020,246(3): 527-537.
[31]GARCIA-VERA Y E, POLOCHE-ARANGO A,MENDIVELSOFAJARDO C A,et al.. Hyperspectral image analysisand machine learning techniques for crop disease detection and identification:a review [J/OL].Sustainability,2O24,16(14): 6064[2024-05-06]. https://doi.org/10.3390/su16146064.