中圖分類號:S572;S126 文獻標識碼:A文章編號:1007-5119(2025)03-0098-11
Tobacco Virus Disease Detection Based on UAV Multispectral and Improved BPNN
ZHANG Yangliang12, JIANG Xueyan1, LI Min2, JIANG Houlong3, JIANG Lianqiang4, GUO Leifeng2*,WANG Xinweil
(1.KeyLaboratoryofTobaco PestMonitoring amp;Integrated Management/Istitute ofTobaccoResearchofCAAS,Qingdao66101,
China;2.AgricuturalInfomationItuteofCeseAcademyofAgriculturalSienes,BeiingO1Chia;3.obaccoLeaf
Company,ChongingBrachf,hongingo,Cina;4.ingshanBrachoficuanobaccoopaniaa 615000, Sichuan, China)
Abstract:Thisstudyaims toidentifytobacovirus diseasebyintegrating UAV-based multispectralremotesensing technologywith animprovedBPneuralnetwork (BPNN).Multispectral imagesof healthyanddiseasedtobacoplants withvaryingdegreesof virus infectionwerecapturedusingtheDJIP4MUAV.Atotalof19 vegetation indiceswerecalculated toconstructfeaturesets for correlationanalysis.K-nearest neighbors (KNN),random forest (RF),supportvectormachine (SVM),traditional BPNN,and improved BPNN were used toperformcomparative testsonbinaryandtermaryclasificationsamples.Theimproved BPNN,with optimizationsinetworktructure,imbalanceatahandling,actiationfunctioneplacing,andotimzerancementchied 89% accuracyand anF1 scoreof O.88 forbinaryclassification, and 79% accuracywith anF1 scoreof O.76 for ternaryclassification-both outperforming traditionalalgorithms.TheseresultsindicatethatUAVmultispectraldatacombinedwithanimprovedBPNNholds applicationpotential forthedetectionof tobaccovirusdisease,providing technical supportforearlywamingand preventionof agricultural diseases.
Keywords: tobacco; virus disease; UAV; multispectral; improved BPNN
煙草病毒病是煙草生產(chǎn)過程中最常見且最具破壞性的病害,常年造成巨大經(jīng)濟損失[1]。該病害傳播途徑多樣且迅速,具有很強的環(huán)境適應性,使得檢測與防治難度增加。
現(xiàn)代農(nóng)業(yè)技術的發(fā)展,尤其是光譜成像技術和智能算法的應用,為植物病害的早期檢測和防控提供」王郝時忘跗。無八仇孜不的,泛應用,付古檢測提升到新高度。無人機遙感成像技術與人工智能算法結合,不僅提高了病害檢測的效率與準確性,還為農(nóng)業(yè)生產(chǎn)提供了更智能和自動化的防治手段[2]。Thimmegowda等3l2023年使用無人機RGB圖像和改進的聚類分割方法,分類辨別出健康和受脅迫煙株,為煙草病害的低空遙感檢測提供了思路。Nguyen 等[4借助無人機搭載的多光譜傳感器,從多光譜圖像中提取植被指數(shù)(VIs)和灰度共生矩陣(GLCM)紋理特征,使用機器學習算法和3D卷積神經(jīng)網(wǎng)絡實現(xiàn)了春小麥黃銹病的檢測,證明了從光譜指數(shù)變化分析作物病害的可行性。眾多智能算法中,BPNN在多光譜圖像數(shù)據(jù)的病害識別任務中表現(xiàn)突出。趙晉陵等[5基于無人機提取檳榔黃化病光譜指數(shù)信息,在對比試驗中,使用兩層結構的傳統(tǒng)BPNN識別精度表現(xiàn)優(yōu)于RF與SVM,達到91.7% 。同時,也提到傳統(tǒng)BPNN在隱藏層節(jié)點數(shù)少時,面臨網(wǎng)絡不能收斂,無法有效學習光譜數(shù)據(jù)的復雜模式;樣本量不平衡時,會產(chǎn)生欠擬合或過擬合現(xiàn)象,導致分類精度波動大、泛化能力差甚至少數(shù)類病害被忽視或錯分的問題,指明了今后BPNN在應用于植物病害檢測時的改進方向。劉麗娟等回在研究玉米葉部病害時引入遺傳算法和Sigmod激活函數(shù)以提升BPNN分類能力。劉坤等[7通過引入隨機梯度下降法(SGD)并優(yōu)化特征選擇,顯著提升了模型在3種黃瓜病害分類中的魯棒性,尤其是黃瓜白粉病識別率達 94% ,進一步討論了改進BPNN的可行性。但引入的Sigmod激活函數(shù)在網(wǎng)絡反向傳播過程中,尤其在網(wǎng)絡層次加深的情況下,當梯度值逐漸變小時,會導致參數(shù)更新變得非常緩慢,甚至梯度消失,即使采用傳統(tǒng)的SGD優(yōu)化,但因沒有內(nèi)建的機制來自動調(diào)整學習率,也很難有效地更新權重[8]。本研究則引入了新的ReLU激活函數(shù),通過在正區(qū)間保持常數(shù)梯度(梯度為1),避免傳統(tǒng)激活函數(shù)在深層網(wǎng)絡中梯度消失的問題;Adam優(yōu)化器,通過自適應學習率和動量機制,避免SGD優(yōu)化器的震蕩問題等[]。上述研究表明作物病害遙感檢測研究已趨向于無人機多光譜數(shù)據(jù)和優(yōu)化的智能算法,伴隨著近年來算法的發(fā)展,新的改進方法也逐漸得到探索,但研究對象仍缺乏煙草一類的經(jīng)濟作物,且算法存在新的改進空間。
基于此,本研究以無人機拍攝的煙草病毒病多光譜影像為例,進一步優(yōu)化BPNN結構,旨在整合多光譜成像、無人機遙感技術以及創(chuàng)新分析方法、智能學習算法,提出一種基于改進BPNN的煙草病毒病快速分類檢測方法,以期為煙草病毒病檢測提供方法參考和案例支撐。
1 材料與方法
1.1 研究區(qū)概況與試驗設計
試驗地點位于中國四川省涼山州西昌市中國農(nóng)業(yè)科學院西南煙草試驗基地( 27°50′19.3\"N 102°21′48.0′′E ,海拔 1670m ,年均溫 16°C 。試驗地按健康-輕度感染-中度感染-重度感染分為4個矩形研究區(qū),試驗地見圖1。
注:a,健康區(qū);b,輕度感染區(qū);c,中度感染區(qū);d,重度感染區(qū)。 Note:a,healthyarea;b,lightly infectedarea; c,moderately infectedarea;d, severely infected area.
每塊研究區(qū)內(nèi)種植約1400株煙草,數(shù)據(jù)采集時間為2023年7月6日至7月30日,10:00至14:00晴朗天氣。無人機每次執(zhí)飛采集任務前懸停至標準白板上方進行輻射定標,采集數(shù)據(jù)飛行時高度為 15m ,每塊研究區(qū)采集時間間隔 2d 。采用DJIPhantom4Multispectral型無人機采集多光譜數(shù)據(jù),該無人機影像系統(tǒng)集成了1個彩色傳感器和5個多光譜成像單色傳感器,單個傳感器有效像素為208萬,百米空間分辨率為 5.3cm ,采集波段為藍(B): 450nm ;綠(G): 560nm ;紅(R): 650nm :紅邊(RE): 730nm ;近紅外(NIR): 840nm[10]
1.2病級劃分與病情調(diào)查
在數(shù)據(jù)采集期間,每次多光譜數(shù)據(jù)采集完畢后,參考GB/T23222-2008《煙草病蟲害分級及調(diào)查方法》,對研究區(qū)所有煙草植株按嚴重等級劃分0,1,3,5,7,9六個等級并在表格記錄,其中0表示未染病健康植株,1至9表示植株染病程度遞增。由于研究區(qū)為非人工干擾的自然生長條件,5級病株較少,出于樣本均衡性和代表性考慮,未采集此類數(shù)據(jù)。本研究目標變量為多類別分類變量,即將植株的感染程度作為分類任務的目標變量。為了實現(xiàn)二元分類和三元分類任務,本研究將煙草植株的感染程度轉化為兩種分類任務,具體如下:
二元分類任務,進一步將植株的感染程度簡化為健康和染病兩類:
健康組(0):健康的植株。
染病組(1、3、7、9):所有被感染的植株(不論感染程度)。
三元分類任務,將感染程度按健康、中、高三個類型進行分類:
健康組(O):健康的植株。
中度染病組(1和3):中等感染的植株。
重度染病組(7和9):嚴重感染的植株。
根據(jù)這兩種分類方案,本研究的目標變量分別為二元分類和三元分類,并使用這些分類任務進行模型訓練與預測。
1.3 樣本提取
從4塊研究區(qū)挑選處于各個病情階段的煙株對原始B通道圖像進行裁剪,裁剪出健康和感染病毒病的單株煙草小圖。具體操作為:按照其在原始大圖中的橫坐標 X ,縱坐標Y,裁剪框的寬W和高 H 對余下G、R、RE、NIR通道進行裁剪,保證裁剪下來的5個通道的小圖大小、位置、形狀相同,如圖2。最終采集到411幅可用樣本影像,采用二元分類、三元分類思想將樣本影像重新合并為兩組數(shù)據(jù)。按二元分類劃分的第一組樣本分布如表1所示,按三元分類劃分的第二組樣本分布如表2所示。
1.4 數(shù)據(jù)預處理
1.4.1基于DN值的植被指數(shù)計算不同于高空衛(wèi)星,在低空無人機遙感中,由于大氣干擾較少且傳感器設計相對簡單,植被冠層圖像的數(shù)字數(shù)值(DN值)雖不同于光譜反射率,但可作為對應波段反射光強的量化表征。DN值是遙感定量分析中一種廣泛采用的參數(shù),利用DN值計算植被指數(shù)預處理步驟簡便,并且能夠直接應用于原始圖像[1]。波段按一定數(shù)學規(guī)律組合而成的植被指數(shù)相比單一波長可以更為有效、穩(wěn)定、可靠地反映植被特征[12]。因此,本研究依托光譜DN值選用了19個常用植被指數(shù)(表3)。
1.4.2特征集構建及處理本研究對每株煙草的19個植被指數(shù)進行了計算,包括每個指數(shù)的最大值、最小值、均值及標準差,作為4個特征集。同時,為降低異常極值對研究結果的干擾,將每一幅植被指數(shù)影像像元值展開并從小到大排列,特別選擇了處于98% 置信區(qū)間內(nèi)的植被指數(shù)的最大值和最小值[22]。此策略可有效減少數(shù)據(jù)極端值帶來的潛在偏差,從而增強分析結果的準確性和可靠性。
1.5 建模方法
選用KNN(K-Nearest Neighbors,K近鄰)[23]、RF(Random Forest,隨機森林)[24]、SVM(SupportVector Machine,支持向量機)[25]、傳統(tǒng)BPNN(Back-propagation Neural Network,BP神經(jīng)網(wǎng)絡)[26]和改進BPNN五種學習算法對兩組樣本分別分類,并采用10折交叉驗證方法依次選取9個子集為訓練集,1個子集為驗證集進行模型訓練和評估。每次迭代后,計算驗證集準確率,并保存準確率最高時的模型參數(shù)。
傳統(tǒng)的BPNN在模型性能和穩(wěn)定性方面存在一些不足之處:
1)結構通常只有兩個隱藏層,限制了模型的表達能力,難以捕捉多光譜數(shù)據(jù)中的復雜特征。2)結構中沒有Dropout層,應用在本研究數(shù)據(jù)量級時易發(fā)生過擬合,致使模型在新數(shù)據(jù)上泛化能力弱。3)常直接使用原始數(shù)據(jù)進行訓練,對于本研究表1類型二和表2類型二數(shù)據(jù)不平衡問題,易導致偏向預測多數(shù)類,影響整體準確性。4)常使用Sigmoid激活函數(shù),易在飽和區(qū)導數(shù)接近于0,導致梯度消失、學習過程緩慢且易停滯[27]。5)傳統(tǒng)SGD優(yōu)化器在本研究數(shù)據(jù)量級下,其本身的隨機梯度下降機制可能出現(xiàn)較大波動,易導致收斂速度慢、無法找到全局最優(yōu)解、穩(wěn)定性不足,使得反向傳播時調(diào)參效率較低。
為了克服這些不足,更好地適用于本研究,在使用BPNN時引入了多種改進:
1)提升隱藏層數(shù):相比傳統(tǒng)兩層,改進的BPNN提升至三層。第一層包含128個神經(jīng)元,第二層包含64個神經(jīng)元,第三層包含32個神經(jīng)元。這種多層結構能增強模型表達能力,捕捉到指數(shù)中的復雜特征和模式。
2)添加Dropout層:Dropout是一種防止神經(jīng)網(wǎng)絡過擬合的正則化技術,即隨機失活技術。本研究在每層隱藏層后引人Dropout層。Dropout層通過在訓練中隨機丟棄一定比例的神經(jīng)元(本研究為50% ),引入隨機性,減少神經(jīng)元之間的共適應性,從而提高模型泛化能力。
3)引入SMOTE 方法:SyntheticMinority OversamplingTechnique(SMOTE),即合成少數(shù)類過采樣技術,通過合成新的少數(shù)類樣本而非簡單復制現(xiàn)有樣本,以平衡數(shù)據(jù)集中的類別分布[28]。在本研究中引入了SMOTE方法對訓練集過采樣,以減少模型訓練過程中受到數(shù)據(jù)不平衡的影響,提高對少數(shù)類的識別能力,確保訓練公平性。
4)更換ReLU激活函數(shù):ReLU即RectifiedLinearUnit,修正線性單元。傳統(tǒng)的BPNN通常使用Sigmoid進行復雜的指數(shù)運算,而ReLU僅在輸入值大于零時激活,執(zhí)行簡單的閾值操作,特別是在處理本研究引入的多層網(wǎng)絡架構時,可減少計算負擔、加快訓練速度。其次,ReLU可緩解梯度消失問題,其在正半?yún)^(qū)的導數(shù)恒定為1,保證了梯度可穩(wěn)定傳播至深層網(wǎng)絡,解決Sigmoid函數(shù)在飽和區(qū)導數(shù)接近于0導致的學習緩慢甚至停滯。此外,ReLU通過使一部分神經(jīng)元輸出為0,促進網(wǎng)絡的稀疏性,減少神經(jīng)元間的依賴性,有助于降低過擬合風險,提升模型的泛化能力[29]。故在每層隱藏層之間,本研究引入ReLU激活函數(shù),以增加網(wǎng)絡的非線性表達能力。
5)采用Adam優(yōu)化器:Adam(AdaptiveMo-mentEstimation)優(yōu)化器是一種基于一階矩和二階矩估計的自適應學習率優(yōu)化算法,在反向傳播階段,本研究使用Adam動態(tài)調(diào)整每個參數(shù)的學習率。相比于傳統(tǒng)的SGD,Adam結合了動量和自適應學習率的方法,不僅考慮了歷史梯度的指數(shù)衰減平均值,還考慮了平方梯度的指數(shù)衰減平均值,從而自動調(diào)整每個參數(shù)的學習率,提供更快的收斂速度和更好的穩(wěn)定性。
通過這些改進措施,改進的BPNN解決了傳統(tǒng)BPNN在本研究中的缺陷,顯著提升了模型在實際應用中的表現(xiàn),改進后的BPNN結構見圖3。
1.6 相關性分析方法
本研究全面探索了兩組樣本各自指數(shù)之間的相關性,采用了一系列統(tǒng)計方法來適應不同數(shù)據(jù)特性的需求,確保分析的深度和廣度。針對二元分類樣本,鑒于其只有“健康-染病\"兩種,本研究采取了點二列相關系數(shù)(Point-BiserialCorrelation)來探究。點二列相關系數(shù)是統(tǒng)計學中一種用來衡量一個連續(xù)變量和一個二元分類變量之間關系強度和方向的指標,特別適合于辨識和量化一個二元分類屬性(染病程度)與一個連續(xù)數(shù)值變量(各指數(shù))之間的關聯(lián)程度[30]。
針對三元分類樣本,依據(jù)各指數(shù)是否符合正態(tài)分布的特性,選擇了適宜的統(tǒng)計手段以確保分析的有效性和準確性。具體而言,對于呈現(xiàn)出正態(tài)分布特征的植被指數(shù),本研究采用皮爾遜相關系數(shù)(PearsonCorrelationCoefficient)這一經(jīng)典統(tǒng)計量來評估它們之間的線性相關強度與方向。皮爾遜系數(shù)是衡量兩連續(xù)變量間直線關系緊密度的理想工具,尤其適用于滿足正態(tài)分布假設的數(shù)據(jù)集[31]。而對于未符合正態(tài)分布特征的植被指數(shù),本研究采取斯皮爾曼相關系數(shù)(SpearmanRankCorrelationCoeffic-ient)進行分析。斯皮爾曼系數(shù)的優(yōu)勢在于其能夠揭示變量間更為寬泛的單調(diào)關系,不僅限于線性,這對于非正態(tài)分布數(shù)據(jù)來說尤為重要,能夠更全面地捕捉到變量間的關聯(lián)模式[31]。
2結果
2.1 模型比較分析
通過多次試驗,將最大值、最小值、均值和標準差4種特征集分別應用于5種學習算法,其中,Epoch均為300,傳統(tǒng)BPNN學習率固定設為0.01,改進后的BPNN初始學習率設為0.001,Adam優(yōu)化根據(jù)參數(shù)歷史梯度自動調(diào)整每個參數(shù)學習率,Dropout隨機丟棄率為 50% 。使用十折交叉驗證集的平均準確率(Accuracy)和F1分數(shù)(F1Score)作為評價指標以評估其在煙草病毒病檢測中的表現(xiàn),結果見表4。
結果表明:改進后的BPNN在所有特征集上的表現(xiàn)均優(yōu)于其他學習算法,優(yōu)勢明顯且穩(wěn)定,特別是在標準差特征集上,其驗證集分類準確率90% 、 80% ,F(xiàn)1分數(shù)0.89、0.78,均達到了最高值。
2.2 最優(yōu)特征變量篩選
2.2.1相關性分析結果通過對二元分類所得19種指數(shù)的點二列相關性計算,各指數(shù)與病害發(fā)生的相關系數(shù)分布如圖4所示,柱狀愈高,則其點二列相關系數(shù)值愈接近1或-1,表明其正或負相關性愈強。
由圖4可看出:最大值特征集,EVI2、MSR、NDVI、OSAVI、REOSAVI、RVI、SAVI的點二列相關系數(shù)值超過了-0.3,表現(xiàn)出較強的負相關性;最小值特征集,DVI、NGBDI、NGRDI、TCARI的點二列相關系數(shù)超過了-0.3,表現(xiàn)出較強負相關性;均值特征集,DVI、EVI2、GNDVI、GOSAVI、MSR、NDVI、NGRDI、 OSAVI、RFDVI、REOSAVI、RVI、SAVI、TCARI的點二列相關系數(shù)值都超過-0.3,甚至RVI的系數(shù)值達到了-0.5,表現(xiàn)出與病害發(fā)生極強的負相關性;標準差特征集,不同植被指數(shù)則表現(xiàn)出更大的相關差異性,MTCI超過了-0.2,RVI超過了-0.3,表現(xiàn)出負相關性,NGBDI、TVCARI超過0.3,表現(xiàn)出較強正相關性。
Fig. 4Correlation coeficients between vegetation indices and disease occurrence in the first group of samples
在皮爾遜、斯皮爾曼相關性分析前,需對4種特征集各自19種指數(shù)進行正態(tài)分布檢驗。本研究進行K-S(Kolmogorov-Smirnov)正態(tài)分布檢驗,4種特征集中符合正態(tài)分布的指數(shù)見圖5小提琴圖。縱坐標表示每個指數(shù)的值,密度圖展示數(shù)據(jù)的核密度估計,反映數(shù)據(jù)分布形狀,中間內(nèi)嵌矩形為箱線圖,箱體底部和頂部邊緣分別表示第25百分位數(shù)和第75百分位數(shù),箱體內(nèi)的橫線表示數(shù)據(jù)中位數(shù),箱體越大表示數(shù)據(jù)越離散,反之越集中。
小提琴圖通過核密度估計展示數(shù)據(jù)分布形狀,類似于平滑直方圖。圖5中列出了4種特征集中所有符合正態(tài)分布的指數(shù),即小提琴圖形狀呈鐘形(左右對稱的光滑曲線),密度最高的部分在中間逐漸向兩邊遞減,類似經(jīng)典的“鐘型曲線”。內(nèi)嵌箱線圖為指數(shù)正態(tài)分布判斷提供輔助信息,箱體內(nèi)橫線趨于箱體中心,且箱體底部和箱體頂部之間距離相對均衡,箱體上下胡須長度也大致相等,佐證了數(shù)據(jù)分布對稱性良好。
三元分類樣本相關系數(shù)見圖6。最大值特征集,EVI2、GNDVI、GOSAVI、MSR、NDVI、OSAVI、REOSAVI、RVI、SAVI系數(shù)值小于-0.3,表現(xiàn)出較強負相關性;最小值特征集,NGBDI系數(shù)值小于-0.3,表現(xiàn)為較強負相關性,CIre、MTCI、SRre大于或等于0.3,表明具有較強正相關性;均值特征集,DVI、EVI2、GNDVI、GOSAVI、MSR、NGRDI、NDVI、OSAVI、RDVI、REOSAVI、RVI均小于-0.3,表現(xiàn)較強負相關性;標準差特征集,EVI2、GNDVI、GOSAVI、MTCI、RDVI、RERDVI小于-0.2,表現(xiàn)為負相關性,且有RVI小于-0.3表現(xiàn)為較強負相關性,另NGBDI大于0.3,表現(xiàn)出較強正相關性。
2.2.2提取最優(yōu)特征指數(shù)為進一步提升模型性能,減少變量冗余,根據(jù)相關系數(shù)常用原則,系數(shù)絕對值小于0.2為低,大于0.8為高[32]。在本研究中對特征指數(shù)進行了篩選,重點保留與染病程度相關性較高的特征。通過對標準差特征集中的19個指數(shù)進行特征重要性排序,根據(jù)圖4和圖6中的相關系數(shù)情況,對相關系數(shù)求取絕對值,并以絕對值0.20作為病害重要性閾值,篩選最優(yōu)特征指數(shù),在二元分類樣本中,篩選出:NGBDI、RVI、TCARI、MTCI。在三元分類樣本中,篩選出:RVI、NGBDI、MTCI、 EVI2、 RDVI、 GNDVI、 GOSAVI、RERDVI、TCARI。接下來根據(jù)表5和表6植被指數(shù)間相關系數(shù)矩陣,取絕對值0.8為指數(shù)間重要性閾值。最終分別得到4個和7個兩組最優(yōu)指數(shù),二元分類:NGBDI、RVI、TCARI、MTCI。三元分類:RVI、NGBDI、MTCI、EVI2、RDVI、GNDVI、TCARI。
注:(a),最大值特征集中符合的指數(shù);(b),最小值特征集中符合的指數(shù);(c),均值特征集中符合的指數(shù);(d),標準差特征集中符合的指數(shù)。Note:(a)d)value feature set; (d), indicesconforming in the standard deviation feature set.
Fig. 6Correlation coefcients between vegetation indices and disease severity levels in the second group ofsamples
2.3基于最優(yōu)特征集的模型比較分析
根據(jù)篩選出的最優(yōu)特征變量,我們保留這些特征的標準差數(shù)據(jù),重新構建了最優(yōu)特征數(shù)據(jù)集,并采用改進后的BPNN對煙草病毒病進行分類評估。以下是基于最優(yōu)特征集的分類結果(表7)。
在二元分類最優(yōu)特征集中,改進BPNN在驗證集上分類準確率和F1分數(shù)分別達到 89% 和0.88;在三元分類最優(yōu)特征集中,改進BPNN分類準確率和F1分數(shù)分別為 79% 和 0.76
2.4基于最優(yōu)特征集的模型結果分析
(1)通過結合NGBDI、RVI、TCARI和MTCI四種植被指數(shù)標準差,改進后的BPNN能夠高效、準確識別煙株是否感染病毒病。這些指數(shù)在特征選擇過程中表現(xiàn)出與病害高度相關的特性,使得模型在二元分類任務中表現(xiàn)優(yōu)異。結合這些特征,以及模型 89% 的準確率和較少的特征計算量能夠快速篩查煙株,掌握煙田健康狀況,為煙草病毒病早期預防提供了可靠的技術手段。
(2)在三元分類最優(yōu)特征集任務中,改進的BPNN結合NGBDI、RVI、TCARI、MTCI,三元分類的RVI、NGBDI、MTCI、EVI2、RDVI、GNDVI、TCARI七種指數(shù),可以區(qū)分煙株處于病毒病的一般發(fā)病階段還是急需治療的嚴重階段。通過引入多種與病害特征相關的指數(shù),模型不僅能夠識別感染的發(fā)生,還能區(qū)分病情的不同嚴重程度。這種細化的分類能力對田間病害管理具有意義,可以幫助種植者在使用二元分類發(fā)現(xiàn)煙田發(fā)生大面積感染后,使用三元分類根據(jù)不同的病情階段及時采取相應措施,確保防控的精準性和及時性。
3討論
煙草花葉病毒侵染烤煙后,主要通過影響光合作用的光系統(tǒng)Ⅱ(PSI),中斷光合電子傳遞鏈,造成葉綠素降解和葉綠體結構破壞[33]。當烤煙受到這種脅迫而失綠時,其光譜特性也會隨之發(fā)生變化。本研究基于此原理,通過無人機多光譜影像采集,提取光譜特征,計算了19種植被指數(shù),并構建了4種特征集進行相關性分析。最終,基于改進的BPNN實現(xiàn)了二元分類任務準確率 89% 、F1分數(shù)0.88,三元分類任務準確率 79% 、F1分數(shù)0.76,均優(yōu)于傳統(tǒng)算法,為煙草病毒病檢測提供新途徑。
傳統(tǒng)的BPNN存在表達能力有限、缺少正則化容易過擬合、不具備數(shù)據(jù)不平衡處理能力、Sigmod激活函數(shù)在網(wǎng)絡層數(shù)加深易導致梯度消失等問題。為提升算法模型性能,本研究對傳統(tǒng)BPNN進行改進:(1)引入三層隱藏層。Syaharud-din等[34]研究表明,更復雜的網(wǎng)絡結構和合理的神經(jīng)元數(shù)量可提高算法準確性。本研究改進后的三層網(wǎng)絡結構增強了模型整體表達能力。(2)添加Dropou層、更換ReLU激活函數(shù)。Cui等[35]研究證明,ReLU函數(shù)和Dropout技術可解決過擬合、梯度消失問題并加速模型收斂。本研究引入Dro-pout層正則化技術,防止模型由于網(wǎng)絡層數(shù)增加導致過擬合;ReLU激活函數(shù)在處理多層網(wǎng)絡架構時,可減少計算負擔、加快訓練速度,緩解梯度消失。(3)采用SMOTE方法。Xu等[36]研究顯示,通過增加少數(shù)類樣本數(shù)量可提高分類器識別少數(shù)類的能力。本研究利用SMOTE平衡數(shù)據(jù),減少數(shù)據(jù)不平衡對模型訓練的影響。(4)Adam優(yōu)化器的采用是本研究改進BPNN的又一關鍵環(huán)節(jié)。Yi等[37]研究指出,Adam優(yōu)化器結合動量法,可增強優(yōu)化過程的穩(wěn)定性,有效避免非凸優(yōu)化問題中的局部極小值陷阱,本研究中Adam優(yōu)化器使各參數(shù)自調(diào)整學習率,模型收斂速度更快、穩(wěn)定性更好。與傳統(tǒng)BPNN及KNN、RF和SVM等算法相比,改進后的BPNN在煙草病毒病檢測中表現(xiàn)出顯著優(yōu)勢,在標準差數(shù)據(jù)集上,相較于傳統(tǒng)BPNN,二元分類準確率提升了5百分點、F1分數(shù)提升0.06,三元分類準確率提升了8百分點、F1分數(shù)提升0.1,相較于KNN、RF、SVM,準確率提升了4百分點至12百分點不等,F(xiàn)1分數(shù)提升0.05至0.12不等(表4)。
植被指數(shù)的選擇對于病害識別至關重要。本研究通過對不同特征集(最大值、最小值、均值及標準差)的相關性分析,篩選出了最優(yōu)特征變量,包括NGBDI、RVI、TCARI和MTCI等。這些指數(shù)在特征選擇過程中表現(xiàn)出與病害高度相關的特性,使得模型能夠在較少特征的情況下仍能達到較高的分類精度。此外,通過結合多種相關性系數(shù)(如點二列、皮爾遜和斯皮爾曼),確保了特征選擇過程中的全面性和準確性,避免單一系數(shù)可能帶來的偏差。
本研究中,選擇了直接基于數(shù)字數(shù)值(DN值)來計算植被指數(shù)的方法,這一決策是基于低空無人機遙感中大氣干擾較少且傳感器設計相對簡單的特點。特別是在使用DJIPhantom4Multispectral型無人機時,其先進的空間分辨率、光譜分辨率以及數(shù)據(jù)校正方法允許本研究使用DN值進行初步的植被指數(shù)計算[11]。李斌等[38]的研究發(fā)現(xiàn),即使不經(jīng)過復雜的輻射校正過程,使用DN值也可以得到具有實用價值的結果,能夠反映出植被生長周期內(nèi)的主要特征變化。這種做法不僅簡化了預處理步驟,而且在進行分類任務時,同樣能提供可靠的數(shù)據(jù)支持。此外,Lan等[39]在其關于柑橘黃龍病檢測的研究中也驗證了原始DN方法的有效性,表明從DN值開始處理數(shù)據(jù)可以實現(xiàn)有效的疾病識別。本研究基于DN值計算植被指數(shù),與傳統(tǒng)的基于反射率的計算方法相比,能夠減少大氣干擾和數(shù)據(jù)校正的復雜度,進一步提高了數(shù)據(jù)處理效率。
然而,本研究仍存在一定局限性。模型泛化能力有限,隨著病害程度劃分更加細致,算法準確率呈下降趨勢。這可能是由于數(shù)據(jù)采集范圍有限,病毒性花葉病表觀特征不如黑脛病、青枯病明顯,導致模型在面對復雜多樣的實際情況時適應性不夠。本研究所用的多光譜數(shù)據(jù)僅涵蓋了幾個特定波段,未能充分利用更廣泛或更高分辨率的光譜信息。未來可以考慮結合高光譜、熱成像等其他傳感器獲取更多信息,提高病害檢測的準確性和魯棒性。此外,不同地區(qū)的煙草品種、土壤條件、氣候環(huán)境等因素差異較大,本研究僅在特定地區(qū)進行了初步研究。
針對這些局限性,未來可通過擴大數(shù)據(jù)采集范圍,涵蓋更多地區(qū)、品種和不同環(huán)境條件下的煙草樣本。引入更多數(shù)據(jù)增強技術,如旋轉、翻轉、縮放等圖像變換操作及增強算法,提高模型泛化能力。結合其他傳感器,如高光譜傳感器可獲取更豐富的光譜信息,熱成像傳感器可反映植株生理狀態(tài)變化,為煙草病毒病檢測提供更全面的數(shù)據(jù)支持。進一步優(yōu)化深度學習模型,如探索更合適的網(wǎng)絡結構、調(diào)整超參數(shù)、改進損失函數(shù)等,以提升模型性能,克服現(xiàn)有局限。本研究為煙草病毒病檢測提供了一種新方法,改進后的BPNN在煙草病毒病檢測中具有一定優(yōu)勢,但仍需進一步完善,以更好地應用于實際生產(chǎn)中,為煙草種植者提供更準確、及時的病害預警和防控技術支持。
綜上,本研究方法能夠簡便、快速篩查煙田健康狀況,幫助煙技人員及時發(fā)現(xiàn)并采取措施應對病害,減少經(jīng)濟損失;同時,也為其他作物病害監(jiān)測提供了可借鑒的技術框架。
4結論
本研究探索了3種機器學習算法、1種傳統(tǒng)神經(jīng)網(wǎng)絡算法和1種改進神經(jīng)網(wǎng)絡算法在實際環(huán)境中對煙草病毒病檢測的適用性。提出一種基于無人機多光譜數(shù)據(jù)采集、光譜指數(shù)分析、多種相關性分析方法和改進的BPNN算法的煙草病毒病檢測方法。在健康與染病的二元分類任務以及健康、中度和重度染病的三元分類任務中,改進的BPNN在準確率和F1分數(shù)上顯著優(yōu)于傳統(tǒng)算法。但本研究仍存在模型泛化能力有限以及多光譜數(shù)據(jù)單調(diào)的局限性,主要表現(xiàn)為算法準確率隨著病害程度劃分更加細致呈下降趨勢,未來可通過擴大數(shù)據(jù)采集范圍、引入更多數(shù)據(jù)增強技術、結合其他傳感器(如高光譜、熱成像)及進一步優(yōu)化深度學習模型來提升泛化能力,克服局限。
參考文獻
[1] 楊梅.煙草花葉病毒病的發(fā)生及綜合防治[J].現(xiàn)代農(nóng)業(yè)科技, 2018(1):121,123. YANG M.Occurrence and integrated control of tobacco mosaic virus disease[J].Modern Agricultural Science and Technology,2018(1): 121,123.
[2] SHAHITB,XUCY,NEUPANEA,etal.Recentadvancesincrop disease detection using UAV and deep learning techniques[J]. RemoteSensing,2023,15(9):2450.
[3] THIMMEGOWDA TG M,JAYARAMAIAH C.Cluster-based segmentation for tobacco plant detection and classification[J]. Bulletin ofElectrical Engineeringand Informatics,2023, 12(1):75- 85.
[4] NGUYENC,SAGANV,SKOBALSKIJ,etal.Earlydetectioof wheatyellowrustdiseaseand itsimpactonterminal yieldwithmultispectralUAV-imagery[J].RemoteSensing,2023,15(13):3301.
[5] 趙晉陵,金玉,葉回春,等.基于無人機多光譜影像的檳榔黃化 病遙感監(jiān)測[J].農(nóng)業(yè)工程學報,2020,36(8):54-61. ZHAOJL,JINY,YEHC,etal.Remotesensingmonitoringof areca yellow leaf disease based on UAV multi-spectral images[J]. Transactions of the Chinese Society of Agricultural Engineering, 2020,36(8): 54-61.
[6] 劉麗娟,劉仲鵬.基于改進BP算法的玉米葉部病害圖像識別研 究[J].江蘇農(nóng)業(yè)科學,2013,41(11):139-142. LIULJ,LIU ZP.Study on image recognitionof maize leaf diseases based on improved BP algorithm[J]. Jiangsu Agricultural Sciences, 2013,41(11): 139-142.
[7] 劉坤,劉娜,張娜,等.改進BP神經(jīng)網(wǎng)絡和特征提取的黃瓜病 害識別研究[J].安徽農(nóng)學通報,2022,28(3):119-122. LIUK,LIUN,ZHANGN, etal.Research oncucumber leaf disease recognition based on improved BP neural network and feature extraction[J].Anhui Agricultural Science Bulletin,2022,28(3):119- 122.
[8] LIUR,ZHANG XQ. Semi-implicit back propagation[EB/OL].2020: 2002.03516. https://arxiv.org/abs/2002.03516v1.
[9] FANG B Y, KLABJAN D. Convergence analyses of online ADAM algorithm in convex seting and two-layer ReLU neural network [EB/OL].2019:1905.09356. htps://arxiv.org/abs/1905.09356v2.
[10]LIU S Z, ZENG W Z, WU L F, et al. Simulating the leaf area index ofrice from multispectral images[J].Remote Sensing,2021,13(18): 3663.
[11]LU H, FAN T X, GHIMIRE P, et al. Experimental evaluation and consistency comparison of UAV multispectral minisensors[J]. Remote Sensing,2020,12(16):2542.
[12]VINA A, GITELSON A A, NGUY-ROBERTSON A L,et al. Comparison of different vegetation indices for the remote assessment of green leaf area index of crops[J]. Remote Sensing of Environment, 2011,115(12):3468-3478.
[13]XUE JR, SU B F. Significant remote sensing vegetation indices: A review of developments and applications[J]. Journal of Sensors,2017, 2017(1):1353691.
[14]KANKE Y,TUBANA B,DALEN M, et al. Evaluation of red and rededge reflectance-based vegetation indices for rice biomass and grain yieldprediction models in paddy fields[J].Precision Agriculture, 2016,17(5): 507-530.
[15]BALIDOY BALOLOY A, CONFERIDO BLANCO A, GUMBAO CANDIDO C, et al. Estimation of mangrove forest aboveground biomass using multispectral bands,vegetation indices and biophysical variablesderivedfromopticalsateliteimageries:Rapideye, planetscope and SENTINEL-2[J]. ISPRS Annals of Photogrammetry, Remote Sensing and Spatial Information Sciences,2018, IV3: 29-36.
[16]KROSS A, McNAIRN H, LAPEN D, et al. Assessment of RapidEye vegetationindices for estimation ofleaf area index and biomassin corn and soybean crops[J]. International Journal of Applied Earth Observation and Geoinformation, 2015, 34: 235-248.
[17]MARIND B,F(xiàn)ERRAZ GA E S,GUIMARAES PH S,et al. Remotely piloted aircraft and random forest in the evaluation of the spatial variability of foliar nitrogenin coffee crop[J].Remote Sensing,2021, 13(8): 1471.
[18]SOUBRY I, PATIAS P,TSIOUKAS V.Monitoring vineyards with UAV and multi-sensors for the assessment of water stress and grape maturity[J]. Journal of Unmanned Vehicle Systems, 2017, 5(2):37- 50.
[19]LYU HY,GRAFTON M,RAMILAN T, et al. Using remote and proximal sensing data and vine vigor parameters for non-destructive andrapid prediction of grape quality[J].Remote Sensing,2023, 15(22): 5412.
[20]JANNOURA R, BRINKMANN K, UTEAU D, et al. Monitoring of crop biomass using true colour aerial photographs taken from a remote controlled hexacopter[J]. Biosystems Engineering, 2015,129: 341-351.
[21]HASHIMOTO N, SAITO Y, MAKI M, et al. Simulation of reflectance and vegetation indices for unmanned aerial vehicle (UAV) monitoring of paddy fields[J].Remote Sensing,2019,11(18): 2119.
[22]張殿岱,王雪梅.基于高分辨率遙感影像的植被分類方法比較[J]. 林業(yè)資源管理,2021(3):108-113. ZHANGDD,WANGXM.Comparisonof vegetationclassification methods based on high resolution remote sensing image[J].Forest Resources Wanagement, 2021(3):108.
[23]ZHANG S C,LI X L,ZONG M,et al.Learning k for kNN classification[J].ACM Transactions on Inteligent Systemsand Technology,2017,8(3):1-19.
[24]SCHONLAU M, ZOU R Y.The random forest algorithm for statistical learning[J]. The Stata Journal: Promoting Communications on Statistics and Stata,2020,20(1): 3-29.
[25]YUE S H, LI P,HAO P Y. SVM classification: Its contents and challenges[J].AppliedMathematics-AJournalofChinese Universities,2003,18(3):332-342.
[26]ASAAD R R, ALI R I. Back propagation neural network(BPNN) and sigmoid activation function in multi-layer networks[J]. Academic Journal of Nawroz University, 2019, 8(4): 216-221.
[27]SINGH N, SABROL H. Convolutional neural networks-an extensive arena of deep learning.a comprehensive study[J]. Archives of Computational Methods in Engineering, 2021, 28(7): 4755-4780.