曹益飛 徐煥良 吳玉強(qiáng) 范加勤 馮佳睿 翟肇裕
(1.南京農(nóng)業(yè)大學(xué)人工智能學(xué)院,南京 210095;2.南京農(nóng)業(yè)大學(xué)工學(xué)院,南京 210031;3.南京農(nóng)業(yè)大學(xué)植物保護(hù)學(xué)院,南京 210095)
水稻是人類重要的糧食作物之一,目前,約有56億人(占世界人口的80%)以水稻為主食[1-2]。水稻白葉枯是水稻三大病害之一,嚴(yán)重影響了水稻的產(chǎn)量,在稻田中分布不均勻、病菌來源廣、傳播途徑多、侵染時(shí)間長,發(fā)展傳播情況復(fù)雜[3]。近年來,白葉枯病的暴發(fā)面積約占總種植面積的1/3,平均病株率約為10%,給我國糧食安全帶來巨大威脅[4]。水稻白葉枯病由病原體引起,是一種在整個(gè)水稻生長期存在的細(xì)菌病害,主要浸染葉片,也可侵染葉鞘[5]。一般在26~30℃、相對濕度85%以上、多雨、光照不足、風(fēng)速大的氣候條件下發(fā)生流行[6],且在發(fā)病初期,不易觀察到明顯病癥,但根據(jù)植物病理學(xué)理論[7],在白葉枯發(fā)病期,水稻葉片內(nèi)部化學(xué)成分發(fā)生了變化,使得患病葉片對不同光譜波段的吸收率和反射率發(fā)生改變。隨著光學(xué)技術(shù)的發(fā)展,高光譜成像技術(shù)為獲取植物內(nèi)部變化信息提供了可能[8-9]。在白葉枯病害脅迫下,水稻葉片將經(jīng)歷兩個(gè)階段,包括無癥狀階段和有癥狀階段[5,10]。為了實(shí)現(xiàn)水稻白葉枯病害發(fā)病率和潛伏期的預(yù)測,則需要采集適宜條件下水稻葉片由無癥狀到有癥狀變化的整個(gè)階段的時(shí)序高光譜圖像。
目前,高光譜成像已被用于監(jiān)測各種作物病害,如大豆炭疽病[11]、小麥白粉病[12]、水稻紋枯病[13]等病害的早期監(jiān)測,很少有水稻白葉枯病的早期監(jiān)測預(yù)警研究。高光譜成像技術(shù)在獲取作物葉片海量光譜信息和空間信息的同時(shí)也帶來了巨大計(jì)算量的挑戰(zhàn),深度學(xué)習(xí)是解決該難題的一個(gè)重要研究方向[9,14]。為了通過水稻葉片時(shí)序高光譜圖像對適宜條件下白葉枯病水稻葉片的發(fā)病率(即接種過白葉枯病菌的水稻葉片病害區(qū)域占葉面積的比例)和潛伏期(即從接種操作開始到出現(xiàn)癥狀的時(shí)間)進(jìn)行預(yù)測,將發(fā)病率和潛伏期設(shè)為兩個(gè)任務(wù)。如果分別使用兩個(gè)模型來分別預(yù)測病害發(fā)病率和潛伏期,就會(huì)出現(xiàn)占用過多計(jì)算和存儲(chǔ)空間的問題。多任務(wù)學(xué)習(xí)(Multi-task learning, MTL)具有共享特征、相互輔助的特點(diǎn)[15]。
近年來,以長短期記憶網(wǎng)絡(luò)(Long-short term memory, LSTM)為代表的深度學(xué)習(xí)算法對時(shí)序數(shù)據(jù)的分析得到了廣泛的應(yīng)用。研究表明,對于時(shí)間序列數(shù)據(jù),LSTM的性能優(yōu)于深度前饋神經(jīng)網(wǎng)絡(luò)[16]。LSTM可以通過記憶單元和門控機(jī)制捕獲長期依賴關(guān)系,有效地從包含時(shí)間信息的數(shù)據(jù)中學(xué)習(xí)順序模式[17]。SU等[18]基于時(shí)序多光譜圖像對小麥黃銹病進(jìn)行時(shí)空監(jiān)測,為農(nóng)田尺度黃銹病的早期監(jiān)測提供了重要指導(dǎo)。KIM等[2]結(jié)合環(huán)境條件和長短期記憶遞歸神經(jīng)網(wǎng)絡(luò)對水稻稻瘟病進(jìn)行早期預(yù)測,預(yù)測病害發(fā)生準(zhǔn)確率達(dá)到67.4%。VERMA等[19]利用視頻流數(shù)據(jù)分析和LSTM卷積神經(jīng)網(wǎng)絡(luò)來預(yù)測水稻病害,結(jié)果表明基于模糊特征構(gòu)建的預(yù)測模型取得了很好的預(yù)測效果。以上研究大多關(guān)注病害發(fā)病率,而忽視了作物病害潛伏期,因此無法及時(shí)指導(dǎo)作物病害防治策略的制定。
本研究結(jié)合時(shí)序高光譜圖像與深度學(xué)習(xí)建立水稻白葉枯病早期預(yù)測模型。該預(yù)測模型基于時(shí)序高光譜數(shù)據(jù),融合多任務(wù)學(xué)習(xí)與LSTM網(wǎng)絡(luò),實(shí)現(xiàn)白葉枯病發(fā)病率和潛伏期的預(yù)測。通過連續(xù)采集健康和發(fā)病初期的葉片高光譜數(shù)據(jù),探索利用隨機(jī)森林(Random forest, RF)和主成分分析(Principal component analysis, PCA)從原始高光譜中提取光譜特征;利用基于全波段光譜數(shù)據(jù)集(232個(gè)波長)以及不同降維方法得到的時(shí)序高光譜特征數(shù)據(jù)集訓(xùn)練MTL-LSTM模型;利用鯨魚優(yōu)化算法(Whale optimization algorithm, WOA)優(yōu)化MTL-LSTM模型,并評估模型優(yōu)化前后的性能,以期為科學(xué)防治作物病害提供思路,為病害預(yù)測提供技術(shù)支持。
使用白葉枯病脅迫下的水稻葉片時(shí)序高光譜圖像構(gòu)建早期病害發(fā)病率和潛伏期的預(yù)測模型。
為了確保水稻葉片在感染白葉枯病之后到出現(xiàn)明顯病斑之前,有足夠時(shí)間來觀測無明顯癥狀的水稻葉片高光譜的變化,本實(shí)驗(yàn)選擇高抗白葉枯水稻品種作為實(shí)驗(yàn)對象。溫室實(shí)驗(yàn)于2020年在南京農(nóng)業(yè)大學(xué)溫室實(shí)驗(yàn)基地進(jìn)行。種植前挑選飽滿種粒,浸種、催芽,水稻種植在填充有水稻粘土的塑料杯(直徑35 cm×高32 cm)中。首先,在溫室內(nèi)培育幼苗(圖1a),然后分別移栽到塑料杯中,每杯3株水稻(圖1b),共計(jì)50杯。為了模擬水稻在自然生長環(huán)境中的管理實(shí)踐,在移栽之前施用基礎(chǔ)營養(yǎng)肥料(包括CO(NH2)2,150 kg/hm2;P2O5,135 kg/hm2;K2O,18.3 kg/hm2),并在分蘗開始階段第2次追肥(N,150 kg/hm2)。為了監(jiān)測水稻白葉枯病在條件適宜情況下的發(fā)病天數(shù),將幼苗移栽后,放在自然環(huán)境下生長,根據(jù)需要進(jìn)行灌溉,以確保每個(gè)塑料杯中的土壤始終被淺層水覆蓋,直到接種病菌前一周轉(zhuǎn)移到溫室。溫室由兩層透明材料組成,配備了空調(diào)和加濕設(shè)施,為白葉枯病菌的人工接種提供合適的環(huán)境條件。
圖1 不同生育期水稻苗栽培示意圖
1.2.1實(shí)驗(yàn)材料制備
本實(shí)驗(yàn)所接種的白葉枯病菌由南京農(nóng)業(yè)大學(xué)植物保護(hù)學(xué)院提供,為稻黃單胞菌稻致病變種(Xanthomonasoryzaepv,oryzae,Xoo),病菌通常由水稻的傷口或水孔侵入水稻葉片,進(jìn)入木質(zhì)部進(jìn)行繁殖,并由葉片向葉鞘侵染[20]。實(shí)驗(yàn)材料制備具體操作過程如下:首先,取出于-70℃保存的菌株,在超凈工作臺(tái)上使用滅菌槍頭吸取菌液,隨后轉(zhuǎn)移至平板培養(yǎng)基(牛肉提取物0.3%、肉蛋白胨1%、蔗糖1%和瓊脂2%)上,用滅菌接種環(huán)涂布均勻,置于28℃培養(yǎng)箱中培養(yǎng)48 h,此時(shí)細(xì)菌呈現(xiàn)亮黃色。然后,用磷酸鹽緩沖液稀釋,采用比濁法將細(xì)菌培養(yǎng)液稀釋至每毫升約9×109個(gè)細(xì)菌。最后,將所有水稻樣本按照比例1∶4分配,其中40杯采用常見的剪葉法使病菌侵染葉片,用已消毒的手術(shù)剪刀蘸取菌液,剪掉分蘗期每株水稻劍葉和倒二葉尖端1 cm長的部分,完成病菌接種,所有病菌接種操作均在病菌懸浮液制備后3 h內(nèi)完成;同時(shí),另外10杯作為參照組,即用已消毒的手術(shù)剪刀蘸取純凈水進(jìn)行相同的剪葉操作。在適宜條件下,病菌侵入至癥狀表現(xiàn)只需3~5 d。同一品種苗期到分蘗期抗病能力較強(qiáng)、分蘗末期抗病力下降、孕穗期和抽穗期最易感病。最后,將接種病菌的所有水稻植株放回溫室繼續(xù)培育。為了確保病菌成功侵染葉片,且環(huán)境條件適宜病害發(fā)展,需要嚴(yán)格控制環(huán)境變量,控制溫室內(nèi)溫度為26~30℃、相對濕度超過90%、光照周期為14 h,為采集病害脅迫下水稻葉片的時(shí)序高光譜圖像做準(zhǔn)備。
1.2.2數(shù)據(jù)采集
本實(shí)驗(yàn)采用上海五鈴光電科技有限公司的推掃型高光譜成像系統(tǒng)的內(nèi)部組件,主要包括成像鏡頭、鹵素?zé)艄庠?、電控步進(jìn)載物臺(tái)等,如圖2所示。
圖2 高光譜成像系統(tǒng)內(nèi)部構(gòu)成圖
高光譜成像系統(tǒng)主要部件參數(shù)如表1所示。采集軟件由Spectral-image成像軟件和HSI Analyzer分析軟件組成。
表1 高光譜成像系統(tǒng)主要部件參數(shù)
時(shí)序高光譜圖像采集過程:以病原菌接種當(dāng)天為初始點(diǎn),每隔24 h對樣本進(jìn)行高光譜成像實(shí)驗(yàn),直至所有感染葉片出現(xiàn)明顯病斑結(jié)束實(shí)驗(yàn)(本實(shí)驗(yàn)7 d全部出現(xiàn)明顯病斑)。實(shí)驗(yàn)中,固定每天采集時(shí)間(12:00—14:00)和儀器光照強(qiáng)度(150 lx)、相機(jī)垂直角度(90°)、物距(27 cm)等因素,確保采集數(shù)據(jù)的時(shí)序一致性。最終,按照上述流程,共采集連續(xù)7 d的高光譜數(shù)據(jù),包括60×7個(gè)對照葉片和240×7個(gè)病害葉片的時(shí)序高光譜數(shù)據(jù)。
使用1.2.2節(jié)中所述的高光譜成像系統(tǒng)采集水稻病害葉片在波段378.28~1 033.05 nm范圍內(nèi)的高光譜圖像。由于成像系統(tǒng)本身及其他因素的影響,獲取的高光譜圖像具有不穩(wěn)定性。因此,需要對高光譜圖像進(jìn)行黑白校正,具體技術(shù)細(xì)節(jié)參照文獻(xiàn)[21]。利用ENVI 5.1x(Research System Inc, boulder, Co.,美國)提取校正后水稻葉片高光譜圖像中的感興趣區(qū)域(Region of interest, ROI),圖3為ROI選取示意圖,其中紅框區(qū)域?yàn)檫x定的待分析ROI。
圖3 ROI選取示意圖
如圖3所示,為了更好地表征無癥狀區(qū)域的光譜,每個(gè)ROI包含9個(gè)小紅框,計(jì)算每一個(gè)小紅框中所有光譜的平均光譜,共計(jì)9條平均光譜作為該ROI的光譜樣本對多任務(wù)進(jìn)行預(yù)測,包括水稻葉片白葉枯病害的發(fā)病率。由于白葉枯病菌可以通過葉脈傳播,越靠近接種點(diǎn)病害的脅迫癥狀越明顯,因此選擇靠近接種點(diǎn)處的ROI作為待分析的對象。在水稻高光譜數(shù)據(jù)采集完成后,通過分析高光譜圖像,對水稻葉片發(fā)病率和潛伏期進(jìn)行統(tǒng)計(jì)。一方面,通過計(jì)算水稻葉片病害面積占整個(gè)水稻葉面積的比例來計(jì)算水稻葉片發(fā)病率。由于采用人工剪葉的方式接種病菌,且白葉枯病菌是沿著維管束侵染葉片,假設(shè)侵染速度相同,故可以用發(fā)病區(qū)域的長度占葉片長度的比率近似為病害面積占整片水稻葉面積的比率,圖4為白葉枯病菌侵染的水稻葉片,紅色框?yàn)榘l(fā)病區(qū)域。另一方面,通過目視檢測的方法,統(tǒng)計(jì)水稻潛伏期(如從病害接種到出現(xiàn)明顯癥狀的時(shí)間為 4 d,則將病害潛伏期記為 3 d,接種第1天不計(jì))。
圖4 白葉枯病菌侵染的水稻葉片
利用ENVI 5.1x提取尺寸為50像素×50像素的ROI光譜圖像作為該葉片的樣本,并提取每個(gè)ROI的平均光譜,每個(gè)ROI的9條平均光譜如圖5所示。由圖5可以看出,高光譜存在噪聲,尤其是小于450 nm波段和大于950 nm波段。常見方法是刪除噪聲較大的波段[22],本研究為了消除光譜信號中的隨機(jī)噪聲,提高采樣信號的信噪比,截取450~950 nm之間的波段進(jìn)行分析,使用Savitzky-Golay(SG)平滑濾波器減少隨機(jī)噪聲(核大小為5×5×5,多項(xiàng)式階數(shù)為3)。
圖5 不同狀態(tài)下水稻葉片ROI的9條平均光譜
考慮到待分析的高光譜圖像涵蓋450~950 nm之間的所有光譜信息,共計(jì)232個(gè)波長,其特點(diǎn)是相鄰波長之間存在高維冗余,給計(jì)算速度帶來了巨大挑戰(zhàn)。為解決這個(gè)問題,在對采集到的高光譜原始數(shù)據(jù)的處理過程中,對數(shù)據(jù)進(jìn)行降維操作是有效的方法,在不丟失有效光譜信息的基礎(chǔ)上降低后續(xù)計(jì)算的成本。常見的高光譜數(shù)據(jù)降維方法有特征提取和波段選擇。選用常見的主成分分析法[23]對高光譜進(jìn)行特征提取,同時(shí)利用隨機(jī)森林算法[24]提取對病害敏感的特征波長對高光譜圖像進(jìn)行波段選擇。
1.4.1基于PCA的光譜特征提取
PCA算法是一種常用的數(shù)據(jù)壓縮方法,常用于高維數(shù)據(jù)降維[25]。PCA可以提取原始高光譜數(shù)據(jù)的主成分(Principal components, PCs)。本文中主成分分析的主要思想是將232維光譜特征映射到k維(k<232)。與簡單地從原始空間中移除不太重要的維度特征相反,通過將原始空間中的特征映射到新空間中,這些k維特征可以被視為主成分。本研究中,每個(gè)ROI包含9條光譜,預(yù)處理后每條光譜包含232個(gè)波長,即預(yù)處理后的高光譜數(shù)據(jù)的特征個(gè)數(shù)為232,主成分求解步驟如下:
(1)將預(yù)處理后的高光譜數(shù)據(jù)按列組成232行9列的光譜矩陣X。
(2)將X的每一行(即每一個(gè)波段光譜反射率)進(jìn)行零均值化,即減去這一行的均值。
(3)求出光譜矩陣X的協(xié)方差矩陣。
(4)計(jì)算協(xié)方差矩陣的特征值及每個(gè)特征值對應(yīng)的特征向量。
(5)將特征向量按對應(yīng)特征值大小從上到下按行排列成矩陣,取前k行組成矩陣P,即為該ROI預(yù)處理后的光譜矩陣降維到k維后的數(shù)據(jù)。
1.4.2基于RF的光譜特征提取
RF算法隨機(jī)替換每個(gè)特征,對特征替換后生成的新袋外數(shù)據(jù)進(jìn)行隨機(jī)森林測試,預(yù)測誤差率會(huì)發(fā)生變化[26]。特征波長對病害敏感性越高,被替換后的預(yù)測誤差率就越大。本文中,每條光譜有232個(gè)波長,即232個(gè)特征。通過這種方式,根據(jù)每個(gè)特征波長替換前后的錯(cuò)誤率進(jìn)行評分,從而獲得具有高重要性評分的特征波長[27]。為了降低原始高光譜數(shù)據(jù)的維數(shù),本文根據(jù)重要分?jǐn)?shù)選擇了不同數(shù)量的特征波長。隨機(jī)森林中決策樹數(shù)為Ntree,設(shè)為200,原始光譜特征數(shù)為d,設(shè)為232。每個(gè)特征Xj(j=1,2,…,d)的重要性得分計(jì)算步驟如下:
(1)計(jì)算第i個(gè)決策樹對應(yīng)的袋外數(shù)據(jù)(Out-of-bag, OOB)OOBi的袋外誤差樣本(Out-of-bag-error, ErrOOB)ErrOOBi的數(shù)量。
(5)特征波長Xj的重要性得分Sim(Xj)計(jì)算公式為
(1)
利用PCA和RF對預(yù)處理后的高光譜進(jìn)行降維處理,分別構(gòu)建了全光譜波長數(shù)據(jù)集(232個(gè)波長)、RF特征波長數(shù)據(jù)集(10個(gè)波長)和PCA光譜特征數(shù)據(jù)集(10個(gè)主成分)共3個(gè)數(shù)據(jù)集,將其作為模型的輸入。
本文旨在利用水稻病害葉片的時(shí)序高光譜數(shù)據(jù)預(yù)測在適宜條件下水稻葉片白葉枯病發(fā)病率和潛伏期。LSTM網(wǎng)絡(luò)是目前最常見的時(shí)序數(shù)據(jù)分析算法,本文擬利用MTL-LSTM對水稻病害時(shí)序高光譜進(jìn)行建模,實(shí)現(xiàn)對水稻葉片白葉枯病發(fā)病率以及潛伏期的多任務(wù)預(yù)測。運(yùn)用鯨魚優(yōu)化算法對MTL-LSTM網(wǎng)絡(luò)進(jìn)行優(yōu)化,以獲得最優(yōu)的病害預(yù)測模型來預(yù)測水稻葉片白葉枯病發(fā)病率和病害潛伏期。
1.5.1多任務(wù)學(xué)習(xí)
MTL是一種歸納遷移方法,能充分利用隱含在多個(gè)相關(guān)任務(wù)訓(xùn)練信號中的特定領(lǐng)域信息。MTL通??煞譃橛补蚕砗蛙浌蚕韮煞N方式[28]。硬共享是通過共享不同任務(wù)間共用底部的隱層參數(shù)來實(shí)現(xiàn)特征提取與輸出,軟共享的形式則較為多樣,每個(gè)任務(wù)都具有單獨(dú)的參數(shù),如兩個(gè)任務(wù)不進(jìn)行參數(shù)共享,但對不同任務(wù)的參數(shù)增加L2范數(shù)的限制。硬共享網(wǎng)絡(luò)不容易陷入過擬合,但如果任務(wù)差異較大,模型結(jié)果較差。軟共享網(wǎng)絡(luò)通常參數(shù)較多,結(jié)構(gòu)比較復(fù)雜,線上部署困難[29]。本文基于時(shí)序高光譜對適宜條件下感染白葉枯病害的水稻葉片的發(fā)病率(任務(wù)1)和潛伏期(任務(wù)2)進(jìn)行預(yù)測,均屬于回歸任務(wù),有較大相關(guān)性,故本文構(gòu)建了參數(shù)硬共享網(wǎng)絡(luò)對水稻病害發(fā)病率和潛伏期進(jìn)行預(yù)測。
在MTL中,每個(gè)任務(wù)的數(shù)據(jù)分布和重要性往往是不同的。MTL損失函數(shù)可以通過不同任務(wù)的平方損失函數(shù)的加權(quán)求和得到。損失值計(jì)算公式為
LMTL=αl1+βl2
(2)
(3)
α+β=1
(4)
式中LMTL——多任務(wù)學(xué)習(xí)模型損失值
l1、l2——發(fā)病率和潛伏期預(yù)測損失值
y1i——發(fā)病率實(shí)際值
y2i——潛伏期實(shí)際值
n——樣本數(shù)α、β——權(quán)重
1.5.2MTL-LSTM神經(jīng)網(wǎng)絡(luò)
LSTM是一種改進(jìn)的循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent neural networks, RNN),主要用于解決長序列訓(xùn)練過程中梯度消失和梯度爆炸問題[30]。與普通的RNN相比,LSTM在時(shí)間序列預(yù)測方面有更好的表現(xiàn),LSTM網(wǎng)絡(luò)善于利用數(shù)據(jù)中的時(shí)間特征來學(xué)習(xí)歷史數(shù)據(jù)的相關(guān)性,從而提高預(yù)測精度。LSTM模型的核心思想,分別為記憶元組和非線性的門單元,其中記憶元組用于保持系統(tǒng)的狀態(tài),非線性的門單元用于在每一個(gè)時(shí)間點(diǎn)調(diào)節(jié)流入和流出記憶元組的信息。
在LSTM網(wǎng)絡(luò)中,LSTM單元的輸入變量有:前一個(gè)單元的狀態(tài)ct-1、前一個(gè)單元的輸出ht-1、當(dāng)前單元的輸入xt,輸出變量有:當(dāng)前輸出ht及當(dāng)前狀態(tài)ct。LSTM網(wǎng)絡(luò)通過輸入門、遺忘門和輸出門來維持和更新神經(jīng)網(wǎng)絡(luò)中細(xì)胞的狀態(tài)[31],如圖6所示。
圖6 LSTM結(jié)構(gòu)圖
由于LSTM神經(jīng)網(wǎng)絡(luò)包含時(shí)間記憶單元,適用于處理和預(yù)測時(shí)間序列數(shù)據(jù)中的間隔和延遲事件,有利于捕捉時(shí)序高光譜的長期和短期依賴關(guān)系[32]。在本研究的病害預(yù)測任務(wù)中選擇LSTM網(wǎng)絡(luò)單元組成子任務(wù)層,并基于此構(gòu)建MTL-LSTM網(wǎng)絡(luò)。LSTM網(wǎng)絡(luò)最大訓(xùn)練次數(shù)為100,學(xué)習(xí)率設(shè)為0.01,最小性能梯度為0.000 1,MTL-LSTM網(wǎng)絡(luò)的結(jié)構(gòu)如圖7所示,構(gòu)建由Embedding層、LSTM網(wǎng)絡(luò)層和Pooling層組成的多任務(wù)學(xué)習(xí)結(jié)構(gòu)。將時(shí)序高光譜數(shù)據(jù)按病菌接種天數(shù)表示為x={x1,x2,…,x7}作為輸入,xi的大小為9n,n為處理后的光譜特征數(shù)(對于全光譜n記為232,對于光譜特征n記為10)。將相同位置ROI中的每一條光譜的反射率序列線性映射到一個(gè)向量中,然后應(yīng)用LSTM對時(shí)序高光譜進(jìn)行建模,獲取每一天光譜的表示向量h={h1,h2,…,h7}。通過共享LSTM層參數(shù),得到不同病害接種天數(shù)時(shí)的LSTM網(wǎng)絡(luò)輸出特征,通過池化得到新的特征a={a1,a2,…,a7},輸入到不同的全連接層,進(jìn)而實(shí)現(xiàn)水稻白葉枯病害發(fā)病率和潛伏期的預(yù)測任務(wù)。
圖7 MTL-LSTM網(wǎng)絡(luò)結(jié)構(gòu)圖
1.5.3鯨魚優(yōu)化算法
鯨魚優(yōu)化算法是一種新型的群智能算法,其基本思想來源于座頭鯨氣泡網(wǎng)狩獵策略,該策略融合了座頭鯨收縮包圍獵物和螺旋狩獵方式的局部開發(fā)能力,具有搜索能力強(qiáng)、收斂速度快以及能夠跳出局部最優(yōu)等特點(diǎn)[33]。本實(shí)驗(yàn)鯨魚優(yōu)化算法被用于優(yōu)化MTL-LSTM網(wǎng)絡(luò)模型的參數(shù),每條鯨魚被看作是一種優(yōu)化策略,其位置的維數(shù)對應(yīng)MTL-LSTM網(wǎng)絡(luò)待優(yōu)化參數(shù)的個(gè)數(shù),鯨魚在不斷更新自身位置的過程中能夠獲得MTL-LSTM網(wǎng)絡(luò)的最優(yōu)參數(shù)組合。
1.5.4WOA-MTL-LSTM模型設(shè)計(jì)
LSTM網(wǎng)絡(luò)在挖掘時(shí)序數(shù)據(jù)方面具有明顯的優(yōu)勢,本文利用MTL-LSTM網(wǎng)絡(luò)預(yù)測水稻發(fā)病率和病害潛伏期。實(shí)踐證明,MTL-LSTM網(wǎng)絡(luò)隱含層神經(jīng)元個(gè)數(shù)m以及時(shí)間步長s的選擇對預(yù)測精度有不可忽略的影響[34]。
目前,MTL-LSTM網(wǎng)絡(luò)的隱含層神經(jīng)元個(gè)數(shù)m只能由經(jīng)驗(yàn)公式確定大致范圍,無法獲得準(zhǔn)確最優(yōu)神經(jīng)元個(gè)數(shù)m。時(shí)間步長s就是循環(huán)單元結(jié)構(gòu)的個(gè)數(shù),若時(shí)間步長s過小則會(huì)失去不同時(shí)刻間信息的關(guān)聯(lián)性,若時(shí)間步長s過大則會(huì)減弱神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力。因此,本文通過鯨魚優(yōu)化算法對MTL-LSTM網(wǎng)絡(luò)的神經(jīng)元個(gè)數(shù)m及時(shí)間步長s進(jìn)行尋優(yōu)?;邛L魚優(yōu)化算法的MTL-LSTM模型(WOA-MTL-LSTM模型)預(yù)測白葉枯病發(fā)病率和潛伏期的流程圖如圖8所示。
圖8 WOA-MTL-LSTM模型流程圖
具體步驟如下:
(1)基于水稻病害葉片時(shí)序高光譜構(gòu)建MTL-LSTM網(wǎng)絡(luò),隨機(jī)初始化MTL-LSTM網(wǎng)絡(luò)隱含層神經(jīng)元個(gè)數(shù)m和時(shí)間步長s。
(2)設(shè)置鯨魚種群位置的上下界,確定生成鯨魚種群數(shù)量X、最大迭代次數(shù)和鯨魚個(gè)體空間維度,將變量(m,s)組合作為鯨魚算法待優(yōu)化參數(shù)。
(3)計(jì)算每個(gè)個(gè)體的適應(yīng)度,以MTL-LSTM訓(xùn)練得到的平均損失函數(shù)LAvg作為模型的適應(yīng)度函數(shù),平均損失函數(shù)LAvg定義為
(10)
通過公式(10)計(jì)算每一個(gè)個(gè)體的適應(yīng)度,標(biāo)記為最優(yōu)個(gè)體位置。
(4)隨機(jī)生成[0,1]之間的捕食行為概率p,若p<0.5,則直接進(jìn)行下一步判斷,反之,則收縮包圍獵物。
(5)若感知距離控制參數(shù)|A|>1,鯨魚根據(jù)彼此位置隨機(jī)搜索獵物,反之,鯨魚個(gè)體位置進(jìn)行螺旋更新。
(6)判斷經(jīng)過鯨魚優(yōu)化算法得到的模型損失值是否小于MTL-LSTM訓(xùn)練得到的平均損失函數(shù)LAvg,若滿足,則得到最優(yōu)的神經(jīng)元個(gè)數(shù)m和時(shí)間步長s;若不滿足,則更新參數(shù)并重新進(jìn)行訓(xùn)練。
(7)利用最優(yōu)參數(shù)的WOA-MTL-LSTM模型對水稻葉片白葉枯病發(fā)病率和潛伏期進(jìn)行預(yù)測。
為了評估基于時(shí)序高光譜的WOA-MTL-LSTM多任務(wù)學(xué)習(xí)模型的預(yù)測性能,將數(shù)據(jù)集按照比例 8∶2 劃分為訓(xùn)練集和測試集,并進(jìn)行5次10折交叉驗(yàn)證。將決定系數(shù)R2、均方根誤差(Root mean square error, RMSE)和相對誤差(Relative error, RE)作為評價(jià)指標(biāo),評估不同模型的預(yù)測性能,從而選擇最佳預(yù)測模型。
實(shí)驗(yàn)基于Tensorflow和Keras開源深度學(xué)習(xí)框架實(shí)現(xiàn)。操作平臺(tái)硬件配置包括NVIDIA GeForce RTX 2080Ti GPU,搭載AMD Ryzen 5-1600 @ 3.20 GHz六核處理器,內(nèi)存為64 GB。軟件環(huán)境為Windows 10操作系統(tǒng),選用Matlab 2016b及Python 3.7編程環(huán)境。構(gòu)建基于時(shí)序高光譜和MTL-LSTM及WOA-MTL-LSTM預(yù)測模型,對水稻葉片白葉枯病發(fā)病率以及潛伏期進(jìn)行預(yù)測,并比較不同模型的預(yù)測性能。
本研究截取波段450~950 nm范圍內(nèi),共計(jì)232個(gè)波長。經(jīng)過SG平滑后,不同ROI光譜中的噪聲大大降低,消除了大小差異和不同信息結(jié)構(gòu)的干擾,SG平滑后的光譜如圖9所示。
圖9 SG平滑后的9條平均光譜
由圖9可以看出,無癥狀ROI的RGB圖像和健康ROI的RGB圖像與有癥狀ROI的RGB圖像在顏色上有較大差異,可以通過目視檢測進(jìn)行分類。而無癥狀ROI的RGB圖像與健康ROI的RGB圖像則無法通過目視檢測進(jìn)行區(qū)分。對于不同狀態(tài)的ROI對應(yīng)的光譜差異較大,尤其無癥狀ROI與健康ROI在波段500~650 nm之間的光譜反射率差異最為明顯,健康ROI的反射率明顯低于病害ROI的反射率,這說明具有完整組織結(jié)構(gòu)的健康葉片ROI包含更多的光合色素,如葉黃素、葉綠素和類胡蘿卜素,導(dǎo)致在波段500~650 nm之間的吸收率更高[35]。病害脅迫下,葉片的內(nèi)部結(jié)構(gòu)隨著潛伏期增加而逐漸被破壞,對可見光的吸收逐漸降低,在波段450~720 nm間的反射率呈逐漸上升趨勢。綠峰波段光譜反射率隨葉片內(nèi)部結(jié)構(gòu)被破壞而逐漸升高,而紅谷波段反射率逐漸下降。在波段750~950 nm范圍內(nèi)光譜曲線變得平坦且重疊較多,這與ZHANG等[36]的研究結(jié)果一致。根據(jù)前人的研究,細(xì)菌引起的葉片內(nèi)部結(jié)構(gòu)損傷首先會(huì)降低近紅外范圍內(nèi)的光譜反射率,且水分等生物質(zhì)的損失可能最終導(dǎo)致反射率上升[37]。
為了分析水稻病害樣本的時(shí)序高光譜的時(shí)序性特點(diǎn),需要對時(shí)序高光譜數(shù)據(jù)進(jìn)行降維處理。本文首先對數(shù)據(jù)進(jìn)行主成分分析,主成分分析不僅可以降低數(shù)據(jù)維度,而且能夠通過樣本在各因子空間的得分確定所屬的類別,新變量可以更加直觀地表征原樣本的差異。
圖10a為經(jīng)過預(yù)處理的光譜的前3個(gè)主成分得分示意圖??梢钥闯?,將光譜的232個(gè)波長映射到全新的正交平面,可以很好地區(qū)分樣本所屬類別,且前3個(gè)主成分得分累加為98.63%,但是映射到新的正交平面則失去了光譜的波長屬性。為了盡可能多的保留原光譜的信息,本文選擇累計(jì)得分超過99%的前10個(gè)主成分作為高光譜降維后的待分析樣本。為了克服主成分分析將特征映射到新的正交平面而失去光譜波長屬性的缺陷,從高光譜所有波長中提取對病害敏感的波長子集。本文利用隨機(jī)森林算法提取高光譜中對水稻白葉枯病敏感性高的前10個(gè)光譜波長,如圖10b所示,從左到右,波長重要性得分逐漸降低,排序?yàn)?的波長(667.02 nm)重要性得分最高,為0.118 6,排序?yàn)?的波長(651.89 nm)重要性得分為0.117 9,依次遞減。在保留所需要信息的同時(shí)還降低了數(shù)據(jù)維度,從而減少了計(jì)算量。由圖10b可以看出,敏感性較高的光譜波段主要集中于530~700 nm之間,這和健康ROI的光譜曲線與病害ROI光譜曲線之間的差異存在較強(qiáng)相關(guān)性,這與ZHANG等[36]發(fā)現(xiàn)的水稻白葉枯病害敏感波段范圍重合。
圖10 基于PCA和RF提取SG平滑后光譜特征示意圖
將水稻病害葉片按照比例8∶2劃分為訓(xùn)練集和測試集,采用WOA算法對多任務(wù)學(xué)習(xí)LSTM網(wǎng)絡(luò)的隱含層神經(jīng)元個(gè)數(shù)m和時(shí)間步長s進(jìn)行尋優(yōu),可以得到最優(yōu)的MTL-LSTM網(wǎng)絡(luò)參數(shù)。圖11為WOA參數(shù)尋優(yōu)過程中平均損失值LAvg收斂曲線。由圖11可知,WOA在迭代周期為76時(shí)收斂到LAvg最小值。此時(shí),隱含層神經(jīng)元個(gè)數(shù)m為10,時(shí)間步長s為4,WOA獲取到MTL-LSTM網(wǎng)絡(luò)的最優(yōu)參數(shù)。
圖11 基于WOA參數(shù)尋優(yōu)的LAvg收斂曲線
為了驗(yàn)證WOA優(yōu)化MTL-LSTM多任務(wù)學(xué)習(xí)模型的性能,將典型的MTL-LSTM多任務(wù)學(xué)習(xí)模型與WOA優(yōu)化的MTL-LSTM多任務(wù)學(xué)習(xí)模型進(jìn)行性能比較。為了避免偶然性且客觀地進(jìn)行評價(jià),采取5次10折交叉驗(yàn)證法,將5次獨(dú)立重復(fù)訓(xùn)練仿真結(jié)果平均值作為最終參考依據(jù)。同時(shí),為了驗(yàn)證通過PCA和RF提取光譜特征的有效性,比較了基于全光譜波長數(shù)據(jù)集和PCA及RF提取光譜特征數(shù)據(jù)集構(gòu)建的模型的預(yù)測性能。
基于全光譜波長數(shù)據(jù)集(232個(gè)波長)構(gòu)建的模型對水稻白葉枯病害發(fā)病率及潛伏期預(yù)測的性能如表2所示。由表2可以看出,對發(fā)病率和潛伏期的預(yù)測性能,基于全光譜波長數(shù)據(jù)集的WOA-MTL-LSTM模型的測試集決定系數(shù)R2分別為0.90和0.84,RMSE分別為0.38和2.50,RE分別為0.47%和1.34%;比MTL-LSTM模型決定系數(shù)R2均上升0.05,RMSE分別下降0.06和0.05,RE分別下降0.36個(gè)百分點(diǎn)和0.34個(gè)百分點(diǎn)。
表2 基于全光譜構(gòu)建的不同模型的預(yù)測性能
基于隨機(jī)森林提取的前10個(gè)特征波長構(gòu)建的MTL-LSTM和WOA-MTL-LSTM網(wǎng)絡(luò)對水稻葉片白葉枯病發(fā)病率以及潛伏期的預(yù)測性能如表3所示。由表3可以看出,WOA-MTL-LSTM網(wǎng)絡(luò)對兩個(gè)任務(wù)的預(yù)測性能優(yōu)于MTL-LSTM網(wǎng)絡(luò)對兩個(gè)任務(wù)的預(yù)測性能。WOA-MTL-LSTM網(wǎng)絡(luò)對發(fā)病率和潛伏期的測試集決定系數(shù)R2分別為0.93和0.85,RMSE分別為0.34和2.12,RE分別為0.33%和1.21%。
對比表2和表3可以發(fā)現(xiàn),基于RF提取的特征波長構(gòu)建的模型的預(yù)測性能優(yōu)于全光譜波長構(gòu)建的模型的預(yù)測性能,前者的建模時(shí)間比后者減少約98%,決定系數(shù)最大提升0.04,驗(yàn)證了特征波長的有效性,表明隨機(jī)森林算法可以有效地從高光譜數(shù)據(jù)中提取特征波長,降低高光譜數(shù)據(jù)維度,這與SPEISER等[26]的研究結(jié)果相符。發(fā)病率和潛伏期預(yù)測的R2為0.89和0.80,RMSE為0.35和2.35,RE為0.76%和1.53%,滿足水稻病害預(yù)測的要求。
表3 基于前10個(gè)特征波長構(gòu)建的不同模型的預(yù)測性能
基于PCA提取的前10個(gè)主成分對水稻葉片白葉枯病發(fā)病率以及潛伏期預(yù)測的性能如表4所示。由表4可知,基于時(shí)序高光譜前10個(gè)主成分構(gòu)建的WOA-MTL-LSTM網(wǎng)絡(luò)對白葉枯病發(fā)病率和潛伏期的預(yù)測性能最優(yōu),測試集決定系數(shù)R2分別為0.91和0.83,RMSE分別為0.37和2.61,RE分別為0.46%和1.33%,性能優(yōu)于MTL-LSTM網(wǎng)絡(luò)的預(yù)測性能。
表4 基于前10個(gè)主成分構(gòu)建的不同模型的預(yù)測性能
比較表3和表4可以發(fā)現(xiàn),基于隨機(jī)森林提取的前10個(gè)特征波長構(gòu)建的WOA-MTL-LSTM對兩個(gè)任務(wù)的預(yù)測性能優(yōu)于基于PCA提取的前 10個(gè)主成分構(gòu)建的WOA-MTL-LSTM對兩個(gè)任務(wù)的預(yù)測性能,且前者建模時(shí)間少于后者的建模時(shí)間。對發(fā)病率的預(yù)測性能,測試集的決定系數(shù)R2上升0.02,RMSE下降0.03,RE下降0.13個(gè)百分點(diǎn)。對潛伏期的預(yù)測性能,測試集的決定系數(shù)R2上升0.02,RMSE下降0.49,RE下降0.12個(gè)百分點(diǎn)。說明基于隨機(jī)森林提取的前10個(gè)特征波長不僅保留了高光譜的光譜特性,而且可以完整地表征時(shí)序高光譜的信息。此外,WOA-MTL-LSTM網(wǎng)絡(luò)比MTL-LSTM網(wǎng)絡(luò)在預(yù)測水稻病害發(fā)病率和潛伏期時(shí)表現(xiàn)出更高的預(yù)測精度,說明WOA可以有效確定MTL-LSTM網(wǎng)絡(luò)神經(jīng)元個(gè)數(shù)和時(shí)間步長,更有效地提取時(shí)序高光譜的信息,這與YANG等[32]的研究相符合。
(1)RF能有效降低原始高光譜數(shù)據(jù)的維度,縮短建模時(shí)間。與使用全光譜波長構(gòu)建的模型相比,利用RF提取的特征波長構(gòu)建的模型可以縮短98%的訓(xùn)練時(shí)間;與PCA提取的主成分相比,基于RF提取的特征波長構(gòu)建的模型具有更優(yōu)的預(yù)測性能和可解釋性。實(shí)驗(yàn)結(jié)果表明,對水稻白葉枯病害敏感的波長主要集中在波段530~700 nm之間。
(2)基于時(shí)序特征波長構(gòu)建的MTL-LSTM模型對發(fā)病率和潛伏期的預(yù)測均取得了良好結(jié)果,對發(fā)病率和潛伏期預(yù)測的R2為0.89和0.80,RMSE為0.35和2.35,RE為0.76%和1.53%,滿足水稻病害預(yù)測的要求。
(3)利用WOA算法對MTL-LSTM模型進(jìn)行優(yōu)化,提升了MTL-LSTM的預(yù)測性能,并縮短了建模時(shí)間?;谇?0個(gè)特征波長構(gòu)建的WOA-MTL-LSTM模型對發(fā)病率和潛伏期預(yù)測測試集的R2分別為0.93和0.85,RMSE分別為0.34和2.12,RE分別為0.33%和1.21%。相較于優(yōu)化前,WOA-MTL-LSTM網(wǎng)絡(luò)對發(fā)病率和潛伏期預(yù)測的R2均提升0.05。實(shí)驗(yàn)表明WOA可以有效確定MTL-LSTM網(wǎng)絡(luò)的最佳神經(jīng)元個(gè)數(shù)以及最佳時(shí)間步長,進(jìn)而提升模型的預(yù)測性能。