龍 騰,李繼宇,龍擁兵,2,閆曉靜,趙 靜,2
(1 華南農(nóng)業(yè)大學 電子工程學院/人工智能學院,廣東 廣州 510642; 2 嶺南現(xiàn)代農(nóng)業(yè)科學與技術廣東省實驗室,廣東 廣州 510642; 3 華南農(nóng)業(yè)大學 工程學院,廣東 廣州 510642; 4 中國農(nóng)業(yè)科學院 植物保護研究所,北京 100193)
小麥白粉病是由白粉菌Blumeriagraminisf.sp.tritici引起的氣傳性真菌病害,在世界各小麥種植區(qū)均有發(fā)生,20世紀70年代以前國內(nèi)主要在西南以及山東沿海局部小麥種植地區(qū)發(fā)病嚴重,隨后發(fā)生范圍不斷擴大,危害程度加重[1]。在田間,最早能夠看到苗期染病葉片出現(xiàn)非常小的白點,之后染病部位短期內(nèi)快速擴大,形成大的白色霉層,最后各個病斑相互融合,形成圓形和不規(guī)則的大霉斑。霉層上面有一層白色粉狀物(分生孢子),稍有外力作用,就會發(fā)散,成為再次侵染的來源。感染后期,霉層顏色逐步加深,由白色轉(zhuǎn)變?yōu)榛野咨?、灰色和淺褐色等,病斑上分散著針頭大小的黑色小顆粒(閉囊殼);霉層下面的葉片及其周圍顏色變淺,最終導致葉片退綠發(fā)黃、卷曲、枯死;葉綠素含量降低,嚴重影響小麥的光合作用[2]。因此,對小麥植株進行實時監(jiān)測,及早發(fā)現(xiàn)病害并噴灑農(nóng)藥對控制病害擴散具有重要的意義。
田間監(jiān)測目前主要依靠植保人員田間調(diào)查、田間取樣等傳統(tǒng)方式,并通過“網(wǎng)格法”計算感染區(qū)域的占比確定單片小麥葉片的感染程度,分為少數(shù)病斑(0~25%):葉片上有少數(shù)病斑,白點隨機分布;輕度發(fā)病(25%~50%):白點聯(lián)結成一塊;中度發(fā)病(50%~75%):葉片局部變黃;嚴重發(fā)病(75%~100%):葉片大面積黃化。結合5片小麥葉片的感染程度確定植株的發(fā)病情況[3],不僅耗時、費力,而且存在代表性差、主觀性強、時效性差等問題[4],難以滿足大范圍病蟲害實時監(jiān)測的需求。
試驗選用‘京雙16號’小麥,人工接種小麥白粉菌,試驗設對照組(0級)、少數(shù)病斑(Ⅰ級)、輕度發(fā)病 (Ⅱ級)、中度發(fā)病 (Ⅲ級)、嚴重發(fā)病(Ⅳ級)共5個區(qū)域。
試驗在中國農(nóng)業(yè)科學院植物保護研究所綜合試驗基地(河南新鄉(xiāng),東經(jīng)119.19°、北緯31.61°)小麥試驗田中開展。
小麥葉片光譜測定時,光源采用海洋光學公司生產(chǎn)的海洋光學輻射定標光源(海洋光學,HL-2000-CAL,光譜范圍 300~1 050 nm),光纖光譜儀采用海洋光學微型光纖光譜儀(海洋光學,F(xiàn)LAME-S,光譜范圍 200~1 000 nm,700 nm 的光譜分辨率0.335 nm),探測器采用線陣硅基檢測器(索尼,ILX511B)。
小麥光譜采集系統(tǒng)如圖1所示。光源輸出的光通過光纖從積分球頂部射入,積分球底部通過葉片夾固定葉片。被葉片反射的光攜帶有被測葉片的特征信息,經(jīng)積分球多次漫反射,從側方輸出,經(jīng)光纖傳輸至海洋光譜儀內(nèi),轉(zhuǎn)化為電信號,以灰度值的數(shù)據(jù)形式存儲于計算機中。設置采集參數(shù)為積分時間200 ms,平均次數(shù) 5 次,平滑度為5,包含 2 048 個波段。
圖 1 小麥光譜采集系統(tǒng)Fig.1 Wheat spectrum collection system
本文將由光纖光譜儀采集的葉片中受白粉病侵染的點稱為病點,未受侵染的點稱為好點。采集對照組好點、病點光譜各50條,用于判斷病點建模。確定是否感染和感染等級時,在小麥田中隨機選取植株,測定每株植株的每片葉片葉尖、中部和基部3個部位的光譜,每株小麥共5片葉片、15條光譜數(shù)據(jù)。
小麥感染白粉病會直接改變?nèi)~片中的葉綠素含量,而葉綠素含量與葉片SPAD值呈極顯著正相關[16]。因此本文通過光譜獲取的SF-SPAD值來初步判斷植株是否被白粉病侵染,SF-SPAD值的計算公式如下:
新舊《五代史》均為馮道立傳,但對馮道的評價卻有極大差別。薛居正《舊五代史》(以下簡稱薛史)論馮道曰:“道之履行,郁有古人之風;道之宇量,深得大臣之禮。然而事四朝,相六帝,可得為忠乎!夫一女二夫,人之不幸,況于再三者哉!所以飾終之典,不得謚為文貞、文忠者,蓋謂此也。 ”〔10〕(卷一二六,P3880)雖指責馮道不忠,但也不因過掩功,對其個人品德還是給予高度贊譽。
式中,K為常數(shù),數(shù)值受傳感器影響,本文中設K=1.0,IRr為接收到的經(jīng)過葉片反射的940 nm紅外光強度,IR0為發(fā)射的紅外光強度,Rr為接收到的經(jīng)過葉片反射的650 nm紅光強度,R0為發(fā)射的紅光強度。
將SF-SPAD值由小到大排列,假設SF-SPAD值取a時,a前面有n個小于a的值,則排序方式t1(i)和好點百分比T1(SF-SPAD=a)可由式(2)和(3)表示:
類似的,將SF-SPAD值由大到小排列,b前面有m個大于b的值,則排序方式t2(i) 和病點百分比T2(SF-SPAD=b)可由式(4)和(5)表示:
式(2)中t1(i)將SF-SPAD值從小到大排列,sort 是排序算法,式(4)中的′descend′將SF-SPAD值從大到小排列。式(3)中當選取的點為好點時,xi=1,反之,xi=0。式(5)中當選取的點為好點時,yi=1,反之,yi=0。
1.4.1 光譜預處理為消除響應度不高以及暗噪聲太大的波段,計算反射率,去除反射率不符合實際的波段。根據(jù)公式(6)得到植株反射率光譜。
式中,I是某一波長下的光譜反射率,Rraw是原始灰度值,Rwhite是標準板灰度值,Rblack是暗光譜灰度值。
1.4.2 PROSPECT 模型敏感度分析 PROSPECT模型是一個基于“平板模型”的輻射傳輸模型。它通過模擬葉片在400~2 500 nm的上行和下行輻射通量得到葉片的反射率和透射率,本研究采用PROSPECT-5擬合植物的反射率光譜,該模型定量描述了植物葉片反射率光譜、透過率光譜與結構參數(shù)(N s)、葉綠素含量(Ca+b)、胡蘿卜素含量(Ccar)等模型參數(shù)之間的關系[17-18]。
敏感度可以描述某一變量以相同步長變化的過程中對模型輸出結果的影響程度。本文通過PROSPECT模型參數(shù)的敏感性計算分析各種生化參數(shù)對葉片光譜的影響程度,同時結合模型參數(shù)參考范圍確定光譜分類的波段范圍。
LOPEX93 (Leaf optical properties experiment 93)是經(jīng)典的植物葉片高光譜和生理生化參數(shù)數(shù)據(jù)集,包含了50多種植物的70多個葉片樣本高光譜數(shù)據(jù)及對應的生化參數(shù)值,是研究高光譜反演生化參數(shù)的重要數(shù)據(jù)庫。通過改變PROSPECT模型3個敏感度分析參數(shù)(N s、Ca+b、Ccar),觀察植株光譜的變化,參數(shù)變化范圍為Ns :1~4,Ca+b:10.00~100.00,Ccar:2.00~40.00,以此確定對葉綠素含量以及SPAD值貢獻最大的波長范圍。
1.4.3 光譜降維 PCA降維將所有維度投影到低維空間內(nèi),使每個數(shù)據(jù)在這個空間的方差 (D1)最大,如式(7)和式(8)所示:
式中,m是樣例數(shù);n是波段數(shù);k是降維后的維數(shù);X(m?n)是訓練樣本集;W(n?k)是X(m?n)按特征值排序后選取的前k個協(xié)方差矩陣的特征向量;Z(m?k)是X(m?n)在由W(n?k)形成的新的正交子空間上的投影,也是降維后的新矩陣; ωT是W(n?k)的轉(zhuǎn)置矩陣; ωTxm是每個光譜投影到低維空間上的值。
1.4.4 光譜分類 SVM的基本思想是尋找一個分類的最優(yōu)超平面,使得離最優(yōu)超平面比較近的點與最優(yōu)超平面能有更大的間距,進而能夠很好地分開訓練樣本中的2類樣本。核函數(shù)主要有線性核、多項式核、徑向基核 (Radial basis function,RBF)以及Sigmoid核。這4種核函數(shù)中,RBF核函數(shù)可以應用到低維、高維、小樣本、大樣本等情況[19]。本文選用徑向基核函數(shù),其核函數(shù)公式如下:
式中,a為空間中的任意一點,a′為核函數(shù)的中心,b為函數(shù)的寬度參數(shù)。
采用PCA對數(shù)據(jù)集進行降維處理,當方差貢獻率大于95%時,得到d個特征值,將這d個特征值對應的特征向量作為SVM算法的輸入矩陣,選擇RBF作為核函數(shù),通過遍歷法找到最優(yōu)懲罰系數(shù)。將懲罰系數(shù)從0.001~100以10倍步進逐步增加,以校正集和測試集的準確率為標準,選擇其中效果最好的懲罰系數(shù)跨度,再將效果最好的跨度等分為10份重復上述過程確定懲罰系數(shù)。最后使用十折交叉驗證將每個維度訓練10次取平均值以獲得最佳預測模型。建立模型后應用于測試集,循環(huán)上述過程50次,對一個點是否有病蟲害癥狀進行50次判斷,使用“投票法”來確定測試集數(shù)據(jù)的標簽。
1.4.5 感染等級確定 本文通過病點百分比進行感染等級確定。在不同感染等級試驗地采集樣品,在每株樣本的5片葉片葉尖、中部和基部3個部位取點,采用SF-SPAD值粗選結合PCA-SVM二分類精選的方法判別病點,計算病點百分比。對于同一感染等級,隨著檢測點數(shù)量的增加病點占全部檢測點的百分比先增加后逐步達到穩(wěn)定。將該穩(wěn)定的百分比作為感染等級的判別依據(jù),所檢測的株數(shù)即為模型適用的最少檢測株數(shù)。本文分別從不同感染等級麥田中隨機選取n株植株,觀察這n株小麥株數(shù) (i)增大時病點百分比平均值的變化情況。光譜百分比的平均值以及植株選擇可分別由式(10)、(11)和(12)來表示:
本文隨機在試驗田中取n株小麥編號并賦值為mk=k,(k=1,···,n)。式(10)中,Pmk是第mk株小麥的光譜百分比,然后對選取的i株小麥的光譜百分比取平均值;j是病點百分比平均值向量 MEAN的第個元素; sort將向量元素從大到小重新排列。式(11)中,選取植株的方法一共有種,將mk的取值代入式(11),得到使等式成立的i個值,從而定位這i株小麥的序號。式(12)中,q為對j/(n?1)向下取整的結果,是式(11)中的補償項。最后,向量 MEAN的最小值到最大值為選擇的i株植株病點百分比平均值的波動范圍,它的中位數(shù)為總平均值的變化情況。
本文使用SF-SPAD值初步判斷小麥白粉病感染等級。圖2為隨機選取的4個感染等級共20株具有代表性的感染程度逐漸增加的小麥的SFSPAD值。從圖2可以看出,相同植株的一葉、二葉的SF-SPAD值比其他葉片低;對不同植株的同一葉序,隨感染程度的增加,SF-SPAD值降低。比較SF-SPAD值可以得出,小麥白粉病感染首先出現(xiàn)在葉序小的葉片上,感染程度越大、葉片序數(shù)越小,SF-SPAD值越低。
圖 2 不同感染等級(R)不同葉序葉片的SF-SPAD值規(guī)律Fig.2 The law of SF-SPAD value in different ordinal leaves with different infection grades (R)
通過對比不同感染級別、不同葉序小麥葉片的SF-SPAD值(圖3),得到規(guī)律:SF-SPAD值隨葉序的增大而逐漸上升。其原因主要是小麥葉面感染白粉病,葉綠素含量降低,導致葉片對紅光的吸收減弱而形成“紅谷”(600~680 nm),即公式(1)中的Rr升高,而葉綠素對近紅外光940 nm影響不大,所以 IRr變化不大,而公式中的 IR0和R0不變,分母增大,分子不變,導致SF-SPAD值變小。
圖4a、4b分別為好點和病點百分比隨SPAD值變大和變小時的規(guī)律。當SF-SPAD值≥1.05,好點百分率開始逐漸下降,當SF-SPAD≤0.90,病點百分率開始逐漸下降,即:
因此,本文將0.90和1.05分別作為判斷病點與好點的臨界值。
由圖3、4可以看出,將SF-SPAD值用于小麥白粉病初步判斷,具有迅速、準確率高、工作量小的優(yōu)勢,能夠根據(jù)650和940 nm的反射率數(shù)據(jù)初步判定植株感染與否。
圖 3 好點、病點SF-SPAD臨界值判別Fig.3 Judgment of SF-SPAD critical value for good spots and disease spots
圖 4 好/病點百分比變化規(guī)律Fig.4 Change law of good and disease spot percentage
為了確定小麥白粉病光譜響應的敏感波段,本文對LOPEX93數(shù)據(jù)集中的小麥光譜進行了敏感度分析,該數(shù)據(jù)集提供了小麥結構參數(shù)、葉綠素含量、胡蘿卜素含量等不同參數(shù)的400~1 000 nm的高光譜數(shù)據(jù)。通過改變小麥植株的各種生化參數(shù),分析生化參數(shù)對葉片光譜的影響程度,同時結合模型參數(shù)范圍確定光譜分類的波段范圍,結果如圖5所示。在敏感度分析中,結構參數(shù)、葉綠素含量對可見光波段 (400 ~ 780 nm)光譜的影響較大,而對胡蘿卜素和干物質(zhì)含量的影響較小。這是由于葉綠素對紅光的強烈吸收而形成“綠峰”和“紅谷”(450、680 nm),以及由植被紅光波段葉綠素的強烈吸收和近紅外波段光在葉片內(nèi)多次散射形成的強反射所構成的“紅邊”(680 ~780 nm),這 2 個區(qū)域內(nèi)蘊含了豐富的植被光譜信息,均被廣泛用于葉綠素含量反演[20-21]。而植株結構參數(shù)包括了植株平均密度、平均高度、葉冠平均半徑等,對植株葉綠素含量、干物質(zhì)含量影響較大,而植株葉綠素含量影響葉片400~780 nm的光譜。因此,本文敏感波段提取了對葉綠素含量以及SPAD值貢獻率大的可見光波段(400~780 nm)。
圖 5 植株生化參數(shù)的敏感度分析Fig.5 Sensitivity analysis of plant biochemical parameters
在此基礎上,對400~780 nm波段進行平滑,將平滑后波動范圍大于此平滑值10%的波段作為噪聲去除,最終確定440~780 nm波段為建模數(shù)據(jù)集,如圖6所示。
圖 6 敏感波段確定結果Fig.6 Determination results of sensitive band
本文使用PCA結合SVM算法,對反射率數(shù)據(jù)訓練分類網(wǎng)絡。圖7是PCA降維后取前3維得到的好點與病點的分類情況,其中,紅點代表病點,黑點代表好點。從圖7可以看出,僅使用PCA第一至第三個主成分已能初步取得較好的效果,再使用SVM構建非線性超平面,就可以達到理想的分類效果,當PCA降維至10維時,特征貢獻率大于99%,且SVM二分類的結果趨于穩(wěn)定,因此確定使用10維數(shù)據(jù)進行建模。除此之外,圖7中顯示好點相對病點更加集中,這種情況的原因可能是未感染病害的小麥光譜差異較小,而感染病蟲害的植株因在各個感染時期的生理狀態(tài)和病菌的形態(tài)不同導致光譜的差異較大。
圖 7 光譜分類結果Fig.7 Spectral classification results
圖8為PCA-SVM光譜分類模型判別的病點百分比分布與感染等級(R)的關系。從各感染等級內(nèi)隨機選取i株小麥進行檢測,根據(jù)公式(10)、(11)、(12)計算這i株病點百分比的平均值及波動范圍。從圖8可以看出,隨著檢測株數(shù)的增加,病點百分比逐漸穩(wěn)定,且病點百分比的波動范圍逐漸縮小。由此得出結論:在4個等級之中,R2,R3和R4之間分界線較為清晰,錯判最多的是R1和R2級,可能的原因是小麥感染初期,一葉和二葉葉片并未像感染中期時黃化,葉片只有白色孢子零星覆蓋,差異不大。感染等級可由病點百分比確定,隨著小麥株數(shù)達到20株以上(如圖8虛線所示),4個感染等級能夠明顯地分離,且病點百分比平均變化率逐步趨于0,病點百分比趨于穩(wěn)定。因此,20株小麥為本文所建模型適用的最少檢測數(shù)量。感染等級與病點百分比之間的關系如下所示:R1:0~30%,R2:30%~50%,R3:50%~70%和R4:70%~100%。
圖 8 小麥植株病點百分比分布與感染等級(R)Fig.8 Percentage distribution of disease spots in wheat plants and infection grade (R)
本文通過SF-SPAD值結合PCA-SVM模型對小麥植株上的光譜數(shù)據(jù)進行二分類,實現(xiàn)小麥白粉病的判斷,通過確定病點百分比來確定小麥白粉病的感染等級。結果表明SF-SPAD值隨葉片序數(shù)的增加逐漸上升,病點和好點的SF-SPAD臨界值分別為0.90和1.05。使用PROSPECT模型進行光譜敏感度分析,確定葉綠素的敏感波段在可見光波段440~500和540~780 nm,將光譜范圍縮小為440~780 nm。結合PCA降維和SVM建模,當總貢獻率大于99%時,確定維度降至10維,能實現(xiàn)對光譜數(shù)據(jù)精確地二分類。根據(jù)二分類模型結果判斷病點和好點,計算出單株小麥的病點百分比,根據(jù)病點百分比的分布情況以及收斂關系,最終確定感染等級以及病點百分比關系為R1:0~30%、R2:30%~50%、R3:50%~70%、R4:70%~100%,以及模型適用的最少檢測植株數(shù)為20。本方法可以降低采樣數(shù)量、減少地面檢測工作量、提高檢測準確率,是一項實用性強、簡單、易推廣的智能化監(jiān)測技術。