曹英麗,肖 文,江凱倫,郭寶贏,劉亞帝,王 洋
(沈陽(yáng)農(nóng)業(yè)大學(xué) 信息與電氣工程學(xué)院/遼寧省農(nóng)業(yè)信息化工程技術(shù)中心,沈陽(yáng) 110161)
紋枯病是水稻發(fā)生最為普遍的主要病害之一,其致病病原菌為立枯絲核菌,在葉鞘表面形成侵染結(jié)構(gòu),菌絲可通過(guò)這種侵染結(jié)構(gòu)來(lái)吸收營(yíng)養(yǎng),使水稻葉鞘、葉片和谷殼感染病菌,往往造成谷粒不飽滿,空殼率增加,嚴(yán)重的可引起植株倒伏枯死[1]。及時(shí)、準(zhǔn)確的對(duì)水稻紋枯病害進(jìn)行識(shí)別,對(duì)于水稻防治病害與提高產(chǎn)量具有極為重要的意義[2-4]。傳統(tǒng)的紋枯病病害檢測(cè)方法主要有人為目測(cè)和基因分子生物學(xué)檢測(cè)兩種。其中,人為目測(cè)是專家或者水稻種植者通過(guò)觀察來(lái)判斷病害,常會(huì)造成人為錯(cuò)誤,難以準(zhǔn)確、及時(shí)地對(duì)癥下藥,在分子層面的分析[5]雖然精確,但只能在實(shí)驗(yàn)室中進(jìn)行且效率較低、成本昂貴。另外,由于病害初期階段癥狀表現(xiàn)不明顯,農(nóng)業(yè)生產(chǎn)者往往缺乏作物病害診斷的專業(yè)知識(shí),使得受害作物得不到及時(shí)控制,作物受害面積迅速擴(kuò)大,病害加重,農(nóng)藥的使用量加大,進(jìn)而造成產(chǎn)量減少和環(huán)境污染。光譜分析是通過(guò)植物受到病害脅迫時(shí)與植物未受到脅迫時(shí)光譜的差異進(jìn)行分析來(lái)實(shí)現(xiàn)病害的檢測(cè)與程度分級(jí),其采樣方式靈活并適用于大范圍樣本,檢測(cè)速度快,結(jié)果也較為準(zhǔn)確,因此,光譜分析是檢測(cè)病害最簡(jiǎn)便快速的方法。隨著光譜分析技術(shù)的不斷完善,在植物、水果、肉類檢測(cè)等[6-1 8]方面都應(yīng)用了光譜分析的方法,在水稻病害方面也有大量應(yīng)用[19-22]?,F(xiàn)階段利用高光譜降維可以更全面保存對(duì)病害的有用信息,是光譜分析的關(guān)鍵,不少學(xué)者已經(jīng)對(duì)此進(jìn)行了研究,楊燕[23]采用主成分分析法降低波段維數(shù),建立判別模型,實(shí)現(xiàn)稻瘟病的檢測(cè);袁建清等[24]結(jié)合偏最小二乘判別分析和主成分加支持向量機(jī)方法構(gòu)建水稻葉瘟病識(shí)別模型,取得了良好的效果;李志偉等[25]對(duì)高光譜成像的冠層水稻光譜數(shù)據(jù)以最小噪聲分離變換進(jìn)行降維,實(shí)現(xiàn)水稻紋枯病無(wú)損檢測(cè)?;诖?,本研究提出了一種基于分窗Gram-Schmidt變換的高光譜降維方法,利用Gram-Schmidt變換[26]找到光譜的基函數(shù)投影空間,將原始光譜在基函數(shù)投影空間上投影從而得到一組低維變量,即為降維后的光譜數(shù)據(jù),此方法的優(yōu)勢(shì)在于可以通過(guò)控制算法程序中的窗口值大小來(lái)找到能最大限度反映出原始光譜信息的數(shù)據(jù),建立主基底與水稻紋枯病早期檢測(cè)模型,構(gòu)建紋枯病預(yù)測(cè)預(yù)報(bào)系統(tǒng),在紋枯病將要爆發(fā)的時(shí)候及時(shí)施藥,降低患病的可能,保證水稻產(chǎn)量并減少農(nóng)藥的使用量進(jìn)而保護(hù)環(huán)境。
試驗(yàn)在沈陽(yáng)農(nóng)業(yè)大學(xué)北方粳型超級(jí)稻成果轉(zhuǎn)化基地進(jìn)行,選擇品種沈農(nóng)9816,設(shè)計(jì)3組對(duì)比試驗(yàn),每組3次重復(fù),共9個(gè)盆栽,于2017和2018年6月中旬將水稻栽至盆中,每盆2穴、每穴2棵苗,保持每盆的水肥條件一致,置于基地大田環(huán)境栽培至7月中旬,每盆分蘗數(shù)為16~21株;紋枯病立枯絲核菌實(shí)驗(yàn)室培養(yǎng):用5mm的打孔器將活化的病菌菌落制成菌餅,并將其放在PDA(馬鈴薯200g,瓊脂20g,葡萄糖20g,蒸餾水1000mL)平板中央,重復(fù)2次,置于28℃恒溫暗箱培養(yǎng)3~5d,待到菌落侵染全部菌餅即可進(jìn)行接種試驗(yàn)。試驗(yàn)于水稻分蘗期(2017年7月21日、2018年7月25日)進(jìn)行接種,將盆栽水稻搬移至避光環(huán)境,將菌餅切小塊,每塊1/9菌餅,放置水稻葉鞘處進(jìn)行接種,每盆接種2~4處;接種后盆栽樣本用長(zhǎng)1m、寬0.5m的塑料袋覆蓋,創(chuàng)造高溫高濕的環(huán)境、避光保存(圖1)。
試驗(yàn)對(duì)象為種植于沈陽(yáng)農(nóng)業(yè)大學(xué)路南試驗(yàn)田的中晚熟水稻沈農(nóng)9816,試驗(yàn)時(shí)間為2017年9月14日與2018年9月16日。為增加背景數(shù)據(jù)復(fù)雜度,設(shè)置7個(gè)氮素水平,氮肥處理分別為:無(wú)氮處理(0kg·hm-2)、低氮處理(150kg·hm-2)、中氮處理(240kg·hm-2)、高氮處理(330kg·hm-2)、有機(jī)肥替代中氮處理氮肥 10%、有機(jī)肥替代中氮處理氮肥20%、有機(jī)肥替代中氮處理氮肥30%。對(duì)不同的氮素水平各進(jìn)行3次重復(fù)試驗(yàn),共21個(gè)試驗(yàn)小區(qū)(圖 2)。
圖1 水稻盆栽試驗(yàn)Figure 1 Rice potted plant
圖2 水稻大田試驗(yàn)Figure 2 Rice field experiment
1.3.1 盆栽水稻葉片高光譜數(shù)據(jù)采集 盆栽紋枯病接種試驗(yàn)中,對(duì)水稻紋枯病病菌接種前和接種后12,24,36,48,60,72h進(jìn)行高光譜數(shù)據(jù)采集,試驗(yàn)采用ASD-HH2儀器測(cè)量光譜,將光譜儀葉片夾夾住水稻葉鞘病斑附近并記錄數(shù)據(jù),光譜儀觀測(cè)范圍325~1075nm,采樣間隔為1nm。去除光譜邊界影響、保留作物病害敏感波段范圍400~1000nm進(jìn)行紋枯病檢測(cè)方法研究,每個(gè)時(shí)期每盆樣本在葉鞘附近隨機(jī)測(cè)量6處,作為該時(shí)期的高光譜數(shù)據(jù),兩年試驗(yàn)共測(cè)得756條樣本光譜。
1.3.2 大田水稻葉片高光譜數(shù)據(jù)采集 大田紋枯病調(diào)查試驗(yàn)中,每小區(qū)隨機(jī)采集紋枯病染病水稻2穴和健康水稻1穴,迅速裝入保鮮袋,封口,放入保鮮箱,將水稻樣品帶回實(shí)驗(yàn)室進(jìn)行高光譜成像試驗(yàn)。高光譜成像試驗(yàn)采用“五鈴光學(xué)”高光譜成像系統(tǒng)(圖3),該系統(tǒng)覆蓋從可見(jiàn)光到近紅外的波段區(qū)域,包含高光譜相機(jī)、光源、移動(dòng)載物臺(tái)等部分。光譜分辨率的間隔在1.0~1.4nm間浮動(dòng),高光譜相機(jī)波長(zhǎng)范圍400.627~1001.026nm。將每個(gè)小區(qū)正常和染病水稻樣本簡(jiǎn)單修剪處理,只保留從近水面數(shù)1~4節(jié)莖稈葉鞘部位,并排列平鋪在移動(dòng)載物臺(tái)上(載物臺(tái)光譜反射率為0),使之垂直于鏡頭縱向移動(dòng)。由系統(tǒng)配套軟件控制移動(dòng)載物臺(tái)的啟動(dòng)和停止,高光譜成像系統(tǒng)曝光時(shí)間20mms,移動(dòng)速度為12mm·s-1,掃描范圍為380mm,高光譜圖像及相關(guān)數(shù)據(jù)由軟件保存。由于暗電流噪聲以及光照不均對(duì)高光譜數(shù)據(jù)的影響,采集到的高光譜數(shù)據(jù)需按照式(1)進(jìn)行黑白定標(biāo)。
圖3 高光譜成像系統(tǒng)Figure 3 Hyperspectral imaging system
式中:Iλ為波長(zhǎng)λ通道的原始高光譜數(shù)據(jù);Bλ為關(guān)閉相機(jī)快門(mén)波長(zhǎng)λ通道的全黑標(biāo)定圖像;Wλ為掃描標(biāo)準(zhǔn)聚四氟乙烯白板波長(zhǎng)λ通道的全白圖像;Rλ為標(biāo)定后波長(zhǎng)λ通道的高光譜圖像。
本研究對(duì)獲取的高光譜圖像在ENVI5.3中獲取水稻高光譜數(shù)據(jù)如圖4。染病樣本每幅圖像選擇10處紋枯病害感興趣區(qū)域(ROI,region of interest),正常樣本每幅圖像選擇10處健康綠色感興趣區(qū)域進(jìn)行圖像向光譜數(shù)據(jù)的轉(zhuǎn)換,兩年試驗(yàn)共得到1260條樣本光譜。
圖4 ENVI處理高光譜成像Figure 4 ENVI processing of hyperspectral imaging
利用Gram-Schmidt正交變換分別對(duì)水稻葉片高光譜測(cè)量數(shù)據(jù)Xn×p進(jìn)行分窗口變換,第i個(gè)窗口的數(shù)據(jù)為Xn×pi:(1)隨機(jī)選取 Xn×pi中的一行數(shù)據(jù) X1×pi,記為 H1,計(jì)算其內(nèi)積將其作為初始能量,并做能量歸一化Z1=將其記為投影空間第一個(gè)投影向量。(2)將中剔除,選擇剩余向量的第一行,與Z1做Gram-Schmidt變換得到
本研究為二分類問(wèn)題,設(shè)健康樣本為0,染病樣本為1。應(yīng)用模型的決定系數(shù)R2和均方誤差MSE來(lái)評(píng)估模型的精度,模型的測(cè)試誤差采用交叉驗(yàn)證(Cross-validation)的方式進(jìn)行計(jì)算。本試驗(yàn)運(yùn)用5折交叉驗(yàn)證,將數(shù)據(jù)集分成5份,其中4份作為訓(xùn)練數(shù)據(jù),1份作為測(cè)試數(shù)據(jù),交叉驗(yàn)證重復(fù)5次,每個(gè)子樣本驗(yàn)證1次,平均5次的結(jié)果得到1個(gè)單一估測(cè)。這個(gè)方法的優(yōu)勢(shì)在于,同時(shí)重復(fù)運(yùn)用產(chǎn)生的子樣本進(jìn)行訓(xùn)練和驗(yàn)證,每次的結(jié)果驗(yàn)證1次,更加準(zhǔn)確求出模型的準(zhǔn)確度。
盆栽紋枯病接種試驗(yàn)使用ASD-HH2儀器測(cè)量水稻葉片光譜,大田試驗(yàn)使用的是高光譜成像儀測(cè)量水稻莖稈上的紋枯病病斑,兩種試驗(yàn)所用的測(cè)量?jī)x器與測(cè)量部位不同,產(chǎn)生的光譜反射率也不相同,增加了Gram-Schmidt算法的復(fù)雜度。
盆栽水稻樣本光譜信息由圖5可知,健康譜線為水稻未接種紋枯病病菌前所測(cè)樣本的平均譜線,染病譜線為水稻接種后所有時(shí)期所測(cè)樣本的平均譜線。400~750nm是植物葉片可見(jiàn)光范圍內(nèi)的綠區(qū),其光合作用強(qiáng),是強(qiáng)吸收波段,反射和透射較低,由于葉綠素的強(qiáng)吸收,680nm處形成了吸收谷,550nm形成了一個(gè)反射峰,并且由于健康葉片比染病葉片的光合作用強(qiáng),則從圖5中可以觀察到此波段染病葉片的光譜反射率稍高于健康葉片的光譜反射率;700~760nm波段為紅邊區(qū)域,光譜曲線急劇上升,染病葉片光譜反射率逐漸低于健康葉片光譜反射率,并在760nm產(chǎn)生峰值;760nm以上為不可見(jiàn)光波段,此區(qū)域染病葉片的光譜反射率始終低于健康的葉片光譜反射率。
按照水稻紋枯病害常規(guī)的分級(jí)方法進(jìn)行人工分級(jí),根據(jù)大田水稻實(shí)際發(fā)病情況,每個(gè)小區(qū)病害情況基本處于3,5,7共3個(gè)病害等級(jí)(水稻紋枯病病害分級(jí)標(biāo)準(zhǔn)為:0級(jí)健康;1級(jí)第4葉及其以下各葉鞘、葉片發(fā)??;3級(jí)第3葉及其以下各葉鞘、葉片發(fā)?。?級(jí)第2葉及其以下各葉鞘、葉片發(fā)??;7級(jí)劍葉葉片及其以下各葉鞘、葉片發(fā)?。?級(jí)全株發(fā)?。?。將大田紋枯病調(diào)查試驗(yàn)水稻樣本分類,各個(gè)病害等級(jí)光譜分別取平均值。圖6為大田試驗(yàn)不同病害等級(jí)的水稻葉片光譜曲線圖,由圖6可知,水稻葉片光譜總體反射率隨紋枯病不同等級(jí)嚴(yán)重度增加而降低,證明紋枯病會(huì)對(duì)水稻葉片光譜的反射率產(chǎn)生影響。染病葉片光譜反射率隨光譜波段的增大而緩慢升高,在綠峰和近紅外區(qū)域反射率低,并且于975~1000nm處3級(jí)病害光譜稍高于健康光譜反射率。
圖5 健康與染病的盆栽水稻葉片光譜信息Figure 5 Spectral information of healthy and infected potted rice leaves
圖6 不同病害等級(jí)的大田水稻葉鞘光譜信息Figure 6 Spectral information of leaves sheath of paddy rice with different disease grades
本研究采用分段方法進(jìn)行光譜數(shù)據(jù)降維,通過(guò)控制分段窗口值的大小來(lái)篩選產(chǎn)生最優(yōu)模型降維后的光譜維數(shù),經(jīng)過(guò)大量試驗(yàn)測(cè)試設(shè)定的閾值ε取0.01時(shí)效果最佳。將降維后的數(shù)據(jù)與是否感染紋枯病建立多元回歸模型,由表1可知,盆栽紋枯病接種試驗(yàn)當(dāng)窗口值為200nm時(shí),高光譜維數(shù)降為4,此時(shí)R2達(dá)到最大,為 0.8373,MSE達(dá)到最小,為 0.0406;大田紋枯病調(diào)查試驗(yàn)當(dāng)窗口值為200nm時(shí),高光譜維數(shù)降為4,此時(shí)R2達(dá)到最大,為0.9701,MSE達(dá)到最小,為0.0065。當(dāng)窗口為200時(shí),試驗(yàn)所選出的4個(gè)主基底如圖7和圖8,水稻紋枯病特征波長(zhǎng)為每一個(gè)主基底的極大值與極小值,盆栽紋枯病接種試驗(yàn)所得特征波長(zhǎng)分別為 407,539,550,672,750,800,998nm,大田紋枯病調(diào)查試驗(yàn)所得特征波長(zhǎng)分別為440.6,550.7,632.8,648.1,675,703.2,735.4,906.9nm。
主成分分析(principal component analysis,PCA),是利用降維的思想,把多指標(biāo)轉(zhuǎn)化為少數(shù)幾個(gè)綜合指標(biāo),是一種簡(jiǎn)化數(shù)據(jù)集的技術(shù)。應(yīng)用于全波段降維,能夠消除波段之間的相關(guān)影響,因?yàn)槠湓趯?duì)原始數(shù)據(jù)指標(biāo)變量進(jìn)行變換后形成了彼此相互獨(dú)立的主成分。在本研究中,對(duì)原始光譜400~1000nm數(shù)據(jù)進(jìn)行主成分分析,表2分別為盆栽與大田水稻光譜降維后主成分個(gè)數(shù)與累計(jì)方差貢獻(xiàn)率,提取6個(gè)主成分,累積方差貢獻(xiàn)率達(dá)到99.61%和99.67%,即此6個(gè)因子可以包含變量中的99%以上的信息。
使用連續(xù)投影算法(successive projections algorithm,SPA)確定最佳成分組合,連續(xù)投影算法能夠從大量的光譜信息中充分尋找含有最低限度的冗余信息的變量組,使得變量之間的共線性達(dá)到最小。同時(shí)能大大減少建模所用變量的個(gè)數(shù),提高建模的速度和效率。SPA選擇不同波長(zhǎng)數(shù)的均方根誤差RMSE分布如圖9和圖10,圖中黑色實(shí)心圓點(diǎn)表示所選到的波長(zhǎng)數(shù),盆栽與大田試驗(yàn)分別選取8和4個(gè)有效波長(zhǎng)時(shí),RMSE達(dá)到一個(gè)低點(diǎn),以后RMSE趨于平滑,因此確定從400~1000nm波長(zhǎng)中分別選擇出其中的8和4個(gè)波長(zhǎng)。圖11和12為選取的波長(zhǎng)分布情況,其中方框表示選中的波長(zhǎng)。盆栽紋枯病接種試驗(yàn)通過(guò)SPA提取 的 8 個(gè) 波 長(zhǎng) 分 別 為 407,417,424,539,550,672,750,998nm;大田紋枯病調(diào)查試驗(yàn)通過(guò) SPA 提取的 4個(gè)波長(zhǎng)分別為541,644,706,993nm。
表2 前6個(gè)主成分的累積貢獻(xiàn)率Table 2 Cumulative contribution rate of the top six principal components
圖9 盆栽試驗(yàn)SPA選擇不同變量數(shù)的RMSE分布圖Figure 9 RMSE distribution map of different vriablesselected by SPA in pot experiments
圖10 大田試驗(yàn)SPA選擇不同變量數(shù)的RMSE分布圖Figure 10 RMSE distribution map of different variables selected by SPA in field test
圖11 盆栽試驗(yàn)有效波長(zhǎng)的分布情況Figure 11 Distribution of effective wavelength in pot experiment
圖12 大田試驗(yàn)有效波長(zhǎng)的分布情況Figure 12 Distribution of effective wavelength in Field Test
本研究利用基礎(chǔ)的線性回歸模型進(jìn)行研究,應(yīng)用模型的決定系數(shù)R2和均方誤差MSE來(lái)評(píng)估模型的檢測(cè)精度,模型的測(cè)試誤差采用5折交叉驗(yàn)證(5-fold cross-validation)的方式進(jìn)行計(jì)算。
基于分窗Gram-Schmidt變換降維,當(dāng)窗口值為200nm,得出4個(gè)主基底時(shí)效果最好,將主基底與紋枯病建立回歸模型,盆栽紋枯病接種試驗(yàn)其回歸模型決定性系數(shù)R2和均方根誤差MSE分別為0.8373和0.0406;大田紋枯病調(diào)查試驗(yàn)其回歸模型決定性系數(shù)R2和均方根誤差MSE分別為0.9701和0.0065。主成分分析選取6個(gè)因子作為特征,基于線性回歸檢測(cè)建模時(shí),盆栽紋枯病接種試驗(yàn)交叉驗(yàn)證決定系數(shù)R2為0.7931,均方誤差MSE為0.049;大田紋枯病調(diào)查試驗(yàn)交叉驗(yàn)證決定系數(shù)R2為0.9658,均方誤差MSE為0.0078。運(yùn)用連續(xù)投影法選取特征參數(shù),盆栽紋枯病接種試驗(yàn)交叉驗(yàn)證決定系數(shù)R2為0.8132,均方誤差MSE為0.0466;大田紋枯病調(diào)查試驗(yàn)交叉驗(yàn)證決定系數(shù)R2為0.9685,均方誤差MSE為0.0072。
表3 各降維方法的評(píng)估Table 3 Evaluation of dimension reduction methods
現(xiàn)階段大部分學(xué)者會(huì)使用主成分和連續(xù)投影法進(jìn)行降維,但兩類方法所得的成分都是原始變量的線性組合,沒(méi)有變量篩選的功能,而本研究基于Gram-Schmidt變換的降維方法可以解決變量篩選的問(wèn)題[27-28],并且能夠通過(guò)控制窗口值來(lái)找到能最大限度反映出原始光譜信息的數(shù)據(jù),明確紋枯病敏感波段,為智能儀器的開(kāi)發(fā)提供理論支撐,服務(wù)于精準(zhǔn)農(nóng)業(yè)。
本研究以沈農(nóng)9816水稻為研究對(duì)象,利用2017和2018兩年水稻紋枯病盆栽試驗(yàn)與大田試驗(yàn)測(cè)試的染病樣本與健康樣本高光譜數(shù)據(jù),分別運(yùn)用了基于分窗Gram-Schmidt變換、主成分分析和連續(xù)投影法進(jìn)行數(shù)據(jù)降維。通過(guò)基于分窗Gram-Schmidt變換對(duì)高光譜數(shù)據(jù)進(jìn)行降維處理,發(fā)現(xiàn)窗口值為200nm原始光譜降到四維時(shí)反演模型精度最高,盆栽紋枯病接種試驗(yàn)其回歸模型決定性系數(shù)R2和均方根誤差MSE分別為0.8373和0.0406,大田紋枯病調(diào)查試驗(yàn)其回歸模型決定性系數(shù)R2和均方根誤差MSE分別為0.9701和0.0065;基于分窗Gram-Schmidt降維比主成分分析降維要精簡(jiǎn),并且能夠找到特征波段;與連續(xù)投影法降維相比,盆栽試驗(yàn)前者比后者精簡(jiǎn),大田試驗(yàn)降維效果相同,但模型精度更高。因此,本研究中提出的基于分窗Gram-Schmidt算法能夠有效的對(duì)高光譜進(jìn)行降維處理,有效地提高模型精度,并且實(shí)現(xiàn)了水稻紋枯病的早期預(yù)測(cè),為水稻紋枯病快速、無(wú)損檢測(cè)和提前做好防治工作提供一定的理論基礎(chǔ)和技術(shù)支撐。