侯冰茹, 劉鵬輝, 張 洋, 胡耀華, 2, 3*
1. 西北農(nóng)林科技大學(xué)機(jī)械與電子工程學(xué)院, 陜西 楊凌 712100
2. 陜西省農(nóng)業(yè)信息感知與智能服務(wù)重點(diǎn)實(shí)驗(yàn)室, 陜西 楊凌 712100
3. 浙江農(nóng)林大學(xué)光機(jī)電工程學(xué)院, 浙江 杭州 311300
馬鈴薯是糧菜兼用型作物, 也是僅次于小麥、 水稻、 玉米的世界第四大糧食作物。 在我國(guó)馬鈴薯主要種植區(qū), 由致病疫霉侵染引起的晚疫病是馬鈴薯產(chǎn)量的毀滅性病害, 也是所有引起產(chǎn)量損失的病害中最嚴(yán)重的一種卵菌性病害[1]。 該病在馬鈴薯整個(gè)生育期均可發(fā)生, 嚴(yán)重時(shí)可導(dǎo)致馬鈴薯絕收。 因此研究馬鈴薯晚疫病害的發(fā)生及流行時(shí)期預(yù)測(cè)對(duì)馬鈴薯晚疫病害的防治具有重要意義。
近年來光譜技術(shù)由于其分析迅速、 不破壞樣品、 不消耗化學(xué)試劑、 不污染環(huán)境等優(yōu)點(diǎn)被廣泛應(yīng)用于農(nóng)作物病蟲害無損檢測(cè)領(lǐng)域中。 光譜技術(shù)結(jié)合圖像處理、 化學(xué)計(jì)量學(xué)方法和與病害有關(guān)的一些理化參數(shù)可實(shí)現(xiàn)對(duì)農(nóng)作物病害的早期檢測(cè), 并達(dá)到了很好的效果。 其中結(jié)合化學(xué)計(jì)量學(xué)方法可實(shí)現(xiàn)對(duì)農(nóng)作物病害的發(fā)病程度的定性分類判別, 如程術(shù)希等[2]采用偏最小二乘回歸(partial least square regression, PLSR)算法對(duì)不同水稻稻葉瘟染病程度的葉片進(jìn)行化學(xué)計(jì)量學(xué)分析, 建立了稻葉瘟染病程度檢測(cè)模型, 利用光譜技術(shù)可實(shí)現(xiàn)病害脅迫下農(nóng)作物葉片的各種酶活性等理化值的預(yù)測(cè), 如程帆[3]等實(shí)現(xiàn)了細(xì)菌性角斑病早期脅迫下黃瓜葉片中過氧化物酶活性的測(cè)定, 楊燕等[4]通過建立基于光譜信息的超氧化物歧化酶(superoxide dismutase, SOD)預(yù)測(cè)模型反演出水稻稻瘟病潛育期內(nèi)的SOD酶活性, 胡耀華等[5]利用高光譜技術(shù)建立了基于X-LW-PLS的定量模型用以預(yù)測(cè)馬鈴薯晚疫病葉片中過氧化物酶的活性。 這些研究側(cè)重于不同程度病害脅迫下作物各種理化值的預(yù)測(cè)和變化規(guī)律的研究, 未能將理化值的變化規(guī)律同病害發(fā)病機(jī)理結(jié)合以實(shí)現(xiàn)染病程度的定性預(yù)測(cè)。
過氧化物酶(peroxidase, POD)是一種用于評(píng)價(jià)植物抗逆性的酶, 其在植物染病期間是不斷變化的, 并與植物患病程度直接相關(guān)。 Li[6]等建立了晚疫病脅迫下不同種類馬鈴薯葉片POD酶活性相對(duì)于患病時(shí)間的五階模型, 證明了利用POD酶活性反演晚疫病害程度的可行性。 因此先利用葉片的光譜信息實(shí)現(xiàn)對(duì)POD酶活性的定量預(yù)測(cè), 再利用預(yù)測(cè)的POD酶活性進(jìn)而實(shí)現(xiàn)對(duì)馬鈴薯晚疫病害的定性預(yù)測(cè)是可行的。
本研究以不同患病程度的馬鈴薯葉片為研究對(duì)象, 利用光譜對(duì)不同溫濕度條件下的馬鈴薯葉片的POD酶活性進(jìn)行快速測(cè)定, 研究POD酶活性隨患病程度變化的規(guī)律, 實(shí)現(xiàn)基于POD酶活性的馬鈴薯晚疫病患病程度的定性預(yù)測(cè), 對(duì)野外馬鈴薯晚疫病害的早期檢測(cè)和防治及便攜式檢測(cè)儀的研制提供科學(xué)依據(jù)。
選用“隴薯1號(hào)”種薯, 其屬晚疫病中感品種, 廣泛種植于西北地區(qū)。 于2020年1月種植于楊凌現(xiàn)代示范農(nóng)業(yè)園區(qū)溫室大棚內(nèi), 以盆栽方式培養(yǎng)。 在馬鈴薯生長(zhǎng)后期(開花末期)采集若干片健康狀況良好、 大小一致的馬鈴薯葉片接種致病疫霉, 圖1為接菌后的馬鈴薯葉片, 接種后用保鮮膜將放置葉片容器密封保濕, 置于溫度為(17±1) ℃的人工氣候培養(yǎng)箱(RGX-250B, 上海坤天實(shí)驗(yàn)室儀器有限公司, 中國(guó))中培養(yǎng)24 h以確保侵染成功。 由于馬鈴薯晚疫病害流行的最適宜溫度為16~24 ℃、 適宜的發(fā)病濕度為85%以上, 為模擬不同馬鈴薯晚疫病害發(fā)生的環(huán)境條件, 因此分別設(shè)置15, 20和25 ℃的溫度梯度及70%, 80%和90%的濕度梯度。 將葉片隨機(jī)分為9組, 每組15片, 將9組葉片分別放入不同溫濕度條件的培養(yǎng)箱中進(jìn)行為期5天的離體培養(yǎng), 圖2為在溫度為20 ℃、 濕度為70%的環(huán)境條件下經(jīng)1~5 d培養(yǎng)后的馬鈴薯葉片圖像。
圖1 接菌后的離體馬鈴薯葉片
圖2 溫度為20 ℃、 濕度為70%環(huán)境條件下培養(yǎng)的第1~5天的葉片圖像
為避免樣品溫度對(duì)光譜反射率的影響, 在同一室溫條件下對(duì)葉片進(jìn)行光譜采集。 采用如圖3所示的波長(zhǎng)范圍為350~1 000 nm的可見光/近紅外光纖光譜儀(USB4000, Ocean Optics, Dunedin, Florida, USA)并結(jié)合便攜式反射探頭(PRB-D0-IS30, 江陰韻翔光電技術(shù)有限公司, 中國(guó))對(duì)馬鈴薯葉片光譜采集。 選擇病斑部位作為感興趣區(qū)域, 使用探頭垂直照射葉片病斑部位表面, 將三次重復(fù)測(cè)量的感興趣區(qū)域部位的光譜反射率的平均值作為樣本的光譜反射率。
圖3 光譜采集系統(tǒng)
剪取葉片的感興趣區(qū)域部位, 對(duì)其利用分光光度法實(shí)現(xiàn)POD酶活性的測(cè)定, 采用酶標(biāo)儀(YMB-7A, 廈門億恩達(dá)儀器設(shè)備有限公司, 中國(guó))進(jìn)行吸光值的測(cè)定, 每隔1 min記錄其在470 nm處的吸光值, 共記錄3次, 以每分鐘吸光值變化0.01定義為一個(gè)酶活性單位, 計(jì)算POD酶活性[7]。
圖4 異常樣本檢測(cè)結(jié)果
表1 馬鈴薯葉片POD酶活性統(tǒng)計(jì)結(jié)果
利用SpectraSuite(Ocean Optics, USA)軟件實(shí)現(xiàn)對(duì)光譜的采集; 利用The Unscrambler X(CAMO, Norway)軟件進(jìn)行光譜數(shù)據(jù)的預(yù)處理; 利用MATLAB(MathWorks, USA)軟件實(shí)現(xiàn)了數(shù)據(jù)劃分、 異常樣本檢測(cè)、 PLS模型建立、 評(píng)估及特征波長(zhǎng)的提取。
光譜儀的波長(zhǎng)測(cè)量范圍為350~1 000 nm, 由于受環(huán)境和儀器噪聲的影響, 350~480和950~1 000 nm波段范圍內(nèi)反射率變化波動(dòng)較大, 因此選擇480~950 nm波段的光譜數(shù)據(jù)進(jìn)行分析。 圖5為不同接菌時(shí)間的馬鈴薯葉片光譜曲線。 550 nm處的反射率與葉綠素含量有關(guān), 近紅外波段的反射率與細(xì)胞結(jié)構(gòu)有關(guān), 隨著接菌時(shí)間的增加, 葉片內(nèi)葉綠素含量降低, 葉片細(xì)胞壁被破壞、 細(xì)胞空隙變大, 導(dǎo)致550 nm處和近紅外波段的光譜反射率隨接菌時(shí)間的增加而減小。 并且隨著接菌時(shí)間的增加, 760 nm波長(zhǎng)附近由于水或氧的窄吸收帶導(dǎo)致的微弱波谷[9]發(fā)生了左移。
圖5 不同接菌時(shí)間時(shí)的馬鈴薯葉片光譜曲線
通過分析圖2中接菌后第1~5 d的馬鈴薯葉片圖像可知, 接菌1 d時(shí)葉片無明顯變化, 2 d時(shí)葉片出現(xiàn)褐色斑點(diǎn), 隨著接菌時(shí)間的增加, 褐色斑點(diǎn)迅速向外擴(kuò)大, 在4 d時(shí)病斑產(chǎn)生白霉, 此后病斑擴(kuò)大速率降低, 其與馬鈴薯葉片染病的基本癥狀基本一致, 在本研究的實(shí)驗(yàn)條件下認(rèn)為接菌后0~1 d為染病初期、 1~4 d為染病中期、 4~5 d為染病后期。 圖6和圖7分別為不同溫度、 濕度條件下POD酶活性隨接菌時(shí)間的變化, 從圖中可看出不同溫濕度環(huán)境條件下POD酶活性隨接菌時(shí)間變化的趨勢(shì)較明顯, 其大致呈先降后升再降的趨勢(shì), 且POD酶活性均在第1天達(dá)到最小值、 在第4天達(dá)到最大值。 這與植物體內(nèi)防御系統(tǒng)有關(guān), 染病初期POD酶活性下降是由于病菌擾亂了植株體內(nèi)的代謝平衡, 之后酶活性升高是由于當(dāng)處于染病中期時(shí)植物體內(nèi)產(chǎn)生大量的POD酶來清除病菌造成的活性氧傷滬, 隨著染病程度的不斷增加, 植物防御失敗導(dǎo)致植物葉片細(xì)胞壁被破壞, 酶活性也隨之降低[10]。
圖6 同一濕度不同溫度條件下POD酶活性隨接菌時(shí)間的變化情況
但溫濕度同樣對(duì)POD酶活性變化產(chǎn)生影響, 從圖6可看出控制濕度條件相同、 溫度條件不同時(shí), 不同溫度條件下POD酶活性變化速率并不一致, 當(dāng)葉片分別處于染病初期、 中期及后期時(shí), 對(duì)應(yīng)20, 25和15 ℃條件下POD酶活性變化相對(duì)劇烈。 從圖7可看出控制溫度條件相同、 濕度條件不同時(shí), 當(dāng)葉片分別處于染病初期、 中期及后期時(shí), 對(duì)應(yīng)90%, 70%和80%濕度條件下POD酶活性變化相對(duì)劇烈。 這說明馬鈴薯晚疫病害在不同染病階段的較適宜的患病流行條件也不相同, 但溫濕度對(duì)POD酶活性變化影響的強(qiáng)弱還需進(jìn)一步建模討論。
圖7 同一溫度不同濕度條件下POD酶活性隨接菌時(shí)間的變化情況
通過上述分析可知, 光譜反射率和POD酶活性都會(huì)以一定規(guī)律隨患病程度變化 , 說明POD酶活性與光譜反射率具有一定的相關(guān)關(guān)系, 通過采集葉片的光譜信息可實(shí)現(xiàn)對(duì)POD酶活性的定量檢測(cè)。
2.2.1 光譜數(shù)據(jù)預(yù)處理
用光譜儀所獲取的數(shù)據(jù)不僅包括樣本的成分信息, 還包括儀器噪聲、 雜散光、 背景信息、 基線漂移等無關(guān)信息, 因此光譜數(shù)據(jù)應(yīng)先進(jìn)行預(yù)處理以建立穩(wěn)定可靠的數(shù)學(xué)模型。 采用了中心化(mean centering, MC)、 歸一化(normalization)、 S-G卷積平滑(Savitzky-Golay smoothing)、 移動(dòng)窗口平均平滑(moving average smoothing)、 多元散射校正(multiplicative scatter correction, MSC)、 標(biāo)準(zhǔn)正態(tài)變量變換(standard normal variate transformation, SNV)、 基線漂移(baseline)、 導(dǎo)數(shù)算法(derivative)等八種預(yù)處理方法對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理。 表2為不同預(yù)處理方法所建立的全波長(zhǎng)光譜數(shù)據(jù)PLS模型效果, 其中參與建模的變量數(shù)是通過多次建模測(cè)試得出, 具體做法為: 參與PLS建模的變量數(shù)從1開始逐漸增加, 利用留一交叉驗(yàn)證建立PLS模型, 當(dāng)求得的預(yù)測(cè)集的誤差均方根最小時(shí), 以此時(shí)的參與PLS建模的變量數(shù)為最終參與PLS建模的變量數(shù)。 從表2可以看出, 利用二階導(dǎo)數(shù)算法處理后的數(shù)據(jù)所建立的模型的建模和預(yù)測(cè)效果遠(yuǎn)遠(yuǎn)差于其他模型, 這是由于經(jīng)二階求導(dǎo)后的導(dǎo)數(shù)光譜與實(shí)際相比存在較大誤差, 使得參與建模的變量數(shù)大大降低, 導(dǎo)致模型效果變差。 經(jīng)中心化和基線漂移處理后, 模型的效果提升, 比較來看, 經(jīng)中心化處理后的數(shù)據(jù)所建立的模型的建模集和預(yù)測(cè)集的均方根誤差相差較小, 模型穩(wěn)定性相對(duì)較好, 因此選擇中心化方法對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理。
表2 不同預(yù)處理方法所建立的全波長(zhǎng)光譜數(shù)據(jù)PLS模型結(jié)果
2.2.2 特征波長(zhǎng)提取
由于光譜數(shù)據(jù)波段較多(采集的有效波長(zhǎng)為2 457個(gè)), 大量數(shù)據(jù)不僅增加建模復(fù)雜程度, 并且其中包含的大量冗余和共線性數(shù)據(jù)會(huì)影響建模精度[11], 因此采用了隨機(jī)青蛙算法(random frog, RF)、 連續(xù)投影算法(successive projections algorithm, SPA)、 競(jìng)爭(zhēng)自適應(yīng)加權(quán)算法(competitive adaptive reweighted sampling, CARS)對(duì)特征波長(zhǎng)進(jìn)行提取。
RF算法[12]通過計(jì)算每個(gè)變量的被選概率來評(píng)價(jià)變量的重要性, 由于該算法是基于隨機(jī)抽樣提出的, 每次運(yùn)行結(jié)果可能會(huì)出現(xiàn)差異, 為減少隨機(jī)因素的影響, 將RF算法運(yùn)行100次。 由于利用RF算法無法得出合適的特征波長(zhǎng)數(shù), 因此取運(yùn)行100次后概率平均值大的前16個(gè)波長(zhǎng)為特征波長(zhǎng)。
SPA算法在數(shù)據(jù)矩陣中應(yīng)用變量投影操作尋找含有冗余信息最低、 共線性最少的光譜特征變量組[13]。 在使用SPA算法提取特征波長(zhǎng)時(shí)將變量數(shù)范圍放大到了30, 即最多可能選擇30個(gè)特征波長(zhǎng)點(diǎn)。 圖8為模型的均方根誤差隨變量數(shù)變化的趨勢(shì), 圖9為利用SPA算法提取的特征波長(zhǎng)分布情況, 從圖8中可看出隨著變量數(shù)的增加, 模型的均方根誤差呈先降低再升高的趨勢(shì), 當(dāng)變量數(shù)為21時(shí)模型的均方根誤差最小, 因此利用SPA算法提取的最佳特征波長(zhǎng)數(shù)目為21。
圖8 模型均方根誤差隨變量數(shù)變化的趨勢(shì)
圖9 特征波長(zhǎng)分布情況
CARS算法能夠選擇出PLS模型中相關(guān)系數(shù)較大的波長(zhǎng), 并利用交叉驗(yàn)證逐步選擇出均方根誤差最小的子集, 該子集里的變量即為被選擇的波長(zhǎng)變量[14]。 同SPA算法相同, 設(shè)置其參與建模的潛在變量數(shù)為30, 共運(yùn)行100次。 圖10為CARS算法運(yùn)行結(jié)果, 圖10(a)可看出隨運(yùn)行次數(shù)增加被選擇的變量數(shù)在逐步減小, 運(yùn)行次數(shù)和變量數(shù)大致呈指數(shù)關(guān)系, 從圖10(b)中可看出當(dāng)運(yùn)行次數(shù)為40時(shí), 均方根誤差達(dá)到最小值。 最終利用CARS算法所提取的最佳特征波長(zhǎng)數(shù)目為72。 各算法提取的特征波長(zhǎng)如表3所示, 分析表3可知利用三種算法提取的特征波長(zhǎng)在可見光區(qū)域和近紅外區(qū)域均有分布, 且在可見光區(qū)域集中在綠光波段(492~577 nm)和紅光波段(622~760 nm), 說明POD酶活性對(duì)綠光波段和紅光波段較為敏感。
表3 各算法提取的特征波長(zhǎng)
圖10 CARS算法運(yùn)行結(jié)果
2.2.3 模型對(duì)比
建立了基于全波長(zhǎng)和各方法提取的特征波長(zhǎng)的POD酶活性的預(yù)測(cè)模型, 各模型結(jié)果如表4所示。 由表4可看出, 利用RF和SPA算法所建立的模型的建模效果均變差, 可能是由于參與建模波長(zhǎng)數(shù)目大大減小而導(dǎo)致的一些有效光譜信息被刪除所引起的; 但用SPA和CARS算法所建立的模型的預(yù)測(cè)效果均和原始模型相當(dāng)。 三種算法比較來看, 利用CARS算法所建立模型的建模集和測(cè)試集的決定系數(shù)最大、 均方根誤差最小, 其建模效果最好, 因此利用CARS算法來進(jìn)行特征波長(zhǎng)的提取效果最好。
表4 基于特征波長(zhǎng)和全波長(zhǎng)的PLS模型結(jié)果
由于POD酶活性受溫濕度和患病程度的影響, 利用多元線性回歸分析和徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(radial basis function neural network, RBFNN)建立了POD酶活性的動(dòng)力學(xué)模型, 模型中晚疫病患病程度用數(shù)字0~3表示, 數(shù)字越大表明其患病程度越嚴(yán)重, 將POD酶活性及溫濕度作為輸入, 輸出為晚疫病患病程度, 且為消除不同量綱的影響, 需對(duì)輸入?yún)?shù)進(jìn)行歸一化處理。 利用多元線性回歸分析建模時(shí), 通過對(duì)數(shù)據(jù)歸一化、 散點(diǎn)圖分析、 線性回歸分析后, 篩選出與POD酶活性有顯著關(guān)系的自變量, 建立的POD酶活性動(dòng)力學(xué)模型如式(1)
y=-0.777t-1.561h+1.407d+4.896th2-3.396t2h2-3.651h2d+7.75h2d2-5.007h2d3+0.8
(1)
式(1)中,y為POD酶活性, 單位U·(g·min)-1;t為溫度, 單位℃;h為濕度, 單位%;d為患病程度, 值取0~3。
利用該模型對(duì)30個(gè)樣本的患病程度預(yù)測(cè)結(jié)果如圖11(a)所示, 其中4個(gè)健康樣本被預(yù)測(cè)為患病樣本, 預(yù)測(cè)準(zhǔn)確率為86.7%。 利用RBFNN網(wǎng)絡(luò)建模時(shí), 以歸一化處理后的120個(gè)樣本為輸入樣本, 其中50%為訓(xùn)練樣本, 25%為測(cè)試樣本, 25%為驗(yàn)證樣本, 不斷修改網(wǎng)絡(luò)參數(shù)以提高模型精度。 模型結(jié)果顯示同溫度相比, 濕度對(duì)POD酶活性的影響較大。 以圖11(b)所示的混淆矩陣評(píng)價(jià)模型對(duì)30個(gè)樣本的預(yù)測(cè)結(jié)果, 有3個(gè)樣本預(yù)測(cè)的患病程度偏嚴(yán)重, 預(yù)測(cè)準(zhǔn)確率為90.0%, 可能是用于測(cè)試的葉片生長(zhǎng)狀況不一, 部分葉片稍許老化, 老化的葉片POD酶活性較正常葉片高, 使得酶活性預(yù)測(cè)誤差偏高, 降低了模型準(zhǔn)確率。
圖11 利用多元線性回歸分析(a)和RBFNN(b)建立的模型對(duì)樣本患病程度的預(yù)測(cè)結(jié)果
利用光譜對(duì)馬鈴薯葉片POD酶活性進(jìn)行預(yù)測(cè), 比較了多種光譜數(shù)據(jù)預(yù)處理及特征波長(zhǎng)提取方法對(duì)預(yù)測(cè)模型精度的影響, 再結(jié)合徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)RBFNN實(shí)現(xiàn)了基于POD酶活性的馬鈴薯晚疫病患病程度的預(yù)測(cè)。 主要結(jié)論如下:
(2) POD酶活性隨患病程度變化的規(guī)律并非呈單調(diào)線性趨勢(shì)。 隨著接菌時(shí)間的增加, POD酶活性大致呈先降后升再降的趨勢(shì), 說明POD酶活性的變化可以反映馬鈴薯葉片的患病程度。
(3) 基于馬鈴薯葉片的光纖光譜信息實(shí)現(xiàn)了晚疫病患病程度的定性預(yù)測(cè)。 利用RBF徑向基網(wǎng)絡(luò)建立了POD酶活性和患病時(shí)間、 溫濕度的動(dòng)力學(xué)模型, 其中溫度對(duì)POD酶活性變化的影響最小、 接菌時(shí)間對(duì)其影響最大, 結(jié)合POD酶活性預(yù)測(cè)模型即可實(shí)現(xiàn)對(duì)患病程度的預(yù)測(cè), 預(yù)測(cè)準(zhǔn)確率為90.0%, 說明基于POD酶活性對(duì)馬鈴薯晚疫病患病程度的定性預(yù)測(cè)是可行的, 對(duì)野外馬鈴薯晚疫病害的早期檢測(cè)和防治及便攜式檢測(cè)儀的研制提供了科學(xué)參考。