呂夢(mèng)琪,宋宇杰,翁海勇,3,孫大偉,3, 董曉婭,方 慧,3,岑海燕,3*
1. 浙江大學(xué)生物系統(tǒng)工程與食品科學(xué)學(xué)院,浙江 杭州 310058 2. 江蘇大學(xué)農(nóng)業(yè)裝備工程學(xué)院,江蘇 鎮(zhèn)江 212013 3. 農(nóng)業(yè)農(nóng)村部光譜檢測(cè)重點(diǎn)實(shí)驗(yàn)室,浙江 杭州 310058 4. 浙江大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,浙江 杭州 310027
干旱脅迫是影響植物正常生長(zhǎng)發(fā)育的重要因素之一,快速定量測(cè)定植物冠層的含水率,了解作物受干旱脅迫的嚴(yán)重程度,對(duì)制定合理的灌溉決策、實(shí)現(xiàn)作物精準(zhǔn)管理有重要意義。擬南芥屬十字花科,具有顯花植物的全部特征,生育期短,其基因易于被誘導(dǎo)、克隆和篩選[1]。因此擬南芥是基于植物冠層分析技術(shù)研究植物干旱脅迫響應(yīng)的理想實(shí)驗(yàn)對(duì)象。
傳統(tǒng)的植物冠層含水率測(cè)量手段以化學(xué)分析法為主,即將植物帶到實(shí)驗(yàn)室后,測(cè)定其干、濕重量,從而計(jì)算含水率[2]。由此可見,傳統(tǒng)植物冠層含水率的測(cè)量方法破壞植物冠層組織結(jié)構(gòu),且測(cè)量過(guò)程繁瑣,無(wú)法實(shí)現(xiàn)快速檢測(cè)[3-5]。近幾年基于高光譜成像的植物冠層分析技術(shù)快速發(fā)展,利用植物冠層反射光譜建立冠層含水率定量分析模型,能夠?qū)崿F(xiàn)無(wú)損檢測(cè)[6-8]。擬南芥干旱脅迫突變體基因型對(duì)干旱脅迫條件響應(yīng)效果明顯。Christoph R?merA等[9]利用高光譜圖像預(yù)測(cè)谷物缺水情況的無(wú)監(jiān)督學(xué)習(xí)分類方法,將真實(shí)生長(zhǎng)環(huán)境下的谷物高光譜圖像與人工模擬的圖像比較,證明高光譜圖像對(duì)于谷物生長(zhǎng)情況預(yù)測(cè)的魯棒性較高。Ge等[10]的研究證明了高光譜圖像中提取的玉米葉片反射光譜與含水率有明顯關(guān)系。Piyush Pandey等[11]的研究表明高通量植物冠層高光譜成像技術(shù)可以量化預(yù)測(cè)植物葉片的含水率和氮含量。Kim等[12]研究了800~1 600 nm的短波近紅外高光譜與楊樹葉片含水率的關(guān)系,當(dāng)干旱脅迫達(dá)到20%及以上時(shí),可以區(qū)分出兩種狀態(tài)的葉片。宋鎮(zhèn)等[4]應(yīng)用高光譜成像技術(shù),建立了高精度杏鮑菇含水率預(yù)測(cè)模型。
上述研究表明,利用近紅外高光譜成像建立植物冠層含水率預(yù)測(cè)模型具有可行性,盡管上述方法獲得了較好的預(yù)測(cè)效果,但將高光譜成像技術(shù)應(yīng)用于在線檢測(cè)仍需要進(jìn)一步研究?;趻呙杷俣葘?duì)植物冠層含水率檢測(cè)的研究很少,本研究以模式植物擬南芥為例,利用擬南芥突變體、野生型基因型對(duì)干旱脅迫的響應(yīng)不同的性質(zhì),探究測(cè)定含水率理化性質(zhì)時(shí)合適的植株冠層高光譜成像掃描速度,并建立擬南芥冠層反射率與含水率的預(yù)測(cè)模型。
本試驗(yàn)以哥倫比亞型擬南芥Col-0(Arabidopsis thaliana, ecotype Columbia)和OSCA1(Arabidopsis reduced hyperosmolality-induced [Ca2+]iincrease 1)突變體為研究材料。其中Col-0為野生型對(duì)照組,OSCA1為干旱敏感型突變體。OSCA1基因型擬南芥保衛(wèi)細(xì)胞和根細(xì)胞的滲透鈣離子通道受損,無(wú)法調(diào)節(jié)植物體內(nèi)滲透壓,致使蒸騰調(diào)控作用和根生長(zhǎng)受到抑制,從而導(dǎo)致其生長(zhǎng)在干旱脅迫下更易受到抑制[13]。
采用1/2 MS (Half-strength Murashigend Skoogsalts)無(wú)菌培養(yǎng)基培養(yǎng)和營(yíng)養(yǎng)土移栽相結(jié)合的方法快速種植擬南芥。擬南芥在1/2 MS無(wú)菌培養(yǎng)的第10天進(jìn)行移栽,每盆中加入約150 mL的營(yíng)養(yǎng)土,每盆1株。最后用噴壺噴水1次,覆蓋保鮮膜。保鮮膜覆蓋維持3 d,每天定時(shí)澆5 mL超純水。在植物培養(yǎng)箱中全過(guò)程培養(yǎng)擬南芥,環(huán)境溫度設(shè)定為22 ℃,濕度為70%,光合有效輻射為100 μmol·(m2·s)-1,光照周期為16/8 h。
共采用192株擬南芥,其中OSCA1突變型96株,Col-0野生型96株。通過(guò)不同的掃描速度采集高光譜圖像后,對(duì)在不同培養(yǎng)條件下的每株擬南芥的近紅外高光譜圖像進(jìn)行處理分析。
在營(yíng)養(yǎng)土中培養(yǎng)擬南芥植株13 d后,選擇生長(zhǎng)狀態(tài)一致的擬南芥植株,以5 mL超純水為變量進(jìn)行干旱處理,處理時(shí)間為:1,2,3,4和5 d。以0 d作為空白對(duì)照組,在生長(zhǎng)狀態(tài)下,空白對(duì)照組的擬南芥植株每天有5 mL超純水作為水分來(lái)源,實(shí)驗(yàn)組干旱處理期間無(wú)外加水分來(lái)源。
擬南芥光譜數(shù)據(jù)的采集使用高光譜成像儀,其波長(zhǎng)范圍是874~1 734 nm,共有256個(gè)波段。本研究所用系統(tǒng)配置有IMSector N17E光譜儀(Spectral imaging LTD., Oulu, Finland),兩個(gè)150 W鹵鎢燈的2900Lightsource線光源(Illumination Technologies Inc., USA),型號(hào)為OLES22的Cmount成像鏡頭(Spectral imaging LTD., Oulu, Finland),型號(hào)為IRCP0076d的電控位移平臺(tái)(Isuzu Optics Crops., Taiwan, China),高光譜成像系統(tǒng)采集軟件(Isuzu Optics Crops, Taiwan, China)以及配套的電腦。
在20 mm·s-1(原始掃描速度)、30 mm·s-1(1.5×原始掃描速度)和40 mm·s-1(2×原始掃描速度)的掃描速度下分別獲取擬南芥冠層的近紅外高光譜圖像,進(jìn)行參考板與暗電流校正,將校正后的近紅外高光譜圖像讀入計(jì)算機(jī),對(duì)采集后的圖像進(jìn)行校正,校正公式為
R=(Iraw-Idark)/(Iref-Idark)
(1)
式中:R為校正后的圖像,Iraw為原始圖像,Idark為暗電流圖像,Iref為參考板圖像。
通過(guò)對(duì)高光譜圖像分割、降噪,獲取擬南芥的全部冠層,作為目標(biāo)區(qū)域(region of interest,ROI),求出擬南芥冠層在874~1 733 nm的平均光譜反射率,研究高光譜成像掃描速度對(duì)圖像信息的影響。
首先,準(zhǔn)確稱量擬南芥冠層樣本的質(zhì)量(精度為0.001 g),然后按照順序放入干燥箱,溫度設(shè)定為80 ℃,干燥20 min后放入干燥器中靜置10 min至室溫,稱取樣品質(zhì)量。再將樣品放入干燥箱5 min后冷卻再次測(cè)量。重復(fù)干燥、冷卻、測(cè)量的操作,直至干燥后的樣品質(zhì)量恒定,取出樣本后計(jì)算冠層含水率,計(jì)算公式為
M(%)=(M1-m0)/(M1-m1)
(2)
式中:M為冠層含水率(%),m1為容器質(zhì)量(g),M1為烘干前冠層樣本質(zhì)量和容器總重(g),m0為烘干后冠層樣本質(zhì)量和容器總重(g)[14-15]。
1.5.1 PLSR模型建立
偏最小二乘算法(partial least squares regression, PLSR)將多因變量的樣本映射到多自變量空間,回歸建模,當(dāng)變量?jī)?nèi)部有高度線性相關(guān)性時(shí),回歸模型的準(zhǔn)確度高[16-17]。將擬南芥的冠層反射率原始特征數(shù)據(jù)X0(N×m)維和Y0(N×n)維利用主成分回歸的思想進(jìn)行標(biāo)準(zhǔn)化處理,得到E0=(xj)N×m和F0=(yi)N×n兩個(gè)標(biāo)準(zhǔn)化的矩陣。對(duì)擬南芥近紅外高光譜冠層反射率信息重新綜合篩選,從中選取若干對(duì)含水率具有最佳解釋能力的成分進(jìn)行回歸建模。通過(guò)拉格朗日算法逐次迭代計(jì)算,建立PLSR回歸模型,進(jìn)行含水率預(yù)測(cè)。
1.5.2 連續(xù)投影算法選擇特征波長(zhǎng)
利用擬南芥冠層近紅外高光譜全波段信息進(jìn)行模型訓(xùn)練預(yù)測(cè)冠層含水率時(shí),數(shù)據(jù)量大,運(yùn)行速度較慢。連續(xù)投影算法(successive projection algorithm,SPA)篩選矢量空間線性最小化的前向變量,從光譜變量中找出冗雜信息最少的變量組,并且該變量組內(nèi)變量之間共線性最小[18]。
構(gòu)造測(cè)試集矩陣的正交投影矢量,求解出最大投影至對(duì)應(yīng)的波長(zhǎng)位置,獲得降維的測(cè)試集矩陣,根據(jù)多元定量校正模型獲取m個(gè)(1≤m≤256)最優(yōu)波長(zhǎng)的數(shù)值。
1.5.3 模型識(shí)別效果的評(píng)判標(biāo)準(zhǔn)及數(shù)據(jù)分析軟件
模型預(yù)測(cè)精度選擇決定系數(shù)(determination coefficients,R2)、均方根誤差(root mean squared error,RMSE)、相對(duì)分析誤差(relative percent deviation,RPD)三個(gè)參數(shù)。R2反映模型建立和驗(yàn)證的穩(wěn)定性,越接近1,模型穩(wěn)定性越好;RMSE越小的模型預(yù)測(cè)能力越好;RPD≥2時(shí),模型具有極好的預(yù)測(cè)能力。
本次數(shù)據(jù)分析的軟件平臺(tái)為MATLAB R2017b(MathWorks, Inc., Natick, MA, USA)和IBM SPSS Statistics(Version 24.0, IBM Corporation, Armonk, New York, USA)。
擬南芥培養(yǎng)過(guò)程中對(duì)干旱脅迫的響應(yīng)與擬南芥基因型、干旱脅迫強(qiáng)度等因素有關(guān)。從圖1中可以看出,擬南芥培養(yǎng)到十葉期附近,干旱天數(shù)越長(zhǎng),受干旱脅迫影響越大,兩種基因型的擬南芥主側(cè)莖受到抑制,葉面積越小。
圖1(a)為正常狀態(tài)下的Col-0野生型擬南芥,圖1(g)為正常狀態(tài)下的OSCA1干旱敏感型突變體,但是無(wú)法根據(jù)肉眼進(jìn)行區(qū)分。如圖1(f)與圖1(l)比較,OSCA1突變體擬南芥冠層葉片呈現(xiàn)明顯卷曲,Col-0擬南芥卷曲程度較低。因此Col-0野生型與OSCA1突變體基因型擬南芥可以作為植物冠層含水率預(yù)測(cè)的實(shí)驗(yàn)對(duì)象。
圖1 擬南芥的RGB圖片(a)—(f):Col-0野生型干旱脅迫天數(shù)0~5 d;(g)—(l):OSCA1突變體基因型干旱脅迫天數(shù)0~5 dFig.1 RGB images of Arabidopsis phenotypes(a)—(f):Col-0 ecotype on 0~5 days of drought stress;(g)—(l):OSCA1 mutant genotypes on 0~5 days of drought stress
從圖2擬南芥冠層含水率變化趨勢(shì)中可以看出,在相同培養(yǎng)條件下,Col-0野生型擬南芥冠層含水率略高于OSCA1突變型擬南芥,隨著干旱脅迫時(shí)間增加,擬南芥冠層含水率降低。
圖2 擬南芥冠層含水率與干旱脅迫天數(shù)的關(guān)系
OSCA1突變型擬南芥在干旱脅迫條件下,冠層含水率下降速度大于Col-0野生型擬南芥。通過(guò)樣本的標(biāo)準(zhǔn)偏差分析,在干旱脅迫0天的情況下,Col-0野生型標(biāo)準(zhǔn)偏差為0.10,OSCA1突變型標(biāo)準(zhǔn)偏差為0.12,在干旱脅迫5 d的情況下,Col-0野生型標(biāo)準(zhǔn)偏差為0.86,OSCA1突變型標(biāo)準(zhǔn)偏差為0.97。從中可以看出實(shí)驗(yàn)所用OSCA1突變型擬南芥的抗旱能力低于野生型擬南芥。
在正常培養(yǎng)狀態(tài)下,OSCA1突變型與野生型含水率存在差異,Duncan檢驗(yàn)結(jié)果顯示,在空白對(duì)照組的對(duì)照下,實(shí)驗(yàn)組中干旱天數(shù)為1和2 d的兩組擬南芥突變體與野生型含水率顯著性差異均小于0.01,對(duì)干旱脅迫程度響應(yīng)并不敏感。
原始掃描速度下,擬南芥冠層近紅外高光譜平均光譜在930和1 400 nm左右分別出現(xiàn)反射率峰值,且在這些峰值上的光譜值差異較大。在1 450 nm為O—H的伸縮振動(dòng)的一級(jí)倍頻,附近有明顯的水分吸收谷[19]。不同干旱脅迫程度的擬南芥近紅外高光譜圖像反射率曲線的吸收深度和吸收面積不同。
圖3 擬南芥冠層近紅外高光譜平均光譜(20 mm·s-1)Fig.3 Mean spectra of all Arabidopsis canopy (20 mm·s-1)
把預(yù)處理后的光譜數(shù)據(jù)作為自變量,擬南芥冠層含水率作為因變量,建立PLSR模型。比較原始光譜與多元散射校正(multiplicative scatter correction, MSC)、Savitsky-Golay、Savitsky-Golay對(duì)數(shù)變換三種預(yù)處理方式后PLSR模型的結(jié)果,選取最佳光譜預(yù)處理方法用于后續(xù)的數(shù)據(jù)處理。MSC預(yù)處理方法所建立的PLSR模型結(jié)果最優(yōu)。該方法得出的決定系數(shù)R2、相對(duì)分析誤差RPD最大分別為0.907和3.28,證明模型有較好的準(zhǔn)確度和穩(wěn)定性;同時(shí)原始光譜與MSC預(yù)處理光譜的RMSEP相同,表明MSC預(yù)處理方法最優(yōu)。
表1 不同光譜預(yù)處理方法的PLSR模型結(jié)果(20 mm·s-1)
圖4 基于不同掃描速度的全波段PLSR模型結(jié)果(a):20 mm·s-1;(b):30 mm·s-1;(c):40 mm·s-1Fig.4 PLSR model results for different moving speeds with full spectra(a):20 mm·s-1;(b):30 mm·s-1;(c):40 mm·s-1
利用掃描速度為20 mm·s-1的擬南芥近紅外高光譜圖像計(jì)算擬南芥冠層的平均反射率,將經(jīng)過(guò)MSC預(yù)處理后全波段下的平均冠層反射率作為輸入變量,利用PLSR算法建立冠層含水率預(yù)測(cè)模型。后改變掃描速度為30和40 mm·s-1,同樣采用PLSR算法建立冠層含水率預(yù)測(cè)模型,可以發(fā)現(xiàn),隨著掃描速度的增加,高光譜圖像的空間分辨率降低,冠層含水率預(yù)測(cè)模型的準(zhǔn)確度略有下降,掃描速度從20 mm·s-1提升到30 mm·s-1,預(yù)測(cè)模型決定系數(shù)R2下降0.88%,相對(duì)分析誤差RPD下降4.3%;掃描速度提升到40 mm·s-1的情況下,預(yù)測(cè)模型R2下降2.3%,相對(duì)分析誤差RPD下降6.9%。綜合考慮效率和準(zhǔn)確度,選擇30 mm·s-1掃描速度進(jìn)行擬南芥冠層含水率預(yù)測(cè)效果最佳。
如圖5所示,1.5×原始掃描速度下的近紅外高光譜圖片的空間維度分辨率為原始掃描速度的66%,2×原始掃描速度的近紅外高光譜圖像的空間維度分辨率為1×原始掃描速度的44.75%。三種掃描速度情況下,PLSR冠層含水率預(yù)測(cè)模型的RPD≥2,證明模型始終有較好的預(yù)測(cè)能力。但利用全波段信息建立的冠層含水率預(yù)測(cè)模型1.5×原始掃描速度的冠層含水率預(yù)測(cè)模型準(zhǔn)確度降低0.94%,小于1%,因此利用近紅外光譜預(yù)測(cè)植物冠層含水率時(shí),適當(dāng)提高掃描速度,能夠顯著加快信息處理速度。
圖5 不同光譜圖像掃描速度的圖像空間分辨率(a):20 mm·s-1;(b):30 mm·s-1;(c):40 mm·s-1Fig.5 The variation of spatial resolution caused by different scanning speeds(a):20 mm·s-1;(b):30 mm·s-1;(c):40 mm·s-1
利用連續(xù)投影算法,從基于MSC預(yù)處理后的不同掃描速度的全波段冠層反射率數(shù)據(jù)中,篩選出最優(yōu)波長(zhǎng)數(shù)據(jù),將最優(yōu)波長(zhǎng)下的擬南芥冠層反射率數(shù)據(jù)作為輸入變量,建立冠層含水率預(yù)測(cè)模型。
從圖6結(jié)果中可以發(fā)現(xiàn)基于最優(yōu)特征波長(zhǎng)建立的PLSR擬南芥冠層含水率預(yù)測(cè)模型中,20 mm·s-1掃描速度預(yù)測(cè)準(zhǔn)確度R2為0.847,30和40 mm·s-1掃描速度的準(zhǔn)確度與原始掃描速度相比,分別下降5.0%和13.3%。SPA篩選最優(yōu)特征波長(zhǎng),只能保證高光譜圖像中的部分關(guān)鍵信息不丟失,三種掃描速度的擬南芥冠層含水率預(yù)測(cè)模型準(zhǔn)確率與全波段情況下的預(yù)測(cè)模型準(zhǔn)確率相比分別下降了7.1%,10.9%和17.5%,在SPA方法中, 只用了極少數(shù)的變量來(lái)建模,所以建立的PLSR模型精度均低于全波長(zhǎng)冠層含水率模型。
表2 不同掃描速度下連續(xù)投影算法的近紅外高光譜圖像的最優(yōu)特征波長(zhǎng)
圖6 基于特征波長(zhǎng)的PLSR模型效果(a):20 mm·s-1;(b):30 mm·s-1;(c):40 mm·s-1