競 霞 張 騰 白宗璠 黃文江
(1.西安科技大學(xué)測繪科學(xué)與技術(shù)學(xué)院, 西安 710054; 2.中國科學(xué)院空天信息創(chuàng)新研究院, 北京 100094)
小麥條銹病是小麥的主要病害之一,具有爆發(fā)性和流行性的特點,嚴(yán)重影響小麥的安全生產(chǎn)[1]。實時準(zhǔn)確獲取小麥條銹病發(fā)病信息,對小麥病害的精準(zhǔn)防治、減少農(nóng)藥污染、提高小麥產(chǎn)量和質(zhì)量具有重要意義。人工田間取樣的傳統(tǒng)病害調(diào)查方式費時、費力、時效性差,難以滿足多點同時大范圍監(jiān)測的需求[2]。遙感技術(shù)具有快速、大面積、無損害等優(yōu)點,已被廣泛應(yīng)用于小麥病害監(jiān)測中[3-5]。高光譜遙感數(shù)據(jù)能提供精細(xì)的地物光譜信息,定量識別作物受病蟲害的脅迫程度,受到了眾多學(xué)者的關(guān)注[6-9]。目前,小麥病害高光譜遙感監(jiān)測主要利用光譜特征參量與病情指數(shù)之間的相關(guān)性作為優(yōu)選敏感因子的標(biāo)準(zhǔn),采用過濾法確定模型構(gòu)建的特征參量[10-12],該方法從數(shù)據(jù)特征的結(jié)構(gòu)出發(fā),特征參量的選擇獨立于模型算法,算法簡單、通用性好[13],但忽略了各特征參量間的相關(guān)性,難以保證所選特征參量是適合于建模算法的最優(yōu)因子,影響了模型構(gòu)建的精度。封裝法將特征選擇算法和建模方法相結(jié)合,進(jìn)行特征參量提取,能夠降低模型的復(fù)雜性,提高模型預(yù)測精度[14-16]。已有研究表明采用封裝法進(jìn)行特征選擇和模型構(gòu)建能夠有效剔除光譜冗余信息[17],以較少的敏感波段達(dá)到較高的反演精度[18],所建模型具有較強(qiáng)的預(yù)測能力[19]。在眾多的特征選擇和模型構(gòu)建算法中,GA能夠模擬自然選擇和遺傳學(xué)機(jī)理的生物進(jìn)化過程,具有原理和操作簡單、通用性強(qiáng)、能在短時間內(nèi)達(dá)到全局最優(yōu)的特點[20],在特征選擇中得到了廣泛應(yīng)用[21-23]。而SVR算法具有適應(yīng)性好、泛化能力強(qiáng)等特點,更適合小樣本數(shù)據(jù)[24]。
小麥?zhǔn)軛l銹病菌侵染后,其水分及葉綠素含量、光合速率和光能轉(zhuǎn)換率等生理生化指標(biāo)均會發(fā)生變化[25]。反射率光譜數(shù)據(jù)能夠反映植被生化組分信息,但對作物光合活性不敏感,難以揭示植被光合生理狀態(tài)[26],且受陰影等非綠色景觀成分的背景噪聲影響較大[27]。自然光照條件下的葉綠素?zé)晒馐鼙尘霸肼暤挠绊戄^小[28],能夠直接探測到植被的光合作用狀態(tài)[29],遙感探測作物脅迫的精度較高。冠層SIF和反射率光譜在作物病害的遙感探測中各有優(yōu)勢和局限性,已有研究表明,在反射率光譜數(shù)據(jù)中融合冠層SIF能夠提高小麥條銹病病情的估測精度[30-32]?;诖?,本文將反射率吸收參數(shù)與冠層SIF數(shù)據(jù)作為初始特征集合,以SVR模型交叉驗證精度作為評價標(biāo)準(zhǔn),利用封裝法將GA和SVR算法相融合,對特征子集與SVR參數(shù)進(jìn)行聯(lián)合優(yōu)選,建立基于遺傳算法優(yōu)選特征參量的小麥條銹病嚴(yán)重度估測的GA-SVR模型,并將其與CC分析法提取特征參量所建模型的精度進(jìn)行對比,探討GA-SVR模型在小麥條銹病遙感監(jiān)測中的適用性,確定遙感監(jiān)測小麥條銹病的敏感因子及模型。
試驗區(qū)位于河北省廊坊市中國農(nóng)業(yè)科學(xué)院試驗站(39°30′40″N,116°36′20″E),小麥試驗品種為對條銹病比較敏感的銘賢169號,2018年4月9日(小麥起身期)采用濃度為0.09 mg/mL的孢子溶液利用噴霧法對小麥進(jìn)行條銹病接種。試驗區(qū)小麥平均種植密度為113株/m2,分為健康組(編號為 A、D)和染病組(編號為B、C),健康組與染病組之間設(shè)置5 m隔離帶,并對健康組采用打藥處理防止病害發(fā)生。每個試驗組的面積為220 m2,每個組分為8個樣方(A1~A8、B1~B8、C1~C8、 D1~D8),即健康組和染病組各16個樣方。
1.2.1冠層光譜測量
試驗分別于2018年5月18日、5月24日和5月30日3個時期測量小麥條銹病不同病情下的冠層光譜數(shù)據(jù),測量儀器為美國ASD公司生產(chǎn)的ASD Field Spec 4型地物光譜儀,其光譜分辨率為3 nm,采樣波長范圍為300~2 500 nm。為了減弱觀測角度和太陽天頂角對測量結(jié)果的影響,每次光譜測量時間均為北京時間11:00—12:30,且在數(shù)據(jù)測試前通過標(biāo)準(zhǔn)BaSO4參考板對冠層輻亮度數(shù)據(jù)進(jìn)行校正。測量時探頭高度距離小麥冠層1.3 m,每個區(qū)域重復(fù)測量10次,取其平均值作為本次小麥冠層輻亮度。然后計算反射率,計算式為
(1)
式中ρ——冠層反射率
Ltarget——目標(biāo)輻亮度,μW/(cm2·nm·sr)
Lboard——參考板輻亮度,μW/(cm2·nm·sr)
ρboard——參考板反射率
1.2.2病情指數(shù)調(diào)查
冠層光譜測量的同時采用5點取樣法調(diào)查小麥條銹病病情嚴(yán)重度,在每個樣方內(nèi)選取對稱的5點,每點調(diào)查30株小麥的單葉病情嚴(yán)重度,并將其分為9個級別,即:0、1%、10%、20%、30%、45%、60%、80%和100%,通過記錄各嚴(yán)重度小麥葉片數(shù)計算病情指數(shù)[33],計算式為
(2)
式中DI——病情指數(shù)
t——各梯度級別
m——最高梯度
f——各梯度葉片數(shù)
1.2.3冠層SIF提取
冠層SIF提取方法主要包括基于輻亮度數(shù)據(jù)的直接提取算法和基于反射率數(shù)據(jù)的間接提取算法兩種?;谳椓炼鹊墓趯覵IF直接提取算法是利用夫瑯和費暗線原理,通過FLD(Fraunhofer line discrimination)、3FLD(3 bands FLD)以及iFLD(Improved FLD)等算法[34]估測SIF強(qiáng)度。已有研究表明,F(xiàn)LD算法在一定程度上會高估熒光值,iFLD和3FLD方法則能夠得到較為可靠的熒光估測結(jié)果[35],而3FLD算法較iFLD算法更穩(wěn)健[36-37]。因此,本文利用3FLD方法估算O2-A波段(760 nm)冠層SIF的絕對強(qiáng)度,計算式為
(3)
其中
ωleft=(λright-λin)/(λright-λleft)
(4)
ωright=(λin-λleft)/(λright-λleft)
(5)
λin、λleft、λright——吸收線內(nèi)、左、右波段波長
ωleft、ωright——吸收線左、右兩參考波段權(quán)重
Iin、Ileft、Iright——吸收線內(nèi)、左、右波段的太陽輻照度,μW/(cm2·nm)
Lin、Lleft、Lright——吸收線內(nèi)、左、右波段的植被冠層反射輻亮度,μW/(cm2·nm·sr)
除了利用夫瑯和費吸收線直接提取冠層SIF外,基于反射率比值的方法也可獲取650~800 nm波段的熒光信息,是提取冠層SIF強(qiáng)度的間接方法[38]?;诜瓷渎时戎堤崛」趯覵IF主要是利用熒光對650~800 nm波段范圍內(nèi)反射率的影響,獲取與葉綠素?zé)晒庀嚓P(guān)的光學(xué)指數(shù),包括反射率比值熒光指數(shù)、反射率導(dǎo)數(shù)熒光指數(shù)和填充指數(shù)3種[39]。反射率比值熒光指數(shù)通過對680 nm或740 nm附近受熒光影響強(qiáng)的波段和一個受熒光影響較少或不受影響波段的比值運算,消除反射率信息,獲取熒光強(qiáng)度。反射率導(dǎo)數(shù)熒光指數(shù)利用反射率一階導(dǎo)數(shù)的比值反映熒光信息,能夠增強(qiáng)熒光對反射率的影響,突出由熒光引起的細(xì)微變化。填充指數(shù)通過兩個波段反射率的差間接反映熒光信息,但該指數(shù)受夫瑯和費暗線的深度和熒光大小的共同影響,由于大氣和太陽觀測幾何的變化都會影響夫瑯和費暗線的深度,所以該指數(shù)僅適用于在相同時間和觀測條件下的數(shù)據(jù)對比[40]。
1.2.4吸收特征參數(shù)計算
吸收特征是植物組織結(jié)構(gòu)、色素含量、水分和蛋白質(zhì)中各種基團(tuán)對反射光譜響應(yīng)的重要特征[33]。反射率光譜中的細(xì)微吸收特征能夠在連續(xù)統(tǒng)去除的歸一化過程中得到增強(qiáng)[41]。連續(xù)統(tǒng)是指將光譜曲線上凸出的“峰”值點用直線連接,并使所形成的折線在峰值點上的外角大于180°[42],連續(xù)去除后的光譜反射率計算式為
(6)
式中ρc——連續(xù)統(tǒng)線
原始光譜經(jīng)過連續(xù)統(tǒng)去除后,波長起點與終點相對反射率等于1,處于起點與終點間的波長,其反射率都小于1。本文在小麥冠層反射率光譜連續(xù)統(tǒng)去除基礎(chǔ)上參照文獻(xiàn)[43-45]提取了吸收峰深度(H)、吸收波長位置(P)、吸收峰面積(A)、吸收峰左面積(A1)、吸收峰右面積(A2)、對稱度(S)和面積歸一化吸收深度(NMAD)等特征參量。
吸收峰深度H計算式為
H=1-ρ′min
(7)
式中ρ′min——連續(xù)統(tǒng)去除后的最小反射率
吸收波長位置P計算式為
P=λH
(8)
式中λH——吸收峰深度對應(yīng)的波長
吸收峰面積A計算式為
(9)
式中a——吸收帶起始波長
b——吸收帶終止波長
di——吸收深度
Δλ——波長增量
吸收峰左面積A1計算式為
(10)
吸收峰右面積A2計算式為
(11)
對稱度S計算式為
S=A1/A
(12)
面積歸一化吸收深度NMAD計算式為
NMAD=H/A
(13)
1.3.1SVR算法
SVR算法的基本思想是利用訓(xùn)練樣本建立一個回歸超平面,將樣本逼近超平面以使樣本點到該平面的總偏差達(dá)到最小[46],其計算式為
(14)
β——偏置φ——映射函數(shù)
為避免高維內(nèi)積運算,引入核函數(shù)k(xi,x)代替(φ(xi),φ(x)),則式(14)轉(zhuǎn)換為
(15)
SVR算法常用的核函數(shù)有線性核函數(shù)、徑向基(Radial basic function,RBF)核函數(shù)、多項式核函數(shù)以及Sigmoid核函數(shù)等[47]。相較于線性核函數(shù)僅能處理線性問題,RBF核函數(shù)可處理自變量與因變量之間復(fù)雜的非線性問題。此外,應(yīng)用RBF核函數(shù)的效果通常優(yōu)于多項式核函數(shù)與Sigmoid核函數(shù),并且需要設(shè)置的參數(shù)更少[48]。因此,本文在基于GA-SVR算法構(gòu)建小麥條銹病嚴(yán)重度估測模型時采用了RBF核,其計算式為
(16)
式中g(shù)——核參數(shù)
1.3.2GA
GA是一種模擬自然選擇和自然遺傳的隨機(jī)搜索與最優(yōu)化求解方法,它將具體的求最優(yōu)解問題進(jìn)行編碼轉(zhuǎn)換為特定數(shù)量并具有基因序列的種群,其中種群中的每一個體代表每一個解,以適應(yīng)度函數(shù)評價種群中個體的求解結(jié)果,并根據(jù)個體的適應(yīng)度,進(jìn)行選擇、交叉和變異3種遺傳操作,以保證在進(jìn)化過程中種群的適應(yīng)性不斷增強(qiáng),進(jìn)而實現(xiàn)個體的優(yōu)勝劣汰,獲取問題的最優(yōu)解[49](圖1)。
圖1 遺傳算法流程圖Fig.1 Flow chart of genetic algorithm
1.3.3基于GA-SVR算法的特征優(yōu)選
利用GA-SVR算法優(yōu)選模型特征參量是基于二進(jìn)制編碼方法對初始群體中的個體染色體進(jìn)行編碼(圖2),圖中每個染色體由3部分構(gòu)成,第1部分C1-Cx與第2部分g1-gy分別為懲罰參數(shù)C與核參數(shù)g的二進(jìn)制編碼,其中下標(biāo)x和y表示懲罰參數(shù)C與核參數(shù)g的二進(jìn)制位數(shù),決定解碼為十進(jìn)制數(shù)的精度。第3部分f1-fz為所有特征集合的編碼,下標(biāo)z為特征總個數(shù)。當(dāng)編碼中的二進(jìn)制數(shù)為“1”時表示該特征被選中,為“0”時表示該特征未被選中。
圖2 編碼示意圖Fig.2 Coding diagram
基于GA-SVR算法進(jìn)行特征優(yōu)選時,需要對種群數(shù)量、最大迭代次數(shù)、交叉概率和遺傳概率等參數(shù)進(jìn)行設(shè)置。為了保證遺傳算法具有全局搜索能力,在上述遺傳參數(shù)設(shè)置的基礎(chǔ)上按 “單點交叉”方式對種群中的個體進(jìn)行兩兩交叉,同時以基本位變異的方式依據(jù)較小的變異概率對交叉完成后的個體進(jìn)行變異操作,以防止算法陷入局部最優(yōu)。經(jīng)過選擇-交叉-變異等遺傳操作形成子代種群,重復(fù)進(jìn)行解碼、適應(yīng)度評價、種群更新等步驟,在滿足迭代終止條件時算法停止。
為了保證評價結(jié)果的穩(wěn)定性和可靠性,提高模型的泛化能力,減弱樣本數(shù)據(jù)對評價結(jié)果的影響,本文將52個原始樣本重復(fù)進(jìn)行3次隨機(jī)分組(記為a、b、c 3組),每組按照3∶1的比例隨機(jī)劃分為訓(xùn)練集和驗證集,其中39個訓(xùn)練樣本用于特征選擇與模型構(gòu)建,13個驗證樣本用于模型評價。
選用預(yù)測值和實測值之間的決定系數(shù)R2與均方根誤差(RMSE)2個指標(biāo)進(jìn)行模型精度評價,其中決定系數(shù)R2越大,均方根誤差(RMSE)越小,預(yù)測樣本與實測樣本偏差越小,模型精度越高。
特征參量很大程度上影響了模型的性能,為了提高小麥條銹病遙感監(jiān)測精度,利用反射率光譜數(shù)據(jù)在作物生化參數(shù)探測方面的優(yōu)勢和SIF在光合生理診斷方面的優(yōu)勢,計算了吸收深度等7個反射率光譜吸收特征及15個冠層SIF數(shù)據(jù),利用封裝法將GA和SVR算法相結(jié)合進(jìn)行小麥條銹病遙感監(jiān)測特征參量優(yōu)選,并將其與CC特征優(yōu)選方法進(jìn)行對比,分析兩種方法提取特征參量所建模型精度,以確定遙感探測小麥條銹病的敏感因子及模型。
2.1.1CC特征優(yōu)選
CC是一種過濾性的特征選擇方法,具有計算量小及所選特征參量通用性較好的優(yōu)點。本文在計算冠層SIF及反射率吸收特征參數(shù)與病情嚴(yán)重度間相關(guān)系數(shù)的基礎(chǔ)上,挑選達(dá)到0.001極顯著水平的特征參量作為遙感監(jiān)測小麥條銹病嚴(yán)重度的敏感因子。
(1)冠層SIF強(qiáng)度特征參量
分別利用輻亮度和反射率計算了小麥條銹病不同病情下的冠層SIF信息。利用輻亮度數(shù)據(jù)計算冠層SIF時,由于O2-A (760 nm)波段氧氣吸收形成的夫瑯和費暗線特征明顯[50],熒光估測精度高[51],因此本文利用輻亮度基于3FLD方法估測了760 nm處的SIF強(qiáng)度,并將計算得到的SIF絕對強(qiáng)度除以夫瑯和費吸收線內(nèi)的太陽入射輻照度,獲取O2-A波段的SIF相對強(qiáng)度,以消除太陽光照強(qiáng)度等外界因素對葉綠素?zé)晒馓崛〗Y(jié)果的影響[52-53]。
(17)
式中F′——SIF相對強(qiáng)度
利用反射率間接估測冠層SIF時,由于填充指數(shù)法僅適用于在相同時間和觀測條件下的數(shù)據(jù)對比,因此本文僅計算了反射率比值熒光指數(shù)和反射率一階導(dǎo)數(shù)熒光指數(shù)。目前常用的反射率比值熒光指數(shù)主要有ZARCO-TEJADA等[54-55]提出的
表1 冠層SIF與病情指數(shù)相關(guān)系數(shù)(n=52)Tab.1 Correlation coefficient between canopy SIF and disease index (n=52)
(2)反射率吸收特征優(yōu)選
在對400~550 nm和550~770 nm兩個吸收波段范圍內(nèi)的反射率光譜數(shù)據(jù)進(jìn)行連續(xù)統(tǒng)去除的基礎(chǔ)上提取了吸收位置等光譜吸收特征參數(shù),并計算其與小麥條銹病嚴(yán)重度的相關(guān)性(表2)。由表2可以看出,在400~550 nm和550~770 nm 2個吸收波段范圍內(nèi)共有吸收位置(P)、最大吸收深度(H)以及面積歸一化最大吸收深度(NMAD)等9個特征參量與小麥條銹病嚴(yán)重度達(dá)到了0.001水平的極顯著相關(guān),可以作為遙感監(jiān)測小麥條銹病嚴(yán)重度的模型輸入變量。
表2 吸收特征參數(shù)與病情指數(shù)相關(guān)系數(shù)(n=52)Tab.2 Correlation coefficient between absorption characteristics and disease index (n=52)
2.1.2GA-SVR特征優(yōu)選
利用GA-SVR算法優(yōu)選遙感監(jiān)測小麥條銹病敏感因子時,GA及SVR參數(shù)設(shè)置對迭代尋優(yōu)的速率與準(zhǔn)確率有較大的影響,基于此本文通過對訓(xùn)練樣本的多次仿真確定SVR算法中懲罰參數(shù)C與核參數(shù)g的尋優(yōu)范圍及GA各參數(shù)設(shè)置(表3)。然后在上述參數(shù)設(shè)置的基礎(chǔ)上將GA-SVR特征選擇算法獨立運行20次,單次運行最大迭代次數(shù)設(shè)定為100,以訓(xùn)練集10折交叉驗證均方誤差(Mean square error,MSE)作為評價個體優(yōu)劣的適應(yīng)度,其中適應(yīng)度最小的個體所對應(yīng)的特征參量以及懲罰參數(shù)C和核參數(shù)g即為GA-SVR模型構(gòu)建時的最優(yōu)特征集合以及SVR算法的最佳參數(shù)組合。表4為a組數(shù)據(jù)運行20次得到的不同適應(yīng)度及其對應(yīng)的最優(yōu)特征集合。
表3 GA-SVR各參數(shù)設(shè)置Tab.3 GA-SVR parameter settings
表4 a組數(shù)據(jù)單次適應(yīng)度最小值及其對應(yīng)特征與參數(shù)組合Tab.4 Minimum single fitness of group a of data and their corresponding characteristics and parameter combinations
由表4可知,第8次運行時的適應(yīng)度為GA-SVR算法20次運行中的最佳適應(yīng)度,對應(yīng)的懲罰參數(shù)C(94.937 9)與核參數(shù)g(0.967 0)為SVR算法的最優(yōu)參數(shù)組合,特征集合{4,5,17,22,24,25,27}為遙感監(jiān)測小麥條銹病嚴(yán)重度的最佳特征參量。同理得到b組和c組的最優(yōu)特征集合及SVR算法的最優(yōu)參數(shù)組合(表5)。
2.2.1模型構(gòu)建
基于GA-SVR算法優(yōu)選的最優(yōu)特征組合建立遙感監(jiān)測小麥條銹病嚴(yán)重度的GA-SVR模型(圖3),并將其與CC法算法優(yōu)選的特征參量集合所建的CC-SVR模型(圖4)進(jìn)行對比分析。
表5 3組數(shù)據(jù)GA-SVR優(yōu)選特征組合及參數(shù)組合Tab.5 Three sets of data GA-SVR preferred feature combination and parameter combination
圖3 GA-SVR模型訓(xùn)練集預(yù)測結(jié)果(n=39)Fig.3 GA-SVR model prediction result on training set(n=39)
圖4 CC-SVR模型訓(xùn)練集預(yù)測結(jié)果(n=39)Fig.4 CC-SVR model prediction result on training set(n=39)
由圖3、4可以看出,3個樣本組中GA-SVR模型預(yù)測DI值和實測DI值之間的R2均在0.9以上,相對于同組CC-SVR模型分別提高了9.9%、10.0%、5.6%,RMSE分別降低了26.3%、26.5%、19.3%,GA-SVR模型對小麥條銹病嚴(yán)重度的估測精度優(yōu)于CC-SVR模型。說明將GA-SVR模型優(yōu)選的特征作為模型輸入能夠明顯地提高模型對訓(xùn)練集病情指數(shù)的預(yù)測能力,而CC法優(yōu)選的特征雖然對病情指數(shù)敏感,但從CC-SVR模型對訓(xùn)練集病情指數(shù)的預(yù)測精度來看,其并非為SVR模型的最佳輸入特征。
2.2.2模型評價
為了在樣本數(shù)量有限的情況下更客觀地評價模型精度,盡可能減少“過擬合”問題對模型評價結(jié)果的影響,采用能夠充分利用樣本中所有數(shù)據(jù)的保留樣本交叉檢驗方式對CC分析法以及GA-SVR方法所選特征構(gòu)建的小麥條銹病嚴(yán)重度預(yù)測模型進(jìn)行評價(表6)。由表6可以看出,3組驗證樣本中GA-SVR模型的預(yù)測精度較同組CC-SVR模型均有不同程度的提高,其中GA-SVR模型估測DI值和實測DI值間的R2較同組CC-SVR模型至少提高了2.7%,平均提高了17.8%,RMSE較同組CC-SVR模型至少減少了10.1%,平均減少了32.1%。綜合分析圖3、圖4和表6可知,無論是訓(xùn)練集樣本還是驗證集樣本,GA-SVR模型對DI的預(yù)測能力均優(yōu)于CC-SVR模型,將特征優(yōu)選和模型構(gòu)建相融合的GA-SVR模型能夠提高小麥條銹病嚴(yán)重度的預(yù)測精度,且模型穩(wěn)定性和泛化能力均優(yōu)于CC-SVR模型,更適合于小麥條銹病嚴(yán)重度的敏感因子優(yōu)選與模型構(gòu)建。這是因為CC算法是以顯著檢驗水平作為特征優(yōu)選的條件,僅考慮了特征參量與病情嚴(yán)重度之間的相關(guān)性,沒有考慮不同特征參量之間是否存在數(shù)據(jù)的冗余以及所選的特征參量是否最適合于模型構(gòu)建算法,影響了模型的預(yù)測精度。而GA-SVR算法綜合利用了GA的全局搜索特點和SVR算法較優(yōu)的學(xué)習(xí)能力,考慮了SVR參數(shù)對特征參量優(yōu)選的影響,將所有特征與SVR參數(shù)進(jìn)行聯(lián)合編碼,以10折交叉驗證最小MSE作為特征與參數(shù)的優(yōu)選依據(jù),對所有可能選擇到的特征進(jìn)行有向搜索,保證了所選特征的敏感性,提升了模型的預(yù)測精度。
表6 小區(qū)試驗數(shù)據(jù)驗證結(jié)果(m=13)Tab.6 Verification results of plot experiment (m=13)
2.2.3大田調(diào)查數(shù)據(jù)驗證
2018年5月12日于陜西省漢中市寧強(qiáng)縣大田小麥種植區(qū)域調(diào)查條銹病的發(fā)病狀況,利用ASD Field Spec 4型地物光譜儀同步獲取42個對應(yīng)樣本點的冠層光譜數(shù)據(jù),并基于此數(shù)據(jù)對本文所建立的模型進(jìn)行驗證(表7),以評價模型的可靠性與普適性。
表7 大田調(diào)查數(shù)據(jù)驗證結(jié)果(m=42)Tab.7 Verification results of field survey data (m=42)
由表7可知,3個樣本組建立的GA-SVR模型預(yù)測DI值與實測DI值間的R2均高于0.7,比CC-SVR模型至少提高了66.2%,RMSE均不高于0.150,比CC-SVR模型至少減少了31.5%,聯(lián)合GA與SVR算法的特征優(yōu)選方法能夠提高小麥條銹病的遙感探測精度,GA-SVR模型具有較好的可靠性和普適性。
融合GA和SVR算法優(yōu)選小麥條銹病遙感監(jiān)測的敏感因子時,3個樣本組中優(yōu)選的特征參量的一致性不高,說明GA-SVR方法進(jìn)行特征選擇時,受到原始樣本的影響較大。這是因為封裝法是以模型的精度作為特征優(yōu)選的標(biāo)準(zhǔn),樣本的差異影響交叉驗證的精度,小樣本訓(xùn)練集的隨機(jī)劃分難以代表所有樣本間的差異,進(jìn)而導(dǎo)致3個樣本組所選的特征參量不一致,能否利用大量的訓(xùn)練樣本解決這一問題還有待繼續(xù)研究。
本文協(xié)同冠層SIF數(shù)據(jù)和反射率光譜進(jìn)行小麥條銹病遙感監(jiān)測時,反射率數(shù)據(jù)僅利用了對植被葉綠素含量敏感的可見光波段的吸收特征,而小麥在受到條銹病菌侵染時,水分、花青素等生化組分含量也會發(fā)生相應(yīng)的變化[58]。在構(gòu)建小麥條銹病嚴(yán)重度反演模型時,若增加能夠反映各種生化組分的光譜指數(shù),分析不同光譜指數(shù)對條銹病害脅迫的響應(yīng)特性,能否提高小麥條銹病的遙感監(jiān)測精度還有待進(jìn)一步研究。
綜合利用反射率光譜在作物生化參數(shù)探測方面的優(yōu)勢及SIF在光合生理診斷方面的優(yōu)勢構(gòu)建了小麥條銹病嚴(yán)重度估測模型,并沒有考慮反射率吸收特征和SIF數(shù)據(jù)對模型的貢獻(xiàn)率問題,如何量化反射率光譜數(shù)據(jù)和SIF數(shù)據(jù)對遙感監(jiān)測小麥條銹病嚴(yán)重度的貢獻(xiàn)率,確定各個輸入特征在模型中的權(quán)重,進(jìn)一步提高小麥條銹病的遙感監(jiān)測精度,則是一個值得研究的問題。
在利用SVR算法構(gòu)建小麥條銹病嚴(yán)重度估測模型時,僅考慮了高斯核函數(shù),并沒有分析所選特征參量與小麥條銹病嚴(yán)重度之間的映射關(guān)系,確定不同特征參量與病情嚴(yán)重度之間的最優(yōu)映射函數(shù)進(jìn)而提高小麥條銹病嚴(yán)重度的遙感估測精度則是下步要研究的問題。
本文在構(gòu)建小麥條銹病嚴(yán)重度反演模型時,僅選用了對小樣本適用性較好的SVR算法,并未與其它機(jī)器學(xué)習(xí)算法進(jìn)行對比分析。已有研究將GA與隨機(jī)森林算法結(jié)合進(jìn)行敏感波段的選擇,并取得了較好的研究成果[18],但是將GA與其他機(jī)器學(xué)習(xí)算法結(jié)合進(jìn)行小麥條銹病敏感特征選擇能否改善小麥條銹病嚴(yán)重度反演精度還需進(jìn)一步研究。
基于小麥條銹病不同病情嚴(yán)重度下的冠層SIF數(shù)據(jù)與反射率吸收特征參量,分別利用GA-SVR算法與CC算法優(yōu)選了小麥條銹病遙感監(jiān)測的敏感因子,在此基礎(chǔ)上構(gòu)建了小麥條銹病的遙感監(jiān)測模型。結(jié)果表明,GA-SVR算法優(yōu)選的小麥條銹病遙感監(jiān)測的敏感因子為7~8個,而CC分析法則優(yōu)選出了22個因子,GA-SVR算法極大地降低了特征空間的維度,減少了特征參量間的冗余,降低了模型的復(fù)雜性。從模型的預(yù)測性能來看,無論是小區(qū)試驗數(shù)據(jù)還是野外大田數(shù)據(jù),GA-SVR模型的預(yù)測精度均高于CC-SVR模型。以小區(qū)試驗數(shù)據(jù)為驗證樣本時,GA-SVR模型預(yù)測DI值與實測DI值之間R2均在0.9以上,RMSE均小于0.1,比CC-SVR模型的R2至少提高了2.7%,RMSE至少降低了10.1%。以大田數(shù)據(jù)為驗證樣本時,GA-SVR模型預(yù)測DI值與實測DI值間的R2比CC-SVR模型至少提高了66.2%,RMSE至少降低了31.5%。