趙 慧,李新國*,牛芳鵬,靳萬貴,麥麥提吐爾遜·艾則孜
(1.新疆師范大學地理科學與旅游學院,新疆 烏魯木齊 830054;2.新疆干旱區(qū)湖泊環(huán)境與資源實驗室,新疆 烏魯木齊 830054)
土壤電導率反映在一定水分條件下土壤鹽分的實際狀況,且包含土壤水分及離子組成等豐富信息[1-2]。土壤電導率是衡量土壤鹽漬化的重要指標,與土壤鹽分含量有極顯著的相關關系,土壤電導率的測定更加簡單快捷[3-4],對高光譜信息的反應比含鹽量更敏感[5-6]。因此利用土壤電導率快速、準確地獲取土壤鹽分信息在土壤開發(fā)利用和土壤鹽漬化防治等方面具有重要的意義[7]。隨著高光譜遙感技術的產(chǎn)生與發(fā)展,高光譜遙感憑借其分辨率高使得不同地物之間較細微的特征差異被區(qū)分和識別出來[8-9]。因此,在進行土壤性質的定量半定量研究中,使用光譜特征進行相關研究成為眾多學者關注的熱點并取得了重要的成果[10-12]。利用土壤電導率和土壤鹽分含量建立高光譜數(shù)據(jù)的偏最小二乘回歸(PLSR)模型發(fā)現(xiàn),構建土壤電導率模型的決定系數(shù)和均方根差都優(yōu)于土壤鹽分含量[13]?;邴}堿地的基本土壤性質數(shù)據(jù)集,采用自適應遺傳算法確定支持向量機(SVM)模型的最優(yōu)自由參數(shù)。結果表明,與基于線性和Sigmoid的模型相比,采用徑向基核函數(shù)(RBF)模型的SVM具有更高的精度[14]。不同區(qū)域的鹽漬化土壤在反射率和光譜曲線形態(tài)上均存在明顯差異,但優(yōu)化光譜指數(shù)法有效地克服了鹽漬化土壤高光譜特征的區(qū)域異質性,與鹽漬化土壤高光譜特征的相關性一直較好[15]。利用兩波段優(yōu)化算法對簡化光譜指數(shù)進行波段優(yōu)化,優(yōu)化光譜指數(shù)對土壤電導率的敏感程度更強[16]。張文文等[17]利用分數(shù)階微分與銅的相關性分析中,發(fā)現(xiàn)分數(shù)階微分可以擴大特征波段的選擇空間。以博斯騰湖西岸湖濱綠洲為研究區(qū),運用5種數(shù)學變換(分數(shù)階微分、平方根、對數(shù)、對數(shù)倒數(shù)、倒數(shù))預處理土壤高光譜數(shù)據(jù),并采用不同預處理方式優(yōu)化4種光譜指數(shù)篩選特征波段,利用PLSR和SVM構建土壤電導率和土壤高光譜數(shù)據(jù)估算模型。
博斯騰湖湖濱綠洲行政區(qū)隸屬于新疆博湖縣,位于新疆焉耆盆地東南部,地理位置介于E 86°15′~86°55′,N 41°45′~42°10′。其是典型的人工綠洲和自然綠洲混合的山前湖泊綠洲,面積為1360 km2。湖濱綠洲受到博斯騰湖水域的調(diào)節(jié),年平均氣溫8.2~11.5℃,無霜期175.8~211.3 d,年蒸發(fā)量1880.0~2785.8 mm,年降水量47.7~68.1 mm,蒸降比高達40∶1。研究區(qū)內(nèi)土壤類型主要有草甸土、沼澤地、灌耕潮土、鹽土、風沙土、棕漠土等,地下水埋深1.0~2.5 m,礦化度0.1~10 g/L[18]。湖濱植物有蘆葦、檉柳等。由于獨特的地理位置,干旱的氣候荒漠條件,活躍的地表水以及地下水補給,研究區(qū)土壤鹽分平均含量為2.84 g/kg[19]。
圖1 研究區(qū)示意圖
土壤采樣時間為2019年5月8日,根據(jù)研究區(qū)土壤類型的現(xiàn)狀,結合研究區(qū)的土壤鹽分狀況,采用GPS定位技術,使采樣點盡可能遍及研究區(qū)范圍內(nèi)的主要土地利用類型,考慮采樣點的水文地貌條件、植被覆蓋類型以及土壤鹽漬化程度等因素,選取11個樣點進行土壤采集,每個樣點采用分層隨機取樣的方法,每1層隨機采集,3次重復,對0~50 cm的土壤進行人工分層,每個樣本點按10 cm為1層,共采集165個樣本。將每層重復的樣本進行混合,共有55個樣本,利用55個樣本進行不同深度的模型構建。將土壤樣品帶回實驗室經(jīng)過前期處理自然風干后除去枯枝、殘葉等雜質,磨碎過2 mm網(wǎng)篩后,分裝自封袋,用于后續(xù)土壤電導率測定和光譜采集,土壤電導率測定按照5∶1的水土浸提液比例進行配置,并用電導儀測定浸提液25℃時的電導率(EC,mS/cm)。從55個代表性的土壤樣品中按照土壤電導率值大小的順序先選3個為建模數(shù)據(jù),下一個為驗證數(shù)據(jù),以此類推,共選取41個樣本作為建模集,剩下14個樣本作為驗證集,如表1所示。
表1 建模集與驗證集的電導率描述性統(tǒng)計
土壤光譜測定采用ASD FieldSpec3便攜式地物光譜儀,波段范圍為350~2500 nm,光譜采樣間隔在350~1000、1000~2500 nm波段分別為1.38、2 nm,光譜儀最后數(shù)據(jù)重采樣間隔為1 nm。野外測量需要選擇晴朗無風的天氣,采集光譜前對光譜儀白板校正,且校正間隔控制在5 min[20],每個土壤樣品重復測量20條光譜曲線,取其平均值作為此樣本的光譜數(shù)據(jù)。對均值處理后的光譜曲線去除水分吸收帶波段,對去除干擾波段的光譜曲線用Savitzky-Golay濾波方法進行平滑處理。
1.3.1 分數(shù)階微分
分數(shù)階微分是將整數(shù)階微分的階數(shù)擴展至任意階。目前,Grünwald-Letnikov[21-23]定義的分數(shù)階微分較為常用,主要是應用一元函數(shù)差分來實現(xiàn),表達式為:
式中V—階數(shù),Γ()—Gamma函數(shù),λ—對應的值,n—微分上下限之差。
1.3.2 偏最小二乘回歸
采用偏最小二乘回歸(PLSR)方法進行建模及驗證,PLSR方法融合主成分分析、典型相關分析和多元線性回歸分析[18]。在多元線性回歸里采用逐步回歸,逐步分解輸入變量矩陣和輸出變量矩陣,并綜合考慮提取的主成分對輸入變量矩陣和輸出變量矩陣的解釋能力,直到滿足性能要求為止。建模和驗證的精度分別用決定系數(shù)RC2、RV2,均方根誤差RMSEC、RMSEV[24]體現(xiàn)。決定系數(shù)用來判定建模的穩(wěn)定程度,越接近1說明模型越穩(wěn)定;RMSE用來說明模型的準確度,值越小表示模型的精度越高[25]。
1.3.3 支持向量機
支持向量機(SVM)是Cortes和Vapnik于1995年首先提出來的用于解決函數(shù)擬合的問題,SVM一般用于分類和回歸兩種情況[26]。SVM應用于回歸擬合時,是尋找一個最優(yōu)分類面使得所有訓練樣本離該最優(yōu)分類面的誤差最小,控制SVM回歸的參數(shù)主要有懲罰參數(shù)c、不靈敏損失參數(shù)ε、核函數(shù)類型和核函數(shù)參數(shù)[27]。已有學者研究表明,徑向基核函數(shù)在土壤鹽漬化反演模型中效果更好[28]。因此,本研究基于高光譜數(shù)據(jù)的土壤電導率估算模型進行回歸分析,選擇徑向基作為核函數(shù),采用訓練交叉驗證進行參數(shù)尋優(yōu)。
1.3.4 光譜指數(shù)
根據(jù)研究區(qū)土壤鹽分離子狀況結合前人的研究結果,采用比值鹽分指數(shù)(RSI,Ratio salt indices)、差值光譜指數(shù)(DSI,Difference spectral indices)、亮度光譜指數(shù)(BSI,Brightness spectral indices)、歸一化光譜指數(shù)(NDSI,Normalized difference spectral indices)[16]進行研究分析。Ri和Rj是土壤鹽分離子在第i波段和第j波段的土壤光譜反射率。根據(jù)全光譜第i波段和第j波段的所有組合計算二維相關系數(shù),繪制形成光譜系數(shù)矩陣圖。光 譜 指 數(shù) 計 算 公 式:RSI=Ri/Rj;DSI=Ri-Rj;BSI=(Ri2-Rj2)0.5;NDSI=(Ri-Rj)/(Ri+Rj)。
由圖2可知,通過分數(shù)階微分光譜反射率與土壤電導率進行P=0.01極顯著性檢驗的相關性分析。0.6~0.8階波段通過極顯著性檢驗的波段數(shù)從7增加到95個;1~2階特征波段與土壤電導率的相關性在正負值之間波動,特征波段分布較相似。0~0.4階波段相關性值在350~750和1450~1600 nm波段隨著階數(shù)的增加,相關系數(shù)有逐漸增加的趨勢,0.4階只有2個波段通過極顯著性檢驗,相關系數(shù)分別為-0.48、-0.36;0~0.2階沒有通過極顯著性檢驗的波段。
圖2 0~2階分數(shù)階微分變換下的光譜反射率與土壤電導率的相關性分析
統(tǒng)計0~2階微分通過P=0.01極顯著檢驗的相關系數(shù)絕對值最大值及其對應波段,由表2可知,0.4~2階通過0.01顯著性水平的分數(shù)階微分中,2階的特征波段數(shù)量最多,為335。相關性值隨著階數(shù)的增加,特征波段數(shù)量呈現(xiàn)增加的趨勢。相關系數(shù)絕對值最大值隨著階數(shù)的增加,呈現(xiàn)增加-減少-增加的趨勢,2階的相關系數(shù)絕對值最大,為0.64。0.4~2階的相關系數(shù)絕對值對應的特征波段分布為1402、2402、2182、1937 nm。
表2 分數(shù)階微分通過0.01極顯著性檢驗的波段數(shù)和相關系數(shù)絕對值最大值及其對應波段
采用分數(shù)階微分-光譜指數(shù)篩選特征波段,防止數(shù)據(jù)冗余,以0階(原始數(shù)據(jù))、0.8階為例(圖3和圖4)。隨著階數(shù)的增加,光譜矩陣系數(shù)圖中黑色分布范圍越大,表明相關系數(shù)在正負值之間波動較大。在0階NDSI的相關系數(shù)絕對值最大為0.64;在0.2階NDSI的相關系數(shù)絕對值最大為0.67;在0.4階NDSI的相關系數(shù)絕對值最大為0.68;在0.6階的NDSI的相關系數(shù)絕對值最大為0.71;在0.8階DSI的相關系數(shù)絕對值最大為0.75;在1階NDSI的相關系數(shù)絕對值最大為0.74;在1.2階的DSI的相關系數(shù)絕對值最大為0.74;在1.4階RSI的相關系數(shù)絕對值最大為0.73;在1.6階DSI的相關系數(shù)絕對值最大為0.74;在1.8階的DSI的相關系數(shù)絕對值最大為0.73;在2階DSI的相關系數(shù)絕對值最大為0.74。篩選出4種高光譜數(shù)據(jù)變化相關性光譜指數(shù)較高的光譜矩陣系數(shù)圖(圖5),平方根( )在DSI的相關系數(shù)絕對值最大為0.64;對數(shù)(lgR)在DSI的相關系數(shù)絕對值最大為0.64;對數(shù)倒數(shù)(1/lgR)在NDSI的相關系數(shù)絕對值最大為0.62;倒數(shù)(1/R)在NDSI的相關系數(shù)絕對值最大為0.64??梢?,0~2階分數(shù)階微分的相關系數(shù)絕對值最大值比4種高光譜數(shù)據(jù)變化的相關系數(shù)絕對值最大值大0.11,可見,分數(shù)階微分能更好地挖掘波段信息。
圖3 電導率與光譜反射率的0階光譜矩陣系數(shù)圖
圖4 電導率與光譜反射率的0.8階光譜矩陣系數(shù)圖
圖5 土壤電導率與不同高光譜數(shù)據(jù)變化下的光譜矩陣系數(shù)圖
利用原始數(shù)據(jù)及5種高光譜數(shù)據(jù)變化與土壤電導率經(jīng)過光譜指數(shù)篩選出較好的相關性,由表3可知,0.8階微分、平方根、對數(shù)的最優(yōu)光譜指數(shù)是DSI;原始數(shù)據(jù)、對數(shù)倒數(shù)、倒數(shù)的最優(yōu)光譜指數(shù)是NDSI,其相關性絕對值最大值大小對應變換順序為0.8階微分>原始數(shù)據(jù)>平方根>對數(shù)>倒數(shù)>對數(shù)倒數(shù),因此,分數(shù)階微分預處理對于提高優(yōu)化光譜指數(shù)與土壤電導率的相關性具有一定作用。相關系數(shù)絕對值最大值對應波段組合,0.8階微分波段集中在可見光部分;平方根波段集中在1830 nm;原始數(shù)據(jù)、對數(shù)、對數(shù)倒數(shù)、倒數(shù)的波段集中在2000~2100 nm。
表3 不同高光譜數(shù)據(jù)變化下的光譜指數(shù)和相關系數(shù)絕對值最大值及其對應波段組合
采用PLSR和SVM對土壤電導率高光譜數(shù)據(jù)進行建模。由表4可知,建模集誤差相對較大的是原數(shù)據(jù)和對數(shù),分別達到7.38和9.58,建模集較優(yōu)的是0.8階微分和對數(shù)倒數(shù),模型精度RC2=0.83和0.85;驗證集較優(yōu)的是對數(shù)RV2=0.96,RMSEV=1.12,通過分析建模集和驗證集的精度和誤差,發(fā)現(xiàn)基于0.8階微分光譜變換和DSI進行波段優(yōu)化運算后,篩選的優(yōu)化指數(shù)[x1=DSI(634,673)、x2=DSI(634,682)、x3=DSI(1996,2011)、x4=DSI(1997,2001)、x5=DSI(1998,2001)、x6=DSI(634,2228)、x7=DSI(593,2253)、x8=DSI(595,2253)、x9=DSI(596,2253)、x10=DSI(598,2253)、x11=DSI(599,2253)、x12=DSI(600,2253)、x13=DSI(601,2253)、x14=DSI(606,2253)、x15=DSI(607,2253)、x16=DSI(609,2253)、x17=DSI(602,2253)、x18=DSI(604,2253)、x19=DSI(579,2253)]為自變量建立的模型最佳,模型公式為:Y=3.05-6571.58x1-5126.74x2+2757.50x3+3654.55x4+761.07x5-7553.53x6-5850.75x7-38.34x8+8862.43x9+9427.01x10+33987.79x11-7853.02x12-22900.3x13-3513.78x14+1741.29x15-1931.01x16+2788.85x17-4108.78x18+3656.37x19。由表5可知,利用SVM構建的土壤電導率估算模型中,建模集較優(yōu)的是0.8階微分和lgR,建模精度分別為RC2=0.89和RC2=0.91;驗證集模型精度最佳的是0.8階微分,建模精度為RV2=0.80。分析驗證集和建模集可知,0.8階微分和DSI篩選的特征波段構建的SVM模型效果較優(yōu)。
表4 基于PLSR的土壤電導率高光譜估算模型的構建與驗證
表5 基于SVM的土壤電導率高光譜估算模型的構建與驗證
博斯騰湖西岸湖濱綠洲土壤高光譜分析已有大量研究,涉及到不同鹽漬化程度的光譜反射分析[19],采用MSR和PLSR對土壤鹽分含量進行建模[11],蘆葦?shù)赝寥利}分特征高光譜分析[29]等方面,但是基于土壤電導率和土壤高光譜數(shù)據(jù),利用分數(shù)階微分優(yōu)化光譜指數(shù)進行特征波段篩選的分析鮮有報道。分數(shù)階微分對于高光譜波段數(shù)量多、信息量大的數(shù)據(jù),能夠較好地挖掘潛在信息,本文中0.8階微分,通過PLSR和SVM建立的模型都優(yōu)于其他數(shù)據(jù)變化建立的模型,此研究結果與亞森江·喀哈爾等[16]研究結果基本一致。從分數(shù)階微分的一維相關性和二維光譜指數(shù)的相關性分析,發(fā)現(xiàn)分數(shù)階微分的Pearson相關性隨著階數(shù)的增加,通過顯著性檢驗的特征波段數(shù)量增加,相關系數(shù)值也增加,分數(shù)階微分優(yōu)化光譜指數(shù)發(fā)現(xiàn)與采用一維相關性展現(xiàn)相似現(xiàn)象,且二維的相關系數(shù)絕對值最大值大于一維的相關性值,此研究結果與吾木提·艾山江等[30]研究結果基本一致。采用合適的數(shù)學變換對高光譜數(shù)據(jù)進行預處理,在一定程度上能提高其相關性,分數(shù)階微分憑借其記憶性和非局部性,總體上優(yōu)于傳統(tǒng)預處理方法,并且采用光譜指數(shù)和分數(shù)階微分篩選特征波段較傳統(tǒng)方法更具有明顯的優(yōu)勢[10,30]。利用分數(shù)階微分優(yōu)化光譜指數(shù)構建的土壤電導率估算模型在干旱區(qū)綠洲的適用性,有待進一步研究。
分數(shù)階微分的高光譜數(shù)據(jù)與土壤電導率的相關性:2階的特征波段數(shù)量最多為335,相關系數(shù)絕對值最大值為0.64。0~2階相關系數(shù)絕對值最大值對應的特征波段分布在1402、2402、2182、1937 nm。
基于分數(shù)階微分優(yōu)化光譜指數(shù)與土壤電導率之間的顯著相關性,0.8階DSI的相關系數(shù)絕對值最大為0.75,0階相關系數(shù)絕對值最大值為0.64。隨著分數(shù)階微分階數(shù)的增加,光譜矩陣系數(shù)圖中黑色分布范圍越大,表明相關系數(shù)在正負值之間波動較大;4種不同數(shù)學變化相關性提升效果不明顯,平方根、對數(shù)、倒數(shù)的相關系數(shù)絕對值最大為0.64。
利用PLSR和SVM構建土壤電導率估算模型,基于0.8階微分和DSI篩選的特征波段構建的土壤電導率估算效果較好,PLSR估算模型表達 式 為:Y=3.05-6571.58x1-5126.74x2+2757.50x3+3654.55x4+761.07x5-7553.53x6-5850.75x7-38.34x8+8862.43x9+9427.01x10+33987.79x11-7853.02x12-22900.3x13-3513.78x14+1741.29x15-1931.01x16+2788.85x17-4108.78x18+3656.37x19,模型精度為RPLSRc2=0.83,RMSEPLSRc=1.95,RPLSRv2=0.78,RMSEPLSRv=2.57;SVM估算模型精度為RSVMc2=0.89,RMSESVMc=0.03,RSVMv2=0.80,RMSESVMv=1.12;SVM構建的土壤電導率估算模型最優(yōu)。