王海江 劉 凡 YUNGER John A 崔 靜 馬 玲
(1.石河子大學(xué)農(nóng)學(xué)院, 石河子 832003; 2.新疆生產(chǎn)建設(shè)兵團(tuán)綠洲生態(tài)農(nóng)業(yè)重點實驗室, 石河子 832003;3.伊利諾伊州長州立大學(xué)生物系, 芝加哥 IL 60466)
快速、有效地獲取土壤屬性信息,是現(xiàn)代農(nóng)業(yè)發(fā)展、自然資源合理利用以及土壤環(huán)境保護(hù)的重要保障。傳統(tǒng)的土壤屬性測試方法費(fèi)時、費(fèi)力,成本高且造成一定的環(huán)境污染。近些年,高光譜技術(shù)以其簡便、非破壞性、信息量豐富的特點為土壤屬性快速、準(zhǔn)確獲取提供了可能[1-2]。土壤氮素水平不僅是衡量和表征土壤肥力特征的重要指標(biāo),也是決定植株氮素營養(yǎng)水平的關(guān)鍵因素,實驗室測定方法繁瑣且有限的樣本數(shù)量已經(jīng)無法滿足現(xiàn)代精準(zhǔn)農(nóng)業(yè)施肥技術(shù)的需求。
目前,普遍認(rèn)為采用適當(dāng)?shù)墓庾V預(yù)處理和模型構(gòu)建方法,能夠很好地簡化土壤屬性的反演模型,并能提高預(yù)測精度[3],如對原始光譜反射率進(jìn)行一階導(dǎo)數(shù)、二階導(dǎo)數(shù)、對數(shù)、連續(xù)統(tǒng)去除等變換[4-7],采用多元線性逐步回歸、偏最小二乘法、人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等建模方法,均能夠有效提高土壤屬性的預(yù)測能力[8-13]。郭熙等[14]應(yīng)用高光譜技術(shù)分析了南方稻田土壤堿解氮的光譜特征,認(rèn)為波長694、2 058、2 189 nm是構(gòu)建光譜反演模型的特征波段,對土壤堿解氮含量具有一定的預(yù)測能力,在對山東潮土[15]和三峽庫區(qū)的紫色土[16]氮素含量預(yù)測中也表現(xiàn)出較好的估測精度。劉秀英等[8]對陜西省吳起縣24個土壤剖面的黃綿土全氮含量進(jìn)行了光譜預(yù)測,模型校正和驗證的R2分別為0.929和0.935;劉雪梅等[17]對原始光譜平滑后采用蒙特卡羅無信息變量消除方法,預(yù)測堿解氮模型的相關(guān)系數(shù)和均方根誤差分別為0.84和17.1 mg/kg,文獻(xiàn)[18-20]利用近紅外光譜分析技術(shù),通過對土壤原始光譜反射率的平滑和變換處理,采用多元逐步回歸和偏最小二乘法構(gòu)建土壤氮素的估測模型也得到了較好的預(yù)測結(jié)果。
土壤的光譜特征是土壤理化特性的綜合反映,而土壤顆粒粒徑(比表面積)對土壤光譜反射率有著顯著的影響,以往的土壤氮素高光譜估測大都針對同一種土壤粒徑,不同的光譜變換和建模方法開展研究,但是土壤光譜測定前的不同過篩處理會存在較大差異?;诖?,本研究以新疆主要棉區(qū)土壤為研究對象,分析不同過篩粒徑的土壤光譜特征與全氮含量的相關(guān)關(guān)系,確定不同光譜變換數(shù)據(jù)建立的全氮含量估測模型精度,以期為土壤屬性信息的快速獲取提供技術(shù)支持。
新疆地域遼闊,自然條件復(fù)雜,深居歐亞大陸腹地,四周距海遙遠(yuǎn),北、西、南三面為高山所環(huán)抱,很難受到海洋氣流的影響,屬于典型的溫帶大陸性干旱氣候,其總的特點是干旱多風(fēng),致使在土壤形成過程中物理風(fēng)化占有突出地位,風(fēng)蝕、風(fēng)積相當(dāng)強(qiáng)烈,形成大面積的漠土、干旱土、鹽堿土、風(fēng)沙土等。棉花是新疆農(nóng)業(yè)種植的特色優(yōu)勢作物,雖光照充足,但受其溫度、土壤、灌水等因素的影響,棉花的種植主要分布在南疆、東疆和北疆的部分地區(qū),因土壤養(yǎng)分貧瘠,新疆棉田氮肥和磷肥單位面積施用量大,鉀肥單位面積施用量較低,區(qū)域差異明顯[21]。
新疆棉花氮肥單位面積施用量大,區(qū)域間土壤養(yǎng)分差異明顯,這為本研究獲取較為寬泛的土壤氮素含量樣本提供了基礎(chǔ)條件。因此,在前期調(diào)查和查閱大量資料的基礎(chǔ)上,重點選取近3年棉花產(chǎn)量差異大、區(qū)域間養(yǎng)分差異明顯的棉田樣地,其中博樂地區(qū)116個、昌吉地區(qū)123個、奎屯地區(qū)83個、石河子地區(qū)66個,采樣點分布位置如圖1所示。土壤樣品采集地表0~20 cm土層,分別在每一個采樣點的周邊5 m范圍內(nèi)隨機(jī)再采集2個土樣,3個土樣混合后作為該采樣點待測樣品,質(zhì)量約1 kg。每一個采樣點詳細(xì)記錄經(jīng)緯度坐標(biāo),并對采樣點周邊環(huán)境進(jìn)行拍照記錄,采集后迅速封裝在自封袋中,帶回實驗室后去除礫石及動植物殘骸等雜質(zhì)。
圖1 樣區(qū)采樣點分布圖Fig.1 Sample plot distribution
土樣經(jīng)自然風(fēng)干、研磨和壓碎后,全氮含量采用全自動凱氏定氮儀(FOSS-2300型,福斯公司,瑞典)測定。為了能夠獲得不同區(qū)域較寬泛的土壤全氮樣本,依據(jù)化學(xué)測定結(jié)果剔除同一區(qū)域全氮含量相近的樣本,最終篩選出博樂地區(qū)62個、昌吉地區(qū)76個、奎屯地區(qū)50個、石河子地區(qū)42個土壤樣品,對篩選出的230個土樣都分4份,分別過2、1、0.5、0.15 mm篩,得到同一個土樣的4種不同粒徑處理樣本,待測光譜反射率。為了能夠更好地構(gòu)建高光譜反演模型并對模型的精度和普適性驗證,將博樂地區(qū)、昌吉地區(qū)和奎屯地區(qū)的188個樣品隨機(jī)分為141 個(75%)建模樣本和 47個(25%)檢驗樣本,并經(jīng)Levene檢驗與T檢驗確保建模樣本集與檢驗樣本集代表相同的總體樣本。石河子地區(qū)的42個樣本不參與模型構(gòu)建和外部檢驗,作為最優(yōu)模型的普適性驗證,樣品描述性統(tǒng)計分析見表1。
表1 土壤全氮含量描述性統(tǒng)計分析Tab.1 Descriptive statistical analysis of soil total nitrogen content
采用美國ASD 公司 Field Spec Pro FR 型光譜儀進(jìn)行土壤樣品測試,其波長為350~2 500 nm,其中350~1 000 nm、1 000~2 500 nm波段光譜分辨率分別為3、10 nm,采樣間隔分別為1.4、2 nm。取制備好的土壤樣品放置于半徑5 cm、深1.5 cm(認(rèn)為是光學(xué)上無限厚)的黑色盛樣皿內(nèi),土壤裝填容重約1.4 g/cm3。光譜測定在暗室中進(jìn)行,將200 W的鹵素?zé)糁糜谀繕?biāo)兩側(cè),光源入射角為25°,距離目標(biāo)30 cm,采用8°視場角的傳感器探頭置于離土壤樣本表面15 cm的垂直上方,探頭接收光譜的區(qū)域為直徑2.1 cm的圓,小于盛樣皿的面積,探頭接收的均為土壤的反射光譜。測試之前先以白板進(jìn)行定標(biāo),每個土樣采集10條光譜曲線,算術(shù)平均后得到該土樣的實際反射光譜。
在對光譜數(shù)據(jù)變換和篩選的基礎(chǔ)上,選取與土壤全氮含量顯著相關(guān)波段多的變換形式,采用支持向量機(jī)(Support vector machine,SVM)、偏最小二乘回歸(Partial least squares regression,PLSR)和多元逐步線性回歸(Stepwise multiple linear regression,SMLR)方法構(gòu)建土壤全氮含量光譜反演模型。設(shè)定SVM類型為4(即v-SVR),核函數(shù)類型為 2(即 RBF),采用訓(xùn)練集交叉驗證和網(wǎng)格搜索法(Grid search)進(jìn)行參數(shù)尋優(yōu),依據(jù)均方差最小原則確定懲罰參數(shù)C和RBF核參量g的值。采用Matlab R2012a和Sigmaplot軟件完成相關(guān)建模、制圖。
(1)
(2)
(3)
(4)
(5)
nc——校正樣本數(shù)
ypi——預(yù)測集中第i個樣本的實測值
np——預(yù)測集樣本數(shù)
SD——預(yù)測集樣本測量值的標(biāo)準(zhǔn)偏差
RMSECV——交互驗證均方根誤差
圖2是不同粒徑土壤樣品光譜特征與全氮含量的相關(guān)性,土壤原始光譜反射率在各個波段與全氮含量的相關(guān)系數(shù)均不高[22],從其變化趨勢來看,不同粒徑處理土壤樣品與全氮的相關(guān)性變化相似,波長在350~664 nm內(nèi)表現(xiàn)為負(fù)相關(guān),波長在664~1 520 nm內(nèi)相關(guān)性為正值,而后至2 500 nm為負(fù)相關(guān)。不同粒徑土壤樣品在370 nm處與土壤全氮含量的相關(guān)性出現(xiàn)一峰值,相關(guān)系數(shù)為-0.31~-0.21,隨著波長的增加,相關(guān)性降低,在497~520 nm內(nèi)有一谷值,相關(guān)系數(shù)約為-0.09,而后在564~584 nm形成小的峰值,相關(guān)系數(shù)在-0.10左右;隨著波長的增加相關(guān)性變?yōu)檎?,? 046 nm附近有一峰值,相關(guān)系數(shù)約為0.22,后在1 892、2 457 nm處形成峰值,相關(guān)系數(shù)分別在-0.32和-0.34附近。從相關(guān)性來看,不同粒徑組成的土壤原始光譜與全氮含量相關(guān)性均不高,其中2 mm粒徑處理相關(guān)性最低,0.5 mm處理最高,其次是0.15、1 mm,試驗結(jié)果表明,土壤粒徑較小的處理在相關(guān)性上優(yōu)于粒徑較大的處理。
圖2 不同粒徑組成土壤光譜特征與全氮含量相關(guān)性Fig.2 Correlation of soil total nitrogen content and spectral characteristics in different soil particle sizes
土壤光譜特征是土壤理化特性的綜合反映,其原始光譜特征與全氮含量的相關(guān)性受土壤類型、質(zhì)地、有機(jī)質(zhì)、鹽分含量以及背景噪聲等多因素綜合作用[3],因此,不同研究中土壤光譜特征與全氮含量的相關(guān)系數(shù)及其變化趨勢差異較大[23-25]。
表2 不同光譜數(shù)據(jù)變換與土壤全氮含量的最優(yōu)相關(guān)關(guān)系Tab.2 Correlation between different spectrum transformations and soil total nitrogen content
表3是利用SVM、PLSR和SMLR 3種方法構(gòu)建的不同粒徑處理全氮含量的擬合模型,由表3可知,對土壤原始光譜進(jìn)行不同形式的變化均能夠不同程度地提高模型精度,土壤過篩粒徑越小模型的擬合精度越高,從建模精度對比,SVM方法優(yōu)于PLSR和SMLR。
通過分析不同粒徑土壤各變換形式構(gòu)建的模型表明(圖3),3種模型構(gòu)建方法均采用過篩0.15 mm的土壤樣品能夠明顯提高氮素含量的預(yù)測精度,SVM方法采用(lgR)′變換形式、PLSR和SMLR方法采用R′建立的全氮含量擬合模型精度最高,將未參與建模的石河子地區(qū)42個土壤樣本進(jìn)行模型適應(yīng)性驗證,并計算出預(yù)測值與實測值的絕對百分比誤差(圖3)。SVM、PLSR和SMLR模型R2分別為0.822 9、0.771 5和0.705 4,其中SVM和PLSR的預(yù)測數(shù)值略高于實測值,SMLR模型的預(yù)測值略低于實測值,3種方法構(gòu)建的模型在不同區(qū)域間都能夠較好地估測土壤全氮含量,具有一定的區(qū)域穩(wěn)定性。從絕對誤差的變化來看,3種模型均表現(xiàn)出土壤全氮含量越小其誤差越大,隨著土壤氮素含量的增大,誤差迅速降低,如實測值氮素含量為0.06 g/kg時,SVM、PLSR和SMLR模型的絕對誤差分別為562.83%、787.11%和547.24%,氮素含量為0.93 g/kg時,絕對百分比誤差分別為2.46%、3.85%和7.85%,說明采用3種估測方法都無法對土壤氮素含量低的樣品進(jìn)行準(zhǔn)確反演。
表3 不同粒徑土壤全氮含量的模型構(gòu)建與檢驗Tab.3 Models of hyperspectral inverse for soil total nitrogen content in different soil particle sizes
圖3 全氮含量最優(yōu)模型的驗證與誤差分析Fig.3 Model checking and error analysis of soil total nitrogen content
土壤的原始光譜特征是土壤屬性的綜合反映,張娟娟等[24]對我國中東部地區(qū)土壤樣品進(jìn)行風(fēng)干處理,分析發(fā)現(xiàn)土壤全氮含量與原始光譜反射率在350~560 nm和1 913~1 932 nm區(qū)域內(nèi)為正相關(guān),其余波段為負(fù)相關(guān),相關(guān)系數(shù)均低于0.4;張瑤等[11]對北京昌平褐色沙壤土原始光譜特征與全氮含量進(jìn)行相關(guān)分析,在波長800~2 564 nm范圍內(nèi)均呈現(xiàn)負(fù)相關(guān);趙燕東等[22]對北京海淀區(qū)土壤樣品過篩處理,在控制土壤含水率為15%的條件下測定原始光譜與全氮含量相關(guān)性,波長在2 203~2 219 nm區(qū)域為正相關(guān),其他區(qū)域均為負(fù)相關(guān);李焱等[25]對新疆北部灰漠土過篩進(jìn)行光譜測定,表明土壤全氮與原始光譜反射率在350~540 nm區(qū)域為負(fù)相關(guān),540~2 490 nm呈現(xiàn)正相關(guān)。本研究中土壤原始光譜特征與全氮含量的相關(guān)性在350~664 nm范圍內(nèi)表現(xiàn)為負(fù)相關(guān),664~1 520 nm相關(guān)性為正值,而后至2 500 nm為負(fù)相關(guān)。綜上所述,僅利用土壤原始光譜反射率對土壤全氮含量進(jìn)行估測時往往因成土母質(zhì)、粒徑、有機(jī)質(zhì)含量等因素而大相徑庭,在對土壤樣品風(fēng)干、過篩等預(yù)處理消除樣品不一致的影響后,利用原始光譜特征仍無法估測土壤氮素含量。大量的研究證明,通過對原始光譜數(shù)值進(jìn)行一階微分、二階微分、連續(xù)統(tǒng)去除等變換后,能夠顯著提高光譜特征與土壤特性參數(shù)的相關(guān)性[8,17,26],本研究中對原始光譜反射率進(jìn)行了12種不同形式的變換,其相關(guān)性較原始光譜均有所提高,一階微分變換后的擬合精度優(yōu)于其他變換,二階微分變換在增強(qiáng)特征波段信息的同時或許也增強(qiáng)了背景噪聲的信號,使建模精度低于一階微分。不同變換形式最大相關(guān)系數(shù)對應(yīng)的波段位置沒有很好的規(guī)律性,但同一種變換形式在不同的粒徑處理上位置是相近的,依據(jù)估測模型的擬合精度,采用SVM方法對光譜進(jìn)行(lgR)′變換,PLSR和SMLR方法對光譜進(jìn)行R′變換能夠較為準(zhǔn)確地估算土壤全氮含量。
土壤光譜反射率受到質(zhì)地、理化性質(zhì)等因素的共同影響,其光譜測定通常是經(jīng)過去雜、過篩處理后進(jìn)行,不同粒徑的土粒由于比表面積的不同而會影響到反射率,粒徑小的土粒具有較大的比表面積而反射率也較高。國內(nèi)外土壤光譜的測定在過篩處理上差異較大,如預(yù)處理過20目篩(0.83 mm)[22,24]、16目篩(1 mm)[25,27-28]、100目篩(0.15 mm)[29]、8目篩(2.5 mm)[30]、2 mm粒級[10,31-34],研究者均認(rèn)為在利用光譜特征反演不同土壤參數(shù)前需要進(jìn)行過篩處理,通過過篩能夠使被測樣品粒徑較為一致,但在不同粒徑樣品的光譜擬合精度上研究略顯不足。本研究在對土壤樣品的原始光譜進(jìn)行12種不同形式數(shù)據(jù)轉(zhuǎn)換后,利用支持向量機(jī)、偏最小二乘回歸和多元逐步回歸3種方法分別構(gòu)建了土壤全氮含量的高光譜擬合模型,從不同粒徑的擬合精度來看,過篩最小粒徑的0.15 mm處理模型的擬合精度最高,其原因或許是土壤顆粒越小,彼此的結(jié)合越緊密,土壤表面也就越平滑,反射率就越大[35-36],另一方面較大的土壤顆粒間能夠容納更多的空氣和束縛水,其對光譜特征的表達(dá)會產(chǎn)生干擾和掩蓋。因此,本研究的結(jié)果可推斷對土壤待測樣品過篩越細(xì),土壤顆粒越小,利用土壤光譜特征對土壤全氮含量的估測能力越強(qiáng)。從模型的絕對誤差來看,土壤氮素含量越低,SVM、PLSR和SMLR模型的預(yù)測誤差均越大,與采用的建模方法并無關(guān)系,這在其他一些研究者得出的結(jié)論中并未表現(xiàn)的很明顯[22-24],或許是因為本研究區(qū)采集的土壤樣品氮素含量偏低,在土壤氮素含量較低的情況下,利用光譜反射特征無法準(zhǔn)確估測。
(1)利用土壤的原始光譜特征無法準(zhǔn)確估測土壤全氮含量,對光譜反射率進(jìn)行相應(yīng)的數(shù)據(jù)轉(zhuǎn)換能夠顯著提高特征波長與土壤全氮含量的相關(guān)性,但光譜特征波長在各變換中差異不大,其中采用SVM方法通過(lgR)′變換在不同粒徑處理中都能夠較準(zhǔn)確地估測土壤全氮含量,RPD均大于1.5;PLSR和SMLR方法通過R′變換在過篩粒徑小于等于1 mm處理,能夠較為準(zhǔn)確地估測土壤全氮含量。
(2)從不同粒級模型的估測精度來看,過篩粒徑越細(xì),對土壤全氮含量的擬合精度越高,0.15 mm處理,SVM方法采用(lgR)′變換后構(gòu)建的模型RPD為2.704 9,PLSR和SMLR方法通過R′變換后RPD分別為2.554 9和2.437 4,3種方法均能夠很好地估測氮素含量,SVM方法擬合精度優(yōu)于PLSR和SMLR。從最優(yōu)模型的驗證結(jié)果來看,SVM、PLSR和SMLR方法的模型檢驗R2分別為0.822 9、0.771 5和0.705 4,土壤中氮素含量越低,預(yù)測誤差也越大。