付艷華, 劉 晶, 毛亞純, 曹 旺, 黃家其, 趙占國(guó)
1. 東北大學(xué)江河建筑學(xué)院, 遼寧 沈陽(yáng) 110819
2. 東北大學(xué)資源與土木工程學(xué)院, 遼寧 沈陽(yáng) 110819
3. 中國(guó)黃金集團(tuán), 北京 100000
近年來(lái), 隨著我國(guó)城市化進(jìn)程加快, 城市周邊耕地被大量占用, 人均耕地日益減少, 對(duì)鹽堿地的改造已成為迫在眉睫的問(wèn)題。 松嫩平原是世界三大蘇打鹽堿地分布區(qū)之一, 該區(qū)域鹽堿地總面積約為3.42×106hm2, 70%以上為蘇打鹽堿土 (主要成分為NaHCO3和Na2CO3)[1]。 由于鹽堿地改良及農(nóng)作物選取方法與鹽堿地中重金屬含量密切相關(guān), 因此如何準(zhǔn)確、 快速確定大區(qū)域內(nèi)鹽堿地重金屬含量已成為亟待解決的關(guān)鍵問(wèn)題。 遙感高光譜技術(shù)具有快速、 動(dòng)態(tài)獲取地物連續(xù)光譜信號(hào)的優(yōu)勢(shì), 已被廣泛應(yīng)用于河漫灘平原[2]、 礦區(qū)[3]、 農(nóng)田[4]的土壤重金屬定量反演等領(lǐng)域。
有效的光譜數(shù)據(jù)預(yù)處理方法和反演方法是實(shí)現(xiàn)鹽堿地土壤重金屬高精度反演的重要保障。 在光譜數(shù)據(jù)預(yù)處理方面, 涂宇龍等[5]在保留土壤樣品弱光譜信號(hào)的基礎(chǔ)上, 發(fā)現(xiàn)經(jīng)標(biāo)準(zhǔn)正態(tài)變換的光譜全要素主成分分析后基于逐步回歸建模方法能有效提升土壤Cu含量估算精度; 徐麗華等[6]利用Savitzky-Golay平滑(SG)、 多元散射校正(MSC)、 標(biāo)準(zhǔn)正態(tài)化(SNV)和克里克濾波(KF)等8種方法對(duì)33個(gè)水稻土壤樣本進(jìn)行了光譜預(yù)處理, 然后基于分區(qū)極值法選取的特征波段進(jìn)行建模, 結(jié)果表明建模精度明顯提高。 在建模方法方面, 程先鋒等[7]開展了蘭坪礦區(qū)土壤樣本的Zn, Pb, As和Cd共4種重金屬含量與光譜響應(yīng)測(cè)試實(shí)驗(yàn), 利用逐步回歸方法預(yù)測(cè)土壤重金屬含量的反演模型具有較高的精度,R2均高于0.816。 Ma等[8]通過(guò)對(duì)土壤重金屬含量與預(yù)處理波段的相關(guān)性分析, 建立了土壤重金屬含量預(yù)測(cè)模型, 結(jié)果表明, 極限學(xué)習(xí)機(jī)和隨機(jī)森林的建模精度優(yōu)于支持向量機(jī)。 目前, 國(guó)內(nèi)外學(xué)者利用遙感技術(shù)對(duì)農(nóng)田、 河漫灘平原土壤的重金屬含量研究較多, 但針對(duì)鹽堿地重金屬含量的反演研究較少, 尤其針對(duì)該應(yīng)用中的光譜數(shù)據(jù)預(yù)處理和建模訓(xùn)練樣本選擇等方面研究不足。
以吉林省白城市鎮(zhèn)賚縣蘇打鹽堿地為研究區(qū)域, 首先利用Savitzky-Golay (SG)平滑法、 多元散射校正(MSC)和連續(xù)統(tǒng)去除法(CR) 3種方法對(duì)原始光譜數(shù)據(jù)進(jìn)行了預(yù)處理, 然后利用差值、 比值及歸一化對(duì)預(yù)處理后的數(shù)據(jù)提取了光譜指數(shù), 并將光譜指數(shù)與重金屬含量做相關(guān)性分析以選取高相關(guān)性的光譜指數(shù), 再以選擇的光譜指數(shù)作為建模輸入的自變量, 鹽堿地重金屬含量作為因變量, 運(yùn)用徑向基神經(jīng)網(wǎng)絡(luò)算法建立重金屬元素錳(Mn)、 鈷(Co)和鐵(Fe)含量的反演模型, 最后通過(guò)相關(guān)系數(shù)等梯度循環(huán)建模精度分析確定了光譜指數(shù)的最優(yōu)選取原則和重金屬含量的最優(yōu)反演模型。 研究結(jié)果表明: 利用上述方法對(duì)Mn, Co和Fe含量進(jìn)行預(yù)測(cè), 相對(duì)精度分別達(dá)到88.64%, 90.36%和91.78%, 為鹽堿地土壤重金屬元素含量的反演提供有效技術(shù)手段和理論支撐。
鎮(zhèn)賚縣位于中國(guó)吉林省白城市的西北部, 總面積約4 737 km2。 鎮(zhèn)賚縣百萬(wàn)畝水田具有鹽堿地面積大、 可溶性鹽含量高等特點(diǎn), 且錳、 鈷、 鐵等重金屬含量較高。 由于重金屬含量決定鹽堿地土壤改良方法及種植植被種類, 因此以鎮(zhèn)賚縣為研究區(qū)域, 采樣區(qū)面積約為15 km2, 每個(gè)采樣點(diǎn)之間有400 m, 如圖1所示。 以均勻抽樣的方式共采集65個(gè)土樣作為實(shí)驗(yàn)樣本, 開展鹽堿地重金屬含量反演研究。
圖1 研究區(qū)概況及采樣點(diǎn)布置圖
首先通過(guò)實(shí)驗(yàn)室土壤干燥箱對(duì)采集的樣本進(jìn)行烘干處理, 然后去除石塊和植物根系后研磨, 放在土壤干燥箱中烘干, 過(guò)100目篩, 共制成粉末狀樣本65件, 每個(gè)樣品分成兩份, 每份約150 g, 分別用于化學(xué)分析和光譜實(shí)驗(yàn)。 采用美國(guó)SVC HR-1024便攜式地物光譜儀對(duì)65件粉末狀樣品進(jìn)行光譜測(cè)試。 該儀器的基本參數(shù)如表1所示。
表1 SVC HR-1024便攜式地物光譜儀基本參數(shù)
光譜測(cè)試實(shí)驗(yàn)于10:00—14:00進(jìn)行, 該時(shí)段可有效降低氣溶膠及太陽(yáng)輻射傳播路徑對(duì)光譜測(cè)試的影響。 將被測(cè)樣品放置于直徑為6 cm的圓形黑色小盒中, 保證樣品表面平整, 可有效避免測(cè)量背景對(duì)光譜實(shí)驗(yàn)的影響。 光譜儀鏡頭垂直于樣品觀測(cè)面, 取3次測(cè)試的反射率均值作為樣品最終反射率。
光譜測(cè)試結(jié)束后, 對(duì)樣品進(jìn)行化學(xué)測(cè)試確定各個(gè)實(shí)驗(yàn)樣本的錳、 鈷和鐵的含量, 實(shí)驗(yàn)土壤樣本中重金屬含量描述統(tǒng)計(jì)分析如表2所示。
表2 重金屬含量描述統(tǒng)計(jì)分析(mg·kg-1)
由于邊緣波段測(cè)試效果不佳, 因此在分析中去除了350~399和2 401~2 500 nm兩段數(shù)據(jù), 最終獲得890個(gè)波段。 65件土壤樣品的可見(jiàn)光-近紅外波段光譜反射率曲線如圖2所示, 由圖可知, 光譜反射率介于5%~60%之間, 在400~2 400 nm之間呈現(xiàn)一定的波動(dòng)性; 在1 400, 1 900和2 200 nm波段附近水分吸收特征較為明顯。 在400~1 000 nm之間, 光譜反射率隨著波長(zhǎng)的增加呈現(xiàn)迅速增大趨勢(shì), 最高值達(dá)到47%; 在1000~1 400 nm之間, 光譜反射率仍保持隨著波長(zhǎng)的增加而增大, 但增加曲線的斜率逐漸變?。?在1 400和1 900 nm這兩個(gè)水分吸收帶之間, 光譜曲線仍然呈現(xiàn)上升的趨勢(shì), 趨勢(shì)較為平緩, 累計(jì)增幅約為5%; 在2 100 nm附近, 反射率總體呈下降趨勢(shì)。
圖2 實(shí)驗(yàn)樣品的可見(jiàn)-近紅外光譜曲線
對(duì)于土壤光譜而言, 其吸收特征與某些特定的土壤屬性有關(guān)。 在400~600 nm區(qū)域形狀較陡, 斜率較大, 這與土壤中所含的鐵有關(guān)。 在可見(jiàn)光(400~700 nm)和短近紅外(700~1 000 nm)波段范圍, 土壤光譜的吸收特征主要由于金屬離子(如Fe2+, Fe3+和Mn3+等)的電子躍遷形成的, 且Mn的主要吸收波段為588.5~591.4, 595.7~601.4, 604.3和615.7 nm[9]。
由于光譜數(shù)據(jù)在獲取過(guò)程中易受到環(huán)境變化、 儀器穩(wěn)定性的影響, 因此獲得的光譜數(shù)據(jù)中包括地物光譜數(shù)據(jù)和一定的噪聲, 而通過(guò)光譜數(shù)據(jù)預(yù)處理可以有效降低噪聲的影響, 并增強(qiáng)土壤原始光譜的細(xì)節(jié)特征, 更好地識(shí)別地物和土壤重金屬信息, 增強(qiáng)反演模型的魯棒性[5]。 因此, 對(duì)原始光譜數(shù)據(jù)進(jìn)行Savitzky-Golay平滑、 多元散射校正、 連續(xù)統(tǒng)去除3種預(yù)處理變換。
(1)Savitzky-Golay平滑法(SG)
Savitzky-Golay算法是最早在1964年引入的基本平滑方法之一, 它利用多項(xiàng)式來(lái)對(duì)移動(dòng)窗口內(nèi)的數(shù)據(jù)進(jìn)行最小二乘擬合, 其實(shí)質(zhì)是一種加權(quán)平均法。 該算法不受樣本數(shù)據(jù)限制, 適用于各種信號(hào)的平滑去噪, 能夠保留頻譜的峰谷特征。 與傳統(tǒng)算法相比, 該算法具有更穩(wěn)定、 誤差更小的平滑去噪效果[10]。 計(jì)算公式如式(1)所示
(1)
(2)多元散射校正(MSC)
多元散射校正算法[11]常用于消除因樣本顆粒分布不均勻造成的散射影響, 在農(nóng)業(yè)土壤研究領(lǐng)域的應(yīng)用較為廣泛。 該方法可有效提高原始光譜的信噪比, 消除光譜數(shù)據(jù)的線性散射干擾。 具體處理過(guò)程如下:
計(jì)算待校正光譜的平均光譜
(2)
一元線性回歸
(3)
得出多元散射校正
(4)
(3)連續(xù)統(tǒng)去除法(CR)
連續(xù)統(tǒng)去除法又稱去包絡(luò)線法, 可有效去除光譜數(shù)據(jù)中的不相關(guān)信息, 是一種可有效增強(qiáng)光譜特征的預(yù)處理方法[13]。 連續(xù)統(tǒng)去除法可以將光譜數(shù)據(jù)歸一化, 不僅能保留和增強(qiáng)光譜的吸收特征, 還能減輕混合物引起的非線性影響, 以便于進(jìn)行光譜吸收特征分析和光譜特征波段選擇。 其公式如式(5)所示
Rc(λ)=Rcr(λ)-R(λ)
(5)
式(5)中,Rc,Rcr和R分別是去包絡(luò)(特征吸收)、 包絡(luò)線和光譜反射率值,λ是波長(zhǎng)。 經(jīng)過(guò)對(duì)光譜反射率曲線去包絡(luò)后, 能夠清晰地看到特征吸收峰。
為提高重金屬含量反演精度, 分別構(gòu)建了比值(RI)、 差值(DI)和歸一化差值(NDI)三種光譜指數(shù)[9]。 對(duì)預(yù)處理后的光譜數(shù)據(jù)所建立的指數(shù)與重金屬含量作相關(guān)性分析, 各指數(shù)計(jì)算公式如式(6)—式(8)
(6)
DI=Rλm-Rλn
(7)
(8)
式(6)—式(8)中:λm為m點(diǎn)對(duì)應(yīng)的波長(zhǎng);λn為n點(diǎn)對(duì)應(yīng)的波長(zhǎng);Rλm為m點(diǎn)波長(zhǎng)對(duì)應(yīng)的反射率值;Rλn為n點(diǎn)波長(zhǎng)處對(duì)應(yīng)的反射率值。
利用3種光譜預(yù)處理方法處理后的光譜數(shù)據(jù)構(gòu)建RI, DI和NDI三種光譜指數(shù), 并分析重金屬含量與光譜指數(shù)的Spearman秩相關(guān)系數(shù)。 對(duì)錳原始光譜數(shù)據(jù)的DI、 連續(xù)統(tǒng)去除后的DI、 Savitzky-Golay平滑后的DI和多元散射校正后的DI與錳重金屬含量相關(guān)性分布如圖3所示。
圖3中的橫坐標(biāo)和縱坐標(biāo)是樣品的光譜波長(zhǎng), 顏色表示光譜指數(shù)與該點(diǎn)樣品的Mn含量之間的相關(guān)系數(shù)的絕對(duì)值。 顏色由藍(lán)色逐漸增加到紅色, 說(shuō)明二者之間相關(guān)系數(shù)的絕對(duì)值由0增加到1, 紅色越深, 說(shuō)明光譜指數(shù)與重金屬含量的相關(guān)性越強(qiáng)。 圖3中(a), (b), (c)和(d)分別為原始光譜指數(shù)DI、 CR處理后的光譜指數(shù)DI、 SG平滑處理后的光譜指數(shù)DI、 MSC處理后的光譜指數(shù)DI與Mn含量的相關(guān)性。 比較上述三種預(yù)處理方法, CR處理后光譜指數(shù)DI與Mn的相關(guān)系數(shù)基本低于0.5, 勉強(qiáng)達(dá)到弱相關(guān), 光譜預(yù)處理效果較差; SG平滑處理后的光譜指數(shù)DI與Mn的相關(guān)系數(shù)可達(dá)到0.8, 能達(dá)到強(qiáng)相關(guān), 預(yù)處理效果較為理想; MSC處理后的光譜指數(shù)DI與Mn的相關(guān)系數(shù)和原始光譜數(shù)據(jù)的光譜指數(shù)DI與Mn的相關(guān)系數(shù)基本一致。
圖3 三種預(yù)處理方法結(jié)合差值指數(shù)與錳含量的相關(guān)分布圖
各種數(shù)據(jù)處理方法增強(qiáng)了部分光譜特征, 但也殘留了部分冗余信息, 數(shù)據(jù)處理后的光譜指數(shù)選取過(guò)多或過(guò)少, 均會(huì)造成建模精度的降低, 因此需要確定一個(gè)合理的數(shù)據(jù)集來(lái)保證建模的反演精度, 具體流程如圖4所示。
圖4 土壤重金屬含量反演建模流程圖
將上述共計(jì)65件樣本, 按照重金屬含量從低到高排列, 抽樣選取50件樣本作為訓(xùn)練集, 15件樣品作為測(cè)試集。 訓(xùn)練集的光譜指數(shù)按照秩相關(guān)系數(shù)r>τ進(jìn)行等梯度選取輸入數(shù)據(jù)集, 利用徑向基神經(jīng)網(wǎng)絡(luò)算法對(duì)重金屬含量進(jìn)行建模預(yù)測(cè), 輸出預(yù)測(cè)的重金屬含量。τ的初始取值為0.6, 然后按Δτ=0.1的梯度遞增, 選取特定輸入數(shù)據(jù)集進(jìn)行多次循環(huán)建模預(yù)測(cè), 在分析中為驗(yàn)證所建模型的精度, 以決定系數(shù)R2、 均方根誤差RMSE和平均相對(duì)精度作為模型評(píng)價(jià)指標(biāo)。R2越接近1, 均方根誤差RMSE值越小, 平均相對(duì)精度越接近1, 表明模型精度越高[14]。 基于反演精度分析最終確定重金屬錳、 鈷和鐵含量的最優(yōu)選取原則和最優(yōu)反演模型。
根據(jù)建模后的決定系數(shù)R2、 均方根誤差RMSE和平均相對(duì)精度這三個(gè)評(píng)價(jià)指標(biāo), 確定了最優(yōu)選取原則, 如表3所示。 Mn選取相關(guān)系數(shù)r>0.70, Co選取相關(guān)系數(shù)r>0.80, Fe選取相關(guān)系數(shù)r>0.80, 并分別選取了108組、 690組和31組。 根據(jù)最優(yōu)選取原則, 對(duì)比三種光譜指數(shù)(DI, RI和NDI), 其中RI和NDI被選取的組數(shù)多, 表明這兩種光譜指數(shù)算法可有效增強(qiáng)光譜特征, 提升建模精度。
表3 重金屬元素光譜指數(shù)最優(yōu)選取原則
根據(jù)最優(yōu)選取原則選取后光譜指數(shù)組合作為輸入數(shù)據(jù), 利用徑向基神經(jīng)網(wǎng)絡(luò)建立了最優(yōu)重金屬含量反演模型, 其預(yù)測(cè)值與實(shí)際重金屬含量對(duì)比如圖5, 圖6和圖7所示, 其中Mn, Co和Fe的預(yù)測(cè)值與實(shí)測(cè)值的回歸曲線R2分別為0.703 4, 0.897 6和0.848 4, 均方根誤差RMSE分別為53.007 3, 1.059 2和0.363 4, 平均相對(duì)精度達(dá)到88.64%, 90.36%和91.78%。
圖5 徑向基神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的Mn含量與實(shí)測(cè)Mn含量對(duì)比圖
圖6 徑向基神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的Co含量與實(shí)測(cè)Co含量對(duì)比圖
圖7 徑向基神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的Fe含量與實(shí)測(cè)Fe含量對(duì)比圖
以中國(guó)吉林省白城市鎮(zhèn)賚縣鹽堿地65件樣本的土壤可見(jiàn)光-近紅外光譜數(shù)據(jù)和Co、 Fe和Mn元素的含量為數(shù)據(jù)源, 采用了Savitzky-Golay平滑、 多元散射校正、 連續(xù)統(tǒng)去除共3種數(shù)據(jù)預(yù)處理方法對(duì)原始光譜數(shù)據(jù)進(jìn)行了處理, 并構(gòu)建了差值指數(shù)、 比值指數(shù)和歸一化指數(shù), 同時(shí)提出了適用于Mn, Co和Fe含量反演的光譜指數(shù)最優(yōu)選取原則。 然后, 利用徑向基神經(jīng)網(wǎng)絡(luò)算法建立了鹽堿地重金屬M(fèi)n, Co和Fe含量最優(yōu)反演模型, 結(jié)論如下:
(1)對(duì)比三種預(yù)處理方法, 利用MSC算法對(duì)鹽堿地土壤光譜數(shù)據(jù)進(jìn)行預(yù)處理、 對(duì)光譜數(shù)據(jù)中干擾信息的去除效果最為明顯。 對(duì)比三種光譜指數(shù)算法, RI和NDI兩種光譜指數(shù)算法可有效增強(qiáng)光譜特征, 提升建模精度。
(2)根據(jù)提出的光譜指數(shù)最優(yōu)選取原則, 基于徑向基神經(jīng)網(wǎng)絡(luò)建立的鹽堿地重金屬M(fèi)n, Co和Fe反演模型預(yù)測(cè)精度較高, 其預(yù)測(cè)值與實(shí)測(cè)值的平均相對(duì)精度分別為88.64%, 90.36%和91.78%。
研究對(duì)鹽堿地重金屬含量精確快速反演提供了一種有效方法。 對(duì)含重金屬的鹽漬化土壤治理具有重要的現(xiàn)實(shí)意義。