武 丹,賈科利,張曉東,張俊華
(1.寧夏大學(xué)資源環(huán)境學(xué)院,寧夏 銀川 750021;2.寧夏回族自治區(qū)遙感測(cè)繪勘查院(寧夏回族自治區(qū)遙感中心),寧夏 銀川 750021;3.中國地質(zhì)大學(xué)(北京)信息工程學(xué)院,北京 100083;4.寧夏回族自治區(qū)地質(zhì)調(diào)查院,寧夏 銀川 750021;5.寧夏大學(xué)環(huán)境工程研究院,寧夏 銀川 750021)
土壤鹽漬化是氣候、水文地質(zhì)、環(huán)境地質(zhì)及人類活動(dòng)共同作用下形成的一類災(zāi)害性的土壤變化,忽視土壤鹽漬化治理,會(huì)導(dǎo)致土壤肥力下降,不利于土壤的可持續(xù)利用。由于技術(shù)方法與數(shù)據(jù)精度等因素的限制,早期土壤鹽漬化程度的評(píng)價(jià)工作主要使用信息疊加的分析方法,通過地理信息系統(tǒng)(GIS)的疊加分析功能將多個(gè)指標(biāo)進(jìn)行疊加來評(píng)估土壤鹽漬化風(fēng)險(xiǎn)等級(jí)。研究表明,評(píng)價(jià)指標(biāo)之間不僅僅是疊加關(guān)系[1],而是呈非線性關(guān)系,通過綜合作用影響土壤鹽漬化的程度。因此,通過數(shù)學(xué)方法建立預(yù)測(cè)模型逐漸成為土壤鹽漬化研究的主要方法。丁建麗等[1]選擇BP-Adaboost預(yù)測(cè)器對(duì)4個(gè)預(yù)測(cè)指標(biāo)進(jìn)行處理,得到土壤鹽漬化預(yù)測(cè)結(jié)果;姚榮江等[2]將生態(tài)風(fēng)險(xiǎn)評(píng)價(jià)數(shù)學(xué)模型與灰色系統(tǒng)理論結(jié)合,對(duì)蘇北海涂圍墾區(qū)進(jìn)行土壤鹽漬化風(fēng)險(xiǎn)評(píng)估與分級(jí);沈掌泉等[3]對(duì)比集成BP神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)統(tǒng)計(jì)學(xué)的克里格插值法,研究土壤養(yǎng)分的空間變異和插值精度。以上研究均表明基于數(shù)學(xué)建模的鹽漬化研究方法能更準(zhǔn)確地評(píng)價(jià)土壤鹽漬化程度且預(yù)測(cè)精度更高。
隨著定量研究的不斷深入,在土壤鹽漬化評(píng)價(jià)中使用神經(jīng)網(wǎng)絡(luò)模型的研究逐漸增多[4],預(yù)測(cè)精度也進(jìn)一步得到提升。支持向量機(jī)(Support Vector Machine,SVM)神經(jīng)網(wǎng)絡(luò)是以大腦生理變化過程為基礎(chǔ),借助計(jì)算機(jī)定量計(jì)算大量數(shù)據(jù)[5],計(jì)算過程中不需要反復(fù)調(diào)試權(quán)重值,克服了以往為提高模型預(yù)測(cè)精度需多次調(diào)整指標(biāo)所占權(quán)重來獲得參數(shù)的缺點(diǎn),適合用于解決分類問題,已應(yīng)用于短時(shí)交通量預(yù)測(cè)[6]、地下水位預(yù)測(cè)[7]、需水量預(yù)測(cè)等諸多領(lǐng)域并取得了很好的效果。本文以銀川平原為研究區(qū),應(yīng)用異質(zhì)SVM神經(jīng)網(wǎng)絡(luò)建立土壤鹽漬化預(yù)測(cè)模型,對(duì)銀川平原的土壤鹽漬化進(jìn)行評(píng)價(jià)研究,以期為銀川平原的土壤鹽漬化預(yù)測(cè)提供借鑒。
銀川平原位于寧夏北部(圖1),面積約7 790 km2,海拔高度1 100~1 500 m,屬于中溫帶干旱區(qū),氣候干燥蒸發(fā)作用強(qiáng)烈,年均降水量185 mm,年均蒸發(fā)量1 825 mm,蒸降比為10∶1。銀川平原位于黃河上游中段是典型的引黃灌溉區(qū),自西向東、由南向北緩傾,黃河水溶解性總固體為4.5~4.85 g/L,局部地區(qū)地下水溶解性總固體高、埋藏淺。銀川平原南部地區(qū)灌排條件較好,北部地區(qū)坡降小、地下水位高、排水不暢,導(dǎo)致土壤積鹽情況較嚴(yán)重[8~9]。
圖1 研究區(qū)地理位置與采樣點(diǎn)分布Fig.1 Location of the study area and sampling points
研究使用的遙感影像為L(zhǎng)andsat8 OLI數(shù)據(jù),分辨率為30 m,具有9個(gè)波段,覆蓋銀川平原共2景數(shù)據(jù),影像獲取時(shí)間為2017年4月30日。對(duì)影像進(jìn)行輻射定標(biāo)、FLAASH大氣校正以及正射校正等預(yù)處理,統(tǒng)一對(duì)影像做投影變換、鑲嵌等處理。植被指數(shù)、鹽分指數(shù)、土壤干旱指數(shù)的計(jì)算均以Landsat8 OLI遙感影像為數(shù)據(jù)源,具體計(jì)算方法參考文[10~11];參考全國第二次土地調(diào)查分類標(biāo)準(zhǔn),使用eCognition軟件,通過面向?qū)ο蠓诸惻c目視解譯相結(jié)合的方法,調(diào)查研究區(qū)土地利用類型狀況,結(jié)合野外實(shí)地調(diào)查結(jié)果評(píng)價(jià)解譯成果的精度為94.5%;地面高程使用ASTER GDEM數(shù)據(jù),空間分辨率為30 m;地下水埋深數(shù)據(jù)采用銀川平原2012—2016年共458個(gè)測(cè)井的地下水靜態(tài)水位數(shù)據(jù),在ArcGIS中選擇球面模型進(jìn)行Kriging[11]處理得到研究區(qū)地下水位埋深的連續(xù)表面;地下水溶解性總固體數(shù)據(jù)采用銀川平原2010—2016年間共325個(gè)鉆孔的地下水溶解性總固體數(shù)據(jù)進(jìn)行插值計(jì)算得到的連續(xù)表面。
本次研究從災(zāi)害預(yù)測(cè)的角度展開,選取6類指標(biāo)作為模型的預(yù)測(cè)指標(biāo),經(jīng)過處理形成相應(yīng)的數(shù)字地面模型作為指標(biāo)數(shù)據(jù)源。根據(jù)野外土壤樣點(diǎn)的實(shí)測(cè)含鹽量結(jié)果制定訓(xùn)練數(shù)據(jù)集與檢驗(yàn)數(shù)據(jù)集,根據(jù)樣點(diǎn)的經(jīng)緯度提取每個(gè)點(diǎn)對(duì)應(yīng)的6類指標(biāo)值。利用2個(gè)數(shù)據(jù)集對(duì)模型進(jìn)行訓(xùn)練及檢驗(yàn)建立SVM神經(jīng)網(wǎng)絡(luò)災(zāi)害預(yù)測(cè)模型。最后,將研究區(qū)內(nèi)的預(yù)測(cè)樣本集輸入模型中,經(jīng)模型預(yù)測(cè)得到分類結(jié)果,將分類結(jié)果插值后得出銀川平原鹽漬化預(yù)測(cè)圖,研究的整體流程見圖2。
圖2 基于異質(zhì)SVM神經(jīng)網(wǎng)絡(luò)的土壤鹽漬化預(yù)測(cè)流程圖Fig.2 Flow chart of soil salinization prediction based on heterogeneous SVM neural network
常用的評(píng)價(jià)指標(biāo)[13]主要包括:土壤含鹽量、土壤水分、植被覆蓋度等。在氣候干燥蒸發(fā)量大、地下水埋藏較淺的地區(qū),地下水中的鹽分會(huì)隨著土壤水分的蒸發(fā)不斷向地表遷移聚集。當(dāng)?shù)叵滤芙庑钥偣腆w相同時(shí),地下水位埋深是影響土壤鹽分分布的主要因素,水位埋深越淺,土壤鹽漬化程度越高;當(dāng)?shù)叵滤宦裆钕嗖畈淮髸r(shí),高溶解性總固體水分布區(qū)土壤鹽漬化程度較高。土壤鹽漬化的發(fā)生會(huì)威脅周圍的生態(tài)環(huán)境,地表鹽分過度積累會(huì)導(dǎo)致植被覆蓋度降低、干旱指數(shù)升高。綜合以上造成土壤鹽漬化的原因,本次研究選擇地面高程、地下水位埋深、地下水溶解性總固體、植被指數(shù)、鹽分指數(shù)、干旱指數(shù)作為模型的預(yù)測(cè)指標(biāo)[14]。圖3為研究使用的6類指標(biāo)數(shù)據(jù)源。
野外采樣時(shí)間為2017年5月,在研究區(qū)內(nèi)隨機(jī)采集土壤樣本208個(gè),采樣時(shí)每個(gè)取土點(diǎn)用GPS定位并記錄經(jīng)緯度坐標(biāo),取表層0~30 cm土壤,剔除土樣中的植物莖葉、礫石等雜質(zhì),送實(shí)驗(yàn)室測(cè)定土壤的堿化度,根據(jù)土壤堿化度[15]對(duì)土壤鹽堿化程度進(jìn)行劃分,樣點(diǎn)土壤的鹽堿化程度分為:1級(jí),非鹽漬化(土壤堿化度≤5);2級(jí),輕度(5<土壤堿化度≤15);3級(jí),中度(15<土壤堿化度≤30);4級(jí),重度(土壤堿化度>30)。經(jīng)實(shí)驗(yàn)室測(cè)定后,根據(jù)土樣的鹽堿化程度,篩選出108個(gè)土壤樣本作為本次實(shí)驗(yàn)的樣本數(shù)據(jù)集(樣點(diǎn)的分布情況見圖1),剩余100個(gè)樣點(diǎn)用作檢驗(yàn)預(yù)測(cè)結(jié)果的精度。在SVM神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型中,土壤鹽漬化的分級(jí)情況分別用標(biāo)簽1,2,3,4表示。
從土樣中篩選非鹽漬化土壤、輕度鹽漬化土壤、中度鹽漬化土壤、重度鹽漬化土壤樣本各27個(gè),每一類中17個(gè)作為訓(xùn)練樣本,另外10個(gè)作為檢驗(yàn)樣本,共計(jì)108個(gè)樣點(diǎn)。在ArcGIS軟件中,根據(jù)點(diǎn)的經(jīng)緯度坐標(biāo),使用值提取至點(diǎn)工具得到每個(gè)點(diǎn)對(duì)應(yīng)的6類指標(biāo)值,組成訓(xùn)練數(shù)據(jù)集和檢驗(yàn)數(shù)據(jù)集。
圖3 土壤鹽漬化評(píng)價(jià)指標(biāo)Fig.3 Evaluation indexes of soil salinization
SVM神經(jīng)網(wǎng)絡(luò)[16]的訓(xùn)練方法屬于監(jiān)督學(xué)習(xí),原理是建立一個(gè)分類超平面作為決策曲面,使得不同類別間的隔離邊緣被最大化。算法利用已知點(diǎn)的類別求出它和類別之間的對(duì)應(yīng)關(guān)系,利用對(duì)應(yīng)關(guān)系將訓(xùn)練集分類,或者預(yù)測(cè)新的數(shù)據(jù)集中每個(gè)點(diǎn)對(duì)應(yīng)的類別。SVM算法的關(guān)鍵是構(gòu)造支持向量x(i)和輸入空間抽取的向量x之間的內(nèi)積核,SVM神經(jīng)網(wǎng)絡(luò)原理是由算法從訓(xùn)練數(shù)據(jù)中抽取的小的子集構(gòu)成的,K為核函數(shù)。最大隔離邊緣在二維分類中被稱為最優(yōu)分類線,推廣到多維分裂問題中為最優(yōu)分類面,使得分類間隔最大。二維分類是容量為n的訓(xùn)練樣本集{(xi,yi),i=1,2,…,n}由2個(gè)類別組成,xi為第一類,yi為第二類,設(shè)xi=1,yi=-1。設(shè)分類超平面為:
(1)
可知平面wTxi+b=1和wTxi+b=-1為該分類問題的分類超平面,轉(zhuǎn)化為求超平面的參數(shù):
(2)
依據(jù)拉格朗日對(duì)偶論轉(zhuǎn)化為對(duì)偶問題,求得的最優(yōu)解為:
(3)
其中,xr和xs為兩個(gè)類別中任意的一對(duì)支持向量,求得最優(yōu)分類函數(shù)為:
(4)
式中:ai*、b*——最優(yōu)化過程求解的參數(shù);
yi——類別標(biāo)簽;
K(X,xi)——核函數(shù),當(dāng)核函數(shù)采用線性(Linear)、多項(xiàng)式(Polynomial)、徑向基核函數(shù)(Radial Basis Function)等不同算法時(shí),SVM神經(jīng)網(wǎng)絡(luò)被稱為異質(zhì)SVM神經(jīng)網(wǎng)絡(luò)。
使用Matlab R2013a軟件編程[17]建立基于SVM神經(jīng)網(wǎng)絡(luò)的土壤鹽漬化預(yù)測(cè)模型。首先,將訓(xùn)練樣本輸入模型中對(duì)SVM神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,然后選取適當(dāng)?shù)暮撕瘮?shù)與參數(shù)提升分類器的性能[18],驗(yàn)證分類器精度是否滿足實(shí)驗(yàn)要求,最后將研究區(qū)內(nèi)隨機(jī)樣點(diǎn)數(shù)據(jù)輸入模型,得到預(yù)測(cè)結(jié)果。核函數(shù)與參數(shù)的選取對(duì)模型預(yù)測(cè)精度有著直接的影響,是本次建模過程中的關(guān)鍵步驟。
核函數(shù)和參數(shù)c、g是SVM模型的重要參數(shù),SVM神經(jīng)網(wǎng)絡(luò)計(jì)算精度與核函數(shù)及參數(shù)c、g的選擇有著直接關(guān)系[19]。常用的核函數(shù)有線性、多項(xiàng)式、徑向基核函數(shù)3種,本文分別使用3種核函數(shù)對(duì)SVM模型進(jìn)行測(cè)試,結(jié)果顯示3種核函數(shù)的準(zhǔn)確率分別為70.4%、82.7%和89.6%,準(zhǔn)確率最高的核函數(shù)為徑向基核函數(shù),線性核函數(shù)準(zhǔn)確率最低。因此,選定徑向基核函數(shù)為該模型的核函數(shù)。
參數(shù)c、g的取值是通過交叉驗(yàn)證(Cross Validation,CV)計(jì)算得出的,實(shí)驗(yàn)使用的CV[20]方法包括:H-CV,K-CV和LOO-CV,分別得出3組c、g值。用RBF核函數(shù)與3組c、g參數(shù)配置SVM神經(jīng)網(wǎng)絡(luò)得到3種模型,將檢驗(yàn)樣本輸入模型中對(duì)3種分類器的精度進(jìn)行驗(yàn)證。分類器的分類精度如表1所示,“實(shí)際類別”代表實(shí)驗(yàn)室測(cè)出的鹽漬化類別的對(duì)應(yīng)標(biāo)簽,“預(yù)測(cè)類別”代表SVM分類器預(yù)測(cè)的鹽漬化類別的對(duì)應(yīng)標(biāo)簽,當(dāng)預(yù)測(cè)類別與實(shí)際類別相同時(shí),代表預(yù)測(cè)結(jié)果與土壤鹽漬化真實(shí)情況一致,說明SVM分類器的預(yù)測(cè)結(jié)果正確。3種模型的分類精度分別為85%、75%和72.5%,因此選擇分類精度最高的模型作為本次實(shí)驗(yàn)的鹽漬化預(yù)測(cè)模型,其參數(shù)c=100,g=3。
表1 不同c、g值的模型分類精度對(duì)比Table 1 Model classification accuracy with different values of c & g
在研究區(qū)內(nèi)隨機(jī)且盡量均勻地選擇317個(gè)點(diǎn)作為預(yù)測(cè)樣本集,將預(yù)測(cè)樣本集輸入具備最優(yōu)核函數(shù)的SVM神經(jīng)網(wǎng)絡(luò)中進(jìn)行預(yù)測(cè),得到研究區(qū)預(yù)測(cè)樣本集的分類結(jié)果。圖4(a)為317個(gè)隨機(jī)點(diǎn)的分類結(jié)果,縱軸1~4類別標(biāo)簽分別對(duì)應(yīng)土壤鹽漬化程度由非鹽漬化—重度的等級(jí)。在ArcGIS中選擇Natural Neighbor[2]方法對(duì)分類結(jié)果做插值處理,得出研究區(qū)的土壤鹽漬化程度預(yù)測(cè)圖(圖4b)。使用ArcGIS的空間統(tǒng)計(jì)功能對(duì)4類鹽漬化土壤的面積進(jìn)行統(tǒng)計(jì),結(jié)合自然資源狀況(圖4c)對(duì)研究區(qū)鹽漬化分布情況進(jìn)行綜合分析,結(jié)果表明:非鹽漬化土壤主要分布在研究區(qū)西邊的賀蘭山周邊、利通區(qū)以及青銅峽地區(qū),該地區(qū)地下水位埋藏較深,地物類型以草地為主,鹽漬化土壤幾乎未見分布;輕度鹽漬化土壤面積約854.08 km2,主要分布在黃河灘涂及耕地周邊,該地區(qū)植被覆蓋度高,干旱指數(shù)較低,灌溉方式主要為引黃灌溉,由于地勢(shì)較高排水順暢,農(nóng)田土壤不易積累過多鹽分;中度鹽漬化土壤面積約985.52 km2,主要分布在研究區(qū)中北部,東部的中度鹽漬化土壤沿黃河灘涂分布,西部的沿賀蘭山呈帶狀分布,惠農(nóng)及平羅的部分地區(qū)在開墾耕地時(shí)破壞土壤覆蓋的原生植被導(dǎo)致植被覆蓋度較低,干旱指數(shù)多在0.42~0.48之間,土壤水分消耗的增加導(dǎo)致土質(zhì)鹽分增多,鹽漬化程度較高;重度鹽漬化土壤面積約231.97 km2,主要在平羅縣西大灘、銀川蘆花和吳忠苦水河地區(qū)的耕地周邊呈點(diǎn)狀集中分布,該地區(qū)地勢(shì)低洼、地下水溶解性總固體高埋藏淺且易滲出地表,植被覆蓋度低,干旱指數(shù)集中在0.62~0.89之間,由于農(nóng)業(yè)耕種過程中人為填埋排水溝,造成農(nóng)田排水不暢導(dǎo)致土壤鹽分積累,農(nóng)業(yè)灌溉后殘余田間的水難以排出,加之強(qiáng)烈的蒸發(fā)作用,引起土壤表面鹽分聚集,鹽漬化程度嚴(yán)重。
圖4 分類結(jié)果Fig.4 Classification results
以野外采集的100個(gè)土壤樣本的實(shí)際鹽漬化類別的對(duì)應(yīng)標(biāo)簽作為橫坐標(biāo),以模型預(yù)測(cè)得出的鹽漬化類別的對(duì)應(yīng)標(biāo)簽為縱坐標(biāo),求實(shí)際值與預(yù)測(cè)值之間的相關(guān)系數(shù),R2為0.834,表明模型預(yù)測(cè)精度較高,滿足本次研究的預(yù)測(cè)精度。
圖5 樣點(diǎn)土壤鹽漬化實(shí)際類別與測(cè)試類別的關(guān)系Fig.5 Actual category and test category of the sample soil salinization
不同鹽漬化程度的點(diǎn)密度也可用于評(píng)估區(qū)域土壤鹽漬化危害的合理性。對(duì)銀川平原非鹽漬化、輕度、中度、重度4類鹽漬化分區(qū)的災(zāi)害點(diǎn)數(shù)量及面積進(jìn)行統(tǒng)計(jì)(表2),計(jì)算不同分區(qū)的災(zāi)害點(diǎn)密度,結(jié)果表明從非鹽漬化區(qū)域到重度鹽漬化區(qū)域,災(zāi)害點(diǎn)的密度呈增加趨勢(shì),重度鹽漬化區(qū)災(zāi)害點(diǎn)密度為0.172是所有類型中密度最大的,表明研究區(qū)域內(nèi)土壤鹽漬化災(zāi)害等級(jí)分布合理。
本研究使用6類引發(fā)土壤鹽漬化的指標(biāo),選取野外實(shí)測(cè)樣本,利用SVM神經(jīng)網(wǎng)絡(luò)模型對(duì)銀川平原土壤鹽漬化的分布情況及潛在發(fā)展趨勢(shì)做出預(yù)測(cè),結(jié)果表明:
表2 四類鹽漬化程度災(zāi)害點(diǎn)統(tǒng)計(jì)Table 2 Severity of salinization in 4 categories
(1)模型建立過程中,實(shí)驗(yàn)驗(yàn)證了3種核函數(shù),結(jié)果顯示徑向基核函數(shù)對(duì)計(jì)算精度影響最大,當(dāng)c=100、g=3時(shí),整個(gè)模型的預(yù)測(cè)正確率最高可達(dá)85%。
(2)非鹽漬化土壤主要分布在研究區(qū)西邊的賀蘭山周邊、利通區(qū)以及青銅峽地區(qū);輕度鹽漬化在銀川平原分布廣泛,面積約854.08 km2,集中分布于吳忠、青銅峽、靈武地區(qū);中度鹽漬化在銀川平原分布較廣,北至惠農(nóng)地區(qū)南至石靈武地區(qū),面積約985.52 km2;重度鹽漬化主要集中在平羅、惠農(nóng)、石嘴山地區(qū),面積約231.97 km2。
(3)銀川平原土地利用類型主要以耕地資源為主,預(yù)測(cè)結(jié)果表明多數(shù)鹽漬化土壤分布在耕地中,其中鹽漬化土壤面積占耕地面積的51%,中度與高度鹽漬化土壤面積占耕地面積的30%。由此可見,銀川平原的土壤鹽漬化程度已較為嚴(yán)重,加之耕地種植結(jié)構(gòu)單一,降低了耕地對(duì)土壤災(zāi)害的抵抗力,因此在農(nóng)業(yè)種植中應(yīng)注重植被的豐富度。同時(shí),應(yīng)注重耕地的合理灌溉與排水,增加土壤的可持續(xù)利用性,減少次生土壤鹽漬化災(zāi)害發(fā)生。此外,經(jīng)野外實(shí)地考察發(fā)現(xiàn),國家“十二五”期間鹽堿地治理效果顯著,應(yīng)延續(xù)其治理方法。
基于SVM神經(jīng)網(wǎng)絡(luò)建立預(yù)測(cè)模型對(duì)銀川平原土壤鹽漬化程度進(jìn)行了預(yù)測(cè),實(shí)驗(yàn)結(jié)果表明,有效的指標(biāo)數(shù)據(jù)是提高預(yù)測(cè)精度的關(guān)鍵,然而研究區(qū)內(nèi)近年數(shù)據(jù)更新不及時(shí)導(dǎo)致數(shù)據(jù)獲取的難度增大,以往的數(shù)據(jù)相對(duì)現(xiàn)在的實(shí)際狀況可能已發(fā)生變化,影響了模型的預(yù)測(cè)精度,今后應(yīng)注重指標(biāo)數(shù)據(jù)的更新。