張峰 趙忠國 謝大偉 李剛 毛偉
摘? 要:在綜合當地滑坡災害發(fā)育特征和誘發(fā)因素基礎上,選取黃土、坡度、坡向、剖面曲率、降雨等12個因子作為滑坡災害易發(fā)性評價因子。利用確定系數法和信息量模型分別與邏輯回歸結合構建了LLCF、LLSI兩種模型作為滑坡敏感性評價方法。據模型計算結果,將滑坡災害易發(fā)程度劃分為極低易發(fā)區(qū)、低易發(fā)區(qū)、中易發(fā)區(qū)、高易發(fā)區(qū)和極高易發(fā)區(qū)。利用接收者操作特征曲線(ROC, Receiver Operating Characteristic Curve)及下圍面積(AUC,,Area Under the ROC Curve)值分別對兩種模型進行精度檢驗。結果表明:LLCF和LLSI模型在訓練集上成功率曲線AUC值分別為0.903 2和0.841 1;在測試集上預測率曲線AUC值分別為0.899 8、0.871 5。整體上LLCF模型精度高于LLSI模型,為當地防災減災、國土資源等方面提供了有效的數據支持。
關鍵詞:特克斯縣;滑坡敏感性;確定系數法;信息向量模型;邏輯回歸
隨著氣候變化及城鎮(zhèn)化、人類活動等因素影響,滑坡等地質災害變的非常活躍,我們需重視對地質災害的易損性評價及區(qū)劃??;旅舾行栽u價是以地質環(huán)境條件為基礎,綜合分析地質災害發(fā)生的控制條件及誘發(fā)條件,預測地質災害在一定區(qū)域內發(fā)生的可能性[1-2]。目前對滑坡敏感性評價主要采取定性和定量方法評估[3-5]。定性方法快捷簡單,可實現對地質災害易發(fā)性的快速分析判斷和評價,其局限性是對參與模型因子權重的確定存在主觀性,同時模型的應用性也受地域限制,缺乏可重復性[6-7]。定量物理模型和數學模型具不同的局限性,如物理模型準確性受單個斜坡或研究區(qū)巖土參數影響較大,僅適合小范圍或單個災害評估等[8-9]。數學模型需大量精度高的地質水文數據,因此數據選擇和要素等級劃分差異對輸出結果影響較大[10]。近年來,3S技術的快速發(fā)展有效提高了區(qū)域地質災害敏感性評價模型的評價精度,尤其是基于GIS的不同模型方法組合使用在地質災害敏感性評價中得到廣泛應用并取得良好效果。
1? 研究區(qū)概況
特克斯縣位于新疆維吾爾自治區(qū)北緯42°22′30″~43°25′30″,東經81°19′00″~82°37′30″。特克斯縣屬山區(qū)縣,面積8 352 km2,93%的面積為丘陵地,研究區(qū)海拔919~4 958 m,地勢呈北低南高(圖1)。該區(qū)氣候為典型北溫帶大陸性氣候,年平均氣溫約5.3 ℃,年降水量約382.3 mm,日照2 719 h,主要地質災害為滑坡、泥石流、崩塌等。
2? 數據來源與研究方法
2.1? 數據來源
本文在實地調查和收集現有資料基礎上,分析當地地質環(huán)境、地質災害分布規(guī)律、發(fā)育特征及形成條件,選取了數字高程模型、距斷層距離、巖性、起伏度、土壤類型、平面曲率、黃土分布、年降水量和歸一化植被指數,在數字高程模型(DEM)基礎上,分別提取坡向、坡度、剖面曲率為滑坡易發(fā)性評價因子。以上參與滑坡條件因子均通過ArcGIS等相關軟件處理。據91個實測監(jiān)測滑坡數據點隨機按7∶3比例劃分為兩個子集,標記為“1”(圖1)。另在非滑坡區(qū)域隨機生成91個相同數量的非滑坡點,同樣按7∶3比例劃分為兩部分,標記為“0”。最后得到128個訓練模型數據和54個驗證數據。
2.2? 研究方法
2.2.1? 確定系數法(CF)
[Pa]為事件(地質災害)在因子分類數據a中發(fā)生的條件概率,實際研究中通常用因子分類a中的地質災害個數(或面積)與數據分類a的面積比值表示。[Ps]為整個研究區(qū)災害總個數(或面積)與研究區(qū)總面積比值。CF變化區(qū)間為[-1,1],當CF值為正時,其值越大,表明該單元為滑坡易發(fā)區(qū);當CF值為負時,其值越小,表明該區(qū)域不易發(fā)生滑坡[11] 。
2.2.2? 信息量模型 (SI)
信息量模型認為可根據評價因子推算出信息值預測是否發(fā)生滑坡的概率。當信息量值為負時,數值越小,表明滑坡易發(fā)性的可能性較低。信息量值越大,表明滑坡易發(fā)性的可能性較高[12]。
[I=i=1nIxi,H=i=1nlnNiNSiS]…(2)
式中,[xi]代表評價單元內所取的因子等級,[Ixi,H]為因子[xi]對地質災害貢獻的信息量;[S]為研究區(qū)面積;[S]為研究區(qū)內含有因子[xi]的面積;[N]為研究區(qū)地質災害總數;[N]為發(fā)生地質災害區(qū)域內含有因子[xi]的數量,[I]為評價單元中綜合信息量;n 為影響因子數量。
2.2.3? 邏輯回歸
邏輯回歸是研究分類結果與影響因子之間的一種常用的多元統計分析方法?;聻暮7治鲋?,它被描述為二元因變量(一般來說,1表示滑坡,0表示非滑坡)與其他自變量(X1,X2,...,Xn)之間的關系[11]。
[PY=1X=11+ezZ=β0+β1X1+…+βnXn]…(3)
其中[P]為滑坡災害發(fā)生的概率,取值范圍為[0,1] ,[β]為邏輯回歸系數。
3? 結果分析
3.1? 多重共線性分析
滑坡敏感性評價中,由于所選因子在參與回歸分析中可能存在多重共線性問題,因此會降低構建模型的預測準確性。本文在R語言中實現lasso的運算,分析因子之間的多元共線性問題。通過訓練集和驗證集分別得到各因子對應的Lasso系數,達到滑坡敏感性因子的篩選。最終選取高程、土壤類型、年均降雨量、坡度、起伏度、黃土、巖性參與滑坡敏感性模型構建分析(表1)。
3.2? 滑坡因子與滑坡分布相關性分析
滑坡敏感性分區(qū)精度取決于所選的影響因子,深入理解每個影響因子與滑坡災害點的關系有助于提高滑坡敏感性評價及分區(qū)效果。通過將高程、土壤類型、年均降雨量、坡度、起伏度、黃土、巖性因子按公式(1)和(2)分別計算上述因子在不同分級中的SI和CF的值,表明滑坡易發(fā)性趨勢(表2)。
坡度影響因子中,10°~20°內滑坡分布比為54.01%。高程因子中,1 800~2 100 m滑坡分布比為70.73%。降水因子中,降水量在400~500 m中滑坡分布比為48.43%。起伏度方面 ,滑坡面積68.29%分布在123~234范圍。巖性方面,碎屑巖組滑坡分布比為79.79%,其他巖性分組占比較少。我們按全國1∶100土壤分類圖,將研究區(qū)土壤劃分為15類,其中黑氈土發(fā)生滑坡占比為37.98%,黑鈣土滑坡分布占比為29.97%,兩類共占滑坡總面積比的67.95%。
3.3? 滑坡敏感性評價結果
本文將滑坡災害點樣本的高程、坡度、土壤類型、年均降雨量、起伏度、黃土、巖性信息量模型的值(SI)和確定系數法的值(CF)參與到邏輯回歸模型分析中,將評價因子分類級別的SI值和CF值作為自變量,是否發(fā)生地質災害作為因變量(1代表地質災害樣本點,0代表非地質災害樣本點),在SPSS軟件中計算邏輯的回歸系數,并構建LLSI和LLCF模型,得到滑坡敏感性分區(qū)圖(圖2,3)。本文將滑坡敏感性按照自然間斷點法劃分為5類(極低易發(fā)區(qū)、低易發(fā)區(qū)、中易發(fā)區(qū)、高易發(fā)區(qū)、極高易發(fā)區(qū))。其中通過LLSI模型劃分得到的極低易發(fā)區(qū)面積(12.33%)、低易發(fā)區(qū)面積(25.07%)、中易發(fā)區(qū)面積(28.76%)、高易發(fā)區(qū)面積(23.46%)和極高易發(fā)區(qū)面積(10.38%);通過LLCF模型劃分得到的極低易發(fā)區(qū)面積(11.53%)、低易發(fā)區(qū)面積(23.56%)、中易發(fā)區(qū)面積(30.06%)、高易發(fā)區(qū)面積(25.71%)和極高易發(fā)區(qū)面積(9.14%)。
3.3? 評價模型精度驗證
為進一步驗證滑坡敏感性分區(qū)意義,利用訓練集數據和測試集數據,分別對LLCF、LLSI兩種模型進行精度檢驗。
接收者操作特征曲線(ROC)是評價滑坡敏感性模型的有效方法,但往往ROC曲線不能清晰表明哪個模型的效果更佳,因此我們結合ROC曲線下的面積(AUC)值評價模型。AUC值一般為0.5~1,模型AUC值越大,對應模型效果越好[12]。利用模型建立過程中使用的滑坡數據集和模型建立過程中未使用的滑坡數據集,對兩個模型得出的滑坡敏感性進行測試。本文通過接收者操作特征曲線(ROC)和ROC曲線下方的面積大?。ˋUC)對模型擬合優(yōu)度及預測能力進行評價。X軸為錯誤分類的非滑坡位置,Y軸為成功分類的滑坡位置,ROC曲線下面積越大,模型的性能越好。LLCF和LLSI模型在訓練集上的AUC值分別為0.903 2和0.841 1(圖4)。LLCF和LLSI模型在測試集上的AUC值分別為0.899 8和0.871 5(圖5)。整體上LLCF模型精度高于LLSI模型,從模型精度評價可知,基于LLCF模型的滑坡敏感性評價效果高于LLSI模型,高敏感性等級區(qū)間基本覆蓋了已有實測滑坡監(jiān)測點,從一定程度上說明基于LLCF模型的滑坡敏感性評價方法可行。
4? 結論
本文以新疆特克斯縣地質災害詳查的91個地質災害點為基礎,選取高程、距斷層距離、坡度、坡向、剖面曲率、起伏度、土壤類型、黃土分布、年降水量、平面曲率,巖性和歸一化植被指數作為地質災害敏感性評價因子。分別采用確定系數法(CF)和信息量法(SI)與邏輯回歸結合構建LLCF和LLSI模型,通過ROC曲線下面積AUC值分別對LLCF、LLSI模型進行精度檢驗,整體上基于LLCF模型精度優(yōu)于LLSI模型。因此,LLCF模型對本研究區(qū)地質災害敏感性分區(qū)方法具有適用性。
參考文獻
[1]? ? Cruden DM .A simple definition of a landslide[J].Bulletin of Engineering Geology and the Environment,1991,43 (1): 27-29.
[2]? ?Guzzetti? F, Reichenbach P, Cardinali M, et al. Probabilistic landslide hazard assessment at the basin scale[J],2005,72(1/2/3/4):272 -299.
[3]? ? Guzzetti F, Carrara A, Cardinali M, et al. Landslide hazard evaluation: a review of current techniques and their application in a multi-scale study, central Italy[J]. Geomorphology,1999,31(1-4):181-216.
[4]? ? Ayalew L, Yamagishi H..The application of GIS-based logistic regression for landslide susceptibility mapping in the Kakuda-Yahiko Mountains,Central Japan[J]. Geomorphology, 2005,65(1-2):15-31.
[5]? ? Corominas J, van Westen C, Frattini, P, et al. Recommendations for the qunantiative analysis of landslide risk[J]. Bulletin of Engineering Geology and the Environment. 2014, 73(2):209-263.
[6]? ? Saha AK,? Gupta RP , Sarkar I,et al.An approach for GIS-based statistical landslide susceptibility zonation—with a case study in the Himalayas[J]. Landslides, 2005,2(1): 61-69.
[7]? ? Kanungo, DP, Arora, Mk, Gupta, RP, et al. A comparative study of conventional, ANN black box, fuzzy and combined neural and fuzzy weighting procedures for landslide susceptibility zonation in Darjeeling Himalayas[J].Engineering Geology. 2006. 85(3-4): 347-366.
[8]? ? Aleotti P, Chowdhury R .Landslide hazard assessment: summary review and new perspectives[J]. Bulletin of Engineering Geology and the Environment , 1999,58(1):21-44.
[9]? ? Baeza C, Corominas J. Assessment of shallow landslide susceptibility by means of ultivariate statistical techniques[J]. Earth Surface Processes and Landforms, 2001,26(12): 1251-1263.
[10]? Mousavi SZ, Kavian A, Soleimani K,et al. GIS-basedspatial prediction of landslide susceptibility using logistic regression model[J]. Geomatics, Natural Hazards and Risk, 2011,2 (1), 33-50.
[11]? 田春山,劉希林,汪佳. 基于 CF 和 Logistic 回歸模型的廣東省地質災害易發(fā)性評價[J]. 水文地質工程地質,2016,43(6):154-170.
[12]? 張曉東,劉湘南,趙志鵬. 信息量模型、確定性系數模型與邏輯回歸模型組合評價地質災害敏感性的對比研究[J].現代地質,2018,32(3):602-610.
Comparative Study on Landslide Sensitivity Assessment in Turks County of Xinjiang Based on Determined Coefficient Method
and Information Quantity Model
Zhang feng1, Zhao Zhongguo2,Xie Dawei1,Li Gang1,Mao wei1
((1.Xinjiang Vocational and Technology college of communication, Urumqi,Xinjiang,830000,China;2.Xinjiang University,Urumqi,Xinjiang,830000,China)
Abstract:On the basis of synthetically considering the development characteristics and inducing factors of local landslide hazards,twelve factors,such as loess,slope gradient,slope direction, section curvature and rainfall,were selected to evaluate the susceptibility of landslide hazards. LLCF and LLSI models are constructed by combining deterministic coefficient method and information model with logistic regression respectively.According to the calculation results of the model, the vulnerability of landslide disasters can be divided into extremely low-vulnerable areas, low-vulnerable areas,medium-vulnerable areas,high-vulnerable areas and extremely high-vulnerable areas.The accuracy of the two models is tested by using ROC (Receiver Operating Characteristic Curve) and AUC (Area Under the ROC Curve) values. The results show that the AUC values of LLCF and LLSI models on the training set are 0.903 2 and 0.841 1 respectively, and the AUC values of predictive rate curve on the test set are 0.899 8 and 0.871 5 respectively. Overall,the accuracy of LLCF model is higher than that of LLSI model,which provides effective data support for local governments in disaster prevention and reduction,land and resources,etc.
Key words:Turks County;Landslide Sensitivity;Determined Coefficient Method;Information Vector Model;Logical Regression