于 憲 煜,胡 友 健,牛 瑞 卿
(1.中國地質(zhì)大學(xué)(武漢)信息工程學(xué)院,湖北 武漢 430074;2.中國地質(zhì)大學(xué)(武漢)地球物理與空間信息學(xué)院,湖北 武漢 430074)
基于RS-SVM模型的滑坡易發(fā)性評價因子選擇方法研究
于 憲 煜1,胡 友 健1,牛 瑞 卿2
(1.中國地質(zhì)大學(xué)(武漢)信息工程學(xué)院,湖北 武漢 430074;2.中國地質(zhì)大學(xué)(武漢)地球物理與空間信息學(xué)院,湖北 武漢 430074)
為提高滑坡易發(fā)性評價的精度和準確性,利用粗糙集理論和支持向量機模型進行滑坡易發(fā)性評價因子選擇。以三峽庫區(qū)秭歸到巴東段為研究區(qū),首先通過相關(guān)分析和主成分變換對初始滑坡評價因子進行篩減與合并,將剩余的評價因子分為控制因素和影響因素,采用粗糙集理論分別對其進行屬性約簡,生成核因子集。然后,利用核因子集對支持向量機模型進行訓(xùn)練和預(yù)測,得到滑坡易發(fā)性評價結(jié)果,其預(yù)測精度和曲線下面積分別為76.9%和0.939。最后,將兩種傳統(tǒng)的對所有滑坡評價因子一同進行篩選的方法用于該研究區(qū)的滑坡易發(fā)性評價,并將傳統(tǒng)方法與該方法的評價結(jié)果進行比較,結(jié)果表明,該文所提出的滑坡評價因子選擇方法的精度和準確性均優(yōu)于傳統(tǒng)方法。
滑坡易發(fā)性評價;評價因子篩選;粗糙集理論;支持向量機
滑坡是一種典型的地質(zhì)災(zāi)害,具有分布地區(qū)廣、發(fā)生頻率高、運動速度快和災(zāi)害損失大等特點,嚴重危害人民的生命與財產(chǎn)安全[1,2]??茖W(xué)、準確、有效地進行滑坡災(zāi)害的預(yù)測預(yù)報,對于防災(zāi)減災(zāi)具有十分重要的意義[3]?;碌囊装l(fā)性評價是一種比較有效的滑坡災(zāi)害預(yù)測方法。
已有學(xué)者采用不同方法進行了滑坡易發(fā)性評價。韓國Lee等將人工神經(jīng)網(wǎng)絡(luò)模型(Artificial Neural Networks,ANN)引入滑坡易發(fā)性評價體系,發(fā)展了滑坡易發(fā)性評價技術(shù)[4];Lee等利用邏輯回歸模型(Logistic Regression,LR)進行滑坡易發(fā)性評價[5-8];Yao等將支持向量機模型(Support Vector Machine,SVM)應(yīng)用到滑坡易發(fā)性評價中,均取得了較好效果[9-12]。
環(huán)境因素并不是一個整體,可將其分為控制因素(靜態(tài)因素)和影響因素(動態(tài)因素)兩大類[13,14]:控制因素是對滑坡的發(fā)生起控制作用的地質(zhì)和地貌因素,控制著滑坡發(fā)生的區(qū)域地質(zhì)環(huán)境、可能的規(guī)模和滑坡類型等,這些因素在長時間內(nèi)是基本穩(wěn)定的;影響因素是對滑坡發(fā)生起影響作用的外部因素,其作用會影響滑坡災(zāi)害發(fā)生的時間,是動態(tài)變化的??刂埔蛩睾陀绊懸蛩匕ǖ匦蔚孛?、地質(zhì)、水文、降雨、人類工程活動等多方面的數(shù)據(jù),甚至對于某些特殊的研究區(qū)域和研究目的,滑坡體上樹木的種類、平均直徑、密度、樹齡[15]及地面峰值加速度[16]等在滑坡研究中不常見的因素也作為參與模型構(gòu)建的因子出現(xiàn)。因此,如何科學(xué)、合理地確定對滑坡發(fā)生起決定性作用的影響因子集,是一個非常棘手的問題,也是在許多研究中沒有提及的問題[17]。
為提高滑坡易發(fā)性評價結(jié)果的精度和準確性,本文基于粗糙集理論(Rough Set,RS)和支持向量機模型進行滑坡易發(fā)性評價因子選擇。以三峽庫區(qū)秭歸到巴東段為研究區(qū),首先利用ArcGIS、SAGA GIS及ENVI軟件從遙感影像和數(shù)字高程模型中獲得初始滑坡評價因子,在利用相關(guān)性分析和主成分變換對因子進行篩減和合并后,將剩余的評價因子分為控制因素和影響因素兩大類。然后,采用粗糙集理論對其分別屬性約簡,生成核因子集。最后,運用支持向量機模型對篩選出來的核因子集進行訓(xùn)練和預(yù)測,得到區(qū)域滑坡易發(fā)性評價結(jié)果,并將本文提出的環(huán)境因素篩選方法與傳統(tǒng)的篩選方法進行比較。
1.1 粗糙集
RS理論是一種能夠有效分析和處理不確定、不一致和不完整信息與知識的數(shù)學(xué)工具。在RS理論中,一個知識系統(tǒng)可以表示為[18]:
IS=(U,A,V,f)
(1)
考慮屬性的子集。每個?B∈A都在U中產(chǎn)生一個不可分辨關(guān)系,定義為:
Ind(B)={(xi,xj)|(xi,xj)∈U2,?b∈B(b(xi)=b(xj))}
(2)
其中,b(xi)表示對象xi中b的屬性值。如果(xi,xj)∈Ind(B),則對象xi和xj被認為關(guān)于屬性集A的子集B是不可分辨的。關(guān)于Ind(B)的等價類稱為B的基本集,對于?xi∈U,Ind(B)的等價類可以表示為[xi]Ind(B)。
對于任意對象集合的X?U,屬性集B?A,則X關(guān)于B的下近似BX,是所有真包含于X的B基本集的并,表示為:
BX={xi∈U|[xi]Ind(B)?X}
(3)
(4)
則X的邊界區(qū)域可以定義為:
(5)
如果Bnd(X)≠0,可以認為子集是不可定義集,即粗糙集(RS),否則子集就是可定義集。屬性約簡和核屬性集是RS理論的兩個基本概念,一個核約簡屬性集是集合A中的屬性最小集,并且能夠得到和全體屬性集一樣的目標分類結(jié)果。
1.2 支持向量機模型
SVM是一種機器學(xué)習方法[19],其重要應(yīng)用之一就是用來分類。假設(shè)一個線性可分離的訓(xùn)練向量xi(i=1,2,…,n)包含了兩類yi=±1,那么SVM的目的就是尋找一個n-維超平面使得這兩類盡可能分開并且有最大的分類間隔。這個n-維超平面可以簡化表示為:
(6)
式中:‖w‖是w的2-范數(shù),b是用來增加間距使得超平面不會穿過原點,xi是超平面上的點,w是垂直于超平面的向量。
在引入非負的拉格朗日乘數(shù)λi后,其成本函數(shù)可以定義為:
(7)
(8)
2.1 研究區(qū)概況
研究區(qū)位于長江三峽庫區(qū)境內(nèi),包括巴東和秭歸縣,總長度約55km,地理坐標為110°18′~110°52′E,30°01′~30°56′N,面積約446km2,其地理位置如圖1所示(見封2)。該地區(qū)處于中國地形三大階梯中的第二階梯向第三階梯的過渡區(qū)域,是川東褶皺與鄂西山地地區(qū)的交匯處,其地貌主要特征為中低山和侵蝕峽谷。境內(nèi)主要山脈是大巴山和巫山余脈,高程80~2 000m。氣候?qū)賮啛釒Т箨懶约撅L型氣候,雨量充沛,月均降雨量為100~150mm,年均降雨量為1 100mm,降雨主要集中在春季和夏季,在這兩個季節(jié)月均降雨量可達200~300mm[20]。區(qū)內(nèi)基巖由前震旦紀的準晶質(zhì)巖組成,有3條主要的斷層和斷裂帶。第1條位于黃陵背斜的西南,是北北西-南南東走向的仙女山斷層;第2條是北北東-南南西走向的九畹溪斷層;第3條是穿過秭歸盆地且與九畹溪斷層有相似走向的???香爐坪斷裂帶[21]。
2.2 數(shù)據(jù)源
本研究中,利用Landsat8衛(wèi)星影像數(shù)據(jù)計算植被指數(shù)、濕度指數(shù)和建筑指數(shù);用1∶5萬比例尺地形圖提取地形地貌及水體等信息;用1∶5萬地質(zhì)圖獲取地層巖性和斷層信息;利用降雨和地震數(shù)據(jù)獲得年均降雨量和地震震級數(shù)據(jù);用歷史滑坡存檔資料和野外調(diào)查資料進行滑坡解譯與滑坡空間定位。
研究區(qū)內(nèi)共有滑坡202處,總面積為23.4km2,占整個研究區(qū)面積的5.89%,其中最大的滑坡是范家坪滑坡,位于長江右岸,面積達1.51km2;最小的滑坡是葵花街滑坡,面積為2 068.8m2。
3.1 評價因子的選取
利用ArcGIS、SAGAGIS以及ENVI等軟件從遙感影像及分辨率為30m的數(shù)字高程模型中共提取58個初始評價因子,其中有23個地形地貌類因子(坡向、高程、平面曲率、剖面曲率、斜坡形態(tài)、坡度、地形粗糙指數(shù)、地形表面凸率、地形表面紋理、地形位置指數(shù)、地形地貌分類、匯聚指數(shù)、截面曲率、一般曲率、縱向曲率、切向曲率、最大曲率、最小曲率、中坡位置、總體曲率、坡長、坡高和谷深);3個地質(zhì)因子(距斷層距離、巖性及斜坡結(jié)構(gòu));13個水文因子(流域面積、流域坡度、渠網(wǎng)基礎(chǔ)等級、流路長度、流寬、坡長系數(shù)、Melton崎嶇系數(shù)、匯流動力指數(shù)、基于低地的地形分類指數(shù)、渠網(wǎng)垂直距離、地形濕度指數(shù)、流線曲率及距河網(wǎng)距離);17個土地覆蓋因子(歸一化植被指數(shù)、歸一化植被含水指數(shù)、簡單比值指數(shù)、差異植被指數(shù)、大氣阻抗植被指數(shù)、轉(zhuǎn)換植被指數(shù)、綠色植被指數(shù)、植被覆蓋度、歸一化水體指數(shù)、改進的歸一化水體指數(shù)、歸一化水分指數(shù)、比值水分指數(shù)-1,比值水分指數(shù)-2,纓帽變換濕度指數(shù)、增強水體指數(shù)、改進的歸一化建筑指數(shù)及城市土地利用指數(shù))。此外,還有研究區(qū)的年平均降雨量因子以及地震活動因子。
3.2 劃分模型計算單元和選擇模型訓(xùn)練樣本集
模型計算單元的劃分方式對模型的建立和模型精度影響很大,一般可分為柵格單元、地形單元、唯一條件單元、斜坡單元和地貌單元[22]。本文采用柵格單元作為模型的計算單元,由于所用的Landsat8遙感影像數(shù)據(jù)的空間分辨率為30m,故以30m×30m作為一個柵格單元,將所有獲取的評價因子重采樣為30m。這樣,將研究區(qū)劃分為439 646個模型計算單元,其中滑坡有25 897個模型計算單元。
在樣本選擇中,采用移動窗口采樣規(guī)則可在一定程度上消除由于空間位置導(dǎo)致的因子空間相關(guān)性。按照3×3窗口(90m×90m)對滑坡區(qū)域進行樣本點采樣,共得到3 197個滑坡樣本點。由于采用SVM模型在模型訓(xùn)練時對訓(xùn)練樣本集的樣本均衡性有嚴格要求,因此,將滑坡區(qū)域以100m做緩沖區(qū),其以外的研究區(qū)作為非滑坡區(qū)域,在非滑坡區(qū)域內(nèi)隨機選擇和滑坡樣本數(shù)相同的3 197個點作為非滑坡樣本點。最后,將滑坡樣本點和非滑坡樣本點合并成最終的訓(xùn)練樣本集。
3.3 評價因子的篩選
在上述58個初始評價因子中,因子之間存在一定的相關(guān)性,需要對其進行相關(guān)性分析和處理,以消除冗余。首先通過相關(guān)性分析,將地形地貌因子中的切線曲率、地形粗糙指數(shù)、流域坡度、流域面積、流路長度、基于低地的地形分類指數(shù)、地形地貌分類和匯聚指數(shù)共8個因子去掉。由于在地形地貌因子中出現(xiàn)了一個由7個因子組成的因子組合,其中的每個因子都與其他6個因子存在較高的相關(guān)性,故再通過主成分分析,將坡面曲率、地形位置指數(shù)、截面曲率、一般曲率、縱向曲率、最大曲率和最小曲率這7個因子轉(zhuǎn)換成曲率綜合第一到第七主成分(Curvature_PCA1到Curvature_PCA7),選擇第一到第三主成分作為新的評價因子(包含原始7個因子92.74%的信息)。在17個土地覆蓋因子中,植被指數(shù)之間、水體指數(shù)之間和建筑指數(shù)之間有很高的相關(guān)性,也通過主成分分析,將其轉(zhuǎn)換成植被綜合(PCA_VI1到PCA_VI8)、水體綜合(PCA_WI1到PCA_WI7)以及建筑綜合(PCA_BI1,PCA_BI2),挑選這3個綜合指數(shù)的第一主成分(分別占各自指數(shù)總信息的93.7%,92.22%和98.75%)作為新的評價因子。對于13個水文因子,由于不存在由多個具有較高相關(guān)性的因子組成的因子組合,故未進行主成分分析,而是從相關(guān)性較高的因子中直接刪除流域面積、流域坡度、流路長度、低地地形分類指數(shù)這4個因子,達到消除相關(guān)性的目的。
經(jīng)過上述步驟,還剩余32個評價因子。采用如下3種不同方法分別進行因子篩選,以便對其篩選結(jié)果進行比較。第1種方法為常規(guī)做法,將這32個評價因子輸入到Rosetta軟件中得到最終的核因子集。第2種方法是將控制因素和影響因素分開,分別獲得核因子集并合并為最終評價因子。第3種方法是在常規(guī)做法中,通過調(diào)整閾值來擴充核因子集中的因子數(shù)量,使其與第2種方法獲取的評價因子個數(shù)相同(經(jīng)過反復(fù)實驗和計算,在Rosetta軟件中將閾值調(diào)整為0.45即可)。本文將這3種方法分別稱為基于默認閾值和傳統(tǒng)因子篩選方法的RS-SVM模型(DT_12,對應(yīng)第1種方法)、基于變化閾值和傳統(tǒng)因子篩選方法的RS-SVM模型(T0.45_20,對應(yīng)第3種方法)和基于默認閾值與本文提出的對滑坡控制因素和影響因素分別約簡后再合并的因子篩選方法的RS-SVM模型(DS_20,對應(yīng)第2種方法)。三種方法最終所選取的因子如表1所列。
從表1可見,通過上述3種方法獲取的核因子集,無論是在因子的數(shù)量上還是在因子本身的選擇上都不盡相同。DT_12中獲取了12個因子作為核因子集,而T0.45_20和DS_20都獲取了20個因子作為核因子集;T0.45_20因為是DT_12閾值調(diào)整后的結(jié)果,所以T0.45_20不僅包含了DT_12的所有因子,還將一部分DT_12中刪減掉的因子加入了核因子集中,但是與DS_20相比,差異非常明顯:在DT_12中,傳統(tǒng)的被認為與滑坡相關(guān)性較強的因子如坡度、地形表面紋理、距河網(wǎng)距離等因子都被剔除在外,雖然在T0.45_20中將這些因子又加入了核因子集中,但是仍然有許多與滑坡有較強相關(guān)性的因子沒有被考慮在內(nèi),如斜坡形態(tài)、巖性、地震活動、年平均降雨量等,這些因子都在DS_20中得到了體現(xiàn)。出現(xiàn)這種現(xiàn)象,是由于控制因素的因子和影響因素的因子之間存在著量綱以及屬性等多方面的差異,將這兩類因子放在一起進行核因子集的篩選,有可能造成不同類別因子在核因子集篩選中的不均衡性,造成重要的滑坡評價因子的缺失,從而影響滑坡易發(fā)性評價結(jié)果的準確性。
表1 三種不同方法最終選擇的影響因子Table 1 The influence factors selected by the three different methods
3.4 SVM模型參數(shù)計算和滑坡易發(fā)性評價
將前述3種方法選擇的核因子集提取到訓(xùn)練樣本集中,并利用這3個訓(xùn)練樣本集分別對SVM模型進行訓(xùn)練,從而得到與這3種方法對應(yīng)的SVM模型參數(shù)。然后,將已經(jīng)訓(xùn)練好的SVM模型對研究區(qū)內(nèi)所有的計算單元進行預(yù)測。由于選擇的SVM模型的計算結(jié)果除了分類結(jié)果之外,還同時輸出屬于各分類結(jié)果的概率值。最后,利用ArcGIS軟件結(jié)合概率值生成滑坡易發(fā)性評價結(jié)果,即滑坡敏感性制圖(Landslide Susceptibility Mapping,LSM)。
通過模型計算,可得到DT_12、T0.45_20和DS_20這3種方法的滑坡敏感性制圖。為了增加滑坡敏感性制圖的可讀性,并且評價這3種方法的預(yù)測準確性,利用自然斷點法將連續(xù)型的滑坡敏感性指數(shù)分成5個離散型的分類值,分別對應(yīng)不易發(fā)區(qū)、低易發(fā)區(qū)、中易發(fā)區(qū)、高易發(fā)區(qū)和極高易發(fā)區(qū),從而得到滑坡敏感性區(qū)劃圖(圖2,見封2),各區(qū)所占面積比見表2。其中,DT_12的極高易發(fā)區(qū)占滑坡面積的28%,T0.45_20的極高易發(fā)區(qū)占滑坡面積的52.5%,DS_20的極高易發(fā)區(qū)占滑坡面積的53.4%。雖然在極高易發(fā)區(qū)的區(qū)間中,本文提出的方法(DS_20)略遜于以0.45為閾值的傳統(tǒng)因子篩選方法(T0.45_20),但如果將高易發(fā)區(qū)和極高易發(fā)區(qū)作為危險區(qū)來考慮,DS_20的危險區(qū)占滑坡面積的76.9%,而T0.45_20的危險區(qū)僅占滑坡面積的72.8%。
表2 基于自然斷點法的滑坡敏感性區(qū)劃各分區(qū)所占研究區(qū)面積和滑坡面積比例Table 2 The ratio of the area of each division to the total study area and landslide area
利用滑坡敏感性區(qū)劃驗證了模型的預(yù)測精度,再利用ROC曲線(Receiver Operating Characteristic Curve)檢驗?zāi)P偷念A(yù)測性能。ROC曲線是反映敏感性和特異性連續(xù)變量的綜合指標,并用構(gòu)圖法揭示敏感性和特異性的相互關(guān)系。在ROC曲線上,最靠近坐標圖左上方的點為敏感性和特異性均較高的臨界值。將DT_12、T0.45_20和DS_20這3種滑坡預(yù)測模型的滑坡敏感性預(yù)測值和已發(fā)生滑坡的真實值聯(lián)合繪制出ROC曲線(圖3),并求得曲線下的面積AUC(Area Under the Curve)(表3)。從圖3可見,DS_20的曲線在ROC曲線圖中更接近左上角,而T0.45_20的曲線與左上角靠近程度要稍次于前者,DT_20與左上角距離最遠。同時,表3顯示,DS_20的AUC值為0.939,稍優(yōu)于T0.45_20的AUC值(0.932),但是前兩者的結(jié)果都要好于DT_12的AUC值(0.912)。所以,在模型預(yù)測性能方面,本文提出的方法也優(yōu)于其他兩種方法。
從研究區(qū)內(nèi)部分區(qū)域的滑坡分布來看,三種方法計算生成的滑坡敏感性制圖結(jié)果都能得到滑坡的大致空間位置,但是DS_20無論是從滑坡空間范圍預(yù)測的準確性上還是非滑坡區(qū)域的誤分率上都要比T0.45_20和DT_12好得多。特別是在位于巴東縣城以東的長江右岸區(qū)域,在歷史資料和野外踏勘中均沒有滑坡的發(fā)生或者可能生成滑坡的區(qū)域,這與DS_20的預(yù)測結(jié)果相符,而T0.45_20和DT_12卻均在此處預(yù)測有大面積的高易發(fā)區(qū)和極高易發(fā)區(qū),與實際情況不符。由此可見,本文提出的方法在模型預(yù)測的實際檢驗中也要優(yōu)于其他兩種方法。
圖3 DT_12、T0 45_20和DS_20三種方法的ROC曲線Fig.3 The ROC curves of the three methods
表3 曲線下面積Table 3 Area under the curve
注:a 在非參數(shù)假設(shè)下;b 零假設(shè):實面積= 0.5。
傳統(tǒng)的滑坡因子篩選方法沒有將滑坡影響因素分為控制因素和影響因素分別進行篩選,而是將這兩類因子放在一起進行核因子集的篩選,由于控制因子與影響因子之間存在著量綱以及屬性等多方面的差異,就存在不同類別的因子在核因子集篩選中的不均衡性,可能造成重要滑坡評價因子的缺失,從而影響滑坡易發(fā)性評價結(jié)果的精度和準確性。本文首先通過相關(guān)性分析和主成分變換將初始滑坡評價因子進行篩減和合并之后,將剩余的滑坡影響因素分為控制因素和影響因素兩大類,再利用粗糙集理論分別對控制因素和影響因素進行屬性約簡,得到相應(yīng)的核因子集。然后,運用支持向量機模型對篩選出來的核因子集進行訓(xùn)練和預(yù)測,得到滑坡易發(fā)性評價結(jié)果。這樣,不僅消除了原始因子中的冗余因子,而且通過篩選能夠得到對滑坡的發(fā)生起到重要作用的因子集,因而可以提高滑坡易發(fā)性評價結(jié)果的精度和準確性。實驗和實際驗證結(jié)果均表明,本文提出的滑坡易發(fā)性評價因子選擇方法的預(yù)測精度和準確性均優(yōu)于傳統(tǒng)方法,具有較好的實用價值。
[1] 陳劍,楊志法,劉衢秋.滑坡的易滑度分區(qū)及概率預(yù)報模式[J].巖石力學(xué)與工程學(xué)報,2005,24(13): 2392-2396.
[2] 戴福初,李軍.暴雨滑坡泥石流的研究進展與趨向[J].地理研究,1998,17(增):117-124.
[3] 牛瑞卿,彭令,葉潤青,等.基于粗糙集的支持向量機滑坡易發(fā)性評價[J].吉林大學(xué)學(xué)報(地球科學(xué)版),2012(2):430-439.
[4] LEE S,RYU J H,MIN K,et al.Landslide susceptibility analysis using GIS and artificial neural network[J].Earth Surface Processes and Landforms,2003,28:1361-1376.
[5] LEE S,MIN K.Statistical analysis of landslide susceptibility at Yongin,Korea[J].Environmental Geology,2001,40:1095-1113.
[6] DAI F C,LEE C F.Landslide characteristics and slope instability modeling using GIS Lantau Island,Hong Kong[J].Geomorphology,2002,42:213-238.
[7] OHLMACHER C G,DAVIS C J.Using multiple regression and GIS technology to predict landslide hazard in northeast Kansas,USA[J].Engineering Geology,2003,69:331-343.
[8] AYALEW L,YAMAGISHI H.The application of GIS-based logistic regression for landslide susceptibility mapping in the Kakuda-Yahiko Mountains,Central Japan[J].Geomorphology,2005,65:15-31.
[9] YAO X,THAM L,DA F C.Landslide susceptibility mapping based on Support Vector Machine:A case study on natural slopes of Hong Kong,China[J].Geomorphology,2008,101(4):572-582.
[10] MARJANOVI M,KOVA EVI M,BAJAT B,et al.Landslide susceptibility assessment using SVM machine learning algorithm[J].Engineering Geology,2011,123(3):225-234.
[11] BALLABIO C,STERLACCHINI S.Support vector machines for landslide susceptibility mapping:The Staffora river basin case study,Italy[J].Mathematical Geosciences,2012,44(1):47-70.
[12] XU C,DAI F C,XU X W,et al.GIS-based support vector machine modeling of earthquake-triggered landslide susceptibility in the Jianjiang River watershed,China[J].Geomorphology,2012,145:70-80.
[13] 晏同珍,楊安順,方云.滑坡學(xué)[M].武漢:中國地質(zhì)大出版社,2000.
[14] 殷坤龍,張桂榮,陳麗霞,等.滑坡災(zāi)害風險分析[M].北京:科學(xué)出版社,2010.
[15] LEE S,SONG K Y,OH H J,et al.Detection of landslides using web-based aerial photographs and landslide susceptibility mapping using geospatial analysis[J].International Journal of Remote Sensing,2012,33(16):4937-4966.
[16] LIU L,XU C,XU X,et al.Interactive statistical analysis of predisposing factors for earthquake-triggered landslides:A case study of the 2013 Lushan,China Ms7.0 earthquake[J].Environmental Earth Sciences,2015,73(8):4729-4738.
[17] 汪華斌,吳樹仁,汪微波.滑坡災(zāi)害空間智能預(yù)測展望[J].地質(zhì)科技情報,2008,27(2):17-20.
[18] PAWLAK Z L A.Rough sets[J].International Journal of Computer & Information Sciences,1982,11(5):341-356.
[19] VAPNIK V.The Nature of Statistical Learning Theory[M].Springer Science & Business Media,2013.
[20] HE K Q,LI X R,YAN X Q,et al.The landslides in the Three Gorges Reservoir Region,China and the effects of water storage and rain on their stability[J].Environmental Geology,2008,55(1):55-63.
[21] LIU J G,MASON P J,CLERICI N,et al.Landslide hazard assessment in the Three Gorges area of the Yangtze river using ASTER imagery:Zigui-Badong[J].Geomorphology,2004,61(1):171-187.
[22] GUZZETTI F,CARRARA A,CARDINALI M,et al.Landslide hazard evaluation:A review of current techniques and their application in a multi-scale study,Central Italy[J].Geomorphology,1999,31(1):181-216.
Research on the Method to Select Landslide Susceptibility Evaluation Factors Based on RS-SVM Model
YU Xian-yu1,HU You-jian1,NIU Rui-qing2
(1.FacultyofInformationEngineering,ChinaUniversityofGeosciences,Wuhan430074;2.InstituteofGeophysicsandGeomatics,ChinaUniversityofGeosciences,Wuhan430074,China)
The evaluation of regional landslide susceptibility is very important for the medium and long-term prediction and forecast of the landslide hazard.Whether the evaluation results are in line with the actual situation depends on the scientific and reasonable determination of evaluation factors.In order to improve the precision and accuracy of evaluation result,this paper proposed a method to select evaluation factors of landslide susceptibility based on Rough Set theory (RS) and Support Vector Machine model (SVM).Zigui to Badong section in the Three Gorges Reservoir Area is used as a study area.Firstly,the original evaluation factors obtained from remote sensing image and digital elevation model are screened and combined by correlation analysis and Principal Components Analysis (PCA).The remaining evaluation factors were divided into control factors and influence factors,and attribute reduction is carried out on the control factors and the influencing factors by RS respectively to generate core factor set.Then,SVM model is used to train and predict the core factor set selected to get the results of the regional landslide susceptibility evaluation,the precision and accuracy of which are 76.9% and 0.939 respectively.In order to make a comparison between the proposed method to select valuation factor and those traditional ones which screen all environmental factors at the same time,the existing two traditional methods are also used for the landslide susceptibility evaluation in this study area,and the precision and accuracy of which are 53.6%,0.912 and 72.8%,0.932 respectively.The results show that the proposed method to select landslide susceptibility evaluation factors in this paper is better than the traditional methods.
landslide susceptibility evaluation;evaluation factor selection;rough set theory;support vector machine
2015-12-18;
2016-02-12
國家863項目“重大工程地質(zhì)災(zāi)害快速監(jiān)測與評估”(2012AA121303)
于憲煜(1987-),男,博士研究生,主要研究方向為地質(zhì)災(zāi)害監(jiān)測與預(yù)測。E-mail:yuxianyu1987@126.com
10.3969/j.issn.1672-0504.2016.03.005
P642.22
A
1672-0504(2016)03-0023-06