王 倩 ,薛 云,張 維,龍?jiān)兰t,周松林
(1. 湖南城市學(xué)院 市政與測繪工程學(xué)院,湖南 益陽 413000;2. 長沙理工大學(xué) 交通運(yùn)輸工程學(xué)院,長沙 410114;3. 湖南城市學(xué)院設(shè)計(jì)研究院有限公司,湖南 益陽 413000)
滑坡是世界范圍內(nèi)造成經(jīng)濟(jì)損失和人員傷亡最嚴(yán)重的地質(zhì)災(zāi)害之一[1].滑坡易發(fā)性評(píng)價(jià)的目的是識(shí)別出極易發(fā)生滑坡的危險(xiǎn)區(qū)域,減少滑坡的不利影響[2-3].
目前地質(zhì)災(zāi)害危險(xiǎn)性評(píng)價(jià)常采用層次分析[4]、信息量[5-6]、證據(jù)權(quán)重[7-8]、趨勢面分析[9]、模糊數(shù)學(xué)[10]、灰色聚類[11]等方法.這些方法都從不同方面反映了地質(zhì)災(zāi)害危險(xiǎn)性及其影響因素的不確定性,為地質(zhì)災(zāi)害的防治起到了一定的作用.近年來,隨著新理論、新技術(shù)發(fā)展,許多新模型被應(yīng)用于滑坡易發(fā)性評(píng)價(jià)中[12-16].支持向量機(jī)(SVM)是20 世紀(jì)90 年代由Vapnik 提出,建立在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上的一種新型機(jī)器學(xué)習(xí)算法,在滑坡易發(fā)評(píng)價(jià)中有些成功的應(yīng)用[17-21].但 SVM 中參數(shù)和核函數(shù)的選擇對(duì)SVM 的性能有重要影響.為了研究不同參數(shù)及核函數(shù)對(duì) SVM 在滑坡易發(fā)評(píng)價(jià)中的影響,本研究應(yīng)用不同參數(shù)及核函數(shù)的支持向量機(jī)算法進(jìn)行湖南省靖州縣的滑坡易發(fā)性評(píng)價(jià),以期為 SVM 算法成功應(yīng)用到滑坡易發(fā)評(píng)價(jià)提供理論依據(jù).
圖1 靖州縣區(qū)位及滑坡點(diǎn)位
靖州縣位于湖南省西南邊陲(見圖1),懷化市南部,湘、黔兩省交界地區(qū),具體地理位置為111°16′~112°56′E,26°15′~26°47′N 之間,地處云貴高原東緣斜坡的山岳地帶,既多崇山峻嶺,又有丘陵,盆地交錯(cuò),地貌多樣.亞熱帶季風(fēng)濕潤氣候,雨量充沛,四季分明,春夏多雨,秋季少雨.縣內(nèi)年平均降水量1 146.3~1 611.4 mm.境內(nèi)溪河密布,地表水系發(fā)育.其大地構(gòu)造位置為江南地軸雪峰山褶皺隆起帶西南端,呈平緩褶曲和排列整齊的北東向構(gòu)造帶的基本地貌,為洪江―黎平中潮大斷裂的中南部,斷裂發(fā)育.境內(nèi)大面積新構(gòu)造上升運(yùn)動(dòng)和斷裂運(yùn)動(dòng)均有明顯的表現(xiàn).隨著社會(huì)經(jīng)濟(jì)發(fā)展,修建了大量的公路和水利設(shè)施,形成了水庫密布和渠道縱橫,公路四通八達(dá)的局面.
1.2.1 滑坡現(xiàn)狀
滑坡現(xiàn)狀數(shù)據(jù)來源于湖南省地質(zhì)環(huán)境監(jiān)測總站的實(shí)地調(diào)查、衛(wèi)片判譯及滑坡歷史記錄,共發(fā)現(xiàn)滑坡102 處及非滑坡點(diǎn)100 處(見圖1).隨機(jī)用70%數(shù)據(jù)來訓(xùn)練模型,30%數(shù)據(jù)來驗(yàn)證模型.
1.2.2 滑坡影響因子
根據(jù)實(shí)地調(diào)查及綜合分析各影響因子與地質(zhì)災(zāi)害點(diǎn)分布空間位置關(guān)系,本文選取坡度、坡向、高度、河流距離、斷層距離、公路距離、土地利用和人類活動(dòng)強(qiáng)度8 個(gè)地質(zhì)災(zāi)害影響因子作為地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià)指標(biāo).
在地理空間數(shù)據(jù)云下載 DEM(Digital Elevation Model,數(shù)字高程模型),利用DEM 分別提取坡度、高度、坡向等不同條件因子;距河流距離、距道路距離、距斷層距離3 個(gè)因子是分別用 ArcGIS 對(duì)河流、道路、斷層做緩沖,根據(jù)遠(yuǎn)近來分級(jí);利用Landsat8 影像對(duì)研究區(qū)土地覆蓋分類,劃分4 種不同的土地利用類型;利用武漢珞珈燈光數(shù)據(jù),在 ArcGIS 中用自然斷點(diǎn)法將人類活動(dòng)強(qiáng)度劃分為4 個(gè)不同的等級(jí).具體分級(jí)分類結(jié)果見表1 和圖2.
圖2 滑坡影響因子
支持向量機(jī)(SVM)是在統(tǒng)計(jì)學(xué)習(xí)理論的基礎(chǔ)上發(fā)展起來的一種新型機(jī)器學(xué)習(xí)算法.SVM 通過最優(yōu)分類超平面,不但能將2 類樣本正確分開,而且能使 2 類的分類間隔最大,VC 維最小,從而使真實(shí)風(fēng)險(xiǎn)最小.SVM 包括線性支持向量機(jī)和非線性支持向量機(jī).在線性可分的情況下,通過求解一個(gè)約束條件下的極值問題,然后轉(zhuǎn)化成它的對(duì)偶問題,就會(huì)得到簡化的不等式約束極值問題,最終得到最優(yōu)分類函數(shù).而在實(shí)際分類問題中,分類問題往往是非線性的問題,即理想的分類面是非線性的.對(duì)非線性問題,可以通過非線性變換,將非線性問題轉(zhuǎn)化為某個(gè)高維空間中的線性問題,在變換后的高維空間中求其最優(yōu)分類面.支持向量機(jī)通過引入核函數(shù)巧妙地解決了低維輸入空間向高維特征空間映射的問題.常用的核函數(shù)主要有:線性核函數(shù)、多項(xiàng)式核函數(shù)、RBF徑向基函數(shù)及Sigmoid核函數(shù)等.SVM 中有2個(gè)參數(shù)(c和g)對(duì)其性能有重要的影響.c是懲罰系數(shù),是對(duì)誤差的寬容度,c 越大,越不能容忍出現(xiàn)誤差,容易導(dǎo)致過度擬合;反之,容易欠擬合.g 是選擇RBF 函數(shù)作為核函數(shù)后,該函數(shù)自帶的一個(gè)參數(shù),g 越大,支持向量越少,反之越多.支持向量的個(gè)數(shù)影響訓(xùn)練與預(yù)測的速度.
頻率比(Frequency Ratio,F(xiàn)R)是描述災(zāi)點(diǎn)與條件因子間關(guān)系的一種定量分析方法[22],是各級(jí)別災(zāi)點(diǎn)數(shù)百分比與各級(jí)別面積百分比的比值.頻率比分析結(jié)果見表 1.滑坡在坡度 7°~15°類中 FR值最高(4.27),表明在這一類別中發(fā)生滑坡的概率最高,其次是 15°~25°類;在坡向方面,東坡頻率比最高(FR 值為1.60),平坡頻率比最低(0.00);在高程方面,500~800 m 的頻率比最高(1.05),其次是小于500 m(0.98);滑坡與斷層、河流、道路距離的關(guān)系表明,當(dāng)與斷層、河流或道路的距離增大時(shí),滑坡發(fā)生的概率就越小;滑坡發(fā)生與地貌頻數(shù)比表明,植被區(qū)的FR 最高值為1.09,居民地為最低值(0.26);在人類活動(dòng)強(qiáng)度方面,活動(dòng)弱的地方頻率值最高(1.02),在強(qiáng)和較強(qiáng)地區(qū)為0.00.
表1 基于頻率比模型的滑坡調(diào)節(jié)因子與滑坡的空間關(guān)系
1)支持向量機(jī)輸入.通過 ENVI5.3,將各影響因子圖層組合成1 個(gè)組合圖;在組合圖上,將先前選擇的102 處滑坡點(diǎn)及100 處非滑坡點(diǎn)進(jìn)行標(biāo)注;隨機(jī)用 70%數(shù)據(jù)來訓(xùn)練模型,30%數(shù)據(jù)來驗(yàn)證模型,并導(dǎo)出4 個(gè)txt 文件,即滑坡點(diǎn)訓(xùn)練樣本、滑坡點(diǎn)測試樣本、非滑坡點(diǎn)訓(xùn)練樣本及非滑坡點(diǎn)測試樣本;將4 個(gè)txt 文件和組合圖的txt 文件轉(zhuǎn)換為SVM 支持的格式并用于SVM 的輸入.
2)支持向量機(jī)的參數(shù)(c 和g)及核函數(shù).這些參數(shù)影響 SVM 的性能,可分別用遺傳算法、灰狼算法、模擬退火算法和粒子群算法來優(yōu)化該參數(shù),其中,粒子群優(yōu)化算法尋優(yōu)精度最高(74%),耗時(shí)最少(63.5 s),殘差最小(0.025 0)(見表2).
表2 智能算法參數(shù)優(yōu)化結(jié)果
3)用ENVI5.3 軟件和粒子群算法優(yōu)化后的參數(shù)(c=92.79, g=71.61),訓(xùn)練4 種核函數(shù)分類器模型:線性核函數(shù)分類器(LN-SVM);多項(xiàng)式核函數(shù)分類器(PL-SVM);徑向基函數(shù)分類器(RBF-SVM);Sigmoid 核函數(shù)分類器(SIG-SVM).
圖3 各模型滑坡易發(fā)性指數(shù)
4)通過ArcGIS10.0 軟件,利用訓(xùn)練好的4 個(gè)模型計(jì)算滑坡易發(fā)性指數(shù)(LSI),見圖 3.由圖 3可知,整個(gè)研究區(qū)發(fā)生滑坡的概率為0~1.其中,LN-SVM 支持向量機(jī)為 0.199 6~0.757 5;PL-SVM為 0.131 6~0.787 7;RBF-SVM 為 0.144 4~0.779 2;SIG-SVM 為 0.261 3~0.813 1.
5)使用ArcGIS 中自然間斷點(diǎn)分類方法將LSI值劃分為高、中、低3 個(gè)易發(fā)等級(jí),見圖4.由圖4 可知,LN-SVM 的高、中、低易發(fā)等級(jí)分別占 37.20%,36.13%和 26.67%;PL-SVM 分別占36.74%,36.22%和 27.04%;RBF-SVM 分別占37.14%,36.21%和 26.65%;SIG-SVM 分別占36.49%,35.69%和27.82%.
信息量法由信息理論發(fā)展而來,是一種成熟的統(tǒng)計(jì)預(yù)測方法,其物理意義明確,易建模,實(shí)現(xiàn)方便快捷,在地質(zhì)災(zāi)害評(píng)價(jià)中運(yùn)用廣泛.本文以信息量法與支持向量機(jī)算法對(duì)比來驗(yàn)證算法的優(yōu)劣[23-24].采用接收-運(yùn)行特性曲線(Receiver-Operating Characteristic Curve, ROC)和曲線下面積(Area Under the Curve, AUC)評(píng)價(jià)比較滑坡模型的性能和預(yù)測能力.ROC 曲線是基于敏感性和 1-特異度構(gòu)建的.AUC 從 0.5 到 1.0 不等,AUC越高的模型越好.本文利用SPSS 制作ROC 曲線,將滑坡點(diǎn)與非滑坡點(diǎn)數(shù)據(jù)導(dǎo)入SPSS,再進(jìn)行ROC曲線分析.成功率和預(yù)測率由ROC 曲線得出.成功率由滑坡訓(xùn)練數(shù)據(jù)獲得,見圖5.由圖5 知,LN-SVM,PL-SVM,SIG-SVM 和 RBF-SVM 模型的ROC曲線的AUC值分別為81.53%,82.61%,79.98%和83.12%;信息量法的AUC 值為78.56%.預(yù)測率由滑坡的驗(yàn)證數(shù)據(jù)獲得,見圖 6.由圖 6可知,LN-SVM,PL-SVM,SIG-SVM 和 RBF-SVM模型的 ROC 曲線的 AUC 值分別為 76.89%,77.34%,76.01%和77.87%;信息量法的AUC 值為75.76%.
圖4 各模型滑坡易發(fā)評(píng)價(jià)等級(jí)
圖5 成功率ROC 曲線
圖6 預(yù)測率ROC 曲線
進(jìn)一步的,計(jì)算各滑坡易發(fā)區(qū)面積百分比及滑坡數(shù)目百分比;同時(shí),用面積百分比與數(shù)目百分比的比值計(jì)算滑坡易發(fā)頻率比(FR),見表3.
表3 各模型滑坡易發(fā)區(qū)域與滑坡點(diǎn)的關(guān)系
由表3 可知,4 個(gè)支持向量機(jī)模型的高易發(fā)區(qū)滑坡頻率比都在 1.5 左右,數(shù)值越高,發(fā)生滑坡的概率就越大;中易發(fā)區(qū)滑坡頻率比在 1.1 左右;低易發(fā)區(qū)滑坡頻率比在 0.6 左右,其數(shù)值最低,滑坡發(fā)生的概率最小.
滑坡易發(fā)性評(píng)價(jià)是搞好地質(zhì)災(zāi)害防治工作,為政府部門提供決策的關(guān)鍵手段.本研究將支持向量機(jī)算法應(yīng)用到湖南省靖州縣的滑坡易發(fā)性評(píng)價(jià)中,結(jié)果表明:1)LN-SVM 的高、中、低易發(fā)等級(jí)分別占37.20%,36.13%和26.67%;PL-SVM分別占36.74%,36.22%和27.04%;RBF-SVM 分別占37.14%,36.21%和26.65%;SIG-SVM 分別占36.49%,35.69%和27.82%.2)4 種支持向量機(jī)模型的成功率分別為 83.12%(RBF-SVM),82.61%(PL-SVM),81.53%(LN-SVM)和 79.98%(SIG-SVM);預(yù)測率分別為 77.87%(RBF-SVM),77.34%(PL-SVM),76.89%(LN-SVM)和 76.01%(SIG-SVM),而信量法的成功率和預(yù)測率分別為78.56%和75.76%.由此證明,支持向量機(jī)算法可應(yīng)用于滑坡易發(fā)性評(píng)價(jià).