楊 碩,李德?tīng)I(yíng),嚴(yán)亮軒,黃 元,王明哲
(中國(guó)地質(zhì)大學(xué)(武漢)工程學(xué)院,湖北 武漢 430074)
我國(guó)重慶長(zhǎng)江支流烏江流域地形陡峻,地質(zhì)環(huán)境復(fù)雜,是滑坡災(zāi)害高發(fā)區(qū)。重慶烏江河谷地區(qū)受河流底蝕作用,深切基巖,河谷緊束,在烏江河谷兩岸形成高陡岸坡,滑坡地質(zhì)災(zāi)害沿河谷地帶多發(fā)。該地區(qū)滑坡多沿烏江河谷地帶的高陡岸坡呈條帶狀分布,對(duì)河谷地區(qū)的居民區(qū)構(gòu)成了嚴(yán)重威脅。因此,研究烏江河谷地區(qū)高陡岸坡滑坡地質(zhì)災(zāi)害的發(fā)育特征,并開(kāi)展滑坡地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià),對(duì)保護(hù)當(dāng)?shù)厣鐣?huì)經(jīng)濟(jì)發(fā)展具有重要意義。
滑坡地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià)是從空間尺度對(duì)滑坡發(fā)生的可能性進(jìn)行預(yù)測(cè),能有效支持國(guó)土空間規(guī)劃。目前,國(guó)內(nèi)外學(xué)者廣泛采用的滑坡地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià)模型大致可以分為啟發(fā)式模型、確定性模型和數(shù)理統(tǒng)計(jì)模型。其中,啟發(fā)式模型主要依靠專(zhuān)家的專(zhuān)業(yè)知識(shí)和經(jīng)驗(yàn)建立滑坡地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià)模型,其缺點(diǎn)是存在較大的主觀(guān)性;確定性模型主要考慮滑坡物理力學(xué)過(guò)程,多通過(guò)計(jì)算災(zāi)害體的穩(wěn)定性系數(shù)來(lái)進(jìn)行滑坡地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià),常用的模型有無(wú)限斜坡模型,但該模型多需要確定地下水水位和滑帶土強(qiáng)度參數(shù),難以適用于大區(qū)域滑坡地質(zhì)災(zāi)害易發(fā)性區(qū)劃;數(shù)理統(tǒng)計(jì)模型以工程地質(zhì)類(lèi)比法為基礎(chǔ),常用的模型有信息量模型、證據(jù)權(quán)法等。隨著人工智能算法的不斷成熟與發(fā)展,基于機(jī)器學(xué)習(xí)的滑坡地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià)模型的研究日趨活躍,常用的有決策樹(shù)模型、支持向量機(jī)模型和神經(jīng)網(wǎng)絡(luò)模型等。這些評(píng)價(jià)模型能較好地適應(yīng)滑坡復(fù)雜的非線(xiàn)性特征,但存在預(yù)測(cè)結(jié)果解釋性較弱或過(guò)度擬合的問(wèn)題。
為了提高模型的預(yù)測(cè)精度,減少過(guò)度擬合的問(wèn)題,以隨機(jī)森林模型為代表的決策樹(shù)集成學(xué)習(xí)方法受到了廣泛的關(guān)注,并在地質(zhì)災(zāi)害領(lǐng)域得到了廣泛應(yīng)用。如Merghadi等以北非米拉盆地為例,比較了基于隨機(jī)森林、梯度提升機(jī)、邏輯回歸、神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)5種滑坡地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià)模型的預(yù)測(cè)能力,結(jié)果發(fā)現(xiàn)隨機(jī)森林模型具有更好的預(yù)測(cè)性能;Goetz等對(duì)比研究了傳統(tǒng)統(tǒng)計(jì)方法和機(jī)器學(xué)習(xí)方法在滑坡地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià)中的預(yù)測(cè)效果,結(jié)果發(fā)現(xiàn)隨機(jī)森林模型具有最佳的預(yù)測(cè)性能;Sun等以重慶市奉節(jié)縣地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià)為例,通過(guò)貝葉斯優(yōu)化算法建立了高精度的地質(zhì)災(zāi)害易發(fā)性隨機(jī)森林評(píng)估模型。
基于上述研究,本文選取重慶烏江龍溪-石朝門(mén)段高陡岸坡為研究區(qū),該區(qū)段滑坡地質(zhì)災(zāi)害密集,提取高程、坡度、斜坡結(jié)構(gòu)、斜坡形態(tài)、沖溝、巖組分類(lèi)、地質(zhì)構(gòu)造和道路評(píng)價(jià)指標(biāo)因子信息,采用隨機(jī)森林模型對(duì)研究區(qū)滑坡地質(zhì)災(zāi)害易發(fā)性進(jìn)行了評(píng)價(jià)與精度分析,并分析了各評(píng)價(jià)指標(biāo)因子的貢獻(xiàn)程度,以為該地區(qū)滑坡地質(zhì)災(zāi)害風(fēng)險(xiǎn)評(píng)估以及未來(lái)該區(qū)域工程建設(shè)和居民選址提供科學(xué)依據(jù)。
k
個(gè)決策樹(shù),每個(gè)決策樹(shù)都有一票投票權(quán)來(lái)選擇最優(yōu)分類(lèi),最后通過(guò)簡(jiǎn)單的表決方式預(yù)測(cè)最終分類(lèi)。采用RF模型進(jìn)行分類(lèi)預(yù)測(cè)的流程如下(見(jiàn)圖1):圖1 隨機(jī)森林(RF)模型分類(lèi)預(yù)測(cè)流程圖
(1) RF模型利用自主采樣法從總樣本里面隨機(jī)有放回地抽取m
個(gè)樣本作為一個(gè)初始訓(xùn)練數(shù)據(jù)集,由于自主采樣法的有放回抽取,在每一個(gè)初始訓(xùn)練集中,仍然有近1/
3的數(shù)據(jù)未被采取,這些數(shù)據(jù)被稱(chēng)為袋外數(shù)據(jù),用來(lái)對(duì)模型性能進(jìn)行評(píng)估。(2) 運(yùn)用上述方法總共抽取k
個(gè)初始訓(xùn)練數(shù)據(jù)集,每個(gè)初始訓(xùn)練數(shù)據(jù)集都會(huì)訓(xùn)練出一個(gè)不剪枝自由生長(zhǎng)的決策樹(shù),形成k
個(gè)分類(lèi)結(jié)果。(3) RF模型的輸出結(jié)果為k
個(gè)決策樹(shù)中平均概率值最高的類(lèi)型,其概率值計(jì)算公式如下:(1)
式中:I
為所有分類(lèi)的集合;k
為決策樹(shù)數(shù)量;p
為事件i
發(fā)生的概率;p
為第j
個(gè)決策樹(shù)事件i
發(fā)生的概率;p
為最終選擇的分類(lèi)對(duì)應(yīng)的概率值。本文選取重慶烏江龍溪-石朝門(mén)段高陡岸坡為研究區(qū)。研究區(qū)位于重慶市彭水和武隆兩縣交界處的烏江流域,沿烏江長(zhǎng)約28.34 km,總面積為86 km。該地區(qū)地貌屬構(gòu)造剝蝕深切割中低山,地勢(shì)總體烏江兩岸南北高、中間低,地形陡峻,河谷呈“V”形,烏江水位高程為215 m。研究區(qū)地層從寒武系到第四系均有出露,以志留系和奧陶系為主,巖性主要為粉砂巖、頁(yè)巖、泥巖、灰?guī)r、白云巖。區(qū)內(nèi)主體斷裂與褶皺軸線(xiàn)方向一致,呈北北東向。
根據(jù)野外調(diào)查結(jié)果顯示,滑坡沿烏江兩岸呈帶狀分布,在烏江北岸主要為切層滑坡,南岸主要為順層滑坡和堆積層滑坡。沿烏江高陡岸坡段共發(fā)育滑坡地質(zhì)災(zāi)害30處,其中土質(zhì)滑坡20處、巖質(zhì)滑坡10處,小型滑坡23處、中型滑坡7處。典型的滑坡地質(zhì)災(zāi)害點(diǎn)有西流坨順層巖質(zhì)滑坡和臨江寺土質(zhì)滑坡,見(jiàn)圖3至圖5。
圖2 研究區(qū)地理位置及滑坡分布圖
圖3 研究區(qū)滑坡現(xiàn)場(chǎng)照片
圖4 研究區(qū)滑坡平面圖
圖5 研究區(qū)滑坡剖面圖
基于野外地質(zhì)災(zāi)害調(diào)查與收集的地質(zhì)資料,用于研究區(qū)滑坡地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià)的主要數(shù)據(jù)有:①1∶5萬(wàn)地形圖,用于提取高程、坡度等信息;②1∶5萬(wàn)高谷幅和火爐鋪幅地質(zhì)圖,用于工程地質(zhì)巖組分類(lèi)和構(gòu)造提取;③重慶市彭水縣和武隆縣1∶10萬(wàn)滑坡地質(zhì)災(zāi)害分布和滑坡地質(zhì)災(zāi)害易發(fā)性分區(qū)圖;④1∶5萬(wàn)GF-2遙感影像滑坡地質(zhì)災(zāi)害解譯數(shù)據(jù);⑤對(duì)研究區(qū)進(jìn)行了1∶5萬(wàn)滑坡地質(zhì)災(zāi)害風(fēng)險(xiǎn)調(diào)查以及利用光學(xué)影像對(duì)滑坡地質(zhì)災(zāi)害進(jìn)行了早期識(shí)別,查明了研究區(qū)有30處滑坡,并建立了滑坡地質(zhì)災(zāi)害數(shù)據(jù)庫(kù)。
滑坡發(fā)生受坡體本身的基礎(chǔ)地質(zhì)條件和外界誘發(fā)因素所控制。根據(jù)研究區(qū)滑坡地質(zhì)災(zāi)害發(fā)育的特征和地質(zhì)環(huán)境條件,初步選取8個(gè)滑坡地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià)指標(biāo)因子進(jìn)行分析,具體為高程、坡度、巖組分類(lèi)、斜坡結(jié)構(gòu)、斜坡形態(tài)、沖溝、地質(zhì)構(gòu)造和道路。本文采用10 m×10 m的柵格,將研究區(qū)共劃分為859 280個(gè)柵格。研究區(qū)高程分為200~420 m、420~640 m、640~900 m、900~1 391 m;坡度分為0°~10°、10°~25°、25°~35°、35°~45°、>45°;斜坡結(jié)構(gòu)分為順向坡、順斜坡、橫向坡、逆斜坡、逆向坡;斜坡形態(tài)根據(jù)剖面曲率分為凸形坡、平直坡、凹形坡;沖溝的緩沖距離分為0~100 m、100~200 m、200~300 m、>300 m;地質(zhì)構(gòu)造的緩沖距離分為0~250 m、250~500 m、500~750 m、750~1 000 m、>1 000 m;道路的緩沖距離根據(jù)災(zāi)害體大小和可能的運(yùn)動(dòng)距離取值,將其分為0~100 m、100~200 m、200~300 m,>300 m。此外,研究區(qū)工程地質(zhì)巖組分為4大類(lèi)7小類(lèi):①第四系松散巖組(Ⅰ),主要為殘坡積、沖洪積、崩坡積碎塊石、砂礫和黏性土;②層狀碎屑巖巖組(Ⅱ),可分為3小類(lèi),即較軟-軟質(zhì)薄層-中厚層狀泥巖、頁(yè)巖巖組(Ⅱ),較軟-較堅(jiān)硬中厚層狀泥質(zhì)粉砂巖、粉砂質(zhì)泥巖巖組(Ⅱ),堅(jiān)硬-較堅(jiān)硬中厚層-厚層狀粉砂巖、石英粉砂巖、細(xì)砂巖巖組(Ⅱ);③層狀碳酸鹽巖巖組(Ⅲ)可分為2小類(lèi),即較堅(jiān)硬中厚層狀含泥灰?guī)r、泥灰?guī)r、夾泥質(zhì)條帶灰?guī)r、巖溶化灰?guī)r及白云巖巖組(Ⅲ),堅(jiān)硬中厚層-巨厚層狀灰?guī)r、微晶灰?guī)r、生物碎屑灰?guī)r、灰質(zhì)白云巖巖組(Ⅲ);④層狀碳酸鹽巖夾碎屑巖組(Ⅳ),主要為軟硬相間灰?guī)r夾泥巖、頁(yè)巖巖組。
各評(píng)價(jià)指標(biāo)因子的具體分類(lèi),詳見(jiàn)圖6。
圖6 研究區(qū)滑坡地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià)指標(biāo)因子圖
對(duì)研究區(qū)評(píng)價(jià)指標(biāo)因子進(jìn)行數(shù)據(jù)處理,得到由8個(gè)評(píng)價(jià)指標(biāo)因子組成的矩陣A
,并對(duì)其進(jìn)行Pearson相關(guān)性分析,其分析結(jié)果見(jiàn)表1。表1 研究區(qū)滑坡地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià)指標(biāo)因子的Pearson相關(guān)系數(shù)矩陣表
由表1可知,研究區(qū)高程與道路評(píng)價(jià)指標(biāo)因子的相關(guān)系數(shù)為0.446>0.3,說(shuō)明兩者之間的相關(guān)性較高。由于道路工程中產(chǎn)生的切坡是該地區(qū)滑坡地質(zhì)災(zāi)害誘發(fā)的重要因素,因此剔除高程評(píng)價(jià)指標(biāo)因子,利用剩余的7個(gè)評(píng)價(jià)指標(biāo)因子建立研究區(qū)滑坡地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià)指標(biāo)體系。
B
。在矩陣B
中隨機(jī)選取70%的樣本數(shù)據(jù)構(gòu)建訓(xùn)練數(shù)據(jù)集,剩下的30%樣本數(shù)據(jù)構(gòu)建測(cè)試數(shù)據(jù)集,應(yīng)用SPSS Modeler 18中的RF模型對(duì)訓(xùn)練數(shù)據(jù)集進(jìn)行訓(xùn)練和建模,并對(duì)全區(qū)域滑坡地質(zhì)災(zāi)害易發(fā)性進(jìn)行評(píng)價(jià),最后利用測(cè)試數(shù)據(jù)集對(duì)模型精度進(jìn)行檢驗(yàn)。3.3.1 滑坡地質(zhì)災(zāi)害易發(fā)性分區(qū)
通過(guò)RF模型計(jì)算出研究區(qū)內(nèi)所有柵格的滑坡發(fā)生概率,并基于K均值聚類(lèi)模型,將研究區(qū)劃分為5個(gè)滑坡易發(fā)區(qū),即極低易發(fā)區(qū)(0,0.16]、低易發(fā)區(qū)(0.16,0.45]、中易發(fā)區(qū)(0.45,0.69]、高易發(fā)區(qū)(0.69,0.87]、極高易發(fā)區(qū)(0.87,1],進(jìn)而得出研究區(qū)滑坡地質(zhì)災(zāi)害易發(fā)性分區(qū)圖(見(jiàn)圖7),再對(duì)研究區(qū)滑坡地質(zhì)災(zāi)害易發(fā)性進(jìn)行分區(qū)統(tǒng)計(jì)(見(jiàn)圖8),最后通過(guò)RF模型得到研究區(qū)滑坡地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià)指標(biāo)因子的貢獻(xiàn)程度雷達(dá)圖,見(jiàn)圖9。
圖7 研究區(qū)滑坡地質(zhì)災(zāi)害易發(fā)性分區(qū)圖
圖8 研究區(qū)滑坡地質(zhì)災(zāi)害易發(fā)性分區(qū)統(tǒng)計(jì)
圖9 研究區(qū)滑坡地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià)指標(biāo)因子的貢獻(xiàn)程度雷達(dá)圖
根據(jù)上述研究區(qū)滑坡地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià)結(jié)果,可分析得出研究區(qū)滑坡地質(zhì)災(zāi)害發(fā)育具有以下分布特征:
(1) 研究區(qū)滑坡極高和高易發(fā)區(qū)主要分布于烏江北岸的共和村以西沿線(xiàn),烏江南岸的青龍咀至木棕坪一帶和銀廠(chǎng)村一帶,其占研究區(qū)總面積的3.33%,其中滑坡極高和高易發(fā)區(qū)的面積占已知滑坡總面積的94.12%,其他區(qū)域滑坡分布較少(見(jiàn)圖8)。
(2) 斜坡物質(zhì)和斜坡結(jié)構(gòu)對(duì)研究區(qū)滑坡地質(zhì)災(zāi)害的發(fā)生起主要作用(見(jiàn)圖9),滑坡極高和高易發(fā)區(qū)主要分布在志留系的泥巖、頁(yè)巖、泥質(zhì)粉砂巖層位中,其次為奧陶系泥質(zhì)灰?guī)r層位中;研究區(qū)滑坡極高和高易發(fā)區(qū)主要分布在順向坡和順斜坡中。
3.3.2 模型預(yù)測(cè)精度評(píng)估
本文采用混淆矩陣和ROC曲線(xiàn)對(duì)RF模型的預(yù)測(cè)精度進(jìn)行評(píng)估。
(1) 混淆矩陣:由于滑坡樣本和非滑坡樣本數(shù)目的極度不平衡,僅采用統(tǒng)計(jì)方法來(lái)衡量預(yù)測(cè)模型判斷滑坡和非滑坡的準(zhǔn)確度,不能評(píng)估該模型的適用性。因此,本文采用混淆矩陣對(duì)RF模型的預(yù)測(cè)精度進(jìn)行評(píng)估,得到研究區(qū)RF模型測(cè)試數(shù)據(jù)集的混合矩陣,見(jiàn)表2。
表2 研究區(qū)隨機(jī)森林模型測(cè)試數(shù)據(jù)集的混淆矩陣
由表2可知,測(cè)試數(shù)據(jù)集中模型正確分類(lèi)樣本數(shù)為226 212個(gè),而測(cè)試數(shù)據(jù)總樣本數(shù)為253 746個(gè),可得到RF模型預(yù)測(cè)的準(zhǔn)確率(ACC值)為0.89(ACC指模型正確分類(lèi)樣本個(gè)數(shù)占總樣本個(gè)數(shù)的比值),表明RF模型的預(yù)測(cè)精度較高。
(2) ROC曲線(xiàn):整個(gè)研究區(qū)隨機(jī)RF模型的ROC曲線(xiàn)見(jiàn)圖10。AUC(Area Under Curve)被定義為ROC曲線(xiàn)下的面積,取值范圍在0.5~1之間,AUC值越大,表明模型的預(yù)測(cè)精度越高。
圖10 研究區(qū)隨機(jī)森林模型的ROC曲線(xiàn)和AUC值
由圖10可見(jiàn),RF模型的AUC值為0.975,表明應(yīng)用RF模型對(duì)研究區(qū)滑坡地質(zhì)災(zāi)害易發(fā)性進(jìn)行預(yù)測(cè)的精度較高。
本文以重慶烏江龍溪-石朝門(mén)段高陡岸坡為研究區(qū),基于隨機(jī)森林模型開(kāi)展了研究區(qū)滑坡地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià),得到如下結(jié)論:
(1) 根據(jù)滑坡地質(zhì)災(zāi)害現(xiàn)場(chǎng)調(diào)查結(jié)果,研究區(qū)94.12%的滑坡分布在極高和高易發(fā)區(qū),表明隨機(jī)森林模型的預(yù)測(cè)效果好。在評(píng)價(jià)指標(biāo)因子中,斜坡物質(zhì)和斜坡結(jié)構(gòu)是影響研究區(qū)滑坡地質(zhì)災(zāi)害發(fā)育的最主要因素。
(2) 通過(guò)混淆矩陣和ROC曲線(xiàn)對(duì)隨機(jī)森林模型的預(yù)測(cè)精度進(jìn)行評(píng)估,結(jié)果表明:隨機(jī)森林模型預(yù)測(cè)的準(zhǔn)確率(ACC值)為0.89,AUC值為0.975,說(shuō)明隨機(jī)森林模型評(píng)價(jià)方法的精確度較高,是一種滑坡地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià)的可靠方法。