馬嘯,王念秦,李曉抗,嚴(yán)冬, 李嘉琳
(1.陜西工程勘察研究院有限公司,陜西 西安 710068;2.西安科技大學(xué)地質(zhì)與環(huán)境學(xué)院,陜西 西安 710054;3.陜西乾和實(shí)業(yè)有限公司,陜西 西安 710000)
陜西是中國地質(zhì)災(zāi)害最為嚴(yán)重的省份之一,據(jù)《陜西統(tǒng)計(jì)年鑒》:2012~2020年陜西省因地質(zhì)災(zāi)害傷亡293人,而滑坡是造成人員傷亡最為主要的災(zāi)害類型之一。近年來,滑坡易發(fā)性評價(jià)已經(jīng)成為滑坡災(zāi)害風(fēng)險(xiǎn)管控和監(jiān)測預(yù)警的重要手段,眾多科研人員致力于此項(xiàng)研究,并取得眾多成果。
滑坡災(zāi)害易發(fā)性評價(jià)方法主要分為定性評價(jià)、半定量評價(jià)和定量評價(jià)3種類型。其中,定量評價(jià)是滑坡易發(fā)性區(qū)劃最為主要的方法。隨著GIS技術(shù)的快速發(fā)展,將其應(yīng)用于滑坡災(zāi)害易發(fā)性評價(jià)領(lǐng)域?qū)⒏觾?yōu)化了定量評價(jià)的準(zhǔn)確性。易發(fā)性區(qū)劃評價(jià)方法主要有:層次分析法、信息量模型、頻率比、邏輯回歸、隨機(jī)森林、支持向量機(jī)和人工神經(jīng)網(wǎng)絡(luò)等。目前,將2種或多種模型進(jìn)行對比與耦合來進(jìn)行滑坡易發(fā)性評價(jià)已成為國內(nèi)外學(xué)者研究的熱點(diǎn)。Chen Wei 等(2018)以太白縣為例,將隨機(jī)森林與確定性因子進(jìn)行耦合,得出RF-CF模型,結(jié)果表明,該模型的精度優(yōu)于單一的模型; J. Cao等(2019)采用邏輯回歸和隨機(jī)森林模型對川西山區(qū)的滑坡災(zāi)害易發(fā)性進(jìn)行了評價(jià),得出隨機(jī)森林模型預(yù)測準(zhǔn)確率高于邏輯回歸模型。郭子正等(2020)基于加權(quán)頻率比、邏輯回歸和確定系數(shù)法,以萬州區(qū)為例進(jìn)行滑坡易發(fā)性評價(jià),得出加權(quán)頻率比的預(yù)測準(zhǔn)確性更高。邱維蓉等(2020)通過LR、SVM、BP、RF 4種模型的對比與分析,得出RF模型優(yōu)于其他3種模型。
結(jié)合前人研究得出:將隨機(jī)森林(RF)模型應(yīng)用于滑坡易發(fā)性評價(jià)具有較高的準(zhǔn)確性與實(shí)用性,而頻率比(FR)模型更加能反映滑坡的發(fā)育規(guī)律。因此,結(jié)合2種模型的優(yōu)越性,將其進(jìn)行耦合應(yīng)用于滑坡易發(fā)性評價(jià)中可提高滑坡災(zāi)害易發(fā)性預(yù)測的準(zhǔn)確性。筆者以略陽縣域?yàn)檠芯繀^(qū),首先將頻率比(FR)、隨機(jī)森林(RF)模型應(yīng)用于滑坡災(zāi)害的易發(fā)性評價(jià)中,得出各模型縣域滑坡易發(fā)性分區(qū)圖及其準(zhǔn)確性;其次以頻率比替代各分級(jí)的評價(jià)因子數(shù)值,代入隨機(jī)森林模型中進(jìn)行2種方法的耦合,得出耦合模型下縣域滑坡易發(fā)性分區(qū)圖及其準(zhǔn)確性。通過對比各模型準(zhǔn)確性,得出研究結(jié)果。研究結(jié)果對滑坡易發(fā)性評價(jià)模型的優(yōu)化具有借鑒意義,也可為相關(guān)部門進(jìn)行滑坡防治提供理論依據(jù)。
略陽縣位于陜西省漢中市西北部,地理坐標(biāo)為東經(jīng)105°42′~ 106°31′,北緯33°07′~33°38′。縣域平面圖略呈長方形,總面積為2 831 km2。屬暖溫帶濕潤季風(fēng)氣候,多年平均降雨量為860 mm,且降雨量分配不均,呈由西北向東南遞增之勢,多年平均氣溫為13.2℃。該區(qū)高程分布范圍較廣,為559~2 399 m,地勢南北高、中間低。屬于秦巴山區(qū)地貌類型。區(qū)內(nèi)有嘉陵江和漢江2條水系,其中嘉陵江水系較大支流有10條,漢江水系較大支流有8條。區(qū)內(nèi)構(gòu)造斷裂發(fā)育,主要有褒城斷裂、茶店斷裂、艾葉-官亭斷裂、勉縣-陽平關(guān)斷裂。據(jù)統(tǒng)計(jì),略陽縣已發(fā)生地質(zhì)災(zāi)害及隱患點(diǎn)共482處,其中,滑坡445處,占研究區(qū)內(nèi)地質(zhì)災(zāi)害總數(shù)92%。研究區(qū)地理位置及滑坡災(zāi)害點(diǎn)分布見圖1。
圖1 研究區(qū)地理位置及滑坡災(zāi)害點(diǎn)分布圖Fig.1 Geographical location and landslide points distribution in research area
隨機(jī)森林 (Random Forest Model,簡稱 RF) 是將多棵決策樹進(jìn)行集成的算法。隨機(jī)森林算法能有效解決二分類問題,準(zhǔn)確率高,使大數(shù)據(jù)、高維特征數(shù)據(jù)能夠有效地運(yùn)行,并且能夠得到各評價(jià)因子的權(quán)重。其方法是:從數(shù)據(jù)集(N)中隨機(jī)選擇k個(gè)特征(列),共m個(gè)特征(其中k小于等于m);然后根據(jù)這k個(gè)特征建立決策樹;重復(fù)n次,這k個(gè)特性經(jīng)過不同隨機(jī)組合建立起來n棵決策樹,對每個(gè)決策樹都傳遞隨機(jī)變量來預(yù)測結(jié)果,得到高票數(shù)的預(yù)測目標(biāo)作為隨機(jī)森林算法的最終預(yù)測。
頻率比模型(frequency ratio model,簡稱FR)是一種基于數(shù)理統(tǒng)計(jì)的預(yù)測方法,F(xiàn)R值的大小表征各級(jí)評價(jià)因子對滑坡災(zāi)害發(fā)生的重要程度,即FR>1表明該分級(jí)區(qū)間有利于滑坡發(fā)生,F(xiàn)R<1表現(xiàn)該分級(jí)區(qū)間對滑坡的發(fā)生不利。其公式如下:
(1)
式中:ni為各分級(jí)區(qū)間內(nèi)滑坡面積,N為研究區(qū)滑坡總面積,si為分類面積,S為研究區(qū)總面積。
基礎(chǔ)數(shù)據(jù)獲取方式為:①略陽縣30 m×30 m的數(shù)字高程模型(DEM),從國家地理空間數(shù)據(jù)云下載(http://www.gscloud.cn),并提取坡向、曲率、坡度等評價(jià)因子。②略陽縣氣象站點(diǎn)降水量數(shù)據(jù)。③1∶50 000地質(zhì)圖、路網(wǎng)圖、河流分布圖在91衛(wèi)圖下載。④陜西省地質(zhì)災(zāi)害點(diǎn)編錄數(shù)據(jù)庫。
影響滑坡形成的因素很多,根據(jù)研究區(qū)內(nèi)滑坡分布特征及形成條件,選取高程(A)、坡向(B)、坡度(C)、地層(D)、地表粗糙度(E)、距斷層距離(F)、曲率(G)、距道路距離(H)、地形濕度指數(shù)(I)、距河流距離(J)、降雨量(K)、地形起伏度(L)、高程變異系數(shù)(M)和地表切割深度(N)14個(gè)因素作為評價(jià)因子。
借助ArcGIS軟件,將研究區(qū)劃分為3 122 182個(gè)30 m×30 m的柵格。各評價(jià)指標(biāo)的獲取方法為:①坡向、坡度、曲率通過ArcGIS工具箱中的表面分析從 DEM 中提取。 ②地形起伏度、地表粗糙度、地形濕度指數(shù)、地表切割深度和高程變異系數(shù)通過空間分析里的柵格計(jì)算器對 DEM 處理得出。③河流通過對河流分布圖矢量化獲得。④道路通過對路網(wǎng)圖進(jìn)行矢量化,使用歐氏距離分析工具得到。⑤斷層、地層巖性通過對1∶50 000地質(zhì)圖矢量化得到。
進(jìn)行滑坡評價(jià)模型預(yù)測時(shí),要求各評價(jià)因子間相關(guān)性小,因而有必要進(jìn)行評價(jià)因子的相關(guān)性分析。采取Spearma法得出各因子間的相關(guān)性系數(shù)(R),R值能反應(yīng)各評價(jià)指標(biāo)的相關(guān)性。通常將相關(guān)性分為微弱相關(guān)、低度相關(guān)、顯著相關(guān)、高度相關(guān)和線性相關(guān),所對應(yīng)的R取值范圍分別為|R|<0.3、0.3≤|R|<0.5、0.5≤|R|<0.8、0.8≤|R|<1、|R|=1。其公式如下:
(2)
將研究區(qū)的各評價(jià)因子的數(shù)據(jù)導(dǎo)入到SPSS軟件中的相關(guān)性分析工具中,得到各因子相關(guān)系數(shù)(表1)。將相關(guān)性系數(shù)大于0.3的評價(jià)因子剔除掉,根據(jù)結(jié)果可知地形起伏度、高程變異系數(shù)、地表切割深度與坡度、地表粗糙度相關(guān)性高。因此,將這3項(xiàng)評價(jià)指標(biāo)剔除,最終得到11項(xiàng)評價(jià)因子進(jìn)行易發(fā)性評價(jià)。
表1 因子相關(guān)性系數(shù)表Tab.1 Correlation coefficient between factors
滑坡相對點(diǎn)密度(LRPD)能反應(yīng)災(zāi)害點(diǎn)與各評價(jià)因子的空間分布關(guān)系,得到不同分級(jí)狀態(tài)的因子對滑坡發(fā)育的影響。LRPD值越大,則表明該分級(jí)區(qū)間是滑坡發(fā)育的有利因素,各評價(jià)因子分級(jí)的LRPD值見表2。其計(jì)算公式為:
(3)
式(3)中,mi表示因子某一分級(jí)內(nèi)滑坡點(diǎn)個(gè)數(shù);M表示研究區(qū)滑坡點(diǎn)總數(shù);ni表示因子對應(yīng)分級(jí)所占面積;N表示研究區(qū)總面積。
表2 各評價(jià)因子分級(jí)標(biāo)準(zhǔn)、頻率比值及LRPD值表Tab.2 Grading standard, frequency ratio and LRPD value of each evaluation factor
3.4.1 地形地貌因子
選取的地形地貌因子為高程、坡度、坡向、曲率和地表粗糙度。采用自然間斷點(diǎn)分類方法將高程劃分為5級(jí)(圖2a)(表2),在高程559~924 m內(nèi)LRPD值最大,為0.383,而在高程>1 375 m范圍內(nèi)滑坡發(fā)育較少,僅占全部災(zāi)害點(diǎn)的2.47%,說明滑坡主要發(fā)生在高程中低區(qū)間的邊坡上,原因是在此高程范圍內(nèi)的人工活動(dòng)強(qiáng)烈、多進(jìn)行切坡建房和道路建設(shè);加上地表水及降雨的侵蝕作用,易形成地質(zhì)災(zāi)害。按照方位角等間距將坡向劃分為9級(jí)(圖2b)(表2),其中-1~0表示水平坡,即平地,在157.5~202.5 m(正南)區(qū)間內(nèi)災(zāi)害點(diǎn)最多,LRPD值為0.262,反映了正南朝向的邊坡更容易受到光照、降雨等自然作用的影響,進(jìn)而形成滑坡災(zāi)害。以相等間隔法將坡度分為5級(jí)(圖2c)(表2),在坡度0°~30°內(nèi)滑坡集中發(fā)育,坡度在30°以上的災(zāi)害點(diǎn)僅11處,在0°~10°LRPD值最大,為0.260,說明中低坡度的邊坡對滑坡發(fā)育影響最大。其原因?yàn)樵谥械推露忍幦斯せ顒?dòng)強(qiáng)烈,人為切坡建房及公路修建導(dǎo)致巖土體局部地區(qū)坡度較陡,而圖層所提取出來的坡度為30×30 m地區(qū)的整體平均坡度,導(dǎo)致坡度值變小,但能反映出在中-低坡度為形成滑坡災(zāi)害的因素,而在平均坡度較大的地區(qū),很少有人居住,僅在人工活動(dòng)的地區(qū)構(gòu)成災(zāi)害,因此,在坡度較大的區(qū)域滑坡災(zāi)害較少。曲率的大小代表邊坡的類型,當(dāng)曲率小于0時(shí)為凸型坡,曲率大于1時(shí)為凹型坡,曲率等于1時(shí)為直線坡(圖2d)(表2)?;聻?zāi)害點(diǎn)多發(fā)生于凸坡處,占總災(zāi)害點(diǎn)的73.3%,LRPD值為0.181。地表粗糙度表示該地區(qū)抗侵蝕能力,指數(shù)越大,則抗侵蝕能力越強(qiáng)(圖2e)(表2)。滑坡多發(fā)生在地表粗糙度指數(shù)較小的地貌類型處,在1~1.07分級(jí)處,LRPD值最大,表明該分級(jí)狀態(tài)為滑坡的發(fā)育有利狀態(tài)。
3.4.2 地質(zhì)因子
地質(zhì)因子包括地層巖性、距斷層距離。地層巖性作為內(nèi)在因子對滑坡發(fā)育起重要作用,是由于不同的巖性物理力學(xué)參數(shù)差異大,直接影響邊坡的穩(wěn)定性(圖2f)(表2)。研究區(qū)共10套地層,而滑坡災(zāi)害點(diǎn)主要分布在泥盆紀(jì)、志留紀(jì)地層,占災(zāi)害點(diǎn)總數(shù)的62.2%。在此2處地層的LRPD值分別為0.24、0.119,表明上述2套地層對滑坡發(fā)育有利。以相等間隔法將距斷層距離以1 000 m劃分為5級(jí)(圖2g)(表1)?;聻?zāi)害點(diǎn)主要分布在0~1 000 m內(nèi),LRPD值為0.139,表明滑坡常發(fā)育在斷層構(gòu)造活動(dòng)帶和巖土體結(jié)構(gòu)軟弱處。
3.4.3 道路因子
略陽縣進(jìn)行了大量的道路建設(shè),破壞了原始地形、地貌,進(jìn)而促進(jìn)了滑坡發(fā)育。以等間隔法進(jìn)行分級(jí),將距道路的距離以500 m等分(圖2h)(表2)。災(zāi)害點(diǎn)主要分布在0~500 m內(nèi),LRPD值為0.291。表明距離道路越近,人類活動(dòng)對滑坡的發(fā)育影響越大。
3.4.4 水文因子
水文因素是滑坡形成、致災(zāi)的重要影響因素之一。水文因子包括降雨量、距河流的距離和地形濕度指數(shù)。降雨能降低巖土體的物理力學(xué)性質(zhì),使剪切強(qiáng)度下降,摩擦系數(shù)變小,使巖土體結(jié)構(gòu)面軟化,是影響滑坡發(fā)生的最重要的因子,依據(jù)自然間斷點(diǎn)將其分為5級(jí)(圖2i)(表2)。降雨量在828~867 mm時(shí),LRPD值最大,為0.156;河流的下蝕和側(cè)蝕作用容易侵蝕其周圍的巖土體,破壞邊坡的穩(wěn)定性,進(jìn)而為滑坡災(zāi)害的形成提供了條件;依據(jù)500 m等間隔法將距河流的距離分為5級(jí)(圖2j)(表2)。災(zāi)害點(diǎn)分布數(shù)量與距河流距離成反比,LRPD值隨距河流距離的增加而遞減。地形濕度指數(shù)表示在某一流域內(nèi)的土壤干濕狀態(tài)(圖2k)(表2);依據(jù)自然間斷點(diǎn)法將評價(jià)因子分為5級(jí),LRPD值在各分級(jí)中依次遞增,表明地形濕度指數(shù)越大越有利于滑坡災(zāi)害的發(fā)生。
滑坡預(yù)測可看作一個(gè)二元分類的過程,在進(jìn)行滑坡的易發(fā)性評級(jí)時(shí),需要建立等量的正數(shù)據(jù)集(滑坡)、負(fù)數(shù)據(jù)集(非滑坡)。借助R軟件中的隨機(jī)選取功能,將災(zāi)害點(diǎn)數(shù)據(jù)集和研究區(qū)數(shù)據(jù)集導(dǎo)入;從445個(gè)滑坡災(zāi)害點(diǎn)隨機(jī)選取312(70%)個(gè)正數(shù)據(jù)集與從研究區(qū)非滑坡災(zāi)害點(diǎn)隨機(jī)選取312個(gè)負(fù)數(shù)據(jù)集作為訓(xùn)練集;將滑坡災(zāi)害點(diǎn)剩余的133(30%)個(gè)正數(shù)據(jù)集和研究區(qū)非滑坡災(zāi)害點(diǎn)數(shù)據(jù)集隨機(jī)選取的133個(gè)負(fù)數(shù)據(jù)集作為測試集。將訓(xùn)練集代入RF模型進(jìn)行訓(xùn)練,再用測試集對RF模型進(jìn)行預(yù)測,得到模型的準(zhǔn)確率為85.36%;然后將訓(xùn)練模型用于整個(gè)研究區(qū),得到全區(qū)的易發(fā)性指數(shù)值,易發(fā)性指數(shù)值越高,則表明越容易發(fā)生滑坡災(zāi)害。自然斷點(diǎn)法的原理為:通過聚類計(jì)算方式使得各分組內(nèi)的相似性保持最大化,組外的相異性也最大化。將其應(yīng)用于滑坡的易發(fā)性分級(jí),通過國內(nèi)外學(xué)者的研究,分類5級(jí)有較為優(yōu)良的效果,能表現(xiàn)出滑坡易發(fā)性分組之間的差異性與組內(nèi)的相似性。因此,將滑坡的易發(fā)性等級(jí)分為極低易發(fā)區(qū)、低易發(fā)區(qū)、中易發(fā)區(qū)、高易發(fā)區(qū)和極高易發(fā)區(qū)5類(圖3)。
圖2 評價(jià)因子分層圖Fig.2 Evaluation factor classification
根據(jù)FR模型方法,得出各級(jí)評價(jià)因子的頻率比值,計(jì)算結(jié)果見表2。因子頻率比值越大,表明滑坡易發(fā)性程度越高;最后運(yùn)用 ArcGIS 柵格計(jì)算器工具將所有評價(jià)因子進(jìn)行疊加,按照自然間斷點(diǎn)法將其分為極低、低、中、高和極高易發(fā)區(qū)5類,得到基于FR模型的略陽縣滑坡易發(fā)性評價(jià)區(qū)劃圖(圖4)。
圖3 基于RF模型的滑坡易發(fā)性區(qū)劃圖Fig.3 Landslide susceptibility map based on RF
圖4 基于FR模型的滑坡易發(fā)性區(qū)劃圖Fig.4 Landslide susceptibility map based on FR
在滑坡易發(fā)性評價(jià)過程中,由于各級(jí)評價(jià)因子數(shù)據(jù)量大,而且數(shù)據(jù)類型各異,進(jìn)而影響評價(jià)模型的準(zhǔn)確性。先將各級(jí)評價(jià)因子數(shù)值采用各分級(jí)的頻率比替代,則能提高數(shù)據(jù)分布的規(guī)律性;其次把評價(jià)因子的數(shù)值替換為在該分級(jí)的頻率比,代入RF模型進(jìn)行計(jì)算,得到基于FR-RF模型的易發(fā)性指數(shù),模型的準(zhǔn)確率為92.83%;將易發(fā)性指數(shù)導(dǎo)入ArcGIS中,得到易發(fā)性分區(qū)圖(圖5),按照自然間斷點(diǎn)法將其分為極低易發(fā)區(qū)、低易發(fā)區(qū)、中易發(fā)區(qū)、高易發(fā)區(qū)和極高易發(fā)區(qū)5類。
圖5 基于FR-RF模型的滑坡易發(fā)性區(qū)劃圖Fig.5 Landslide susceptibility map based on FR-RF
將3種模型的測試樣本集的易發(fā)性指數(shù)值及對應(yīng)的真實(shí)類標(biāo)簽導(dǎo)入SPSS軟件ROC曲線分析工具中進(jìn)行分析,得到3種評價(jià)模型的預(yù)測率曲線(圖6),由圖6可知,F(xiàn)R、RF、RF-FR 3種模型下訓(xùn)練樣本的成功率分別為 0.843、0.901、0.950。其中,RF-FR模型較其他2種模型更好,預(yù)測率比FR、RF模型分別高出0.107、0.049,可見RF-FR模型更適合研究區(qū)滑坡易發(fā)性評價(jià)。
圖6 預(yù)測率曲線圖Fig.6 Graph of success rate
采用ArcGIS多值提取致點(diǎn)工具提取各模型災(zāi)害點(diǎn)的易發(fā)性分級(jí),得到災(zāi)害點(diǎn)在各分級(jí)內(nèi)的比例(表3)。結(jié)果表明,RF-FR模型滑坡災(zāi)害點(diǎn)落在極高易發(fā)區(qū)、高易發(fā)區(qū)的比例為87.45%;RF、FR模型滑坡災(zāi)害點(diǎn)落在極高易發(fā)區(qū)、高易發(fā)區(qū)的比例分別為82.16%、71.56%。說明用RF-FR模型進(jìn)行易發(fā)性評價(jià)有更佳的效果。
表3 各易發(fā)區(qū)災(zāi)害點(diǎn)比例表Tab.3 Percentages of landslide susceptibility
隨機(jī)選取略陽縣70個(gè)滑坡點(diǎn)進(jìn)行實(shí)地調(diào)研,結(jié)果表明,極高、高和中易發(fā)區(qū)內(nèi)分布滑坡點(diǎn)個(gè)數(shù)分別為53、10和7,滑坡點(diǎn)在低易發(fā)區(qū)與極低易發(fā)區(qū)無分布。通過與FR-RF模型中災(zāi)害點(diǎn)比例對比,現(xiàn)場調(diào)查得出的各易發(fā)區(qū)災(zāi)害點(diǎn)比例與其相近,驗(yàn)證了FR-RF模型預(yù)測結(jié)果的準(zhǔn)確性。
(1)根據(jù)Pearson相關(guān)系數(shù)的統(tǒng)計(jì)分析,地形起伏度、高程變異系數(shù)、地表切割深度與坡度的相關(guān)性系數(shù)絕對值分別為0.972、0.822、0.962,呈強(qiáng)相關(guān)性。剔除地形起伏度、高程變異系數(shù)和地表切割深度3項(xiàng)因子。
(2)基于滑坡相對點(diǎn)密度(LRPD)對評價(jià)因子進(jìn)行分析,得出滑坡災(zāi)害點(diǎn)與線狀因子的距離呈負(fù)相關(guān),即距離越近,災(zāi)害點(diǎn)越多;反之,災(zāi)害點(diǎn)越少。
(3)將RF、FR 2種模型進(jìn)行耦合,得到RF-FR模型。以ROC曲線對3種模型精度進(jìn)行檢驗(yàn),結(jié)果表明,RF-FR模型測試樣本的預(yù)測率比RF、FR模型分別提高了10.7%、4.9%,顯示耦合模型優(yōu)于單一模型,且RF-FR模型用于地質(zhì)災(zāi)害易發(fā)性評價(jià)具較高的準(zhǔn)確性與實(shí)用性。
(4)基于FR、RF和RF-FR模型,滑坡災(zāi)害點(diǎn)落在高易發(fā)區(qū)—極高易發(fā)區(qū)所占的比例分別為71.56%、82.16%和87.45%,得出滑坡在高—極高易發(fā)區(qū)發(fā)育較為集中,空間分布呈樹枝狀發(fā)育,主要集中在河流、道路所在區(qū)。