郭飛,王秀娟,陳璽,王力,謝明娟,李玉,譚建民
(1. 湖北長(zhǎng)江三峽滑坡國(guó)家野外科學(xué)觀測(cè)研究站,湖北 宜昌 443002;2. 三峽大學(xué)土木與建筑學(xué)院,宜昌 443002;3. 中國(guó)地質(zhì)環(huán)境監(jiān)測(cè)院,北京 100081;4. 中國(guó)科學(xué)院新疆生態(tài)與地理研究所,新疆 烏魯木齊 830011;5. 中國(guó)地質(zhì)調(diào)查局武漢地質(zhì)調(diào)查中心(中南地質(zhì)科技創(chuàng)新中心),湖北 武漢 430205)
易發(fā)性評(píng)價(jià)作為滑坡風(fēng)險(xiǎn)評(píng)估的基礎(chǔ)工作,是近些年來(lái)國(guó)內(nèi)外的研究熱點(diǎn),其評(píng)價(jià)結(jié)果也為防災(zāi)減災(zāi)工作提供了參考。目前我國(guó)滑坡易發(fā)性評(píng)價(jià)主要集中于發(fā)育規(guī)模較大的水庫(kù)型滑坡[1?3]、黃土滑坡[4?5]、地震誘發(fā)滑坡[6?7]以及降雨型滑坡[8?9],在易發(fā)性評(píng)價(jià)指標(biāo)、評(píng)價(jià)模型等方面積累了較多經(jīng)驗(yàn)。但由于贛南地區(qū)滑坡災(zāi)害點(diǎn)多、面廣、規(guī)模小,且90%以上的滑坡是因人工切坡導(dǎo)致的,這些滑坡與前述滑坡在規(guī)模、成因機(jī)制等方面存在顯著差異,上述滑坡易發(fā)性評(píng)價(jià)所積累的經(jīng)驗(yàn)并不能完全適用贛南地區(qū)滑坡易發(fā)性評(píng)價(jià),仍需在指標(biāo)體系、評(píng)價(jià)模型等方面進(jìn)一步探索。
彭珂等[10]指出贛州市地質(zhì)災(zāi)害的發(fā)生與該區(qū)地形地貌、地層巖性、巖土體類型及人類工程活動(dòng)呈正相關(guān)關(guān)系。通過(guò)現(xiàn)場(chǎng)調(diào)查,人工切坡和降雨是贛南地區(qū)滑坡災(zāi)害最主要的誘發(fā)因素,贛南于都縣銀坑鎮(zhèn)多以修路切坡為主[11]。目前開展的易發(fā)性評(píng)價(jià)對(duì)小型削方滑坡的指標(biāo)多以距道路距離[12]表征,部分學(xué)者嘗試采用道路空間密度[13]表征,對(duì)于小型削方滑坡的表征指標(biāo)仍需進(jìn)一步探索。
目前,滑坡易發(fā)性評(píng)價(jià)模型主要分為知識(shí)驅(qū)動(dòng)、數(shù)據(jù)驅(qū)動(dòng)和機(jī)制驅(qū)動(dòng)模型三大類。在目前易發(fā)性評(píng)價(jià)中數(shù)據(jù)驅(qū)動(dòng)模型應(yīng)用最為廣泛,常見的數(shù)據(jù)驅(qū)動(dòng)模型包括隨機(jī)森林[13]、信息量(I)[14]、支持向量機(jī)(SVM)[4]、邏輯回歸(LR)[15]、人工神經(jīng)網(wǎng)絡(luò)(ANN)[16]、決策樹(DT)[5]、確定性系數(shù)法(CF)[17]等。這些模型在水庫(kù)型、地震型和降雨型滑坡易發(fā)性評(píng)價(jià)中應(yīng)用較為成熟,而對(duì)于贛南地區(qū)小型削方滑坡易發(fā)性的適用性,仍需進(jìn)一步探索。
文中以贛州于都縣銀坑鎮(zhèn)為例,根據(jù)野外地質(zhì)調(diào)查成果,利用地理探測(cè)器構(gòu)建易發(fā)性評(píng)價(jià)指標(biāo)體系,選取信息量、人工神經(jīng)網(wǎng)絡(luò)、決策樹和邏輯回歸模型開展易發(fā)性評(píng)價(jià),并對(duì)模型精度進(jìn)行驗(yàn)證以分析贛南地區(qū)小型削方滑坡易發(fā)性評(píng)價(jià)模型的適用性。
銀坑鎮(zhèn)位于江西省贛州市于都縣北部,屬典型的亞熱帶季風(fēng)濕潤(rùn)氣候,雨量充沛、四季分明。降雨量多集中于3—6 月,約占全年降水的55.4%。區(qū)內(nèi)多為山地與丘陵,崗地與平原較少,強(qiáng)風(fēng)化巖漿巖、變質(zhì)巖廣泛分布,復(fù)雜的地質(zhì)環(huán)境條件極易產(chǎn)生地質(zhì)災(zāi)害。常見地質(zhì)災(zāi)害類型主要為崩塌、滑坡、泥石流等,主要發(fā)生在5—8 月,尤其是6 月,與當(dāng)?shù)赜昙疚呛希⒋嬖跍笮浴?/p>
根據(jù)現(xiàn)場(chǎng)調(diào)查,區(qū)內(nèi)共有164 處滑坡災(zāi)害點(diǎn)(圖1),滑坡點(diǎn)體積分布為38.5~3 045.0 m3,小于1 000 m3的滑坡占80%以上,多數(shù)為土質(zhì)滑坡,極少數(shù)為巖質(zhì)滑坡。滑坡主要集中于研究區(qū)南部,多發(fā)生在屋后和道路旁,這主要是由建房和修路切坡導(dǎo)致的,其中修路切坡誘發(fā)的滑坡占比較大,人工切坡一般會(huì)形成3~5 m 的陡坡,且鮮有護(hù)面或排水措施,在降雨作用下極易形成滑坡。
圖1 銀坑鎮(zhèn)地理位置以及滑坡點(diǎn)分布圖Fig.1 The distribution of landslides and location of Yinkeng Town,Yudu County
信息量模型是基于信息論的一種統(tǒng)計(jì)方法,通過(guò)熵的變化來(lái)體現(xiàn)易發(fā)性程度[18]。信息量模型考慮了各評(píng)價(jià)因子之間的相關(guān)性,適用于不同比例尺的易發(fā)性評(píng)價(jià)中。該模型是以信息論為理論基礎(chǔ),其基本觀點(diǎn)為將已有地質(zhì)災(zāi)害影響指標(biāo)分類并轉(zhuǎn)化為影響大小的信息量值,進(jìn)而利用信息量的值來(lái)評(píng)價(jià)各指標(biāo)與研究對(duì)象的相關(guān)程度,信息量值越大,則代表越有可能引發(fā)滑坡等地質(zhì)災(zāi)害,其計(jì)算公式為:
式中:I(Y1,x1,x2,···,xn)——各影響指標(biāo)的信息量值;
P(Y,x1,x2,···,xn)——各影響指標(biāo)組合條件下滑坡等地質(zhì)災(zāi)害發(fā)生的概率;
P(Y)——滑坡災(zāi)害發(fā)生概率。
通常情況下,影響滑坡等地質(zhì)災(zāi)害的指標(biāo)種類較多,相對(duì)應(yīng)各指標(biāo)的組合狀態(tài)也比較多,而通常樣本統(tǒng)計(jì)的數(shù)量會(huì)受到限制,故一般情況下可先對(duì)每個(gè)單因素指標(biāo)信息量模型進(jìn)行分步計(jì)算,再進(jìn)行綜合疊加分析,其對(duì)應(yīng)的信息量模型為:
式中:I——研究區(qū)域某指標(biāo)x信息量值;
Ii——研究區(qū)域某指標(biāo)xi信息量值;
Si——指標(biāo)xi所占單元總面積;
——因素xi單元中發(fā)生滑坡災(zāi)害的單元面積之和;
A——區(qū)域內(nèi)單元總面積;
A0——已經(jīng)發(fā)生滑坡災(zāi)害的單元面積之和。
人工神經(jīng)網(wǎng)絡(luò)模型是進(jìn)行分布并行信息處理的一種算法數(shù)學(xué)模型。通過(guò)其自學(xué)習(xí)和訓(xùn)練,建立輸入因子與輸出結(jié)果的關(guān)系,該模型通常用于非線性回歸和分類問(wèn)題[19]。而其中的BP 神經(jīng)網(wǎng)絡(luò)最具有普遍性和代表性,其結(jié)構(gòu)分為輸入層、隱藏層和輸出層,其中輸入層為影響因子,隱藏層為問(wèn)題復(fù)雜性程度,輸出層為結(jié)果[20]。
決策樹是在已知情況發(fā)生概率的基礎(chǔ)下,通過(guò)求取凈現(xiàn)值的期望值大于等于零的概率,來(lái)評(píng)價(jià)項(xiàng)目可行性的一種分析方法。文中采用ID3 算法,該算法通過(guò)熵來(lái)度量信息的不確定度[21]。在信息論中,熵叫做信息量,是來(lái)衡量變量的不確定性的,其表達(dá)式為:
式中:c——?jiǎng)澐值念悇e總數(shù);
pi——各個(gè)分類的概率。
邏輯回歸是一種概率與統(tǒng)計(jì)模型,在易發(fā)性研究中,將影響災(zāi)害發(fā)生的因子作為自變量,災(zāi)害是否發(fā)生(0 為不發(fā)生,1 為發(fā)生)作為二值因變量[15,22]。邏輯回歸的表達(dá)式為:
式中:Logit(P)——指為P做的Logit變化;
P——滑坡發(fā)生的概率;
1?P——滑坡不發(fā)生的概率;
x1,x2,···,xn——各影響因子的值;
ω0,ω1,···,ωn——回歸系數(shù)。
評(píng)價(jià)單元是易發(fā)性評(píng)價(jià)的最小單元,其選取的依據(jù)很大程度上受滑坡的空間尺度、評(píng)價(jià)范圍和資料詳細(xì)程度的影響,文中采用柵格單元來(lái)進(jìn)行易發(fā)性評(píng)價(jià),與其他評(píng)價(jià)單元相比在處理大量空間數(shù)據(jù)疊加上顯得更加便捷。另外,考慮到研究區(qū)內(nèi)滑坡規(guī)模較小,柵格分辨率選用5 m×5 m,研究區(qū)共分為5 518 864 個(gè)柵格單元。
指標(biāo)體系的構(gòu)建對(duì)滑坡易發(fā)性評(píng)價(jià)結(jié)果的合理性起著決定作用[23]。通過(guò)野外地質(zhì)調(diào)查及滑坡災(zāi)害與各評(píng)價(jià)指標(biāo)的相關(guān)性統(tǒng)計(jì)分析,從地形地貌、地層巖性、地質(zhì)構(gòu)造、植被條件等方面初步篩選評(píng)價(jià)指標(biāo),再利用地理探測(cè)器對(duì)上述指標(biāo)進(jìn)行貢獻(xiàn)排序,從而構(gòu)建滑坡易發(fā)性指標(biāo)體系。
地理探測(cè)器是探測(cè)空間分異性以及揭示其背后驅(qū)動(dòng)力的一組統(tǒng)計(jì)學(xué)方法[24]。其核心思想是若某個(gè)自變量對(duì)某個(gè)因變量有重要影響,那么自變量和因變量的空間分布應(yīng)該具有相似性。地理探測(cè)器具有兩大獨(dú)特優(yōu)勢(shì),一是可以探測(cè)數(shù)值型數(shù)據(jù)和定性數(shù)據(jù),二是探測(cè)兩因子交互作用于因變量。地理探測(cè)器通過(guò)分別計(jì)算和比較各單因子q值及兩因子疊加后的q值,可以判斷兩因子是否存在交互作用,以及交互作用的強(qiáng)弱、方向、線性還是非線性等。文中利用地理探測(cè)器的因子探測(cè)器探測(cè)定量(如坡度)和定性(如巖組)數(shù)據(jù),并根據(jù)分異探測(cè)器判斷兩因子的交互作用,從而構(gòu)建易發(fā)性評(píng)價(jià)指標(biāo)體系。
指標(biāo)X對(duì)于其屬性Y的空間分異表達(dá)式q如下:
式中:q——反映空間分異程度,q∈[0,1];
h——變量Y或指標(biāo)X的分層,h=1,2,···,n;
Nh、N——層h和全區(qū)Y的單元數(shù);
SSW、SST——層內(nèi)方差之和和全區(qū)總方差。
q值是指X對(duì)Y發(fā)生的貢獻(xiàn)值,也可將其視為權(quán)重值。q值越大,表示指標(biāo)空間分異性越明顯,自變量指標(biāo)X對(duì)于屬性Y的解釋能力越強(qiáng),反之則越弱。
根據(jù)《贛州市地質(zhì)災(zāi)害防治規(guī)劃(2012—2020)研究報(bào)告》及野外地質(zhì)調(diào)查分析,地形地貌選擇了坡度、坡向、高程變異系數(shù)、地表切割深度、曲率等因子;地質(zhì)條件考慮了巖組、坡體結(jié)構(gòu)、距斷層距離等因子;植被條件選擇了植被覆蓋率這一因子;人類工程活動(dòng),主要考慮研究區(qū)修路切坡是滑坡災(zāi)害最主要的誘發(fā)因素,因此根據(jù)常規(guī)表征方法,選擇了距道路距離這一指標(biāo)進(jìn)行表征。
采用地理探測(cè)器的因子探測(cè)器計(jì)算出上述11 個(gè)評(píng)價(jià)指標(biāo)的q值(表1),從表中可知,坡度、坡體結(jié)構(gòu)、巖組、距道路距離、距斷層距離、植被覆蓋率等6 個(gè)指標(biāo)對(duì)滑坡的貢獻(xiàn)占95%以上,所以選其作為易發(fā)性評(píng)價(jià)指標(biāo)。
表1 地理探測(cè)器得到11 個(gè)指標(biāo)的q值Table 1 The normalized weight values of 11 indicators
(1)坡度:文中以1∶1 萬(wàn)等高線為基礎(chǔ)生成高程TIN 模型,然后利用TIN 轉(zhuǎn)柵格工具以5 m×5 m 為單位生成最終的DEM 模型,最后通過(guò)自然間斷點(diǎn)分級(jí)法將坡度分為5 類:①0°~7°;②7°~17°;③17°~26°;④26°~36°;⑤>36°。通過(guò)坡度與災(zāi)害點(diǎn)疊加圖見圖2(a),可以看出滑坡大多發(fā)生在7°~17°和17°~26°區(qū)間內(nèi),這與人們?cè)诖饲衅陆ǚ亢托蘼访芮邢嚓P(guān)。
(2)坡體結(jié)構(gòu):文中以等高線圖和地層產(chǎn)狀圖繪制坡體結(jié)構(gòu),將其劃分為4 類:①巖質(zhì)-斜向坡;②巖質(zhì)-逆向坡;③巖質(zhì)-順向坡;④碎石土質(zhì)邊坡。通過(guò)坡體結(jié)構(gòu)與災(zāi)害點(diǎn)的疊加圖見圖2(b),可以看出滑坡大多處于巖質(zhì)-順向坡和巖質(zhì)-斜向坡這兩個(gè)分類當(dāng)中,這與滑坡的發(fā)育分布規(guī)律較吻合。
(3)巖組:通過(guò)研究區(qū)域的地質(zhì)圖和結(jié)合災(zāi)害分布規(guī)律,將巖性劃分為8 類:①堅(jiān)硬花崗巖組;②軟硬相間巖組(礫巖、粉砂巖);③堅(jiān)硬巖組(石英礫巖、砂礫巖等);④較軟-較硬巖組(石英礫巖、泥巖等);⑤較硬-較軟巖組(粉砂巖、頁(yè)巖等);⑥較堅(jiān)硬巖組(礫巖、安山巖);⑦較硬-堅(jiān)硬巖組(變質(zhì)砂巖、變質(zhì)粉砂巖等);⑧多層含礫黏土、粉質(zhì)黏土。通過(guò)巖組和災(zāi)害點(diǎn)的疊加圖見圖2(c),分析可知較堅(jiān)硬-堅(jiān)硬的變質(zhì)砂巖、變質(zhì)粉砂巖等巖組中滑坡點(diǎn)較多。
(4)距道路距離:在研究區(qū)內(nèi)以50,100,200,500,大于500 m 劃分緩沖區(qū),得出切坡修路對(duì)于研究區(qū)域的影響區(qū)域。通過(guò)道路與滑坡點(diǎn)的疊加圖見圖2(d),分析可知災(zāi)害點(diǎn)與道路重合度很高。
(5)距斷層距離:在研究區(qū)域內(nèi)以100,200,300,400,500,大于500 m 劃分緩沖區(qū),得出斷層的影響區(qū)域。通過(guò)斷層與滑坡點(diǎn)的疊加圖見圖2(e),分析可知災(zāi)害點(diǎn)與斷層重合度較高。
(6)植被覆蓋率:通過(guò)遙感數(shù)據(jù),并運(yùn)用ENVI 軟件獲取歸一化植被指數(shù)(NDVI),最終在GIS 軟件中通過(guò)自然斷點(diǎn)法將形成的柵格文件劃分為6 類。通過(guò)植被與災(zāi)害點(diǎn)的疊加圖見圖2(f),分析可知災(zāi)害點(diǎn)大多集中在植被覆蓋率較低、低和極低區(qū)域。
圖2 易發(fā)性評(píng)價(jià)指標(biāo)圖Fig.2 The susceptibility evaluation index chart
信息量模型利用信息量法計(jì)算式(2),以銀坑鎮(zhèn)地質(zhì)災(zāi)害野外調(diào)查數(shù)據(jù)為基礎(chǔ),對(duì)6 個(gè)評(píng)價(jià)指標(biāo)的信息量值進(jìn)行計(jì)算,計(jì)算結(jié)果如表2 所示。
表2 評(píng)價(jià)指標(biāo)各自信息量值Table 2 Each information value of evaluation index
通過(guò)對(duì)各評(píng)價(jià)指標(biāo)各自的信息量值和權(quán)重值進(jìn)行分析可以得知距道路距離和工程地質(zhì)巖組兩個(gè)指標(biāo)對(duì)滑坡發(fā)生的影響較大,坡度和坡體結(jié)構(gòu)次之,植被和斷層影響相對(duì)較小。
基于ArcGIS 平臺(tái),利用柵格計(jì)算功能,對(duì)于各評(píng)價(jià)指標(biāo)按各指標(biāo)歸一化的權(quán)重值進(jìn)行疊加,得到易發(fā)性分布圖,參考自然資源部中國(guó)地質(zhì)調(diào)查局編制的《地質(zhì)災(zāi)害風(fēng)險(xiǎn)調(diào)查評(píng)價(jià)編圖技術(shù)要求(1∶50 000)(試行)》,根據(jù)自然斷點(diǎn)法將易發(fā)性分布圖劃分為高、中、低和非易發(fā)區(qū)四級(jí)(圖3)。
根據(jù)圖3 可以看出:高易發(fā)區(qū)主要分布于河背村、謝坑村、三溪村、小莊村、老屋村和龍頭村等地區(qū);中易發(fā)區(qū)主要分布于梅屋村、上謝村和年豐村等地區(qū);低易發(fā)區(qū)主要分布巖前村、松山村、楊河村和窯前村等地區(qū)。人工神經(jīng)網(wǎng)絡(luò)模型和邏輯回歸模型的高易發(fā)區(qū)主要集中在道路兩側(cè)?;曼c(diǎn)在各個(gè)分區(qū)所占比例見表3。
圖3 不同模型下易發(fā)性分區(qū)圖Fig.3 Susceptibility partition chart under different models
從表3 可以看出,各模型得到高、中易發(fā)性面積占比分別為77.6%、76.9%、60.1%和60.6%。其中信息量模型高、中易發(fā)性面積占比最高,且從圖3 可以看出,滑坡點(diǎn)基本分布在高、中易發(fā)性區(qū)。
表3 滑坡點(diǎn)在各個(gè)分區(qū)所占比例Table 3 The proportion of disaster points in each partition
ROC 曲線在易發(fā)性評(píng)價(jià)精度檢測(cè)中被廣泛應(yīng)用,橫坐標(biāo)為假陽(yáng)性率(1-特異性),縱坐標(biāo)為真陽(yáng)性率(即敏感性)。ROC 曲線下的面積即AUC值,AUC評(píng)價(jià)指標(biāo)值越大,則代表模型分類結(jié)果的準(zhǔn)確性越高。銀坑鎮(zhèn)滑坡易發(fā)性評(píng)價(jià)結(jié)果ROC 曲線見圖4,圖中信息量模型的AUC值為0.800,而其他三個(gè)模型的AUC值分別為0.708、0.672 和0.586,說(shuō)明信息量模型具有較高的精度和可靠性。
圖4 各個(gè)模型準(zhǔn)確率曲線圖Fig.4 The accuracy curve of each model
(1)開展贛南地區(qū)小型削方滑坡易發(fā)性評(píng)價(jià)時(shí),信息量模型較人工神經(jīng)網(wǎng)絡(luò)模型、決策樹模型和邏輯回歸模型準(zhǔn)確率更高,適用性較強(qiáng)。
(2)于都縣銀坑鎮(zhèn)高易發(fā)區(qū)主要分布于河背村、謝坑村、三溪村、小莊村、老屋村和龍頭村等地區(qū);中易發(fā)區(qū)主要分布于梅屋村、上謝村和年豐村等地區(qū);低易發(fā)區(qū)和較低易發(fā)區(qū)主要分布巖前村、松山村、楊河村和窯前村等地區(qū)。