毛華銳, 孫小飛, 周穎智
(1. 重慶市規(guī)劃和自然資源信息中心, 重慶 401120; 2. 西南交通大學(xué)地球科學(xué)與環(huán)境工程學(xué)院, 成都 610031; 3. 四川省南充市自然資源與規(guī)劃局, 南充 637000)
中國是山地大國,山地特有的能量梯度在降雨和人為活動的影響下,誘發(fā)了大量的地質(zhì)災(zāi)害,使中國成為世界上地質(zhì)災(zāi)害頻發(fā)且最嚴(yán)重的國家之一[1]。地質(zhì)災(zāi)害的頻發(fā)造成了巨大的人員傷亡、財產(chǎn)損失和生態(tài)破壞,嚴(yán)重威脅山區(qū)人民生命財產(chǎn)與工程建設(shè)安全,制約山區(qū)資源開發(fā)與經(jīng)濟(jì)發(fā)展[2-4]。渝東北是三峽庫區(qū)的核心區(qū)域,也是長江流域地質(zhì)災(zāi)害預(yù)警高度關(guān)注的地區(qū)之一[5]。自蓄水以來,三峽庫區(qū)內(nèi)地質(zhì)災(zāi)害隱患明顯增多,具有“點(diǎn)多、面廣”的特點(diǎn),其中滑坡災(zāi)害尤為發(fā)育[6]。因此,對渝東北三峽庫區(qū)的滑坡預(yù)測成為災(zāi)害管理中亟待解決的問題。
滑坡敏感性制圖是一種減少、減輕未來滑坡造成損失的有效方法。滑坡敏感性可理解為滑坡發(fā)生的空間概率,應(yīng)用適當(dāng)?shù)姆椒ɡL制滑坡敏感性分區(qū)圖,找出滑坡的高發(fā)區(qū),有助于揭示其成因并預(yù)測未來發(fā)生的可能性,從而加強(qiáng)關(guān)注和監(jiān)測以減少滑坡給人類生命財產(chǎn)造成的損失[7]。近年來,遙感和地理信息系統(tǒng)(geographic information system,GIS)技術(shù)為處理大型和復(fù)雜的空間數(shù)據(jù)提供了系統(tǒng)、快速和出色的配置,為大范圍的滑坡敏感性制圖提供了機(jī)會[8]。目前,基于遙感和GIS技術(shù)的機(jī)器學(xué)習(xí)模型已廣泛應(yīng)用于滑坡敏感性制圖。例如,齊信等[9]利用GIS技術(shù)和頻率比繪制了三峽地區(qū)秭歸向斜盆地的滑坡敏感性圖,并通過滑坡敏感性面積累計百分比曲線圖驗(yàn)證了結(jié)果準(zhǔn)確度和可靠性。Sun等[10]基于貝葉斯優(yōu)化算法優(yōu)化超參數(shù),建立了一個效率和、精度更高的隨機(jī)森林滑坡敏感性評估模型,并對模型進(jìn)行了可靠性評價和應(yīng)用驗(yàn)證。高克昌等[11]利用信息量模型評估了萬州地區(qū)的滑坡危險性,認(rèn)為信息量模型能夠很好地為滑坡的敏感性研究服務(wù),可用來解決以往滑坡危險性評價中效率低、精度差的問題。黃發(fā)明等[12]將灰色關(guān)聯(lián)度模型用于浙江南田地區(qū)的滑坡敏感性評價,并認(rèn)為灰色關(guān)聯(lián)度模型的預(yù)測精度略高于支持向量機(jī)模型且建模過程較為簡單。Sahana等[13]評估了頻率比、模糊邏輯和邏輯回歸模型在滑坡敏感性制圖中的有效性,認(rèn)為模糊邏輯模型在評估滑坡敏感性方面更為有效。上述研究科學(xué)地預(yù)測了滑坡發(fā)生的空間概率和發(fā)育規(guī)律,為滑坡的防治提供了科學(xué)依據(jù)??偟膩砜?,不同方法各有特點(diǎn),在進(jìn)行滑坡敏感性評估與制圖時應(yīng)根據(jù)研究區(qū)的實(shí)際情況和所建立的評價指標(biāo)選取合適的評價模型。
進(jìn)行滑坡敏感性制圖需要結(jié)合歷史滑坡頻率,并盡可能避免在分配指標(biāo)權(quán)重時的主觀性/不確定性[14-15]。頻率比可用于分析歷史滑坡和指標(biāo)之間的相關(guān)系[16];投影尋蹤模型是分析和處理非線性非正態(tài)高維數(shù)據(jù)的有效方法,可有效排除人為因素干擾[17]?,F(xiàn)將討論基于頻率比和投影尋蹤模型的滑坡敏感性制圖,并將其應(yīng)用到渝東北地區(qū)。目前,投影尋蹤模型已被廣泛用于區(qū)域環(huán)境評價研究中[18],但在滑坡敏感性制圖中的應(yīng)用還比較少見。因此,現(xiàn)擬利用頻率比和投影尋蹤模型繪制渝東北三峽庫區(qū)的滑坡敏感性圖,這對于當(dāng)?shù)亟Y(jié)合國家長江經(jīng)濟(jì)帶發(fā)展戰(zhàn)略制定發(fā)展規(guī)劃、開展地質(zhì)災(zāi)害綜合防治,打造長江上游生態(tài)保護(hù)屏障具有重要的指導(dǎo)意義。
渝東北地區(qū)地處渝鄂川陜四省市交界地帶,介于東經(jīng)107°30′40″~110°12′12″,北緯30°02′20″~31°44′00″,面積30 698 km2,是三峽庫區(qū)的核心區(qū)域(圖1)。區(qū)內(nèi)主要包括萬州、開州、豐都、忠縣、云陽、奉節(jié)、巫山、巫溪、石柱9個區(qū)縣,是國家重點(diǎn)生態(tài)功能區(qū)和農(nóng)產(chǎn)品主產(chǎn)區(qū)、長江流域重要生態(tài)屏障和特色經(jīng)濟(jì)走廊[19]。研究區(qū)屬亞熱濕潤季風(fēng)氣候,汛期雨量充沛,多災(zāi)害性天氣和暴雨。區(qū)內(nèi)地形為中低山區(qū),包括中切割低山、中山以及深切割中山,最低海拔73 m,最高海拔2 741 m。區(qū)內(nèi)地質(zhì)構(gòu)造復(fù)雜且地質(zhì)環(huán)境條件脆弱,是長江流域地質(zhì)災(zāi)害高發(fā)區(qū)之一。
圖1 研究區(qū)位置圖Fig.1 Location map of the study area
滑坡的發(fā)生是地質(zhì)、地形、氣象和人類活動等許多因素綜合作用的結(jié)果。根據(jù)研究區(qū)的地質(zhì)環(huán)境特點(diǎn),參照已有研究[20-22],建立滑坡敏感性評價指標(biāo)體系。評價指標(biāo)的選取原則如表1所示。
根據(jù)評價指標(biāo),收集的數(shù)據(jù)包括歷史滑坡清單、中分辨率成像光譜儀(moderate-resolution imaging spectroradiometer,MODIS)數(shù)據(jù)、土地利用、數(shù)字高程模型(digital elevation model,DEM)、降水、人口分布、地質(zhì)圖和其他數(shù)據(jù)。數(shù)據(jù)源如表2所示。
利用ArcGIS 10.2軟件對DEM數(shù)據(jù)處理可獲得坡度、高程、地表起伏度等數(shù)據(jù)。巖性和斷層數(shù)據(jù)可利用地質(zhì)圖矢量化獲得。采用最大值合成法[32]將MOD13Q1數(shù)據(jù)(2020年度)合成最大歸一化植被指數(shù)(normalized difference vegetation index,NDVI)分布數(shù)據(jù),并利用像元二分模型[33]對研究區(qū)的植被覆蓋度進(jìn)行定量估算。水系和人類工程活動是從土地利用數(shù)據(jù)中獲取的,并利用ArcGIS 10.2軟件的多重緩沖工具進(jìn)行處理。年均降水是由原始數(shù)據(jù)通過空間克里金內(nèi)插法產(chǎn)生的柵格數(shù)據(jù)。在評估分析之前需將指標(biāo)進(jìn)行重分類處理,結(jié)果如表3和圖2所示。
指標(biāo)的多重共線性分析是進(jìn)行滑坡敏感評估前最重要的步驟之一[34]。指標(biāo)之間的相關(guān)性直接影響到評估結(jié)果的準(zhǔn)確性。因此,采用皮爾森相關(guān)系數(shù)[35](Pearson correlation coefficient,PCC)來分析指標(biāo)之間的相關(guān)性。PCC的計算方法如下。
表1 評價指標(biāo)的選取Table 1 Selection of evaluation indicators
表2 本研究所需數(shù)據(jù)及來源Table 2 Data and sources of this study
表3 評價指標(biāo)的重分類Table 3 Reclassification of evaluation indicators
圖2 研究區(qū)評價指標(biāo)分級Fig.2 Classifications of different evaluation indicators in study area
假設(shè)存在樣本數(shù)據(jù)集(Xi,Yi)=(X1,Y1),(X2,Y2),…,(Xn,Yn),則可得到評價指標(biāo)之間的相關(guān)系數(shù)PCC為
(1)
在滑坡敏感性制圖中,一般認(rèn)為未來可能發(fā)生的滑坡將在已發(fā)生滑坡相同的地質(zhì)環(huán)境條件下發(fā)生[36]。因此,將頻率比用于推導(dǎo)歷史滑坡與指標(biāo)之間的空間關(guān)系。頻率比FR的計算公式為
(2)
式(2)中:FR為滑坡在指標(biāo)類型(或范圍)i中的發(fā)生頻率;Ni為類型(或范圍)i中的滑坡數(shù)量;N為滑坡總數(shù);Mi為類型(或范圍)i的面積;M為研究區(qū)總面積。
采用GIS技術(shù)和投影尋蹤模型相結(jié)合的方法,開展研究區(qū)的滑坡敏感性制圖研究。模型構(gòu)建步驟如下。
步驟1數(shù)據(jù)標(biāo)準(zhǔn)化。以頻率比分析結(jié)果為基礎(chǔ),根據(jù)各指標(biāo)子類的FR對評價指標(biāo)進(jìn)行歸一化處理,歸一化方程為
(3)
式(3)中:Gx為指標(biāo)x的歸一化數(shù)據(jù);gx為指標(biāo)x中不同子類的FR值;gxmax為指標(biāo)x中子類的最大FR值;gxmin為指標(biāo)x中子類的最小FR值。
步驟2線性投影。設(shè)第i個樣本的第j個指標(biāo)為Hij(i=1,2,…,m;j=1,2,…,n),m為選取評價樣本個數(shù),j為評價指標(biāo)個數(shù)。設(shè)k為n維單位投影的方向向量,則Hij在一維線性空間的投影特征值Ii為
(4)
步驟3構(gòu)造投影指標(biāo)?;旅舾行灾茍D是以評價指標(biāo)為基礎(chǔ),將評價樣本進(jìn)行合理分類或排序,是進(jìn)行滑坡敏感性制圖的必要過程。因此,投影指標(biāo)可依據(jù)分類指標(biāo)構(gòu)成。指標(biāo)的分類或排序就是尋求多維數(shù)據(jù)在一維空間的類間距離W(k)和類內(nèi)密度V(k)的散布結(jié)構(gòu)同時滿足最大值。故定義投影指標(biāo)P為
P=W(k)V(k)
(5)
類間距離用指標(biāo)序列的投影特征值方差來表示[式(6)],類內(nèi)密度V(k)是利用投影特征值兩兩之間的距離Fil=|Hi-Hl|,i,l=1,2,…,m來表示[式(7)]。
(6)
(7)
步驟4優(yōu)化投影向量。投影向量反映的是數(shù)據(jù)的結(jié)構(gòu)特征,最佳投影向量就是最大限度地反映高維數(shù)據(jù)的某種特征結(jié)構(gòu)。以投影指標(biāo)P為依據(jù),當(dāng)P為最大值時,其對應(yīng)的投影方向向量k為最優(yōu)投影向量。因此,最優(yōu)投影向量的計算可轉(zhuǎn)化為非線性優(yōu)化問題。
(8)
步驟5綜合分析。滑坡敏感性指數(shù)(landslide susceptibility index,LSI)被認(rèn)為是表征滑坡敏感性水平的一個重要組成部分,它被定義為若干特征指標(biāo)加權(quán)求和。以特征指標(biāo)所對應(yīng)最優(yōu)向量的最大值作為權(quán)重,并根據(jù)不同層次的綜合信息進(jìn)行滑坡敏感性制圖,即
(9)
式(9)中:Ai為指標(biāo)根據(jù)FR值標(biāo)準(zhǔn)化后的數(shù)據(jù);Bi為對應(yīng)的權(quán)重,也就是所對應(yīng)最優(yōu)向量的最大值。最后,采用自然斷點(diǎn)法將滑坡敏感性指數(shù)劃分為低敏感,較低敏感,中敏感,較高敏感和高敏感5個等級。
采用滑坡敏感性綜合指數(shù)(composite index,CI)表征滑坡敏感性的分布趨勢,即
(10)
式(10)中:i為敏感性等級,n為總級別數(shù);Ei為等級i在評級單元j中所占的面積;SFj為評價單元j的面積;Fi為等級i的分級值。根據(jù)敏感性區(qū)劃將低敏感區(qū)賦值1,較低敏感賦值2,中敏感區(qū)賦值3,較高敏感區(qū)賦值4,高敏感區(qū)賦值5。CI的值越大,表示整體滑坡敏感性越高。
結(jié)果驗(yàn)證是滑坡敏感性制圖中必要的過程。接收者操作特征(receiver operating characteristic,ROC)曲線是一種對于靈敏度進(jìn)行描述的功能圖像,被廣泛應(yīng)用于包括滑坡在內(nèi)的多個領(lǐng)域[37]。ROC曲線繪制了一組閾值或臨界值的真陽性率(true positive rate,TPR),表明評估結(jié)果成功地定位了敏感區(qū);而假陽性率(false positive rate,F(xiàn)PR)則顯示了敏感區(qū)不顯著的位置。結(jié)果的精度用ROC曲線下面積(area under the curve,AUC)來衡量。一般AUC值在大于0.5的情況下,其值越接近1,則說明模型應(yīng)用越成功。將歷史滑坡數(shù)據(jù)劃分為樣本數(shù)據(jù)(歷史滑坡總數(shù)的70%)和驗(yàn)證數(shù)據(jù)(歷史滑坡總數(shù)的30%)來評價結(jié)果的準(zhǔn)確性。樣本數(shù)據(jù)用于計算結(jié)果的成功率,驗(yàn)證數(shù)據(jù)用于計算結(jié)果的預(yù)測率。
指標(biāo)之間相關(guān)性將影響滑坡敏感性制圖的準(zhǔn)確性。通過皮爾森相關(guān)系數(shù)法計算了評價指標(biāo)之間的相關(guān)系數(shù),得到評價指標(biāo)之間的相關(guān)系數(shù)在-0.43~0.58,以弱相關(guān)或無相關(guān)為主(圖3)。因此,在開展滑坡敏感性制圖時,無需對評價指標(biāo)進(jìn)行刪減。
藍(lán)色表示負(fù)相關(guān);紅色表示正相關(guān);圓圈的大小表示相關(guān)性大小圖3 評價指標(biāo)之間的相關(guān)性Fig.3 Correlations between different evaluation indicators
選擇研究區(qū)內(nèi)4 322個歷史滑坡(歷史滑坡總數(shù)的70%)作為樣本數(shù)據(jù)來探討指標(biāo)與歷史滑坡之間的分布關(guān)系?;陬l率比模型的分析結(jié)果(圖4),根據(jù)各指標(biāo)子類的FR值對指標(biāo)進(jìn)行標(biāo)準(zhǔn)化,
為后續(xù)的利用投影尋蹤評估研究區(qū)滑坡敏感性做準(zhǔn)備。
采用遺傳算法尋找最優(yōu)投影向量,優(yōu)化步驟如下。
(1)隨機(jī)產(chǎn)生X組原始單位投影向量,根據(jù)式(4)分別計算每個組的特征值。
(2)根據(jù)式(6)和式(7)分別計算X組投影方向上的W(k)和V(k),并帶入式(5)計算X組投影方向上的目標(biāo)函數(shù)P。
(3)利用遺傳算法中的選擇、變異和交叉操作,得到多組新的投影向量。
(4)由于P是具有空間分布且連續(xù)的數(shù)據(jù),故只需滿足P最大值越大越優(yōu)的原則,從多組投影向量中選取新的投影向量。
(5)重復(fù)上述操作,直到P的最大值不再增大時,得到所對應(yīng)的投影向量就是最優(yōu)投影向量。
根據(jù)表4中的特征指標(biāo)及其最優(yōu)投影向量,帶入式(9)可得到研究區(qū)滑坡敏感性指數(shù),并將滑坡敏感性指數(shù)劃分為低敏感、較低敏感、中敏感、較高敏感和高敏感5個等級(圖5)。
圖4 滑坡與評價指標(biāo)之間的關(guān)系Fig.4 Relationship between landslide and evaluation indicators
通過對滑坡敏感性區(qū)劃統(tǒng)計(表5),研究區(qū)內(nèi)高敏感區(qū)面積為2 823.84 km2,滑坡1 618處,占滑坡總數(shù)的26.21%;較高敏感區(qū)5 923.30 km2,滑坡1 795處,占滑坡總數(shù)的29.07%;中敏感區(qū)9 820.13 km2,滑坡1 783處,占滑坡總數(shù)的28.88%;較低敏感區(qū)7 825.97 km2,滑坡805處,占滑坡總數(shù)的13.04%;低敏感區(qū)4 304.35 km2,滑坡173處,占滑坡總數(shù)的2.80%。通常情況下,在滑坡敏感性分級結(jié)果中敏感性越高的區(qū)域滑坡密度約大,則表明分級結(jié)果越合理。在劃分結(jié)果中,存在84.16%的滑坡分布于中、較高以及高敏感區(qū),且滑坡密度隨滑坡敏感程度的增加而增加,這表明研究區(qū)域的滑坡敏感性區(qū)劃結(jié)果是有效合理的。
表4 特征指標(biāo)及其最優(yōu)投影向量Table 4 Characteristic indicators and its optimal vector
圖5 研究區(qū)滑坡敏感性區(qū)劃圖Fig.5 Landslide susceptibility zoning map of study area
表5 研究區(qū)滑坡敏感性區(qū)劃結(jié)果Table 5 Results of landslide susceptibility zoning
根據(jù)ROC曲線驗(yàn)證結(jié)果(圖6),結(jié)果的成功率AUC值為0.844,標(biāo)準(zhǔn)誤差0.003,95%的置信區(qū)間內(nèi)AUC值的上限和下限分別為0.838和0.850,顯著水平P<0.001。預(yù)測率AUC值為0.763,標(biāo)準(zhǔn)誤差0.005,95%的置信區(qū)間內(nèi)AUC值的上限和下限分別為0.753和0.773,顯著水平P<0.001。參考Yesilnacar等[38]對AUC的分類,基于頻率比-投影尋蹤模型的渝東北三峽庫區(qū)滑坡敏感性制圖具有相當(dāng)高的精度。
圖6 評估結(jié)果的成功率和預(yù)測率ROC曲線Fig.6 ROC curve of evaluated success rate and prediction rate
在遙感和GIS技術(shù)支持下,基于頻率比和投影尋蹤模型的滑坡敏感性制圖是一項(xiàng)有利于防災(zāi)減災(zāi)的工作。其從空間上評估了滑坡發(fā)生的可能性,評價結(jié)果對減少人民生命財產(chǎn)損失和促進(jìn)社會發(fā)展都具有重要意義。根據(jù)滑坡敏感性分布趨勢分析,同一指標(biāo)在不同范圍或類型中的滑坡敏感性綜合指數(shù)存在空間差異性(圖7)。
從地形地貌來看,較高和高敏感區(qū)主要分布在海拔<1 000 m的區(qū)域;由于隨著坡度的增大,斜坡巖土體抗能力逐漸減弱而下滑力增大,但當(dāng)坡度達(dá)到一定角度,坡體上的松散固體物質(zhì)切向分力就可以克服摩擦力而向下運(yùn)動,因此高敏感區(qū)的坡度主要在10°~35°[39]。從地質(zhì)因素來看,地層巖性是控制地質(zhì)災(zāi)害的主要因素,高敏感區(qū)主要分布在頁巖、泥巖、砂頁巖等軟巖區(qū)域,這可能是軟巖具有膨脹性、崩解性、流變性和易擾動性等特性,使得軟巖區(qū)斜坡的穩(wěn)定性較低[40]。高敏感區(qū)的植被覆蓋度大多低于60%,可能的原因是高植被區(qū)的保持水土、穩(wěn)固邊坡作用更強(qiáng)。人類工程活動日益增強(qiáng),改變坡體自然結(jié)構(gòu),松動巖石,增大坡高坡度,破壞斜坡自身平衡,導(dǎo)致高敏感區(qū)主要分布在距人類工程活動1 500 m之內(nèi)的區(qū)域。此外,距離水系越近,滑坡敏感性越高,主要是水流的下切作用使得坡體原來平衡的應(yīng)力狀態(tài)遭到破壞[41]。降水是滑坡產(chǎn)生的重要誘發(fā)因子,但由于研究區(qū)年均降水豐富但差異不大(1 000~1 200 mm),以至研究區(qū)的滑坡敏感性分布與年均降水沒有明顯的相關(guān)性。
此外,將投影尋蹤模型應(yīng)用于滑坡敏感性評估建模,并完成了渝東北三峽庫區(qū)滑坡敏感性制圖與評估。利用ROC曲線證明了應(yīng)用投影尋蹤模型進(jìn)行滑坡敏感性制圖與評估是可行的,而且可以定量地描述每個指標(biāo)對滑坡敏感性的影響和貢獻(xiàn)。投影尋蹤模型是尋找出反映原始高維數(shù)據(jù)結(jié)構(gòu)特征的投影,以達(dá)到研究和分析高維數(shù)據(jù)的目的。和其他方法相比,該模型不需要人工假設(shè),除了自動設(shè)置評價指標(biāo)權(quán)重之外,還避免了嚴(yán)重的信息丟失,具有較強(qiáng)的魯棒性和客觀性[42]。
在遙感和GIS技術(shù)支持下,選取了高程、坡度、地形起伏度、水系距離、斷層距離、地層巖性、植被覆蓋度、年均降水、距人類工程活動距離9個指標(biāo),結(jié)合頻率比和投影尋蹤模型繪制了渝東北三峽庫區(qū)的滑坡敏感性圖,并將研究區(qū)劃分為低敏感區(qū)、較低敏感區(qū)、中敏感區(qū)、較高敏感區(qū)和高敏感區(qū)。研究區(qū)內(nèi)滑坡敏感性以中低敏感性為主,制圖結(jié)果能夠較好地反映渝東北三峽庫區(qū)的滑坡災(zāi)害狀況。
根據(jù)敏感性制圖結(jié)果,研究區(qū)的較高、高風(fēng)險區(qū)約占22%,主要分布在忠縣、萬州以及巫山等區(qū)縣的人類工程活動集中區(qū)。同一指標(biāo)的不同范圍或類型對研究區(qū)滑坡敏感性的影響存在空間差異。地形地貌是影響研究區(qū)滑坡敏感性的主要環(huán)境因素,人類工程活動是影響滑坡敏感性的主要誘發(fā)因素。該研究結(jié)果可為渝東北三峽庫區(qū)的滑坡防治提供參考依據(jù),對區(qū)內(nèi)災(zāi)害管理具有重要意義。