劉璐瑤,高惠瑛**,李 照
(1.中國海洋大學工程學院,山東 青島 266100;2.中國海洋大學城市與工程管理信息化山東高校重點實驗室,山東 青島 266100)
中國地質環(huán)境脆弱、地理條件復雜,是地質災害多發(fā)的國家之一?;聻暮ψ鳛橹饕牡刭|災害之一,具有分布范圍廣、發(fā)生頻率高、災害損失嚴重等特點。浙江省永嘉縣具有獨特的地形地貌條件、水文地質環(huán)境以及地理位置,在降雨因素的誘發(fā)下,極易發(fā)生滑坡災害,僅在2019年8月10日利奇馬臺風期間,發(fā)生的山體滑坡就造成了27人死亡,5人失聯(lián)的嚴重人員傷亡。故在研究該地區(qū)孕災環(huán)境的基礎上,開展滑坡易發(fā)性評價對當地防災減災、土地利用規(guī)劃具有十分重要的參考價值[1]。
近年來,隨著地理信息系統(tǒng)的發(fā)展,區(qū)域地質災害評價模型日漸完善,從過去的直接地形地貌地質制圖、基于專家經驗定性分析發(fā)展到現(xiàn)在的統(tǒng)計模型及機器學習的定量分析[2]。目前,常用的滑坡易發(fā)性評價模型主要有:層次分析法、信息量模型、Logistic回歸模型、證據權模型、確定性系數模型、決策樹、隨機森林、BP神經網絡、支持向量機等[3-4]。國外學者,Guillard C等[5]對葡萄牙盧爾斯市進行了滑坡災害易發(fā)性評估研究,基于GIS數據庫,以柵格單元為基礎,采用基于統(tǒng)計分析的信息量法對特定的地形單元進行了滑坡易發(fā)性評估。Zhang K等[6]將機器學習與遙感和GIS技術結合,基于地形、地質、水文、土地覆蓋與環(huán)境觸發(fā)因素,采用隨機森林模型對三峽地區(qū)進行滑坡災害易發(fā)性制圖,并與決策樹模型的評價結果進行比較,結果表明,隨機森林具有更高的精確度,其評價結果與實際情況更加吻合。Bahareh 等[7]采用坡度、坡向、高程、曲率、地形濕度指數、距河流的距離、距斷層的距離、土地利用、巖性等因子,利用支持向量機、邏輯回歸、人工神經網絡方法對伊朗馬贊達蘭省薩里縣多丹格河流域的滑坡易發(fā)性進行了分析,分析表明,邏輯回歸模型對多丹格河流域的滑坡易發(fā)性分析的精度比支持向量機、人工神經網絡的精度高。國內學者,沈玲玲等[8]用Shannon熵對信息量模型進行改進,并與模糊邏輯模型進行比較,對甘肅岷縣地震滑坡進行了易發(fā)性研究評價。武雪玲等[9]通過融合多源數據以選取孕災環(huán)境與誘發(fā)因子為評價指標,采用PSO-SVM模型,定性預測滑坡易發(fā)性,并通過對網格單元與對象單元的易發(fā)性預測精度進行分類精度比較,得到與野外調查一致的預測結果。
確定性系數模型原理簡單、操作性強、易于實現(xiàn),能夠進行一級評價因子各分類級別對滑坡災害的影響大小的評價,故可進行影響因素的內部比較[2-3];Logistic回歸模型能夠根據不同因子與災害點之間的關系,確定各因子的權重。二者的耦合模型解決指標因子權重確定及不同因子分類級別的權重計算問題,以實現(xiàn)各評價單元滑坡易發(fā)性概率的計算[10]。故本文采用確定性系數與Logistic回歸耦合模型,選取高程、坡度、坡向、距水系距離、距道路距離、距斷層距離、地質巖性與NDVI八個評價因子開展永嘉縣滑坡災害易發(fā)性評價,制作其易發(fā)性區(qū)劃圖,為當地防災減災工作提供參考。
永嘉縣位于浙江省東南部,地理坐標為東經120°19′34″—120°59′19″,北緯28°01′08″—28°36′54″,總面積為2 674.3 km2(見圖1)。該地區(qū)屬亞熱帶季風氣候,四季分明,雨量充沛,雨熱同步,年均氣溫19.6 ℃,多年平均降雨量為1 743.9 mm。其中,楠溪江是貫穿全縣的水系,流域總面積達2 489.97 km2??h域內地勢南低北高,分布有中山、低山、丘陵及河谷平原四種地貌。境內NE向、NW向斷裂最為發(fā)育,如NE向溫州—鎮(zhèn)海大斷裂、永嘉—黃巖大斷裂,NW向淳安—溫州斷裂[11]。區(qū)內巖脈發(fā)育,斷裂分布,巖石破碎;出露的地層以早白堊世和晚侏羅世的火山巖、火山沉積巖為主;第四紀的沖積物、洪積物主要分布在河流兩岸及溝谷地帶;局部出露小范圍的早二疊世變質巖——芝溪頭雜巖。同時,該區(qū)位于亞熱帶常綠闊葉林區(qū),分布多為次生林及人工幼林,森林覆蓋率約為77.27%[11]。
圖1 研究區(qū)概況圖Fig.1 Overview of the study area
永嘉縣主要發(fā)育有滑坡、崩塌、泥石流及斜坡等地質災害。從地域上看,整個研究區(qū)均分布有地質災害,且分布密度自北向南逐漸增大[11];從地形上看,主要分布在海拔較低、坡度較緩的縣域南部地區(qū);從水文地質環(huán)境上看,歷史災害點主要分布在河流沿岸的斷層密集區(qū)。由此可見,頻繁的人類工程活動、軟弱的地質巖組及河流切坡均可能導致滑坡災害發(fā)生,造成嚴重的災情事故,威脅人民生命與財產安全[12]。
本次研究的基礎數據主要來源于遙感、規(guī)劃與統(tǒng)計三個方面[13],其中滑坡歷史災害點的數據來源于中國科學院資源環(huán)境科學數據中心,共包含203個災害點數據?;乱装l(fā)性評價指標因子的基礎數據有永嘉縣DEM(Digital Elevation Model,數字高程模型,簡稱DEM)數據、地質數據、水文交通和歸一化植被指數(Normalized Difference Vegetation Index,簡稱NDVI)數據4類,主要來源見表1。
表1 數據來源Table 1 Sources of data
指標因子的選取需與滑坡災害的發(fā)生有密切關系[14],故對浙江永嘉縣的滑坡災害發(fā)育特征及時空分布規(guī)律進行分析,選擇合適的孕災環(huán)境因子作為滑坡易發(fā)性評價的指標因子。
通過研究發(fā)現(xiàn):不同的高程范圍內,植被覆蓋率、降雨量及人類工程活動強度均具有明顯差異性,直接或間接地影響著滑坡災害的發(fā)生[14-15];坡度的大小則影響著地表松散巖土體發(fā)生位移形成滑坡災害的可能性,影響著坡體應力分布、地表徑流及地下水補給、排泄等情況[2,12];不同的坡向,植被類型、覆蓋率、降雨量、蒸發(fā)量的大小的不同,影響著斜坡體的穩(wěn)定性[12,14-15]。河流對斜坡坡腳的沖刷、掏蝕,改變了坡體的形態(tài)結構,使得邊坡的臨空面增大,為滑坡的發(fā)生提供了誘發(fā)條件[12,14-15];道路交通是研究區(qū)內最具代表性的人類工程活動,道路的修建通過切坡、開挖邊坡實現(xiàn),這改變了坡體的應力狀態(tài),使得邊坡臨空面積增大,加劇了滑坡發(fā)生可能[16]。斷層導致了巖體破碎,致使邊坡自穩(wěn)性下降,形成了有利于滑坡災害形成和發(fā)育的構造條件;出露的地層為滑坡的發(fā)生提供了物質基礎[17],不同性質的巖石堅硬程度不同、抗剪能力不同,對于滑坡失穩(wěn)變形的影響不同,對滑坡的影響程度也不同[2,15]。與此同時,越來越多的學者把歸一化植被指數(NDVI)看作用來描述土地覆蓋類型特征影響滑坡災害發(fā)生的一個指標因子[2],不同的植被覆蓋率下,人類活動密集程度、地表蒸發(fā)量、植被根莖根固程度有所不同,對滑坡災害的影響程度不同[16]。
根據以上分析,選取高程、坡度、坡向、距水系距離、距道路距離、距斷層距離、地層巖性、NDVI八個評價因子構成本次滑坡易發(fā)性評價的指標體系。為進一步研究各評價因子對滑坡發(fā)生的影響,在前人的研究基礎上,根據滑坡發(fā)生的特點和分布規(guī)律[1],且結合研究尺度和研究區(qū)的實際情況[2],對各因子進行分級處理(見圖2)。
圖2 評價因子分級圖Fig.2 Classification maps of assessment factors
本文對浙江省永嘉縣開展滑坡易發(fā)性評價,基于上節(jié)對各評價因子的分類級別處理,首先采用確定性系數模型計算出各評價因子各分類級別的權重值,即CF值。然后各因子分類級別的CF值作為自變量,將是否發(fā)生滑坡災害(“1”代表滑坡災害發(fā)生,“0”表示滑坡災害未發(fā)生)作為因變量[18],導入SPSS 25.0軟件中進行二元Logistic回歸分析,以得到各評價因子的回歸系數即因子之間的權重?;贕IS平臺計算得到各評價單元的滑坡發(fā)生概率,最終運用自然間斷點法實現(xiàn)研究區(qū)滑坡災害易發(fā)性區(qū)劃[1,18]。本文選取的基本柵格單元大小為30 m×30 m,對各評價因子柵格圖層進行重采樣[19],與之匹配進行分析。
(1)評價因子各分類級別CF值計算
通過對各個評價因子進行分類級別處理,與203個歷史滑坡災害點進行疊加處理,分析滑坡災害點在各評價因子不同分類級別中的分布情況,根據下式:
(1)
計算出評價因子各分類級別的CF值,即權重值。該權重可實現(xiàn)評價因子內部各分類級別之間的重要性比較,也可實現(xiàn)不同評價因子各分類級別之間的比較[2,10]。評價因子各分類級別的CF值見表2。
表2 各評價因子分類級別的CF值Table 2 Values of CF for different classes of assessment factors
(2)評價因子權重值的計算
本文采用的評價單元為30 m×30 m的柵格單元,通過GIS的重采樣功能[15],共計得到2 976 478個獨立的評價單元。隨機選取203個非災害點,與同等數量的歷史災害點構成永嘉縣滑坡災害易發(fā)性評價的統(tǒng)計樣本。其中,406個樣本點8個評價因子的CF值為自變量,滑坡發(fā)生與否為因變量(“1”代表滑坡災害發(fā)生,“0”代表滑坡災害未發(fā)生)[18]。運用GIS的多值提取至點功能,依次提取各樣本點的CF值,并將提取的樣本值導入至SPSS 25.0中進行二元Logistic回歸分析,結果見表3。
表3 Logistic回歸分析結果Table 3 Results of logistic regression analysis
在滑坡災害易發(fā)性評價過程中,回歸系數B代表各指標因子的權重[2,18],每個變量在方程的重要性可以通過比較sig值(顯著性)的大小來判斷,當sig<0.05時,變量具有統(tǒng)計意義[20]?;貧w結果顯示,高程、坡度、坡向等8個評價因子的sig均小于0.05,說明8個指標因子的回歸系數在誤差允許的范圍內是準確的,耦合模型得到的各因子權重由大到小分別是:距斷層距離、坡度、高程、坡向、NDVI、地層巖組、距河流距離和距道路距離。
(3)各因子獨立性檢驗
變量之間存在高度相關性會使模型估計失真或難以估計準確[10],故為使所選的評價因子更加合理,需要對各因子進行獨立性檢驗,剔除相關性較大的評價因子[2]。各評價因子的相關系數矩陣見表4。
表4 評價因子相關系數矩陣Table 4 Correlation matrix of assessment factors
由表4可知,各評價因子之間的相關系數均小于0.3,根據胡燕等對相關性大小的劃分標準[21],相關性系數小于0.3時,所選因子之間的相關性較小,故8個評價因子均可進入模型。
(4)易發(fā)性評價計算與區(qū)劃
根據計算所得的各因子回歸系數,結合Logistic回歸公式,可得下式:
(2)
式中:P為滑坡災害發(fā)生的概率值,x1~x8為各評價因子的CF值。根據式(2),利用GIS的柵格計算功能[1,4],得到每個評價單元的滑坡發(fā)生概率P,采用自然間斷點分級法[1,18],將研究區(qū)易發(fā)性劃分為極高易發(fā)區(qū)、高易發(fā)區(qū)、中易發(fā)區(qū)、低易發(fā)區(qū)、極低易發(fā)區(qū)5類,見圖3。
圖3 研究區(qū)滑坡易發(fā)性分區(qū)圖Fig.3 Landslide susceptibility map of study area
根據確定性系數模型與Logistic回歸模型的計算過程及研究區(qū)易發(fā)性分區(qū)圖,可以得出:
(1)從各評價因子的回歸系數及各分類級別的CF值,可以看出:滑坡災害主要發(fā)生在高程0~100 m,坡度5°~10°,距河流和道路距離400 m內的區(qū)域,該區(qū)域地勢平緩、人類工程活動密切,受河流沖刷、掏蝕及道路開挖、開鑿的影響,使得斜坡的臨界面大大增加,滑坡災害易發(fā)性明顯提高。同時,斷層的密集分布與軟弱的芝溪頭雜巖、高塢組等為滑坡災害的發(fā)生提供了豐富的物質來源與充足的物質基礎。
(2)從永嘉縣的易發(fā)性分區(qū)圖,可以看出:極高易發(fā)區(qū)與極高易發(fā)區(qū)主要分布在永嘉縣的南部地區(qū),并沿河流和道路向北分布,約占縣域面積的28%;極低易發(fā)區(qū)和低易發(fā)區(qū)主要分布在縣域地北部區(qū)域,該區(qū)域海拔高、坡度陡,人類工程活動稀少,約占研究區(qū)總面積的55%。
本文采用歷史滑坡點落在各等級易發(fā)區(qū)的比例對易發(fā)性分區(qū)的合理性進行檢驗[2,12],采用受試者工作特征曲線(Receiver Operating Characteristic Curve,ROC)對模型評價精度進行檢驗[2-3,12]。
將歷史滑坡點與易發(fā)性分區(qū)結果進行疊加分析[2-3],得到分析結果,見表5。檢驗結果顯示,有74.88%的歷史滑坡點落在極高易發(fā)區(qū)和高易發(fā)區(qū)的范圍內,而二者的柵格數量占總柵格數量的28.03%;分別有4.93%和5.42%的歷史滑坡點落在占研究區(qū)總柵格數量32.41%和22.59%的極低易發(fā)區(qū)和低易發(fā)區(qū)內;且隨著易發(fā)性由低到高,柵格比逐漸減小,滑坡比與頻率比均逐步增加,這均符合實際情況,由此說明易發(fā)性區(qū)劃結果是合理的[2]。若用歷史滑坡點落在較高易發(fā)區(qū)域內的比例表征精度[12],則本研究的預測精度達74.88%。
表5 耦合模型易發(fā)性分區(qū)結果Table 5 Susceptibility zoning results of coupling model
再進一步采用ROC曲線對耦合模型的評價精度進行檢驗。以滑坡災害單元被正確預測的比例(真陽性率,也稱敏感度)為縱坐標,以未發(fā)生滑坡單元被正確預測的比例(假陽性率,也稱1-特異性)為橫坐標繪制曲線[2-3],ROC曲線越靠近左上角,曲線下的面積(Area Under the Curve,AUC)越大,模型的準確率越高[1,3]。耦合模型的ROC曲線如圖4所示,AUC值為0.814,說明確定性系數與Logistic回歸耦合模型能夠較為準確客觀地對浙江省永嘉縣滑坡易發(fā)性進行評價。
圖4 耦合模型的ROC曲線Fig.4 ROC curve of coupling model
(1)本文采用了確定性系數和Logistic回歸耦合模型對浙江省永嘉縣開展了滑坡易發(fā)性評價。確定性系數模型通過計算評價因子各分類級別的CF值,客觀地揭示了評價因子各分類級別與滑坡災害發(fā)育的關系,避免了人為主觀的不合理賦值情況;Logistic回歸模型通過計算各評價因子間的權重,客觀地揭示了不同評價因子對滑坡作用的影響程度差異。二者的耦合模型實現(xiàn)了各因子權重和各因子分類級別權重的客觀計算,避免了主觀因素對權重評估的干擾。
(2)基于前人研究成果,從地形地貌、地質構造、水文交通、其他因子等方面,選取高程、坡度、坡向、距水系距離、距道路距離、距斷層距離、地層巖組及NDVI 8個評價因子,采用了確定性系數與Logistic回歸耦合模型,對永嘉縣開展滑坡易發(fā)性區(qū)劃研究。其中,距斷層距離、坡度、高程、坡向、NDVI這5個因子對研究區(qū)滑坡易發(fā)性影響相對較大。
(3)根據耦合模型下滑坡易發(fā)性區(qū)劃結果,將研究區(qū)劃分為極高易發(fā)區(qū)、高易發(fā)區(qū)、中易發(fā)區(qū)、低易發(fā)區(qū)和極低易發(fā)區(qū)。并將滑坡點與分區(qū)圖疊加分析,發(fā)現(xiàn)分區(qū)圖與研究區(qū)實際情況較為一致。其中極高易發(fā)區(qū)和高易發(fā)區(qū)主要分布在縣域南部,并沿河流、道路、斷層相對發(fā)育;極低易發(fā)區(qū)和低易發(fā)區(qū)主要分布在研究區(qū)北部海拔高、坡度陡峭的區(qū)域。
(4)通過采用歷史滑坡點落在各易發(fā)性分區(qū)的比例與ROC曲線分別對分區(qū)結果合理性和耦合模型評價精度進行了檢驗。有74.88%的滑坡點落在極高易發(fā)區(qū)和高易發(fā)區(qū)范圍內,且ROC曲線的AUC值達到為0.814,說明分區(qū)結果合理,模型評價精度較高。由此可知,確定性系數和Logistic回歸耦合模型能夠客觀準確地實現(xiàn)永嘉縣滑坡災害易發(fā)性評價,且能在滑坡易發(fā)性及其風險評價工作中起到一定的作用。