金 帥
(防災(zāi)科技學(xué)院,河北 三河065201)
宜賓市地處云貴川三省交界地帶,地震活動頻繁,地震、降雨加之人為活動導(dǎo)致該地區(qū)地質(zhì)災(zāi)害發(fā)生頻繁,給人民群眾生命財產(chǎn)帶來巨大威脅。地質(zhì)災(zāi)害易發(fā)性分區(qū)不僅可以有效減輕地質(zhì)災(zāi)害損失,還可以為各級政府制定地質(zhì)災(zāi)害防治規(guī)劃和實施地質(zhì)災(zāi)害預(yù)警提供依據(jù)[1]。
目前,地質(zhì)災(zāi)害易發(fā)性分區(qū)方法較多,但沒有統(tǒng)一的評價標(biāo)準(zhǔn)[2,3]。最早為方便評價,研究者試圖通過模糊評判的方法進(jìn)行易發(fā)性分析,此方法主觀因素占主導(dǎo),結(jié)果是否可信常受到質(zhì)疑[2-5]。薩蒂[5]利用層次分析模型進(jìn)行易發(fā)性評價,通過專家等具有專門知識的人對各評價因子進(jìn)行重要程度排序,構(gòu)建比較矩陣并賦予權(quán)重值。由于AHP 法往往是通過專家等權(quán)威人士進(jìn)行分析,結(jié)果具有公信力[5-6]。由于易發(fā)性工作的發(fā)展,不依靠主觀因素的客觀評價方法開始涌現(xiàn),如證據(jù)權(quán)、Logistics 模型、信息量模型等[2-3]。目前,常用的方法有信息量模型[3]、Logistics 模型[4]、AHP 法[5-6]及人工智能[7]等方法。其中,證據(jù)權(quán)法考慮了各因子正負(fù)兩方面的因素,對因子如何影響滑坡發(fā)生有全面的認(rèn)識,但是計算較為復(fù)雜,分區(qū)精度不高;Logistics 模型計算量較小,可以方便得到因子權(quán)重,模型建立后,只需填入各因子數(shù)值就可快速得到某地區(qū)易發(fā)性概率,但Logistics 模型對因子要求較高,各因子不得有任何相關(guān)性,實際中會導(dǎo)致因子選取困難;AHP 法對參與者的專業(yè)知識與經(jīng)驗要求極高,經(jīng)驗不足會導(dǎo)致精度降低甚至不可用;人工智能的方法計算快速且精度較高,但該方法對參數(shù)的調(diào)試繁瑣,未經(jīng)參數(shù)調(diào)優(yōu)的模型不可用。由于信息量模型理論簡單,計算方便,既有效避免AHP 法主觀判斷,精度又略高于Logistics 模型[8],逐漸成為易發(fā)性分區(qū)主要方法。
信息量模型優(yōu)點突出但也有缺陷。其只是單純的對各因子圖層進(jìn)行疊加,忽略了各因子對易發(fā)性的貢獻(xiàn)率不同,模型加入過多非主要評價因子往往導(dǎo)致分區(qū)精度降低。本文針對易發(fā)性評價工作中,單一模型評價有缺陷的問題,選擇常用的信息量模型與Logistics 模型進(jìn)行耦合。Logistics 模型客觀計算得到的系數(shù)表示了各評價因子的重要程度,利用其為信息量模型做權(quán)重,彌補信息量模型忽略各因子貢獻(xiàn)率不同的缺陷,降低易發(fā)性次要因素比重,以此提高易發(fā)性分區(qū)精度。
宜賓市位于四川省東南,全市面積1.33 萬平方公里,總?cè)丝?51.5 萬[9]。宜賓市地形由西南向東北逐漸降低,全市地形地貌以山地和丘陵為主,全區(qū)地質(zhì)災(zāi)害點分布較為分散,但大多集中于海拔中部地區(qū),全市海拔最高與最低處地質(zhì)災(zāi)害分布較少。本文共選取宜賓市地質(zhì)災(zāi)害點1160 處。其中滑坡603 處,崩塌345 處,崩塌、滑坡及具有發(fā)展成崩塌和滑坡的不穩(wěn)定邊坡共占地質(zhì)災(zāi)害點總數(shù)的92.32%,表明研究區(qū)內(nèi)主要地質(zhì)災(zāi)害為滑坡和崩塌。宜賓地質(zhì)條件復(fù)雜,以石英巖、頁巖、粉砂巖、泥巖為主,玄武巖少量分布。
本文地質(zhì)災(zāi)害數(shù)據(jù)來源于四川省自然資源廳(http://dnr.sc.gov.cn/scdnr/scxxgkzn/sc_gkzn.shtml),利用ArcGIS轉(zhuǎn)換成矢量點圖層,研究區(qū)內(nèi)主要地質(zhì)災(zāi)害為滑坡與崩塌,經(jīng)分析,地質(zhì)災(zāi)害點在300m~600m 處分布最為廣泛,占全區(qū)地質(zhì)災(zāi)害點51.5%;地層巖性和斷裂帶來源于中國地質(zhì)調(diào)查總局1:50 萬地質(zhì)圖,經(jīng)重投影并矢量化得來;數(shù)字高程模型(DEM)來源于NASA,采用12.5mALOS DEM,經(jīng)鑲嵌和裁剪后重采樣為30m 柵格。地形因子(如坡度、坡向等)根據(jù)DEM 得來,其中,平面曲率表示研究區(qū)內(nèi)地形離散度及水流匯集的可能性,是等高線的彎曲程度;剖面曲率表示坡度的再分析,對坡度再次求導(dǎo)得出,是剖面線的彎曲程度;基礎(chǔ)地理數(shù)據(jù)如路網(wǎng)、水系等來源于天地圖(http://lbs.tianditu.gov.cn/home.html),其中路網(wǎng)分為鐵路網(wǎng)與公路網(wǎng),對其進(jìn)行合并處理;降雨量利用近10 年宜賓地區(qū)降水再分析數(shù)據(jù),來源于WheatA,經(jīng)計算各點平均值后使用普通克里金插值得來;地震動峰值加速度(PGA) 來源于《中國地震動參數(shù)區(qū)劃圖》(GB18306-2015);興趣點(POI)密度采用爬蟲技術(shù)獲得宜賓地區(qū)5 萬余處POI,經(jīng)ArcGIS 密度計算得來;NDVI采用Landsat 8 OLI_TIRS 衛(wèi)星數(shù)字產(chǎn)品,經(jīng)輻射定標(biāo)及大氣校正后計算得來;地形因子(坡度、坡向等)來源于ALOS DEM,基于ArcGIS 進(jìn)行提取。
綜合考慮研究區(qū)實際與計算量,結(jié)合前人經(jīng)驗[10],本文以30m×30m 柵格為評價單元,基于ArcGIS 共劃分為14738029 個柵格。
目前,易發(fā)性分區(qū)因子選取種類與方法日益增多[11]。本文選取DEM、坡度、坡向、PGA、POI 點密度、地形起伏度、坡型、斷層距離、河流距離、道路距離、NDVI、土地利用、巖性、降雨量、剖面曲率,平面曲率共計16 類評價因子,其中,連續(xù)型因子以自然斷點法進(jìn)行分級,非連續(xù)性因子以頻率比作為分級依據(jù)。
DEM 越高,地質(zhì)災(zāi)害發(fā)生頻率越高,超過一定海拔高度后,地質(zhì)災(zāi)害頻率開始降低,由圖1 可知,研究區(qū)內(nèi)地質(zhì)災(zāi)害多分布于海拔300m~600m 處的低山丘陵地帶。
坡度與地質(zhì)災(zāi)害發(fā)生密切相關(guān),坡度越陡,滑坡體摩擦力越小,滑坡越容易發(fā)生,研究區(qū)內(nèi)危險坡度為15°~36°之間。
坡向通過日照時常與蒸發(fā)量等因素對地質(zhì)災(zāi)害產(chǎn)生影響;由于地質(zhì)災(zāi)害觸發(fā)因素主要有降水和地震,因此將降雨量與表征地震的地震動峰值加速度和距離斷層距離納入評價因子,由圖可知,研究區(qū)降水量自東向西依次增加,與地質(zhì)災(zāi)害點分布相吻合,表明降水量是影響地質(zhì)災(zāi)害的因素之一。
由于受到人為活動干擾,導(dǎo)致部分地區(qū)巖石土體松動或者邊坡穩(wěn)定性降低,容易發(fā)生滑坡等地質(zhì)災(zāi)害,故表征人類活動的POI 點密度與道路距離納入評價因子。
河道沖刷會使含水量與坡度等發(fā)生變化而導(dǎo)致邊坡失穩(wěn),進(jìn)而發(fā)生地質(zhì)災(zāi)害,故距河流距離納入評價因子,距河流越近,地質(zhì)災(zāi)害發(fā)生越頻繁。
評價因子過多會帶來因子冗余,部分因子相關(guān)性太強,使得易發(fā)性分區(qū)精度呈現(xiàn)過飽和的趨勢[12]。為此,本文引入Mahalanobis 距離[13],利用頻率比作為數(shù)值[14],應(yīng)用步進(jìn)式方法進(jìn)行相關(guān)性檢驗。
Mahalanobis 距離表示數(shù)據(jù)協(xié)方差距離,由于其充分考慮了兩組數(shù)據(jù)集間的特征與聯(lián)系,可以利用其計算兩組數(shù)據(jù)集的相似度,是進(jìn)行數(shù)據(jù)相關(guān)分析常用方法之一[15]。頻率比(FR)表示分級后的評價因子中,各分級對易發(fā)性的影響程度[16],其定義如下:
圖1 易發(fā)性評價因子
其中:N1表示分類內(nèi)地質(zhì)災(zāi)害柵格數(shù);N2表示分類柵格數(shù);S1表示研究區(qū)地質(zhì)災(zāi)害總柵格數(shù);S2表示研究區(qū)總柵格數(shù),當(dāng)FR>0 表示該分類區(qū)間有利于地質(zhì)災(zāi)害發(fā)生;當(dāng)FR<0 表示該分類區(qū)間不利于地質(zhì)災(zāi)害發(fā)生(見表1)。Mahalanobis 距離計算基于SPSS 完成。
經(jīng)因子相關(guān)性分析,最終確定12 類因子(巖性、坡度、DEM、地震動加速度、NDVI、斷裂帶距離、降雨量、水系距離、POI 點密度、地形起伏度、坡型、道路距離)顯著性小于0.05,即該12 類因子無相關(guān)性,可以進(jìn)行模型構(gòu)建(見圖1)。
信息量模型是信息理論延伸出的預(yù)測模型,理論基礎(chǔ)是將地質(zhì)災(zāi)害各影響因子單獨進(jìn)行分析。將各因子分級后,各分級狀態(tài)對地質(zhì)災(zāi)害易發(fā)性影響程度不同,影響程度即為信息量,信息量數(shù)值可以表示地質(zhì)災(zāi)害與影響因子之間的關(guān)系[17-18]。
總信息量為:
其中,I(Xi,Z)是評價因子Xi(i=1,2,3...)的信息量,其中:N1表示分類內(nèi)地質(zhì)災(zāi)害柵格數(shù);N2表示分類柵格數(shù);S1表示研究區(qū)地質(zhì)災(zāi)害總柵格數(shù)。
信息量值如表1 所示。
Logistic 模型主要應(yīng)用于醫(yī)學(xué)領(lǐng)域,屬于線性回歸的一種。其對結(jié)果進(jìn)行二分類,一般結(jié)果可用1 和0 代表發(fā)生與未發(fā)生,由于Logistic 模型對評價因子包容性好,即評價因子可以是連續(xù)型變量也可以是非連續(xù)型變量且客觀公正,目前廣泛應(yīng)用于易發(fā)性分區(qū)中[14]。但Logistic 模型計算繁瑣,進(jìn)行易發(fā)性分區(qū)精度不如信息量模型等缺陷也制約其在易發(fā)性分區(qū)中大規(guī)模應(yīng)用。計算公式為:
其中P 為結(jié)果發(fā)生的概率,β0為常數(shù)項,βi為非常數(shù)項系數(shù),使用頻率比,基于SPSS 計算Logistic 模型系數(shù),計算結(jié)果見表2。
表1 信息量表
表2 Logistic 模型計算表
針對信息量模型忽略各評價因子對地質(zhì)災(zāi)害易發(fā)性貢獻(xiàn)率不同的缺陷,采用Logistic 模型系數(shù)作為信息量法權(quán)重,在ArcGIS 中使用柵格計算器進(jìn)行圖層計算。
由于使用的Logistic 模型系數(shù)是不依賴主觀評判,所以該耦合模型既避免AHP 法主觀定權(quán)的缺陷,又保留信息量法精度高、簡單易行、運算速度快的優(yōu)勢,同時避免Logistic 模型計算繁瑣、精度較低的弊端。計算公式為:
圖2 宜賓市地質(zhì)災(zāi)害易發(fā)性分區(qū)
圖3 ROC 曲線
將上述12 類評價因子進(jìn)行疊加分析,利用自然斷點法將研究區(qū)分為三類,分別為低易發(fā)區(qū)、中易發(fā)區(qū)和高易發(fā)區(qū)(見圖2)
從圖2 可知,屏山縣、筠連縣、興文縣地質(zhì)災(zāi)害發(fā)生頻繁,宜賓縣、翠屏區(qū)、南溪區(qū)等地質(zhì)災(zāi)害發(fā)生率低。結(jié)合DEM、坡度、巖性等信息可知,高易發(fā)區(qū)大多位于山區(qū)且坡度較陡處,巖性以粉砂巖或者泥巖為主的地區(qū)。
信息量模型計算得到的高易發(fā)區(qū)多于耦合模型得到的高易發(fā)區(qū);但兩個模型易發(fā)區(qū)走勢基本一致,初步證明分區(qū)結(jié)果準(zhǔn)確。
本文應(yīng)用ROC 曲線計算AUC 值進(jìn)行精度驗證。ROC 曲線又稱為受試者特性曲線,是醫(yī)學(xué)上常用的關(guān)聯(lián)性分析方法,其通過設(shè)定閾值來表達(dá)觀測量與結(jié)果的關(guān)聯(lián)度,關(guān)聯(lián)度越高,表明觀測值與發(fā)生結(jié)果越緊密,其精度也越高。AUC 值為ROC 曲線下方與坐標(biāo)軸構(gòu)成的面積,對ROC 曲線進(jìn)行積分運算,值越大表明擬合度越高。由于其簡單便捷,也常常被用來進(jìn)行易發(fā)性分區(qū)制圖精度的檢驗[19]。本文綜合前人經(jīng)驗[19]設(shè)定閾值為0.5,通過驗證組數(shù)據(jù)進(jìn)行驗證,經(jīng)計算,信息量模型AUC 值為0.749,信息量-Logistics 耦合模型AUC 值為0.756,結(jié)果表明耦合模型精度更高(如圖3)。
本文通過信息量模型與Logistics 模型進(jìn)行耦合,利用Logistics 模型系數(shù)表示各評價因子重要程度為信息量模型賦予權(quán)重,改進(jìn)了信息量模型忽略評價因子對易發(fā)性貢獻(xiàn)率不同的弊端,提高了易發(fā)性分區(qū)結(jié)果的精度。經(jīng)計算,信息量模型精度為74.9%,信息量-Logistics 耦合模型精度為75.6%,結(jié)果表明耦合模型精度更高,該方法簡單易行,不受人為因素干擾,既保留信息量法計算速度快,原理簡單的優(yōu)勢,又避免Logistics 模型精度較低,計算繁瑣的弊端,客觀公正,可以作為易發(fā)性分區(qū)的模型。