劉亞靜, 劉紅健
(1.華北理工大學礦業(yè)工程學院, 唐山 063210; 2.唐山市資源與環(huán)境遙感重點實驗室, 唐山 063210;3.河北省礦山生態(tài)修復工業(yè)技術(shù)研究院, 唐山 063210; 4.河北省礦業(yè)開發(fā)與安全技術(shù)重點實驗室, 唐山 063210)
地震是由地球板塊運動引起的地表振動或破壞,會加大海嘯、滑坡、崩塌、地裂縫等次生災害的發(fā)生概率[1],地震高發(fā)地帶往往也成為地質(zhì)災害頻發(fā)區(qū)[2]。中國幅員遼闊,東西部位于板塊交界地帶,地殼活動頻繁劇烈,復雜的地質(zhì)構(gòu)造為地質(zhì)災害發(fā)育提供了孕災條件,導致地震及地質(zhì)災害頻發(fā)[3]。據(jù)統(tǒng)計,中國2021年共發(fā)生5級以上地震37次,地質(zhì)災害4 772起。因此,對地震帶災害多發(fā)區(qū)進行地質(zhì)災害風險監(jiān)測和評價,了解其空間易發(fā)性和控制因素對于制訂應對策略以降低風險至關(guān)重要。
地質(zhì)災害易發(fā)性是指在一定地質(zhì)環(huán)境條件下區(qū)域發(fā)生地質(zhì)災害的概率[4],據(jù)應急管理部的數(shù)據(jù)顯示,中國69%的國土面積存在較高滑坡、泥石流、崩塌等地質(zhì)災害風險,近10年因災害導致的直接經(jīng)濟損失達4 000多億元。雖然中國每年在防災減災領域投入大量人力物力,但受限于經(jīng)濟發(fā)展和技術(shù)水平制約,取得效果有限[5]。地質(zhì)災害易發(fā)風險研究經(jīng)歷了從地球觀測數(shù)據(jù)進行實地調(diào)查及制圖到基于包括全球定位系統(tǒng)(global positioning system,GPS)、地理信息系統(tǒng)(geographic information system,GIS)、遙感(remote sensing,RS)的3S技術(shù)構(gòu)建地質(zhì)災害風險評價體系的發(fā)展過程,主要可分為定性研究和定量研究[6]。目前主要的研究模型可分為以層次分析法(analytic hierarchy process,AHP)[7]、證據(jù)權(quán)[8]、信息量[9]為代表的統(tǒng)計分析模型及以隨機森林(random forest,RF)、神經(jīng)網(wǎng)絡(artificial neural network,ANN)[10]、支持向量機(support vector machine,SVM)[11]等機器學習算法為代表的數(shù)學分析模型,以地理空間分析技術(shù)為載體,應用于地質(zhì)災害評價與監(jiān)測領域[12]。如楊銳等[13]以加權(quán)信息量的方法對榆社縣的地質(zhì)災害易發(fā)性進行分析評價;Pei等[14]基于隨機森林模型分析了橫斷山區(qū)風險災害的空間格局及控制因素;Han等[15]基于貝葉斯神經(jīng)網(wǎng)絡模型實現(xiàn)了地震災害鏈的危險性制圖;丁茜等[16]建立了基于徑向基函數(shù)(adical basis function,RBF)核的多分類SVM評價模型運用到滑塌易發(fā)性分析領域。
由于地質(zhì)條件的復雜性,地質(zhì)災害易發(fā)性評價的指標因子難以統(tǒng)一量化,而且傳統(tǒng)經(jīng)驗統(tǒng)計分析評價模型在因子定權(quán)時大多采取等權(quán)或主觀判斷因子權(quán)重的方式,往往導致與因子實際權(quán)重不符,無法體現(xiàn)因子與地質(zhì)災害間的關(guān)聯(lián)程度,導致最終結(jié)果與實際有較大誤差[17]。為了修正傳統(tǒng)經(jīng)驗模型的局限性,目前大多采用統(tǒng)計分析模型和數(shù)學分析相結(jié)合的方法,建立綜合評價模型來分析災害易發(fā)性,代表性的有隨機森林-頻率比(RF-FR)模型[18]、信息量-SVM模型[19]、邏輯回歸-隨機森林(LR-RF)模型[20]等,相比于傳統(tǒng)模型,優(yōu)化的綜合評價模型往往具有更高的預測精度[4]。
信息量模型在避免主觀判斷的基礎上能夠反映因子對因變量的貢獻程度[9],客觀地反映評級結(jié)果,但其未考慮評價指標權(quán)重,無法解釋指標對因變量的貢獻程度[21]。而隨機森林(RF)作為基于集成學習的算法,是目前應用廣泛的機器學習算法之一,具有泛化能力強、平衡誤差、處理高維數(shù)據(jù)的優(yōu)點[22]。因此,在信息量模型基礎上,建立信息量耦合隨機森林的綜合評價模型,以彌補單一模型的局限性?,F(xiàn)以四川松潘-較場地震帶的平武縣為例,選取地形地貌特征、地層地質(zhì)條件、氣象水文、地震帶發(fā)育特征、土壤植被、人類工程活動影響6個方面的22個影響因子,以信息量模型、信息量-AHP模型、信息量-RF 3種評價模型對研究區(qū)地質(zhì)災害易發(fā)性進行分析,探索適用地震帶區(qū)域的地質(zhì)災害易發(fā)性評價方法,從而為當?shù)貫暮︻A測及防治工作提供有效參考。
平武縣位于四川省綿陽市西北部,地理坐標31°59′31″N~33°02′41″N,103°50′31″E~104°59′13″E;屬于四川盆地西北部的盆周山區(qū),位居涪江上游,其地勢西北高、東南低,處于中國三大構(gòu)造域接合部位,中、新生代構(gòu)造運動強烈,具有典型的山地地貌,主要由近南北走向的岷山山脈、近東西走向的摩天嶺山脈和近北東至南西走向的龍門山脈組成,海拔1 000 m以上的山地占轄區(qū)面積的90%以上,地勢起伏突出,高差懸殊,因地處中緯度地帶,地貌受控于地質(zhì)構(gòu)造,因此地形地貌多樣。氣候?qū)儆诒眮啛釒降貪駶櫦撅L氣候,降水充足,氣候溫和,年平均降水量約866 mm。全縣面積約5 950 km2,大部分地區(qū)處于松潘-較場地震帶,屬于地震及地質(zhì)災害頻發(fā)區(qū),近期最嚴重的是3·16平武7.2級大地震,崩塌、滑坡、泥石流等因斜坡巖土體運動導致的約占地質(zhì)災害總數(shù)的83%。平武縣地理位置及災害點分布如圖1所示。
圖1 研究區(qū)地理位置及災害點分布Fig.1 Geographical location of the study area and distribution of disaster sites
地質(zhì)災害數(shù)據(jù)來源于中科院資源環(huán)境科學與數(shù)據(jù)中心的地質(zhì)災害點空間分布數(shù)據(jù);數(shù)字高程模型(digital elevation model,DEM)數(shù)據(jù)來源于國家地理空間數(shù)據(jù)云的GDEMV3 30 m高程數(shù)據(jù)集,用以坡度、坡向、剖面曲率、地形粗糙度、地形起伏度、坡向變率、河網(wǎng)及地形濕度指數(shù)(topographic wetness index,TWI)等指標因子的提取;降水量、斷層分布、地震點歷史數(shù)據(jù)來源于國家地球系統(tǒng)科學數(shù)據(jù)中心;地震動峰值加速度數(shù)據(jù)是基于《中國地震動參數(shù)區(qū)劃圖》(GB 18306—2015)矢量化制作;土壤侵蝕數(shù)據(jù)來源于中科院李佳蕾等[23]制作的中國水蝕區(qū)土壤侵蝕數(shù)據(jù)集;地貌類型來源Hartmann等[24]的30 m精度地貌類型柵格數(shù)據(jù)集;地層巖性數(shù)據(jù)是由Sayre等[25]的250 m精度柵格數(shù)據(jù)重采樣得到;土壤類型數(shù)據(jù)來源于中國土壤數(shù)據(jù)庫;精細地表覆蓋數(shù)據(jù)來自劉良云、張肖制作的全球30 m精細地表覆蓋產(chǎn)品;路網(wǎng)、興趣點(point of interest,POI)矢量數(shù)據(jù)基于網(wǎng)絡爬蟲獲取。
層次分析法(AHP)是一種基于多目標決策問題而提出的一種層次權(quán)重決策分析方法[26]。根據(jù)決策者的經(jīng)驗判斷比較確定權(quán)重,從而為多目標、多準則或無結(jié)構(gòu)特性的復雜決策問題提供簡便的決策方法[27]。
層次分析法被廣泛應用于復雜決策分析問題。其核心過程為:根據(jù)1~9標度法構(gòu)造出判斷矩陣對評價指標兩兩進行比較,最終確定各指標因子的相對權(quán)重。用一致性比率(CR)來檢驗判斷矩陣合理性,當CR<0.1時,認為判斷矩陣一致性較好,即通過一致性檢驗。其公式為
(2)
式中:λmax為最大特征值;N為唯一非0特征根,即判斷矩陣的維數(shù);CI為定義的一致性指標,當CI=0,有完全的一致性,CI接近于0,有滿意的一致性;CI越大,不一致越嚴重;RI為引入的隨機一致性指標。
信息量模型,又稱雙變量統(tǒng)計模型[17],是以信息論、概率論和數(shù)理統(tǒng)計方法為基礎,以信息熵的概念通過信息量值表示地災影響因子的各個指標要素對地質(zhì)災害的貢獻程度,基于信息值分析地質(zhì)災害易發(fā)性的模型。通過指標分級,分析各指標因素等級對地質(zhì)災害發(fā)生的“貢獻率”,來判斷地質(zhì)災害發(fā)生難易程度,即I值。當信息量大于0時,表示該地區(qū)發(fā)生地質(zhì)災害的可能性較高;反之,當信息量小于0時,表示該地區(qū)發(fā)生地質(zhì)災害的可能性較低;信息量為0,表示該地區(qū)未發(fā)生地質(zhì)災害,可去除不作為預測要素。其表達式為
(3)
式(3)中:I為n種評價因子的總信息量值;Iij為第i個評價因子在第j分類下的信息量;Nij為第i個評價因子在第j分類下的地質(zhì)災害點數(shù)量;Sij為第i個評價因子在第j分類下的評價單元數(shù)量;N為該地區(qū)地質(zhì)災害點總數(shù)量;S為研究區(qū)內(nèi)評價單元總數(shù)。
隨機森林(RF)是由Leo Breiman和Adele Cutler提出的一種基于Bagging思想,根據(jù)多決策樹進行分類和回歸的集成學習算法[28]。其由多棵決策樹構(gòu)成,每棵決策樹都取決于獨立采樣的隨機向量值,其原理模型在進行分類預測時會根據(jù)N個樣本建立N個獨立的決策樹作為基分類器,并基于Bootstrap抽樣算法對初始訓練集進行多次抽樣,從訓練集中有放回地隨機抽取,得到N種分類結(jié)果,通過每顆決策樹對每個記錄采用投票方式進行判斷選擇最優(yōu)分類結(jié)果[29]。其模型公式為
(4)
式(4)中:F(X)為RF模型;fi(X)為某個單獨決策樹模型;Z為輸出變量(目標變量);I為示性函數(shù)。
相比于單一決策樹,隨機森林通過對樣本和特征隨機采樣的方法能夠明顯提高易發(fā)性評價模型的精度和穩(wěn)定性[30],且對大數(shù)據(jù)集、多維數(shù)據(jù)有強大的泛化能力,對異常值和噪聲等具有很強的容錯率[31],并且每棵樹的訓練樣本及節(jié)點的分裂屬性均為隨機選取,在其交互作用下避免了模型的過擬合效應[32],成為應用最為廣泛的機器學習算法之一。
為了保證評價單元內(nèi)部的統(tǒng)一性與單元之間的差異性,需要對評價單元繼續(xù)統(tǒng)一劃分,目前常用的方法主要有柵格單元、斜坡單元、子流域單元等[33]。其中,柵格和斜坡單元大多應用于地質(zhì)災害的易發(fā)性評價中。采用的基礎數(shù)據(jù)比例尺為1∶50 000,根據(jù)地質(zhì)災害特征及危害范圍,在參考前人研究經(jīng)驗的基礎上,采取30 m×30 m的柵格單元進行平武縣地質(zhì)災害易發(fā)評價模型,在ArcGIS軟件中共劃分6 613 214個基礎柵格單元,如圖2所示。
圖2 柵格單元劃分示意圖Fig.2 Grid cell division diagram
地質(zhì)災害的誘發(fā)原因是多種影響因素共同作用的結(jié)果,基于平武縣孕災地質(zhì)條件及人文環(huán)境,結(jié)合地質(zhì)災害發(fā)育特征等,主要從地形地貌特征、地層地質(zhì)條件、氣象水文、地震帶發(fā)育特征、土壤植被、人類工程活動影響等六大控制因素選取指標因子,共計選取22項指標,如圖3所示。
圖3 評價指標因子結(jié)構(gòu)圖Fig.3 Evaluation index factor structure chart
3.2.1 地形地貌
地形地貌是地質(zhì)災害的基礎控制因素,主要分為兩類,一類以DEM高程數(shù)據(jù)為基礎、基于ArcGIS軟件空間分析功能提取坡度、坡向、剖面曲率、坡向變率、地形粗糙度、地形起伏度6類地形因子,用來說明平武縣地表區(qū)域地形特征。其次為地貌類型分布特征。由圖4可知,平武縣地勢西高東低,最低點與最高點高差達4 752 m,山地溝壑縱橫,地表起伏度較大,地貌以中高海拔大起伏山地為主。
3.2.2 地層地質(zhì)條件
地層地質(zhì)條件主要包括地層巖性及斷裂帶分布,是地質(zhì)災害發(fā)育的重要內(nèi)在因素,影響災害的發(fā)育程度及規(guī)模特征。平武縣地層巖性以混合沉積巖和硅質(zhì)碎屑沉積巖為主,災害點主要分布在東南部的混合沉積巖地層中。地質(zhì)構(gòu)造控制巖層的巖體結(jié)構(gòu)及其組合特征,對地質(zhì)災害的發(fā)育起綜合控制作用,研究以距斷層距離來表達斷裂帶對地質(zhì)災害的影響程度,平武縣的斷裂帶主要中部及東部地區(qū),以500 m為步長建立多環(huán)緩沖區(qū)將距斷層距離分為5類,其中,東部地區(qū)位于平武-青川斷裂帶,這一地帶災害點分布較為密集,且主要集中分布在距斷層2 000 m范圍內(nèi)。
3.2.3 氣象水文
氣象水文指標包括地形濕度指數(shù)(TWI)、河網(wǎng)密度、年降水量,TWI是指區(qū)域地形對徑流流向和蓄積影響,能夠定量描述區(qū)域地表水分的空間分布情況。降水和河流侵蝕作為滑坡、泥石流的主要誘發(fā)因素之一,水力沖刷及侵蝕作用加大了災害發(fā)生概率。使用ArcGIS基于DEM數(shù)據(jù)提取平武縣河網(wǎng)分布,并基于核密度分析計算河網(wǎng)密度,平武縣年降水量較高,導致其河網(wǎng)水系發(fā)達,在起伏較大地區(qū)極易發(fā)生滑坡和泥石流危害。
3.2.4 地震帶發(fā)育特征
平武縣屬于亞歐板塊和印度洋板塊的分界地帶,屬于四川境內(nèi)的松潘-較場地震帶,地震及板塊運動活躍。選取地震點密度、地震烈度、地震動峰值加速度3個指標體現(xiàn)地震帶發(fā)育特征對災害易發(fā)性的影響。通過地震點密度體現(xiàn)地殼活躍程度對地表微型變化的影響。地震烈度作為衡量地震強度的重要指標,用來說明地震對地表及工程建筑物等的影響程度,而地震加速度值是指地震時地面運動的加速度,用作輔助確定烈度的依據(jù)。平武縣歷史地震點的震源中心大多集中在東南部,地震點密度和地震烈度也顯著高于西北部地區(qū),其分布特征與地質(zhì)災害分布呈現(xiàn)相似性。
3.2.5 土壤植被
植被覆蓋能有效降低產(chǎn)流產(chǎn)沙量,減少徑流量,改善土壤理化性質(zhì),提高土壤抗侵蝕能力,與土壤協(xié)同提高地表水土保持能力,降低滑坡、泥石流災害等發(fā)生概率。土壤植被指標主要包括歸一化植被指數(shù)(normalized difference vegetation index,NDVI)、精細地表覆蓋類型、土壤類型、土壤侵蝕率。根據(jù)圖4、圖5的分布特征可知,平武縣NDVI平均值為0.84,整體植被覆蓋水平較高。境內(nèi)土壤類型主要有黃棕壤、暗棕壤、黑氈土等,以黃棕壤為代表的壤土約占總面積的87.15%。不同植被對水土的保持能力不同,其地表覆蓋類型以常綠闊葉林、落葉闊葉林為主,地質(zhì)災害主要集中在以森林為主體的不透水表面、水體附近。土壤侵蝕是指土壤在水力、風力等外力作用下,被破壞、剝蝕和搬運的過程,土壤侵蝕速率體現(xiàn)出單位面積時間內(nèi)的土壤侵蝕程度,平武縣土壤侵蝕率較高的地區(qū)集中在西北至東南的走廊地帶以及東南地帶的龍門山脈地帶。
3.2.6 人類工程活動
人類工程活動包括興趣點(POI)密度和距道路距離,頻繁的工程建設活動會改變斜坡應力狀態(tài)及降低邊坡穩(wěn)定性,平武縣以山地為主,頻發(fā)的崩滑流災害對道路安全性具有重大威脅,伴隨其多雨氣候極易產(chǎn)生不穩(wěn)定斜坡增加危險性。以平武縣路網(wǎng)分布為基礎,根據(jù)災害體影響程度,與斷裂帶采取相同的分類方法以500 m步長為分類標準建立緩沖區(qū),研究區(qū)POI高密度區(qū)集中在中部及東南部,其中,東南部為災害集中區(qū)。
為了避免因子間多重共線性對評價模型的復合影響,從而降級預測精度,對選取的22個評價指標進行相關(guān)性分析,以剔除相關(guān)性較高的因子。當因子相關(guān)性絕對值系數(shù)大于0.5時,相關(guān)性較強,即認為因子間存在多種共線性,應剔除該因子;反之,因子相關(guān)性絕對值系數(shù)小于0.5,即相關(guān)性較低,因子間基本不會相互影響,可用于模型的預測分析。根據(jù)相關(guān)性分析結(jié)果可知,地形粗糙度、地形起伏度與坡度,距道路距離、地貌類型與DEM,年降水量、精細地表覆蓋類型與地震動峰值加速度的相關(guān)性均大于0.5,因此,將DEM、地形粗糙度、地形起伏度與地震動峰值加速度4項指標剔除,最終得到18項指標進行地質(zhì)災害易發(fā)性評價分析。
利用信息量模型將各評價因子狀態(tài)劃分,將數(shù)值連續(xù)狀態(tài)因子分為十級,其余因子根據(jù)各分級統(tǒng)計計算各評價因子各分級狀態(tài)的信息量,信息量數(shù)值越大表示對地質(zhì)災害發(fā)生的影響程度越高,計算得到各指標因子各等級的信息量值,疊加得到柵格對于地質(zhì)災害的總信息量值,將結(jié)果歸一化后根據(jù)概率比值按照自然間斷分級劃分為極高、高、中、低和極低5個易發(fā)區(qū)等級,如圖6所示。
圖6 基于信息量模型的災害易發(fā)性分區(qū)圖Fig.6 Disaster susceptibility partition map based on information volume model
在信息量模型的基礎上,采用層次分析法(AHP)根據(jù)專家打分對18個因子進行重要性排序, 根據(jù)構(gòu)造的判斷矩陣計算各指標因子權(quán)重,一致性檢驗結(jié)果CR=0.033<0.1,一致性檢驗通過,對信息量進行加權(quán)疊加。同上將結(jié)果歸一化后采用自然間斷法將AHP-信息量模型結(jié)果分為5類等級,如圖7所示。
圖7 基于信息量-AHP模型的災害易發(fā)性分區(qū)圖Fig.7 Disaster susceptibility partition map based on information-AHP model
平武縣共395處地質(zhì)災害點,在此基礎上,隨機選取3倍于地質(zhì)災害點的1 185個非地質(zhì)災害點作為反向訓練樣本,根據(jù)隨機森林模型的分類要求,將發(fā)生過地質(zhì)災害的其余劃分為一類,記為“1”,未發(fā)生過地質(zhì)災害的其余劃分為另外一類,記為“0”,以此將地質(zhì)災害易發(fā)性研究問題轉(zhuǎn)變?yōu)槎诸悊栴}。共計1 580個訓練樣本,在劃分基礎數(shù)據(jù)集為訓練集與測試集的過程中,訓練集與測試集的比率劃分不恰當會影響模型的預測精度,因此參考相關(guān)文獻研究,將樣本集按照7∶3的比例劃分,即選取70%的樣本點作為訓練數(shù)據(jù),30%的樣本點作為測試數(shù)據(jù)。經(jīng)過模型訓練并獲取各指標因子的客觀權(quán)重,經(jīng)預測得到信息量-RF模型的易發(fā)性預測結(jié)果,同上分為5類,如圖8所示。
圖8 基于信息量-RF模型的災害易發(fā)性分區(qū)圖Fig.8 Disaster susceptibility zoning map based on information volume-RF model
AHP與RF都對指標因子的重要性進行分析,兩種模型的因子重要性對比如圖9所示。由圖9可知,AHP分析的因子重要性前三位為距道路距離、地震烈度、地震點密度,RF對訓練樣本分析的因子重要性前三位為地震點密度、土壤類型、距道路距離,地震點密度和據(jù)道路距離作為兩種方法公認的高貢獻指標,能更好地描述平武縣典型山地區(qū)地形因素對崩滑流等災害的誘發(fā)條件,RF模型分析的因子貢獻率兩極分化較為明顯,前五項指標的客觀權(quán)重達71.37%,AHP分析的因子權(quán)重呈現(xiàn)梯度下降的趨勢,并未出現(xiàn)斷崖式差距。
圖9 AHP與RF指標因子重要性比對Fig.9 Comparison of importance of AHP and RF index factors
從3種模型的結(jié)果可知,其地質(zhì)災害易發(fā)性分區(qū)呈現(xiàn)出相似的空間分布,極高易發(fā)區(qū)主要分布在東南部的水觀鄉(xiāng)、南壩鎮(zhèn)、響巖鎮(zhèn)等地,以及在中部以龍安和古城鎮(zhèn)為中心向周圍分散的條帶分布,大部分極高易發(fā)區(qū)屬于高山河谷地帶,涪江的支流水系貫穿此地,暴雨和洪水災害較多,其引發(fā)的泥石流、滑坡也較為集中,其次,龍門山斷裂帶貫穿此地,地震頻發(fā)導致的地表運動劇烈也是重要的誘發(fā)原因,應對此地重點防治及監(jiān)測。高易發(fā)區(qū)重要集中在極高易發(fā)區(qū)的邊緣地帶,以壩子鄉(xiāng)、豆叩鎮(zhèn)、大印鎮(zhèn)分布最廣,大多位于斷裂帶邊緣,地質(zhì)災害較為集中,可作為次防治區(qū)觀察??傮w上平武縣的地質(zhì)災害易發(fā)特征表現(xiàn)為西北低風險、東南高風險及中部條帶性的聚集性分布,但相較于另外兩種評價模型,信息量-RF模型的極高和高易發(fā)區(qū)范圍較小,地質(zhì)災害點分布密度也更為聚集。為更直觀進行對比分析,對3種模型的分類結(jié)果進行分區(qū)統(tǒng)計,結(jié)果如表1所示。
表1 分區(qū)統(tǒng)計結(jié)果
從對比結(jié)果來看,信息量-RF模型預測的高易發(fā)區(qū)和極高易發(fā)區(qū)面積分別為506.40 km2和194.84 km2,面積綜合占比為11.84%,低于信息量模型的30.70%和信息量-AHP模型的29.54%;信息量-RF模型的高易發(fā)區(qū)含有88個災害點,占比22.28%,災害點密度為0.174 個/km2,極高易發(fā)區(qū)含有283個災害點,占比71.65%,災害點密度為1.452 個/km2,高和極高易發(fā)區(qū)共包含了總災害點的93.92%,災害點占比與其余兩種模型接近,但從災害點密度對比結(jié)果分析來看,信息量-RF模型要顯著優(yōu)于另外兩種模型,尤其在極高易發(fā)區(qū),這種差異更為明顯。災害發(fā)生率體現(xiàn)了模型預測的相對準確性,發(fā)生率越高,說明地區(qū)災害點更為集中,發(fā)生地質(zhì)災害的相對概率也更大,對防治區(qū)劃等級劃分具有重大作用。信息量-RF模型預測的高易發(fā)區(qū)和極高易發(fā)區(qū)的發(fā)生率分別為2.032和44.146,要明顯高于信息量模型(0.497,3.490)和信息量-AHP模型(0.514,4.104),信息量-AHP模型經(jīng)過加權(quán)優(yōu)化后,相比于等權(quán)評價的信息量模型,其災害點密度、災害發(fā)生率要優(yōu)于信息量模型,但這種提升是有限的。從整體結(jié)果來看,3種模型分區(qū)結(jié)果符合災害點分布特征,高和極高易發(fā)區(qū)都解釋了約90%的地質(zhì)災害分布,而相比于等權(quán)信息量評定,經(jīng)專家打分修正權(quán)重的信息量-AHP模型對比分析結(jié)果要略優(yōu)于信息量模型,但相比于信息量-RF,其無論在災害集中程度,分區(qū)的精確程度均優(yōu)于其余兩種模型,但其在極低易發(fā)區(qū)存在極少的災害點數(shù)量,可能是對指標進行了過度擬合,導致與實際結(jié)果不符,在劃分防治區(qū)劃,應合理地進行人為規(guī)避,整體來看,信息量-RF模型的評價結(jié)果精準度較高,滿足預期。
為了進一步檢驗易發(fā)性評價模型的準確度和預測能力,采用受試者工作特征曲線(receiver operating characteristics,ROC)對3種模型的預測性能進行檢驗,以曲線下的面積(area under curve,AUC)對模型進行評價。AUC表示曲線下方與坐標軸圍成的面積,其中,X軸為假陽性率,即1-特異性,表示非災害點被錯誤預測的概率;Y軸為真陽性率,即敏感性,表示災害點被正確預測的概率,曲線越靠近左上角,面積越接近于1,說明模型分類的準確率越高,預測結(jié)果越正確。如圖10所示,信息量模型、信息量-AHP模型、信息量-RF模型的的AUC值分別為0.920、0.931和0.991,信息量-RF模型的預測精度高于其余兩個模型,說明基于信息量耦合隨機森林的綜合易發(fā)性評價模型比單一信息量模型、信息量-AHP模型更適用于預測類平武縣的地質(zhì)災害易發(fā)性。
圖10 ROC曲線評價模型對比Fig.10 Comparison of ROC curve evaluation models
以松潘-較場典型地震帶的平武縣為例,充分考慮孕災地質(zhì)環(huán)境因素,從地形地貌特征、地層地質(zhì)條件、氣象水文、地震帶發(fā)育特征、土壤植被、人類工程活動影響6個方面選取了22項地質(zhì)災害的誘發(fā)因子,采用信息量模型、信息量-AHP模型、信息量-RF模型對平武縣地質(zhì)災害進行易發(fā)性評價,得出結(jié)論如下。
(1)從分區(qū)統(tǒng)計對比結(jié)果來看,信息量-RF模型的高和極高易發(fā)區(qū)的災害點密度和災害發(fā)生率最高,信息量-AHP模型次之,信息量模型最差,說明采用信息量-RF的分類結(jié)果更具有針對性,能夠增加災害防治效率,有針對性地作出預測,防治成本較小。
(2)ROC精度分析結(jié)果顯示,信息量-RF模型的AUC值為0.991,高于信息量模型(0.920)和信息量-AHP模型(0.931),說明基于信息量耦合隨機森林的綜合易發(fā)性評價模型比單一信息量模型、信息量-AHP模型更適用于預測類平武縣的地質(zhì)災害易發(fā)性,具有較高的準確性、穩(wěn)定性以及良好的預測功能。