關 穎,程 瑤,王東興
(1.南京國圖信息產(chǎn)業(yè)有限公司,黑龍江 哈爾濱 150000;2.中國測繪科學研究院,北京 100830)
新疆位于我國西北邊陲,面積約166萬平方公里。由于人類活動頻繁、地質構造復雜、巖體破碎、獨特的水文氣象等自然因素,促使新疆地區(qū)地質災害頻發(fā)。而且不同區(qū)域的地質災害表現(xiàn)形式不同、危害強度影響范圍也不同[1]。根據(jù)新疆應急辦提供的數(shù)據(jù),全疆范圍內在1920—2007期間共發(fā)生滑坡災害1700余次,泥石流1 600余次,崩塌4 400余次。2012年由于地質災害使新疆區(qū)域的直接經(jīng)濟損失更是達3 000余萬元??梢姷刭|災害給人們的生命財產(chǎn)安全及政府的防災減災工作構成了嚴重威脅。因此,亟需探索符合新疆區(qū)域實際地質災害情況的評估方法模型。
隨著GIS技術在在災害評價領域的作用日益凸顯,我國災害評估的不再局限于傳統(tǒng)的定性研究,已經(jīng)向定量化方向發(fā)展。中南大學的匡樂紅學者基于粗糙集理論對AHP方法進行改進優(yōu)化,從而確定指標因子的權重[2];柳依莎等人運用GIS方法選取高程、坡度及主要交通公路等指標因子,構建信息量模型對研究區(qū)域進行危險性評價[3];張麗君運用貝葉斯概率模型進行滑坡災害敏感性分析[4];多元回歸的分析方法被應用到滑坡災害的空間分布評價中[5]等。在眾多理論模型中,統(tǒng)計學方法受到了學者的青睞,因為它不需要收集詳細的邊坡數(shù)據(jù),運用起來方便靈活。
但基于統(tǒng)計模型對大區(qū)域的評價,研究者會直接面臨“分級”樣本量化會造成模型不準確的問題,因此可利用“直接提取真實值”的方式來解決這個問題。根據(jù)新疆區(qū)域的實際情況,在相關地質災害評價理論的基礎上,從孕災和致災兩個角度出發(fā)構建指標體系,將GIS技術和Logistical方法集成構建符合新疆實際特點的危險性評價模型。最后以滑坡為例,對新疆地質災害危險性進行綜合評估。
新疆地域遼闊,地形地貌變化復雜,地勢高低差異大,斷裂帶發(fā)育明顯,構造運動活躍,地質環(huán)境脆弱,因此在特殊條件下極易誘發(fā)各類地質災害,并且暴發(fā)頻率高,影響范圍廣。新疆歷史災害點的具體空間分布如圖1所示。
圖1 歷史災害點空間分布
在1920—2007年期間,經(jīng)過分析統(tǒng)計,發(fā)現(xiàn)約70%的滑坡災害發(fā)生在伊犁河谷地區(qū)。巨型和大型滑坡事件累計約66次,集中分布在新源縣地區(qū);泥石流災害大部分事件集中在克孜勒蘇柯爾克孜自治州、喀什地區(qū)西南部、昌吉回族自治州的南部及巴音郭楞蒙古自治州北部等區(qū)域。巨型和大型泥石流事件累計約59次;大型和巨型崩塌事件約30次。
本文研究所用的數(shù)據(jù)來自新疆1∶5萬的信息資料,主要包括DEM數(shù)據(jù)、土地利用、斷層構造、地層巖性、道路及歷史災害點和隱患點等。首先由于數(shù)據(jù)來源不同,并且考慮到新疆面積較大及試驗中會涉及面積、長度等的計算,因此統(tǒng)一采用Alberts等面積投影。
其次評價過程中會涉及空間疊加運算,因此需要將各專題數(shù)據(jù)柵格化。根據(jù)李軍對不同比例尺下柵格大小的選擇問題提出的經(jīng)驗公式[6],將柵格的大小確定為30 m。依托ArcGIS平臺對各專題數(shù)據(jù)和DEM進行轉換和重采樣處理。
Gs=7.49+0.000 6S-2.0×10-9S2+
2.9×10-15S3.
式中:S為原始DEM精度的分母,Gs為適宜網(wǎng)格的大小。
區(qū)域地質災害評價通常是根據(jù)研究區(qū)域的地形地貌背景、地質構造條件、誘發(fā)因素以及人類工程活動的狀況,對一定的區(qū)域范圍內地質災害可能發(fā)生的地點、時間及造成的損失所進行客觀的評價[7]。地質災害的危險性評價需要遵循一定的原理和方法,這樣才能科學、合理的對區(qū)域展開評價。
敏感性評價:它用于回答“什么地方容易發(fā)生地質災害”。其實質是利用區(qū)域中已發(fā)生地質災害的相關信息(災害的密度,強度,概率大小),再結合潛在影響地質災害性的因素,如斷層構造、高程分布、巖性、水文氣象等進行客觀分析評價,進而劃分區(qū)域災害敏感區(qū)。敏感性評估只對潛在的空間分布研究,不考慮時間概率。
危險性評價:是在敏感性的基礎上結合誘發(fā)因素如降雨、地震及融雪等外在因素,是其自然屬性的體現(xiàn)。Westen等學者認為地質災害危險性主要受時間概率和空間概率兩個因素的制約影響[8],即
地質災害危險性概率=時間概率×空間概率.
如果把地質災害的發(fā)生看作為一種“隨機事件”,那么地質災害危險性評估的實質則是分析出地質災害何時再次發(fā)生及可能性的大小[9]。
從敏感性和危險性評價的定義中,不難看出危險性評價應按照敏感性評價—危險性評價的順序遞進進行。敏感性評價是危險性評價的重要基礎。敏感性評價側重于解決在什么樣的條件下“哪里”容易發(fā)生災害,危險性側重于“何時”發(fā)生災害。因此不難理解敏感性評價注重于對模型的分析研究,同時更是關系到區(qū)域危險性評價結果的準確性的關鍵所在。因此在遵循相關理論的基礎上,采取的技術路線如圖2所示。
圖2 技術路線
地質災害是多因素相互作用的結果,因素之間的關系也錯綜復雜。在查閱相關文獻的基礎上[10],從地質災害孕災環(huán)境和致災因子兩方面考慮構建指標體系(見圖3)。孕災環(huán)境是內在因素,主要指研究區(qū)域自身所處的自然環(huán)境條件:地形地貌、地質結構等條件;致災因子主要是指對地質災害的產(chǎn)生起到誘發(fā)作用的外界因素:降雨、融雪和人類大型工程活動等。
圖3 評價指標體系
基于統(tǒng)計分析的理論模型是近年被很多學者普遍采用的方法,它不需要搜集詳細邊坡物理數(shù)據(jù),主要在分析災害事件的分布與若干指標因子的相關關系和規(guī)律的基礎上,進而判斷區(qū)域發(fā)生災害可能性的大小,具有客觀性。邏輯回歸方法(Logistic)是典型統(tǒng)計學方法之一。它的優(yōu)勢在于進行統(tǒng)計分析時,對自變量的分布未作任何要求,可以是連續(xù)變量,也可以是離散變量等,在一定程度上增強了模型的應用范圍和靈活性[11]。
3.2.1 基本原理
Logistic模型方法屬于典型的二分類變量的統(tǒng)計方法,即因變量y只有0和1,其中1表示“災害已發(fā)生”,0表示“災害不發(fā)生”。其評價結果在0-1之間,因此可以用概率來解釋,具有實際意義。地質災害事件發(fā)生的概率可用Logistic模型方法為
P=eβ0+β1x1+…+βnxn/(1+eβ0+β1x1+…+βnxn),
(1)
Q=1-P=1/(1+evβ0+β1x1+…+βnxn).
(2)
式中:P代表地質災害發(fā)生概率的大小,Q則代表地質災害不發(fā)生概率的大小,且Q+P=l。x1,x2,x3,…,xn代表指標因子。
將P與Q進行Logit變換,取其對數(shù)ln(odds),odds表示某種結果的概率與不出現(xiàn)的概率之比的比值。 Logit變換可寫成:
β2x2+…+βnxn.
(3)
式中:β0,β1,…,βn稱為Logistical回歸系數(shù)。其中P值反映研究區(qū)域在各指標因子的綜合影響,災害發(fā)生敏感性的高低。
3.2.2 樣本量化方法
Logistical方程的系數(shù)受樣本量化制約性較強。地質災害評價,傳統(tǒng)的量化方法是將指標因子分成若干二級子類,用各二級子類包含的災害點數(shù)目或災害點密度度量其敏感性。但由于評價區(qū)域面積較大,通過大量實驗發(fā)現(xiàn),這樣的方法既破壞了數(shù)據(jù)的連續(xù)性也缺少關聯(lián)性,并會導致某些因子的系數(shù)與實際情況不符,如道路、斷層因子的系數(shù)為正值,即隨著距離的增加地質災害的可能性增大。
針對上述情況,為使得模型達到最優(yōu)狀態(tài),本文不將因子做分類處理。具體方法如圖4所示。
1)連續(xù)數(shù)據(jù)直接獲取其真實值并歸一化到0~1之間,消除量綱影響。對于不能直接獲取其連續(xù)值的因子(公路、斷層等),將新疆區(qū)域格網(wǎng)化,每個格網(wǎng)中心點會有“l(fā)abel”點。將所有“l(fā)abel”點的集合近似看作是“整個”新疆,然后利用ArcGIS工具箱中的“Near”工具獲取每個“l(fā)abel”點到公路、斷層的距離。
2)分類變量則以“啞變量”的形式引入。啞變量為變量的一種定義方式,用來度量兩個級別或若干級別分類變量之間的差異性,這樣可以避免一個系數(shù)擬合的不足,使結果更加準確[12]。
4.1.1 樣本點采集及相關性檢驗
新疆共有1 201個滑坡點,將其分為兩部分:模型訓練點(601個),測試點(600個)。在滑坡點30 m緩沖區(qū)以外的區(qū)域隨機生成1 000個非樣本點,這樣可以避免地理空間距離太近帶來的影響。其中,500個作為訓練點,500個作為測試點。所以最終得到1 101個訓練樣本點,1 100個測試點。提取屬性值后剔除無效的邊界點(1個),即最后有1 100個訓練點將用于模型訓練。
在評價因子中,坡度、坡向等地形地貌因子都是根據(jù)DEM提取出來的,這些因子或與其它因子之間若存在多元共線性的問題[13],則會對模型帶來影響。因此用SPSS17.0對指標因子進行多重共線性關系檢驗。在容忍度(Tolerance)和方差膨脹因子(VIF)彼此間互為倒數(shù)。若容忍度指標值越小,則說明因子間的共線性現(xiàn)象越嚴重。當其低至0.1以下時,則表明共線性嚴重,此時就要慎重或適當?shù)奶幚砗笤龠M行Logistical分析。表1分析結果顯示7個自變量因子之間不存在明顯的相關性。
表1 因子相關性統(tǒng)計表
4.1.2 模型計算
將1 100個滑坡數(shù)據(jù)訓練樣本點導入SPSS軟件中分析,經(jīng)多次迭代和對模型校正后,Logistical分析結果顯示:高程、坡度、斷層、巖性及道路因子對應的顯著性Sig.值均小于0.05。而坡向因子的Sig.值卻遠遠大于0.05,因此不被納入評估模型。以啞變量形式引入的巖性和土地利用分類因子整體的回歸系數(shù)差異性顯著,但是卻出現(xiàn)同一分類變量的不同啞變量之間一些具有統(tǒng)計學意義而另一些不具備的現(xiàn)象,為保證啞變量代表含義的正確性和模型精度,根據(jù)“同進同出”的原則,將巖性和土地利用兩個指標因子都納入模型。因此最終構建的滑坡敏感性Logistical方程如下:
4.778×Xslope-4.667×Xdem-10.045Xrode-
(4)
其中,P為滑坡災害空間預測的概率,Xslope,Xdem,Xrode,Xslipe為坡度、高程、道路及斷層因子值,βlituology,βlanduse為巖性、土地利用的啞變量回歸系數(shù)。
由模型匯總擬統(tǒng)計表2可以看出,模型擬合程度較好,進行敏感性評價?;旅舾行灶A測最終的結果是預測出區(qū)域中每個格網(wǎng)發(fā)生災害的概率。Can等學者通過研究:在檢驗空間預測分布圖效果時,應該考慮兩個方面的因素:第一,歷史地質災害點應盡量的落在“高易發(fā)”的敏感區(qū)內;第二,高易發(fā)區(qū)的面積不宜過大,因此他主張采用0~0.25,0.25~0.5,0.5~0.75,0.75-1的分級評估體系[14]。吳樹仁[15]建議評估結果制圖劃分的等級不宜太細,一般分3~5級,并且從低級到高級顏色逐級加深。綜上考慮,在ArcGIS平臺將各因子圖層疊加獲取每個格網(wǎng)單元概率值P,按照0~0.25,0.25~0.5,0.5~0.75,0.75~1劃分為四級(圖5所示),分別代表不易發(fā)區(qū)、低易發(fā)區(qū)、中易發(fā)區(qū)和高易發(fā)區(qū)。
表2 邏輯回歸模型擬合統(tǒng)計
4.1.3 模型驗證
敏感性的評價結果是危險性評價的重要基礎,因此需要對敏感性評估的精確度進行檢驗。通過測試點(1 100個)提取新疆發(fā)生滑坡敏感性概率的預測值采用正確率擬合(切割值為0.6)與ROC曲線的AUC值行驗證,具體結果如表3所示。
表3 預測率檢測與AUC
當AUC≥0.9時則認為模型有很高地準確性,因此構建的模型具有較高的準確性與合理性。這是對模型本身預測效果的評價。為對滑坡空間預測分布圖的效果進一步評判,將通過新疆滑坡歷史滑坡點(1 201)去驗證模型的預測效果(見表4)。發(fā)現(xiàn)落在中、高易發(fā)區(qū)的災害點數(shù)目占到災害點總數(shù)的94%左右,并且高易發(fā)區(qū)域內的滑坡點密度最高。進一步說明了實驗構建的模型在地質災害敏感性評估中的有效性和科學性。
危險性評價主要針對災害何時發(fā)生的“時間概率”而言。但對于“什么時候會發(fā)生地質災害”這樣的問題卻很難回答。新疆環(huán)境氣象研究中心的譚艷梅等專家通過分析、挖掘歷史數(shù)據(jù)信息(洪水和地質災害的關系),發(fā)現(xiàn)新疆地質災害頻繁發(fā)生的區(qū)域內,災害事件的空間分布與降水分布有一致性[16]??梢娊涤陮π陆刭|災害有著明顯的制約作用。因此轉換思路,將“降雨”作為時間的度量單位實現(xiàn)對新疆滑坡地質災害危險性的評價,在敏感性評估的基礎上疊加時況降雨分級圖從而得到評估結果。
降雨的時況數(shù)據(jù)很難獲取,因此通過氣象站預報的天氣進行評價。一般天氣預報以“小雨”、“小到中雨”等的形式預報。選取新疆某一天的天氣情況,將降雨按新疆當?shù)靥鞖忸A報進行量化,陣雨—4,小雨—6,中雨—10,大雨—24,暴雨—48。最后通過普通克里格方法獲得全疆的降雨預報分布圖,如圖6所示。
表4 預測結果與實際滑坡對比
圖6 新疆預報降雨分布模擬
自然斷點法是在分級數(shù)確定的情況下,通過聚類分析的原理將相似性最大的數(shù)據(jù)分在同一等級,差異最大的則分在不同的等級[17]。因此最后將新疆滑坡地質災害敏感性區(qū)劃與降雨分布疊加,利用自然斷點法將結果分四級:低危險、中度危險、較高危險和高危險類別,具體結果如圖7所示。
從危險性評估結果看,新疆伊犁河谷地區(qū)發(fā)生滑坡地質災害的危險性很高,這與降雨插值模擬的結果相吻合:伊犁河谷地區(qū)雨量接近10 mm左右,在新疆屬于中到大雨的級別,因此與敏感性疊加發(fā)生災害的危險性理應很高。
本文充分吸收Logistical的核心思想,解決大區(qū)域的評價預測過程中樣本量化的問題。在綜合GIS技術和Logistical方法的各自優(yōu)點基礎上,建立危險性評價模型。并以新疆滑坡災害為例,對滑坡災害的危險性進行評估。結果表明GIS技術和統(tǒng)計學方法相融合,對大區(qū)域地質災害危險性進行評估的研究具有可行性和實踐意義。
作為初步研究成果,在模型設計中仍有一些問題有待改進,如地質災害形成機理復雜,并非是線性系統(tǒng),嘗試對非線性模型引入從而對現(xiàn)有成果進行優(yōu)化;對于大區(qū)域的評價應具有針對性,研究合適的格網(wǎng)劃分。
參考文獻:
[1] 陳亞寧,李衛(wèi)紅.新疆干旱區(qū)地質災害研究[J].海洋地質與第四紀地質,1995,15(3):122-125.
[2] 匡樂紅,徐林榮,劉寶琛.組合賦權法確定地質災害危險性評價指標權重[J].地下空間與工程學報,2002,2 (6):1063-1067.
[3] 柳伊莎,楊苗.基于信息量模型的地質災害危險性評價研究[J].重慶師范大學學報,2012,29(4):35-38.
[4] 張麗君,江思宏.區(qū)域性滑坡敏感性評價的數(shù)據(jù)驅動權重模型及應用[J].水文地質工程地質,2004(6):33-36.
[5] 韋浩.多元回歸分析法在滑坡空間預測中的應用[D].西安:長安大學,2011:47-64.
[6] 李軍,周成虎.基于GIS柵格滑坡風險評價方法中格網(wǎng)大小選取分析[J].遙感學報,2003,7(2):86-92.
[7] 周偉.基于Logistic回歸和SINMAP模型的白龍江流域滑坡危險性評價研究[D].蘭州:蘭州大學,2012.
[8] 齊信,唐川,鐵永波,等.基于GIS 技術的汶川地震誘發(fā)地質災害危險性評價—以四川省北川縣為例[J].成都理工大學學報,2010,37(2):160-163.
[9] 邱海軍.區(qū)域滑坡崩塌地質災害特征分析及其易發(fā)性和危險性評價研究[D].西安:西北大學,2012,99-102.
[10] 杜繼穩(wěn).降雨型地質災害預報預警—以黃土高原和秦巴山區(qū)為例[M].北京:科學出版社,2010.
[11] 方苗,張金龍,徐瑱. 基于GIS和Logistic回歸模型的蘭州市滑坡災害敏感性區(qū)劃研究[J].遙感技術與應用,2011,26(6):846-852.
[12] 張文彤,董偉.SPSS統(tǒng)計分析高級教程[M].北京:高等教育出版社,2013:168-171.
[13] 司康平,田源,汪大明,等.滑坡災害危險性評價的3 種統(tǒng)計方法比較—以深圳市為例[J].北京大學學報(自然科學版),2009,45(4):19-32.
[14] CAN T, NEFESLIOGLU H A,GOKCEOGLU C,et al. Susceptibility assessments of shallow earthflows triggered by heavy rainfall at three catchments by logistic regression analyses[J].Geomorphology, 2005, 72: 250- 271.
[15] 吳樹任,石菊松.地質災害風險評估技術指南初論[J].地質通報,2009,28(8):996-999.
[16] 譚艷梅, 蔣軍,蔡仁,等.地質災害臨界雨量及潛勢預報模型研究[J].新疆氣象,2006,29(3):1-5.
[17] 廖永豐,趙飛,王志強,等.2000-2011年中國自然災害災情空間分布格局分析[J].災害學,2013,28(4):55-60.