曹聰潔施冬韋原原
(1.長江大學,湖北 武漢 430100;2.鄭州師范學院,河南 鄭州 450000)
由于巖體的整體或局部穩(wěn)定性受到破壞,再加之重力作用的影響,巖體或其它碎屑會沿著一個或多個斷裂的滑動面向下滑動,這就是滑坡。當某一地區(qū)地形條件與那些發(fā)生過滑坡的地區(qū)的地形條件相當或者類似時,該地區(qū)即被認為是滑坡的易發(fā)地區(qū)。
中國是世界上滑坡災(zāi)害最為嚴重的國家之一,其中,黃土高原作為我國生態(tài)系統(tǒng)脆弱區(qū),要著重考慮。近年來,滑坡作為幾大重要的地質(zhì)災(zāi)害之一,其數(shù)量也在不斷以數(shù)以百計的比例逐年上升。由于人類工程活動等人為因素,以及一些非人為因素等自然條件的影響,使得滑坡災(zāi)害的發(fā)生率不斷增加,造成的損害愈來愈嚴重,嚴重地影響著滑坡易發(fā)地區(qū)工農(nóng)業(yè)等產(chǎn)業(yè)發(fā)展和生態(tài)環(huán)境的提升。
滑坡事故在危害人類的同時,也對自然界產(chǎn)生嚴重危害。不僅能夠?qū)χ脖缓屯翆咏Y(jié)構(gòu)產(chǎn)生破壞,而且還降低了土壤水分涵養(yǎng)能力,嚴重時還會危害土層自我修復功能,造成該地形成地質(zhì)災(zāi)害多發(fā)區(qū),破壞當?shù)厣鷳B(tài)環(huán)境,不利于可持續(xù)發(fā)展。
黃土高原滑坡災(zāi)害的發(fā)生與該地區(qū)的自然和人文條件,如地質(zhì)條件、氣候、人類活動等因素有著密不可分的聯(lián)系,可見,通過一定手段對黃土高原滑坡易發(fā)區(qū)未來可能發(fā)生的滑坡災(zāi)害做出準確預(yù)測,對人類及時、準確、快速地做好應(yīng)對措施,以減少對自然環(huán)境以及工農(nóng)業(yè)和人類生命安全的威脅,具有重要意義。
徐岳仁等基于歷史文獻分析、遙感解譯、野外驗證等方法獲得通渭地震滑坡數(shù)據(jù)庫并進行滑坡分析[1]。余璐采用改進的增長率敏感系數(shù)法對影響黃土高原重力侵蝕的地貌等因素進行敏感性分析[2]。決策樹的規(guī)則便于理解,計算量相對較小,分類速度快,相對于其它技術(shù)來說,需要的數(shù)據(jù)準備較少,可以處理不相關(guān)特征數(shù)據(jù),所以本文主要利用分類決策樹的方法以分析黃土高原區(qū)域滑坡風險發(fā)生率。
作為中國4大高原之一,黃土高原位于中國中北部,范圍大致為N33°41′~41°16′,E100°54′~114°33′,海拔約80~5000m,總占地面積約64萬km2[3]。黃土高原是世界上黃土面積覆蓋最大的高原,也是地球上分布最集中、面積最大的黃土區(qū),涵蓋了山西、陜西北部,以及甘肅、青海、寧夏、河南、內(nèi)蒙古等7個省,46個地(盟、州、市),282個縣(旗、市、區(qū)),所占面積40萬km2[4]。
黃土高原地區(qū)居于內(nèi)陸,遠離海洋,海洋水汽難以到達,且該地區(qū)處于我國季風區(qū)和非季風區(qū)的過渡地帶,該地氣候為溫帶大陸性季風氣候。冬季和春季,黃土高原受到西伯利亞高壓冷氣團的影響,盛行西北風,氣候寒冷干燥,風沙多;夏季和秋季,黃土高原受太平洋高壓和印度洋低壓的控制,盛行東南、西南季風,氣候炎熱多雨。黃土高原平均降雨量較低,蒸發(fā)量遠大于降水量,其總的趨勢是從東南向西北遞減。
黃土高原的地貌類型包括山、原(塬)、川3大地貌類型。山是指山地,原(塬)是指平坦的地面,川是指河谷平原。黃土高原擁有廣泛的山地、高原、丘陵和復雜的地質(zhì)地貌條件,因此更容易發(fā)生滑坡。
決策樹算法(Decision Tree)是數(shù)據(jù)挖掘中典型的分類算法,應(yīng)用廣泛。其主要是從一組無次序、無規(guī)則的事例中分析推理出分類規(guī)則,并用樹狀方式來表現(xiàn)[5]。
決策樹重要概念中的熵(Entropy),用來度量隨機變量的不確定性。隨機變量X的不確定性隨著熵的增大而增大。設(shè),X取有限值,其概率:
P(X=xi)=pi,i=1,2……n
(1)
則,隨機變量X的熵:
(2)
在決策樹的3種常見算法有ID3算法、C4.5算法以及CART,3種算法的比較如表1所示。
表1 算法比較
2.2.1 ID3算法
在決策樹的各級結(jié)點上,選擇信息增益最大的屬性作為分類結(jié)點,根據(jù)該屬性的不同取值分裂出各個子結(jié)點,隨后采用遞歸的方法建立決策樹的分支,直到樣本集中只含有一種類別時停止,得到最終的決策樹[5]。
2.2.2 C4.5算法
C4.5算法在ID3算法的基礎(chǔ)上做了一些改進,該算法選擇信息增益比最大的屬性作為分類結(jié)點,通過遞歸計算,對變量進行特征選擇,然后用最優(yōu)特征分割數(shù)據(jù)集,這個過程持續(xù)到所有實例中的子集都落在同一個類中[5]。
2.2.3 CART
CART(Classification And Regression Tree)是一種二分分類回歸樹[6]。當CART作為分類樹的時候,使用基尼指數(shù)最小化標準作為特征選擇的標準;當CART作為回歸樹的時候,使用樣本最小方差進行特征選擇。
本文選擇ID3算法,在決策樹的各級結(jié)點上,選擇信息增益最大的屬性作為分類結(jié)點,根據(jù)該屬性的不同取值分裂出各個子結(jié)點,隨后采用遞歸的方法建立決策樹的分支,直到樣本集中只含有一種類別時停止,得到最終的決策樹[7]。
本文中所用的黃土高原地區(qū)界限數(shù)據(jù)來源于全球變化科學研究數(shù)據(jù)出版系統(tǒng)官網(wǎng),一級河流及湖泊數(shù)據(jù)來源于麻辣GIS官網(wǎng),用來進行滑坡易發(fā)性評價的數(shù)據(jù)是通過全國DEM數(shù)據(jù)拼接、投影,并通過黃土高原邊界矢量數(shù)據(jù)按掩膜提取得到的。
對中國省級行政區(qū)劃數(shù)據(jù)與黃土高原地區(qū)界限數(shù)據(jù)進行疊加,保留黃土高原地區(qū)的省級行政區(qū)劃,生成黃土高原區(qū)劃圖;用相同方法對中國主要水系.shp數(shù)據(jù)進行處理,得出黃土高原水系分布專題圖;在ArcGIS中導入黃土高原數(shù)字高程圖,從高程圖中計算得到坡度專題圖,從專題圖中獲取所需要的坡度數(shù)據(jù);土壤質(zhì)地數(shù)據(jù)包括粘土、沙土、淤泥遙感影像數(shù)據(jù),將其與黃土高原矢量邊界進行按掩膜提取,得出黃土高原粘土、沙土、淤泥分布圖;再將其分別與滑坡點位數(shù)據(jù)進行疊置,得出各因子的滑坡點分布圖。
將指標進行如下分類:高程取值范圍={950m,1500m,2500m,5000m};坡度取值范圍={2°,20°,40°,70°};距河流遠近={>1km,≤1km};土壤等級={1,2,3};分類結(jié)果:滑坡風險等級={1,2,3},共有96個樣本數(shù)據(jù),建立樣本數(shù)據(jù)表。
表2 樣本數(shù)據(jù)表
樣本數(shù)據(jù)總數(shù)D=96,分類數(shù)目為3,其中滑坡風險等級為1級的數(shù)目是16,2級的數(shù)目是56,3級的數(shù)目是24,整體的信息熵:
=1.3850179
通過計算信息熵、信息增益,從根節(jié)點層層向下遞歸,選擇信息增益最大的屬性作為根節(jié)點,生成的決策樹如圖1所示。
在上述決策樹分析中可知,“距離河流遠近”是影響黃土高原滑坡發(fā)生的關(guān)鍵因素,所占權(quán)重最大;其次是“高程”和“坡度”;“土壤質(zhì)地”所占權(quán)重最小。所以,對以上各因子進行加權(quán)疊加時,應(yīng)合理設(shè)置各因子的影響值。這里設(shè)置的權(quán)重值:“距離河流遠近”占22%;“坡度”和“高程”分別占18%;“黏土”、“淤泥”、“沙土”分別占14%;“土壤等級”和“高程”所占權(quán)重最小。
本文選用坡度、距河流遠近、土壤質(zhì)地、高程作為黃土高原滑坡易發(fā)性評價指標。通過將黃土高原滑坡點位數(shù)據(jù)與這4類指標進行疊置分析,可通過ArcGIS重分類的方法將這4類指標劃分別分成3個等級,其中,一級表示滑坡發(fā)生最嚴重,以此類推。對沙土、黏土、淤泥分別進行重分類,對分類結(jié)果進行加權(quán)疊加,得出土壤等級。
坡度是地表面上某一點的切面和水平面所成的夾角,坡度值越大,地勢越陡峭;坡度值越小,地勢越平坦。對于滑坡來說,只有依附于斜坡才有可能發(fā)生滑坡,不同坡度的斜坡滑坡發(fā)生概率是不同的[8]。
黃土高原南部地區(qū)地勢低,支流眾多,結(jié)合滑坡數(shù)據(jù)分析,黃土高原滑坡災(zāi)害集中在南部黃河支流附近。對河流數(shù)據(jù)進行歐氏距離分析得出,在距河流1km范圍之內(nèi),滑坡點分布密集,是滑坡易發(fā)區(qū)。
通過研究黃土高原土壤類型與滑坡發(fā)生率的關(guān)系得出,在黃土高原南部,黏土和淤泥分布廣泛,滑坡發(fā)生率高;在黃土高原北部,沙土分布廣泛,滑坡發(fā)生率低。
不同海拔高度,反映了該地區(qū)地殼隆起的速度不同,即地質(zhì)構(gòu)造的作用不同,這必然會對坡體穩(wěn)定性產(chǎn)生影響[8]。黃土高原高程范圍為84~5206m。
使用ArcGIS軟件,將重分類的結(jié)果進行加權(quán)疊加,設(shè)置的權(quán)重值:“坡度”30%;“距河流遠近”26%;“土壤等級”和“高程”分別占22%,得出滑坡風險分析如圖2所示。
該決策樹和可視化分析結(jié)果表明,甘肅、寧夏、陜西、山西四省地形陡峭,黃河及其支流貫穿其中,地形復雜,峽谷交錯,滑坡災(zāi)害最為嚴重;青海省、寧夏回族自治區(qū)北部和河南省北部滑坡發(fā)生率次之,內(nèi)蒙古自治區(qū)有平坦的地形和河流較少,整體坡度小于或等于2°,是一個平坦開闊的高原,滑坡發(fā)生率最小。
由上述結(jié)果可知,沙質(zhì)土在黃土高原北部廣泛分布,淤泥質(zhì)和粘質(zhì)土在黃土高原中部和南部廣泛分布,所以在防治黃土高原滑坡災(zāi)害過程中,要因地制宜,具體問題具體分析。