張洪吉,趙 錚,陳建華,甘先霞,謝華偉,譚小琴
(1.四川省自然資源科學(xué)研究院,四川 成都 610015; 2.成都理工大學(xué) 地球物理學(xué)院,四川 成都 610059)
滑坡災(zāi)害的頻發(fā)每年給人類帶來巨大的生命和財產(chǎn)損失,據(jù)全國地質(zhì)災(zāi)害通報統(tǒng)計,2019年共發(fā)生地質(zhì)災(zāi)害6 181起,其中滑坡4 220起,占地質(zhì)災(zāi)害總數(shù)的68.27%,其中特別是伴隨著強(qiáng)降雨和地震過后的山區(qū)城鎮(zhèn)極易發(fā)生山體滑坡[1]?;挛kU性評價是研究區(qū)域滑坡發(fā)生的空間概率[2]。因此,高精度的滑坡危險性評價對于滑坡災(zāi)害的空間預(yù)測具有重要意義。
目前,國內(nèi)外學(xué)者使用大量的機(jī)器學(xué)習(xí)方法應(yīng)用于滑坡危險性評價,其中包括支持向量機(jī)[3-4]、信息量模型[5-6]、隨機(jī)森林[7]、決策樹[8-9]、人工神經(jīng)網(wǎng)絡(luò)[10-11]等,上述機(jī)器學(xué)習(xí)方法能夠較好地挖掘自變量與因變量的非線性關(guān)系來模擬滑坡影響因子與滑坡類別(滑坡或非滑坡)之間的復(fù)雜關(guān)系[12],并且取得了較高的預(yù)測精度。但是其通過直接對輸入數(shù)據(jù)進(jìn)行分類并不能從其中獲取更具代表性的特征來提高分類效果[13],同時也存在物理含義不明確等缺陷。
為了應(yīng)對上述問題,近年來深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)深受研究人員的青睞,卷積神經(jīng)網(wǎng)絡(luò)方法被大量地應(yīng)用于模式識別[14]、圖像處理[15-17]、地學(xué)研究[18-19]等領(lǐng)域。卷積神經(jīng)網(wǎng)絡(luò)因其多層網(wǎng)絡(luò)結(jié)構(gòu)而具有強(qiáng)大的數(shù)據(jù)表征能力,在模型擬合和學(xué)習(xí)能力上具有顯著的能力。但到目前為止,卷積神經(jīng)網(wǎng)絡(luò)方法還未在滑坡危險性評價中取得充分的應(yīng)用。因此,本文提出一種深度一維卷積神經(jīng)網(wǎng)絡(luò)方法,針對四川蘆山地區(qū)開展滑坡危險性評價方法研究,期望獲得更優(yōu)的評價效果,為滑坡危險性評價提供有力的評價方法。
蘆山縣位于四川盆地西緣,雅安市東北部。占地面積約為1 166.39平方公里,人口為119 886人。由于2013年蘆山發(fā)生7.0級地震,震源深度13 km,地震使得山體斜坡內(nèi)部受力發(fā)生改變,從而導(dǎo)致山體容易發(fā)生大面積滑坡。因此實(shí)驗(yàn)選擇蘆山縣作為研究區(qū)(圖1)。
圖1 研究區(qū)范圍Fig.1 Research area overview
滑坡危險性評價模型的性能主要取決用于訓(xùn)練的滑坡數(shù)據(jù)[20]。經(jīng)調(diào)查顯示2016年蘆山縣共有346個歷史滑坡點(diǎn),最大滑坡面積為16 000 m2,最小滑坡面積為200 m2,滑坡多發(fā)生于路網(wǎng)、水系兩側(cè)。為了開展實(shí)驗(yàn),通過各種途徑獲取了基礎(chǔ)數(shù)據(jù)集,如:從中國地震臺網(wǎng)獲取了蘆山縣2016年地震數(shù)據(jù),由蘆山縣自然資源和規(guī)劃局提供了水系數(shù)據(jù),從地理空間數(shù)據(jù)云獲取了30 m數(shù)字高程模型數(shù)據(jù)等。
滑坡的影響因子有上百種之多,合理地選擇滑坡影響因子對于構(gòu)建模型至關(guān)重要[21-22]?;碌挠绊懸蜃涌梢苑譃橐韵聨最悾旱乩砦恢谩⒌匦蔚孛?、地質(zhì)構(gòu)造、氣候與水文、人口與交通等。通過對蘆山區(qū)域環(huán)境條件的分析,選擇了坡度、坡向、巖性、土地利用、植被覆蓋度、降雨量、高程、人口密度、距斷層距離、距路網(wǎng)距離、距水系距離、距震中距離共計12個滑坡影響因子(表1)。
表1 影響因子Table 1 Evaluation factors
結(jié)合研究區(qū)評價尺度和方法,參考地質(zhì)災(zāi)害評價標(biāo)準(zhǔn),蘆山縣屬于面級、地方級、大比例尺的評價類型,結(jié)合遙感影像等相關(guān)數(shù)據(jù)資料,選定30 m×30 m的規(guī)則格網(wǎng)單元作為區(qū)域滑坡危險性的評價單元[24],最終將整個研究區(qū)劃分成大小為1 323 696個格網(wǎng)單元。
實(shí)驗(yàn)為了驗(yàn)證因子之間的相關(guān)性,采用多重共線性檢驗(yàn)對因子進(jìn)行相關(guān)性分析[25]。一般認(rèn)為,當(dāng)方差膨脹系數(shù)(Variance Inflation Factor,VIF)大于10時,因子之間線性相關(guān)。實(shí)驗(yàn)結(jié)果如表2所示。由表2可知,其VIF最大為高程因子,其值為5.907,故所選因子之間不存在相關(guān)性,可全部用于模型訓(xùn)練和測試。
表2 影響因子方差膨脹系數(shù)Table 2 VIF of evaluation factors
由于評價因子數(shù)據(jù)類型的多樣化,包括描述性數(shù)據(jù)及數(shù)值型數(shù)據(jù),因此實(shí)驗(yàn)需要對因子數(shù)據(jù)進(jìn)行分級處理,以便后期參與模型的訓(xùn)練及驗(yàn)證。實(shí)驗(yàn)結(jié)合滑坡數(shù)據(jù)分布特征,研究區(qū)范圍、各評價因子的數(shù)據(jù)特征等多個方面將評價因子的相關(guān)數(shù)據(jù)進(jìn)行分級,其對應(yīng)的評價因子分級圖如圖2所示。
圖2 蘆山縣滑坡危險性評價因子分級圖Fig.2 Classification maps of landslide risk assessment factors in Lushan
卷積神經(jīng)網(wǎng)絡(luò)是一種深度學(xué)習(xí)方法,本質(zhì)上仍是一種類似人工神經(jīng)網(wǎng)絡(luò)的多層感知器,一個基本的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)包括輸入層、卷積層、最大池化層、全連接層和輸出層。它能夠?qū)斎氲臄?shù)據(jù)進(jìn)行隱式的并行學(xué)習(xí),分層的特征提取,不需要事先定義輸入和輸出間的精確數(shù)學(xué)映射關(guān)系,具有強(qiáng)大的表征學(xué)習(xí)能力,能夠提取更多隱含特征。近年來被廣泛應(yīng)用于模式識別和圖像分類領(lǐng)域。典型的CNN結(jié)構(gòu)如圖3所示。
圖3 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 General structure of convolutional neural networks
在滑坡危險性評價中,研究區(qū)構(gòu)成的輸入數(shù)據(jù)可以視為一幅圖像,圖像中的每一個像素包含對應(yīng)的滑坡影響因子。因此輸入數(shù)據(jù)中的每一格網(wǎng)單元可以被視為長度為影響因子數(shù)量的一維向量,該向量中的每一個元素對應(yīng)一個滑坡影響因子?;诖?,實(shí)驗(yàn)構(gòu)建出一維卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network with One Dimension,CNN-1D),該網(wǎng)絡(luò)結(jié)構(gòu)由卷積層、最大池化層、全連接層組成。假設(shè)有n個滑坡影響因子構(gòu)成的長度為n的一維向量,經(jīng)過N個大小為m的卷積核卷積之后得到圖層為N個大小為(n-m+1)維的特征向量,特征向量中的每一個元素都對應(yīng)輸入數(shù)據(jù)中m×1的鄰域。假設(shè)最大池化層的大小為c,其輸出圖層為N個長度為(n-2m+1)/c+1的向量。具有k個神經(jīng)元的全連接層來表達(dá)池化層中所提取分離的特征信息。最后,實(shí)驗(yàn)使用輸出層中兩條神經(jīng)元來表達(dá)二分類問題,即滑坡或非滑坡。由于實(shí)驗(yàn)中選擇了12個滑坡影響因子,故該網(wǎng)絡(luò)結(jié)構(gòu)的參數(shù)為n=12,m=5,N=52,c=4,k=13。其網(wǎng)絡(luò)結(jié)構(gòu)及訓(xùn)練參數(shù)如圖4所示。
圖4 一維卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.4 Structure of CNN-1D
實(shí)驗(yàn)采用受試者特征工作曲線(Receiver Operating Characteristic Curve,ROC)和總體精度來驗(yàn)證模型的性能。ROC曲線能夠總體評價模型的性能[22],以橫軸表示滑坡危險性由高到低的面積累計百分比,縱軸表示對應(yīng)危險性指數(shù)下滑坡點(diǎn)數(shù)量的累計百分比,繪制成功率曲線并計算其線下面積值(Value of the Area Under the Curve,AUC)作為精度評價指標(biāo),曲線形狀越彎曲靠近圖像左上部則AUC值越大,也就說明滑坡危險性評價結(jié)果越好。
在上述實(shí)驗(yàn)數(shù)據(jù)處理的基礎(chǔ)上,通過統(tǒng)計分析研究區(qū)內(nèi)歷史滑坡點(diǎn)之間的距離,最終選擇在歷史滑坡點(diǎn)500 m以外的區(qū)域,利用創(chuàng)建隨機(jī)點(diǎn)工具產(chǎn)生與滑坡點(diǎn)等量的非滑坡點(diǎn),則構(gòu)成了數(shù)量為692個的總樣本數(shù)據(jù)集。按照8:1:1的比例將總樣本集分層隨機(jī)抽樣分為訓(xùn)練集、驗(yàn)證集和測試集三部分用于實(shí)驗(yàn)。利用CNN-1D、支持向量機(jī)(Support Vector Machine with Radial Basis Function,SVM-RBF)、加權(quán)信息量模型(Information Value Method,IVM)對全區(qū)數(shù)據(jù)進(jìn)行評價,利用GIS軟件生成滑坡危險性評價圖,采用自然斷點(diǎn)法將滑坡危險性劃分為高、中、低。實(shí)驗(yàn)為了驗(yàn)證CNN-1D模型的高精度特性,將使用性能良好的支持向量機(jī)模型、傳統(tǒng)統(tǒng)計理論方法信息量模型與其對比。其模型參數(shù)的設(shè)置如表3所示。
表3 模型參數(shù)設(shè)置Table 3 Parameter settings of models
實(shí)驗(yàn)采用CNN-1D和對照實(shí)驗(yàn)組中的SVM-RBF、IVM進(jìn)行滑坡危險性評價實(shí)驗(yàn),通過模型來評價全區(qū)1323696個格網(wǎng)單元的滑坡危險性概率,并在GIS軟件中繪制滑坡危險性評價圖。圖5(a)、(b)、(c)為相同實(shí)驗(yàn)數(shù)據(jù)集下針對CNN-1D和SVM-RBF、IVM模型預(yù)測的滑坡危險性評價圖。圖6為3種方法對應(yīng)的滑坡危險性高中低面積占比。從圖5中可以看出:滑坡高危險性區(qū)域主要集中在路網(wǎng)、水系處,圖5(a)中低危險性區(qū)域最多、中危險次之、高危險最少,其危險性區(qū)域面積占比分別為68%、18%、14%,符合實(shí)際情況。而圖5(b)中的低危險性區(qū)域和中危險區(qū)域面積大小均為40%,而高危險性區(qū)域接近20%,如此危險性分級圖使得在對應(yīng)區(qū)域的居民無法生存,不太符合實(shí)際情況。圖5(c)中的低、中、高危險性面積占比分別為51%、33%、16%,其危險性分級圖以及危險性面積占比相較SVM-RBF較為合理,但是其高危險區(qū)域主要分布在蘆山縣域中下部,且危險性分布較為密集,不太適合居民生活。從圖中可知,基于徑向基核函數(shù)的支持向量機(jī)模型對應(yīng)的預(yù)測結(jié)果呈現(xiàn)出大面積的中危險區(qū)域,使得低危險性區(qū)域較少,覆蓋范圍廣,大面積的覆蓋居民城鎮(zhèn)等地,其評價效果較差。而加權(quán)信息量模型中下部呈密集高危險性區(qū)域,其評價效果較差。因此,就危險性評價圖可知,CNN-1D模型的評價效果優(yōu)于SVM-RBF、IVM。就總體精度而言,CNN-1D和SVM-RBF的精度分別為0.9015和0.842,CNN-1D的總體精度遠(yuǎn)高于SVM-RBF,因此在精度指標(biāo)上考慮,CNN-1D的評價精度更值得信服。綜合滑坡危險性面積占比、總體精度等評價指標(biāo),從整體評價效果上看,SVM-RBF、IVM模型效果低于CNN-1D模型。
圖5 蘆山地區(qū)滑坡危險性評價分級圖Fig.5 Classification maps of landslide risk assessment in Lushan
圖7為相同實(shí)驗(yàn)數(shù)據(jù)集下3種方法對應(yīng)的ROC曲線。其ROC曲線線下面積表示的是AUC值。從圖中可知,CNN-1D、SVM-RBF、IVM的AUC值分別為0.888、0.876、0.818,說明在ROC曲線評價中,CNN-1D模型的預(yù)測能力表現(xiàn)得比SVM-RBF、IVM更好,其模型結(jié)果優(yōu)于SVM-RBF、IVM。因此,從總體精度、ROC曲線和分級區(qū)劃圖結(jié)果可知,一維卷積神經(jīng)網(wǎng)絡(luò)模型表現(xiàn)優(yōu)于支持向量機(jī)模型以及傳統(tǒng)的信息量模型方法,從模型應(yīng)用上來講,論文提出的一維卷積神經(jīng)網(wǎng)絡(luò)模型可有效應(yīng)用于相關(guān)滑坡危險性評價研究中。
論文提出了一種面向滑坡危險性評價的深度一維卷積神經(jīng)網(wǎng)絡(luò)方法,針對四川蘆山地區(qū)開展滑坡危險性評價結(jié)果是比較有效的,可以應(yīng)用于其它類似特征的區(qū)域。通過ROC曲線及總體精度進(jìn)行對比,支持向量機(jī)、信息量模型的AUC值低于深度一維卷積神經(jīng)網(wǎng)絡(luò),深度一維卷積神經(jīng)網(wǎng)絡(luò)的滑坡危險性評價總體精度明顯高于支持向量機(jī)模型、信息量模型。
相比支持向量機(jī)模型及信息量模型,在全區(qū)危險性評價分級結(jié)果圖上,深度一維卷積神經(jīng)網(wǎng)絡(luò)在蘆山地區(qū)危險性評價方面更符合實(shí)際情況,在模型的擬合和效果上優(yōu)于支持向量機(jī)、信息量模型。表明:相比于傳統(tǒng)機(jī)器學(xué)習(xí)方法,深度一維卷積神經(jīng)網(wǎng)絡(luò)由于其能夠挖掘更多更具代表性的特征信息,因此能夠取得更優(yōu)的模型性能。
致謝:感謝蘆山縣自然資源和規(guī)劃局、蘆山縣公安局、蘆山縣交通運(yùn)輸局、雅安市公共氣象服務(wù)中心、四川省地質(zhì)調(diào)查院、中國地震臺網(wǎng)、地理空間數(shù)據(jù)云網(wǎng)、美國地質(zhì)調(diào)查局、歐空局提供了實(shí)驗(yàn)所需的各類數(shù)據(jù)。感謝秦宇龍先生在實(shí)驗(yàn)中提供的支持。