連浩, 周愛紅,2*, 樂婧瑜
(1.河北地質(zhì)大學城市地質(zhì)工程學院, 石家莊 050031; 2.河北省地下人工環(huán)境智慧開發(fā)與管控技術(shù)創(chuàng)新中心, 石家莊 050031)
大量研究表明,邊坡失穩(wěn)會導致崩塌、滑坡等常見的地質(zhì)災害,對社會經(jīng)濟、人民財產(chǎn)和工程建設等安全造成巨大的威脅,因此能夠準確預測邊坡穩(wěn)定性狀態(tài)具有重要的意義[1-3]。影響邊坡穩(wěn)定性的因素復雜多樣,如何建立合理的評價模型來反映多個影響因素與邊坡穩(wěn)定狀態(tài)之間的聯(lián)系,對邊坡穩(wěn)定性研究至關(guān)重要。
目前應用于邊坡穩(wěn)定性的預測模型眾多,如王鵬飛[4]建立灰色系統(tǒng)理論和RBF(radial basis function)神經(jīng)網(wǎng)絡組合模型對邊坡變形進行預測,能夠更好地抵抗預測數(shù)據(jù)序列中的波動性,保持邊坡穩(wěn)定性預測的良好精度;方慶紅等[5]建立了強度折減法和BP(back propagation)神經(jīng)網(wǎng)絡模型,用于確定坡態(tài)控制參數(shù)優(yōu)化與穩(wěn)定性之間的非線性關(guān)系;孫吉書等[6]通過建立相關(guān)向量機模型對邊坡安全系數(shù)進行了預測;楊勇等[7]建立基于隨機權(quán)重法改進的粒子群算法優(yōu)化極限學習機模型,可以有效提高ELM(extreme learning machines)模型的穩(wěn)定性;劉君浩等[8]選用隨機森林和神經(jīng)網(wǎng)絡方法對巖質(zhì)邊坡進行了變形預測;張化進等[9]采用5種自動機器學習對邊坡穩(wěn)定性狀態(tài)進行預測, 并與傳統(tǒng)機器學習方法對比分析; 傅楊攀等[10]將CSMR(Chinese system for SMR)分類體系和卷積神經(jīng)網(wǎng)絡相結(jié)合,對廣東某巖質(zhì)邊坡進行穩(wěn)定性預測分析;張?zhí)惖萚11]建立了Box-Jenkins模型預測邊坡穩(wěn)定系數(shù)時間序列數(shù)據(jù),得到循環(huán)荷載作用下的邊坡穩(wěn)定系數(shù)的變化規(guī)律。
上述模型在邊坡穩(wěn)定性預測中都取得了不錯的實際效果, 但是仍存在收斂速度較慢、計算結(jié)果不穩(wěn)定、泛化性能差、易陷入局部最優(yōu)和預測精度較低等問題。鑒于此,現(xiàn)結(jié)合ISSA具有求解精度高、穩(wěn)定性強、收斂速度快等特點,SVM適用于解決小樣本數(shù)據(jù)及非線性問題的特性,建立ISSA-SVM邊坡穩(wěn)定性預測模型對邊坡穩(wěn)定性狀態(tài)進行預測,為邊坡防治工程提供重要參考。
在自然、人工條件下影響下,邊坡均有可能從穩(wěn)定狀態(tài)轉(zhuǎn)為失穩(wěn)狀態(tài),其穩(wěn)定性受到眾多因素影響,大致可分為以下幾類:①物理力學性質(zhì):包含邊坡的黏聚力、內(nèi)摩擦角、孔隙壓力比、重度等;②邊坡的幾何特征:包含邊坡高、邊坡角、邊坡幾何現(xiàn)狀;③降雨作用;④地震作用;⑤人類工程活動:包含開挖、爆破等一系列工程措施。
對于上述所提到的5類影響邊坡穩(wěn)定性的因素,中外學者有著不同的評價標準,通過對于前人選取指標的歸納總結(jié),大部分專家學者采用巖土體重度(γ)、黏聚力(C)、內(nèi)摩擦角(Φ)、邊坡高(H)、邊坡角(β)、孔隙壓力比(ru)6項因素作為邊坡穩(wěn)定性判別的輸入數(shù)據(jù)[12-15]。
根據(jù)1.1節(jié)得到的結(jié)論,為使模型測試數(shù)據(jù)更具有普適性,選取文獻[16-19]中所涉及的中外邊坡工程實例作為數(shù)據(jù)庫,所選邊坡應涉及不同高度、坡度、類型,并繪制小提琴圖(圖1)。通過圖1可以看到,本文所選的6項影響因素的最大最小值、平均值、主要分布范圍,由巖土體重度、黏聚力、內(nèi)摩擦角的分布可知本文所選取的邊坡包含巖質(zhì)邊坡及土質(zhì)邊坡,由邊坡高度分布可知本文所選取的邊坡包含超高邊坡、高邊坡、中邊坡、低邊坡,由邊坡坡度分布可知本文所選取的邊坡包含緩坡、中等坡、陡坡。
圖1 影響因素小提琴圖Fig.1 Violin diagram of influencing factors
以文獻[16-19]中選取邊坡工程實例,作為訓練樣本數(shù)據(jù)集,同時為了避免不同文獻中出現(xiàn)相同的樣本數(shù)據(jù)造成模型訓練過擬合,對上述訓練樣本數(shù)據(jù)剔除重復數(shù)據(jù),最終選用193組數(shù)據(jù)作為訓練樣本數(shù)據(jù)(部分數(shù)據(jù)見表1),以文獻[20]中選取的39個邊坡工程實例作為測試樣本數(shù)據(jù)集(部分數(shù)據(jù)見表2),以重度、黏聚力、內(nèi)摩擦角、邊坡角、邊坡高、孔隙壓力比作為評價邊坡穩(wěn)定性的影響因素,取邊坡穩(wěn)定狀態(tài)為評價結(jié)果,其中穩(wěn)定邊坡、不穩(wěn)定邊坡,分別用1、0表示。
表1 訓練樣本Table 1 Training samples
表2 測試樣本Table 2 Test samples
在機器學習中,若樣本數(shù)據(jù)間存在較強的相關(guān)性關(guān)系,則會導致模型出現(xiàn)過擬合問題[21]。為提高模型的預測精度,防止模型出現(xiàn)過擬合問題,文章利用皮爾遜系數(shù)進行數(shù)據(jù)相關(guān)性分析,得到6個影響因素之間的兩兩關(guān)系,具體如表3所示。一般認為相關(guān)性系數(shù)越接近于1相關(guān)性關(guān)系越強,其中0.7~1為強相關(guān),0.4~0.7為中度相關(guān),小于0.4為弱相關(guān),表3中影響因素大于0.5的因素有2個,為重度與邊坡角、重度與邊坡高,其余因素之間的相關(guān)性均小于0.5,表明參數(shù)之間的相關(guān)程度均為非強相關(guān),可以采用巖土體重度、黏聚力、內(nèi)摩擦角、邊坡角、邊坡高度、孔隙壓力比6項因素作為邊坡穩(wěn)定性輸入?yún)?shù)。
表4 預測結(jié)果對比表Table 4 Comparison table of forecast results
麻雀搜索算法是一種基于麻雀種群中的覓食和反捕食行為提出的種群智能優(yōu)化算法[22]。麻雀種群可分為發(fā)現(xiàn)者和跟隨者、警戒者。發(fā)現(xiàn)者、跟隨者和警戒者的位置更新公式為
(1)
式(1)中:t為當前迭代次數(shù);itermax為最大迭代次數(shù);Xi,j為第i個麻雀在第j維中的位置信息;α∈(0,1]為一個隨機數(shù);Q為服從正態(tài)分布的隨機數(shù);L為元素值為1的d維列向量;R2和ST分別為預警值和安全值,R2∈[0,1],ST∈[0.5,1]。
(2)
式(2)中:Xp為當前發(fā)現(xiàn)者所占最優(yōu)位置;Xworst為當前全局最差位置;A為元素隨機賦值1或-1的1×d矩陣,且A+=AT(AAT)-1。
(3)
式(3)中:Xbest為當前全局最優(yōu)位置;β為步長控制參數(shù);K∈[-1,1]為隨機數(shù);fi為當前麻雀個體的適應度值;fg、fw分別為全局最佳和最差適應度值;ε為最小常數(shù)。
麻雀搜索算法容易出現(xiàn)性能差、收斂速度慢、陷入局部最優(yōu)的問題。基于以上原因,選用ISSA算法對上述不足進行改進[23]。其改進方面主要包含:對初始化麻雀種群采用立方混沌映射[24],并使用透鏡成像反向?qū)W習方法增加更優(yōu)解的選取概率[25];將雞群優(yōu)化算法中隨機跟隨策略引入跟隨者位置更新公式[26];采用柯西高斯變異策略解決局部最優(yōu)停止問題[27]。
SVM是一種基于VC維理論(Vapnik Chervonenkis dimension,VC)和結(jié)構(gòu)風險最小原理建立的機器學習方法[28-29]。在低維空間難以處理的數(shù)據(jù)集,SVM可通過非線性變換將輸入空間變換到一個高維空間中,在這個空間中構(gòu)造最優(yōu)分類面,該平面不僅可以正確分開兩類訓練樣本,還可以使其分類間隔達到最大,提高預測精度。具體求解過程如下。
設給定的樣本{(xi,yi),i=1,2,…,n},xi為樣本數(shù)據(jù)中的各項評價指標,yi為相對應的評價結(jié)果。假設xi為第一類,則yi=1;xi屬于第二類,則yi=-1,將超平面記為wTx+b=0,為使所有樣本正確分類且具有分類間隔,需滿足約束條件為
yi(wTx+b)≥1
(4)
式(4)中:w為權(quán)重向量,定義了特征空間中的一個超平面,將不同類別的樣本分開;b為決策邊界的偏置項,調(diào)整了決策邊界的位置。
(5)
引入Lagrange函數(shù),將最小值求解問題轉(zhuǎn)化為相應的對偶問題,即
(9)
式(6)中:αi、αj為拉格朗日乘子;xm、xn為第m、n個樣本的特征向量;ym、yn為第m、n個樣本的類別標簽。
(7)
得到最優(yōu)分類函數(shù),即
(8)
對表1中的訓練樣本進行歸一化后,以6項影響因素作為輸入、以邊坡穩(wěn)定狀態(tài)作為輸出建立SVM模型。并通過ISSA算法對SVM的懲罰函數(shù)C和核函數(shù)g進行優(yōu)化取值。ISSA算法的初始參數(shù)為:初始麻雀數(shù)量pop=30,最大迭代次數(shù)100,預警值ST=0.6,發(fā)現(xiàn)者比例PD=0.7,警戒者比例SD=0.2;其參數(shù)的ISSA尋優(yōu)過程如圖2所示,經(jīng)過多次迭代尋優(yōu)后,最終確定SVM模型參數(shù)最優(yōu)值C=100,g=100.009。
由圖2可知,使用ISSA智能算法對SVM邊坡穩(wěn)定性預測模型參數(shù)進行迭代尋優(yōu)時,算法初始收斂速度較快,表明引入精英混沌反向?qū)W習策略后,極大地提升了算法的收斂速度,且迭代曲線呈階梯式下降,表明引入雞群算法和柯西-高斯變異策略后,較好地避免陷入局部最優(yōu)問題,并在7次迭代之后,適應度值趨于收斂。
圖2 ISSA算法參數(shù)尋優(yōu)Fig.2 ISSA algorithm parameter optimization
將訓練樣本代入該模型進行回歸仿真訓練,得到圖3所示的混淆矩陣圖。由圖3可知訓練樣本中的穩(wěn)定邊坡共有110個,其中109個預測正確,1個預測錯誤,模型判別正確率為99.09%,不穩(wěn)定邊坡共有83個,全部預測正確,模型判別正確率為100%,ISSA-SVM模型的總體判別正確率為99.49%,邊坡穩(wěn)定性預測模型具有較高的預測精度。
圖3 混淆矩陣圖Fig.3 Confusion matrix diagram
通過上述建立的ISSA-SVM預測模型對測試樣本中的邊坡穩(wěn)定狀態(tài)進行預測,模型測試集的預測結(jié)果如下表4所示,ISSA-SVM模型在僅19號樣本發(fā)生了誤判,模型判別正確率為97.44%,SSA-SVM模型在12、13、19號樣本發(fā)生了誤判,模型判別正確率為92.30%,表明經(jīng)過改進優(yōu)化的麻雀搜索算法具有更高的預測精度。同時在進行100次迭代時,ISSA-SVM模型總用時16.19 s,SSA-SVM模型總用時44.39 s,表明ISSA算法大幅提高了運算速率。
為了評估模型的預測性能,引入ROC(receiver-operating characteristiccurve,ROC)曲線作為衡量標準。ROC曲線是基于真正率和假正率評估預測模型性能的一種方法,具有直觀易懂、較好的魯棒性等優(yōu)點,因此在機器學習中采用ROC曲線可以更加直觀地評估預測模型的性能,其精度通過曲線下面積(area under roc curve, AUC)表征,AUC值越接近于1認為模型越好[31-32]。圖4為ISSA-SVM、SSA-SVM模型的ROC曲線圖,其中ISSA-SVM模型的AUC為0.987,SSA-SVM模型的AUC為0.932,表明相比較SSA算法,ISSA算法優(yōu)化后的SVM模型具有更好地預測精度、更好的魯棒性以及更不易出現(xiàn)過擬合問題的優(yōu)點,可以用于邊坡穩(wěn)定性預測。
圖4 ROC曲線圖Fig.4 ROC plot
測試集19號樣本被誤判為不穩(wěn)定邊坡,其可能原因是:通過對比訓練集和測試集數(shù)據(jù),發(fā)現(xiàn)183號訓練集樣本與19號測試集樣本6項影響因素的值均一致,其對應的邊坡穩(wěn)定狀態(tài)應該一致,但來源于文獻[18]的訓練集183號樣本的邊坡穩(wěn)定狀態(tài)為不穩(wěn)定,而來源于文獻[20]測試集19號樣本的邊坡穩(wěn)定狀態(tài)為穩(wěn)定,表明可能其中一篇文獻數(shù)據(jù)有誤。而ISSA-SVM模型在使用183號樣本進行訓練后將測試集19號樣本預測為與183號樣本一致的穩(wěn)定性狀態(tài),符合模型預測邏輯,這從另一角度反映出ISSA-SVM模型具有較好的訓練能力,能有效挖掘已知樣本的內(nèi)部規(guī)律。
在機器學習中探究影響因素對輸出結(jié)果的敏感程度,可以為邊坡穩(wěn)定性判斷提供更加可靠的參考依據(jù),因此本文研究采取灰色關(guān)聯(lián)度分析法(GRA)進行敏感性分析,具體結(jié)果如圖5所示。
圖5 影響因素關(guān)聯(lián)度圖Fig.5 Influencer correlation chart
由圖5可知,通過灰色關(guān)聯(lián)度分析法,確定各影響因素敏感性分析結(jié)果如下:內(nèi)摩擦角(0.957)>黏聚力(0.953)>邊坡高(0.928)>巖土體重度(0.874)>邊坡角(0.851)>孔隙壓力比(0.835)。依據(jù)灰色關(guān)聯(lián)度理論一般認為關(guān)聯(lián)度大于0.8,影響因素與邊坡穩(wěn)定性狀態(tài)之間關(guān)聯(lián)程度較高,因此本文所選取的6項指標可以用于邊坡穩(wěn)定性預測模型,并且內(nèi)摩擦角和黏聚力是對邊坡穩(wěn)定性最敏感的兩個因子。
根據(jù)相關(guān)研究理論,通常認為邊坡角對于邊坡穩(wěn)定性影響的重要程度大于巖土體重度,與本文研究通過GRA法得到的各影響因素敏感性排序有所區(qū)別,因前文提到邊坡高和巖土體重度間有較高的相關(guān)關(guān)系,為探究是否因兩者間相關(guān)關(guān)系過高導致巖土體重度的敏感性大于邊坡角的敏感性,本文研究采用分布回歸法進行中介效應檢驗,如表5所示。通過表5可知,模型1中巖土體重度與邊坡穩(wěn)定性狀態(tài)存在顯著影響關(guān)系, 模型2中巖土體重度與邊坡高存在顯著影響關(guān)系,且在模型3巖土體重度與邊坡穩(wěn)定性狀態(tài)無顯著性關(guān)系。因此說明邊坡高在模型中的中介作用成立,并且為完全中介。因此認為灰色關(guān)聯(lián)度分析法中巖土體重度對于邊坡穩(wěn)定性影響的敏感性大于邊坡角是受到了邊坡高的影響。
表5 中介效應檢驗表Table 5 Mediation effect check table
(1)ISSA算法具有求解精度高、穩(wěn)定性強、收斂速度快等特點,可以高效準確地尋找SVM模型所需最優(yōu)參數(shù)。利用ISSA-SVM邊坡穩(wěn)定性預測模型,對測試集數(shù)據(jù)進行預測,模型判別正確率為97.44%,表明該模型能夠準確地預測邊坡穩(wěn)定狀態(tài)。同時利用ROC曲線對測試樣本進行檢驗,其中ISSA-SVM模型的AUC=0.987,表明ISSA-SVM模型具有較好的泛化能力,可以用于預測邊坡穩(wěn)定性。
(2)影響邊坡穩(wěn)定性的因素復雜多樣,本文通過灰色關(guān)聯(lián)度法對選取的6個因素進行敏感性分析,各因子敏感性大小依次為:內(nèi)摩擦角、黏聚力、邊坡高、巖土體重度、邊坡角、孔隙壓力比。其中內(nèi)摩擦角、黏聚力兩個因素的關(guān)聯(lián)度值最高,與邊坡穩(wěn)定性狀態(tài)有較強的影響關(guān)系,在邊坡防治中可以采取針對性的監(jiān)測措施,從而進行邊坡失穩(wěn)預警。
(3)本文建立的ISSA-SVM邊坡穩(wěn)定性預測模型取得了較好的預測效果,但受限于所收集數(shù)據(jù)僅為邊坡物理力學性質(zhì)、邊坡的幾何特征這兩類因素,缺少了對外力作用(降雨、地震等)、人類工程活動作用對邊坡穩(wěn)定性的影響,因此在邊坡防治工程中,除了借鑒本文所提供的研究方法外,還應注重其他影響因素的作用。