王團輝,王 超,2,李岳峰,徐健琿,王琦瑋
(1.昆明理工大學(xué) 國土資源工程學(xué)院,云南 昆明650093;2.自然資源部高原山地地質(zhì)災(zāi)害預(yù)報預(yù)警與生態(tài)保護修復(fù)重點實驗室,云南 昆明650093)
近年來,隨著社會經(jīng)濟的不斷發(fā)展,巖土體工程數(shù)量快速增加,其中邊坡安全問題受到了越來越多的關(guān)注。邊坡失穩(wěn)可能會對人民生命財產(chǎn)安全造成重大影響[1-3],自然資源部2022年發(fā)布的2021年全國地質(zhì)災(zāi)害災(zāi)情統(tǒng)計數(shù)據(jù)顯示,我國發(fā)生的滑坡事故數(shù)量為2 335起,占地質(zhì)災(zāi)害總起數(shù)的48.93%,居于首位[4]。據(jù)2023年2月24日央視新聞報道,內(nèi)蒙古自治區(qū)阿拉善盟阿拉善左旗新井煤業(yè)有限公司礦區(qū)發(fā)生山體滑坡,造成6人死亡,47人失聯(lián)[5-6]。因此,邊坡失穩(wěn)防治是巖土工程的重要研究課題之一[7-8]。為了降低邊坡失穩(wěn)帶來的危害,開展邊坡穩(wěn)定性預(yù)測研究十分必要[9]。
目前,邊坡穩(wěn)定性預(yù)測通常分為定量和定性兩類方法。定性分析方法主要有地質(zhì)分析法、工程地質(zhì)類比法等[10-11],該類方法綜合考慮了影響邊坡的多種因素,但主觀性較強。定量分析方法包括確定性分析和不確定性分析,確定性分析主要采用極限平衡法和數(shù)值分析法[12-13]。邊坡工程是一個復(fù)雜的非線性系統(tǒng)[14],其穩(wěn)定性受多種不確定性因素的影響。不確定性方法在處理非線性問題上具有較好的預(yù)測效果,隨著人工智能算法的興起,不確定性分析已成為目前常用的分析方法,如模糊層次綜合評判法[15]、灰色關(guān)聯(lián)度分析[16]、支持向量機(SVM)[17]、BP神經(jīng)網(wǎng)絡(luò)[18]、K近鄰(KNN)[19]、隨機森林(RF)[20]等。鑒于邊坡巖土體的結(jié)構(gòu)、巖土體構(gòu)成及物理力學(xué)性質(zhì)的不確定性和非線性特點[9],國內(nèi)外學(xué)者多從降維的角度出發(fā)進行邊坡穩(wěn)定性研究,如:姚怡等[21]通過主成分分析(PCA)進行降維,消除指標(biāo)之間的相關(guān)性,建立了徑向核函數(shù)(ERBF)優(yōu)化的SVM模型;EANG等[22]采用層次聚類分析(HCA)和主成分分析(PCA)對邊坡穩(wěn)定性進行了預(yù)測;IVANOV等[23]通過主成分分析對土質(zhì)邊坡穩(wěn)定性的影響因素進行了特征提取;SANTOS 等[24]采用主成分分析、判別分析和置信度對露天礦邊坡穩(wěn)定性進行了評估;高峰等[25]利用PCA降低了數(shù)據(jù)的冗余性,建立了基于粒子群優(yōu)化算法的極限學(xué)習(xí)機模型;馮澤杰[26]利用Z-Score主成分分析及代數(shù)迭代算法(ART)提高了邊坡穩(wěn)定性的預(yù)測精度;陳建宏等[27]建立了PCA和BP神經(jīng)網(wǎng)絡(luò)的預(yù)測模型,對邊坡穩(wěn)定性進行了預(yù)測;高文華等[28]利用PCA優(yōu)化了BP神經(jīng)網(wǎng)絡(luò)的運行效率;宋鑫華等[29]建立了PCA-Logistic模型,其能夠有效處理樣本數(shù)據(jù),提升模型的準(zhǔn)確性。
以上研究都是基于PCA降維來消除指標(biāo)之間的相關(guān)性,鮮有學(xué)者運用升維思想即用高維空間的線性運算來代替原始空間的非線性運算[30]?;诖?本文利用核主成分分析(KPCA)方法,通過維數(shù)提升來挖掘高維空間中特征之間的關(guān)聯(lián),使處理后的數(shù)據(jù)更易于分類,建立基于KPCA-KNN算法的邊坡穩(wěn)定性預(yù)測模型,旨在提高模型的分類性能和效率。
KPCA是一種基于核方法的非線性主成分分析方法,其核心原理見圖1。核方法是一種基于核函數(shù)的學(xué)習(xí)算法,善于處理非線性問題,其核心思想是:將原始數(shù)據(jù)映射到更高維的空間進行線性運算,以減少計算量、提高運算效率。由于核主成分分析方法應(yīng)用較廣,在此不再贅述,詳細計算步驟見文獻[31]。
圖1 KPCA核心原理[30]
K近鄰算法是一種常見的機器學(xué)習(xí)算法,能夠高效處理分類和回歸問題,其核心思想是:在確定各個樣本之間距離的前提下,通過樣本間的距離來界定該樣本與特征空間內(nèi)K個樣本的親疏關(guān)系,根據(jù)最相鄰的K個樣本的類別來判定該樣本的所屬類別[32],其核心原理見圖2。
圖2 K近鄰算法核心原理[33]
若有n個訓(xùn)練對象,利用K近鄰算法對待分類樣本xnew進行分類。首先找到K個距離xnew最近的訓(xùn)練樣本點,根據(jù)K組樣本的類別投票確定xnew所屬類別。距離可用歐氏距離計算:
(1)
式中,xi為已知類別樣本。
在實際工程中,影響邊坡穩(wěn)定性的因素眾多,主要包括地層、巖性、地質(zhì)構(gòu)造、地應(yīng)力、巖體結(jié)構(gòu)、水的作用、邊坡的幾何形狀和表面形態(tài)等[34]。其中邊坡高度、邊坡角是基本的邊坡幾何參數(shù);影響邊坡穩(wěn)定性的巖土體物理力學(xué)指標(biāo)主要是容重、黏聚力、內(nèi)摩擦角和孔隙壓力比等。一般而言,巖土體的容重、黏聚力、內(nèi)摩擦角越大,邊坡越穩(wěn)定;反之,則邊坡越容易失穩(wěn)[35]。在水的作用方面,可以用孔隙壓力比來表征注液量變化和降雨過程[36]。借鑒前人的研究成果,選取容重(γ)、黏聚力(c)、內(nèi)摩擦角(φ)、邊坡角(φf)、邊坡高度(H)、孔隙壓力比(ru)等6個指標(biāo)作為輸入指標(biāo),邊坡狀態(tài)作為輸出指標(biāo)。模型構(gòu)建流程見圖3。本文在文獻[37]所收集的邊坡實例中選取55組樣本建立數(shù)據(jù)庫,部分?jǐn)?shù)據(jù)見表1。
表1 樣本原始數(shù)據(jù)
圖3 模型構(gòu)建流程
為了消除指標(biāo)量綱對預(yù)測模型的影響,本文選取統(tǒng)一極差處理法對樣本的原始數(shù)據(jù)進行處理[38],計算式為
(2)
將預(yù)處理后的樣本數(shù)據(jù)進行KPCA處理,處理后的指標(biāo)由K1-K6代替,得到的數(shù)據(jù)見表2。
表2 KPCA數(shù)據(jù)處理結(jié)果
K值作為KNN算法的超參數(shù)之一,直接影響模型的性能。K值過小,訓(xùn)練誤差減小,但會出現(xiàn)過擬合現(xiàn)象;K值過大,泛化能力提高,但誤差增大,易出現(xiàn)欠擬合。本文結(jié)合文獻[19]中的K值尋優(yōu)方法,最后取最優(yōu)K值為5。
分別將KPCA處理前和處理后的數(shù)據(jù)劃分為訓(xùn)練集(40個樣本)和測試集(15個樣本),將數(shù)據(jù)導(dǎo)入KNN模型并進行5倍交叉驗證(交叉驗證原理見圖4)。
對測試集中的樣本進行預(yù)測,結(jié)果見表3。由表3可知,本文模型的預(yù)測結(jié)果與實際等級完全吻合,而傳統(tǒng)KNN模型、BP神經(jīng)網(wǎng)絡(luò)模型、SVM模型均出現(xiàn)了錯判。
表3 測試集樣本預(yù)測結(jié)果
各模型的準(zhǔn)確率-召回率見圖5。由圖5可知,經(jīng)過KPCA處理的KNN模型準(zhǔn)確率和召回率均為100%,未經(jīng)過KPCA處理的KNN模型則為70.6%,BP神經(jīng)網(wǎng)絡(luò)和SVM的準(zhǔn)確率和召回率也不及本文模型。
圖5 準(zhǔn)確率-召回率
各模型的F1-訓(xùn)練時間見圖6。由圖6可知,指標(biāo)F1-score(同時考慮精確率和召回率,在0~1范圍內(nèi),越靠近1表示效果越好)在本文模型預(yù)測中達到峰值1,且本文模型的訓(xùn)練時間為0.044 s,均短于其他3種模型。
圖6 F1-訓(xùn)練時間
綜上,經(jīng)過KPCA方法處理的數(shù)據(jù)可以提高KNN算法的準(zhǔn)確率并縮短訓(xùn)練時間,是對原模型的進一步優(yōu)化。
選取6組國內(nèi)外邊坡實例進行穩(wěn)定性預(yù)測[37],同時將預(yù)測結(jié)果與傳統(tǒng)KNN、BP神經(jīng)網(wǎng)絡(luò)、SVM的預(yù)測結(jié)果進行對比,結(jié)果見表4。由表4可知,本文模型預(yù)測結(jié)果與實際邊坡情況完全相符,其余3種對比模型均出現(xiàn)了錯判(KNN錯判2個,BP和SVM各錯判1個)。由此可見,經(jīng)過KPCA處理的KNN預(yù)測模型效果最好,進一步驗證了本文模型的準(zhǔn)確性和合理性。
表4 預(yù)測結(jié)果對比
a.本文以55組邊坡實例樣本為研究對象,選取容重、黏聚力、內(nèi)摩擦角、邊坡角、邊坡高度、孔隙壓力比作為邊坡穩(wěn)定性預(yù)測指標(biāo),并采用統(tǒng)一極差處理法對樣本指標(biāo)的原始數(shù)據(jù)進行處理,消除了指標(biāo)量綱的影響。
b.運用核主成分分析將樣本指標(biāo)數(shù)據(jù)映射到高維空間進行線性運算,經(jīng)過訓(xùn)練構(gòu)建了KPCA-KNN邊坡穩(wěn)定性預(yù)測模型,模型測試集準(zhǔn)確率和召回率均為100%,F1-score達到峰值1且訓(xùn)練時間短。
c.6組工程實例預(yù)測結(jié)果與邊坡實際狀態(tài)完全相符,且優(yōu)于傳統(tǒng)的KNN、BP神經(jīng)網(wǎng)絡(luò)、SVM模型,表明本文建立的KPCA-KNN模型是一種有效的邊坡穩(wěn)定性預(yù)測方法。在后續(xù)的工程應(yīng)用中,可根據(jù)工程需要,基于MATLAB平臺建立數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、質(zhì)量控制和分析預(yù)測等一體化邊坡穩(wěn)定性實時監(jiān)測系統(tǒng),以實現(xiàn)邊坡穩(wěn)定性監(jiān)測預(yù)警的智能化和可視化。