付曉娣 張 搏 王林均 魏 勇
(①貴州民族大學(xué)建筑工程學(xué)院,貴陽 550025,中國(guó))(②喀斯特環(huán)境地質(zhì)災(zāi)害防治國(guó)家民委重點(diǎn)實(shí)驗(yàn)室,貴陽 550025,中國(guó))(③巖溶區(qū)城市地下空間開發(fā)與安全貴州民族大學(xué)重點(diǎn)實(shí)驗(yàn)室,貴陽 550025,中國(guó))
土石混合體是指由塊石、細(xì)粒土等組成的極端非均質(zhì)的巖土介質(zhì)系統(tǒng)(徐文杰等,2009),其力學(xué)特性界于土和巖石之間,材料屬性介于散體與連續(xù)介質(zhì)之間(胡瑞林等,2020)。由于土石混合體具有顯著的非均質(zhì)性,該類斜坡的穩(wěn)定性較難預(yù)測(cè)和評(píng)價(jià),斜坡失穩(wěn)后會(huì)引起較大的人民生命安全與財(cái)產(chǎn)損失。土石混合體斜坡在我國(guó)山區(qū)廣泛分布,2013年7月,四川省都江堰市中興鎮(zhèn)三溪村發(fā)生特大滑坡,造成了45人遇難,116人失蹤(成浩等,2020;成浩,2021)。2018年5月,四川萬源長(zhǎng)石鄉(xiāng)桃樹坪發(fā)生土石混合體滑坡,造成直接經(jīng)濟(jì)損失約295萬元(白永健,2020)。
由于土石混合體斜坡穩(wěn)定性評(píng)價(jià)較為困難,學(xué)者們對(duì)此類斜坡的塊石屬性、含石量和相關(guān)力學(xué)參數(shù)等進(jìn)行了大量的相關(guān)研究。楊忠平等(2020)認(rèn)為土石混合體斜坡的塊石形狀、顆粒級(jí)配及初始孔隙率對(duì)斜坡體的穩(wěn)定性無明顯影響,但是塊石尺寸對(duì)土石混合體的抗剪強(qiáng)度有很大影響。尚敏等(2021)、楊忠平等(2021)在前人的研究基礎(chǔ)上(向玲等,2014;王衛(wèi),2015;趙國(guó)宣等,2015;孫一清等,2019),認(rèn)為庫水波動(dòng)對(duì)三峽庫區(qū)堆積層滑坡的穩(wěn)定性影響較大。劉康琦等(2022)采用等效均質(zhì)土坡和土石混合體斜坡兩者發(fā)生滑坡時(shí)的永久位移量的差別,得出塊石增加了土石混合體斜坡的穩(wěn)定性。于偉(2018)建立擬動(dòng)力作用下的三維極限平衡方程,考慮土條底部剪切力的橫向作用方向,能夠分析三維條件下土石混合體斜坡穩(wěn)定系數(shù)與斜坡形態(tài)、力學(xué)參數(shù)和地震加速度之間的關(guān)系。黃獻(xiàn)文等(2021)利用物理模型試驗(yàn)和有限元法,分別得到了塊石長(zhǎng)軸平行或垂直于邊坡剪切帶時(shí)斜坡的穩(wěn)定系數(shù)。龔健等(2017),劉康琦等(2020),王其寬等(2021),和Zhao et al.(2021)采用FLAC3D和強(qiáng)度折減法獲得了土石混合體斜坡的穩(wěn)定系數(shù),并揭示了含石量對(duì)穩(wěn)定系數(shù)和破壞模式的影響。
近年來,機(jī)器學(xué)習(xí)方法越來越多地應(yīng)用于斜坡穩(wěn)定性預(yù)測(cè)中并取得顯著成效。李麟瑋等(2018)在三峽庫區(qū)白水河滑坡上提出精度高、速度快、參數(shù)簡(jiǎn)單的新型非等距位移時(shí)序預(yù)測(cè)模型,是基于非等距時(shí)間序列分析法、灰狼優(yōu)化算法和支持向量回歸機(jī)(SVR)的預(yù)測(cè)模型。Pham et al.(2021)利用全球滑坡數(shù)據(jù)庫,對(duì)比了8種單一的機(jī)器學(xué)習(xí)算法和集成算法的預(yù)測(cè)精度,得出集成算法的效果明顯高于單一的算法。Ray et al.(2020)改進(jìn)了兩種基于人工神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)預(yù)測(cè)模型,在喜馬拉雅地區(qū)的殘積土斜坡穩(wěn)定性預(yù)測(cè)中取得了較好的效果。Lin et al.(2021)采用11種機(jī)器學(xué)習(xí)算法針對(duì)斜坡的6種屬性特征建立斜坡穩(wěn)定性預(yù)測(cè)模型。Qi et al.(2018)、劉艷輝等(2021)分別利用螢火蟲算法和貝葉斯優(yōu)化算法,尋找所使用的6種機(jī)器學(xué)習(xí)算法各自的最佳超參數(shù),以此獲得預(yù)測(cè)精度最高的斜坡穩(wěn)定性預(yù)測(cè)模型。王海軍等(2015)采用了一種基于果蠅優(yōu)化算法的廣義回歸神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)邊坡的穩(wěn)定狀態(tài),其預(yù)測(cè)精度明顯高于利用BP神經(jīng)網(wǎng)絡(luò)(Back Propagation Neuron NetWok)建立的預(yù)測(cè)模型精度。Xue(2016)提出了一種基于最小二乘支持向量機(jī)和粒子群優(yōu)化算法的,具有較高精度的邊坡穩(wěn)定性預(yù)測(cè)模型。李晴文(2021)利用粒子群算法優(yōu)化了例如支持向量機(jī)(SVM)、非齊次指數(shù)離散函數(shù)的灰色預(yù)測(cè)模型(NGM)等的算法,進(jìn)一步建立邊坡位移的預(yù)測(cè)模型,并取得了不錯(cuò)的預(yù)測(cè)效果。
然而,由于土石混合體斜坡的復(fù)雜性,采用機(jī)器學(xué)習(xí)的方法預(yù)測(cè)其穩(wěn)定性鮮有報(bào)道。為了能夠較為精確地預(yù)測(cè)土石混合體斜坡的穩(wěn)定性,本文結(jié)合粒子群算法和果蠅優(yōu)化算法提出一種融合算法,從而更好地優(yōu)化機(jī)器學(xué)習(xí)模型的參數(shù)。采用3種機(jī)器學(xué)習(xí)模型,對(duì)土石混合體斜坡的穩(wěn)定性進(jìn)行預(yù)測(cè),并且對(duì)比分析了融合算法對(duì)預(yù)測(cè)精度的提升作用。最后對(duì)機(jī)器學(xué)習(xí)中的4個(gè)輸入?yún)?shù)進(jìn)行了重要性分析,得到了影響土石混合體斜坡穩(wěn)定性因素的重要性排序。該融合算法能夠顯著提高機(jī)器學(xué)習(xí)模型的預(yù)測(cè)精度,為相關(guān)研究和工程應(yīng)用提供新的解決方案。
調(diào)參算法主要是確定預(yù)測(cè)模型的超參數(shù),本文的改進(jìn)方法,主要是基于粒子群算法和果蠅優(yōu)化算法,這是建立邊坡預(yù)測(cè)模型最重要的一個(gè)環(huán)節(jié)。
1.1.1 粒子群算法
Kennedy et al.(1995)提出的粒子群算法(Particle Swarm Optimization)是一種用于非線性函數(shù)優(yōu)化的調(diào)參算法。
基本思路是:在搜索空間中,群體中單一粒子搜索得到的最優(yōu)值為局部極值,與群體中其他粒子共享信息獲得的最優(yōu)值為全局極值,粒子群中所有粒子根據(jù)局部極值和全局極值來調(diào)整自己的速度和位置,并最終獲得最優(yōu)解。
1.1.2 果蠅算法
潘文超(2011)提出的果蠅優(yōu)化算法(Fruit Fly Optimization Algorithm)是一種通過模擬果蠅利用敏銳的嗅覺和視覺進(jìn)行捕食過程的算法。
主要思想是:首先初始化果蠅群體的位置、果蠅個(gè)體移動(dòng)的距離和方向,計(jì)算果蠅利用嗅覺所得到的味道濃度判定值,以及果蠅個(gè)體所在位置的味道濃度的最大值。然后,保留最佳的味道濃度值和果蠅個(gè)體的位置信息。以此迭代,最終找到最優(yōu)值。
1.1.3 融合算法
粒子群算法具有收斂速度快、魯棒性好、在誤差函數(shù)梯度信息不影響的情況下尋找最優(yōu)解等諸多優(yōu)點(diǎn)(代娟等,2017)。果蠅優(yōu)化算法思想簡(jiǎn)單,方法易懂,易于編程,并且在函數(shù)尋優(yōu)的收斂速率和計(jì)算量上具有明顯的優(yōu)勢(shì)(趙建強(qiáng)等,2014)。但是,兩種算法都有容易陷入局部最優(yōu)的問題,對(duì)于模型的預(yù)測(cè)精度影響嚴(yán)重(郭建豪等,2020;付興武等,2021;劉召朝等,2021;寇斌等,2022)。
本文利用粒子群算法與果蠅優(yōu)化算法的相互耦合,使得融合算法在具有兩者的優(yōu)點(diǎn)的同時(shí),解決算法易陷入局部最優(yōu)的難題。首先,將果蠅優(yōu)化算法融合進(jìn)粒子群算法的更新框架:速度更新和位置更新;其次,將粒子群算法的位置更新公式融合進(jìn)果蠅優(yōu)化算法,進(jìn)行基礎(chǔ)算法的改進(jìn)。
Xi=(Xi+vi)+R×RV
(1)
Yi=Y_axis+R×RV
(2)
(3)
c1×rand()×(pbesti-Xi)+
c2×rand()×(gbesti-Xi)
(4)
式中:i=1,…,N,N為群體中的種群的總個(gè)數(shù);vi為第i個(gè)種群的速度;rand()為介于(0,1)之間的隨機(jī)數(shù);Xi為第i個(gè)種群的位置;c1,c2為學(xué)習(xí)因子;pbest為局部極值;gbest為全局極值;wini為初始慣性權(quán)值;wgnd為最大迭代次數(shù)的慣性權(quán)值;Gk為最大迭代次數(shù);R為找尋半徑;g為當(dāng)前迭代數(shù);RV為種群維度大小的隨機(jī)向量;Si為第i個(gè)種群所對(duì)應(yīng)的味道濃度判定值;Y_axis為初始種群向量值。
1.2.1 決策樹模型
決策樹模型(Decision Tree Model)是由樹狀分裂的、無數(shù)代表數(shù)據(jù)屬性節(jié)點(diǎn)組合成的分類或者回歸模型,包括ID3算法(Yasami et al.,2010)、C4.5算法等。決策樹模型主要采用從頂部到底部進(jìn)行遞歸的過程中,每個(gè)迭代產(chǎn)生的新節(jié)點(diǎn)為基礎(chǔ)的循環(huán)模型(馮夏庭,2000)。隨著迭代次數(shù)的不斷增加,其產(chǎn)生的新節(jié)點(diǎn)的分支子集逐漸減小,繼續(xù)迭代的可能性逐漸減小,當(dāng)決策樹模型的深度或者迭代的次數(shù)達(dá)到要求時(shí),分支節(jié)點(diǎn)將會(huì)停止分裂。
雖然決策樹模型具有可讀性和分類速度快等的優(yōu)點(diǎn),但是它對(duì)未知的測(cè)試數(shù)據(jù)的分類、泛化能力無法保證。
1.2.2 梯度提升決策樹模型
Froedman(2002)提出的梯度提升決策樹模型(Gradient Boosting Decision Tree Model)是由一種基于梯度提升框架,逐步減少上一次迭代所產(chǎn)生殘差的決策樹分類模型(張凌凡等,2020)。主要思想是,首先初始化一個(gè)學(xué)習(xí)器參數(shù),并減小負(fù)梯度方向的損失函數(shù)值。然后,通過一定的迭代次數(shù),獲得最優(yōu)的基分類器,并計(jì)算最優(yōu)的學(xué)習(xí)率,進(jìn)行更新下一個(gè)學(xué)習(xí)器。通過使用弱分類器的預(yù)測(cè)結(jié)果的逐步累計(jì)得到強(qiáng)分類器(李根等,2022),因此具有較高泛化能力和防止過擬合的優(yōu)點(diǎn)。
圖1 土石混合體斜坡相關(guān)參數(shù)的相關(guān)性和統(tǒng)計(jì)分布Fig.1 Correlation and statistical distribution for parameters of soil-rock mixture slopes
1.2.3 Stacking模型
Stacking模型是Wolpert(1992)首次提出,其主要是訓(xùn)練一個(gè)用于組合其他各個(gè)串行結(jié)構(gòu)的機(jī)器學(xué)習(xí)模型集成框架,在各大機(jī)器學(xué)習(xí)算法比賽中表現(xiàn)突出(Chang et al.,2019),是集成學(xué)習(xí)方法(徐繼偉等,2018)中的主要模型之一。
此算法分成基本分類器和元分類器,首先使用基本分類器對(duì)初始數(shù)據(jù)進(jìn)行訓(xùn)練,之后將基本分類器所有預(yù)測(cè)輸出的特征值和初始的數(shù)據(jù)帶入元分類器,進(jìn)行進(jìn)一步的模型優(yōu)化。因?yàn)閮蓚€(gè)分類器的輸入數(shù)據(jù)不同,所以在一定程度上防止過擬合,從而提高預(yù)測(cè)模型的預(yù)測(cè)能力。
影響土石混合體斜坡穩(wěn)定性的因素很多,在斜坡穩(wěn)定性分析中,穩(wěn)定系數(shù)本質(zhì)上是抗滑力與下滑力的比值,這與巖土體的物理力學(xué)性質(zhì)和斜坡的地貌形態(tài)直接相關(guān)??紤]到土石混合體具有顯著的非均質(zhì)性,因此本文的輸入?yún)?shù)主要聚焦于土石混合體斜坡典型的結(jié)構(gòu)性因素,包括含石率、基覆面傾角、坡角和坡高。在土石混合體中,含石率是決定物理力學(xué)性質(zhì)的關(guān)鍵參數(shù),對(duì)重度、黏聚力和內(nèi)摩擦角有直接影響(Kalender et al.,2014;Zhang et al.,2020;張振平等,2021)。在機(jī)器學(xué)習(xí)中若輸入?yún)?shù)之間存在多重共線性,則會(huì)影響預(yù)測(cè)模型的準(zhǔn)確性(張玘愷等,2020;許嘉慧等,2021;趙忠國(guó)等,2021)。因此,在土石混合體斜坡的穩(wěn)定性預(yù)測(cè)中,用含石率來代替重度、黏聚力和內(nèi)摩擦角作為輸入?yún)?shù)?;裁媸峭潦旌象w與下覆基巖的分離界面,正是由于基覆面的存在,使土石混合體斜坡具有典型的二元結(jié)構(gòu)。因此,基覆面是影響土石混合體斜坡整體穩(wěn)定的重要因素(孫永帥等,2018;劉順青等,2019)。坡角和坡高是斜坡的重要地貌幾何特征,對(duì)斜坡的穩(wěn)定性有重要影響。一般來說隨著斜坡高度和坡腳的增加,斜坡穩(wěn)定性逐漸降低。
本論文選用文獻(xiàn)(成國(guó)文,2009)中已詳細(xì)勘察的49個(gè)土石混合體斜坡數(shù)據(jù)作為分析樣本。
圖1為4個(gè)輸入?yún)?shù)和穩(wěn)定系數(shù)的數(shù)據(jù)正態(tài)分布情況。在主對(duì)角線散點(diǎn)圖中,穩(wěn)定系數(shù)值多處在1.0~1.3之間,少數(shù)值大于2.0。根據(jù)《建筑邊坡工程技術(shù)規(guī)范》(GB50330-2013)、《公路路基設(shè)計(jì)規(guī)范》(JTGD30-2015),穩(wěn)定系數(shù)小于1屬于不穩(wěn)定狀態(tài),所以文獻(xiàn)中所調(diào)查的斜坡是穩(wěn)定的。坡度值多在地質(zhì)災(zāi)害頻發(fā)的區(qū)間10°~25°(白世彪等,2005;劉傳正等,2007)。在上下三角的散點(diǎn)圖中,4個(gè)輸入?yún)?shù)與穩(wěn)定系數(shù)具有不同的相關(guān)性,基覆面傾角、坡角、坡高與穩(wěn)定系數(shù)呈現(xiàn)明顯的負(fù)相關(guān),而含石率與穩(wěn)定系數(shù)呈現(xiàn)明顯的正相關(guān),其數(shù)值越大穩(wěn)定系數(shù)越大。
如表 1所示,針對(duì)不同的機(jī)器學(xué)習(xí)模型,其調(diào)參算法的初始化參數(shù)不同。粒子群算法的初始化固定參數(shù)為:兩個(gè)學(xué)習(xí)因子均為2,權(quán)重矩陣為[0.4,0.9]。 果蠅優(yōu)化算法的初始化固定參數(shù)為:種群個(gè)數(shù)為30、最大迭代數(shù)為100。對(duì)于3種機(jī)器學(xué)習(xí)模型,果蠅優(yōu)化算法有不同的找尋半徑參數(shù),粒子群算法有不同的種群個(gè)數(shù)、最大迭代數(shù)的組合。根據(jù)1.1節(jié)所述,融合算法是利用粒子群算法和果蠅優(yōu)化算法相互耦合得到的,所以,融合算法的初始化固定參數(shù)和上述兩個(gè)調(diào)參算法的初始化參數(shù)一樣,又因?yàn)?種調(diào)參算法所處理的機(jī)器學(xué)習(xí)模型的超參數(shù)都是一樣的,所以種群維度相同。
表 1 調(diào)參算法的基本參數(shù)及最佳超參數(shù)組合
如圖2所示,首先初始化種群的維度、位置、個(gè)數(shù),以及找尋半徑的范圍。在3種調(diào)參算法中,均使用決定系數(shù)R2作為是否繼續(xù)進(jìn)行迭代操作的依據(jù),也就是圖2中的適應(yīng)度函數(shù)。在迭代過程中,根據(jù)式(1)、式(2)、式(3)更新二維位置,利用得到的局部極值和全局極值更新速度,見式(4)。當(dāng)適應(yīng)度函數(shù)值大于等于模型精度要求時(shí),即可輸出最佳的超參數(shù)組合。
結(jié)合圖2的算法圖以及表 1中的參數(shù)值,對(duì)每一種機(jī)器學(xué)習(xí)模型進(jìn)行超參數(shù)尋找,獲得最佳超參數(shù)組合的結(jié)果見表 1。
圖2 調(diào)參算法圖Fig.2 Adjustment algorithm diagram
建立土石混合體斜坡穩(wěn)定性預(yù)測(cè)模型的流程圖如圖3,具體流程如下:
(1)將模型輸入?yún)?shù),即含石率、基覆面傾角、坡角和坡高,對(duì)應(yīng)的數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,讓數(shù)據(jù)符合標(biāo)準(zhǔn)正態(tài)分布。
(2)將數(shù)據(jù)以 3︰1 的比例劃分成訓(xùn)練集和測(cè)試集。
圖3 土石混合體斜坡穩(wěn)定性預(yù)測(cè)模型Fig.3 The prediction model for stability of soil-rock mixture slope
(3)利用粒子群算法、果蠅優(yōu)化算法和融合算法這3種調(diào)參算法分別確定土石混合體斜坡穩(wěn)定性預(yù)測(cè)模型的超參數(shù)組合,如表 1所示。
(4)初步確定土石混合體斜坡穩(wěn)定性預(yù)測(cè)模型。之后,利用25%的測(cè)試集數(shù)據(jù)對(duì)模型進(jìn)行預(yù)測(cè)精度的進(jìn)一步檢驗(yàn),如果模型精度不再提高,則最終確定斜坡穩(wěn)定性預(yù)測(cè)模型,反之,繼續(xù)進(jìn)行第三步。
圖4 土石混合體斜坡穩(wěn)定性預(yù)測(cè)結(jié)果Fig.4 The results of stability prediction for soil-rock mixture slope
利用在數(shù)據(jù)集中隨機(jī)取出82%的結(jié)果,進(jìn)行模型精度的驗(yàn)證。圖4每一個(gè)子圖的橫、縱坐標(biāo)分別表示穩(wěn)定系數(shù)的真實(shí)值和預(yù)測(cè)值,虛線表示正方形子圖框中的對(duì)角線。散點(diǎn)分布越遠(yuǎn)離矩形坐標(biāo)軸的主對(duì)角線,說明穩(wěn)定系數(shù)的預(yù)測(cè)值和真實(shí)值相對(duì)誤差越大。在本文中將遠(yuǎn)離虛線的散點(diǎn)稱為離散點(diǎn)。
在同一種機(jī)器學(xué)習(xí)模型下,決策樹模型列的預(yù)測(cè)值相較于真實(shí)值仍存在一定的相對(duì)誤差,但在融合算法下預(yù)測(cè)模型的散點(diǎn)離散程度達(dá)到最低。梯度提升決策樹模型列和Stacking模型列的散點(diǎn)都呈現(xiàn)出從粒子群算法到果蠅優(yōu)化算法再到融合算法模型離散程度逐漸變低。不同的是,梯度提升決策樹模型的離散點(diǎn)絕大部分聚集在虛線上,Stacking模型在融合算法下,其離散點(diǎn)逐漸趨近于虛線。因此,在3種調(diào)參算法中,利用融合算法建立的模型預(yù)測(cè)精度最高。
基于融合算法下的3種機(jī)器學(xué)習(xí)模型散點(diǎn)分布各不相同。梯度提升決策樹模型相較于其他兩種機(jī)器學(xué)習(xí)模型的散點(diǎn)分布均勻,離散點(diǎn)少,預(yù)測(cè)效果較好。在Stacking模型的離散點(diǎn)多處在虛線的上半部分,說明模型預(yù)測(cè)值多大于穩(wěn)定系數(shù)的真實(shí)值,相對(duì)誤差較大。相較于梯度提升決策樹模型,決策樹模型的散點(diǎn)多分布在虛線的左右,說明模型預(yù)測(cè)值的標(biāo)準(zhǔn)差較大,但是比Stacking模型的預(yù)測(cè)精度高。因此,在3種機(jī)器學(xué)習(xí)模型中,利用梯度提升決策樹模型的預(yù)測(cè)精度最高。
圖5 預(yù)測(cè)模型的評(píng)價(jià)指標(biāo)結(jié)果Fig.5 The results of evaluation index for prediction model
對(duì)于評(píng)價(jià)機(jī)器學(xué)習(xí)模型的預(yù)測(cè)能力,本文采用3個(gè)指標(biāo),分別是將均值作為誤差基準(zhǔn)的決定系數(shù)R2,反映估計(jì)量與被估計(jì)量之間差異程度的一種度量的均方誤差MSE,所有單個(gè)觀測(cè)值與算術(shù)平均值的偏差的絕對(duì)值的平均絕對(duì)誤差MAE。其中作為本文最重要的評(píng)價(jià)指標(biāo):R2,其值越趨近于1,說明模型的預(yù)測(cè)精度越高。MSE值和MAE值越小說明模型預(yù)測(cè)精度越高。
表 2 評(píng)價(jià)指標(biāo)統(tǒng)計(jì)結(jié)果
據(jù)表 2和圖5所示,相比于粒子群算法和果蠅優(yōu)化算法,采用融合算法進(jìn)行調(diào)參后的決策樹模型、梯度提升決策樹模型和Stacking模型的預(yù)測(cè)精度均獲得提高。尤其是梯度提升決策樹模型中,預(yù)測(cè)精度大幅度提高,明顯優(yōu)于決策樹模型和Stacking模型?;谌诤纤惴ǖ奶荻忍嵘龥Q策樹模型分別比采用粒子群算法和果蠅優(yōu)化算法時(shí),R2高出0.1775、0.0889,MAE低0.0479、0.0229,MSE值低0.0111、0.0055。對(duì)于決策樹模型,采用融合算法比采用粒子群算法和果蠅優(yōu)化算法的R2分別高出0.0116、0.0494,MAE低0.0008、0.0144,MSE低0.0007、0.003。對(duì)于Stacking模型,采用融合算法比采用粒子群算法和果蠅優(yōu)化算法的R2分別高出0.0133、0.1967,MAE低0.0033、0.0348,MSE低0.0008、0.0123。
綜上所述,根據(jù)3個(gè)評(píng)價(jià)指標(biāo)的結(jié)果,整體來說梯度提升決策樹模型預(yù)測(cè)精度優(yōu)于另外兩個(gè)機(jī)器學(xué)習(xí)模型,尤其是采用融合算法調(diào)參之后。雖然粒子群算法下的梯度提升決策樹模型的預(yù)測(cè)精度略低于決策樹模型,但對(duì)比融合算法下的梯度提升決策樹模型的預(yù)測(cè)精度,上述精度損失可以忽略不計(jì)。
因?yàn)橥潦旌象w的力學(xué)性質(zhì)和材料屬性的復(fù)雜度高,所以需要對(duì)影響土石混合體斜坡穩(wěn)定的結(jié)構(gòu)性因素進(jìn)行排序。本文采用基于融合算法的梯度提升決策樹模型,分析含石率、基覆面傾角、坡角和坡高這4個(gè)輸入?yún)?shù)的重要性程度。如上所述,梯度提升決策樹模型為多個(gè)弱學(xué)習(xí)器逐步形成的強(qiáng)學(xué)習(xí)器,本文以某一因素在所有弱學(xué)習(xí)器中重要度的平均值作為此因素對(duì)于土石混合體斜坡穩(wěn)定性特征的影響程度值(Froedman,2002),而單一弱學(xué)習(xí)器中的特征重要性得分標(biāo)準(zhǔn)(Liu et al.,2021)為式(5)、式(6)所示:
(5)
(6)
式中:Vc為屬性c在整個(gè)弱學(xué)習(xí)器中的重要度值;Vc,k為屬性c在節(jié)點(diǎn)k的重要度值;Ginik為k節(jié)點(diǎn)的Gini值;Ginikl為k節(jié)點(diǎn)的左Gini值;Ginikr為k節(jié)點(diǎn)的右Gini值。
如圖6所示,4個(gè)輸入?yún)?shù)按照重要性從大到小的順序?yàn)椋夯裁鎯A角、含石率、坡角、坡高?;裁鎯A角和含石率這兩個(gè)結(jié)構(gòu)性因素,是土石混合體斜坡區(qū)別于其他斜坡的重要特征。
圖6 輸入?yún)?shù)重要性排序Fig.6 Importance ranking for input parameters
劉順青等(2019)認(rèn)為基覆面傾角對(duì)土石混合體斜坡穩(wěn)定性的影響非常顯著,隨著傾角的增大,穩(wěn)定系數(shù)逐漸減小。龔健等(2017)、江強(qiáng)強(qiáng)等(2020)和王其寬等(2021)認(rèn)為含石量對(duì)土石混合體的力學(xué)行為有重要影響,隨著含石量的增大,斜坡的穩(wěn)定系數(shù)逐漸提高,破壞模式有單一光滑轉(zhuǎn)為交叉繞石。因此,對(duì)于土石混合體斜坡的工程評(píng)價(jià),應(yīng)先從含石率和基覆面傾角入手。
本文通過粒子群和果蠅優(yōu)化耦合形成的融合算法,能夠有效提升機(jī)器學(xué)習(xí)模型的預(yù)測(cè)精度?;谌诤纤惴ń⒘送潦旌象w斜坡的穩(wěn)定性預(yù)測(cè)模型,并對(duì)已有文獻(xiàn)中土石混合體斜坡穩(wěn)定系數(shù)進(jìn)行預(yù)測(cè),通過評(píng)價(jià)指標(biāo)明確了融合算法的優(yōu)勢(shì),最后對(duì)影響斜坡穩(wěn)定性的因素進(jìn)行特征重要性分析,為土石混合體斜坡的穩(wěn)定性預(yù)測(cè)提供了新的思路。得到以下結(jié)論:
(1)利用調(diào)參算法對(duì)決策樹模型、梯度提升決策樹模型、Stacking模型進(jìn)行超參數(shù)尋找,相對(duì)于粒子群算法和果蠅優(yōu)化算法來說,融合算法下的模型預(yù)測(cè)能力表現(xiàn)出了明顯的優(yōu)勢(shì),說明融合模型解決了粒子群和果蠅優(yōu)化算法所存在的容易陷入局部極值的缺點(diǎn)。
(2)在基于融合算法的決策樹模型、梯度提升決策樹模型、Stacking模型中,梯度提升決策樹模型的預(yù)測(cè)精度最高,決定系數(shù)R2達(dá)到0.9333,均方誤差MSE和平均絕對(duì)誤差MAE也最小。因此,可采用該模型預(yù)測(cè)土石混合體斜坡的穩(wěn)定性。
(3)采用基于融合算法的梯度提升決策樹模型,對(duì)影響土石混合體斜坡穩(wěn)定性的因素重要性進(jìn)行分析,4個(gè)參數(shù)從大到小的順序?yàn)椋夯裁鎯A角、含石率、坡角、坡高。因此在土石混合體斜坡的工程評(píng)價(jià)和處理中,應(yīng)重點(diǎn)考慮基覆面傾角和含石率的影響。