馬 高,王 瑤
(1.湖南大學(xué)土木工程學(xué)院,湖南長沙 410082;2.工程結(jié)構(gòu)損傷診斷湖南省重點(diǎn)實(shí)驗(yàn)室(湖南大學(xué)),湖南長沙 410082)
剪力墻作為高層建筑結(jié)構(gòu)中重要的主體抗震和側(cè)力支撐構(gòu)件,在高層建筑結(jié)構(gòu)抗震設(shè)計中具有重要地位。鋼管混凝土剪力墻作為一種新型剪力墻,能有效改善傳統(tǒng)剪力墻的延性與耗能能力,應(yīng)用前景廣闊。出于抗震需求的考慮,需充分發(fā)揮鋼管混凝土剪力墻的延性和耗能性能,應(yīng)盡量避免剪力墻發(fā)生脆性破壞。因此,預(yù)測其破壞模式可以輔助設(shè)計人員尋找鋼管混凝土剪力墻結(jié)構(gòu)中易發(fā)生脆性破壞的部位,并對其進(jìn)行設(shè)計上的優(yōu)化?,F(xiàn)有的文獻(xiàn)和規(guī)范普遍認(rèn)為低矮墻易受剪切破壞影響,然而試驗(yàn)證明該觀點(diǎn)并不完全正確。例如Greifenhagen 等[1]試驗(yàn)中2 片剪跨比為0.69 的低矮剪力墻發(fā)生了彎曲破壞,Teng 等[2]試驗(yàn)中3 片剪跨比為2.2 的高剪力墻發(fā)生了剪切破壞。其原因在于剪力墻的破壞模式受多種設(shè)計參數(shù)的影響,僅用剪跨比并不能確定剪力墻的破壞模式,如何精準(zhǔn)預(yù)測剪力墻的破壞模式成為有待解決的難題。
機(jī)器學(xué)習(xí)是該問題的一個可行解決方案,近年來已有不少研究人員進(jìn)行了相關(guān)嘗試。Mangalathu 等[3]嘗試用多種機(jī)器學(xué)習(xí)算法對RC 剪力墻破壞模式進(jìn)行預(yù)測,并建立了一個包含393 個RC 剪力墻的試驗(yàn)數(shù)據(jù)庫。Siam 等[4]收集了93 個配筋砌體剪力墻的試驗(yàn)數(shù)據(jù),使用聚類分析方法對其破壞模式進(jìn)行分類。Feng等[5]使用集成學(xué)習(xí)的方法對鋼筋混凝土柱的破壞模式進(jìn)行了預(yù)測。雖然機(jī)器學(xué)習(xí)在預(yù)測結(jié)構(gòu)構(gòu)件破壞模式上已取得了一定成效,在建立多個變量間的復(fù)雜非線性關(guān)系時也很有效率,但機(jī)器學(xué)習(xí)的“黑箱”特性使得解釋輸入變量和輸出變量間的關(guān)系很困難,這也給機(jī)器學(xué)習(xí)模型的實(shí)際應(yīng)用帶來了阻礙。針對該問題,?trumbelj 等[6]提出用Shapley Additice Explanations(SHAP)法解決,SHAP 法是一種基于博弈論對機(jī)器學(xué)習(xí)模型進(jìn)行解釋的方法,其以一個線性模型解釋各個特征參數(shù)對模型輸出結(jié)果的影響,用Shapley 值量化反映各個特征參數(shù)的貢獻(xiàn)。已有研究人員進(jìn)行了相關(guān)探索,如:Mangalathu等[7]在已有的模型基礎(chǔ)上,使用SHAP法對各個參數(shù)對剪力墻破壞模式的影響進(jìn)行了量化分析;Parsa 等[8]利用SHAP 法對基于XGBoost 的高速公路事故預(yù)測模型的結(jié)果進(jìn)行了解釋,并分析了各個特征參數(shù)的重要性。
類間樣本不均衡是機(jī)器學(xué)習(xí)中的重要問題。類間不均衡是指多數(shù)類的樣本數(shù)遠(yuǎn)超少數(shù)類樣本數(shù),可能會導(dǎo)致分類器失去應(yīng)有的分類功能,模型預(yù)測效果較差[9]。例如對于一個二分類問題,少數(shù)類樣本與多數(shù)類樣本數(shù)比值為1∶1000,分類器僅需忽略少數(shù)類樣本即可達(dá)到99.9%的分類準(zhǔn)確率。在Mangalathu 等[3]對RC剪力墻進(jìn)行破壞模式預(yù)測的過程中,類間樣本不均衡對模型預(yù)測結(jié)果也有不利影響。此外,由于鋼管混凝土剪力墻破壞模式的影響因素相較于普通RC 剪力墻更為復(fù)雜,現(xiàn)有的預(yù)測模型并不適用,所以有必要建立適用于鋼管混凝土剪力墻破壞模式的預(yù)測模型。
在此背景下,文中收集了107個鋼管混凝土剪力墻試驗(yàn)數(shù)據(jù),使用6種機(jī)器學(xué)習(xí)算法對鋼管混凝土剪力墻的破壞模式進(jìn)行預(yù)測,比較各類算法的穩(wěn)定性和可靠性,以此篩選出綜合性能最優(yōu)模型;使用SHAP 法對模型進(jìn)行解釋性分析,挖掘出破壞模式的內(nèi)在影響因素;針對類間樣本不均衡的問題,文中采用SMOTE法對訓(xùn)練集樣本進(jìn)行過采樣處理,對比發(fā)現(xiàn)經(jīng)SMOTE法處理過后,機(jī)器學(xué)習(xí)模型的預(yù)測精度有一定的提高。
文中從文獻(xiàn)[10-31]收集了107個鋼管混凝土剪力墻試驗(yàn)數(shù)據(jù)建立數(shù)據(jù)庫。為讓所使用的特征參數(shù)盡可能地反映剪力墻的實(shí)際特征和破壞情況,文中從幾何特征、力學(xué)特征和破壞模式3個方面進(jìn)行描述??紤]到剪力墻截面形式、縱向尺寸均對破壞模式均存在影響,采用的幾何特征參數(shù)為:剪跨比λ、寬厚比lw/bw、腹板面積占比Aw/A。其中l(wèi)w為腹板寬度;bw為腹板厚度;Aw為腹板截面積;A為剪力墻截面積。通過引入配筋指數(shù)[2]進(jìn)行無量綱處理,選用的力學(xué)特征參數(shù)為:軸壓比n、腹板水平鋼筋配筋指數(shù)ρhw,s fy/fc、腹板縱筋配筋指數(shù)ρvw,s fy/fc、腹板鋼管配筋指數(shù)ρw,st fy/fc、邊緣構(gòu)件鋼管配筋指數(shù)ρc,st fy/fc、邊緣構(gòu)件縱筋配筋指數(shù)ρvc,s fy/fc、邊緣構(gòu)件水平鋼筋配筋指數(shù)ρhc,s fy/fc。其中ρhw,s、ρvw,s、ρw,st分別表示腹板中水平鋼筋配筋率、縱筋配筋率、鋼管配筋率;ρc,st、ρvc,s、ρhc,s分別表示邊緣構(gòu)件中鋼管配筋率、縱筋配筋率、水平鋼筋配筋率;fy為鋼材抗拉強(qiáng)度;fc為混凝土抗壓強(qiáng)度。圖1為所收集的鋼管混凝土剪力墻特征參數(shù)分布直方圖。
圖1 特征參數(shù)分布直方圖Fig.1 Distribution histogram of characteristic parameters
剪力墻破壞模式分為:彎曲破壞、彎剪破壞、剪切破壞和剪切滑移破壞。由于在現(xiàn)有的鋼管混凝土剪力墻試驗(yàn)中,并未出現(xiàn)剪切滑移破壞,文中不予討論。各破壞模式具體破壞特征如下:(1)剪切破壞,墻體斜裂縫交錯,通常有混凝土剝落現(xiàn)象,邊緣約束構(gòu)件也表現(xiàn)為剪切破壞;(2)彎剪破壞,墻體彎曲裂縫和剪切裂縫均有發(fā)展,但仍以剪切破壞現(xiàn)象為主。邊緣約束構(gòu)件表現(xiàn)為受彎破壞,底部混凝土被壓碎或鋼管壓屈;(3)彎曲破壞,墻體和邊緣約束構(gòu)件均表現(xiàn)為因彎曲破壞而發(fā)生的底部混凝土壓碎或鋼管壓屈。圖2 為3 種破壞模式的典型破壞形態(tài)圖。
圖2 典型破壞特征圖Fig.2 Typical failure characteristic
圖1 特征參數(shù)分布結(jié)果表明數(shù)據(jù)庫中發(fā)生彎剪破壞的樣本明顯少于發(fā)生彎曲破壞和剪切破壞的樣本。He 等[32]指出分類器中樣本不均衡會對模型訓(xùn)練結(jié)果產(chǎn)生不良影響。Mangalathu 等[3]在進(jìn)行RC 剪力墻破壞模式預(yù)測時,因類間樣本不均衡使得模型對于少數(shù)類的預(yù)測效果較差。改善該問題的方法有過采樣、欠采樣等[32],由于文中所使用的數(shù)據(jù)集樣本量較小欠采樣并不適用,故采用過采樣進(jìn)行處理。簡易的隨機(jī)過采樣是用復(fù)制少數(shù)類樣本的方式來增加樣本數(shù)量,該方法會產(chǎn)生過擬合現(xiàn)象[33],為此Chawla 等[34]提出了SMOTE法進(jìn)行人工合成數(shù)據(jù)以解決簡單隨機(jī)過采樣易產(chǎn)生過擬合的問題。
SMOTE法是一種基于KNN技術(shù)人工合成數(shù)據(jù)進(jìn)行隨機(jī)過采樣的方法,其原理如圖3所示。對于少數(shù)樣本集y={y1,y2,.......,yn},SMOTE 法首先選取任一樣本yi作為基樣本,再選取與yi鄰近的n個同類樣本(圖中n取5)按式(1)進(jìn)行隨機(jī)線性插值合成新樣本,該過程重復(fù)多次直至少數(shù)樣本與多數(shù)樣本的樣本數(shù)相近。
圖3 SMOTE原理圖Fig.3 Schematic diagram of SMOTE
式中:xn代表基樣本yi的第n個特征值;xn_synthesis代表合成樣本的第n個特征值;xn_near代表鄰近樣本的第n個特征值。
文中所涉及的機(jī)器學(xué)習(xí)方法為有監(jiān)督學(xué)習(xí),具體算法有樸素貝葉斯、支持向量機(jī)、決策樹、隨機(jī)森林、XGBoost和LightGBM。依據(jù)所使用學(xué)習(xí)器的數(shù)量分為單一學(xué)習(xí)和集成學(xué)習(xí),其中樸素貝葉斯、支持向量機(jī)、決策樹為單一學(xué)習(xí),隨機(jī)森林、XGBoost、LightGBM為基于決策樹的集成學(xué)習(xí),下面對算法的原理進(jìn)行簡要介紹。
(1)樸素貝葉斯
樸素貝葉斯是一種以概率為決策方式的分類算法,其原理是貝葉斯定理和特征獨(dú)立假設(shè)[35]。算法的主要思想是通過貝葉斯公式計算鋼管混凝土剪力墻在其自身特征x下,破壞模式fi發(fā)生的概率,并判定發(fā)生概率最高的破壞模式即為該鋼管混凝土剪力墻的破壞模式:
式中:fi表示破壞模式的類別;xi為x在第i個特征上的取值。
(2)支持向量機(jī)
支持向量機(jī)是一種通過分析類分布邊緣的訓(xùn)練集樣本(即支持向量),以此擬合類間最優(yōu)超平面的分類器算法。例如,由式(3)表示在q維空間中的一個含有r個樣本的訓(xùn)練集:
最佳超平面存在于不同破壞模式類型之間,并使得不同破壞類型的類間差距最大。在樣本空間中,超平面可以用式(4)來描述:
式中:x是位于超平面上的點(diǎn);ω是超平面的法線;b是偏差。超平面劃分的具體過程及原理見文獻(xiàn)[36]。
(3)決策樹
決策樹是一種經(jīng)典的分類算法,在決策樹模型的構(gòu)建過程中主要有2 個步驟[37]:(1)分析每個特征屬性的分割并選擇最佳分割;(2)使用最佳分割來定義分類區(qū)域,確定最佳分割的指標(biāo)主要有熵和基尼系數(shù)。上述步驟均在訓(xùn)練集中完成。
(4)隨機(jī)森林
隨機(jī)森林屬于有監(jiān)督集成機(jī)器學(xué)習(xí)模型,使用決策樹作為基礎(chǔ)分類器。相比傳統(tǒng)決策樹,隨機(jī)森林在訓(xùn)練基學(xué)習(xí)器的過程中進(jìn)行了特征參數(shù)的隨機(jī)篩選用于分類[38]。
(5)Boosting算法
Boosting 族算法是通過組合一組弱分類器形成強(qiáng)分類器以此來提高模型性能的強(qiáng)化學(xué)習(xí)方法。Hastie等[39]提出了一種稱為梯度提升的強(qiáng)化方法,該方法對在前一次迭代中評估的損失函數(shù)的梯度向量的函數(shù)進(jìn)行回歸,從而得到損失函數(shù)最優(yōu)的模型。XGBoost、LightGBM方法均是基于決策樹的梯度增強(qiáng)模型。
以上所使用的機(jī)器學(xué)習(xí)模型均使用Python庫中的Scikit-learn進(jìn)行開發(fā)。剪力墻數(shù)據(jù)庫中的數(shù)據(jù)按照7∶3的比例隨機(jī)分配為訓(xùn)練集和測試集。訓(xùn)練集用于建立預(yù)測鋼管混凝土剪力墻破壞模式的機(jī)器學(xué)習(xí)模型,測試集用來評估模型性能。文中采用混淆矩陣展示模型的具體性能。矩陣中的元素Aij表示破壞模式為i的剪力墻被預(yù)測為破壞模式j(luò)的數(shù)量。對模型預(yù)測性能進(jìn)行量化評估的指標(biāo)為:準(zhǔn)確率(Accuracy)、精確度(Pre‐diction)、召回率(Recall)、F1-score。其中:
準(zhǔn)確率:
精確率:
召回率:
F1-score:
式中:TP為真正例,指實(shí)際破壞模式為i同時被預(yù)測破壞模式為i的樣本數(shù)量;TN為真負(fù)例,指實(shí)際破壞模式不為i同時被預(yù)測破壞模式不為i的樣本數(shù)量;FN為假負(fù)例,指實(shí)際破壞模式為i但被預(yù)測破壞模式不為i的樣本數(shù)量;FP為假正例,指實(shí)際破壞模式不為i但被預(yù)測破壞模式為i的樣本數(shù)量。F1-score 能反映模型在特定破壞模式預(yù)測中的性能,準(zhǔn)確率能反映模型整體的預(yù)測準(zhǔn)確性。
為反映破壞模式類間樣本分布不均衡對模型性能的影響,SMOTE算法處理前后的混淆矩陣對比見圖4,各方法的性能指標(biāo)對比見表1。
表1 SMOTE算法處理前后各模型性能指標(biāo)Table 1 Performance indexes of each model before and after smote algorithm processing
圖4 SOMTE算法處理前后各模型在測試集中的混淆矩陣Fig.4 Confusion matrix of each model in the test set before and after SMOTE algorithm processing
通過分析圖4、表1,可得到如下結(jié)論:
(1)SMOTE 算法處理前,隨機(jī)森林的平均F1-socre 與彎剪破壞F1-socre 最高(0.87、0.67);SMOTE 算法處理后,隨機(jī)森林的平均F1-socre 與彎剪破壞F1-socre 最高(0.92、0.80)??梢?,在SMOTE 算法處理前后,隨機(jī)森林在類間分布不均衡樣本集中的整體性能與彎剪破壞的預(yù)測性能最好,其在類間樣本不均衡情況下的表現(xiàn)較其它模型更為優(yōu)異。
(2)各個機(jī)器學(xué)習(xí)模型中,剪切破壞及彎曲破壞的F1-socre 相差較小且接近1,彎剪破壞的F1-socre 與其他破壞模式的F1-socre相差較大,說明彎剪破壞的預(yù)測難度較大。
(3)SMOTE 算法處理后各模型的平均F1-socre 均有一定提升,其中XGBoost 的提升幅度最大,為27.9%,其次是支持向量機(jī)(13.4%)、決策樹(13.0%)。可見,SMOTE 算法對于改善模型在類間樣本不均衡情況下的性能具有積極作用。
(4)SMOTE 算法處理后支持向量機(jī)模型的準(zhǔn)確率反而有所降低,而在SMOTE 算法處理前,彎曲破壞、剪切破壞的精準(zhǔn)率與召回率都很高,但這并不代表SMOTE 算法對模型產(chǎn)生了負(fù)面影響。其原因是SMOTE 算法處理前訓(xùn)練集中彎剪破壞樣本所占比例很少,在模型預(yù)測時很容易對彎曲破壞和剪切破壞產(chǎn)生過擬合,導(dǎo)致了模型預(yù)測結(jié)果準(zhǔn)確率的虛高,其準(zhǔn)確率并不能真實(shí)反映模型性能。
SHAP 法是由?trumbelj 等[6]提出的一種用于解釋機(jī)器學(xué)習(xí)模型的方法,通過計算各個特征參數(shù)的Shap‐ley值來量化解釋特征參數(shù)對模型最終輸出值的影響??捎檬剑?)表示為:
式中:f(x)表示初始的機(jī)器學(xué)習(xí)模型;g(x′)表示對應(yīng)的解釋模型;x表示f(x)的輸入變量;x′為與x存在映射關(guān)系的簡化輸入變量;M表示特征參數(shù)的數(shù)量;φ0表示所有特征參數(shù)為0時的輸出值;φk為第k個特征參數(shù)的Shapley值。
使用SHAP 法對上一節(jié)中經(jīng)SMOTE 算法處理后的隨機(jī)森林模型進(jìn)行解釋,各特征參數(shù)的平均絕對Shapley值分布見圖5。
由圖5可見,在鋼管混凝土剪力墻破壞模式的預(yù)測中,剪跨比λ 的影響最大,其次是腹板水平鋼筋配筋指數(shù)ρhw,s fy/fc、邊緣構(gòu)件鋼管配筋指數(shù)ρc,st fy/fc、軸壓比;腹板截面積占比Aw/A對預(yù)測結(jié)果幾乎沒有影響。
圖5 各特征參數(shù)平均絕對Shapley值Fig.5 Average absolute Shapley values of characteristic parameters
圖6~圖8給出了各個特征參數(shù)對不同破壞模式的相應(yīng)貢獻(xiàn),可得出如下結(jié)論:
圖6 剪切破壞模式下各特征參數(shù)的Shapley值分布Fig.6 Shapley value distribution of characteristic parameters under shear failure mode
圖7 彎剪破壞模式下各特征參數(shù)的Shapley值分布Fig.7 Shapley value distribution of characteristic parameters under bending shear failure mode
圖8 彎曲破壞模式下各特征參數(shù)的Shapley值分布Fig.8 Shapley value distribution of characteristic parameters under bending failure mode
(1)從3種破壞模式中各特征參數(shù)的Shapley 值來看,對破壞模式起主導(dǎo)作用的特征參數(shù)為:剪跨比λ、腹板分布鋼筋配筋指數(shù)ρhw,s fy/fc、ρvw,s fy/fc、邊緣構(gòu)件鋼管配筋指數(shù)ρc,st fy/fc與軸壓比n。由Shapley 值分析可知,當(dāng)剪跨比λ、腹板分布鋼筋配筋指數(shù)ρhw,s fy/fc、ρvw,s fy/fc較高,邊緣構(gòu)件鋼管配筋指數(shù)ρc,st fy/fc適中且軸壓比n 處于中低水平時將發(fā)生彎曲破壞。結(jié)合正文第1 部分各參數(shù)的實(shí)際分布,可知當(dāng)λ≥2、ρhw,s fy/fc≥0.06、ρvw,s fy/fc≥0.06、0.10 ≤ρc,st fy/fc≤0.175、n≤0.35時,將發(fā)生彎曲破壞。同理可得出發(fā)生剪切破壞與彎剪破壞時各特征參數(shù)的大致取值,具體見表2。需要說明的是,該參數(shù)取值范圍依據(jù)的是所收集的107個試件的試驗(yàn)數(shù)據(jù),對于所收集數(shù)據(jù)庫參數(shù)范圍外的取值可能需要進(jìn)一步討論。
表2 不同破壞模式下的特征參數(shù)分布區(qū)間Table 2 Distribution range of the characteristic parameters under different failure modes
(2)剪跨比λ越大發(fā)生彎曲破壞的概率越高,λ越低發(fā)生剪切破壞的概率越高。只有在剪跨比λ適中時才會增加彎剪破壞發(fā)生的概率,并推高其對應(yīng)破壞模式的Shapley 值。這是由于當(dāng)剪跨比較高或較低時,剪力墻的荷載分別由彎矩或剪力控制,故發(fā)生彎曲破壞或剪切破壞的概率會增加。當(dāng)剪跨比適中時,剪力墻荷載由彎矩和剪力共同控制,此時發(fā)生彎剪破壞的概率將增加。
(3)腹板分布鋼筋配筋指數(shù)ρhw,s fy/fc、ρvw,s fy/fc越高,發(fā)生彎曲破壞的概率越高,其在彎曲破壞模式中的Shapley值越高,與之對應(yīng)的是發(fā)生彎剪破壞的概率越低,其在彎剪破壞模式中的Shapley值越低。這是由于隨著腹板內(nèi)分布鋼筋配筋的增加,其約束腹板內(nèi)斜裂縫發(fā)展的能力也就越強(qiáng),同時提升了腹板的抗剪承載力,有效限制了腹板剪切破壞的發(fā)生。
(4)邊緣構(gòu)件內(nèi)的鋼管配筋指數(shù)ρc,st fy/fc與軸壓比n越高,其在彎剪破壞模式中的Shapley值越高,發(fā)生彎剪破壞的概率越高。這是由于當(dāng)邊緣構(gòu)件的配筋率增加時,邊緣構(gòu)件的承載力隨之增加,邊緣構(gòu)件中的鋼管同時也發(fā)揮了水平抗剪的作用,限制了斜裂縫在邊緣構(gòu)件中的發(fā)展。而此時腹板內(nèi)的裂縫發(fā)展較深,在軸壓比較高時,腹板混凝土發(fā)生剝落,剪力墻發(fā)生彎剪破壞。
(5)相較于彎曲破壞與剪切破壞,彎剪破壞中產(chǎn)生較高Shapley值的特征參數(shù)更多,說明彎剪破壞的影響因素更復(fù)雜,預(yù)測難度更大。
鑒于彎剪破壞模式的預(yù)測較為困難,下面對典型彎剪破壞樣本進(jìn)行Shapley值分析。圖9中紅色箭頭代表將預(yù)測結(jié)果推向彎剪破壞的特征參數(shù),藍(lán)色箭頭代表將預(yù)測結(jié)果導(dǎo)向其他破壞模式的特征參數(shù)。由該典型樣本圖9(a)與(b)的Shapley值分析結(jié)果可知,彎剪破壞Shapley基礎(chǔ)值為0.583,將圖9(a)中該值推高的主要特征參數(shù)為:適中的剪跨比λ(1.5)、較低的腹板配筋指數(shù)ρhw,s fy/fc(0.031)與ρvw,s fy/fc(0.031)、較高的邊緣構(gòu)件鋼管配筋指數(shù)ρc,st fy/fc(0.173)。同時較低的軸壓比n(0.2)降低了該樣本在彎剪破壞中的Shapley值。將樣本圖9(b)中該值推高的主要特征參數(shù)為:較高的邊緣構(gòu)件鋼管配筋指數(shù)ρc,st fy/fc(0.258)、較低的腹板配筋指數(shù)ρhw,s fy/fc(0.031)與ρvw,s fy/fc(0.031)。同時較低的剪跨比λ(1.0)降低了該樣本在彎剪破壞中的Shapley 值。從典型樣本的Shapley 值分析結(jié)果可知,較低的腹板配筋率與較高的邊緣構(gòu)件配筋率有利于彎剪破壞的發(fā)生。尤培波等[10]基于試驗(yàn)和理論認(rèn)為對于中高剪力墻,在邊緣構(gòu)件配筋率較高且腹板墻體配筋率較低的情況下,剪力墻將發(fā)生彎剪破壞。該結(jié)論與典型樣本的Shapley值分析結(jié)果相符合。
圖9 彎剪破壞典型樣本Shapley值分析圖Fig.9 Analysis of Shapley value of typical specimens under bending shear failure
基于文獻(xiàn)數(shù)據(jù),文中建立了一個含有107個鋼管混凝土剪力墻的試驗(yàn)數(shù)據(jù)庫,提出了基于機(jī)器學(xué)習(xí)預(yù)測鋼管混凝土剪力墻破壞模式的方法,該方法通過SMOTE 算法降低了樣本類間分布不均衡對模型的負(fù)面影響,并通過SHAP法對機(jī)器學(xué)習(xí)模型進(jìn)行了解釋與分析,得到了如下結(jié)論:
(1)使用SMOTE 算法能降低樣本類間分布不均衡對模型的負(fù)面影響,在文中使用的機(jī)器學(xué)習(xí)模型中隨機(jī)森林的性能最好。
(2)在3種破壞模式中,彎剪破壞中產(chǎn)生較高Shapley值的特征參數(shù)更多,說明彎剪破壞的影響因素更復(fù)雜,預(yù)測難度更大。
(3)剪跨比λ越高發(fā)生彎曲破壞的概率越高,剪跨比λ越低發(fā)生剪切破壞的概率越高。只有在剪跨比λ適中時才會增加發(fā)生彎剪破壞的概率,并推高其對應(yīng)破壞模式的Shapley 值。腹板內(nèi)的配筋指數(shù)ρhw,s fy/fc、ρvw,s fy/fc越高,發(fā)生彎剪破壞的概率越低。邊緣構(gòu)件內(nèi)的配筋指數(shù)ρc,st fy/fc與軸壓比n 越高,發(fā)生彎剪破壞的概率越高。
(4)對于鋼管混凝土剪力墻,對其破壞模式起主導(dǎo)作用的特征參數(shù)為:剪跨比λ、腹板分布鋼筋配筋指數(shù)ρhw,s fy/fc、ρvw,s fy/fc、邊緣構(gòu)件鋼管配筋指數(shù)ρc,st fy/fc與軸壓比n。文中根據(jù)Shapley 值分析與參數(shù)分布,給出了不同破壞模式下這幾個特征參數(shù)的分布區(qū)間,具有一定的指導(dǎo)意義。
(5)彎剪破壞樣本的Shapley 值分析與基于試驗(yàn)的理論分析對影響彎剪破壞主要因素的判斷相符合,基于機(jī)器學(xué)習(xí)模型對鋼管混凝土剪力墻彎剪破壞模式的預(yù)測具有一定的可靠性。