摘" 要: 為了得到高效準(zhǔn)確的基于集成學(xué)習(xí)的蔗渣灰混凝土抗壓強度預(yù)測模型,建立了4種集成學(xué)習(xí)模型,即eXtreme Gradient-Boosting (XGBoost)、Random Forest (RF)、Light Gradient-Boosting Machine (LightGBM)和Adaptive Boosting (AdaBoost);通過模型的性能比較得到了預(yù)測能力最優(yōu)的集成學(xué)習(xí)模型,然后利用SHAP(Shapley additive explanation)值方法定量研究各輸入變量對蔗渣灰混凝土抗壓強度的影響。首先,進行蔗渣灰混凝土抗壓強度試驗,根據(jù)試驗數(shù)據(jù)和文獻數(shù)據(jù)構(gòu)建了包含水泥含量、水灰比、蔗渣灰摻和量、細骨料含量、粗骨料含量等5個輸入變量的集成學(xué)習(xí)數(shù)據(jù)庫。然后,采用決定系數(shù)、平均絕對誤差、均方根誤差、可靠性指數(shù)等4個評估指標(biāo)來評估模型的預(yù)測能力。通過對比發(fā)現(xiàn):XGBoost模型的預(yù)測精度最高,該模型訓(xùn)練集的評估指標(biāo)決定系數(shù)、平均絕對誤差、均方根誤差、可靠性指數(shù)分別為0.976、1.811、2.344、0.875。各輸入變量對蔗渣灰混凝土抗壓強度的影響從大到小排序為水泥含量、細骨料含量、粗骨料含量、蔗渣灰摻和量、水灰比;水泥含量對混凝土抗壓強度有正面影響,蔗渣灰摻和量低于10%時不會明顯降低混凝土的抗壓強度。該研究為蔗渣灰混凝土抗壓強度的預(yù)測和影響因素解釋提供了有益參考,對于推動蔗渣灰混凝土等環(huán)保型材料的研究和應(yīng)用具有一定價值。
關(guān)鍵詞: 集成學(xué)習(xí);蔗渣灰混凝土;抗壓強度;SHAP值方法;預(yù)測模型
中圖分類號: TU377.9
文獻標(biāo)志碼: A
文章編號: 1673-3851 (2024) 04-0507-11
DOI:10.3969/j.issn.1673-3851(n).2024.04.010
收稿日期: 2023-11-27" 網(wǎng)絡(luò)出版日期:2024-04-11網(wǎng)絡(luò)出版日期
基金項目: 國家自然科學(xué)基金項目(51808499);浙江省自然科學(xué)基金項目(LY22E080016);浙江理工大學(xué)科研業(yè)務(wù)費專項資金(24052126-Y)
作者簡介: 林" 星(2000—" ),男,浙江臺州人,碩士研究生,主要從事新型混凝土結(jié)構(gòu)方面的研究。
通信作者: 梁詩雪,E-mail:liangshixue0716@126.com
引文格式:林星,梁詩雪,馮斯奕. 基于集成學(xué)習(xí)的蔗渣灰混凝土抗壓強度預(yù)測模型[J]. 浙江理工大學(xué)學(xué)報(自然科學(xué)),2024,51(4):507-517.
Reference Format: LIN Xing, LIANG Shixue, FENG Siyi. Models for predicting the compressive strength of bagasse ash concrete based on emsemble learning [J]. Journal of Zhejiang Sci-Tech University,2024,51(4):507-517.
Models for predicting the compressive strength of bagasse ash concrete based on emsemble learning
LIN Xing, LIANG Shixue, FENG Siyi
(School of Civil Engineering and Architecture, Zhejiang Sci-Tech University, Hangzhou 310018, China)
Abstract:" To obtain an efficient and accurate ensemble learning model for predicting the compressive strength of sugarcane bagasse ash concrete, four ensemble learning models, namely eXtreme Gradient Boosting (XGBoost), Random Forest (RF), Light Gradient Boosting Machine (LightGBM), and Adaptive Boosting (AdaBoost) were established. The predictive capabilities of these models were compared, and the ensemble learning model with the optimal predictive performance was identified. The Shapley Additive Explanation (SHAP) value method was employed to quantitatively study the impact of each input variable on the compressive strength of sugarcane bagasse ash concrete. Firstly, compressive strength experiments were conducted for sugarcane bagasse ash concrete. Based on experimental data and literature information, an ensemble learning database consisting of five input variables, namely cement content, water-to-cement ratio, sugarcane bagasse ash admixture content, fine aggregate content, and coarse aggregate content, was built. Subsequently, four evaluation metrics, namely determination coefficient, mean absolute error, root mean square error, and reliability index, were used to assess the predictive capabilities of the models. In the performance comparison, it was observed that the XGBoost model exhibited the highest predictive accuracy. The evaluation metrics for the training set of the XGBoost model were determined as follows: determination coefficient of 0.976, mean absolute error of 1.811, root mean square error of 2.344, and reliability index of 0.875. The impact of each input variable on the compressive strength of sugarcane bagasse ash concrete was ranked from highest to lowest as follows: cement content, fine aggregate, coarse aggregate, sugarcane bagasse ash admixture content, and water-to-cement ratio. Cement content had a positive effect on concrete compressive strength, and the compressive strength of concrete was not significantly reduced when the sugarcane bagasse ash admixture content was below 10%. This study provides useful reference for predicting the compressive strength of sugarcane bagasse ash concrete and explaining influencing factors. It holds value in advancing research and applications of environmentally friendly materials such as sugarcane bagasse ash concrete.
Key words: ensemble learning; sugarcane bagasse ash concrete; compressive strength; SHAP value method; predictive model
0" 引" 言
隨著社會的發(fā)展與人口的增加,農(nóng)業(yè)生產(chǎn)在迅猛發(fā)展的同時也產(chǎn)生了大量的農(nóng)業(yè)垃圾。農(nóng)業(yè)垃圾包含大量生物質(zhì),為了充分利用農(nóng)業(yè)垃圾,通常將其焚燒轉(zhuǎn)化為能源,以滿足工業(yè)發(fā)展的一定需要。農(nóng)業(yè)垃圾焚燒后產(chǎn)生的生物質(zhì)灰是農(nóng)業(yè)生產(chǎn)鏈的最終廢棄物,其產(chǎn)量呈現(xiàn)逐年增加的趨勢。生物質(zhì)灰富含二氧化硅(SiO2),是建筑領(lǐng)域的重要材料,具備資源可持續(xù)利用的特點。目前關(guān)于將生物質(zhì)灰應(yīng)用在建筑領(lǐng)域的研究已成為研究熱點[1]。研究發(fā)現(xiàn),生物質(zhì)灰如稻殼灰、竹莖灰、麥稈灰、蔗渣灰等可用于制備混凝土、磚塊等建筑材料[2]。其中蔗渣灰是制糖業(yè)副產(chǎn)品甘蔗渣經(jīng)焚燒后由除塵裝置得到的灰分。我國擁有廣闊的熱帶、亞熱帶農(nóng)耕區(qū)域,蔗渣灰的來源穩(wěn)定、基數(shù)大,其燃燒所釋放的二氧化碳量遠低于植物生長周期中排放的氧氣量,是一種潛力巨大的綠色材料[3]。自1998年Martirena Hernndez等[4]發(fā)現(xiàn)蔗渣灰具有一定的火山灰活性后,關(guān)于蔗渣灰的研究成果逐漸在建筑材料領(lǐng)域得到應(yīng)用[5-7]。在建筑材料中合理利用蔗渣灰,既能保證建筑材料的抗壓強度、抗折強度等力學(xué)性能,又可以減少環(huán)境污染和資源浪費,符合綠色、可持續(xù)發(fā)展的要求,具有廣闊的應(yīng)用前景。
抗壓強度是混凝土的力學(xué)性能中最受研究者關(guān)心的核心指標(biāo)之一?;炷量箟簭姸热Q于多種因素,如水泥含量、粗骨料含量、細骨料含量等。一些研究者研究了蔗渣灰在混凝土中的應(yīng)用。Xu等[8]使用蔗渣灰替代部分水泥,研究了蔗渣灰摻和量對混凝土抗收縮、抗侵蝕、抗壓強度、抗折強度等力學(xué)性能的影響。Sales等[9]使用蔗渣灰替代部分天然砂,研究了蔗渣灰摻和量對混凝土的抗壓強度、抗拉強度、彈性模量以及吸水性的影響。Katare等[10]進行了蔗渣灰混凝土單軸抗壓試驗,探討了蔗渣灰摻和量、水灰比、骨料含量等因素對蔗渣灰混凝土抗壓強度的影響。然而,蔗渣灰混凝土的抗壓強度受到多種因素的共同作用,且添加了蔗渣灰這一成分復(fù)雜的生物質(zhì)灰后,混凝土的力學(xué)性能更為復(fù)雜,單批試驗難以反映其影響規(guī)律。因此,亟待建立預(yù)測精度較高的抗壓強度預(yù)測模型。
近年來,越來越多的研究者們利用機器學(xué)習(xí)方法來解決各類工程問題。機器學(xué)習(xí)涉及統(tǒng)計學(xué)、概率論以及計算機科學(xué)等多個學(xué)科領(lǐng)域,其主要思想是通過對一部分數(shù)據(jù)進行學(xué)習(xí),運用相關(guān)算法分析數(shù)據(jù),發(fā)掘內(nèi)在規(guī)律,從而對新數(shù)據(jù)作出預(yù)測。在土木工程領(lǐng)域,機器學(xué)習(xí)模型被廣泛應(yīng)用于研究結(jié)構(gòu)(包括結(jié)構(gòu)構(gòu)件)承載能力預(yù)測、結(jié)構(gòu)動力響應(yīng)預(yù)測等問題[11-13]。但目前鮮有研究者利用機器學(xué)習(xí)模型對蔗渣灰混凝土的抗壓強度進行預(yù)測以及定量研究各種因素對蔗渣灰混凝土抗壓強度的影響。
本文通過集成學(xué)習(xí)模型對蔗渣灰混凝土抗壓強度進行預(yù)測,并且利用SHAP(Shapley additive explanation)值方法定量研究各因素對蔗渣灰混凝土抗壓強度的影響。首先,本文進行了蔗渣灰混凝土抗壓強度試驗,研究了蔗渣灰摻和量對混凝土抗壓強度的影響,并將獲得的試驗數(shù)據(jù)與國內(nèi)外文獻中收集到的強度數(shù)據(jù)相結(jié)合,作為集成學(xué)習(xí)模型的訓(xùn)練和測試的數(shù)據(jù)庫。然后,采用4種不同的集成學(xué)習(xí)模型,即eXtreme Gradient-Boosting (XGBoost)、Random Forest (RF)、Light Gradient-Boosting Machine (LightGBM)和Adaptive Boosting (AdaBoost),對蔗渣灰混凝土的抗壓強度進行預(yù)測,并得到預(yù)測精度最高的集成學(xué)習(xí)模型,從而建立高效準(zhǔn)確的抗壓強度預(yù)測模型,為實際工程中的材料選擇和結(jié)構(gòu)設(shè)計提供可靠的參考。最后,利用SHAP值方法定量分析水灰比、蔗渣灰摻和量、水泥含量、細骨料含量和粗骨料含量等5個輸入變量對蔗渣灰混凝土抗壓強度的影響,為混凝土配合比的設(shè)計提供科學(xué)依據(jù),進而推進蔗渣灰混凝土等環(huán)保型材料的應(yīng)用。
1" 蔗渣灰混凝土抗壓強度試驗
1.1" 試驗方案
本文通過試驗分析不同的蔗渣灰摻和量對混凝土抗壓強度的影響。采用了取代率不同的蔗渣灰替代水泥,制備混凝土試件;并根據(jù)GB/T 50081-2019《混凝土物理力學(xué)性能試驗方法標(biāo)準(zhǔn)》進行混凝土抗壓強度試驗。
1.2" 原材料
1.2.1" 水泥
水泥采用P·O42.5級普通硅酸鹽水泥,其基本性能參數(shù)及主要組成分別見表1-表2。
1.2.2" 細骨料
砂子采用河砂,級配區(qū)間為Ⅱ區(qū)的中砂,細度模數(shù)為2.6,表觀密度為2630 kg/m3,堆積密度為1537 kg/m3,含泥量0.8%。
1.2.3" 粗骨料
石子采用碎石,最大粒徑為20 mm,表觀密度為2650 kg/m3,堆積密度為1408 kg/m3,含泥量0.4%。
1.2.4" 蔗渣灰
蔗渣灰的制備過程涉及將甘蔗渣進行一系列處理,最終得到試驗所使用的蔗渣灰,蔗渣灰制備過程中各階段的示例照片見圖1。蔗渣灰的具體制備過程如下:a)收集甘蔗渣。收集蔗糖生產(chǎn)過程中剩余的甘蔗渣。b)清理和預(yù)處理。將收集的甘蔗渣去除雜質(zhì)、清洗和干燥后進行初步研磨,得到粗磨甘蔗渣。c)研磨。對處理后的甘蔗渣進行細致研磨,獲得更細的顆粒。d)灼燒。將研磨后的甘蔗渣置于鍋爐中,用500~600 ℃的高溫灼燒。e)篩分。將灼燒后的蔗渣灰通過篩子進行篩分,得到的灰燼小于75 μm。
1.3" 混凝土配合比設(shè)計
本次試驗選定混凝土設(shè)計強度為C30,按照JGJ 55-2019《普通混凝土配合比設(shè)計規(guī)程》進行混凝土配合比設(shè)計。試驗設(shè)置了對照組S0,該組的蔗渣灰摻和量為0,并且設(shè)置試驗組S1、S2、S3,這3組的蔗渣灰摻和量分別為10.00%、20.00%、30.00%,其具體配合比見表3。
1.4" 試驗方法
首先,按照表3的配合比稱取原材料,接著依次向攪拌機內(nèi)投入水泥、骨料、水以及蔗渣灰,在確保攪拌均勻后排出混凝土料。然后,制備尺寸為150 mm×150 mm×150 mm的混凝土試件,共4組,每組3個試塊。5 h后進行收面處理,在相對濕度為60%、溫度為(20±1)℃的環(huán)境中養(yǎng)護1 d后脫模。隨后將試件放置于相對濕度為95%以上、溫度為(20±2)℃的標(biāo)準(zhǔn)養(yǎng)護室內(nèi)養(yǎng)護至28 d。最后使用TYE-2000B型壓力試驗機進行抗壓強度試驗。
1.5" 試驗結(jié)果
蔗渣灰混凝土抗壓強度試驗數(shù)據(jù)見圖2,從圖中可以發(fā)現(xiàn):當(dāng)蔗渣灰摻和量為0時,混凝土抗壓強度為33.76 MPa;而在摻和量為10.00%時,混凝土抗壓強度略微下降至33.61 MPa;當(dāng)蔗渣灰摻和量從10.00%增加至20.00%時,混凝土抗壓強度快速降至26.93 MPa;隨著蔗渣灰摻和量超過20.00%,混凝土抗壓強度的下降幅度減??;當(dāng)摻和量達到30.00%時,混凝土抗壓強度為24.00 MPa。
綜上所述,蔗渣灰在摻和量低于10.00%時對混凝土抗壓強度無明顯負面影響。這可能是因為蔗渣灰顆粒粒徑較小,在混凝土中發(fā)揮了填充的作用,填補了水泥漿體與骨料之間的空隙,使得混凝土強度沒有明顯下降[14]。隨著摻和量的增加,負面影響增大。這可能是由于蔗渣灰顆粒之間的粘合力低,并且水泥含量減少導(dǎo)致混凝土內(nèi)部的粘合力下降,混凝土強度明顯下降[14]。
2" 集成學(xué)習(xí)模型
本文選取4種集成學(xué)習(xí)模型來預(yù)測蔗渣灰混凝土的抗壓強度,即eXtreme Gradient-Boosting (XGBoost)、Random Forest (RF)、Light Gradient-Boosting Machine (LightGBM)和Adaptive Boosting (AdaBoost)。集成學(xué)習(xí)模型是一種機器學(xué)習(xí)方法,其通過整合多個弱學(xué)習(xí)器的預(yù)測結(jié)果,以彌補單個弱學(xué)習(xí)器的不足,從而獲得具有更高預(yù)測能力的強學(xué)習(xí)器。集成學(xué)習(xí)模型通常在性能方面表現(xiàn)出卓越的優(yōu)勢,能夠克服單個學(xué)習(xí)器的局限性,提高模型的整體性能。
2.1" eXtreme Gradient-Boosting (XGBoost)
XGBoost是一種高效且靈活的集成學(xué)習(xí)模型,屬于梯度提升框架(Gradient boosting framework,GBF)中的一種。XGBoost通過迭代的方式構(gòu)建決策樹,每一輪迭代都生成一棵決策樹。在每輪迭代中,首先模型會計算當(dāng)前模型的殘差,接著構(gòu)建一棵新的決策樹來減小殘差。在構(gòu)建決策樹的過程中,XGBoost會通過最小化損失函數(shù)來確定決策樹的結(jié)構(gòu),然后引入正則化項以避免過擬合[15]。構(gòu)建完成后,XGBoost會得到n棵決策樹。當(dāng)對新樣本進行預(yù)測時,每個新樣本會被分配到?jīng)Q策樹上對應(yīng)的葉節(jié)點,每個葉節(jié)點有一個關(guān)聯(lián)的分數(shù),最終的輸出結(jié)果是所有決策樹的葉節(jié)點分數(shù)的累加和[16]。圖3展示了XGBoost的算法原理。
2.2" Random Forest (RF)
RF屬于集成學(xué)習(xí)模型中的一種組合分類算法模型。RF通過構(gòu)建多個決策樹,將所有決策樹的輸出結(jié)果結(jié)合起來進行最終的預(yù)測。在構(gòu)建決策樹的過程中,RF首先利用隨機采樣法從數(shù)據(jù)集中有放回或無放回地抽取多個樣本,使得每棵決策樹的訓(xùn)練數(shù)據(jù)集都略有不同,以避免過擬合。然后用抽取的樣本對決策樹進行訓(xùn)練,最后把訓(xùn)練后的n棵決策樹組合在一起,通過投票得出最終的預(yù)測結(jié)果[17]。圖4展示了RF的算法原理。
2.3" Light Gradient-Boosting Machine (LightGBM)
LightGBM是一種基于GBF的集成學(xué)習(xí)模型,原理上與XGBoost相似,能夠在不降低準(zhǔn)確率的條件下加快模型的訓(xùn)練速度。圖5展示了LightGBM的優(yōu)化原理。LightGBM相對于XGBoost在一些方面進行了優(yōu)化:
a)采用帶深度限制的節(jié)點展開(Leaf-wise)算法。大多數(shù)梯度提升決策樹工具使用低效的按層生長的Level-wise決策樹生長策略,不加區(qū)分地對待同一層的葉節(jié)點,探索和分裂了很多分裂效益較低的葉節(jié)點。LightGBM使用了帶有深度限制的節(jié)點
展開的Leaf-wise算法[18],決策樹的層級不會無限制地增長,這有助于控制模型的復(fù)雜度,防止過擬合。
b)引入直方圖算法。為了加速梯度計算,首先LightGBM會將連續(xù)的特征值劃分為多個離散區(qū)間,然后在訓(xùn)練過程中構(gòu)建直方圖,最后使用直方圖差來近似直方圖的梯度信息,以降低梯度的計算復(fù)雜度。
2.4" Adaptive Boosting (AdaBoost)
AdaBoost是由Yoav Freund和Robert E. Schapire在1995年提出的一種集成學(xué)習(xí)模型[19],它通過迭代訓(xùn)練一系列弱學(xué)習(xí)器,然后將它們組合成一個強大的分類器。AdaBoost的核心思想是通過調(diào)整訓(xùn)練樣本的權(quán)重,使得前一個弱學(xué)習(xí)器分錯的樣本在后續(xù)的學(xué)習(xí)中得到更多的關(guān)注,從而糾正錯誤,提高模型的整體性能。AdaBoost將多個弱學(xué)習(xí)器的結(jié)果進行加權(quán)組合,形成一個在整體上具有更好的泛化能力的強學(xué)習(xí)器。圖6展示了AdaBoost的算法原理。
3" 蔗渣灰混凝土強度預(yù)測
3.1" 蔗渣灰混凝土抗壓強度數(shù)據(jù)庫
結(jié)合本文開展的試驗以及文獻[20-21],共收集了68組蔗渣灰混凝土抗壓強度的數(shù)據(jù)作為數(shù)據(jù)集(見附錄A),并且將數(shù)據(jù)集按照8∶2的比例劃分為訓(xùn)練集和測試集,其中訓(xùn)練集為55組,測試集為13組。本文根據(jù)收集的數(shù)據(jù)集,選取了5個變量作為輸入變量,它們分別為水灰比、蔗渣灰摻和量、水泥含量、細骨料含量、粗骨料含量;將蔗渣灰混凝土的抗壓強度作為輸出變量。集成學(xué)習(xí)建??山邮艿臄?shù)據(jù)量應(yīng)大于輸入變量個數(shù)的10倍[22],因此數(shù)據(jù)量應(yīng)大于50組,本文數(shù)據(jù)集的數(shù)據(jù)量符合要求。
3.2" 超參數(shù)取值
為了提高集成學(xué)習(xí)模型的預(yù)測準(zhǔn)確性和泛化能力,需要進行超參數(shù)調(diào)優(yōu)。超參數(shù)是在訓(xùn)練集成學(xué)習(xí)模型之前預(yù)設(shè)的參數(shù),其值不能由模型從數(shù)據(jù)中自動學(xué)習(xí)得出。超參數(shù)優(yōu)化的常見方法包括網(wǎng)格搜索、隨機搜索和貝葉斯優(yōu)化等,本文采用了網(wǎng)格搜索結(jié)合K-fold交叉驗證的方法來優(yōu)化超參數(shù)。
網(wǎng)格搜索通過事先定義一組可能的超參數(shù)值,然后嘗試所有可能的超參數(shù)組合,以遍歷模型的各種超參數(shù)組合[23]。而K-fold交叉驗證是一種數(shù)據(jù)拆分技術(shù),可以讓使用者在未曾見過的數(shù)據(jù)上評估模型的性能[24]。首先,它將數(shù)據(jù)集分成K個子集,然后多次訓(xùn)練模型,每次使用不同的子集作為驗證集,其余的作為訓(xùn)練集。最后,將這些驗證集上的性能指標(biāo)的平均值作為最終性能的評估指標(biāo)[18]。
本文采用了10折交叉驗證。首先,將所有樣本均勻分成10個子集。然后,依次遍歷這10個子集,每次將1個子集作為驗證集,其余9個子集作為訓(xùn)練集用于模型的訓(xùn)練。最后,取這10次評估的平均值作為最終評估指標(biāo)。
表4列出了4種集成學(xué)習(xí)模型在網(wǎng)格搜索中需要調(diào)優(yōu)的主要超參數(shù),表5總結(jié)了每個模型的最佳超參數(shù)組合以及相應(yīng)的交叉驗證性能評分。
3.3" 模型預(yù)測結(jié)果
為了準(zhǔn)確比較4種集成學(xué)習(xí)模型的預(yù)測能力,這4種模型均使用相同的訓(xùn)練集和測試集,最終通過4個評估指標(biāo)(決定系數(shù)、平均絕對誤差、均方根
誤差、可靠性指數(shù))評價模型的預(yù)測能力。4個評估指標(biāo)的計算公式為式(1)-(4):
R=1-∑mi=1(f(xi)-yi)2∑mi=1(yi-yi)2(1)
M=1m∑mi=1|f(xi)-yi|(2)
r=1m∑mi=1(f(xi)-yi)2(3)
a10=m10m(4)
其中:R為決定系數(shù);M為平均絕對誤差;r為均方根誤差;a10為可靠性指數(shù);f(xi)為模型對蔗渣灰混凝土抗壓強度的預(yù)測值,MPa;yi為蔗渣灰混凝土抗壓強度的實驗值,MPa;yi為蔗渣灰混凝土抗壓強度實驗值的平均值,MPa;m為數(shù)據(jù)集樣本的數(shù)量;m10為實驗值與預(yù)測值之比在0.9和1.1之間的數(shù)據(jù)集樣本數(shù)量。
決定系數(shù)是一種用于評估模型擬合程度的統(tǒng)計指標(biāo),表示因變量(輸出變量)的變異性能夠被自變量(輸入變量)解釋的比例,它的取值范圍在0到1之間,其值越接近于1,說明模型對數(shù)據(jù)擬合效果越好;平均絕對誤差用于評估預(yù)測值和實驗值之間的接近程度,其值越小說明擬合效果越好;均方根誤差是一種用于衡量預(yù)測值和實驗值之間的偏差的度量,它對一組數(shù)據(jù)中非常大或者非常小的誤差反應(yīng)非常敏感,其值越小說明模型擬合效果越好;可靠性指數(shù)通過顯示預(yù)測值與實驗值偏差在±10%之間的樣本數(shù)量占全部樣本數(shù)量的比例來評估模型的可靠性,其值越靠近1說明模型可靠性越高,模型擬合效果越好。
圖7(a)-(d)展示的預(yù)測結(jié)果可以作為評估4個集成學(xué)習(xí)模型預(yù)測能力的參考依據(jù)。圖中的藍色圓點代表訓(xùn)練集結(jié)果,橙色方點代表測試集結(jié)果。4種模型預(yù)測結(jié)果的數(shù)據(jù)點散布在基線(y=x)周圍。觀察圖7(a)-(d)可以發(fā)現(xiàn),圖7(a)中預(yù)測值與實驗值之間的差異較小,表明集成學(xué)習(xí)模型XGBoost的預(yù)測能力較好。
為了比較4種模型的預(yù)測能力,表6列出了4種模型在訓(xùn)練集和測試集上的評估指標(biāo)具體數(shù)值。在訓(xùn)練集上,XGBoost模型表現(xiàn)出色,其R為0.976,M為1.811,r為2.344,a10為0.875,優(yōu)于其他3個模型。LightGBM模型的表現(xiàn)較差,4個評估指標(biāo)的數(shù)值分別為0.529、7.959、10.490、0.271,準(zhǔn)確性最低。
在測試集上,XGBoost模型展現(xiàn)出良好的泛化能力,其R為0.833,M為6.229,r為11.898,a10為0.333。LightGBM模型的表現(xiàn)最差,其R為0.384,M為12.722,r為16.601,a10為0.250,表明其在未見數(shù)據(jù)上的適應(yīng)能力較差。綜合考慮4個評估指標(biāo),4個模型的預(yù)測能力由高到低依次為XGBoost、RF、AdaBoost、LightGBM。
3.4" SHAP影響因素分析
基于以上結(jié)果分析,選用XGBoost模型進行影響因素分析。由于集成學(xué)習(xí)模型只能得到最終的預(yù)測結(jié)果,無法解釋特征值對結(jié)果的影響。因此本文通過SHAP值方法定量解釋每個輸入變量對于預(yù)測結(jié)果的影響。
集成學(xué)習(xí)模型的解釋方法包括Partial dependence plot(PDP)、Individual conditional expectation(ICE)、Permuted feature importance(PFI)、Global surrogate(GS)、Local surrogate(LS)、Shapley value(SHAP)等,其中SHAP值方法在集成學(xué)習(xí)模型的解釋中應(yīng)用最為廣泛,因為它既能反映每個樣本所有特征的影響,又能顯示影響的正負性[25]。
根據(jù)得到的SHAP值創(chuàng)建XGBoost模型的全局特征重要性條形圖和全局特征重要性蜂窩圖,如圖8-圖9所示。觀察圖8可以看出,各輸入變量對抗壓強度的影響從大到小排序為:水泥含量、細骨
料含量、粗骨料含量、蔗渣灰摻和量、水灰比。由此可以得到結(jié)論:水泥含量對抗壓強度的影響是最大的,而蔗渣灰摻和量的影響相對較小。
XGBoost模型全局特征重要性蜂窩圖如圖9所示,其中每個點的顏色從藍色過渡到紅色表示相應(yīng)特征值由小變大。觀察圖9可以得到以下結(jié)論:
a)水泥含量對蔗渣灰混凝土抗壓強度的影響。水泥含量的特征值與SHAP值呈現(xiàn)正相關(guān),這表明水泥含量對抗壓強度有正面的影響。
b)細骨料含量和蔗渣灰摻和量對蔗渣灰混凝土抗壓強度的影響。隨著細骨料含量和蔗渣灰摻和量的增加,SHAP值呈現(xiàn)先增加后減小的趨勢,這說明過多的細骨料含量和蔗渣灰摻和量對混凝土抗壓強度有負面影響。
c)水灰比對蔗渣灰混凝土抗壓強度的影響。水灰比的值與SHAP值呈現(xiàn)負相關(guān),這表明水灰比對抗壓強度具有負面影響。
綜合圖8和圖9的信息,可以得出結(jié)論:蔗渣灰摻和量較低時并不會明顯降低混凝土的抗壓強度。
4" 結(jié)" 論
本文構(gòu)建了基于集成學(xué)習(xí)的蔗渣灰混凝土抗壓強度預(yù)測模型,首先通過試驗探究了蔗渣灰摻和量對混凝土抗壓強度的影響,然后挑選出了預(yù)測能力最佳的集成學(xué)習(xí)模型,最后定量分析了輸入變量對蔗渣灰混凝土抗壓強度的影響。所得主要研究結(jié)論有:
a)蔗渣灰混凝土抗壓強度試驗結(jié)果顯示,蔗渣灰摻和量在10.00%以下時對混凝土抗壓強度沒有明顯的負面影響,蔗渣灰摻和量超過10.00%時對混凝土抗壓強度表現(xiàn)出了負面影響。
b)XGBoost模型在4個模型中預(yù)測效果最好,它在訓(xùn)練集的R、M、r、a10分別為0.976、1.811、2.344、0.875,在測試集中的R、M、r、a10分別為0.833、6.229、11.898、0.333。
c)蔗渣灰混凝土抗壓強度的影響因素分析結(jié)果顯示,水泥含量對抗壓強度影響最大,對抗壓強度有正面影響;蔗渣灰摻和量影響相對較小,并且蔗渣灰摻和量過多會有負面影響,該結(jié)果與本文進行的試驗結(jié)果基本符合。
本文發(fā)現(xiàn),在混凝土中使用替代率不超過10.00%的蔗渣灰來替代水泥,不僅能夠確?;炷恋男阅埽€有助于減少環(huán)境污染,這為混凝土配合比設(shè)計提供了有益的指導(dǎo)。XGBoost模型的應(yīng)用不僅能夠支持混凝土質(zhì)量控制方面的工程實踐,還突顯了在可持續(xù)性設(shè)計中合理使用蔗渣灰的重要性。
參考文獻:
[1]黃萍, 徐青, 吳能森, 等. 蔗渣灰特性及其在建筑材料的應(yīng)用研究綜述[J]. 武漢工程大學(xué)學(xué)報, 2022, 44(6): 599-607.
[2]王卓琳, 黎慶濤, 田瀟凌, 等. 甘蔗糖廠廢棄物蔗渣灰綜合利用的研究進展和展望[J]. 輕工科技, 2018, 34(2): 74-76.
[3]Andreo P V, Suleiman A R, Cordeiro G C, et al. Beneficiation of sugarcane bagasse ash: Pozzolanic activity and leaching behavior[J]. Waste and Biomass Valorization, 2020, 11(8): 4393-4402.
[4]Martirena Hernndez J F, Middendorf B, Gehrke M, et al. Use of wastes of the sugar industry as pozzolana in lime-pozzolana binders: Study of the reaction[J]. Cement and Concrete Research, 1998, 28(11): 1525-1536.
[5]Ambedkar B, Alex J, Dhanalakshmi J. Enhancement of mechanical properties and durability of the cement concrete by RHA as cement replacement: Experiments and modeling[J]. Construction and Building Materials, 2017, 148: 167-175.
[6]Rodier L, Bilba K, Onsippe C, et al. Study of pozzolanic activity of bamboo stem ashes for use as partial replacement of cement[J]. Materials and Structures, 2016, 50(1): 87.
[7]Al-Akhras N M, Abu-Alfoul B A. Effect of wheat straw ash on mechanical properties of autoclaved mortar[J]. Cement and Concrete Research, 2002, 32(6): 859-863.
[8]Xu Q, Ji T, Gao S J, et al. Characteristics and applications of sugar cane bagasse ash waste in cementitious materials[J]. Materials, 2018, 12(1): 39.
[9]Sales A, Lima S A. Use of Brazilian sugarcane bagasse ash in concrete as sand replacement[J]. Waste Management, 2010, 30(6): 1114-1122.
[10]Katare V D, Madurwar M V. Experimental characterization of sugarcane biomass ash: A review[J]. Construction and Building Materials, 2017, 152: 1-15.
[11]馬財龍, 王文虎, 侯憲龍, 等.基于可解釋機器學(xué)習(xí)方法的RC深受彎構(gòu)件開裂剪力預(yù)測[J]. 新疆大學(xué)學(xué)報(自然科學(xué)版)(中英文), 2023, 40(5):621-629.
[12]李萌, 武海軍, 董恒, 等.基于機器學(xué)習(xí)的混凝土侵徹深度預(yù)測模型[J]. 兵工學(xué)報,2023,44(12):3771-3782.
[13]李宏偉, 王文武, 賈馮睿, 等.鋼筋混凝土黏結(jié)-滑移行為敏感性分析及機器學(xué)習(xí)模型[J/OL]. 遼寧石油化工大學(xué)學(xué)報: 1-9(2023-06-26)[2024-01-26].http:∥kns.cnki.net/kcms/detail/21.1504.TE.20230625.1448.008.html.
[14]李騰宇, 梁晉鵬, 陀廣泉, 等. 蔗渣灰對砂漿性能及孔結(jié)構(gòu)的影響研究[J]. 混凝土與水泥制品,2022,(10):92-95.
[15]Sagi O, Rokach L. Approximating XGBoost with an interpretable decision tree[J]. Information Sciences, 2021, 572: 522-542.
[16]張馳, 郭媛, 黎明. 人工神經(jīng)網(wǎng)絡(luò)模型發(fā)展及應(yīng)用綜述[J]. 計算機工程與應(yīng)用, 2021, 57(11): 57-69.
[17]李慧, 李正, 佘堃. 一種基于綜合不放回抽樣的隨機森林算法改進[J]. 計算機工程與科學(xué), 2015, 37(7): 1233-1238.
[18]Guo R H, Fu D L, Sollazzo G. An ensemble learning model for asphalt pavement performance prediction based on gradient boosting decision tree[J]. International Journal of Pavement Engineering, 2022, 23(10): 3633-3646.
[19]Freund Y, Schapire R E. A desicion-theoretic generalization of on-line learning and an application to boosting[C]∥European Conference on Computational Learning Theory, 1995. Berlin, Heidelberg: Springer Berlin Heidelberg, 1995: 23-37.
[20]Shah M I, Javed M F, Aslam F, et al. Machine learning modeling integrating experimental analysis for predicting the properties of sugarcane bagasse ash concrete[J]. Construction and Building Materials, 2022,314:125634.
[21]Sai Vamsi Gangadhar M, Absar W, Siddharth A, et al. Comparative study on sugarcane bagasse ash and banana peel powder on concrete and its properties[J/OL]. Materials Today: Proceedings. (2023-01-24)[2023-11-27]. https:∥doi.org/10.1016/j.matpr.2023.04.041.
[22]Wang H Q, Yi W, Liu Y. An innovative approach of determining the sample data size for machine learning models: a case study on health and safety management for infrastructure workers[J]. Electronic Research Archive, 2022, 30(9): 3452-3462.
[23]王健峰, 張磊, 陳國興, 等. 基于改進的網(wǎng)格搜索法的SVM參數(shù)優(yōu)化[J]. 應(yīng)用科技, 2012, 39(3): 28-31.
[24]Naderpour H, Mirrashid M. Estimating the compressive strength of eco-friendly concrete incorporating recycled coarse aggregate using neuro-fuzzy approach[J]. Journal of Cleaner Production, 2020, 265: 121886.
[25]Mi J X, Li A D, Zhou L F. Review study of interpretation methods for future interpretable machine learning[J]. IEEE Access, 2020, 8: 191969-191985.
附錄A
(責(zé)任編輯:康" 鋒)