李志國(guó) 白瑞涵 劉旭進(jìn) 王庶懋※
1) 中國(guó)電力工程顧問(wèn)集團(tuán)華東電力設(shè)計(jì)院有限公司,上海 200063
2) 河海大學(xué)巖土力學(xué)與堤壩工程教育部重點(diǎn)實(shí)驗(yàn)室,江蘇南京 210024
3) 河海大學(xué)江蘇省巖土工程技術(shù)工程研究中心,江蘇南京 210024
地基沉降是沿海地區(qū)的一種嚴(yán)重緩變的地質(zhì)災(zāi)害,具有累積和不可逆轉(zhuǎn)的特性,其影響將持續(xù)的發(fā)生作用。上海作為我國(guó)地基沉降最嚴(yán)重的城市之一,控制地基的沉降對(duì)上海地區(qū)的發(fā)展十分重要。土的壓縮模量和壓縮系數(shù)是評(píng)價(jià)土體壓縮性和地基沉降計(jì)算的主要指標(biāo),而土體的物理指標(biāo)參數(shù)會(huì)影響土體壓縮性,所以需要開(kāi)展土體壓縮性指標(biāo)與物理參數(shù)的相關(guān)性分析,為實(shí)際工程提供指導(dǎo)。
Koppula[1]與Rendon-Herrero[2]認(rèn)為天然含水率對(duì)土顆粒表面水膜厚度有影響,對(duì)土體結(jié)構(gòu)與壓縮性展開(kāi)了相關(guān)性分析;Schofield和Wroth[3]與Nakase等[4]認(rèn)為土體的可塑狀態(tài)與其壓縮性密不可分,基于工程實(shí)測(cè)數(shù)據(jù)進(jìn)行壓縮指數(shù)與塑性指數(shù)的相關(guān)性分析;Azzouz等[5]對(duì)700多組固結(jié)試驗(yàn)得到的壓縮指數(shù)和壓縮系數(shù)進(jìn)行了回歸分析,建立了塑性指數(shù)、天然含水率、初始孔隙比多變量特征的壓縮指數(shù)預(yù)測(cè)公式;劉吉福和高玉峰[6]對(duì)廣東省13條高速公路軟粘土的物理力學(xué)指標(biāo)進(jìn)行了相關(guān)性分析,并得出壓縮系數(shù)與含水率、孔隙比、密度之間呈現(xiàn)良好的冪函數(shù)關(guān)系;趙孝旗等[7]對(duì)杭州地區(qū)大量的海相軟土試樣進(jìn)行統(tǒng)計(jì)分析,研究結(jié)果表明壓縮系數(shù)與物理指標(biāo)孔隙比、質(zhì)量密度、天然含水率具有較強(qiáng)線性關(guān)系;劉伽等[8]對(duì)上海、廣州、江蘇、連云港、溫州等地黏性土物理力學(xué)指標(biāo)統(tǒng)計(jì)分析,結(jié)果表明壓縮指數(shù)與初始孔隙比、干重度、液限多參數(shù)的相關(guān)性最高;涂春霖等[9]基于相關(guān)關(guān)系和一元線性回歸分析等方法分析了遮放盆地粉質(zhì)黏土,其中液性指數(shù)與壓縮系數(shù)、壓縮模量相關(guān)性較好,并提出可根據(jù)液性指數(shù)估算力學(xué)指標(biāo);白冰等[10]研究了塑性指數(shù)對(duì)飽和軟黏土壓縮變形參數(shù)的影響,得到了壓縮指數(shù)、回彈指數(shù)、次固結(jié)系數(shù)等與塑性指數(shù)的線性擬合關(guān)系;李晨晨等[11]取土樣于昆明市南市區(qū),給出了物理指標(biāo)與力學(xué)指標(biāo)參數(shù)的經(jīng)驗(yàn)公式;孫毅力和于洪民[12]以北京地區(qū)積累的物理指標(biāo)參數(shù)為研究對(duì)象,分析了該地區(qū)土體參數(shù)對(duì)壓縮模量的影響規(guī)律;李旭昶等[13]對(duì)揚(yáng)州地區(qū)土體的物理力學(xué)指標(biāo)展開(kāi)分析,并就塑性指數(shù)與壓縮系數(shù)提出了經(jīng)驗(yàn)公式;丁祖德等[14]就昆明地區(qū)泥炭質(zhì)土提出了壓縮系數(shù)與液性指數(shù)的經(jīng)驗(yàn)公式。以上土體壓縮系數(shù)與物理參數(shù)的相關(guān)性研究大多采用擬合或回歸分析的方法,擬合方法往往對(duì)非線性問(wèn)題表現(xiàn)不佳,而回歸分析是基于先驗(yàn)知識(shí)的推測(cè),限制了變量的多樣性和不可測(cè)性,這使得以上方法在實(shí)際工程應(yīng)用時(shí)具有一定局限性。近年來(lái)隨著機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等新理論、新技術(shù)的高速發(fā)展,眾多學(xué)者就人工智能在土木工程領(lǐng)域做出了眾多的嘗試,張鶴[15]基于MLP和RBF神經(jīng)網(wǎng)絡(luò)建立不同的軟土物理參數(shù)——壓縮模量神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型;蔣建平等[16]基于RBF神經(jīng)網(wǎng)絡(luò)建立了以壓縮系數(shù)為輸出,多參數(shù)組合孔隙比、塑性指數(shù)、水與土粒的質(zhì)量比、密度為輸入的模型,并驗(yàn)證了該模型的誤差在巖土工程中是可以接受的;Zhang等[17]基于GBRT算法建立了壓縮模量的預(yù)測(cè)模型,并使用GA遺傳算法對(duì)GBRT超參數(shù)優(yōu)化,與傳統(tǒng)的經(jīng)驗(yàn)公式對(duì)比證明了該方法的優(yōu)越性。
機(jī)器學(xué)習(xí)中支持向量機(jī)算法(SVR)的核心理念為尋求結(jié)構(gòu)化風(fēng)險(xiǎn)最小來(lái)提高模型的泛化能力,即通過(guò)合理的函數(shù)變換將輸入變量映射到高維空間后進(jìn)行回歸分析,能夠很好的處理非線性特征的相互作用。本文將結(jié)合支持向量機(jī)算法,對(duì)上海地區(qū)土體的物理力學(xué)指標(biāo)展開(kāi)相關(guān)性分析,為進(jìn)一步拓展到更為廣泛區(qū)域提供重要指導(dǎo)。
土體物理力學(xué)指標(biāo)統(tǒng)計(jì)分析所需的數(shù)據(jù)來(lái)源于上海地區(qū)的6處工程場(chǎng)地的室內(nèi)試驗(yàn)。
對(duì)上海地區(qū)工程場(chǎng)地所取得的大量淤泥質(zhì)粘土、粘土、粉質(zhì)粘土、砂質(zhì)粉土的物理力學(xué)指標(biāo)進(jìn)行統(tǒng)計(jì),結(jié)果見(jiàn)表1。由表統(tǒng)計(jì)分析結(jié)果知,上海地區(qū)土體的天然密度ρ和土粒比重Gs的變化范圍都不大,且變異系數(shù)都接近于0,說(shuō)明這些指標(biāo)在上海地區(qū)相對(duì)均一,所以在實(shí)際應(yīng)用分析時(shí)可不考慮土的天然密度和土粒比重的影響。上海地區(qū)所取得的4種土體有以下特征:
表1 土的物理力學(xué)指標(biāo)統(tǒng)計(jì)Table 1 Statistics of physical and mechanical indexes of soil
(1)淤泥質(zhì)粘土的天然含水量w變化范圍為24.40%——63.40%,均值達(dá)到42.93%,土體含水量較大;液性指數(shù)IL變化范圍在0.52——2.57之間,均值為1.41,這說(shuō)明上海地區(qū)淤泥質(zhì)粘土多處于軟塑至流塑狀態(tài);塑性指數(shù)IP的變化范圍為9.40——22.80,均值為14.62,說(shuō)明土中有一定的粘粒含量;其塑限、液限、液性指數(shù)與塑性指數(shù)的變異系數(shù)分別為0.13、0.16、0.23、0.23,這幾個(gè)指標(biāo)的變異系數(shù)均大于0.1,在具體取值時(shí)應(yīng)考慮其變異性;壓縮系數(shù)的均值為 0.84 MPa?1,大于 0.5 MPa?1,屬于高壓縮性土。
(2)粘土的天然含水量w變化范圍為24.00%——52.60%,均值達(dá)到36.22%;液性指數(shù)IL變化范圍在0.35——1.93之間,均值為0.92;塑性指數(shù)IP的變化范圍在10.80——20.60之間,均值為15.47,這些說(shuō)明上海地區(qū)粘土土粒較細(xì),黏粒含量較高;其塑限、液限、液性指數(shù)與塑性指數(shù)的變異系數(shù)分別為0.12、0.12、0.47、0.16,這幾個(gè)指標(biāo)的變異系數(shù)均大于0.1,液性指數(shù)接近于0.5,變異性相對(duì)較大,在具體取值時(shí)應(yīng)考慮其變異性;壓縮系數(shù)均值為0.57 MPa?1,大于 0.5 MPa?1,屬于高壓縮性土。
(3)粉質(zhì)粘土的天然含水量w變化范圍為18.20%——52.00%,均值達(dá)到30.97%;液性指數(shù)IL變化范圍處于?0.31——1.84之間,變化范圍較大,均值為0.72;塑性指數(shù)IP的變化范圍在9.00——22.80之間,均值為13.68,上海地區(qū)粉質(zhì)粘土的塑性指數(shù)較淤泥質(zhì)粘土和粘土相對(duì)較小,所以其細(xì)顆粒含量相對(duì)較少,顆粒相對(duì)較粗;其塑限、液限、液性指數(shù)與塑性指數(shù)的變異系數(shù)分別為0.11、0.13、0.57、0.19,這幾個(gè)指標(biāo)的變異系數(shù)均大于0.1,液性指數(shù)大于0.5,在指標(biāo)取值時(shí)變異性較大;壓縮系數(shù)均值為0.41 MPa?1,小于0.5 MPa?1,屬于中壓縮性土,其變異系數(shù)為 0.51,變異性較大。
(4)砂質(zhì)粉土的天然含水量w變化范圍為19.90%——46.40%,均值達(dá)到31.51%;液性指數(shù)IL變化范圍大,處于0.35——1.90之間,均值為1.10;塑性指數(shù)IP的變化范圍為7.10——17.70,均值為10.15,上海地區(qū)砂質(zhì)粉土塑性指數(shù)較小,細(xì)顆粒含量較少,則其比表面結(jié)合水含量較低;其塑限、液限、液性指數(shù)與塑性指數(shù)的變異系數(shù)分別為0.12、0.11、0.30、0.19,這幾個(gè)指標(biāo)的變異系數(shù)均大于0.1,指標(biāo)取值時(shí)變異性較大;壓縮系數(shù)的變化范圍為 0.10——0.83 MPa?1,均值為0.39 MPa?1,小于 0.5 MPa?1,屬于中壓縮性土,其變異系數(shù)為0.46,變異性較大。
上海地區(qū)所取的4種類型土體的天然密度變化范圍不大,土顆粒結(jié)構(gòu)緊密狀態(tài)相近,在土體壓縮系數(shù)相關(guān)性分析中可忽略土體密度的影響;而塑性指數(shù)、液性指數(shù)影響著土體結(jié)構(gòu)與表面水膜厚度,對(duì)土體壓縮系數(shù)影響較大。因此,本文研究重點(diǎn)針對(duì)壓縮系數(shù)與塑性指數(shù)、液性指數(shù)的相關(guān)性展開(kāi)研究,建立變量之間的相關(guān)性散點(diǎn)圖(圖1),可見(jiàn)壓縮系數(shù)與塑性指數(shù)、液性指數(shù)呈正相關(guān)。
圖1 相關(guān)性散點(diǎn)圖Fig.1 Correlation scatter plot
支持向量機(jī)是一種基于統(tǒng)計(jì)學(xué)理論的原理性方法,可用于線性和非線性回歸問(wèn)題。通過(guò)尋求結(jié)構(gòu)化風(fēng)險(xiǎn)最小來(lái)提高學(xué)習(xí)機(jī)泛化能力,實(shí)現(xiàn)經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信范圍的最小化,從而達(dá)到在統(tǒng)計(jì)樣本量較少的情況下,亦能獲得良好統(tǒng)計(jì)規(guī)律的目的。其基本思想是通過(guò)一個(gè)非線性變換將輸入空間對(duì)應(yīng)于一個(gè)特征空間,使得在輸入空間中的決策超曲面模型對(duì)應(yīng)于特征空間中的決策超平面模型。
給定訓(xùn)練樣本,希望基于機(jī)器學(xué)習(xí)學(xué)得一個(gè)回歸模型,使得f(x)與y盡可能接近,w和b是待確定的模型參數(shù)。通過(guò)設(shè)定最大容忍誤差ε,當(dāng)誤差絕對(duì)值大于ε時(shí)才計(jì)算損失,SVR問(wèn)題可轉(zhuǎn)化為:
式中,C為正則化常數(shù),lε為ε的不敏感損失函數(shù)。
支持向量損失函數(shù)表達(dá)為:
引入拉格朗日乘子μi:
上述過(guò)程中需要滿足KKT條件,即要求:
SVR的解形如:
式中,若0<αi<C,則必有 ξi=0
若考慮特征映射形式,則:
則SVR可表示為:
通過(guò)對(duì)方程求解確定模型的最終參數(shù)w和b,式中k(xi,xj)表示SVR模型的核函數(shù),該函數(shù)的主要作用是將樣本映射到高維狀態(tài)并進(jìn)行運(yùn)輸。
采用MAE(平均絕對(duì)誤差)、RMSE(均方根誤差)、MSE(均方誤差)、R2(決定系數(shù))作為預(yù)測(cè)準(zhǔn)確性的評(píng)判標(biāo)準(zhǔn),具體表達(dá)式如下:
MAE、RMSE、MSE指標(biāo)越小,R2越接近于1,表示預(yù)測(cè)值與真實(shí)值間誤差越小。
為使機(jī)器學(xué)習(xí)模型在真實(shí)數(shù)據(jù)上能達(dá)到良好的預(yù)測(cè)效果,在訓(xùn)練過(guò)程中需要對(duì)模型的超參數(shù)進(jìn)行設(shè)定,其中包括模型的輸入變量與支持向量機(jī)參數(shù)(核函數(shù)系數(shù)γ,誤差懲罰系數(shù)C,最大容忍誤差ε)。本文將搜集到的數(shù)據(jù)集劃分兩份,一份用來(lái)訓(xùn)練模型,一份用來(lái)評(píng)估模型,分別稱為訓(xùn)練集和測(cè)試集,并分別基于壓縮系數(shù)預(yù)測(cè)值和實(shí)測(cè)值的分布散點(diǎn)圖與誤差累計(jì)曲線對(duì)影響模型預(yù)測(cè)精度的超參數(shù)展開(kāi)分析,以確定出每個(gè)超參數(shù)的最優(yōu)取值。在預(yù)測(cè)值與實(shí)測(cè)值的分布散點(diǎn)(圖2a)中,橫坐標(biāo)與縱坐標(biāo)分別為測(cè)試樣本的真實(shí)值與預(yù)測(cè)值,黑色虛線y=x代表預(yù)測(cè)值等于真實(shí)值,測(cè)試樣本點(diǎn)越集中于平分線,表明在該情況下模型的預(yù)測(cè)值越接近于真實(shí)值。而誤差累積曲線(圖2b)中,圖中橫坐標(biāo)為待測(cè)試樣本的序號(hào),縱坐標(biāo)為誤差累計(jì)總值,該值初始情況為零,按順序每對(duì)一個(gè)待測(cè)樣本進(jìn)行誤差計(jì)算后,該樣本的誤差值累加在誤差累積總值之上,隨著測(cè)試樣本數(shù)量的不斷增加,誤差累計(jì)總值不斷變大。當(dāng)總誤差累積曲線的斜率越緩,代表在相同的測(cè)試樣本中該情況下的模型誤差累積總值累積速度越快,即總預(yù)測(cè)的偏離程度越大。
2.3.1 輸入變量
為確定壓縮系數(shù)支持向量機(jī)預(yù)測(cè)模型的輸入變量,對(duì)比兩種單變量輸入和一種多變量輸入。兩種單變量輸入分別為塑性指數(shù)和液性指數(shù),多變量輸入為塑性指數(shù)與液性指數(shù)。除輸入變量不一致外,其余的支持向量機(jī)參數(shù)設(shè)置相同,這里支持向量機(jī)算法模型采用線性核函數(shù)。
圖2給出了支持向量機(jī)算法模型在3種輸入變量下預(yù)測(cè)結(jié)果的對(duì)比分析(圖2b),結(jié)合誤差評(píng)價(jià)指標(biāo)(表2),單變量輸入液性指數(shù)的誤差整體較大,塑性指數(shù)輸入小于液性指數(shù)輸入,多變量輸入誤差最小??梢园l(fā)現(xiàn)多變量輸入比另外兩種單變量輸入在誤差大小和模型穩(wěn)定性上均有較大優(yōu)勢(shì)。因此,本文采用由塑性指數(shù)與液性指數(shù)的多變量輸入展開(kāi)與壓縮系數(shù)的相關(guān)性分析。
表2 不同輸入變量預(yù)測(cè)結(jié)果誤差對(duì)比Table 2 Error comparison of forecast results for different input variables
圖2 不同輸入變量預(yù)測(cè)結(jié)果的對(duì)比分析Fig.2 Comparisive analysis of forecast results for different input variables
圖2a中支持向量機(jī)在線性核函數(shù)下基于塑性指數(shù)、液性指數(shù)多變量建立預(yù)測(cè)模型后,對(duì)真實(shí)值較小的壓縮系數(shù)預(yù)測(cè)出現(xiàn)負(fù)值,與實(shí)際情況不符合??紤]到不同類別土體中細(xì)顆粒含量不同,相應(yīng)的表面結(jié)合水含量不同,所以不同類別土體塑性與壓縮性的相關(guān)性不同,而線性核函數(shù)較為簡(jiǎn)單,對(duì)多類別土體關(guān)系的映射較為片面,加之沒(méi)有對(duì)模型誤差項(xiàng)懲罰性系數(shù)C進(jìn)行優(yōu)化來(lái)降低個(gè)別奇異點(diǎn)對(duì)整體的影響,故所建立的模型適用性較差。接下來(lái)對(duì)模型的核函數(shù)與誤差項(xiàng)懲罰系數(shù)C進(jìn)行分析,以此期望能夠增強(qiáng)模型對(duì)多類別土體壓縮系數(shù)預(yù)測(cè)的魯棒性。
2.3.2 核函數(shù)
當(dāng)輸入為多變量時(shí),為確定最優(yōu)核函數(shù),這里對(duì)支持向量機(jī)不同核函數(shù)(線性、多項(xiàng)式、RBF)進(jìn)行對(duì)比(圖3)。從誤差累計(jì)曲線沿著y軸正向的增長(zhǎng)速度(圖3b)及誤差指標(biāo)(表3),核函數(shù)RBF模型在預(yù)測(cè)有一定的優(yōu)勢(shì)。就塑性指數(shù)、液性指數(shù)與壓縮系數(shù)的相關(guān)性分析而言,核函數(shù)RBF優(yōu)于線性核函數(shù)和多項(xiàng)式核函數(shù)。
圖3 不同核函數(shù)預(yù)測(cè)結(jié)果的對(duì)比分析Fig.3 Comparisive analysis of forecast results for different kernel functions
表3 不同核函數(shù)預(yù)測(cè)結(jié)果誤差對(duì)比Table 3 Error comparison of forecast results for different kernel functions
2.3.3 誤差項(xiàng)懲罰系數(shù) C
為了確定最優(yōu)誤差項(xiàng)懲罰系數(shù),這里對(duì)支持向量機(jī)不同誤差項(xiàng)懲罰系數(shù)進(jìn)行比較(圖4)。通過(guò)誤差累計(jì)曲線于y軸方向的增長(zhǎng)速度(圖4b),結(jié)合誤差指標(biāo)(表4),誤差項(xiàng)懲罰系數(shù)C=5相較于其他取值在預(yù)測(cè)時(shí)更加準(zhǔn)確。
表4 不同誤差項(xiàng)懲罰系數(shù)預(yù)測(cè)結(jié)果誤差對(duì)比Table 4 Error comparison of forecast results of penalty coefficients of different error item
圖4 不同誤差項(xiàng)懲罰系數(shù)預(yù)測(cè)結(jié)果的對(duì)比分析Fig.4 Comparisive analysis of forecast results of penalty coefficients of different error item
在以上分析中,根據(jù)測(cè)試樣本的預(yù)測(cè)誤差,確定出模型的最優(yōu)輸入模式為塑性指數(shù)與液性指數(shù)二維輸入變量,支持向量機(jī)算法的最優(yōu)核函數(shù)為RBF,誤差項(xiàng)懲罰系數(shù)的最優(yōu)取值為5。通過(guò)對(duì)上海地區(qū)工程場(chǎng)地中大量的淤泥質(zhì)粘土、粘土、粉質(zhì)粘土、砂質(zhì)粉土數(shù)據(jù)集訓(xùn)練建立最終模型,進(jìn)而為上海廣泛區(qū)域土體的壓縮性研究提供指導(dǎo)。
基于支持向量機(jī)算法在塑性指數(shù)、液性指數(shù)多變量輸入情況下建立的模型與線性擬合、多項(xiàng)式擬合方法對(duì)比分析。以上海某一場(chǎng)地為例,該場(chǎng)地壓縮系數(shù)在不同方法下的預(yù)測(cè)結(jié)果如圖5所示,各方法預(yù)測(cè)結(jié)果與真實(shí)情況的誤差指標(biāo)見(jiàn)表5。
圖5 不同方法的壓縮系數(shù)預(yù)測(cè)結(jié)果對(duì)比分析Fig.5 Comparisive analysis of prediction results of compression coefficients by different methods
表5 不同方法的壓縮系數(shù)預(yù)測(cè)結(jié)果誤差對(duì)比Table 5 Error comparison of prediction results of compression coefficients by different methods
圖5a給出了在不同方法下樣本點(diǎn)預(yù)測(cè)值與實(shí)測(cè)值的分布結(jié)果,基于支持向量機(jī)算法在多變量因素下建立的預(yù)測(cè)模型,數(shù)據(jù)更加趨于分布在平分線兩側(cè);而線性擬合與多項(xiàng)式擬合的預(yù)測(cè)方法,部分樣本點(diǎn)位于平分線右下方,預(yù)測(cè)值小于真實(shí)值,可見(jiàn)采用本文支持向量機(jī)算法所建立的多參數(shù)預(yù)測(cè)模型預(yù)測(cè)值與真實(shí)值較為貼近。圖5b為各個(gè)方法預(yù)測(cè)結(jié)果的誤差累計(jì)值,基于支持向量機(jī)算法的多因素預(yù)測(cè)方法樣本誤差的累計(jì)速度較慢,即整體的偏離程度越小,相比于擬合方法有明顯的優(yōu)勢(shì)。圖5c給出了預(yù)測(cè)值與真實(shí)值比值的頻數(shù)分布曲線,基于支持向量機(jī)算法多因素頻數(shù)分布曲線相較陡峭,數(shù)據(jù)點(diǎn)最為集中,多項(xiàng)式擬合方法頻數(shù)分布曲線表現(xiàn)為右邊的尾部相對(duì)于與左邊的尾部要長(zhǎng),即有輕微的右態(tài)偏,說(shuō)明部分樣本的預(yù)測(cè)值大于真實(shí)值。因此,從整體上基于支持向量機(jī)算法建立的多參數(shù)預(yù)測(cè)模型更有優(yōu)勢(shì)。
為了進(jìn)一步驗(yàn)證支持向量機(jī)算法相比于其他擬合方法的優(yōu)勢(shì),本文構(gòu)建了不同數(shù)量的數(shù)據(jù)集0,1,2,3,4,數(shù)據(jù)集的數(shù)量逐漸增加,然后分別以支持向量機(jī)算法、線性擬合以及多項(xiàng)式擬合方法展開(kāi)訓(xùn)練或擬合,最后就同一測(cè)試樣本進(jìn)行精度驗(yàn)證。結(jié)果如圖6所示,隨著樣本數(shù)據(jù)的不斷增加,支持向量機(jī)所訓(xùn)練的模型精度不斷增加,考慮到算法復(fù)雜的理念設(shè)計(jì),基于大量數(shù)據(jù)可進(jìn)行更加深度的挖掘;而擬合方法較為簡(jiǎn)單,樣本達(dá)到一定數(shù)量后對(duì)擬合參數(shù)的影響趨于穩(wěn)定。
圖6 不同數(shù)量數(shù)據(jù)集下支持向量機(jī)與擬合方法的對(duì)比分析Fig.6 Comparative analysis of support vector machine and fitting methods in different datasets
土粒的微觀結(jié)構(gòu)反映出不同的土??紫丁⑺ず穸纫约罢沉:?,在沉淀中形成的土體結(jié)構(gòu)會(huì)影響土體的壓縮性。這里將預(yù)測(cè)值與實(shí)測(cè)值之間的偏差定義為預(yù)測(cè)偏差,利用偏差擬合曲線的變化來(lái)分析其他物理指標(biāo)對(duì)模型預(yù)測(cè)性能的影響,從而對(duì)模型的預(yù)測(cè)性能進(jìn)行評(píng)估。
圖7給出了基于物理指標(biāo)(塑限、液限、塑性指數(shù)、液性指數(shù))模型預(yù)測(cè)性能的偏差變化,散點(diǎn)表示基于模型預(yù)測(cè)偏差與其所對(duì)應(yīng)的物理指標(biāo),黑線和紅線分別表示模型預(yù)測(cè)的偏差擬合曲線與0偏差線。對(duì)于不同的物理指標(biāo),模型的預(yù)測(cè)準(zhǔn)確性有顯著差異,對(duì)應(yīng)各范圍預(yù)測(cè)結(jié)果誤差(表6)。隨著含水量、塑限、液限、塑性指數(shù)等物理指標(biāo)的逐漸增加,相應(yīng)樣本模型預(yù)測(cè)值上下偏離于真實(shí)值越大;而液性指數(shù)的變化對(duì)模型預(yù)測(cè)精度的影響較小,所以在模型使用時(shí)可忽略該指標(biāo)對(duì)預(yù)測(cè)準(zhǔn)度的影響。
表6 不同物理指標(biāo)預(yù)測(cè)結(jié)果誤差對(duì)比Table 6 Error comparison of prediction results for different physical indexes
圖7 不同物理指標(biāo)的預(yù)測(cè)偏差Fig.7 Forecast bias of different physical indexes
圖8給出了基于壓縮系數(shù)的預(yù)測(cè)偏差變化,其誤差結(jié)果如表7所示,高壓縮性土的預(yù)測(cè)偏差曲線隨著參數(shù)指標(biāo)的變化波動(dòng)起伏較大,中壓縮性土體趨于穩(wěn)定,即模型對(duì)淤泥質(zhì)粘土、粘土等中低壓縮性土體的預(yù)測(cè)能力更強(qiáng)。因此,在預(yù)測(cè)時(shí)模型對(duì)不同指標(biāo)區(qū)間土體的泛化能力有差異,可結(jié)合偏差變化曲線約束樣本指標(biāo)范圍來(lái)提高模型預(yù)測(cè)的準(zhǔn)確性。
表7 中高壓縮性土預(yù)測(cè)結(jié)果誤差對(duì)比Table 7 Error comparison of prediction results of medium and high compressible soil
圖8 基于壓縮系數(shù)的預(yù)測(cè)偏差變化Fig.8 Variation of forecast bias based on compression coefficients
本文運(yùn)用支持向量機(jī)算法開(kāi)展了上海地區(qū)土體的物理力學(xué)指標(biāo)相關(guān)性分析,得到如下結(jié)論:
(1)建立了基于塑性指數(shù)與液性指數(shù)的土體壓縮系數(shù)預(yù)測(cè)模型,所建立的雙因素模型相較于單因素塑性指數(shù)模型能夠有效地對(duì)土體壓縮系數(shù)進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果與實(shí)測(cè)結(jié)果相關(guān)性顯著提高、誤差明顯降低,該預(yù)測(cè)壓縮系數(shù)的模型算法可作為上海地區(qū)參數(shù)估計(jì)的參考驗(yàn)證。
(2)通過(guò)對(duì)模型算法的超參數(shù)進(jìn)行優(yōu)化,并將該模型與傳統(tǒng)的線性、多項(xiàng)式擬合方法對(duì)比,支持向量機(jī)模型預(yù)測(cè)結(jié)果與實(shí)際更為接近,具有一定的工程應(yīng)用價(jià)值。
(3)基于含水量、塑限、液限、塑性指數(shù)以及液性指數(shù)建立預(yù)測(cè)與實(shí)測(cè)壓縮系數(shù)之間的偏差變化曲線,發(fā)現(xiàn)含水量少、可塑性小的中壓縮性土體相較于高壓縮性土體的預(yù)測(cè)偏差幅度變化更小,模型更加穩(wěn)定與準(zhǔn)確。