王軍龍
(西安鐵路職業(yè)技術(shù)學(xué)院 土木工程系,西安 710600)
砂土液化是在循環(huán)往復(fù)荷載作用下,飽和砂土層孔隙水位升高,有效應(yīng)力降低,造成地基承載力部分或者全部喪失,形成的一種破壞性嚴(yán)重的區(qū)域性地質(zhì)災(zāi)害。20世紀(jì)60年代以來,幾次大的地震,如日本新瀉地震(1964)、美國阿拉斯加地震(1964)、中國唐山大地震(1978)以及神戶大地震(1995)、汶川特大地震(2008)等均因砂土液化導(dǎo)致堤防或建筑物大規(guī)模的破壞,給人類造成了巨大的經(jīng)濟(jì)損失,砂土液化問題引起了工程界的廣泛關(guān)注[1-2]??紤]單因素判定砂土液化具有一定的片面性,多因素綜合評判就成為砂土液化判別分析的一種可行方法。據(jù)此,國內(nèi)外的學(xué)者提出了多種綜合預(yù)測模型和方法,如神經(jīng)網(wǎng)絡(luò)模型、支持向量機(jī)模型、模糊綜合評價(jià)法、距離判別法、投影尋蹤模型、分形-插值模型[3-9]等。
總結(jié)上述模型和方法,可以將其分為2種類型:①以砂土液化分類標(biāo)準(zhǔn)為基礎(chǔ)采用一定的數(shù)學(xué)方法建立模型,這類模型和方法主要包括模糊綜合評價(jià)法、投影尋蹤模型和分形-插值模型,其中投影尋蹤模型和分形-插值模型將砂土分類標(biāo)準(zhǔn)直接轉(zhuǎn)化為數(shù)學(xué)表達(dá)式,易于使用,這類模型的有效性依賴于分類標(biāo)準(zhǔn)的準(zhǔn)確性;②以一定的砂土液化樣本數(shù)據(jù)為基礎(chǔ),對已有的模型和方法進(jìn)行訓(xùn)練,從而建立砂土液化預(yù)測模型,模型的有效性依賴于訓(xùn)練樣本的數(shù)量,這類模型和方法主要有神經(jīng)網(wǎng)絡(luò)模型、支持向量機(jī)模型和距離判別法等。
從模型的通用性和實(shí)用性考慮,具有一定數(shù)學(xué)表達(dá)式的模型更易于被理解和應(yīng)用,其只需將實(shí)際數(shù)據(jù)輸入數(shù)學(xué)表達(dá)式中即可計(jì)算出預(yù)測結(jié)果。為了建立簡單實(shí)用的砂土液化預(yù)測模型,本文結(jié)合主成分分析和Logistic回歸模型來描述砂土液化等級與影響因素之間的映射關(guān)系,建立了砂土液化預(yù)測的數(shù)學(xué)表達(dá)式。根據(jù)數(shù)據(jù)樣本的不同,該模型可以實(shí)現(xiàn)上述2種類型,即砂土液化分類標(biāo)準(zhǔn)的數(shù)學(xué)表達(dá),以及砂土液化實(shí)例數(shù)據(jù)的經(jīng)驗(yàn)表達(dá)。最后,工程實(shí)例分析結(jié)果顯示,本文建立的砂土液化預(yù)測模型簡單實(shí)用,預(yù)測效果良好,可以在工程中推廣應(yīng)用。
對于砂土液化預(yù)測問題,砂土液化等級為類別變量[9](不液化(Ⅰ)、輕微液化(Ⅱ)、中等液化(Ⅲ)、嚴(yán)重液化(Ⅳ)4個(gè)等級),砂土液化指標(biāo)為連續(xù)變量,對于這種連續(xù)變量到類別變量之間的函數(shù)關(guān)系,可以采用Logistic回歸分析進(jìn)行描述。由于砂土液化指標(biāo)之間具有高度的相關(guān)性,直接建立Logistic模型,可能導(dǎo)致模型不穩(wěn)定、解釋上的沖突等[10]。為此,本文在建立Logistic回歸模型之前,采用主成分分析降低指標(biāo)之間的相關(guān)性,將多個(gè)指標(biāo)綜合為少數(shù)幾個(gè)彼此獨(dú)立的主成分,從而避免多重共線性的影響。
主成分分析是一種將多維數(shù)據(jù)進(jìn)行降維處理,簡化為少數(shù)幾個(gè)不相關(guān)的綜合指標(biāo)(主成分)的多元統(tǒng)計(jì)分析方法。其建模過程具體如下:
(1)數(shù)據(jù)預(yù)處理。假設(shè)有m個(gè)樣本(i=1,2,…,m),n 個(gè)指標(biāo)(j=1,2,…,n),對原始數(shù)據(jù) X=進(jìn)行均值化處理,可保留數(shù)據(jù)內(nèi)的變異信息[11]:
(2)計(jì)算均值化數(shù)據(jù)的協(xié)方差矩陣S=(sij)n×n。
(3)計(jì)算協(xié)方差矩陣的特征值和特征向量。S的n個(gè)特征值記為:λ1≥λ2≥…≥λn,標(biāo)準(zhǔn)化特征向量為ajj=(aj1,aj2,…,ajn),則第 i個(gè)樣本的第 j個(gè)主成分為
Logistic回歸分析的目的是建立經(jīng)驗(yàn)公式,以便由自變量預(yù)測因變量概率分布。令y=1,2,3,4表示砂土液化的4個(gè)等級。令q1=p(y≤1),q2=p(y≤2),…,q3=p(y≤3),常用的 Logistic回歸模型是[12]:
式中:βi0為截距,i=1,2,…,4;β1,…,βn為斜率系數(shù);x1,…,xn為自變量。
由已有觀測值能估計(jì)出 βi0,β1,…,βn,從而砂土液化各等級的概率表達(dá)式:
這時(shí)對于給定的自變量x1,…,xn的值,由回歸方程可以預(yù)測 q1,q2,q3,再由 p(y=1)=q1,p(y=2)=q2-q1,…,p(y=3)=q3- q2,p(y=4)=1-q3可以預(yù)測各砂土液化等級概率。根據(jù)各類別的概率,由可以確定響應(yīng)變量屬于類別y=l。
首先本文建立第1種類型的主成分-Logistic回歸模型,即模型的建立以砂土液化等級分類標(biāo)準(zhǔn)為基礎(chǔ),應(yīng)用效果完全依賴于砂土液化等級分類標(biāo)準(zhǔn)的準(zhǔn)確性。
3.1.1 評價(jià)指標(biāo)與分類標(biāo)準(zhǔn)
影響砂土液化的因素很多,但大體上可分為3大類:第1類是砂土特性,如土的種類、顆粒組成和密實(shí)度;第2類是土層埋藏條件;第3類是地震因素或稱地震條件。參考以往研究,選擇震級M,地面加速度最大值gmax,標(biāo)貫擊數(shù) N63.5,比貫入阻力 Ps,相對密度Dr,平均粒徑D50,地下水位dw7個(gè)因素作為評價(jià)指標(biāo)。各指標(biāo)的分類標(biāo)準(zhǔn)詳見文獻(xiàn)[9]。
3.1.2 生成樣本數(shù)據(jù)
由于本文模型的建立和參數(shù)的確定是由數(shù)據(jù)驅(qū)動(dòng),因此需要利用砂土液化分類標(biāo)準(zhǔn)來生成數(shù)據(jù)作為建?;A(chǔ)。由于正態(tài)分布是自然界中最常見的分布形式之一,按照各指標(biāo)的分類標(biāo)準(zhǔn),每個(gè)指標(biāo)在每個(gè)等級范圍內(nèi)按照正態(tài)分布隨機(jī)產(chǎn)生20個(gè)樣本,其中分布參數(shù)均值和標(biāo)準(zhǔn)差(3σ原理)按照下式確定:
式中:Cmax和Cmin分別為等級最大值和最小值為均值,σ為標(biāo)準(zhǔn)差。
采用Matlab軟件normrnd()函數(shù)即可實(shí)現(xiàn),對于每個(gè)指標(biāo)采用同一組隨機(jī)數(shù)值,共形成80個(gè)評價(jià)樣本,將不液化(Ⅰ)、輕微液化(Ⅱ)、中等液化(Ⅲ)、嚴(yán)重液化(Ⅳ)分別賦予響應(yīng)值 4,3,2,1,具體如表1所示。
3.1.3 建立預(yù)測模型
首先按照本文介紹的主成分分析步驟,計(jì)算得到協(xié)方差矩陣的特征值為0.002,0.006,0.010,0.018,0.019,0.061,2.267,特征值 2.267 累計(jì)方差貢獻(xiàn)率為95.1%>85%,因此取其對應(yīng)的特征向量a=(-0.166,-0.366,0.497,0.388,0.425,0.338,0.382)。根據(jù)式(1)和式(2)得到主成分計(jì)算公式為
表1 樣本數(shù)據(jù)Table 1 Sample data
根據(jù)式(7)可計(jì)算各樣本對應(yīng)的主成分值,并用于建立Logistic回歸模型。獲得樣本的主成分值以后,采用Logistic模型建立各樣本對應(yīng)的主成分與經(jīng)驗(yàn)等級(響應(yīng)值)之間的函數(shù)關(guān)系。以SPSS軟件實(shí)現(xiàn)Logistic模型參數(shù)的求解,具體可以參閱相關(guān)軟件的介紹資料,本文不再復(fù)述軟件求解過程,得到模型表達(dá)式如下:
將各指標(biāo)實(shí)測值代入式(8)至式(11)中即可計(jì)算砂土液化屬于各等級的概率,從而確定砂土液化等級。Logistic回歸模型對上述樣本的擬合結(jié)果與實(shí)際結(jié)果完全一致,說明其可以很好地表達(dá)砂土液化等級分類標(biāo)準(zhǔn)。
上述第1種類型的主成分-Logistic回歸模型實(shí)現(xiàn)了砂土液化等級分類標(biāo)準(zhǔn)的數(shù)學(xué)表達(dá),但是很容易發(fā)現(xiàn)砂土液化等級分類標(biāo)準(zhǔn)隨機(jī)產(chǎn)生的樣本完全滿足所有指標(biāo)的分級標(biāo)準(zhǔn),而實(shí)際工程中,許多指標(biāo)數(shù)據(jù)并不可能同時(shí)屬于某個(gè)等級,并且分類標(biāo)準(zhǔn)的劃分具有主觀性。下面以砂土液化實(shí)例作為樣本數(shù)據(jù)來建立主成分-Logistic回歸模型,從理論上講這類模型應(yīng)該更符合實(shí)際,但是由于樣本數(shù)量的限制,也不易達(dá)到理想的預(yù)測效果。
3.2.1 評價(jià)指標(biāo)和樣本數(shù)據(jù)
同樣采用上述7個(gè)因素作為評價(jià)指標(biāo),采用文獻(xiàn)[13]中提供的25組數(shù)作為分析樣本,具體數(shù)據(jù)詳見文獻(xiàn)[13]。其中前20組數(shù)據(jù)作為建模樣本數(shù)據(jù),后5組數(shù)據(jù)則作為檢驗(yàn)樣本,以檢驗(yàn)?zāi)P偷念A(yù)測效果。
3.2.2 建立模型
以20組建模樣本數(shù)據(jù),按照本文介紹的主成分分析步驟,計(jì)算得到協(xié)方差矩陣的特征值為0.016,0.036,0.044,0.114,0.185,0.355,0.734,最大的前3個(gè)特征值累計(jì)方差貢獻(xiàn)率為85.8%>85%,因此取其對應(yīng)的特征向量計(jì)算前3個(gè)主成分。根據(jù)式(1)和
式(2)得到主成分計(jì)算公式為
根據(jù)以上各式可計(jì)算各樣本對應(yīng)的主成分值,并用于建立Logistic回歸模型。獲得了樣本的主成分值以后,采用Logistic模型建立各樣本對應(yīng)的主成分與經(jīng)驗(yàn)等級(響應(yīng)值)之間的函數(shù)關(guān)系。以SPSS軟件實(shí)現(xiàn)Logistic模型參數(shù)的求解,得到模型表達(dá)式如下:
將各指標(biāo)實(shí)測值代入式(15)至式(18)中即可計(jì)算砂土液化屬于各等級的概率,從而確定砂土液化等級。Logistic回歸模型對前20個(gè)樣本的擬合結(jié)果與實(shí)際結(jié)果完全一致,說明其可以很好地表達(dá)砂土液化等級與砂土液化指標(biāo)之間的經(jīng)驗(yàn)關(guān)系。
下面以實(shí)例數(shù)據(jù)驗(yàn)證和比較上述2種類型的主成分-Logistic回歸模型對砂土液化等級的預(yù)測效果。由于第1種類型的主成分-Logistic回歸模型采用的是分類標(biāo)準(zhǔn)生成的數(shù)據(jù),首先以其對文獻(xiàn)[13]中提供的25組數(shù)據(jù)進(jìn)行預(yù)測,檢驗(yàn)預(yù)測效果,并與分形-插值模型[9]和可拓物元模型[13]進(jìn)行對比分析。本文僅列出了3種預(yù)測結(jié)果與實(shí)際結(jié)果存在差異的樣本,見表2。
從表2的預(yù)測結(jié)果可以看出,本文所建立的主成分-Logistic回歸模型與可拓物元模型具有相同的預(yù)測效果,都僅出現(xiàn)了2處與實(shí)際不一致的地方,預(yù)測準(zhǔn)確率92%,而分形-插值模型出現(xiàn)了3處與實(shí)際不一致的地方,預(yù)測準(zhǔn)確率88%,稍低于主成分-Logistic回歸模型。上述結(jié)果說明了本文所建立的第一種類型的主成分-Logistic回歸模型預(yù)測效果良好,可以使用。
表2 樣本實(shí)測值和不同模型的預(yù)測結(jié)果Table 2 Measured values of samples and model-predicted results
其次,以5組檢驗(yàn)樣本數(shù)據(jù)對第2種類型的主成分-Logistic回歸模型進(jìn)行檢驗(yàn),并與第1種類型的主成分-Logistic回歸模型進(jìn)行對比分析,結(jié)果見表3。
表3 2種類型的主成分-Logistic回歸模型預(yù)測結(jié)果Table 3 Predicted results of two types of PCA-Logistic models
從表3的結(jié)果可以看出,2種類型的主成分-Logistic回歸模型對樣本的預(yù)測等級完全一致,僅最后一個(gè)樣本與實(shí)際結(jié)果存在差異,從對各等級的概率結(jié)果來看,第2種類型的主成分-Logistic回歸模型計(jì)算樣本25屬于等級Ⅰ的概率更大(0.340>0.117),說明樣本25更偏向于等級Ⅰ,從這個(gè)角度來看,第2種類型的主成分-Logistic回歸模型預(yù)測結(jié)果確實(shí)更符合實(shí)際。如果能利用更多的實(shí)例數(shù)據(jù),相信可以得到更好的預(yù)測效果。
(1)現(xiàn)有砂土液化等級的多指標(biāo)預(yù)測模型可以分為2種類型:第1類以砂土液化等級分類標(biāo)準(zhǔn)為基礎(chǔ),預(yù)測效果依賴于分類標(biāo)準(zhǔn)的準(zhǔn)確性;第2類以實(shí)例數(shù)據(jù)為基礎(chǔ),預(yù)測效果依賴于樣本的數(shù)量。
(2)根據(jù)砂土液化分類標(biāo)準(zhǔn)生成樣本數(shù)據(jù),以主成分分析對數(shù)據(jù)進(jìn)行降維處理,以Logistic模型描述砂土液化等級與影響因素之間的映射關(guān)系(分類標(biāo)準(zhǔn)),建立了第1種類型的主成分-Logistic回歸模型,工程實(shí)例分析結(jié)果顯示該模型預(yù)測效果良好,可以在實(shí)際中應(yīng)用。
(3)以工程實(shí)例數(shù)據(jù)作為訓(xùn)練樣本建立第2種類型的主成分-Logistic回歸模型,用于描述砂土液化等級與影響因素之間的經(jīng)驗(yàn)關(guān)系,與第1種類型的主成分-Logistic回歸模型的對比結(jié)果顯示,第2種類型的主成分-Logistic回歸模型預(yù)測結(jié)果更符合實(shí)際情況,在具有較多實(shí)例數(shù)據(jù)時(shí),其更具有應(yīng)用價(jià)值。
[1]任紅梅,呂西林,李培振.飽和砂土液化研究進(jìn)展[J].地震工程與工程振動(dòng),2007,27(6):166-174.(REN Hong-mei,LV Xi-lin,LI Pei-zhen.Advances in Liquefaction Research on Saturated Soils[J].Journal of Earthquake Engineering and Engineering Vibration,2007,27(6):166-174.(in Chinese))
[2]勾麗杰,劉家順.RBF神經(jīng)網(wǎng)絡(luò)模型在砂土液化判別中的應(yīng)用研究[J].長江科學(xué)院院報(bào),2013,30(4):76-81.(GOU Li-jie,LIU Jia-shun.Application of RBF Neural Network Model to Evaluating Sand Liquefaction[J].Journal of Yangtze River Scientific Research Institute,2013,30(4):76-81.(in Chinese))
[3]劉年平,王宏圖,袁志剛,等.砂土液化預(yù)測的Fisher判別模型及應(yīng)用[J].巖土力學(xué),2012,33(2):554-557.(LIU Nian-ping,WANG Hong-tu,YUAN Zhigang,et al.Fisher Discriminant Analysis Model of Sand Liquefaction and Its Application[J].Rock and Soil Mechanics,2012,33(2):554-557.(in Chinese))
[4]陳國興,李方明.基于徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)模型的砂土液化概率判別方法[J].巖土工程學(xué)報(bào),2006,28(3):301- 305.(CHEN Guo-xing,LI Fang-ming.Probabilistic Estimation of Sand Liquefaction Based on Neural Network Model of Radial Basis Function[J].Chinese Journal of Geotechnical Engineering,2006,28(3):301-305.(in Chinese))
[5]陳榮淋,林建華,黃群賢.支持向量機(jī)在砂土液化預(yù)測中的應(yīng)用研究[J].中國地質(zhì)災(zāi)害與防治學(xué)報(bào),2005,16(2):15-18.(CHEN Rong-lin,LIN Jianhua,HUANG Qun-xian.Application of the Support Vector Machine in Prediction of Sand Liquefaction[J].The Chinese Journal of Geological Hazard and Control,2005,16(2):15-18.(in Chinese))
[6]薛新華,張我華,劉紅軍.砂土地震液化的模糊綜合評判法[J].重慶建筑大學(xué)學(xué)報(bào),2006,28(1):55-58.(XUE Xin-hua,ZHANG Wo-hua,LIU Hong-jun.Comprehensive Fuzzy Evaluation Method for Sand Liquefaction[J].Journal of Chongqing Jianzhu University,2006,28(1):55-58.(in Chinese))
[7]金志仁.基于距離判別分析方法的砂土液化預(yù)測模型及應(yīng)用[J].巖土工程學(xué)報(bào),2008,30(5):776-780.(JIN Zhi-ren.Prediction of Sand Liquefaction Based on Distance Discriminant Analysis and Its Application[J].Chinese Journal of Geotechnical Engineering, 2008,30(5):776-780.(in Chinese))
[8]汪明武,金菊良,李 麗.基于實(shí)碼加速遺傳算法的投影尋蹤方法在砂土液化勢評價(jià)中的應(yīng)用[J].巖石力學(xué)與工程學(xué)報(bào),2004,23(4):631-634.(WANG Ming-wu,JIN Ju-liang,LI Li.Application of PPMethod Based on RAGA to Assessment of Sand Liquefaction Potential[J].Chinese Journal of Rock Mechanics and Engineering,2004,23(4):631-634.(in Chinese))
[9]王 威,蘇經(jīng)宇,馬東輝,等.飽和砂土地震液化判別的分形插值模型[J].世界地震工程,2012,28(1):118- 124.(WANG Wei,SU Jing-yu,MA Dong-hui,et al.Fractal Interpolation Model of Seismic Liquefaction Discrimination of Saturated Sandy Soil[J].World Earthquake Engineering,2012,28(1):118-124.(in Chinese))
[10]襲炯良,郟劍寧,張 揚(yáng).主成分改進(jìn)的logistic回歸模型方法在流行病學(xué)分析中的應(yīng)用[J].中國熱帶醫(yī)學(xué),2005,5(2):207-209.(QIU Jiong-liang,ZHENG Jian-ning,ZHANG Yang.Application of Modified Logistic Regression Model in the Analysis of Epidemiology[J].China Tropical Medicine,2005,5(2):207-209.(in Chinese))
[11]葉雙峰.關(guān)于主成分分析做綜合評價(jià)的改進(jìn)[J].數(shù)理統(tǒng)計(jì)與管理,2001,20(2):52-61.(YE Shuangfeng.The Application and Consideration about Principal Component Analysis[J].Application of Statistics and Management,2001,20(2):52-61.(in Chinese))
[12]吳令云,吳家祺,吳誠鷗,等.MINITAB軟件入門:最易學(xué)實(shí)用的統(tǒng)計(jì)分析教程[M].北京:高等教育出版社,2012.(WU Ling-yun,WU Jia-qi,WU Cheng-ou,et al.MINITAB Software Starter Guide:The Easiest and Most Practical Course for Statistical Analysis[M].Beijing:Higher Education Press,2012.(in Chinese))
[13]陳榮淋.基于可拓學(xué)和支持向量機(jī)理論的砂土液化勢綜合評價(jià)研究[D].廈門:華僑大學(xué),2004.(CHEN Ronglin.Research on Assessment of Sand Liquefaction Potential Based on Extenics and Support Vector Machine[D].Xiamen:Huaqiao University,2004.(in Chinese))