劉曉悅,張雪梅,楊 偉
(華北理工大學(xué)電氣工程學(xué)院,河北 唐山 063000)
巖爆是深部巖體工程開挖中常見的一種動態(tài)、自發(fā)、不受控制的地質(zhì)災(zāi)害。開挖圍巖在高地應(yīng)力條件下應(yīng)力場重新分配,導(dǎo)致巖石破裂并產(chǎn)生的一系列不利的影響,如破裂、剝離排出、突然釋放了硬脆性圍巖儲存的彈性應(yīng)變能量。因?yàn)閹r爆過程是突發(fā)的、強(qiáng)烈的,而且?guī)r石顆??梢砸?~50 m/s的速度噴射出來,威脅地下工作人員和設(shè)備的安全,影響作業(yè)的進(jìn)度,進(jìn)而導(dǎo)致整個工程被阻礙。由于越來越深的開挖和越來越高的應(yīng)力水平,巖爆的發(fā)生越來越頻繁,巖爆問題也日益突出[1]。然而,受模型和參數(shù)不確定性影響的巖爆預(yù)測分類是一個非常復(fù)雜的非線性過程,巖爆分類仍是一個巨大的挑戰(zhàn)。因此,引入一種新的智能方法來研究巖爆和強(qiáng)度分級預(yù)測仍然十分必要。
本文通過主成分分析方法對文獻(xiàn)中選取的巖爆預(yù)測指標(biāo)進(jìn)行分析,解決了數(shù)據(jù)之間的相關(guān)性問題,將提取出的指標(biāo)用于SVM模型。最后通過支持向量機(jī)用于巖爆預(yù)測數(shù)據(jù)的訓(xùn)練并建立相應(yīng)的預(yù)測模型,有效解決了復(fù)雜影響因素情況下模型難以確定的問題,為巖爆預(yù)測研究提供了一種新的方法。
主成分分析方法的核心是線性組合原始指標(biāo),使之成為一組包含大部分原始信息的獨(dú)立的、新的、綜合的指標(biāo)集。具體步驟如下所述[2-3]。
步驟1:將原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化。假設(shè)原始評價(jià)指標(biāo)數(shù)據(jù)矩陣為X=(xij)m×p,見式(1)。
(1)
標(biāo)準(zhǔn)化處理數(shù)據(jù),見式(2)。
(i=1,2,…,m;j=1,2,…,p)
(2)
式中:xj為均值;sj為標(biāo)準(zhǔn)差。
步驟2:計(jì)算相關(guān)系數(shù)矩陣R,即:R=(rkl)m×p(k,l=1,2,…,p),其中,rkl(rkl=rlk)的計(jì)算公式見式(3)。
(3)
步驟3:計(jì)算R的特征值λ1,λ2,…,λp和特征值對應(yīng)的單位化特征向量p1,p2,…,pp。
步驟4:選取主成分?jǐn)?shù),計(jì)算主要成分的累計(jì)貢獻(xiàn)率,通常取大于1的特征值且在85%以上的累積貢獻(xiàn)率[4]。
(4)
(5)
式中:vh為第h個主成分的方差貢獻(xiàn)率;vs為前k個主成分的累計(jì)貢獻(xiàn)率。
步驟5:計(jì)算提取主成分的對應(yīng)得分。主成分系數(shù)矩陣為:U=(p1,p2,…,pp),若從原指標(biāo)中提取了前k個主成分,則有式(6)。
(s=1,2,…,k)
(6)
1.2.1 支持向量機(jī)理論
支持向量機(jī)(SVM)是在20世紀(jì)90年代中期開始發(fā)展的一種機(jī)器學(xué)習(xí)方法,是借助于最優(yōu)化方法解決機(jī)器學(xué)習(xí)的問題的新工具。它通過尋求最小的結(jié)構(gòu)化風(fēng)險(xiǎn)以最小化經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信范圍來提高學(xué)習(xí)機(jī)的泛化能力,以便在統(tǒng)計(jì)樣本量較小時(shí),可以得到比較好的統(tǒng)計(jì)。經(jīng)過國內(nèi)外研究者的不斷努力,支持向量機(jī)在回歸預(yù)測和密度估計(jì)中的重要性日益提高,其應(yīng)用領(lǐng)域也在不斷擴(kuò)大[5]。其中支持向量機(jī)示意圖如圖1所示。
圖1 支持向量機(jī)示意圖Fig.1 Support vector machine schematic
1) 線性支持向量機(jī)。要想把兩種樣本正確的分開,則需要超平面w×x+b=0。為了保證分類間隔最大,那么優(yōu)化方法則表示為式(7)。
(7)
拉格朗日函數(shù)可用于將原始問題轉(zhuǎn)換為對偶問題,得到式(8)。
(8)
由式(8)求解之后,得到了最優(yōu)分類函數(shù),見式(9)。
f(x)=sgn(wTx+b)=
(9)
但是,在實(shí)際情況中存在許多線性不可分的情況,因此使用線性可分方法會引起很大的誤差。 應(yīng)對這種情況,在引入松弛變量后問題就變成了式(10)。
(10)
式中,C為懲罰因子。
引入拉格朗日算法求解該問題,可得到式(11)。
(11)
通過求解各類系數(shù)ai后,得到分類決策函數(shù),見式(12)。
(12)
(13)
分類決策函數(shù)變?yōu)槭?14)。
(14)
實(shí)際上,映射后仍然不可分的情況也是存在的。
3) 核函數(shù)。核函數(shù)對于支持向量機(jī)的訓(xùn)練算法具有決定性的作用,常用的核函數(shù)有四種:線性核函數(shù)、多項(xiàng)式核函數(shù)、最常用的徑向基函數(shù)(RBF)、Sigmoid核函數(shù)。 本文選用最常用的徑向基函數(shù)。
1.2.2 基于粒子群算法的支持向量機(jī)參數(shù)優(yōu)化
粒子群優(yōu)化(PSO)是EBERHART等專家提出的基于種群的隨機(jī)優(yōu)化算法。在粒子群算法中,每個優(yōu)化問題的解決方案都是搜索空間中的一個粒子。在粒子群算法中,每個優(yōu)化問題的解決方案都是搜索空間中的粒子。所有粒子都具有通過優(yōu)化函數(shù)確定的適應(yīng)度值,并且每個粒子還具有確定其飛行方向和距離的速度v。 粒子優(yōu)化算法過程為:①初始化粒子的位置和速度;②計(jì)算粒子適應(yīng)度(本文以訓(xùn)練樣本的輸出值與實(shí)際值的誤差作為適應(yīng)度函數(shù));③尋找個體極值和群體極值;④更新位置和速度;⑤計(jì)算更新后粒子的適應(yīng)度;⑥更新個體極值和群體極值??词欠駶M足條件,若不能滿足條件,則重復(fù)步驟③、步驟④、步驟⑤和步驟⑥,直到滿足條件則可以結(jié)束優(yōu)化過程,得到最終優(yōu)化后的支持向量機(jī)參數(shù)。
粒子群優(yōu)化算法一般需要比較少的調(diào)整參數(shù),不僅算法簡單而且容易達(dá)到優(yōu)化目標(biāo),適合在動態(tài)、多目標(biāo)環(huán)境中尋優(yōu)。與傳統(tǒng)算法相比,它不僅能夠使計(jì)算速度更快,而且能使全面的搜索能力變得更好。因此本文采用粒子群算法去優(yōu)化支持向量機(jī)的參數(shù),這樣才能提高巖爆預(yù)測模型的準(zhǔn)確性,進(jìn)而建立性能良好的巖爆預(yù)測模型。
建立巖爆評價(jià)指標(biāo)體系的原則是評價(jià)指標(biāo)應(yīng)能反映巖爆的主要特征和圍巖的性質(zhì),并能方便地獲取數(shù)據(jù),本文選取了6個最具有代表性的指標(biāo):圍巖切向應(yīng)力σθ、單軸抗拉強(qiáng)度σt、單軸抗壓強(qiáng)度σc、應(yīng)力系數(shù)σθ/σc、脆性系數(shù)σc/σt以及沖擊傾向性指數(shù)Wet。
巖爆烈度等級通常分為四級:Ⅰ級(無巖爆活動)、Ⅱ級(輕度巖爆活動)、Ⅲ級(中度巖爆活動)、Ⅳ級(劇烈?guī)r爆活動)。巖爆等級分類標(biāo)準(zhǔn)見表1[6]。
表1 巖爆等級分類標(biāo)準(zhǔn)表Table 1 Rockburst classification
本文通過資料查閱[7],獲得了30組國內(nèi)外地下工程實(shí)例,訓(xùn)練樣本數(shù)據(jù)25組,預(yù)測樣本數(shù)據(jù)5組,對從文獻(xiàn)中查到的巖爆案例原始數(shù)據(jù),首先根據(jù)標(biāo)準(zhǔn)化公式對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,然后將得出的結(jié)果進(jìn)行主成分分析,本文采用Matlab程序?qū)?shù)據(jù)進(jìn)行主成分分析,最終提取出主成分F1、F2和F3。由于篇幅關(guān)系無法將數(shù)據(jù)列出來,因此本文并未將巖爆案例原始數(shù)據(jù)與主成分?jǐn)?shù)據(jù)列出來,但重要分析過程已將列出。各指標(biāo)間的相關(guān)系數(shù)和主成分特征值及貢獻(xiàn)率見表2和表3。
表2 相關(guān)系數(shù)矩陣Table 2 Correlation coefficient matrix
從表3中找出特征值大于1且累計(jì)貢獻(xiàn)率在85%以上的前K個主成分,因此本文選取了前3個主成分作為支持向量機(jī)模型的輸入。
表3 主成分特征值及貢獻(xiàn)率Table 3 Principal component eigenvalue and contribution rate
表4為主成分載荷(即主成分系數(shù)矩陣),得到3個主成分F1、F2、F3與6個指標(biāo)變量之間的關(guān)系為式(15)~式(17)。
表4 主成分載荷Table 4 Principal component load
F1=0.873x1+0.781x2+0.318x3+
0.802x4-0.451x5+0.131x6
(15)
F2=-0.337x1+0.059x2-0.891x3+
0.181x4-0.847x5+0.033x6
(16)
F3=-0.294x1+0.450x2+0.237x3-
0.487x4-0.170x5+0.816x6
(17)
將標(biāo)準(zhǔn)化之后的指標(biāo)數(shù)據(jù)代入式(15)~式(17),可以得到3個主成分?jǐn)?shù)據(jù)綜合指標(biāo)F1、F2、F3,將三個指標(biāo)作為支持向量機(jī)模型的輸入,消除了冗余數(shù)據(jù)和因維數(shù)不同而造成的影響,有效降低了變量維數(shù)與數(shù)據(jù)之間的相關(guān)性,大大提高了模型的運(yùn)算效率,從而提供了更為合理的解釋。
粒子群優(yōu)化支持向量機(jī)的巖爆預(yù)測模型流程圖如圖2所示。
圖2 巖爆預(yù)測流程圖Fig.2 Rockburst prediction flowchart
本文為了滿足巖爆預(yù)測模型支持向量機(jī)(SVM)的精度要求,核函數(shù)選擇了徑向基函數(shù),優(yōu)化懲罰參數(shù)c和核函數(shù)g選擇了粒子群算法(PSO)。PSO算法的初始化的參數(shù)為:加速度C1=1.6,C2=1.5,終止代數(shù)=300,種群數(shù)N=5,并在多次迭代之后進(jìn)行優(yōu)化,最后得到的SVM參數(shù)最優(yōu)值c=9.876,g=2.234,參數(shù)優(yōu)化過程如圖3所示。
圖3 參數(shù)優(yōu)化的適應(yīng)度收斂曲線Fig.3 Adaptive curve of parameter optimizaion
上文根據(jù)主成分分析對數(shù)據(jù)進(jìn)行處理之后,得到主成分F1、F2和F3,因此從樣本數(shù)據(jù)中隨機(jī)抽取25組訓(xùn)練樣本,剩下的5組作為了預(yù)測樣本,由優(yōu)化之后的預(yù)測模型PSOSVM對5組樣本進(jìn)行預(yù)測,得出的預(yù)測結(jié)果見表5。
由表5可知,選擇5組預(yù)測樣本結(jié)果與實(shí)際預(yù)測等級相符,說明本文建立的PCA-PSOSVM巖爆預(yù)測模型具有一定的可行性。
表5 PCA-PSOSVM模型巖爆預(yù)測等級Table 5 PCA-PSOSVM model rockburst prediction level
為了進(jìn)一步驗(yàn)證巖爆預(yù)測模型PCA-PSOSVM模型的準(zhǔn)確性,必須與不同的巖爆預(yù)測模型對同樣的巖爆數(shù)據(jù)進(jìn)行預(yù)測,因此本文進(jìn)行了不同模型的對比。其中,表6當(dāng)中其他模型的預(yù)測結(jié)果數(shù)據(jù)選自文獻(xiàn)[8],比較以上三種模型對11個測試樣本的測試結(jié)果,發(fā)現(xiàn)三種模型預(yù)測正確率分別為90.9%、 72.7%和81.8%, 說明PCA-PSOSVM模型相對于SVM模型和ANN模型而言,具有更高的準(zhǔn)確率,因此PCA-PSOSVM模型具有一定的可行性。
表6 不同預(yù)測模型預(yù)測結(jié)果對比Table 6 Comparison of prediction results of different prediction models
1) 選用主成分分析對原始數(shù)據(jù)處理,可以消除指標(biāo)間的相關(guān)性,并選出3個主成分達(dá)到了降維的目的,這樣支持向量機(jī)的模型輸入就會變成3個,大大簡化了計(jì)算過程。
2) 對SVM模型來說,對模型性能影響較大的是懲罰參數(shù)c和核函數(shù)g,所以本文使用粒子群算法(PSO)去優(yōu)化懲罰參數(shù)c和核函數(shù)g,這樣一來就提高了SVM巖爆預(yù)測模型的準(zhǔn)確性。
3) 為了驗(yàn)證準(zhǔn)確性,用本文建立的PCA-PSOSVM模型與支持向量機(jī)(SVM)模型和人工神經(jīng)網(wǎng)絡(luò)(ANN)模型的預(yù)測結(jié)果進(jìn)行對比,發(fā)現(xiàn)PCA-PSOSVM模型具有更高的巖爆預(yù)測準(zhǔn)確率。