李康楠,吳雅琴,杜 鋒,張 翔,王乙橋
(1.中國(guó)礦業(yè)大學(xué)(北京) 共伴生能源精準(zhǔn)開采北京市重點(diǎn)實(shí)驗(yàn)室,北京 100083;2.中國(guó)礦業(yè)大學(xué)(北京)應(yīng)急管理與安全工程學(xué)院,北京 100083;3.中國(guó)礦業(yè)大學(xué)(北京) 機(jī)電與信息工程學(xué)院,北京 100083)
深部脆性巖體受外界擾動(dòng)影響,發(fā)生動(dòng)力失穩(wěn)現(xiàn)象致使其內(nèi)部彈性能極速釋放,從而導(dǎo)致巖體碎片彈射、拋擲與剝落,同時(shí)伴隨不同程度的爆炸聲響等現(xiàn)象,稱為巖爆地質(zhì)災(zāi)害[1-3]。巖爆災(zāi)害發(fā)生的影響因素多,不確定性大,嚴(yán)重干擾現(xiàn)場(chǎng)作業(yè)的有序進(jìn)行;巖爆災(zāi)害危險(xiǎn)性大,一旦發(fā)生中等、強(qiáng)烈?guī)r爆,往往會(huì)造成一定的人員傷亡和巨大的經(jīng)濟(jì)損失。隨著地下巖土工程逐步加深,巖爆災(zāi)害事故日益增多,高效準(zhǔn)確的巖爆烈度等級(jí)預(yù)測(cè)方法研究迫在眉睫[4-5]。
國(guó)內(nèi)外學(xué)者對(duì)巖爆烈度等級(jí)預(yù)測(cè)方法的研究大致可分為判據(jù)預(yù)測(cè)方法和綜合分析預(yù)測(cè)方法2 種[6]。判據(jù)預(yù)測(cè)方法首先會(huì)確立巖爆烈度等級(jí)的單因素分類標(biāo)準(zhǔn),然后將預(yù)測(cè)區(qū)域該因素的數(shù)值大小與預(yù)定標(biāo)準(zhǔn)進(jìn)行對(duì)比,從而預(yù)測(cè)巖爆的烈度等級(jí),如:Russenes[7]與Hoek[8]與二郎山[9]應(yīng)力系數(shù)判據(jù)、Turchaninov[10]判據(jù)、Kidybinski[11]與Singh[12]巖爆傾向性指數(shù)判據(jù)、N-Jhelum[13]判據(jù)、Aubertin[14]改進(jìn)脆性指數(shù)判據(jù)、Wang[15]最大儲(chǔ)存彈性應(yīng)變能判據(jù)、陶振宇判據(jù)[16]等。巖爆誘發(fā)因素眾多,單因素很難全面揭示災(zāi)害發(fā)生規(guī)律,且各因素之間可能存在相互耦合的現(xiàn)象,故僅以單因素判據(jù)預(yù)測(cè)巖爆災(zāi)害缺乏可信度。因此,越來(lái)越多的學(xué)者采用多因素分析預(yù)測(cè)方法進(jìn)行綜合研究,以期通過(guò)數(shù)學(xué)方法、機(jī)器學(xué)習(xí)與智能算法達(dá)到準(zhǔn)確預(yù)測(cè)巖爆烈度等級(jí)的目的。傳統(tǒng)數(shù)學(xué)方法如貝葉斯模型[17]、功效系數(shù)法[18]、支持向量機(jī)[19]、決策樹[20]等雖應(yīng)用廣泛,在一定程度上提升了巖爆烈度等級(jí)預(yù)測(cè)的準(zhǔn)確率,但存在一些方面的缺陷:在確定指標(biāo)權(quán)重與定性因素方面受人為主觀影響嚴(yán)重,很難客觀預(yù)測(cè)巖爆烈度等級(jí);影響因素之間相互聯(lián)系、共同作用,預(yù)測(cè)過(guò)程往往忽略非線性因素。為彌補(bǔ)上述缺陷,國(guó)內(nèi)外學(xué)者展開機(jī)器學(xué)習(xí)與智能算法領(lǐng)域的研究,如SVM (Support Vector Machines)模型[21]、IPP-PNN(Improved Projection Pursuit-Probabilistic Neural Networks)模 型[22]、PCA-PNN(Principle Component Analysis-PNN)模型[23]、PCA-RBF(PCA-Radial Basis Function)[24]模型等,進(jìn)一步提高了巖爆烈度等級(jí)的預(yù)測(cè)精度,但存在兩方面的局限性:所需訓(xùn)練樣本量與計(jì)算權(quán)值量大,導(dǎo)致模型復(fù)雜程度提高與運(yùn)算時(shí)間延長(zhǎng);需要配合數(shù)據(jù)降維方法進(jìn)行模型訓(xùn)練,易丟失重要的數(shù)據(jù)信息從而影響模型預(yù)測(cè)的準(zhǔn)確度,故需要繼續(xù)深入研究并探索新的預(yù)測(cè)方法。
深度學(xué)習(xí)算法卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)具有局部感知與權(quán)重共享的優(yōu)點(diǎn),能夠極大減少連接權(quán)值的數(shù)量并降低模型復(fù)雜度,挖掘線性與非線性數(shù)據(jù)深層次的特征規(guī)律與數(shù)據(jù)之間的內(nèi)在聯(lián)系;無(wú)需配合額外的分析法即可降低多重共線性并提高模型的泛化能力,在短期電力負(fù)荷預(yù)測(cè)[25-26]、短時(shí)交通流預(yù)測(cè)[27-28]、電廠存煤量預(yù)測(cè)[29]與煤層底板突水預(yù)測(cè)[30]等方面都具有強(qiáng)大的功能。考慮到數(shù)據(jù)缺失使訓(xùn)練樣本減少?gòu)亩鴮?dǎo)致模型準(zhǔn)確率降低的問(wèn)題,筆者選用鏈?zhǔn)椒匠潭嘀夭逖a(bǔ)(Multiple Imputation by Chained Equations,MICE)法對(duì)空缺數(shù)據(jù)進(jìn)行填補(bǔ)[31-33]。該方法能夠通過(guò)表達(dá)數(shù)據(jù)的不確定性并進(jìn)行綜合分析,得到更加可靠與精確的插補(bǔ)結(jié)果。基于MICE-CNN,選取120 組典型巖爆案例現(xiàn)場(chǎng)數(shù)據(jù),通過(guò)參數(shù)優(yōu)選、數(shù)據(jù)處理與網(wǎng)絡(luò)訓(xùn)練建立模型,并與RBF、SVM、PNN 模型的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比,期望得到更加可靠有效并利于工程實(shí)際的巖爆烈度等級(jí)預(yù)測(cè)模型。
基于CNN 的巖爆烈度等級(jí)預(yù)測(cè)模型建立流程如圖1 所示,模型的建立主要分成4 個(gè)步驟。第一步,列舉并選取巖爆災(zāi)害的影響因素,通過(guò)綜合分析建立契合本預(yù)測(cè)模型的指標(biāo)體系。第二步,搜集原始數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行基于拉伊達(dá)準(zhǔn)則的異常值剔除與基于MICE的缺失值插補(bǔ),得到完整數(shù)據(jù)后進(jìn)行數(shù)據(jù)集分割與數(shù)據(jù)轉(zhuǎn)換,搭建CNN 的初始框架并進(jìn)行訓(xùn)練,從而優(yōu)選模型超參數(shù),建立基于CNN 的巖爆烈度等級(jí)預(yù)測(cè)模型。第三步,輸入現(xiàn)場(chǎng)數(shù)據(jù)進(jìn)行驗(yàn)證模型準(zhǔn)確度預(yù)測(cè)。第四步,建立基于RBF、SVM 與PNN 的巖爆烈度等級(jí)預(yù)測(cè)對(duì)比模型,輸入相同數(shù)據(jù)進(jìn)行預(yù)測(cè),并與CNN模型比較預(yù)測(cè)結(jié)果,并觀察預(yù)測(cè)結(jié)果的混淆矩陣,對(duì)比誤判結(jié)果的傾向性,最終得到最優(yōu)模型。
圖1 巖爆烈度等級(jí)預(yù)測(cè)模型建立流程Fig.1 Flow chart for establishing prediction model of rockburst intensity grade
本研究通過(guò)對(duì)國(guó)內(nèi)外大量文獻(xiàn)及礦井現(xiàn)場(chǎng)資料的查閱收集[7-9,14-16],得到了主流的巖爆分級(jí)標(biāo)準(zhǔn)與對(duì)應(yīng)計(jì)算公式,詳見表1。
表1 巖爆分級(jí)標(biāo)準(zhǔn)Table 1 Rockburst classification standard
巖爆災(zāi)害的發(fā)生與圍巖特征、地質(zhì)構(gòu)造、地應(yīng)力與外界擾動(dòng)等因素密切相關(guān)[34-36],這導(dǎo)致了影響巖爆發(fā)生的因素眾多,使指標(biāo)選取困難。目前國(guó)內(nèi)外尚無(wú)統(tǒng)一的巖爆烈度等級(jí)預(yù)測(cè)指標(biāo)體系,但多數(shù)包含3~6 種巖爆判據(jù)或巖石力學(xué)參數(shù)。過(guò)多影響因素組成的預(yù)測(cè)指標(biāo)體系既不易于獲取,增加計(jì)算的冗余程度與預(yù)測(cè)時(shí)間,而且相關(guān)度小的因素?cái)?shù)據(jù)離群點(diǎn)還會(huì)在一定程度上影響模型的學(xué)習(xí)與判斷;過(guò)少的指標(biāo)缺乏代表性,難以支撐災(zāi)害預(yù)測(cè),從而導(dǎo)致預(yù)測(cè)結(jié)果出現(xiàn)較大偏差。由表1 的計(jì)算公式可以得到計(jì)算巖爆分類標(biāo)準(zhǔn)所常用的具有較好代表性的影響因素,在此基礎(chǔ)上,考慮現(xiàn)場(chǎng)獲取便捷,且能夠全面反映巖爆特征信息等條件,最終選取硐室最大切向應(yīng)力σθ、巖石單軸抗壓強(qiáng)度σc、巖石單軸抗拉強(qiáng)度σt、巖體應(yīng)力系數(shù)σθ/σc、巖石強(qiáng)度脆性系數(shù)σc/σt和彈性變形能系數(shù)Wet這6 種指標(biāo)組成巖爆預(yù)測(cè)指標(biāo)體系。
基于本研究所建立的巖爆預(yù)測(cè)指標(biāo)體系,通過(guò)現(xiàn)場(chǎng)實(shí)測(cè)、查閱資料等方式搜集巖爆烈度等級(jí)工程實(shí)例,得到120 組實(shí)際發(fā)生烈度的原始數(shù)據(jù)用來(lái)建立巖爆預(yù)測(cè)模型,部分?jǐn)?shù)據(jù)見表2,其中,無(wú)、弱、中等、強(qiáng)烈?guī)r爆4 種烈度等級(jí)分別用數(shù)字1、2、3、4 表示。
表2 部分工程實(shí)例原始數(shù)據(jù)[7-24]Table 2 Partial engineeri ng examples raw data[7-24]
CNN 卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖2 所示。
圖2 CNN 網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Structure of CNN
1) 卷積層
卷積層線性抽取局部范圍內(nèi)的神經(jīng)元信息與特征,然后運(yùn)用非線性激活函數(shù)對(duì)神經(jīng)元進(jìn)行激活。卷積運(yùn)算主要為2 個(gè)數(shù)值矩陣的變換運(yùn)算,過(guò)濾器(卷積核)首先會(huì)選擇每次移動(dòng)的距離(步長(zhǎng)),然后與輸入矩陣進(jìn)行對(duì)應(yīng)的映射點(diǎn)積運(yùn)算,運(yùn)算結(jié)果組成輸出矩陣(特征圖)。假定在l層的卷積層有n[l]個(gè)濾波器,權(quán)重為K[l]∈大小為3×3,其中n[l-1]是前一層的過(guò)濾器數(shù)量。這些過(guò)濾器以[1,1]的步伐遍歷整個(gè)輸入特征圖,卷積操作可用下式表達(dá),輸出特征Y[l]是:
式中:f(·)為激活函數(shù);b為偏執(zhí)項(xiàng)。
2) 池化層
池化層可降低模型過(guò)擬合并提高模型的泛化能力。常用最大池化法進(jìn)行降采樣,其表達(dá)式為:
式中:X為輸出;α為乘性偏置;S(x)為降采樣函數(shù)。
3) 全連接層 (Fully Connected Layers,F(xiàn)C)
全連接層能夠?qū)⒆詈笠粋€(gè)池化層所得到的特征圖平鋪為一條一維向量,從而將數(shù)據(jù)進(jìn)行由高到低的維度變換,同時(shí)不丟棄任何有用的信息,其中每個(gè)輸入通過(guò)一個(gè)可學(xué)習(xí)的權(quán)重連接到每個(gè)輸出。
4) 損失函數(shù)層
損失函數(shù)可以表達(dá)模型預(yù)測(cè)值與真實(shí)值之間的不一致程度,損失函數(shù)與模型的魯棒性是負(fù)相關(guān),在模型的學(xué)習(xí)過(guò)程中起到一定的指導(dǎo)作用。本研究選用Softmax 損失函數(shù)[37]。
1) 基于拉伊達(dá)準(zhǔn)則的異常值剔除
在數(shù)據(jù)測(cè)量與記錄的過(guò)程中存在人工操作不當(dāng)、采動(dòng)影響等產(chǎn)生的錯(cuò)誤數(shù)據(jù),剔除錯(cuò)誤數(shù)據(jù)能夠消除其對(duì)模型預(yù)測(cè)準(zhǔn)確性的影響。對(duì)120 組原始數(shù)據(jù)的前4 列數(shù)據(jù)進(jìn)行處理,設(shè)數(shù)據(jù)集qi(i=1,2,···,m),計(jì)算剩余誤差vi,并計(jì)算標(biāo)準(zhǔn)偏差β,若某一值的剩余誤差va(1≤a≤m)滿足下式,則認(rèn)為該值為異常值并予以剔除。
式中:qa為數(shù)據(jù)集中第a個(gè)數(shù)據(jù);為數(shù)據(jù)集均值。
2) 基于MICE 的缺失值填補(bǔ)
對(duì)前4 列中經(jīng)過(guò)異常值剔除的數(shù)據(jù)在原本空缺的地方進(jìn)行數(shù)據(jù)填補(bǔ)。通過(guò)在每個(gè)空缺位置使用插補(bǔ)模型進(jìn)行多次填補(bǔ)產(chǎn)生若干完整數(shù)據(jù)集,然后對(duì)若干完整數(shù)據(jù)集分別進(jìn)行分析,得到相應(yīng)的分析結(jié)果,對(duì)結(jié)果做出綜合推斷與比較分析,最終得到最優(yōu)估計(jì)值。本研究使用R 語(yǔ)言中的mice 程序包實(shí)現(xiàn)MICE。
本研究選用隨機(jī)森林(Random Forest,RF),貝葉斯線性回歸(Bayesian Linear Regression,BLR),極 限樹(Extra Tree,ET),K 臨近(K-Nearest Neighbor,KNN)4 種插補(bǔ)模型作為MICE 的估計(jì)器,并結(jié)合中值法(Median)與均值法(Mean)2 種傳統(tǒng)插補(bǔ)方法分別進(jìn)行數(shù)據(jù)填補(bǔ),為驗(yàn)證MICE 的優(yōu)越性并優(yōu)選最佳插補(bǔ)模型,對(duì)比6 種填補(bǔ)結(jié)果的均方根誤差(ERMS),如圖3 所示。
圖3 不同插補(bǔ)模型/方法的ERMSFig.3 ERMS for different imputation models or methods
觀察圖3 可以得出MICE 比傳統(tǒng)插補(bǔ)方法擁有更高的精度,其中ET 模型的精度最高,故本研究選用ET 模型作為估計(jì)器對(duì)前4 列進(jìn)行MICE 插補(bǔ),插補(bǔ)后計(jì)算并補(bǔ)全后2 列數(shù)據(jù),完整數(shù)據(jù)如圖4 所示。
圖4 完整數(shù)據(jù)Fig.4 Complete data
3) 數(shù)據(jù)集分割
為使模型以有限的現(xiàn)場(chǎng)實(shí)測(cè)數(shù)據(jù)進(jìn)行充分學(xué)習(xí),將樣本數(shù)據(jù)10 等分,其中訓(xùn)練集占8 份、驗(yàn)證集與測(cè)試集分別為1 份[38],即120 組樣本數(shù)據(jù)中隨機(jī)抽取96 組作為CNN 模型的訓(xùn)練集樣本,12 組驗(yàn)證集樣本,共108 組數(shù)據(jù)為預(yù)測(cè)模型建立過(guò)程中的訓(xùn)練樣本,剩余12 組測(cè)試集樣本作為工程實(shí)例以進(jìn)一步驗(yàn)證模型準(zhǔn)確率;3 部分?jǐn)?shù)據(jù)相互獨(dú)立且均具有代表性。
4) 數(shù)據(jù)轉(zhuǎn)換
CNN 在圖像分類預(yù)測(cè)方面具有良好的預(yù)測(cè)精度,故本研究需要將數(shù)值數(shù)據(jù)轉(zhuǎn)換為包含RGB 三通道的圖像數(shù)據(jù)[39]。由于本研究的訓(xùn)練樣本僅包含6 個(gè)指標(biāo),將數(shù)據(jù)平鋪為6×1×1 的一維圖像數(shù)據(jù),既可以充分提取樣本數(shù)據(jù)內(nèi)涵特征信息,又可降低特征維度使神經(jīng)網(wǎng)絡(luò)的訓(xùn)練與計(jì)算更加便捷。
1) CNN 神經(jīng)網(wǎng)絡(luò)構(gòu)造
第一層為圖像輸入層(Image input)。第二層為卷積層1(Conv_1),由于數(shù)據(jù)為一維,所以卷積核大小選取為z×1,而z為1 時(shí)會(huì)喪失感受野的作用,故需z>1;當(dāng)卷積核為偶數(shù)時(shí),輸出特征圖比輸入特征圖尺寸變小,可學(xué)習(xí)的特征信息減少,故需z為奇數(shù)??紤]到卷積核過(guò)大可能忽略數(shù)據(jù)特征信息,故本研究所選用的卷積核大小為3×1;同理,本研究以1 為步長(zhǎng)進(jìn)行卷積操作能夠盡量減少信息的丟失;采用的硬件資源為單GPU,結(jié)合硬件配置選擇卷積核的數(shù)目為16;卷積層與池化層的特征邊緣處理方法有不填充與前后補(bǔ)零2 種,不填充即忽略最后未卷積的區(qū)域并降低特征圖尺寸,前后補(bǔ)零方式可以使最后輸出的特征圖尺寸和原圖尺寸一致。本研究選用前后補(bǔ)零的特征邊緣處理方法,可保證輸入與輸出特征圖尺寸Sc一致。輸出特征圖的尺寸計(jì)算公式如下:
式中:Co為輸出通道數(shù);Ho、Io分別為輸出特征圖的高和寬;Hi、Ii分別為輸入特征圖的高和寬;F1與F2分別為卷積核的高與寬;M為步長(zhǎng);P1、P2分別為補(bǔ)零的行數(shù)和列數(shù)。經(jīng)過(guò)計(jì)算,特征邊緣處理后的特征圖尺寸始終保持為6×1×1。
第三層為批量歸一化層(Batch norm)[40],該層對(duì)訓(xùn)練樣本進(jìn)行局部歸一化,加快模型的收斂與運(yùn)算速度,并且使模型更加穩(wěn)定。本研究對(duì)是否添加批量歸一化層進(jìn)行對(duì)比訓(xùn)練,結(jié)果顯示,添加該層后預(yù)測(cè)準(zhǔn)確率略微提高,運(yùn)算速度顯著提高。
第四層為激活函數(shù)層1(ReLU_1),激活函數(shù)通過(guò)添加非線性因素的方法捕捉非線性信息,進(jìn)一步提高線性模型的表達(dá)能力,常用的激活函數(shù)有[41-42]:(1) Sigmoid 函數(shù),該函數(shù)在其飽和時(shí)的梯度值相對(duì)低下,梯度的耗散問(wèn)題將會(huì)隨著模型中神經(jīng)網(wǎng)絡(luò)層數(shù)的增多而嚴(yán)重;(2) Tanh 函數(shù),該函數(shù)的缺點(diǎn)是仍然具有飽和的問(wèn)題;(3) ReLU 函數(shù),可有效解決Sigmoid 函數(shù)所存在的梯度耗散問(wèn)題,網(wǎng)絡(luò)稀疏性較大從而降低Tanh 函數(shù)存在的飽和問(wèn)題,且運(yùn)算效率高。3 個(gè)函數(shù)公式分別如下:
以訓(xùn)練樣本的預(yù)測(cè)準(zhǔn)確率為校驗(yàn)?zāi)繕?biāo)對(duì)各激活函數(shù)進(jìn)行模型訓(xùn)練,結(jié)果如圖5 所示。觀察圖5,以ReLU 函數(shù)進(jìn)行模型訓(xùn)練的準(zhǔn)確率均較高,特別地,訓(xùn)練集準(zhǔn)確率達(dá)到100%,故本研究選取ReLU 函數(shù)作為激活層函數(shù)。
圖5 激活函數(shù)的選取Fig.5 Activation function selection
第五層為池化層1(Maxpool_1),常用的池化方法有平均池化法與最大池化法。平均池化法能夠最大限度地保留數(shù)據(jù)背景信息,最大池化法能夠盡可能地提取數(shù)據(jù)的特征紋理,本研究期望能夠挖掘到更多的數(shù)據(jù)特征,故選取最大池化法進(jìn)行池化操作。池化核與步長(zhǎng)的確定過(guò)程類似于卷積層卷積核與步長(zhǎng)的確定過(guò)程,確定本研究池化核大小為3×1,步長(zhǎng)為1,特征邊緣處理方法選擇前后補(bǔ)零。
第六層為卷積層2(Conv_2),由大小為3×1 的卷積核以1 的步長(zhǎng)進(jìn)行卷積操作,生成32 幅特征圖,特征邊緣處理方法選擇前后補(bǔ)零。第七層為批量歸一化層。第八層為激活函數(shù)層2。第九層為池化層2(Maxpool_2),特征邊緣處理方法選擇前后補(bǔ)零。
第十層為全連接層(FC),將上一層數(shù)據(jù)展開,經(jīng)過(guò)激活函數(shù)Softmax 激活后挖掘特征信息,得到4 類輸出,即巖爆烈度的4 個(gè)等級(jí)。本研究所建立的CNN神經(jīng)網(wǎng)絡(luò)共有12 層,各層參數(shù)見表3。
表3 CNN 網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)Table 3 Structural parameters of CNN
2) 超參數(shù)優(yōu)選
優(yōu)化器的選擇方面,目前常用且性能優(yōu)秀的優(yōu)化器有3 種:SGDM、RMSProp 和Adam[43]。SGDM 在梯度下降的過(guò)程中引入一階動(dòng)量解決了可能僅找到局部最優(yōu)點(diǎn)而不是全局最優(yōu)的缺陷;RMSProp 加入了迭代衰減,不會(huì)在迭代過(guò)程中梯度下降過(guò)大使自適應(yīng)梯度出現(xiàn)變化異常等現(xiàn)象;Adam 結(jié)合了前2 種優(yōu)化器的優(yōu)點(diǎn),在提高自適應(yīng)學(xué)習(xí)率、尋找全局最優(yōu)點(diǎn)等方面皆較為突出。以訓(xùn)練樣本的預(yù)測(cè)準(zhǔn)確率為校驗(yàn)?zāi)繕?biāo),對(duì)RMSProp、SGDM 與Adam 進(jìn)行模型訓(xùn)練,結(jié)果如圖6 所示,經(jīng)對(duì)比,Adam 能夠在較少的訓(xùn)練次數(shù)下達(dá)到較高的預(yù)測(cè)準(zhǔn)確率,故本研究選用Adam 優(yōu)化器進(jìn)行模型優(yōu)化。
圖6 優(yōu)化器的選取Fig.6 Optimizer selection
由圖6 可知,訓(xùn)練次數(shù)達(dá)到200 時(shí),預(yù)測(cè)準(zhǔn)確率便不再升高,繼續(xù)升高訓(xùn)練次數(shù)只會(huì)延長(zhǎng)模型訓(xùn)練時(shí)間,故本研究的最大訓(xùn)練次數(shù)選為200。預(yù)測(cè)模型的超參數(shù)詳見表4。
表4 預(yù)測(cè)模型超參數(shù)Table 4 Prediction model hyperparameter
將本研究構(gòu)造的CNN 神經(jīng)網(wǎng)絡(luò)與選取的超參數(shù)相結(jié)合建立巖爆烈度等級(jí)預(yù)測(cè)模型,輸入訓(xùn)練樣本進(jìn)行訓(xùn)練,訓(xùn)練集預(yù)測(cè)結(jié)果如圖7a 所示,驗(yàn)證集預(yù)測(cè)結(jié)果如圖7b 所示。由兩圖可得,訓(xùn)練集預(yù)測(cè)準(zhǔn)確率達(dá)到100.00%;驗(yàn)證集的預(yù)測(cè)準(zhǔn)確率達(dá)到91.67%,其中第七組真實(shí)值為弱巖爆,而預(yù)測(cè)值為中等巖爆,其他組預(yù)測(cè)結(jié)果均正確,錯(cuò)誤率在合理范圍內(nèi)。由訓(xùn)練樣本預(yù)測(cè)結(jié)果可得,本研究所建立的CNN 巖爆烈度等級(jí)預(yù)測(cè)模型是合理可行的。
圖7 訓(xùn)練集與驗(yàn)證集預(yù)測(cè)結(jié)果Fig.7 Prediction results of the training set and verification set
為進(jìn)一步說(shuō)明模型的可行性,將包含12 組數(shù)據(jù)的測(cè)試集分別輸入本次所建立的CNN 預(yù)測(cè)模型和3 個(gè)對(duì)比模型:RBF、SVM 與PNN 模型中進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果見表5。觀察各模型預(yù)測(cè)結(jié)果準(zhǔn)確率可知,CNN模型的預(yù)測(cè)結(jié)果準(zhǔn)確率最高,僅第9 組數(shù)據(jù)預(yù)測(cè)錯(cuò)誤,其他組皆能夠正確預(yù)測(cè)巖爆烈度等級(jí)。
表5 各個(gè)模型的預(yù)測(cè)結(jié)果與準(zhǔn)確率Table 5 Prediction results and accuracy of each model
CNN 模型測(cè)試集混淆矩陣[44]如圖8a 所示。圖中可以看到有一組現(xiàn)場(chǎng)案例的實(shí)際結(jié)果為中等巖爆,而模型預(yù)測(cè)結(jié)果誤判為強(qiáng)烈?guī)r爆,預(yù)測(cè)結(jié)果略高一級(jí),雖在應(yīng)急防治方面會(huì)消耗更多的人力物力,但在誤判的情況下依然能夠保證現(xiàn)場(chǎng)工作人員的生命安全。
圖8 CNN 與PNN 測(cè)試集混淆矩陣Fig.8 Confusion matrix of CNN and PNN test set
PNN 模型測(cè)試集混淆矩陣如圖8b 所示。PNN 預(yù)測(cè)模型的準(zhǔn)確率與CNN 模型相近,但觀察混淆矩陣,有2 組現(xiàn)場(chǎng)案例的實(shí)際結(jié)果為中等巖爆,而模型預(yù)測(cè)結(jié)果分別誤判為一組無(wú)巖爆與一組弱巖爆。當(dāng)誤判為弱巖爆時(shí),現(xiàn)場(chǎng)人員的準(zhǔn)備與預(yù)防措施不夠充分,難以保障人身與財(cái)產(chǎn)的安全;而當(dāng)誤判為無(wú)巖爆時(shí),巖爆災(zāi)害將對(duì)施工現(xiàn)場(chǎng)造成極大的破壞并嚴(yán)重危害工作人員的生命,造成巨大的財(cái)產(chǎn)損失。
通過(guò)以上分析可以得到,本研究所建立的基于CNN 的預(yù)測(cè)模型是可行的,且具有準(zhǔn)確率高、安全系數(shù)高等優(yōu)點(diǎn)。由于現(xiàn)場(chǎng)數(shù)據(jù)收集較為困難,缺乏地下水、微震、聲發(fā)射等影響巖爆的關(guān)鍵因素與動(dòng)態(tài)指標(biāo);需要收集與應(yīng)用的現(xiàn)場(chǎng)數(shù)據(jù)量需進(jìn)一步擴(kuò)大,未來(lái)需要結(jié)合更多案例與更多影響指標(biāo)進(jìn)行綜合研究。
a.建立巖爆烈度等級(jí)預(yù)測(cè)指標(biāo)體系,對(duì)原始數(shù)據(jù)進(jìn)行基于拉依達(dá)準(zhǔn)則的異常值剔除與MICE 的缺失值填補(bǔ),建立RF、BLR、ET、KNN 4 種插補(bǔ)模型并結(jié)合2 種傳統(tǒng)插補(bǔ)方法,依據(jù)ERMS評(píng)價(jià)指標(biāo)優(yōu)選MICE 的估計(jì)器,其中,ET 模型得到的觀測(cè)值與真值偏差最小,能夠保證模型預(yù)測(cè)的準(zhǔn)確度。
b.搭建CNN 神經(jīng)網(wǎng)絡(luò)初始框架,確定卷積核和池化核大小、特征邊緣處理方法與激活函數(shù)等;優(yōu)化模型超參數(shù),確定優(yōu)化器函數(shù)等,提高了模型預(yù)測(cè)準(zhǔn)確率,降低了運(yùn)算時(shí)間,增強(qiáng)了模型的適用性。運(yùn)用訓(xùn)練樣本對(duì)模型進(jìn)行訓(xùn)練,訓(xùn)練集準(zhǔn)確率為100.00%,驗(yàn)證集準(zhǔn)確率為91.67%。
c.建立基于RBF、SVM 與PNN 對(duì)比模型,并對(duì)實(shí)例應(yīng)用結(jié)果進(jìn)行綜合分析顯示,基于CNN 的巖爆烈度等級(jí)預(yù)測(cè)模型準(zhǔn)確率最高,為91.67%。對(duì)比CNN與PNN 模型的混淆矩陣得到,在誤判的情況下CNN預(yù)測(cè)模型安全性更高。
d.未來(lái)需進(jìn)一步擴(kuò)大用來(lái)建立指標(biāo)體系與預(yù)測(cè)模型的現(xiàn)場(chǎng)數(shù)據(jù)量,結(jié)合現(xiàn)場(chǎng)案例的更多影響因素進(jìn)行綜合分析。有必要運(yùn)用先進(jìn)算法進(jìn)行超參數(shù)優(yōu)化,建立成熟的深度學(xué)習(xí)模型對(duì)巖爆災(zāi)害進(jìn)行精確預(yù)測(cè)。