柴 敬, 王潤沛, 雷武林
(1.西安科技大學能源學院, 西安 710054; 2.教育部西部礦井開采與災害防治重點實驗室, 西安 710054)
隨著中國工業(yè)化的發(fā)展,對煤炭的需要也日益增長。煤礦動力災害現(xiàn)象也與日俱增,為此掌握其機理,減少覆巖變形帶來的災害事故,對其有效的預測和防治成為研究的重要內(nèi)容[1-2]。其中,用來預測的樣本集采用分布式光纖監(jiān)測相似材料模型試驗來獲取巖層變形規(guī)律數(shù)據(jù)。分布式光纖的超高精度、可實時監(jiān)測巖體內(nèi)部變形等優(yōu)點成為監(jiān)測覆巖變形規(guī)律的研究熱點,結(jié)合相似材料模型試驗形成研究覆巖變形規(guī)律的重要手段之一,柴敬等[3-4]將分布式光纖應用于采動覆巖變形相似材料模型試驗中,并提出光纖頻移變化度表征礦壓等規(guī)律。高磊等[5]采用分布式光纖監(jiān)測斜管,獲取斜管應變信息,分析獲得基坑深層水平位移變化。樸春德等[6]將分布式光纖應用于楊柳煤礦,成功監(jiān)測到覆巖變形規(guī)律。覆巖變形是一種非常復雜的非線性問題,在工作面開采中及時準確預測其變形引起的礦壓規(guī)律是預防地質(zhì)災害的重要研究問題。對此,部分學者采用神經(jīng)網(wǎng)絡的方法進行來壓的預測,賀超峰等[7]、李小永等[8]采用神經(jīng)網(wǎng)絡方法進行來壓預測。然而,神經(jīng)網(wǎng)絡雖具有高度的非線性系統(tǒng)、多信息融合的綜合預測能力,但其在小樣本訓練過程中易出現(xiàn)‘維度災難’和‘過擬合’等問題,需要新的算法替代。因此,支持向量機借助機構風險最小化理論,引入核技巧,保證數(shù)據(jù)從低維線性不可分映射到高位線性可分,得到全局最優(yōu)解的能力,成為了研究的新方向。張洋等[9]、郝秦霞等[10]采用支持向量機方法進行頂板來壓預測,提高模型泛化能力。此外,王晨暉等[11]、蘇晨旭等[12]分別將支持向量機應用于泥石流危險度和滑坡易發(fā)性評價預測中。
然而,覆巖變形引起礦壓現(xiàn)象是動態(tài)演化過程,因此可以采用非線性混沌動力學來構造混沌時間序列預測,其構造的時序預測是解決采礦、巖土、邊坡等領域地質(zhì)災害的重要手段。其中,陶慧等[13]將其應用于沖擊地壓時序預測中;董輝等[14]、孫剛等[15]、謝洋洋等[16]將混沌時間序列結(jié)合支持向量機應用于滑坡預測、礦壓預測、基坑變形預測。引入光纖頻移變化度[4],將其看作隨開挖距離變化的時間序列,結(jié)合支持向量機(support vector machine,SVM)建立時序預測模型。SVM預測模型的泛化能力與其超參數(shù)的選取有關。目前為止,借助遺傳算法等進行超參數(shù)選擇有較好效果。其中,曹慶奎等[17]、勒聰聰?shù)萚18]使用遺傳算法結(jié)合支持向量機分別在導水裂隙帶和煤層底板破壞程度預測進行研究。
目前,將支持向量機結(jié)合光纖數(shù)據(jù)進行礦壓時序預測的研究尚鮮見報道。因此,以寶雞某煤礦為對象進行相似材料模型制作,獲取光纖監(jiān)測數(shù)據(jù),采用遺傳-支持向量機對光纖頻移變化度進行時序預測。
埋入工作面上覆巖層的光纖,其任意位置的頻移變化與該位置的巖層變形相關。定義光纖平均頻移變化度為
(1)
式(1)中:Dl為工作面開挖距離l時的光纖平均頻移變化度;n為光纖上的采樣點的個數(shù);Sj為開挖時的光纖上某一個位置的頻移;Sj-1為上一次開挖時的光纖上某個位置對應的頻移;j為工作面開挖次數(shù)。通過前后兩次頻移差值來表示該時間段巖體變形程度,即光纖上采樣點的任意位置處的頻移變化的絕對值可以表示該位置巖層在某一段時間內(nèi)的變形大小。其曲線會隨開挖次數(shù)出現(xiàn)突峰,因此可以作為上覆巖層初次來壓或周期來壓的判斷指標。
根據(jù)Takens理論進行相空間重構,對光纖頻移變化度數(shù)據(jù)集進行一維投影,將光纖頻移變化度作為隨開挖距離變化的時間序列x=[xi],光纖頻移變化度構成的時間序列數(shù)據(jù)集為{x1,x2,…,xi},xi是開挖一次的光線頻移變化度,i=1,2,…,n。選取嵌入維數(shù)m和延遲時間τ是相空間重構的關鍵,這里嵌入維數(shù)采用預測誤差最小法進行確定,延遲時間采用互信息法進行確定。由相空間重構后的構成的學習樣本集為Y(m)=f[xi,xi+1,…,xi+(m-1)τ],其中i=1,2,…,n-1-(m-1)τ,共n-1-(m-1)τ個樣本。已知上一開挖光纖頻移變化度xi預測下一次開挖光線頻移變化度xi+1,通過支持向量機學習到一個函數(shù)f(x),使得樣本以外的X通過f(x)的映射找到對應的Y,且使真實值與Y盡可能地接近。將m作為輸入特征建立訓練樣本,X和Y對應關系為
(2)
通過φ(xi)將樣本映射到高維空間,建立支持向量機回歸目標函數(shù)為
(3)
式(3)中:f(xi)=wφ(xi)+b為需要找的回歸函數(shù);C為正則化系數(shù);L為不敏感損失函數(shù);w為權值;b為閾值;yi為真實值。
引入松弛變量
和不敏感參數(shù)ε,將式(3)轉(zhuǎn)化成目標極小化函數(shù),即
(4)
(5)
通過式(5)推導得SVR回歸函數(shù)為
(6)
式(6)中:K(xi,xj)=φ(xi)Tφ(xj)是SVR的核函數(shù)。
不同的核函數(shù)具有不同的核函數(shù)參數(shù),無論樣本大小、維數(shù)多少,徑向基核函數(shù)均表現(xiàn)效果好,且σ是高斯徑向基核函數(shù)唯一參數(shù),為核寬度易于實現(xiàn)。經(jīng)試驗效果,高斯徑向基核函數(shù)效果最好,因此,選其作為模型核函數(shù),即
(7)
選取高斯徑向基作為核函數(shù)的SVR模型,其預測精度的高低主要取決于模型懲罰因子C和核函數(shù)參數(shù)σ的選擇。人工經(jīng)驗選取會造成誤差,需要科學的選取方法。因此,引入遺傳算法通優(yōu)化參數(shù),選取最優(yōu)SVR預測模型。編程方式采用華南理工大學開發(fā)的Geatpy遺傳算法工具箱和 Python語言。使用編程語言進行建模的程序流程如圖1所示。
圖1 SVR礦壓時序預測模型流程
以寶雞某礦區(qū)地質(zhì)柱狀及其物理力學參數(shù)為對象,制作尺寸為3 000 mm×200 mm×2 000 mm(長×寬×高)的二維采場覆巖模型,其中,模型幾何相似比為1∶100,模型高度為1 290 mm,其中上覆巖層厚度為1 180 mm,煤層厚度為50 mm,地板厚度為60 mm??偣查_挖60步,共計2 400 mm。
分布式光纖測試系統(tǒng)選用日本Neubrex基于PPP-BOTDA技術研發(fā)的新一代光纖傳感系統(tǒng),如圖2所示。在模型鋪裝過程中,埋設3根垂直光纖,記為V1、V2、V3,分別位于距離開切眼600、1 200、1 800 mm模型尺寸。開挖工作面位置和追至光纖布置位置如圖3所示。
圖2 NBX-6055分布式光纖測量儀
圖3 相似材料模型試驗
圖4 光纖表征礦壓規(guī)律示意圖
經(jīng)模型試驗測得光纖頻移值結(jié)合式(1)可知,3根光纖Dl求均值可以得到來壓規(guī)律分為1次初次來壓和13次周期來壓。如圖4所示,根據(jù)光纖頻移變化度Dl得出了工作面來壓的基本表現(xiàn)形式。整個過程共出現(xiàn)14次光纖頻移變化度“尖峰”,在工作面開挖840 mm時首次出現(xiàn)尖峰,并在960、1 080、1 200、1 320、1 440、1 560、1 680、1 840、1 960、2 080、2 200、2 280、2 400 mm處出現(xiàn)頻移尖峰。以此數(shù)據(jù)為樣本集,將樣本集按4∶1分割,前48次開挖作為訓練樣本,后12次開挖作為測試樣本。訓練不同的預測模型,并對模型進行評估,選取最優(yōu)模型。
通過上述實驗得到60次光線頻移變化度。在對數(shù)據(jù)進行均一化處理后,需進一步研究模型性能,保持數(shù)據(jù)訓練樣本和測試樣本不變的條件下,對SVR和BP神經(jīng)網(wǎng)絡進行礦壓數(shù)據(jù)預測建模和測試分析。通常使用平均絕對誤差MAE、均方誤差MSE和決定系數(shù)R2這3種指標作為回歸問題的評估指標。
(8)
(9)
(10)
根據(jù)圖1流程圖所示,首先確定延遲時間為1,嵌入維數(shù)為3。再利用GA遺傳算法對支持向量機參數(shù)C、σ進行尋優(yōu),其中遺傳算法初始化參數(shù)設定為:種群個數(shù)為20,最大進化代數(shù)200,參數(shù)C的變化范圍為[0,100],參數(shù)σ的變化范圍為[0,1 000]。經(jīng)過54次迭代后達到最優(yōu),在100次迭代后終止。經(jīng)過優(yōu)化后確定,C=11.625,σ=1.725,不敏感系數(shù)取程序庫默認值ε=0.1,參數(shù)尋優(yōu)過程如圖5所示。
將參數(shù)代入SVR模型中對樣本進行訓練,使用相同訓練樣本集對傳統(tǒng)SVR和神經(jīng)網(wǎng)絡進行訓練,其中傳統(tǒng)支持向量機參數(shù)采用程序默認數(shù)值,對于BP神經(jīng)網(wǎng)絡來說,選取兩層隱含層,神經(jīng)元個數(shù)為(5,2),輸出層為回歸函數(shù)進行擬合。
上述3種模型測試結(jié)果如圖6所示,從圖6中可以看出,取后12次開挖產(chǎn)生的頻移變化度作為測試集。共出現(xiàn)5次光纖頻移變化度“尖峰”,因此共計出現(xiàn)5次來壓。從礦壓時列數(shù)據(jù)的開挖預測結(jié)果,可以看出神經(jīng)網(wǎng)絡在前8次開挖過程中正確預測出2次來壓,之后的預測數(shù)值幾乎不變,說明其出現(xiàn)了“過擬合”現(xiàn)象。傳統(tǒng)SVM整體趨勢效果不錯,正確預測出4次來壓,但在第4、8次開挖出現(xiàn)較大誤差。GA-SVM預測性能效果好,整體趨勢吻合無較大誤差,且12次開挖過程中成果預測出5次周期來壓。
圖5 GA-SVM參數(shù)尋優(yōu)過程
圖6 光纖頻移變化度實測值和預測值關系
為了進一步對比分析,如表1所示。其中均方誤差MSE和平均絕對誤差MAE的數(shù)值越接近0模型表現(xiàn)越好。R2反映了對信息擬合度的好壞,其數(shù)值越接近1模型表現(xiàn)越好。由表1可知,在測試階段BP神經(jīng)網(wǎng)絡測試樣本的MSE相對于訓練樣本增多,決定系數(shù)在減小,說明神經(jīng)網(wǎng)絡模型存在過擬合顯現(xiàn),在測試集上由較大誤差。傳統(tǒng)SVR在訓練集和測試集表現(xiàn)效果較好,但其超參數(shù)通過人工經(jīng)驗選取,沒有很好的科學依據(jù),會造成一定程度的誤差,采用GA-SVR,其決定系數(shù)接近1,MSE接近0,與訓練階段差異較小,說明具有較強泛化能力。
表1 不同模型性能指標對比
(1)引入遺傳算法優(yōu)化SVR參數(shù)和相空間重構方法,結(jié)合分布式光纖傳感技術,提出基于GA-SVR的分布式光纖監(jiān)測礦壓數(shù)據(jù)的時序預測方法。
(2)通過分布式光纖傳感器技術監(jiān)測到光線頻移變化度,并通過二維平面模型試驗進行驗證,建立光纖監(jiān)測系統(tǒng),并用預測結(jié)果與BPNN、傳統(tǒng)SVM方法進行分析比較。驗證GA-SVR在煤礦開采過程中預測礦壓顯現(xiàn)是一種可行、有效和準確的方法。
(3)在模型性能上BPNN模型在其訓練樣本上表現(xiàn)良好,但在測試樣本上易出現(xiàn)“過擬合”現(xiàn)象引起預測誤差。GA-SVR其擁有最佳的訓練結(jié)果,相對于傳統(tǒng)SVR在選取超參數(shù)上更加科學,模型的預測精度更高。說明參數(shù)選取對SVR精度具有重要影響,并且其在處理模型試驗小樣本、非線性數(shù)據(jù)性能要好于BPNN模型。因此,GA-SVR在礦壓預測中具有很高的實際推廣價值。