程健,石林松,駱意,周天白,楊凌凱
(1.煤炭科學研究總院,北京 100013;2.煤炭科學研究總院有限公司 礦山大數據研究院,北京 100013;3.天地科技股份有限公司,北京 100013;4.煤炭智能開采與巖層控制全國重點實驗室,北京 100013)
加速煤礦智能化發(fā)展,建設數字化、智能化礦山和綠色煤炭工業(yè)新體系,實現煤炭資源的安全開發(fā)利用,是我國煤炭工業(yè)新時期高質量發(fā)展的戰(zhàn)略任務[1]。隨著我國煤礦采深逐年增加,各類安全監(jiān)測系統(tǒng)已成為保障煤炭安全生產的重要組成部分。其中微震監(jiān)測系統(tǒng)作為一種區(qū)域性、實時、連續(xù)的監(jiān)測系統(tǒng),可對各類震動信號進行實時采集分析,廣泛應用在煤礦安全監(jiān)測領域[2]。
在微震監(jiān)測中,微震事件判識是一項重要的基礎工作,也是進一步開展震源位置與震級能量分析等工作的基石。眾多學者依據微震特性進行微震事件判識研究,形成了震源參數分析、震動波波速層析成像技術等理論[3]。文獻[4]基于數據驅動思路,對離線微震監(jiān)測數據進行特征提取,并對特征數據進行半監(jiān)督非平衡學習,解決了不平衡微震數據集的識別問題。文獻[5]利用流形學習的非線性降維思想,提出了一種流形嵌入過采樣方法,為有機結合流形學習與過采樣的非平衡數據模式分類方法提供了框架,對于較大規(guī)模的非平衡微震數據有穩(wěn)定的分類效果。在現場應用中,以動載應力集中系數[6]等指標輔助的監(jiān)測方式是主流,如KJ768 監(jiān)測系統(tǒng)、ARAMIS 監(jiān)測系統(tǒng),其通過對近期數據的統(tǒng)計劃定閾值,進而判斷微震事件危險等級[7]。文獻[8]通過分析微震數據時空演化規(guī)律,認為綜合分析微震歷史事件平均數、平均釋放能量、地震參數等可提升微震事件預測精度。
實際工程數據中存在大量干擾信號和噪聲,導致微震事件實時判別易產生錯誤結果,主要原因是常規(guī)的微震監(jiān)測技術大多基于單物理量變化規(guī)律而開發(fā)[9]。因此,充分融合多通道微震信號,得到準確且魯棒的分析結果,是微震事件實時判識的關鍵。狀態(tài)監(jiān)測與判識方法可對多通道信息進行融合分析,從系統(tǒng)穩(wěn)定性的角度為多通道微震信號融合分析提供了可能[10]。其核心原理是采用多元統(tǒng)計分析與數據挖掘方法,對傳感器采集信號進行分析并挖掘潛隱空間信息,得到系統(tǒng)穩(wěn)定性的度量[11]。常用的狀態(tài)監(jiān)測與判識方法包括主成分分析(Principal Components Analysis,PCA)[12]、偏最小二乘(Partial Least Squares,PLS)方法[13]、規(guī)范變量分析(Canonical Variate Analysis,CVA)[14],其中CVA 對時序數據的處理效果較好,更適用于動態(tài)數據場景[15]。為進一步提高CVA 的信號處理能力,有學者對其進行改進,提出了多模塊方法和核函數方法等[16-20],通過高維空間分類對非線性數據進行有效挖掘,但抗噪聲干擾能力仍較差。對此,文獻[21-23]將稀疏化建模引入CVA,以應對噪聲干擾。鑒于多通道微震監(jiān)測信號具有強自相關性和互相關性[4],上述方法用于微震事件判識時存在誤判情況。本文采用稀疏化建模中的嶺回歸方法改進CVA,通過模擬實驗和實際微震監(jiān)測數據驗證了該方法的有效性。
CVA 通過最大化2 個變量集間的相關度,實現對高維數據的降維[24]。其優(yōu)勢在于通過處理數據之間的相關性來提高數據的辨識度,有利于提高訓練模型的監(jiān)測效果。
設給定2 組向量x∈Rm和y∈Rn,m,n為向量維度,x和y的協(xié)方差矩陣分別為 Σxx和 Σyy,互協(xié)方差矩陣為 Σxy,矩陣J∈Rm×m和L∈Rn×n滿足以下條件:
式中:I為前個對角元素為1、其余對角元素均為0 的對角矩陣,=rank(Σxx);I為前個對角元素為1、其余對角元素均為0 的對角矩陣,=rank(Σyy);D為規(guī)范相關系數矩陣;ωi為規(guī)范相關系數,i=1,2,…,r,r為規(guī)范相關系數矩陣D的秩。
設存在向量c,d,其中c=Jx,其協(xié)方差矩陣Σcc=JΣxxJT=I,d=Ly,其協(xié)方差矩陣Σdd=LΣyyLT=I,c和d之間的互協(xié)方差矩陣為規(guī)范相關系數矩陣D,即 Σcd=D=diag(ω1,ω2,···,ωr,0,0,···,0)。
c和d的相關程度可由規(guī)范相關系數表示。映射矩陣J,L及規(guī)范相關系數矩陣D可通過奇異值分解方法計算:
CVA 將過去和未來的信息分離,在特定時刻t(t∈{K+1,K+2,···,N-K+1},K為觀測長度,N為觀測樣本數),包含過去信息的向量pt與包含未來信息的向量ft分別為
通過將過去信息和未來信息構造為過去與未來矩陣并應用于CVA 中,可得到樣本估計下的狀態(tài)空間模型。由于煤礦微震監(jiān)測信號包含大量噪聲干擾,所以信號估計模型的輸出值與實際值存在偏差。可采用稀疏化建模降低噪聲信號干擾,以獲得更準確的估計模型。稀疏化建模通過降低干擾信息和噪聲在估計模型中的權重,有效保留微震監(jiān)測數據中的重要信息。嶺回歸是一種可用于共線性數據的有偏估計回歸方法,是經典的稀疏化建模方法之一。其通過在損失函數中加入正則項,使回歸系數接近0,從而實現稀疏化,避免過擬合現象,提升模型泛化能力,對含強噪聲、大干擾數據的擬合性能優(yōu)于常見的最小二乘法。
微震監(jiān)測系統(tǒng)包含多通道監(jiān)測信號,實現對不同區(qū)域的實時監(jiān)測。利用微震監(jiān)測信號時間序列構建pt和ft,組合為過去信息矩陣X和未來信息矩陣Y:
CVA 目標函數為
式中u,v分別為U和V的列向量。
采用嶺回歸算法改進CVA 的損失函數,得到新的損失函數:
式中 λ1,λ2為收縮參數。
式(8)可等價為
構造Lagrange 函數并簡化,得
式中 β1,β2為Lagrange 乘子。
對u,v分別求偏導,并令導數為0,即
求解式(11),得
式中I為單位矩陣。
上述模型的偽代碼如下。
依據Hotelling-T2檢驗定理計算統(tǒng)計量和。
式中:k為選取的規(guī)范變量空間維數,本文中k=K;Fα(·)為F 統(tǒng)計檢驗函數;α為置信度;q為剩余空間維數,本文指噪聲空間維數。
根據嶺回歸改進CVA 得到的u中前k行元素組成的向量uk和后q行元素組成的向量uq計算監(jiān)測量
通過模擬實驗及基于實際微震監(jiān)測數據的實驗驗證嶺回歸改進CVA 的有效性和正確性。
采用平均準確率CAC、誤報率RFP、漏報率RFN和錯誤率RE作為數據判識評價指標,取多次實驗的平均值。
式中:TP 為將異常點判識為異常點的個數;TN 為將正常點判斷為正常點的個數;FP 為將正常點判識為異常點的個數;FN 為將異常點判識為正常點的個數。
采用文獻[25]中的模擬數據構造方法,驗證嶺回歸改進CVA 的判識效果。用于訓練的每個正常數據集包含2 500 個觀測數據、16 個特征,每個測試集包含2 500 個觀測數據、16 個特征。每個數據集均在沒有異常波動的情況下開始生成,測試集在第1 500 次觀測后觸發(fā)異常波動。每個數據集分為A、B兩部分,特征個數分別為3、13,特征生成規(guī)則如下。
式中:g1(t)—g13(t)為白噪聲序列,可自行設置均值和方差;θ為故障系數,用于改變測試集數據的波動程度。
設置正常數據集中 θ=0,測試集中t=1 500 之前θ=0,之后 θ≠0。令t0為數據波動開始時刻,即t0=1 500,則 θ設置規(guī)則為
模擬數據集生成方法:①預先生成白噪聲序列g1(t)—g13(t),其均值為0,方差自行設置。②從{1,-1}中隨機生成觀測數據A。③利用A生成數據B,其中t=1 500 時刻改變故障系數 θ,構造波動數據。訓練集和測試集數據分別如圖1(a)和圖1(b)所示,其中8,9,16 號通道分別為A1,A2,A3,其他通道依次為B1—B13,3,12,13,14,15 號通道在t=1 500 時刻之后因θ 改變而發(fā)生波動,紅色部分為t=1 500~2 500時刻。
圖1 訓練集與測試集數據Fig.1 Data in training set and testing set
經多次實驗驗證,式(12)中包含的4 個可調參數λ1,λ2,β1,β2均設置為1,置信度 α=99%。
生成9 組不同噪聲方差下的數據,每組噪聲方差下分別采用CVA 和嶺回歸改進CVA 進行3 次判識實驗,結果如圖2 所示。可看出隨著噪聲方差由5×10-6增大至 5×10-2,嶺回歸改進CVA 的判識準確率較CVA 提升了0.6%~5.4%,誤報率和漏報率之和較CVA 降低了4.8%~17.3%??梢妿X回歸改進CVA 具有較好的魯棒性,在噪聲干擾下具有較高的異常判識準確率。
圖2 模擬數據實驗結果Fig.2 Experiment results by simulation data
采用煤礦微震實際監(jiān)測數據驗證嶺回歸改進CVA 的應用效果。微震監(jiān)測數據由波蘭SOS 微震監(jiān)測系統(tǒng)采集,每個數據集包含20 個通道監(jiān)測數據,每個通道數據包含10 240 個采樣點。實驗中使用的微震信號測試集包含3 組平穩(wěn)狀態(tài)數據集(測試集1,2,3)和3 組波動狀態(tài)數據集(測試集4,5,6)。以測試集4 為例進行判識,其各通道微震監(jiān)測數據如圖3 所示。
圖3 微震監(jiān)測數據Fig.3 Monitored microseismic data
通過嶺回歸改進CVA 融合分析測試集4 中20 個通道的微震監(jiān)測信號,采用99%置信度,設置λ1,λ2,β1,β2均為1。微震判識結果如圖4 所示,藍色線代表融合分析的監(jiān)測量,紅色線代表統(tǒng)計量,若大于,則判斷該時刻發(fā)生微震信號波動,即發(fā)生微震事件。從圖3 可看出,20 個通道未全部監(jiān)測到微震信號波動,但由于多通道信號間的相關關系已發(fā)生改變,經嶺回歸改進CVA 融合分析的結果反映出微震監(jiān)測信號處于波動狀態(tài),驗證了嶺回歸改進CVA 具備微震事件實時判識功能。
圖4 微震監(jiān)測數據融合分析統(tǒng)計結果Fig.4 Statistics of fusion analysis of monitored microseismic data
采用6 個測試集對嶺回歸改進CVA 與CVA 的判識性能進行驗證,結果見表1??煽闯鰩X回歸改進CVA 的平均準確率為97.14%,較CVA 高2.39%,誤報率與漏報率之和較CVA 降低了0.07%。
表1 微震數據實驗結果Table 1 Experiment results by microseismic data %
1)針對含有噪聲和干擾信號的煤礦微震監(jiān)測信號,采用嶺回歸改進CVA 對多通道微震信號進行融合分析,進而實時判識微震事件。
2)采用模擬數據和實際微震監(jiān)測數據對嶺回歸改進CVA 進行實驗驗證,結果表明,對于含噪聲和干擾信號的微震監(jiān)測數據,嶺回歸改進CVA 較CVA 具有更優(yōu)的判識能力。
3)下一步將針對噪聲環(huán)境,構造基于信噪比改變通道信號權重的稀疏化模型,以優(yōu)化嶺回歸改進CVA 對多通道微震信號的自主篩選能力。