曹安業(yè) ,劉耀琪,楊 旭,李 森,王常彬,白賢棲,劉亞鵬
(1.中國(guó)礦業(yè)大學(xué) 礦業(yè)工程學(xué)院,江蘇 徐州 221116;2.中國(guó)礦業(yè)大學(xué) 江蘇省礦山地震監(jiān)測(cè)工程實(shí)驗(yàn)室,江蘇 徐州 221116;3.徐州物碩信息技術(shù)有限公司,江蘇 徐州 221116;4.中國(guó)礦業(yè)大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,江蘇 徐州 221116)
沖擊地壓災(zāi)害由采掘空間煤巖體集聚彈性能的瞬間釋放所引起,具有突發(fā)、急劇以及猛烈的特點(diǎn),易造成巷道嚴(yán)重?fù)p毀和人員重大傷亡[1-2]。究其根源,沖擊地壓的誘發(fā)機(jī)理不清、沖擊災(zāi)變信息判識(shí)不明以及監(jiān)測(cè)技術(shù)精度不足是主要原因[3]。
相較于沖擊地壓誘發(fā)機(jī)理研究的突破可有效指導(dǎo)針對(duì)性制定防控措施,沖擊地壓的監(jiān)測(cè)預(yù)警更注重沖擊災(zāi)變信息的全方位捕捉與災(zāi)變前兆信息的有效辨識(shí)。沖擊災(zāi)變信息的捕捉方法主要可分為:①巖石力學(xué)方法,主要包括鉆屑法[4-5]、煤巖體變形觀測(cè)法、煤巖體應(yīng)力測(cè)量法[6-7]、煤炮及礦震統(tǒng)計(jì)法、頂板來(lái)壓預(yù)測(cè)法、工作面“見(jiàn)方”預(yù)測(cè)法等;②地球物理方法,主要包括微震法[8-10]、電磁輻射法[11]、聲發(fā)射(地音)法[12-14]、電荷感應(yīng)法[15]等,通過(guò)連續(xù)記錄煤巖體內(nèi)出現(xiàn)的動(dòng)力現(xiàn)象,實(shí)時(shí)監(jiān)測(cè)沖擊危險(xiǎn)狀態(tài)。其中,微震監(jiān)測(cè)方法是目前煤礦開(kāi)采過(guò)程中監(jiān)測(cè)范圍最大、信息量最多的方法,我國(guó)沖擊地壓礦井幾乎都安裝了該類監(jiān)測(cè)系統(tǒng),已成為煤礦沖擊地壓區(qū)域性監(jiān)測(cè)預(yù)警的最主要手段。齊慶新等[16-17]較早開(kāi)展了沖擊地壓的微震監(jiān)測(cè)理論及應(yīng)用研究,姜福興等[9]研發(fā)并在國(guó)內(nèi)多個(gè)礦井建立了礦山微震監(jiān)測(cè)系統(tǒng),潘一山等[18]研制了礦震監(jiān)測(cè)定位系統(tǒng)并進(jìn)行了現(xiàn)場(chǎng)應(yīng)用,竇林名等[19]在沖擊地壓微震監(jiān)測(cè)和防治方面進(jìn)行了大量研究,取得了顯著成果。此外,馮夏庭、唐春安等[20-22]采用微震監(jiān)測(cè)技術(shù)對(duì)金屬礦山的巖爆進(jìn)行監(jiān)測(cè),取得了較好的效果。
沖擊地壓危險(xiǎn)的預(yù)測(cè)具體可分為沖擊危險(xiǎn)性的時(shí)序預(yù)測(cè)與沖擊危險(xiǎn)區(qū)域的空間預(yù)測(cè),兩者各有側(cè)重,均具有廣闊的研究前景。就沖擊危險(xiǎn)時(shí)序預(yù)測(cè)而言,諸多學(xué)者基于微震監(jiān)測(cè)數(shù)據(jù)提出基于物理指標(biāo)的時(shí)序預(yù)測(cè)方法,該方法的特點(diǎn)是致力于尋找沖擊地壓發(fā)生的前兆信息。如田向輝等[23]提出了一種基于微震能量、頻次的定量-趨勢(shì)沖擊危險(xiǎn)預(yù)警方法,李宏艷等[24]初步建立了以響應(yīng)能量異常系數(shù)和無(wú)響應(yīng)時(shí)間異常系數(shù)為指標(biāo)的沖擊危險(xiǎn)性微震評(píng)價(jià)方法。同時(shí),已有學(xué)者發(fā)現(xiàn)單一物理指標(biāo)僅代表沖擊孕育過(guò)程中某些物理特征的變化趨勢(shì),導(dǎo)致使用單一物理指標(biāo)預(yù)警準(zhǔn)確率難以進(jìn)一步提升,據(jù)此提出采用多參量綜合預(yù)警的思路,在現(xiàn)場(chǎng)應(yīng)用獲得較好效果[25-26]。然而,面對(duì)日益復(fù)雜的采掘工程環(huán)境,如“三高一擾動(dòng)”等復(fù)雜環(huán)境下的沖擊地壓機(jī)理模型有待進(jìn)一步完善,而基于物理指標(biāo)的預(yù)測(cè)方法往往基于一定的物理假設(shè)與力學(xué)模型,導(dǎo)致其預(yù)測(cè)模型的適用性可能大打折扣。此外,在煤礦智能化建設(shè)的大背景下,如何高效利用海量的監(jiān)測(cè)數(shù)據(jù),充分挖掘其內(nèi)在的災(zāi)變信息特征,以及預(yù)警模型的快速更新迭代是制約煤礦沖擊地壓智能化預(yù)警的新的瓶頸。
面對(duì)此困境,已有學(xué)者展開(kāi)積極探索。國(guó)家重點(diǎn)研發(fā)計(jì)劃“煤礦典型動(dòng)力災(zāi)害風(fēng)險(xiǎn)判識(shí)及監(jiān)控預(yù)警技術(shù)研究”已布局開(kāi)展基于人工智能的沖擊地壓多源多場(chǎng)智能監(jiān)測(cè)預(yù)警的階段性研究[27],魏立科等[28]提出了沖擊地壓災(zāi)害風(fēng)險(xiǎn)監(jiān)察智能分析系統(tǒng)關(guān)鍵技術(shù)架構(gòu),陳結(jié)等[29]提出了沖擊地壓“雙驅(qū)動(dòng)”智能預(yù)警架構(gòu)與方法。此外,由于巖爆與沖擊地壓均為礦山典型動(dòng)力災(zāi)害,具有一定的相似性,在監(jiān)測(cè)預(yù)警理念與方法上可相互借鑒。就機(jī)器學(xué)習(xí)算法在巖爆預(yù)測(cè)的研究方面,已有學(xué)者結(jié)合神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、隨機(jī)森林、深度學(xué)習(xí)等人工智能方法對(duì)巖爆災(zāi)害預(yù)測(cè)開(kāi)展初步研究。如孫臣生等[30]以非線性科學(xué)理論為指導(dǎo),結(jié)合BP 神經(jīng)網(wǎng)絡(luò)對(duì)隧道巖爆預(yù)測(cè)模型進(jìn)行改進(jìn),葛啟發(fā)、馮夏庭[31]結(jié)合集成學(xué)習(xí)算法和BP 人工神經(jīng)網(wǎng)絡(luò)算法進(jìn)行了巖爆等級(jí)預(yù)測(cè)模型研究,張航[32]開(kāi)展了基于深度學(xué)習(xí)的隧道微震信號(hào)處理及巖爆智能預(yù)警研究,李明亮等[33]結(jié)合相關(guān)系數(shù)與支持向量機(jī)算法開(kāi)展了巖爆烈度等級(jí)預(yù)測(cè)研究,田睿等[34]開(kāi)展了基于深度殘差神經(jīng)網(wǎng)絡(luò)的巖爆預(yù)測(cè)方法研究,DONG 等[35]結(jié)合隨機(jī)森林算法進(jìn)行了巖爆等級(jí)預(yù)測(cè)方法研究。巖爆預(yù)測(cè)領(lǐng)域的相關(guān)研究進(jìn)展可為煤礦沖擊地壓智能預(yù)警研究提供一定借鑒。然而,基于機(jī)器學(xué)習(xí)所構(gòu)建的模型具有數(shù)據(jù)集構(gòu)建成本高、可解釋性差、穩(wěn)定性低等弊端。物理指標(biāo)驅(qū)動(dòng)和基于數(shù)據(jù)驅(qū)動(dòng)的預(yù)警方法各具優(yōu)勢(shì),如何將兩者優(yōu)勢(shì)互補(bǔ),做到物理指標(biāo)與數(shù)據(jù)驅(qū)動(dòng)的有效融合,是未來(lái)沖擊地壓預(yù)測(cè)預(yù)警的主要發(fā)展方向。
筆者以陜西彬長(zhǎng)礦區(qū)某強(qiáng)沖擊危險(xiǎn)工作面為背景,統(tǒng)計(jì)分析了多次大能量事件發(fā)生前物理指標(biāo)的變化特征并剖析了僅使用物理指標(biāo)驅(qū)動(dòng)的沖擊地壓危險(xiǎn)預(yù)測(cè)方法的短板與不足,在此基礎(chǔ)上提出采用物理指標(biāo)與數(shù)據(jù)特征融合驅(qū)動(dòng)的沖擊地壓時(shí)序預(yù)測(cè)方法。該預(yù)測(cè)模型包括數(shù)據(jù)預(yù)處理、特征提取以及預(yù)警模型構(gòu)建3 個(gè)模塊,數(shù)據(jù)預(yù)處理將原有微震監(jiān)測(cè)數(shù)據(jù)處理為具有特定時(shí)間窗的前兆模式序列;特征提取主要包括基于物理指標(biāo)的顯式特征以及基于卷積神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)隱式特征提?。灰虼?,提出基于注意力機(jī)制的顯式特征和隱式特征的深度融合方法,并通過(guò)全連接網(wǎng)絡(luò)實(shí)現(xiàn)預(yù)測(cè)模型分類,實(shí)現(xiàn)對(duì)不同沖擊危險(xiǎn)等級(jí)的大能量事件進(jìn)行預(yù)測(cè),并進(jìn)行了方法應(yīng)用及實(shí)踐。
彬長(zhǎng)礦區(qū)某礦主采4 煤層,平均厚度9.43 m,埋深介于800~1 000 m,直接頂為厚度1~4 m 的泥巖,基本頂為厚度約10 m 的細(xì)粒砂巖,上覆多層厚度不等的粗粒砂巖。4 煤層經(jīng)鑒定具有強(qiáng)沖擊傾向性,其頂、底板分別具有弱沖擊傾向性。
該礦生產(chǎn)期間大能量事件頻發(fā),并誘發(fā)過(guò)多起沖擊地壓顯現(xiàn)。如2021-09-29 監(jiān)測(cè)到一起1.6×105J 的微震事件,事件發(fā)生時(shí)地面有明顯震感,井下冒頂范圍可達(dá)55 m,冒頂高度約2 m,頂板錨桿索脫落、崩斷,頂板鋼帶破斷;底板與巷道兩幫無(wú)明顯變形?,F(xiàn)場(chǎng)典型顯現(xiàn)場(chǎng)景如圖1 所示。
圖1 彬長(zhǎng)某礦典型沖擊地壓顯現(xiàn)場(chǎng)景Fig.1 Typical coal burst scene of a coal mine in Binchang mine area
本文研究對(duì)象302 工作面為該礦三盤區(qū)首采工作面,平均埋深約980 m,頂板上方存在多層堅(jiān)硬砂巖頂板。工作面區(qū)域煤層起伏較大,其中部與終采線附近分布有較大幅度的向斜,構(gòu)造應(yīng)力水平較高。僅2020 年11 月—2021 年2 月回采期間就發(fā)生大能量事件(能量大于105J)19 起,大能量震源分布及工作面布置如圖2 所示,綜合柱狀如圖3 所示。
圖2 302 工作面布置Fig.2 Layout of longwall 302
圖3 302 工作面綜合柱狀Fig.3 Synthesis column around lonwall 302
302 工作面自2020 年6 月—2021 年5 月回采期間監(jiān)測(cè)到多次微震事件,各能級(jí)微震事件頻次與能量占比如圖4 所示。工作面回采過(guò)程中能量大于5×104J的事件頻次占比僅為3.81%,而能量占比卻可達(dá)32.67%,可見(jiàn)工作面開(kāi)采應(yīng)力調(diào)整劇烈,大能量事件對(duì)工作面的沖擊危險(xiǎn)性起到重要影響。同時(shí),工作面監(jiān)測(cè)到的大量微震信息可為本文后續(xù)研究提供數(shù)據(jù)基礎(chǔ)。
圖4 302 工作面回采過(guò)程中微震事件頻次及能量占比Fig.4 Microseismic event frequency and energy ratio during the longwall 302 mining
302 工作面回采前采用綜合指數(shù)法及多因素耦合法對(duì)沖擊危險(xiǎn)進(jìn)行了預(yù)評(píng)估。沖擊危險(xiǎn)綜合指數(shù)為0.86,具有強(qiáng)沖擊危險(xiǎn)性;受大采深(采深接近千米)、斷層以及褶曲等地質(zhì)構(gòu)造影響,工作面以中等危險(xiǎn)區(qū)域?yàn)橹鳎⒍嗵幘哂袕?qiáng)沖擊危險(xiǎn)性。為實(shí)時(shí)掌握工作面沖擊危險(xiǎn)程度,指導(dǎo)現(xiàn)場(chǎng)卸壓解危工作,有必要進(jìn)一步開(kāi)展工作面危險(xiǎn)預(yù)警方法研究,尤其應(yīng)提高大能量事件的預(yù)警準(zhǔn)確率。
為實(shí)現(xiàn)對(duì)大能量事件的精準(zhǔn)預(yù)警,本節(jié)首先分析工作面大能量事件發(fā)生前常見(jiàn)物理預(yù)警指標(biāo),如礦震時(shí)間信息熵Qt、礦震活動(dòng)度S、a、b、A(b)、Zmap、礦震活動(dòng)標(biāo)度 ΔF、缺震以及斷層總面積A(t)等[25]指標(biāo)的變化規(guī)律,進(jìn)而對(duì)物理指標(biāo)驅(qū)動(dòng)的沖擊危險(xiǎn)預(yù)警的有效性進(jìn)行分析(震活動(dòng)度S結(jié)合了礦震頻次、礦震最大能量、礦震平均能量和震源分布集中度等常用的指標(biāo),并與震源分布集中度的記憶效應(yīng)相結(jié)合,其值的大小描述了礦震活動(dòng)的強(qiáng)度。A(b)綜合考慮某一時(shí)間段某一區(qū)域內(nèi)礦震事件的能量、頻次和活動(dòng)性等各種因素,直觀定量地對(duì)某一區(qū)域礦震活動(dòng)程度為“增強(qiáng)”或“平靜”做出評(píng)價(jià)。a的大小可以代表礦震活動(dòng)水平的高低,a越大說(shuō)明礦震發(fā)生的頻次越高,礦震活動(dòng)越頻繁。b的大小代表了礦震活動(dòng)強(qiáng)度的高低,b越小,發(fā)生強(qiáng)礦震的可能性就越大,發(fā)生沖擊地壓的可能性也越大)。
如圖5 所示,選取2020 年11 月—2021 年2 月期間的微震數(shù)據(jù)進(jìn)行分析,分別計(jì)算了該時(shí)間段19 次大能量事件發(fā)生前上述9 個(gè)指標(biāo)的變化情況(計(jì)算時(shí)間窗口與滑移步長(zhǎng)為1 d,大能量震源分布如圖2 所示)。
圖5 大能量事件發(fā)生前后各物理指標(biāo)時(shí)序變化特征Fig.5 Temporal variation characteristics of physical indexes before and after the occurrence of high-energy events
利用物理指標(biāo)變化特征通常從2 方面進(jìn)行預(yù)警(此處分析的時(shí)間窗為3 d,滑移步長(zhǎng)為1 d):①趨勢(shì)預(yù)警,如圖5 中各指標(biāo)存在急劇上升(3 d 內(nèi)指標(biāo)連續(xù)上升)、急劇下降(3 d 內(nèi)指標(biāo)連續(xù)下降)、先升后降(3 d 內(nèi)指標(biāo)先升后降)、先降后升(3 d 內(nèi)指標(biāo)先降后升)等情況;實(shí)際應(yīng)用過(guò)程中根據(jù)大能量事件發(fā)生前各指標(biāo)“異常變化趨勢(shì)”開(kāi)展分析預(yù)警。②閾值預(yù)警,通過(guò)大能量事件發(fā)生前各指標(biāo)所達(dá)到的閾值進(jìn)行預(yù)警,如圖5中各指標(biāo)存在局部極值的情況,實(shí)際應(yīng)用過(guò)程中可通過(guò)各指標(biāo)值的“局部極值”是否超過(guò)閾值進(jìn)行預(yù)警。
通過(guò)及時(shí)總結(jié)各物理指標(biāo)的變化規(guī)律,可有效改善沖擊地壓預(yù)警的準(zhǔn)確率。但是僅憑人工進(jìn)行龐大監(jiān)測(cè)數(shù)據(jù)統(tǒng)計(jì),難免工程量巨大。此外,基于人工經(jīng)驗(yàn)對(duì)變化趨勢(shì)、閾值進(jìn)行標(biāo)定時(shí),難免由于個(gè)人經(jīng)驗(yàn)等因素產(chǎn)生非必要的誤差,例如對(duì)指標(biāo)變化趨勢(shì)中“上升”還是“下降”的判斷,若選擇不同的統(tǒng)計(jì)窗口可能會(huì)得出完全相左的結(jié)果;此外,沖擊危險(xiǎn)程度不同,大能量事件發(fā)生前各指標(biāo)的變化速率也顯著不同,憑人工進(jìn)行判斷勢(shì)必會(huì)產(chǎn)生誤差,而通過(guò)統(tǒng)計(jì)方法計(jì)算時(shí)不同的時(shí)間窗口也會(huì)產(chǎn)生差異。對(duì)采用“閾值”進(jìn)行預(yù)警而言,同樣存在采用統(tǒng)計(jì)方法與統(tǒng)計(jì)窗口的不同,可產(chǎn)生誤差甚至導(dǎo)致預(yù)警失敗。
為進(jìn)一步分析采用“趨勢(shì)”法進(jìn)行大能量事件預(yù)警的有效性。對(duì)圖5 中19 次大能量事件發(fā)生前各物理指標(biāo)的變化率、當(dāng)日預(yù)警值、前3 d 最大值以及變化趨勢(shì)進(jìn)行了統(tǒng)計(jì)(缺震只包含1 和0 兩種結(jié)果,此處不做統(tǒng)計(jì)),各指標(biāo)變化趨勢(shì)的統(tǒng)計(jì)分布如圖6 右軸與上軸所示。
圖6 大能量事件發(fā)生前后各物理指標(biāo)變化統(tǒng)計(jì)特征Fig.6 Statistical characteristics of physical index changes before and after high-energy events
如圖6 所示,各物理指標(biāo)的4 類變化特征在大能量事件發(fā)生之前存在明顯的規(guī)律性。以圖6(a)為例,大能量事件發(fā)生前Zmap的4 類指標(biāo)變化特征的概率分布存在較為明顯的集中分布特征,如當(dāng)日預(yù)警值與變化率的概率峰值集中在0.3 與0.4 左右,前3 d 最大值與變化趨勢(shì)的概率峰值均集中在0.4 附近;通過(guò)統(tǒng)計(jì)其他7 類指標(biāo)(圖6(b)~(h))也均可獲得類似的統(tǒng)計(jì)特征。
理論上,通過(guò)統(tǒng)計(jì)各類指標(biāo)的變化特征可對(duì)大能量事件進(jìn)行預(yù)警。但其實(shí)不然,主要原因有:①各指標(biāo)變化特征的概率分布雖具有明顯的集中分布特征,但是集中度并不十分突出,如圖6(c)中S的當(dāng)日預(yù)警值與變化率概率分布曲線較為平緩,在實(shí)際判斷過(guò)程中可能難以得出準(zhǔn)確的預(yù)警值;②由于各物理指標(biāo)往往基于一定的物理含義,不同地質(zhì)與采掘環(huán)境下指標(biāo)的敏感性可能存在差異,而井下采掘過(guò)程中條件復(fù)雜,孕災(zāi)環(huán)境多變,這會(huì)導(dǎo)致物理指標(biāo)預(yù)警的敏感性顯著不同,以本文302 工作面各物理指標(biāo)統(tǒng)計(jì)特征為例(圖6(a)~(h)),在本工作面開(kāi)采背景下各指標(biāo)的指標(biāo)統(tǒng)計(jì)特征存在明顯的概率分布差異可證明這一點(diǎn);③井下采掘過(guò)程中微震數(shù)據(jù)時(shí)刻產(chǎn)生,積累了大量的數(shù)據(jù),如何自動(dòng)、高效的獲取物理指標(biāo)的前兆信息也面臨挑戰(zhàn)。
因此,筆者后續(xù)嘗試結(jié)合大數(shù)據(jù)與機(jī)器學(xué)習(xí)方法對(duì)預(yù)警指標(biāo)的前兆信息特征進(jìn)行提取,并提出一種可大規(guī)模處理與實(shí)時(shí)分析的沖擊地壓時(shí)序預(yù)測(cè)方法。
如圖7 所示,本文提出的預(yù)測(cè)方法主要包括3 個(gè)部分:數(shù)據(jù)預(yù)處理、特征提取以及預(yù)測(cè)模型。
圖7 物理指標(biāo)與數(shù)據(jù)融合驅(qū)動(dòng)的沖擊地壓預(yù)測(cè)模型架構(gòu)Fig.7 Coal burst prediction model driven by combined physical index and data characteristics
數(shù)據(jù)預(yù)處理將微震原始數(shù)據(jù)包括發(fā)生時(shí)間、能量以及震源坐標(biāo)等轉(zhuǎn)化為用于模型輸入的前兆模式序列數(shù)據(jù)。具體過(guò)程為首先將原始數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,計(jì)算得到每日的最大能量和平均能量,生成以日為最小單位的時(shí)間序列數(shù)據(jù)。指定前兆模式序列長(zhǎng)度,生成多前兆模式序列及其標(biāo)簽。
特征提取包括知識(shí)驅(qū)動(dòng)的顯式特征提取和數(shù)據(jù)驅(qū)動(dòng)的隱式特征提取。顯式特征是指利用物理指標(biāo)所計(jì)算的相關(guān)指標(biāo),并基于子集搜索方法確定最優(yōu)的顯式特征指標(biāo)組合。隱式特征是指利用深度學(xué)習(xí)方法從海量數(shù)據(jù)中所挖掘的隱藏規(guī)律信息,本文利用卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)隱式特征提取。
預(yù)測(cè)模型包括特征融合和分類網(wǎng)絡(luò)。在特征融合部分,提出了基于注意力機(jī)制的顯式特征和隱式特征的深度融合方法。在分類網(wǎng)絡(luò)部分,通過(guò)全連接網(wǎng)絡(luò)擬合實(shí)現(xiàn)分類,進(jìn)而構(gòu)建沖擊地壓大能量事件預(yù)測(cè)模型。
如圖8 所示,為使數(shù)據(jù)適用于模型的訓(xùn)練和預(yù)測(cè),對(duì)微震原始數(shù)據(jù)包括時(shí)間、能量以及震源坐標(biāo)等進(jìn)行預(yù)處理。
圖8 數(shù)據(jù)預(yù)處理過(guò)程Fig.8 Process of data preprocessing
首先,以固定時(shí)間窗統(tǒng)計(jì)數(shù)據(jù),構(gòu)建時(shí)間序列數(shù)據(jù)集。假設(shè)第i個(gè)時(shí)間窗計(jì)算得到的數(shù)據(jù)記錄為mi,其可以表示為
其中,id為時(shí)間窗編號(hào);emax為時(shí)間窗內(nèi)微震最大能量;emean為時(shí)間窗內(nèi)的微震平均能量;f為時(shí)間窗內(nèi)微震頻次。當(dāng)數(shù)據(jù)被劃分為n個(gè)時(shí)間窗并對(duì)數(shù)據(jù)進(jìn)行遍歷可得時(shí)間數(shù)據(jù)序列數(shù)據(jù)集M=(m0,m1,m2,···,mn-1),進(jìn)一步根據(jù)時(shí)間序列數(shù)據(jù)集M構(gòu)建前兆模式序列,假設(shè)其第i個(gè)前兆模式序列為si,可表示為
其中,p為前兆模式序列長(zhǎng)度;j為采樣步長(zhǎng)。因此,在n個(gè)時(shí)間窗口且n?p的前提下,生成的前兆模式序列集S可表示為
式中,D為前兆模式序列樣本在預(yù)測(cè)時(shí)間范圍為N小時(shí)情況下的前兆模式序列數(shù)量;N為統(tǒng)計(jì)時(shí)長(zhǎng)。
本文的目的是預(yù)測(cè)大能量事件發(fā)生的概率,在利用深度學(xué)習(xí)模型訓(xùn)練之前,需對(duì)不同沖擊危險(xiǎn)等級(jí)的微震能量進(jìn)行定義及標(biāo)記,具體對(duì)應(yīng)關(guān)系見(jiàn)表1。此外,便于后續(xù)模型訓(xùn)練,需建立前兆模式序列集合對(duì)應(yīng)的標(biāo)簽集合T表示為
表1 標(biāo)記的微震能量及其與沖擊危險(xiǎn)的對(duì)應(yīng)關(guān)系Table 1 Labeled microseismic energy and its relation to coal burst risk
其中,ti為前兆模式序列si的標(biāo)簽。將前兆模式序列si未來(lái)N小時(shí)內(nèi)最大能量表示為ei,取值范圍見(jiàn)表1。
3.3.1 物理指標(biāo)的顯式特征提取
顯式特征是基于物理指標(biāo)提取的特征指標(biāo),本文將第2 節(jié)所述9 個(gè)指標(biāo)作為候選集,采用反饋式選擇方法進(jìn)行最優(yōu)指標(biāo)篩選,其主要思想是動(dòng)態(tài)添加指標(biāo),具體利用已有微震數(shù)據(jù)計(jì)算不同指標(biāo)添加后的模型精度,根據(jù)精度判斷該指標(biāo)集合是否最優(yōu),步驟如下:給定微震指標(biāo)集合 {a1,a2,···,am},將每個(gè)指標(biāo)看作一個(gè)候選子集,對(duì)m個(gè)候選指標(biāo)子集分別進(jìn)行評(píng)價(jià),假定第1 輪最優(yōu)候選集是{a2},則將其作為第1 輪選定集;后續(xù)在該選定集中加入一個(gè)指標(biāo),構(gòu)成了包含2個(gè)指標(biāo)的候選子集,假定這m-1 個(gè)候選子集中{a2,a5}最優(yōu),則將其作為第2 輪選定集;直到r+1 輪,最優(yōu)候選子集精度低于上一輪,則將第r輪指標(biāo)集合做為最終的特征選擇結(jié)果。在本研究中,一個(gè)特征子集優(yōu)劣的評(píng)價(jià)標(biāo)準(zhǔn)是特征子集在不同數(shù)據(jù)集和不同采樣方法上的模型平均準(zhǔn)確率。反饋式微震指標(biāo)選擇機(jī)制解決了微震指標(biāo)選擇問(wèn)題,一定程度上提高了模型預(yù)測(cè)準(zhǔn)確率。
依據(jù)“反饋式選擇”的思路,筆者選擇預(yù)測(cè)時(shí)長(zhǎng)為3 d,選用樣本訓(xùn)練集和測(cè)試集樣本數(shù)量比為1 919∶822,選用模型參數(shù)見(jiàn)表5,依次對(duì)不同物理指標(biāo)組合預(yù)測(cè)的F1(計(jì)算公式見(jiàn)式(9),試驗(yàn)結(jié)果見(jiàn)表2)進(jìn)行了比較,筆者發(fā)現(xiàn)使用b、a、A(b)、缺震組成的指標(biāo)組合預(yù)警準(zhǔn)確率較高(F1=0.854),若在此基礎(chǔ)上再增添指標(biāo)預(yù)警準(zhǔn)確率上升有限,卻會(huì)大幅增加運(yùn)算時(shí)間,對(duì)實(shí)現(xiàn)該方法的實(shí)時(shí)預(yù)警不利,因此本文將上述4 個(gè)指標(biāo)作為優(yōu)選的顯式特征指標(biāo),其物理含義及計(jì)算方法見(jiàn)表3。
表2 不同物理指標(biāo)組合預(yù)測(cè)的預(yù)測(cè)F1Table 2 F1 values predicted by different physical indicator couples
表3 優(yōu)選的物理指標(biāo)及其含義Table 3 Physical indicators and their meanings
3.3.2 數(shù)據(jù)驅(qū)動(dòng)的隱式特征提取
本文提出基于深度學(xué)習(xí)的隱式特征提取方法,該方法利用深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)隱式特征提取。卷積神經(jīng)網(wǎng)絡(luò)其隱含層內(nèi)的卷積核參數(shù)共享和層間連接的稀疏性使得卷積神經(jīng)網(wǎng)絡(luò)能夠以較小的計(jì)算量實(shí)現(xiàn)隱式特征提取。本文采用的卷積神經(jīng)網(wǎng)絡(luò)為3 層卷積,總共包含112 個(gè)卷積核,卷積核大小均為3×3,步長(zhǎng)為1,填充為1。經(jīng)過(guò)3 層卷積后進(jìn)行扁平化操作,再通過(guò)一個(gè)線性層,即可輸出1 000 維度的隱式特征向量,該向量即為本文所要提取的隱式特征。
基于3.2 節(jié)創(chuàng)建的訓(xùn)練數(shù)據(jù)集,可建立目標(biāo)函數(shù),利用反向傳播算法進(jìn)行網(wǎng)絡(luò)權(quán)重的更新,使得目標(biāo)函數(shù)損失最小化,從而生成預(yù)測(cè)模型。訓(xùn)練完的模型用于大能量事件預(yù)測(cè),即輸入前兆模式序列,用于預(yù)測(cè)未來(lái)一段時(shí)間內(nèi)發(fā)生大能量事件的等級(jí)。本文任務(wù)屬于時(shí)間序列分類任務(wù),其輸入是前Nd 的礦震數(shù)據(jù),輸出為(N+1)d 的沖擊地壓等級(jí)。模型整體網(wǎng)絡(luò)架構(gòu)如圖9 所示,包括特征提取、特征融合、分類網(wǎng)絡(luò)3 部分。
圖9 預(yù)測(cè)模型網(wǎng)絡(luò)架構(gòu)Fig.9 Network architecture for prediction model
3.4.1 特征融合
在預(yù)測(cè)模型中,需將顯式特征和隱式特征進(jìn)行深度融合。由于顯示特征和隱式特征的復(fù)雜性和異構(gòu)性,導(dǎo)致簡(jiǎn)單的加權(quán)特征融合方法并不適用,因此本文利用深度學(xué)習(xí)中的注意力機(jī)制法實(shí)現(xiàn)特征融合,并實(shí)現(xiàn)顯式特征和隱式特征內(nèi)每個(gè)維度的加權(quán)。
如圖10 所示,首先,將顯式特征Fe和隱式特征Fi進(jìn)行合并,從而得到初始特征向量Fs,有
圖10 預(yù)測(cè)模型中顯式與隱式特征融合示意Fig.10 Schematic of explicit and implicit feature fusion in prediction model
式中,⊙為哈達(dá)瑪積,融合后的特征用于后續(xù)分類網(wǎng)絡(luò)輸入。
3.4.2 分類網(wǎng)絡(luò)
預(yù)測(cè)模型中的分類網(wǎng)絡(luò)包括一個(gè)全連接層和一個(gè)激活函數(shù),在深度學(xué)習(xí)中,全連接層起到分類器的作用,其可以將學(xué)到的分布式特征表示映射到樣本標(biāo)記空間中,本模型中全連接層由2 000 個(gè)神經(jīng)元組成。然后,利用激活函數(shù)進(jìn)行歸一化處理,得到每個(gè)類別的概率,概率最大的類別即為輸出類別,即發(fā)生該能量區(qū)間(表1)的大能量事件概率最大。
3.4.3 模型訓(xùn)練
考慮到實(shí)際數(shù)據(jù)中大能量事件發(fā)生的次數(shù)較少,導(dǎo)致標(biāo)簽為小能量事件的數(shù)據(jù)遠(yuǎn)多于大能量事件,進(jìn)一步導(dǎo)致訓(xùn)練數(shù)據(jù)集樣本不平衡。若使用傳統(tǒng)的深度學(xué)習(xí)模型訓(xùn)練方法,則會(huì)導(dǎo)致模型在分類時(shí)偏向?qū)W習(xí)樣本較多的一類。針對(duì)該問(wèn)題,本文采用“再放縮”的思想,在訓(xùn)練過(guò)程中,模型根據(jù)批樣本和總體樣本的分布情況,動(dòng)態(tài)調(diào)整各類別在計(jì)算損失的權(quán)重。在網(wǎng)絡(luò)訓(xùn)練中,使用加權(quán)交叉熵?fù)p失函數(shù)計(jì)算模型的損失,進(jìn)而不斷更新神經(jīng)網(wǎng)絡(luò)模型中的參數(shù),使得模型在訓(xùn)練數(shù)據(jù)集上的損失最小化。此外,在沖擊地壓預(yù)測(cè)過(guò)程中,本文在損失函數(shù)中添加了各類別的學(xué)習(xí)權(quán)重z0和z1,通過(guò)調(diào)整大能量事件的學(xué)習(xí)權(quán)重,使得該模型可以更偏向大能量樣本的預(yù)測(cè),以降低大能量事件的漏報(bào)率。本文的加權(quán)交叉熵?fù)p失L可表示為
其中,Li為第i個(gè)前兆模式序列的損失;N為前兆模式序列數(shù)量;M為能量等級(jí)類別數(shù)量;zc為類別c的學(xué)習(xí)權(quán)重;wc為類別c的樣本分布權(quán)重,若第i個(gè)前兆模式序列的標(biāo)簽為c,則yic=1,否則yic=0;pic為觀測(cè)樣本i為類別c的預(yù)測(cè)概率;W為所有類別樣本的權(quán)重之和;yic為真實(shí)樣本類別概率分布,即若第i個(gè)前兆模式序列的標(biāo)簽為c,則yic=1,否則yic=0。上述方法有效改善了微震數(shù)據(jù)不平衡的問(wèn)題,加快了模型收斂速度,并提高了模型預(yù)測(cè)準(zhǔn)確率。此外,通過(guò)深度學(xué)習(xí)中常用的“dropout”方法來(lái)避免模型過(guò)擬合問(wèn)題。
本實(shí)驗(yàn)利用混淆矩陣記錄模型預(yù)測(cè)結(jié)果(表4)。對(duì)于每個(gè)類別,若實(shí)際情況為真,且預(yù)測(cè)為真,則記作TP(True Positive);若實(shí)際情況為真,且預(yù)測(cè)為假,則記為FN(False Negative)。若實(shí)際情況為假,且預(yù)測(cè)為假,則記TN(True Negative);若實(shí)際情況為假,且預(yù)測(cè)為真,則記為FP(False Positive)。
表4 記錄預(yù)測(cè)結(jié)果的混淆矩陣Table 4 Confusion matrix of the predicted results
在模型評(píng)估中,本文使用F1作為評(píng)估指標(biāo)。F1能綜合考慮查準(zhǔn)率(Precision)和召回率(Recall),計(jì)算公式為
式中,Pr和Re分別為查準(zhǔn)率和召回率,計(jì)算方法為
圖11 為302 工作面2020-11-01—2021-03-01回采期間微震日最大能量分布情況,受復(fù)雜采掘環(huán)境等因素影響,工作面多數(shù)情況下處于中等沖擊危險(xiǎn)狀態(tài),甚至局部時(shí)間段頻繁發(fā)生105J 以上的大能量事件。一方面說(shuō)明在302 工作面實(shí)施大能量事件預(yù)測(cè)的必要性,另一方面豐富的數(shù)據(jù)可滿足預(yù)警模型訓(xùn)練的需要。以該時(shí)間段共131 d 的微震數(shù)據(jù)為樣本進(jìn)行訓(xùn)練和測(cè)試,具體將數(shù)據(jù)以7∶3 的比例進(jìn)行隨機(jī)劃分,生成訓(xùn)練集和測(cè)試集。在預(yù)測(cè)未來(lái)1、2、3 d 情況下,生成的訓(xùn)練集和測(cè)試集樣本數(shù)量比分別為1 952∶836、1 936∶829、1 919∶822。后續(xù)在預(yù)警效能分析時(shí)采用訓(xùn)練集數(shù)據(jù)完成模型訓(xùn)練后,使用預(yù)警模型對(duì)測(cè)試集中的大能量事件進(jìn)行預(yù)測(cè)以檢驗(yàn)預(yù)測(cè)模型的有效性。數(shù)據(jù)預(yù)處理參數(shù)設(shè)置見(jiàn)表5。設(shè)置模型訓(xùn)練時(shí)的批大小為16,最大訓(xùn)練輪次為130,學(xué)習(xí)率為0.000 1。不同預(yù)測(cè)實(shí)驗(yàn)中訓(xùn)練集與測(cè)試集的目標(biāo)函數(shù)損失變化如圖12 所示,實(shí)驗(yàn)過(guò)程中當(dāng)目標(biāo)函數(shù)損失連續(xù)20 輪不降低或者F1連續(xù)20 輪不上升即停止訓(xùn)練。
表5 數(shù)據(jù)預(yù)處理參數(shù)取值Table 5 Parameter value of warning model
圖11 302 工作面2020-11-01—2021-03-01 回采期間日最大能量分布Fig.11 Maximum daily energy distribution during longwall 302 retreat from 2020-11-01 to 2021-03-01
沖擊地壓危險(xiǎn)實(shí)時(shí)預(yù)測(cè)有助于保障人員及時(shí)撤出,災(zāi)情及時(shí)處理及指導(dǎo)卸壓防控措施等。因此,預(yù)測(cè)沖擊地壓或大能量事件何時(shí)、何地以及能級(jí)大小便是關(guān)鍵所在。針對(duì)預(yù)測(cè)沖擊地壓危險(xiǎn)“何時(shí)”發(fā)生,為驗(yàn)證本文提出的融合驅(qū)動(dòng)的沖擊地壓預(yù)測(cè)方法的預(yù)測(cè)效能,采用訓(xùn)練完成的預(yù)測(cè)模型對(duì)未來(lái)一定時(shí)間內(nèi)(預(yù)測(cè)1、2 及3 d)的大能量事件進(jìn)行預(yù)測(cè),并采用混淆矩陣分析其F1,預(yù)測(cè)結(jié)果的混淆矩陣以及F1見(jiàn)表6~8。
表6 預(yù)測(cè)未來(lái)1 d 的預(yù)測(cè)結(jié)果混淆矩陣Table 6 Predicted results in the future one day
表8 預(yù)測(cè)未來(lái)3 d 的預(yù)測(cè)結(jié)果混淆矩陣Table 8 Predicted results in the future three day
由表6~8 可知,預(yù)測(cè)實(shí)驗(yàn)F1最高可達(dá)0.956,最低為0.854,可見(jiàn)本模型對(duì)沖擊危險(xiǎn)的預(yù)測(cè)效果較好。因此,現(xiàn)場(chǎng)選用本模型進(jìn)行預(yù)測(cè)時(shí),可根據(jù)現(xiàn)場(chǎng)危險(xiǎn)情況(采用綜合指數(shù)法等可提前預(yù)估采掘工作面整體沖擊危險(xiǎn)等級(jí))確定預(yù)測(cè)時(shí)長(zhǎng):若提前預(yù)測(cè)采掘工作面沖擊危險(xiǎn)等級(jí)較高,例如本文實(shí)驗(yàn)的302 工作面,大能量事件頻發(fā)(圖11),沖擊危險(xiǎn)性較高,需實(shí)施大量的卸壓工程、耗費(fèi)大量時(shí)間,因此需盡量提前預(yù)測(cè)危險(xiǎn),此時(shí)選用預(yù)測(cè)時(shí)長(zhǎng)3 d 為宜;若預(yù)測(cè)現(xiàn)場(chǎng)預(yù)估的整體沖擊危險(xiǎn)等級(jí)較低或者預(yù)估的沖擊危險(xiǎn)等級(jí)較高同時(shí)需采取的卸壓工程量較小時(shí),選用預(yù)測(cè)時(shí)長(zhǎng)1 d 為宜。
通過(guò)本實(shí)驗(yàn)不難發(fā)現(xiàn),在工作面采掘過(guò)程中可保證微震數(shù)據(jù)正常采集情況下,使用本模型可有效預(yù)測(cè)沖擊地壓危險(xiǎn);未來(lái)在此基礎(chǔ)上,筆者將進(jìn)一步開(kāi)展實(shí)驗(yàn),以探求本模型在預(yù)測(cè)時(shí)長(zhǎng)更短時(shí)能否精準(zhǔn)預(yù)測(cè)危險(xiǎn)的可能性。在此過(guò)程中,需保證模型在微震數(shù)據(jù)不足的情況下獲得較好的訓(xùn)練結(jié)果,擬解決的途徑主要有:①試驗(yàn)本模型在小樣本情況下的適應(yīng)性,適時(shí)調(diào)整參數(shù),以期獲得較好的訓(xùn)練結(jié)果;②通過(guò)云平臺(tái)等建立沖擊地壓事件數(shù)據(jù)庫(kù),采用大批量的模型調(diào)整模型參數(shù),使預(yù)測(cè)模型具有更強(qiáng)的泛化能力;③研究基于遷移學(xué)習(xí)的模型泛化方法,使模型具有較強(qiáng)的自適應(yīng)及調(diào)整能力,實(shí)現(xiàn)模型參數(shù)的及時(shí)更新迭代與調(diào)整。
為進(jìn)一步評(píng)估模型總體性能,本節(jié)進(jìn)行工程應(yīng)用測(cè)試。實(shí)驗(yàn)設(shè)計(jì)思路如下:①利用302 工作面前110 d的數(shù)據(jù)訓(xùn)練初始模型,然后預(yù)測(cè)第111~113 天內(nèi)發(fā)生各能量等級(jí)事件的概率;②模擬時(shí)間推移1 d,對(duì)模型進(jìn)行訓(xùn)練并更新,具體采用前111 d 的數(shù)據(jù)重新訓(xùn)練,預(yù)測(cè)第112~114 天內(nèi)發(fā)生各能量等級(jí)事件的概率;③再模擬時(shí)間推移1 d,對(duì)模型再進(jìn)行更新,利用前112 d 的數(shù)據(jù)重新訓(xùn)練,預(yù)測(cè)第113~115 天內(nèi)的沖擊危險(xiǎn)性;以此類推,共進(jìn)行了50 次模擬預(yù)測(cè)。由表9 可知,在2021-02-27—2021-04-17 這50 d 內(nèi),302 共發(fā)生6 起105J 以上的大能量事件。對(duì)比實(shí)際與預(yù)測(cè)危險(xiǎn)等級(jí)不難發(fā)現(xiàn),本模型通過(guò)每日訓(xùn)練更新迭代后準(zhǔn)確預(yù)測(cè)了6 起大能量事件中的5 起,將另外1 起具有強(qiáng)沖擊危險(xiǎn)性的大能量事件預(yù)測(cè)為中等沖擊危險(xiǎn)。為進(jìn)一步對(duì)模型的工程應(yīng)用效果進(jìn)行分析,統(tǒng)計(jì)了50 d 模擬預(yù)測(cè)結(jié)果中誤差分布(圖13),不難發(fā)現(xiàn)50 次預(yù)測(cè)中26 次預(yù)測(cè)結(jié)果準(zhǔn)確,20 次預(yù)測(cè)結(jié)果為誤差1 級(jí)(例如實(shí)際危險(xiǎn)等級(jí)為弱而預(yù)測(cè)等級(jí)為中等,兩者相差1 級(jí)),僅有4 次預(yù)測(cè)結(jié)果誤差等級(jí)可達(dá)2 級(jí)。工程應(yīng)用結(jié)果表明本融合驅(qū)動(dòng)預(yù)測(cè)模型可對(duì)強(qiáng)沖擊危險(xiǎn)尤其是大能量事件提前預(yù)測(cè),進(jìn)而為針對(duì)性防控措施的制定提供重要參考。
表9 工程應(yīng)用中實(shí)際與預(yù)測(cè)危險(xiǎn)等級(jí)對(duì)比Table 9 Comparison of actual and predicted risk levels in engineering applications
圖13 工程應(yīng)用中預(yù)測(cè)結(jié)果誤差分布Fig.13 Error distribution of prediction results in engineering applications
(1)通過(guò)實(shí)例分析了物理指標(biāo)驅(qū)動(dòng)用于沖擊地壓危險(xiǎn)預(yù)測(cè)的不足與短板。結(jié)果表明物理指標(biāo)主要利用沖擊危險(xiǎn)來(lái)臨前各物理指標(biāo)的異常變化進(jìn)行預(yù)警,如典型的“趨勢(shì)法”與“閾值法”,而2 者的概率分布特征分析表明難以得出明顯的統(tǒng)計(jì)特征;各物理指標(biāo)往往僅適用于特定采掘條件,模型泛化與跨場(chǎng)景預(yù)測(cè)效率較差;物理指標(biāo)往往通過(guò)特定統(tǒng)計(jì)數(shù)據(jù)得出,難以結(jié)合大數(shù)據(jù)分析技術(shù)進(jìn)行模型更新及實(shí)時(shí)分析。
(2)提出物理指標(biāo)與數(shù)據(jù)特征融合驅(qū)動(dòng)的預(yù)測(cè)模型。預(yù)測(cè)模型包括數(shù)據(jù)預(yù)處理、特征提取以及預(yù)測(cè)模型融合。數(shù)據(jù)預(yù)處理將原有微震監(jiān)測(cè)數(shù)據(jù)處理為具有特定時(shí)間窗的前兆模式序列;特征提取主要包括基于物理指標(biāo)的顯式特征以及基于卷積神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)隱式特征提??;提出基于注意力機(jī)制的顯式特征和隱式特征的深度融合方法,并通過(guò)全連接網(wǎng)絡(luò)實(shí)現(xiàn)預(yù)測(cè)模型分類,實(shí)現(xiàn)對(duì)不同沖擊危險(xiǎn)等級(jí)的大能量事件進(jìn)行預(yù)測(cè)。
(3)采用混淆矩陣對(duì)預(yù)測(cè)結(jié)果進(jìn)行分析,預(yù)測(cè)實(shí)驗(yàn)結(jié)果表明預(yù)測(cè)時(shí)長(zhǎng)為未來(lái)1 d、未來(lái)2 d 以及未來(lái)3 d時(shí)預(yù)測(cè)F1分別可達(dá)0.956、0.950、0.854,現(xiàn)場(chǎng)可根據(jù)需求選用預(yù)測(cè)時(shí)長(zhǎng);工程應(yīng)用結(jié)果表明融合驅(qū)動(dòng)模型可對(duì)大能量事件準(zhǔn)確預(yù)測(cè),誤差分析結(jié)果表明模型預(yù)測(cè)準(zhǔn)確率較高,可滿足現(xiàn)場(chǎng)需求。
煤巖動(dòng)力災(zāi)害的智能化預(yù)測(cè)是煤礦智能化建設(shè)的重要組成部分,而機(jī)器學(xué)習(xí)與大數(shù)據(jù)技術(shù)是實(shí)現(xiàn)智能化預(yù)測(cè)與提高預(yù)測(cè)準(zhǔn)確率的關(guān)鍵所在。本文提出的基于物理指標(biāo)與數(shù)據(jù)特征融合驅(qū)動(dòng)的預(yù)測(cè)方法僅是將機(jī)器學(xué)習(xí)技術(shù)用于沖擊地壓危險(xiǎn)預(yù)測(cè)的初步嘗試,經(jīng)筆者粗略總結(jié),未來(lái)仍有面向不同煤礦預(yù)測(cè)模型遷移、小樣本數(shù)據(jù)情況下的機(jī)器學(xué)習(xí)模型構(gòu)建以及多源異構(gòu)數(shù)據(jù)融合等關(guān)鍵技術(shù)問(wèn)題需進(jìn)行攻關(guān)。