陳 結(jié),高靖寬,蒲源源,姜德義,齊慶新,文志杰,孫啟龍,陳林林
( 1.重慶大學(xué) 煤礦災(zāi)害動(dòng)力學(xué)與控制國(guó)家重點(diǎn)實(shí)驗(yàn)室,重慶 400044;2.煤炭科學(xué)研究總院,北京 100013;3.山東科技大學(xué),山東 青島 266590;4.中科院重慶綠色智能技術(shù)研究院,重慶 400714;5.河南大有能源股份有限公司 耿村煤礦,河南 三門峽 472300 )
沖擊地壓( 非煤礦山和其他地下工程也稱為巖爆 )是煤礦開(kāi)采中一種常見(jiàn)的地質(zhì)災(zāi)害,是在煤巖體的應(yīng)力集聚超過(guò)其強(qiáng)度極限時(shí),瞬間、突然、猛烈地釋放出彈性能,導(dǎo)致煤巖體瞬時(shí)破壞并伴有煤巖體大量噴射,造成人員傷亡和設(shè)備損毀的一種現(xiàn)象[1-6]。加拿大、美國(guó)、德國(guó)、澳大利亞等世界上大部分的采礦國(guó)家都有發(fā)生過(guò)沖擊地壓的記錄。在加拿大,15余座礦山發(fā)生過(guò)沖擊地壓,包括Brunswick鉛鋅礦、Macassa金礦、Diavik鉆石礦等[7]。在美國(guó),沖擊地壓事件也有大量的記錄,僅1936—1993年,美國(guó)的礦井發(fā)生沖擊地壓事件約172起,共造成78人死亡和約160人受傷[8-9]。近年來(lái),由于德國(guó)煤礦的逐漸關(guān)閉,德國(guó)礦井的沖擊地壓事件已大幅減少,但在1983—2007年,仍然有超過(guò)40起導(dǎo)致人員傷亡的沖擊地壓事件發(fā)生[10]。澳大利亞是世界上沖擊地壓災(zāi)害最嚴(yán)重的地區(qū)之一,其第1起有記錄的沖擊地壓事件于1917年發(fā)生在Golden Mile的金礦開(kāi)采中,迄今為止,已有超過(guò)100起導(dǎo)致人員傷亡的沖擊地壓事件發(fā)生[11]。其他包括南非、波蘭、巴西等國(guó)家也有因沖擊地壓帶來(lái)人員傷亡的記錄。
在我國(guó),隨著煤礦開(kāi)采深度的逐漸增加,沖擊地壓已經(jīng)成為煤礦開(kāi)采特別是深部礦井開(kāi)采中面臨的主要地質(zhì)災(zāi)害[12]。我國(guó)第1次有記錄的沖擊地壓事件是1933年發(fā)生在遼寧撫順勝利煤礦的沖擊地壓事件。目前,沖擊地壓事件已遍布我國(guó)各大礦務(wù)局,僅2004—2014年,我國(guó)就有超過(guò)35起導(dǎo)致人員傷亡的沖擊地壓發(fā)生,超過(guò)300名礦工身亡和超過(guò)1 000名礦工受傷[13]。其中,2011年11月發(fā)生在義馬礦務(wù)局千秋煤礦的沖擊地壓事件,共造成10名礦工死亡,超過(guò)60人受傷。沖擊地壓已經(jīng)成為制約我國(guó)煤礦高效安全生產(chǎn)的主要災(zāi)害。圖1( a )為1995—2000年世界范圍內(nèi)的沖擊地壓分布[14],圖1( b )為我國(guó)沖擊地壓礦井?dāng)?shù)量的變化趨勢(shì)( 中國(guó)能源統(tǒng)計(jì)年鑒2013 )。
圖1 世界范圍內(nèi)沖擊地壓分布和我國(guó)沖擊地壓礦井?dāng)?shù)Fig.1 Rockburst maps all of the worlds and the number of domestically impacted underground pressure mines in China
沖擊地壓的研究主要集中在3個(gè)方面:① 沖擊地壓的發(fā)生機(jī)理;② 沖擊地壓的預(yù)測(cè)預(yù)警和方法;③ 沖擊地壓的控制措施。其中,沖擊地壓的準(zhǔn)確預(yù)測(cè)預(yù)警不僅可以為人員以及設(shè)備的撤出贏得寶貴時(shí)間,也可以有效地控制沖擊地壓的發(fā)生,因而成為目前沖擊地壓研究的一個(gè)重點(diǎn)和熱點(diǎn)。
沖擊地壓的預(yù)測(cè)預(yù)警包括長(zhǎng)期預(yù)測(cè)和短期實(shí)時(shí)預(yù)警。長(zhǎng)期預(yù)測(cè)主要針對(duì)工程項(xiàng)目的設(shè)計(jì)階段( 如工作面回采之前,回采巷道掘進(jìn)之前 ),對(duì)整個(gè)工程作業(yè)區(qū)域發(fā)生沖擊地壓的可能性進(jìn)行評(píng)估。長(zhǎng)期預(yù)測(cè)覆蓋整個(gè)工程范圍和整個(gè)工期,是宏觀水平上對(duì)沖擊地壓發(fā)生的評(píng)估。短期實(shí)時(shí)預(yù)警則是在工程施工階段,利用實(shí)時(shí)監(jiān)測(cè)手段對(duì)局部范圍內(nèi)( 幾米到數(shù)百米 )短期( 幾小時(shí)到數(shù)天 )發(fā)生沖擊地壓的預(yù)測(cè)。短期實(shí)時(shí)預(yù)警主要回答3個(gè)問(wèn)題:何時(shí)發(fā)生、何地發(fā)生、沖擊等級(jí)。長(zhǎng)期預(yù)測(cè)和短期預(yù)警的結(jié)合是預(yù)防沖擊地壓發(fā)生的有效手段。
沖擊地壓長(zhǎng)期預(yù)測(cè)可以看成沖擊危險(xiǎn)性評(píng)價(jià)的過(guò)程,是結(jié)合煤( 巖 )層的沖擊傾向性和現(xiàn)場(chǎng)地質(zhì)與開(kāi)采技術(shù)條件對(duì)沖擊地壓發(fā)生的可能性進(jìn)行評(píng)估。沖擊傾向性是煤巖體的一種固有屬性,是沖擊地壓長(zhǎng)期預(yù)測(cè)的基礎(chǔ)。但是,具有高沖擊傾向性的煤巖層并不一定會(huì)發(fā)生沖擊地壓,即使發(fā)生,危險(xiǎn)程度也不一樣,其還取決于現(xiàn)場(chǎng)地質(zhì)條件和開(kāi)采方法等。例如,最近10 a,所有發(fā)生過(guò)沖擊地壓的國(guó)內(nèi)礦井中只有75%的礦井是開(kāi)采沖擊傾向性煤層( 29%煤層強(qiáng)沖擊傾向性,8%煤層中等沖擊傾向性,38%煤層弱沖擊傾向性 )[15]。因此,直接用沖擊傾向性對(duì)沖擊地壓進(jìn)行長(zhǎng)期預(yù)測(cè)是不全面的。煤巖體的沖擊傾向性評(píng)價(jià)可以在實(shí)驗(yàn)室中進(jìn)行,國(guó)內(nèi)外學(xué)者提出了一系列的沖擊傾向性評(píng)價(jià)指標(biāo)和相應(yīng)的分類標(biāo)準(zhǔn)。沖擊傾向性評(píng)價(jià)指標(biāo)主要有4大類:能量指標(biāo)、剛度指標(biāo)、脆性指標(biāo)和時(shí)間指標(biāo)[16]。表1列出了一些常用的煤巖體沖擊傾向性評(píng)價(jià)指標(biāo)。
表1 常用的煤巖體沖擊傾向性評(píng)價(jià)指標(biāo)Table 1 Common tendency evaluation index of coal and rock mass
除了利用單一的沖擊傾向性評(píng)價(jià)指標(biāo)進(jìn)行沖擊傾向性的鑒定,通常情況下,沖擊地壓的長(zhǎng)期預(yù)測(cè)還應(yīng)該選取多個(gè)煤巖體傾向性評(píng)價(jià)指標(biāo)進(jìn)行沖擊傾向性的鑒定。例如,2018年8月1日頒布的《防治煤礦沖擊地壓細(xì)則》規(guī)定,鑒定煤層和頂?shù)装鍘r層的沖擊傾向性,需要考慮單軸抗壓強(qiáng)度( σd)、應(yīng)變能指數(shù)( WET)、沖擊能量( KE)和動(dòng)態(tài)破壞時(shí)間( Dt),并且用綜合指數(shù)法確定最終的煤巖體沖擊傾向性。最后,綜合考慮煤巖體的沖擊傾向性和地質(zhì)條件、開(kāi)采方法等進(jìn)行沖擊地壓的長(zhǎng)期預(yù)測(cè)。
沖擊地壓短期預(yù)警主要是在工程施工階段利用地球物理方法監(jiān)測(cè)沖擊地壓的一些前兆信號(hào),對(duì)沖擊地壓的發(fā)生做出預(yù)警。使用的地球物理方法包括電磁法( Electromagnetic radiation method )、微重力法( Micro-gravity method )、熱成像法( Infrared thermal imaging method )和微震監(jiān)測(cè)法( Microseismic monitoring )等,其中微震監(jiān)測(cè)是使用最廣泛的預(yù)警方法之一。通常,一次明顯的、可觀察的沖擊地壓發(fā)生之前會(huì)有若干次微震事件提前發(fā)生,這些事件記錄了巖石破裂和應(yīng)力傳遞的前兆信息。微震監(jiān)測(cè)可以實(shí)時(shí)地確定這些微震事件發(fā)生的時(shí)間、地點(diǎn)和強(qiáng)度,從而對(duì)潛在的沖擊地壓發(fā)生做出推斷[23]。圖2為利用微震監(jiān)測(cè)進(jìn)行沖擊地壓預(yù)警的一般過(guò)程,利用微震監(jiān)測(cè)進(jìn)行短期沖擊地壓預(yù)警有2個(gè)關(guān)鍵步驟:① 識(shí)別正確的微震事件信號(hào)。礦山開(kāi)采和地下工程施工中會(huì)監(jiān)測(cè)到各種信號(hào),包括巖石破裂的聲發(fā)射信號(hào)、爆破信號(hào)、車輛震動(dòng)信號(hào)和電源信號(hào)等,必須從這些干擾信號(hào)中正確地識(shí)別和提取微震信號(hào),才能用于后續(xù)的沖擊地壓預(yù)警分析。② 建立微震參數(shù)和沖擊地壓發(fā)生的時(shí)間、地點(diǎn)和強(qiáng)度之間的關(guān)系。工程中獲得的微震監(jiān)測(cè)信號(hào)包含了許多沖擊地壓發(fā)生的前兆信息,這些信息被各種各樣的監(jiān)測(cè)參數(shù)所表示。通過(guò)提取監(jiān)測(cè)參數(shù)里的有效信息,建立預(yù)測(cè)指標(biāo)與沖擊地壓發(fā)生的時(shí)間、空間和強(qiáng)度關(guān)系是利用微震監(jiān)測(cè)實(shí)時(shí)預(yù)警沖擊地壓的基本思想。通常,微震監(jiān)測(cè)系統(tǒng)收集到的沖擊地壓預(yù)測(cè)指標(biāo)包含3大類:第1類是可以反映煤巖體應(yīng)力狀態(tài)和失穩(wěn)情形的震源參數(shù)( Source parameters ),包括微震能量、地震矩、應(yīng)力降、傳感器觸發(fā)數(shù)量等;第2類是微震波形參數(shù)( Waveform characteristics ),其可以通過(guò)觀察時(shí)域和幅域的地震波得到,主要包括初次峰值幅值、初次峰值到時(shí)、最大峰值幅值、最大峰值到時(shí)等;第3類是從頻域分析所得到的頻譜特征( Spectrum characteristics ),包括微震信號(hào)的主頻等。微震監(jiān)測(cè)系統(tǒng)已經(jīng)廣泛應(yīng)用于國(guó)內(nèi)的礦山開(kāi)采和地下工程建設(shè)[24],如冬瓜山銅礦、三河尖煤礦、錦屏二號(hào)電站地下引水隧洞等。
圖2 利用微震監(jiān)測(cè)進(jìn)行沖擊地壓預(yù)警的一般過(guò)程Fig.2 General process of impact ground pressure warning using microseismic monitoring
在沖擊地壓長(zhǎng)期預(yù)測(cè)中,不論是進(jìn)行煤巖體沖擊傾向性的測(cè)定還是沖擊地壓危險(xiǎn)性評(píng)價(jià),主要采用綜合指數(shù)法,即在考慮各個(gè)沖擊地壓指標(biāo)的基礎(chǔ)上,對(duì)沖擊地壓發(fā)生的可能性進(jìn)行綜合評(píng)估。目前,常用的沖擊地壓長(zhǎng)期預(yù)測(cè)綜合指數(shù)法有模糊邏輯( Fuzzy logic )[5,25-27]法,其先對(duì)沖擊地壓指標(biāo)進(jìn)行單因素評(píng)價(jià),再通過(guò)模糊數(shù)學(xué)建立指標(biāo)的權(quán)重,最后綜合判定沖擊地壓發(fā)生的可能性。其他一些方法也被用來(lái)和模糊邏輯法相結(jié)合使用,如主成分分析( Principe component analysis,PCA )[25]用于在模糊邏輯中確定指標(biāo)權(quán)重、層次分析法( Analytic hierarchy process,AHP )[28-32]等。其余出現(xiàn)在沖擊地壓長(zhǎng)期預(yù)測(cè)里的綜合指數(shù)法有故障樹(shù)( Fault tree )[33]、云模型( Cloud model )[34-35]、模糊物元理論( Fuzzy-matter theory )[26]、灰度理論( Grey system theory )[36-37]等。
對(duì)于絕大多數(shù)綜合指數(shù)法,關(guān)鍵步驟是確定沖擊地壓的指標(biāo)( 包括權(quán)重 )和各指標(biāo)對(duì)應(yīng)的分類標(biāo)準(zhǔn)。通常,這些指標(biāo)為煤巖體沖擊傾向性指標(biāo)( 表1 )和工程現(xiàn)場(chǎng)的應(yīng)力狀態(tài)指標(biāo)( 如埋深、最大切應(yīng)力等 )。這個(gè)關(guān)鍵步驟使得利用綜合指數(shù)法預(yù)測(cè)沖擊地壓有2個(gè)關(guān)鍵缺陷:主觀性( Subjectivity )和不一致性( Inconsistency )。主觀性是指各指標(biāo)對(duì)應(yīng)的分類標(biāo)準(zhǔn)為人為制定,如對(duì)于應(yīng)變能指數(shù)( WET),一個(gè)常用的分類標(biāo)準(zhǔn)是WET≤2.0為無(wú)沖擊傾向性;2.0<WET≤3.5為弱沖擊傾向性;3.5<WET<5.0為中等沖擊傾向性;WET≥5.0 為強(qiáng)沖擊傾向性,但這是KIDYBI?SKI[17]根據(jù)波蘭西里西亞煤田煤層所確定的標(biāo)準(zhǔn),能否無(wú)條件地推廣到其他地方仍值得思考。再者,確定各沖擊地壓指標(biāo)權(quán)重即確定指標(biāo)對(duì)沖擊地壓發(fā)生的影響力大小的過(guò)程依然是一個(gè)主觀過(guò)程。無(wú)論是利用PCA或者AHP,其中都有需要主觀確定的參數(shù),這就導(dǎo)致即使選取同樣的指標(biāo)和同樣的分類標(biāo)準(zhǔn),也有可能得到不同的預(yù)測(cè)結(jié)果。沖擊地壓長(zhǎng)期預(yù)測(cè)是以煤巖體沖擊傾向性為基礎(chǔ),集合工程地質(zhì)條件和施工方法的綜合評(píng)測(cè)( 1.1節(jié) ),所以利用綜合指數(shù)法進(jìn)行長(zhǎng)期預(yù)測(cè)時(shí),所選取的指標(biāo)必須既包括沖擊傾向性指標(biāo)又包括工程地質(zhì)條件指標(biāo)。目前,一些研究只選取沖擊傾向性指標(biāo)對(duì)沖擊地壓進(jìn)行長(zhǎng)期預(yù)測(cè),這是非常不全面的,即所謂的不一致性。
對(duì)于利用微震監(jiān)測(cè)的沖擊地壓短期預(yù)警,2個(gè)關(guān)鍵步驟都涉及到提取微震信號(hào)中的有效信息( 參數(shù) )。在識(shí)別微震事件時(shí),需通過(guò)各個(gè)監(jiān)測(cè)參數(shù)之間的差異來(lái)判斷是否是由于巖石破裂和應(yīng)力轉(zhuǎn)移誘發(fā)的微震事件。在后期進(jìn)行預(yù)警時(shí),需建立監(jiān)測(cè)參數(shù)和沖擊地壓發(fā)生的時(shí)間、地點(diǎn)和強(qiáng)度的關(guān)系。微震監(jiān)測(cè)信號(hào)包含大量信息,人為定義和提取參數(shù)很難反映微震事件的全部特征,極易造成大量的有效信息被忽略。因而,目前的微震監(jiān)測(cè)只能監(jiān)控和反映已經(jīng)和正在發(fā)生的微震事件,對(duì)潛在的可能發(fā)生的微震很難準(zhǔn)確判斷。這也是沖擊地壓短期預(yù)警研究的瓶頸之一。
上述沖擊地壓長(zhǎng)期預(yù)測(cè)和短期預(yù)警研究存在的一些問(wèn)題迫使研究人員尋找新的解決思路,其中利用機(jī)器學(xué)習(xí)( Machine learning )等數(shù)據(jù)驅(qū)動(dòng)方法進(jìn)行沖擊地壓的預(yù)測(cè)預(yù)警有著很好的研究前景。目前,機(jī)器學(xué)習(xí)模型已經(jīng)逐步應(yīng)用到?jīng)_擊地壓長(zhǎng)期預(yù)測(cè)中,并取得了較好的效果。在短期預(yù)警中,也有學(xué)者利用機(jī)器學(xué)習(xí)方法對(duì)微震信號(hào)進(jìn)行識(shí)別。對(duì)于沖擊地壓長(zhǎng)期預(yù)測(cè),機(jī)器學(xué)習(xí)能很好地克服綜合指數(shù)法帶來(lái)的問(wèn)題。首先,機(jī)器學(xué)習(xí)建模過(guò)程不涉及太多的主觀決策,是一個(gè)數(shù)據(jù)驅(qū)動(dòng)的策略。利用機(jī)器學(xué)習(xí)模型,研究人員不用關(guān)注各個(gè)沖擊地壓指標(biāo)的權(quán)重和對(duì)應(yīng)的分類標(biāo)準(zhǔn),只需知道各個(gè)指標(biāo)的具體數(shù)值,而這個(gè)數(shù)值是客觀可度量的。其次,機(jī)器學(xué)習(xí)中的監(jiān)督學(xué)習(xí)( Supervised learning )策略可以考慮不同地區(qū)、不同條件、不同時(shí)間發(fā)生的沖擊地壓歷史數(shù)據(jù),避免了只通過(guò)沖擊地壓指標(biāo)進(jìn)行評(píng)測(cè)。對(duì)于短期預(yù)警,利用機(jī)器學(xué)習(xí)方法分析監(jiān)測(cè)信號(hào)可以最大限度地獲取有效信息,其中的大部分信息是無(wú)法用顯式算法獲得的。在建立監(jiān)測(cè)參數(shù)和沖擊地壓發(fā)生的時(shí)間、地點(diǎn)和強(qiáng)度的關(guān)系上,機(jī)器學(xué)習(xí)方法也有著獨(dú)特的優(yōu)勢(shì)。機(jī)器學(xué)習(xí)方法可以將自動(dòng)監(jiān)測(cè)信號(hào)解析成一個(gè)高維矩陣,無(wú)需人為決定提取參數(shù)的類型,最大限度地保留信號(hào)特征。再者通過(guò)顯式編程或其他方法很難確定一個(gè)從高維矩陣到?jīng)_擊地壓發(fā)生的時(shí)間、地點(diǎn)和強(qiáng)度之間的映射。而許多機(jī)器學(xué)習(xí)方法善于處理高維數(shù)據(jù)之間的映射關(guān)系,如深度學(xué)習(xí)等。
機(jī)器學(xué)習(xí)最早可追溯到20世紀(jì)40年代關(guān)于人工神經(jīng)網(wǎng)絡(luò)( Artificial neural network )的研究。MCCULLOCH W S[38]等提出的神經(jīng)網(wǎng)絡(luò)的層級(jí)模型被認(rèn)為是神經(jīng)網(wǎng)絡(luò)研究的開(kāi)端。ROSENBLATT F[39]提出了感知機(jī)( Perceptron )的概念,其還設(shè)計(jì)了世界上第1個(gè)計(jì)算機(jī)神經(jīng)網(wǎng)絡(luò)模型。感知機(jī)模型成為最早的有實(shí)際應(yīng)用的模型,被IBM公司用于一款射擊游戲程序中。1962年HUBEL和WIESEL[40]通過(guò)對(duì)貓大腦皮層的研究,提出了著名的HW生物視覺(jué)模型( Hubel-Wiesel biological visual model ),該模型可以有效地降低神經(jīng)網(wǎng)絡(luò)的計(jì)算復(fù)雜度,啟發(fā)了接下來(lái)的一系列神經(jīng)網(wǎng)絡(luò)模型的研發(fā)。然而,由于感知機(jī)模型不能解決異或( XOR )分類問(wèn)題,被學(xué)者們懷疑其實(shí)用價(jià)值,神經(jīng)網(wǎng)絡(luò)的研究在整個(gè)20世紀(jì)70年代陷入低潮,直至1985年,RUMELHART和HINTON[41]發(fā)表了著名的有關(guān)反向傳播( Backpropagation )的論文,提出通過(guò)訓(xùn)練誤差反向傳播和增加神經(jīng)網(wǎng)絡(luò)隱藏層來(lái)解決網(wǎng)絡(luò)參數(shù)優(yōu)化問(wèn)題和異或問(wèn)題。此外,BP模型還可以顯著地降低計(jì)算開(kāi)銷。BP模型的問(wèn)世立即重新激活了神經(jīng)網(wǎng)絡(luò)的研究。1989年,LECUN Yann[42]提出了卷積神經(jīng)網(wǎng)絡(luò)模型( Convolutional neural network,CNN ),并為CNN設(shè)計(jì)了基于誤差反向傳播的訓(xùn)練方法。CNN是第1個(gè)大規(guī)模用于工程實(shí)踐的神經(jīng)網(wǎng)絡(luò),至今,CNN仍是計(jì)算機(jī)視覺(jué)領(lǐng)域和自然語(yǔ)言識(shí)別的主要模型。20世紀(jì)90年代后,各種機(jī)器學(xué)習(xí)模型層出不窮,包括決策樹(shù)( Decision tree )[43]、支持向量機(jī)( Support vector machine )[44]、提升學(xué)習(xí)( Boosting )[45]、邏輯回歸( Logistics regression )等。這些機(jī)器學(xué)習(xí)模型大都基于統(tǒng)計(jì)學(xué)習(xí)( Statistical learning )的概念,可以找到模型映射的閉式解,包含有限幾個(gè)隱藏層( 決策樹(shù) )、1個(gè)隱藏層( 支持向量機(jī)、提升學(xué)習(xí) )或者沒(méi)有隱藏層( 邏輯回歸 )。然而,這些模型的學(xué)習(xí)能力有限,不能表示大型復(fù)雜映射和提取大量數(shù)據(jù)特征[46],只是由于這些模型需要數(shù)據(jù)量小,容易訓(xùn)練,才在計(jì)算機(jī)計(jì)算能力不強(qiáng)的時(shí)代占據(jù)了機(jī)器學(xué)習(xí)的主流。隨著計(jì)算機(jī)軟硬件的飛速發(fā)展,計(jì)算能力已不是一個(gè)阻礙機(jī)器學(xué)習(xí)模型訓(xùn)練的障礙。HINTON和SALAKHUTDINOV[47]于2006年提出了深度學(xué)習(xí)( Deep learning )的思想,用多隱層的神經(jīng)網(wǎng)絡(luò)模擬任意復(fù)雜映射。深度學(xué)習(xí)是一種接近人腦運(yùn)作模式的智能學(xué)習(xí)方法,開(kāi)啟了機(jī)器學(xué)習(xí)的新紀(jì)元。借助于云計(jì)算、大數(shù)據(jù)和其他的計(jì)算機(jī)技術(shù),深度學(xué)習(xí)已經(jīng)廣泛應(yīng)用于生活中的各個(gè)領(lǐng)域,包括無(wú)人駕駛、人臉識(shí)別、智能推薦等??梢哉f(shuō),深度學(xué)習(xí)代表了機(jī)器學(xué)習(xí)的未來(lái),在很大程度上決定了人工智能的發(fā)展方向[48]。本文成文之際,文獻(xiàn)[48]的3 位作者,LECUN,HINTON和BENGIO共同獲得了2018年度計(jì)算機(jī)領(lǐng)域的最高獎(jiǎng)——圖靈獎(jiǎng)。借此文向3位機(jī)器學(xué)習(xí)的先驅(qū)者致敬。圖3簡(jiǎn)要說(shuō)明了機(jī)器學(xué)習(xí)的發(fā)展簡(jiǎn)史。
圖3 機(jī)器學(xué)習(xí)發(fā)展簡(jiǎn)史Fig.3 A brief history of machine learning development
機(jī)器學(xué)習(xí)的基本思想是讓計(jì)算機(jī)從過(guò)往經(jīng)驗(yàn)和歷史數(shù)據(jù)中獲得學(xué)習(xí)能力,從而對(duì)未知事物做出推斷。大多數(shù)出現(xiàn)在沖擊地壓長(zhǎng)期預(yù)測(cè)中的機(jī)器學(xué)習(xí)模型都是監(jiān)督學(xué)習(xí)模型,即模型用帶標(biāo)簽的數(shù)據(jù)進(jìn)行訓(xùn)練。圖4為利用監(jiān)督學(xué)習(xí)建模的一般步驟。
圖4 監(jiān)督學(xué)習(xí)的一般建模步驟Fig.4 General modeling steps for supervised learning
神經(jīng)網(wǎng)絡(luò)模型已成為利用機(jī)器學(xué)習(xí)方法進(jìn)行沖擊地壓長(zhǎng)期預(yù)測(cè)的常用模型。只含1個(gè)隱藏層的神經(jīng)網(wǎng)絡(luò)就可以以任意精度逼近已知函數(shù)[49],該特點(diǎn)保證了神經(jīng)網(wǎng)絡(luò)在處理類似沖擊地壓指標(biāo)和沖擊地壓強(qiáng)度的關(guān)系這種非線性任務(wù)時(shí)具有很好的適應(yīng)性。在沖擊地壓長(zhǎng)期預(yù)測(cè)中出現(xiàn)的神經(jīng)網(wǎng)絡(luò)是多層感知機(jī)( Multi-layer perceptron )而非深度學(xué)習(xí)模型。除了一些最普通的反向傳播神經(jīng)網(wǎng)絡(luò)模型外[50-57],其他的具有特殊適應(yīng)性的特殊網(wǎng)絡(luò)模型也被研究者用來(lái)進(jìn)行沖擊地壓長(zhǎng)期預(yù)測(cè),包括廣義回歸神經(jīng)網(wǎng)絡(luò)( Generalized regression neural network,GRNN )和徑向基神經(jīng)網(wǎng)絡(luò)( Radial basis function network,RBF )[58]。如GRNN模型超參數(shù)最少,因?yàn)槠浣Y(jié)構(gòu)在訓(xùn)練數(shù)據(jù)集被確定時(shí)就自然確定。因此,GRNN需要的訓(xùn)練樣本數(shù)較少。然而,這些特點(diǎn)不一定總能提升模型的預(yù)測(cè)性能,因?yàn)槟軌蛘业降臎_擊地壓長(zhǎng)期預(yù)測(cè)任務(wù)的訓(xùn)練樣本很少( 通常小于300個(gè) )。
支持向量機(jī)也是被廣泛使用的模型[59-62]。因其建模思想是基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化( Minimize structural risk ),因此,支持向量機(jī)比神經(jīng)網(wǎng)絡(luò)的泛化能力( Generalization ability )更強(qiáng)。但是,研究者多把支持向量機(jī)當(dāng)做神經(jīng)網(wǎng)絡(luò)的一個(gè)替代模型,而不是真正考慮其模型泛化能力。支持向量機(jī)模型中含有一些超參數(shù),會(huì)極大地影響模型的性能,如核函數(shù)類型、軟間隔( C )、寬度參數(shù)( gamma,僅在Gaussian核函數(shù)中 )。文獻(xiàn)[63]比較了4種核函數(shù)類型,并利用徑向基核函數(shù)進(jìn)行建模。該文獻(xiàn)還利用網(wǎng)格搜索確定超參數(shù)C和gamma。文獻(xiàn)[61]用啟發(fā)式算法( 基因算法和粒子群算法 )優(yōu)化支持向量機(jī)模型中的超參數(shù)。啟發(fā)式算法加快了模型的收斂速度,獲得了良好的表現(xiàn)。
其他用在沖擊地壓長(zhǎng)期預(yù)測(cè)中的機(jī)器學(xué)習(xí)模型包括K近鄰法( K-nearest neighbor )[64]、隨機(jī)森林( Random forest )[65]、提升學(xué)習(xí)( Adaboost )[66]等。然而,大多數(shù)研究都沿用一種固定模式,即選擇一種機(jī)器學(xué)習(xí)模型,在其中添加某些特殊算法用于模型超參數(shù)優(yōu)化。鮮有研究考慮沖擊地壓長(zhǎng)期預(yù)測(cè)的特殊性而對(duì)模型進(jìn)行針對(duì)性調(diào)整。文獻(xiàn)[67]為此做了很好的嘗試,利用改進(jìn)的決策樹(shù)模型進(jìn)行沖擊地壓長(zhǎng)期預(yù)測(cè)。該模型可以使用有缺失特征的數(shù)據(jù)進(jìn)行訓(xùn)練,非常符合該任務(wù)的數(shù)據(jù)集特點(diǎn)。
目前來(lái)看,利用機(jī)器學(xué)習(xí)模型進(jìn)行沖擊地壓長(zhǎng)期預(yù)測(cè)的研究中存在4個(gè)值得深入探討的問(wèn)題。
( 1 ) 訓(xùn)練樣本少( Limited database )
作為一種數(shù)據(jù)驅(qū)動(dòng)的方法,機(jī)器學(xué)習(xí)需要足夠的高質(zhì)量數(shù)據(jù)來(lái)確保模型訓(xùn)練過(guò)程中的參數(shù)有效更新。沖擊地壓長(zhǎng)期預(yù)測(cè)任務(wù)的訓(xùn)練數(shù)據(jù)都來(lái)自實(shí)際發(fā)生的沖擊地壓實(shí)例。表2截取了1個(gè)典型的沖擊地壓長(zhǎng)期預(yù)測(cè)任務(wù)訓(xùn)練數(shù)據(jù)集,數(shù)據(jù)集包含9個(gè)訓(xùn)練樣本,每個(gè)樣本含有8個(gè)特征和1個(gè)數(shù)據(jù)標(biāo)簽。目前,已知的關(guān)于該任務(wù)的最大訓(xùn)練數(shù)據(jù)集來(lái)自文獻(xiàn)[69],包含246個(gè)訓(xùn)練樣本,每個(gè)樣本含有7個(gè)特征和1個(gè)標(biāo)簽。盡管機(jī)器學(xué)習(xí)任務(wù)的數(shù)據(jù)需求量是依任務(wù)而定,但不足300個(gè)的訓(xùn)練數(shù)據(jù)依然太少,特別是針對(duì)特征維度比較高的情況。
( 2 ) 訓(xùn)練樣本標(biāo)簽不一致( Training label inconsistency )
在沖擊地壓長(zhǎng)期預(yù)測(cè)任務(wù)中,訓(xùn)練樣本標(biāo)簽是沖擊地壓工程案例的沖擊等級(jí)。然而,不同的研究者針對(duì)沖擊地壓提出了不同的等級(jí)判斷方法[69-72]。如,在挪威,沖擊地壓一般分為三級(jí);前蘇聯(lián)把沖擊地壓分為三級(jí)或五級(jí);中國(guó)國(guó)家標(biāo)準(zhǔn)把沖擊地壓分為四級(jí)( GB/T25217.2-2010 )。由于這個(gè)任務(wù)的訓(xùn)練數(shù)據(jù)集來(lái)自全世界的沖擊地壓工程案例,很難弄清每一個(gè)沖擊地壓案例所依據(jù)的分類標(biāo)準(zhǔn)。如,2個(gè)訓(xùn)練樣本都標(biāo)注“強(qiáng)沖擊”,如果一個(gè)是按挪威的三級(jí)分類標(biāo)準(zhǔn),另一個(gè)是按中國(guó)的四級(jí)分類標(biāo)準(zhǔn),則其所代表的沖擊地壓等級(jí)是不同的。但在樣本數(shù)據(jù)集中,他們被當(dāng)做等級(jí)相同的沖擊地壓。樣本標(biāo)簽的不一致會(huì)極大地影響預(yù)測(cè)結(jié)果的可靠性,這是一個(gè)必須解決的問(wèn)題。
表2 典型的沖擊地壓長(zhǎng)期預(yù)測(cè)訓(xùn)練數(shù)據(jù)集[68]Table 2 A typical impact ground pressure long-term prediction training data sets[68]
( 3 ) 特征重疊( Feature overlapping )
用于機(jī)器學(xué)習(xí)的理想的訓(xùn)練樣本特征應(yīng)該至少滿足富含信息、有識(shí)別力、獨(dú)立3 個(gè)條件( Informative,discriminating,independent )[73]。對(duì)于沖擊地壓長(zhǎng)期預(yù)測(cè)任務(wù),訓(xùn)練樣本特征是沖擊地壓傾向性指標(biāo)和現(xiàn)場(chǎng)地質(zhì)條件指標(biāo)( 表2 )。毫無(wú)疑問(wèn),表2這些特征可以滿足富含信息和有識(shí)別力2個(gè)條件,但是不滿足獨(dú)立性條件。如表2中的一些樣本特征是相關(guān)的。2 個(gè)煤巖體脆性參數(shù)和,都是由單軸抗拉強(qiáng)度和單軸抗壓強(qiáng)度決定的。雖然相關(guān)的特征不總是影響機(jī)器學(xué)習(xí)模型表現(xiàn),但對(duì)于某些特殊模型,依然推薦去掉樣本中的關(guān)聯(lián)特征[74]。如,對(duì)于線性模型( 線性回歸和邏輯回歸 ),關(guān)聯(lián)特征會(huì)導(dǎo)致多重共線性( Multicollinearity ),造成預(yù)測(cè)值的異常波動(dòng)。此外,移除關(guān)聯(lián)特征會(huì)加速模型的訓(xùn)練,特別在高維特征樣本時(shí)可以避免“維度災(zāi)難”( The curse of dimensionality )。移除關(guān)聯(lián)特征并不是簡(jiǎn)單的手動(dòng)刪除,而是需要一些特殊降維算法。
( 4 ) 代價(jià)敏感分類( Cost-sensitive classification )
大多數(shù)研究者采用模型在驗(yàn)證數(shù)據(jù)集或測(cè)試數(shù)據(jù)集上的誤分類率( Misclassification rate )對(duì)模型表現(xiàn)進(jìn)行評(píng)判。然而,誤分類率并不能在一個(gè)代價(jià)敏感的分類任務(wù)中反映模型的真實(shí)表現(xiàn)。而沖擊地壓的長(zhǎng)期預(yù)警正是一個(gè)代價(jià)敏感的分類任務(wù)??紤]2個(gè)模型( A和B ),模型A把所有的“強(qiáng)”沖擊地壓預(yù)測(cè)為“弱”沖擊地壓,模型B把所有的“弱”沖擊地壓預(yù)測(cè)為“強(qiáng)”沖擊地壓。上述的誤分類率是一樣的,但是模型A明顯比模型B更不可接受。模型A的誤分類代價(jià)是把工人置于一個(gè)強(qiáng)沖擊環(huán)境下,而模型B的誤分類代價(jià)是在一個(gè)不太可能發(fā)生沖擊地壓的環(huán)境下花更多的代價(jià)進(jìn)行沖擊地壓防治。兩個(gè)誤分類代價(jià)明顯不同。表3是一個(gè)推廣的多分類混淆矩陣( Confusion matrix ),該矩陣為非對(duì)稱矩陣(),反映沖擊地壓長(zhǎng)期預(yù)測(cè)任務(wù)是代價(jià)敏感的分類。針對(duì)此類問(wèn)題,需要用另外的標(biāo)準(zhǔn)來(lái)衡量模型表現(xiàn)。
表3 沖擊地壓長(zhǎng)期預(yù)測(cè)任務(wù)的混淆矩陣Table 3 Confusion matrix for long-term prediction tasks of rockburst
沖擊地壓短期預(yù)警包括2個(gè)重要步驟,即正確識(shí)別微震事件、建立微震監(jiān)測(cè)信號(hào)和沖擊地壓發(fā)生的時(shí)間、地點(diǎn)及強(qiáng)度之間的關(guān)系。其中,機(jī)器學(xué)習(xí)方法已大量應(yīng)用于識(shí)別微震事件。而對(duì)于利用機(jī)器學(xué)習(xí)建立微震監(jiān)測(cè)信號(hào)和沖擊地壓發(fā)生的時(shí)間、地點(diǎn)和強(qiáng)度之間的關(guān)系,目前尚未出現(xiàn)有價(jià)值的研究。
微震事件識(shí)別可以看作一個(gè)二( 多 )分類的分類任務(wù),可以被很多機(jī)器學(xué)習(xí)模型所解決。事實(shí)上,由于微震監(jiān)測(cè)能夠獲得大量的數(shù)據(jù),機(jī)器學(xué)習(xí)方法在該任務(wù)上的表現(xiàn)比沖擊地壓長(zhǎng)期預(yù)測(cè)任務(wù)更好。目前用于此任務(wù)的主要是監(jiān)督學(xué)習(xí)模型,主要工作流程為:收集微震監(jiān)測(cè)信號(hào)作為訓(xùn)練樣本;提取訓(xùn)練樣本的特征和確定訓(xùn)練樣本的標(biāo)簽;選擇合適的監(jiān)督學(xué)習(xí)模型進(jìn)行訓(xùn)練;用訓(xùn)練好的模型判斷新的輸入信號(hào)。
線性模型如Fisher線性判別[75-77];邏輯回歸[78]和非線性模型如神經(jīng)網(wǎng)絡(luò)[79-82]、支持向量機(jī)[83-84]都被廣泛地用于微震事件的識(shí)別。其中一些研究不只是針對(duì)沖擊地壓預(yù)警的微震信號(hào)識(shí)別,也用在其他如地下工程巖爆和采石場(chǎng)爆破的微震監(jiān)測(cè)中。很多研究是通過(guò)建立幾個(gè)類比的監(jiān)督學(xué)習(xí)模型,從中選擇效果最好的一個(gè)。
一個(gè)代表性的工作是文獻(xiàn)[85]。研究人員建立了一個(gè)邏輯回歸模型來(lái)識(shí)別微震事件和開(kāi)采爆破活動(dòng)。訓(xùn)練數(shù)據(jù)集來(lái)自加拿大和澳大利亞的3個(gè)金屬礦山。共有40 000多個(gè)訓(xùn)練樣本被收集,每個(gè)樣本包括5個(gè)樣本特征,這些樣本被貼上標(biāo)簽,然后劃分為訓(xùn)練數(shù)據(jù)集和驗(yàn)證數(shù)據(jù)集。訓(xùn)練數(shù)據(jù)集用于訓(xùn)練模型,驗(yàn)證數(shù)據(jù)集用于測(cè)試模型的表現(xiàn)。通過(guò)訓(xùn)練,該邏輯回歸模型獲得超過(guò)90%的分類精度,優(yōu)于該文獻(xiàn)中的另外2個(gè)模型,F(xiàn)isher分類器和樸素貝葉斯分類器。另一個(gè)相似的工作見(jiàn)于文獻(xiàn)[78]。研究人員運(yùn)用的邏輯回歸模型也收獲了超過(guò)90%的正確率,超過(guò)了其他的類比模型。
文獻(xiàn)[79]建立了2個(gè)神經(jīng)網(wǎng)絡(luò)模型來(lái)識(shí)別微震事件。其中一個(gè)神經(jīng)網(wǎng)絡(luò)模型用于提取信號(hào)特征來(lái)構(gòu)建訓(xùn)練樣本,另一個(gè)神經(jīng)網(wǎng)絡(luò)模型用于事件分類。文獻(xiàn)[81]收集了175個(gè)數(shù)據(jù)樣本訓(xùn)練了3種不同類型的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行微震事件的識(shí)別,最后發(fā)現(xiàn)前向神經(jīng)網(wǎng)絡(luò)模型在驗(yàn)證集上能達(dá)到99%的正確率。
由于邏輯回歸模型需要的數(shù)學(xué)假設(shè)比貝葉斯分類器和高斯分類器更弱,所以如果利用相同的數(shù)據(jù)集進(jìn)行訓(xùn)練,邏輯回歸模型的表現(xiàn)總是優(yōu)于其他模型。如,貝葉斯分類器假設(shè)訓(xùn)練樣本特征之間相互獨(dú)立,高斯分類器假設(shè)訓(xùn)練樣本特征取自一個(gè)高維的高斯分布等。事實(shí)上,邏輯回歸模型和貝葉斯分類器( 高斯分類器 )正是代表了機(jī)器學(xué)習(xí)的2大類分類模型:判別方法( Discriminative model )和生成方法( Generative model )。其具體差別和適用范圍可參見(jiàn)文獻(xiàn)[86]。然而,對(duì)于其他分類器,如神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、Fisher判別等,很難在理論上解釋為什么邏輯回歸表現(xiàn)比他們更好。這就是機(jī)器學(xué)習(xí)所謂的“黑箱”特性[87]。但是,基于試驗(yàn)事實(shí),在微震事件識(shí)別任務(wù)中,邏輯回歸應(yīng)該是優(yōu)先選擇的模型。
縱覽目前的微震事件識(shí)別的機(jī)器學(xué)習(xí)研究,有3個(gè)主要問(wèn)題值得進(jìn)一步完善:
( 1 ) 大部分研究把微震事件識(shí)別考慮成一個(gè)二分類任務(wù),即只識(shí)別微震事件和其他某一類的干擾信號(hào)( 大多數(shù)研究是識(shí)別微震事件和爆破事件 )。然而礦山開(kāi)采和地下工程活動(dòng)中,干擾信號(hào)的種類很多,如車輛震動(dòng)、電源信號(hào)等。一個(gè)更合理的做法是把微震事件識(shí)別看成一個(gè)多分類的任務(wù),可以直接把微震事件和其他各種類的干擾信號(hào)共同進(jìn)行處理。在二分類問(wèn)題上表現(xiàn)最好的邏輯回歸模型可以很容易地推廣到多分類任務(wù)( SoftMax模型 )。但是目前沒(méi)有關(guān)于微震事件識(shí)別的多分類任務(wù)的研究,故不清楚SoftMax模型在這個(gè)任務(wù)上的表現(xiàn)。
( 2 ) 訓(xùn)練數(shù)據(jù)標(biāo)簽問(wèn)題。監(jiān)督學(xué)習(xí)需要利用有標(biāo)簽數(shù)據(jù)進(jìn)行訓(xùn)練。對(duì)于微震事件識(shí)別任務(wù),訓(xùn)練數(shù)據(jù)來(lái)自現(xiàn)場(chǎng)連續(xù)監(jiān)測(cè)的信號(hào),樣本量巨大。如文獻(xiàn)[85]的樣本量超過(guò)40 000,給如此大的數(shù)據(jù)貼標(biāo)簽需要大量的精力,而且準(zhǔn)確度不能保證。一個(gè)解決方案是利用非監(jiān)督學(xué)習(xí)的策略。非監(jiān)督學(xué)習(xí)可以利用無(wú)標(biāo)簽的數(shù)據(jù)樣本進(jìn)行訓(xùn)練。文獻(xiàn)[88]嘗試建立了一個(gè)非監(jiān)督學(xué)習(xí)模型( 自組織神經(jīng)網(wǎng)絡(luò),The self-organizing neural network )識(shí)別微震事件。該模型并未取得較好的效果,在179個(gè)信號(hào)中,超過(guò)6%的信號(hào)被誤分類。理論上來(lái)說(shuō),由于沒(méi)有訓(xùn)練數(shù)據(jù)標(biāo)簽的指引,在同一個(gè)任務(wù)上非監(jiān)督學(xué)習(xí)的效率( 表現(xiàn) )不如監(jiān)督學(xué)習(xí)合理[89]。
( 3 )訓(xùn)練數(shù)據(jù)的類別不平衡( Class-imbalance )問(wèn)題,即訓(xùn)練樣本中屬于某一類的樣本遠(yuǎn)遠(yuǎn)多于另一( 幾 )類。在文獻(xiàn)[85]中,3個(gè)訓(xùn)練數(shù)據(jù)集中,微震事件樣本數(shù)和爆破事件樣本數(shù)的比例分別為,23.5%∶76.5%;23.5%∶76.5%;13.2%∶86.8%。微震樣本數(shù)遠(yuǎn)小于爆破樣本數(shù)。在文獻(xiàn)[78]中,樣本中微震事件超過(guò)70%,其他干擾信號(hào)小于30%。樣本類別不平衡會(huì)造成對(duì)小比例樣本的識(shí)別精度出現(xiàn)偏差,需要用特殊的采樣方法重新構(gòu)建訓(xùn)練樣本。
隨著計(jì)算機(jī)軟件硬件的發(fā)展,以機(jī)器學(xué)習(xí)為主的數(shù)據(jù)驅(qū)動(dòng)方法已經(jīng)廣泛應(yīng)用到了生活和科學(xué)研究的各個(gè)領(lǐng)域,成為常規(guī)乃至主流工具。然而,在采礦工程和地下工程中,數(shù)據(jù)驅(qū)動(dòng)的方法仍然沒(méi)有大規(guī)模的進(jìn)入,更遑論占據(jù)主流。工程人員依然傾向于利用經(jīng)驗(yàn)驅(qū)動(dòng)和機(jī)理驅(qū)動(dòng)的策略來(lái)解決施工中遇到的問(wèn)題。這就產(chǎn)生了一個(gè)很尷尬的矛盾,一方面,越來(lái)越多的先進(jìn)電氣化設(shè)備被用于采礦與地下工程施工中,如微震監(jiān)測(cè)設(shè)備、TBM盾構(gòu)設(shè)備、無(wú)人駕駛礦車設(shè)備等,這些設(shè)備的使用過(guò)程中會(huì)產(chǎn)生海量的、攜帶大量有效信息的實(shí)時(shí)數(shù)據(jù)。而另一方面,工程技術(shù)人員仍執(zhí)著于經(jīng)驗(yàn)驅(qū)動(dòng)和機(jī)理驅(qū)動(dòng)的方法,這些方法對(duì)數(shù)據(jù)的使用還很不充分,導(dǎo)致大量數(shù)據(jù)的浪費(fèi)和有效信息的丟失。
對(duì)于沖擊地壓的預(yù)測(cè)預(yù)警問(wèn)題,傳統(tǒng)的經(jīng)驗(yàn)驅(qū)動(dòng)和機(jī)理驅(qū)動(dòng)的策略已很難準(zhǔn)確回答何時(shí)發(fā)生、何地發(fā)生、沖擊等級(jí)這3個(gè)關(guān)鍵問(wèn)題。這恰恰給了數(shù)據(jù)驅(qū)動(dòng)方法一個(gè)機(jī)會(huì),事實(shí)上目前對(duì)于這個(gè)問(wèn)題,最優(yōu)秀的研究成果都或多或少地涉及了數(shù)據(jù)驅(qū)動(dòng)的方法??梢哉f(shuō),利用數(shù)據(jù)驅(qū)動(dòng)方法解決沖擊地壓的預(yù)測(cè)預(yù)警問(wèn)題將會(huì)成為數(shù)據(jù)驅(qū)動(dòng)進(jìn)入傳統(tǒng)工程領(lǐng)域的一個(gè)切入點(diǎn),也是能否讓礦山開(kāi)采這一古老行業(yè)邁入智慧礦山、數(shù)據(jù)礦山的一個(gè)關(guān)鍵。
而2.2和2.3節(jié)中提到的在沖擊地壓的長(zhǎng)期預(yù)測(cè)和短期預(yù)警中出現(xiàn)的一些問(wèn)題,在數(shù)據(jù)科學(xué)中都不難找到解決方案。如,解決長(zhǎng)期預(yù)測(cè)訓(xùn)練樣本過(guò)少的問(wèn)題,可以考慮在線( On-line )學(xué)習(xí)和離線( Off-line )學(xué)習(xí)。一方面,盡量選擇判別模型進(jìn)行長(zhǎng)期預(yù)測(cè)( 關(guān)于生成模型和判別模型在該任務(wù)下的小樣本適應(yīng)性,參見(jiàn)文獻(xiàn)[89] )。另一方面,可以通過(guò)云連接建立沖擊地壓事件數(shù)據(jù)庫(kù),不斷累積事件樣本數(shù)。解決訓(xùn)練樣本標(biāo)簽不一致的問(wèn)題,可以利用非監(jiān)督學(xué)習(xí)重新給沖擊地壓訓(xùn)練樣本貼上標(biāo)簽,再進(jìn)行訓(xùn)練。解決特征重疊問(wèn)題,可以考慮一些非線性降維方法,如t-SNE進(jìn)行特征組合和篩選。解決分類代價(jià)敏感問(wèn)題,可以利用特殊的模型評(píng)價(jià)標(biāo)準(zhǔn),如ROC曲線和代價(jià)曲線等。在沖擊地壓短期預(yù)警中,解決訓(xùn)練樣本貼標(biāo)簽問(wèn)題可以采用半監(jiān)督學(xué)習(xí)( Semisupervised )策略,用大量無(wú)標(biāo)簽樣本結(jié)合少量有標(biāo)簽樣本組成訓(xùn)練集,兼顧了模型效率和精度。解決類別不平衡問(wèn)題,可以采用過(guò)采樣( Over-sampling )和欠采樣( Under-sampling )構(gòu)建新的訓(xùn)練數(shù)據(jù)集。也可以調(diào)整( 概率 )分類模型的閾值( Threshold ),匹配不平衡的訓(xùn)練樣本??傊瑪?shù)據(jù)科學(xué)是一門日新月異的新興科學(xué),每天都有大量的模型、算法、標(biāo)準(zhǔn)、工具包的更新。數(shù)據(jù)科學(xué)源源不斷地推陳出新是利用其解決工程實(shí)際問(wèn)題的根本保障。
沖擊地壓預(yù)測(cè)預(yù)防的技術(shù)壁壘是如何通過(guò)微震( 或其他現(xiàn)場(chǎng)監(jiān)測(cè)手段 )監(jiān)測(cè)信號(hào)準(zhǔn)確確定沖擊地壓發(fā)生的時(shí)間、地點(diǎn)和強(qiáng)度,特別是確定準(zhǔn)確的發(fā)生時(shí)間。傳統(tǒng)方法已無(wú)法回答這個(gè)問(wèn)題。目前利用機(jī)器學(xué)習(xí)進(jìn)行的相關(guān)研究還在進(jìn)行中。但是,憑借數(shù)據(jù)科學(xué)強(qiáng)大的實(shí)用性、海量的工具支持和眾多的研究團(tuán)隊(duì),突破這個(gè)技術(shù)壁壘只是時(shí)間問(wèn)題,從而完成建立沖擊地壓預(yù)測(cè)預(yù)警系統(tǒng)這一巖石力學(xué)與工程中的歷史性難題。
參考文獻(xiàn)( References ):
[1] HE M,REN F,LIU D.Rockburst mechanism research and its control[J].International Journal of Mining Science and Technology,2018,28( 5 ):829-837.
[2] HE J,DOU L,GONG S,et al.Rock burst assessment and prediction by dynamic and static stress analysis based on micro-seismic monitoring[J].International Journal of Rock Mechanics and Mining Sciences,2017,93:46-53.
[3] PU Y Y,APEL D B,LINGGA B.Rockburst prediction in kimberlite using decision tree with incomplete data[J].Journal of Sustainable Mining,2018,17( 3 ):158-165.
[4] PU Y Y,APEL D B,WANG C,et al.Evaluation of burst liability in kimberlite using support vector machine[J].Acta Geophysica,2018,66( 5 ):973-982.
[5] CAI W,DOU L,SI G,et al.A principal component analysis/fuzzy comprehensive evaluation model for coal burst liability assessment[J].International Journal of Rock Mechanics and Mining Sciences,2016,81:62-69.
[6] HE M C,MIAO J L,F(xiàn)ENG J L.Rock burst process of limestone and its acoustic emission characteristics under true-triaxial unloading conditions[J].International Journal of Rock Mechanics and Mining Sciences,2010,47( 2 ):286-298.
[7] BLAKE W,HEDLEY D G F.Rockbursts:Case studies from North American hard-rock mines[M].SME,2003.
[8] MARK C.Coal bursts in the deep longwall mines of the United States[J].International Journal of Coal Science & Technology,2016,3( 1 ):1-9.
[9] WILLIAMS T J,BRADY T M,BAYER D C,et al.Underhand cut and fill mining as practiced in three deep hard rock mines in the United States[A].Proceedings of the CIM Conference and Exhibition,Montreal,Quebec,Canada,April 29-May 2,2007[C].Montreal,Quebec,Canada:Canadian Institute of Mining,Metallurgy and Petroleum,2007:1-11.
[10] BALTZ R,HUCKE A.Rockburst prevention in the German coal industry[A].Proceedings of the 27th International Conference on Ground Control in Mining[C].Morgantown WV:West Virginia University,2008.
[11] POTVIN Y,HUDYMA M,JEWELL R J.Rockburst and seismic activity in underground Australian mines-An introduction to a new research project[A].ISRM International Symposium[C].International Society for Rock Mechanics and Rock Engineering,2000.
[12] 齊慶新,李曉璐,趙善坤.煤礦沖擊地壓應(yīng)力控制理論與實(shí)踐[J].煤炭科學(xué)技術(shù),2013,41( 6 ):1-5.QI Qingxin,LI Xiaolu,ZHAO Shankun.Theory and practices on stress control of mine pressure bumping[J].Coal Science and Technology,2013,41( 6 ):1-5.
[13] DOU L,CAI W,CAO A,et al.Comprehensive early warning of rock burst utilizing microseismic multi-parameter indices[J].International Journal of Mining Science and Technology,2018,28( 5 ):767-774.
[14] BENNETT T J,MARSHALL M E.Identification of rockbursts and other mining events using regional signals at international monitoring system stations[R].Science Applications International Corp Mclean VA,2001.
[15] 姜耀東,趙毅鑫.我國(guó)煤礦沖擊地壓的研究現(xiàn)狀:機(jī)制,預(yù)警與控制[J].巖石力學(xué)與工程學(xué)報(bào),2015,34( 11 ):2188-2204.JIANG Yaodong,ZHAO Yixin.State of the art:Investigation on mechanism,forecast and control of coal bumps in china[J].Chinese Journal of Rock Mechanics and Engineering,2015,34( 11 ):2188-2204.
[16] 張傳慶,盧景景,陳珺,等.巖爆傾向性指標(biāo)及其相互關(guān)系探討[J].巖土力學(xué),2017,38( 5 ):1397-1404.ZHANG Chuanqing,LU Jingjing,CHEN Jun,et al.Discussion on rock burst proneness indexes and their relation[J].Rock and Soil Mechanics,2017,38( 5 ):1397-1404.
[17] KIDYBI?SKI A.Bursting liability indices of coal[J].International Journal of Rock Mechanics and Mining Sciences & Geomechanics Abstracts( Pergamon ),1981,18( 4 ):295-304.
[18] WATTIMENA R K,SIRAIT B,WIDODO N P,et al.Evaluation of rockburst potential in a cut-and-fill mine using energy balance[J].International Journal of the JCRM,2012,8( 1 ):19-23.
[19] WANG J A,PARK H D.Comprehensive prediction of rockburst based on analysis of strain energy in rocks[J].Tunnelling and Underground Space Technology,2001,16( 1 ):49-57.
[20] AUBERTIN M,GILL DE,SIMON R.On the use of the brittleness index modified( BIM ) to estimate the post-peak behavior or rocks[J].Aqua Fennica,1994,23:24-25.
[21] WU Y,ZHANG W.Evaluation of the bursting proneness of coal by means of its failure duration[A].Rock-bursts and Seismicity in Mines[C].Rotterdam:Balkema,1997:285-288.
[22] SIMON R.Analysis of fault-slip mechanisms in hard rock mining [D].Montreal:Mc Gill University,1999.
[23] WANG J ,ZHANG J.Preliminary engineering application of microseismic monitoring technique to rockburst prediction in tunneling of Jinping II project[J].Journal of Rock Mechanics and Geotechnical Engineering,2010,2( 3 ):193-208.
[24] 張文東,馬天輝,唐春安,等.錦屏二級(jí)水電站引水隧洞巖爆特征及微震監(jiān)測(cè)規(guī)律研究[J].巖石力學(xué)與工程學(xué)報(bào),2014,33( 2 ):339-348.ZHANG Wendong,MA Tianhui,TANG Chun'an,et al.Research on characteristics of rockburst and rules of microseismic monitoring at diversion tunnels in Jinping Ⅱ hydropower station[J].Chinese Journal of Rock Mechanics and Engineering,2014,33( 2 ):339-348.
[25] PU Y,APEL D,XU H.A principal component analysis/fuzzy comprehensive evaluation for rockburst potential in kimberlite[J].Pure and Applied Geophysics,2018,175( 6 ):2141-2151.
[26] WANG C,WU A,LU H,et al.Predicting rockburst tendency based on the fuzzy matter-element model[J].International Journal of Rock Mechanics and Mining Sciences,2015,75:224-232.
[27] WANG X,LI S,XU Z,et al.An interval fuzzy comprehensive assessment method for rock burst in underground caverns and its engineering application[J].Bulletin of Engineering Geology and the Environment,2019,78( 7 ):1-16.
[28] ZHU Z,ZHANG H,HAN J,et al.A risk assessment method for rockburst based on geodynamic environment[J].Shock and Vibration,2018( 6 ):2586842.
[29] FENG Q,YAO C,XIAO Z.Construction of students' comprehensive quality evaluation model based on improved AHP[A].2018 13th International Conference on Computer Science & Education ( ICCSE )[C].IEEE,2018:1-5.
[30] JI M,GUO H,ZHANG Y,et al.Hierarchic analysis method to evaluate rock burst risk[J].Mathematical Problems in Engineering,2015( 13 ):1-8.
[31] 陳丹,馮東梅,邵良杉.采用AHP—可拓學(xué)的地下工程圍巖穩(wěn)定性預(yù)測(cè)模型[J].遼寧工程技術(shù)大學(xué)學(xué)報(bào)( 自然科學(xué)版 ),2016,35( 1 ):32-36.CHEN Dan,F(xiàn)ENG Dongmei,SHAO Liangshan.AHP-extenics model for stability classification of underground engineering surrounding rock[J].Journal of Liaoning Technical University ( Natural Science ),2016,35( 1 ):32-36.
[32] LU J,WANG W,ZHANG Y,et al.Multi-objective optimal design of stand-alone hybrid energy system using entropy weight method based on HOMER[J].Energies,2017,10( 10 ):1664.
[33] MOTTAHEDI A,ATAEI M.Fuzzy fault tree analysis for coal burst occurrence probability in underground coal mining[J].Tunnelling and Underground Space Technology,2019,83:165-174.
[34] LIU Z,SHAO J,XU W,et al.Prediction of rock burst classification using the technique of cloud models with attribution weight[J].Natural Hazards,2013,68( 2 ):549-568.
[35] ZHOU K,YUN L,DENG H,et al.Prediction of rock burst classification using cloud model with entropy weight[J].Transactions of Nonferrous Metals Society of China,2016,26( 7 ):1995-2002.
[36] JIANG T,HUANG Z,ZHAO Y.Application of grey system optimal theory model to forecasting rockburst[J].Journal of North China Institute of Water Conservancy and Hydroelectric Power,2003,24( 2 ):37-40.
[37] WANG M,JIN J,LI L.SPA-VFS model for the prediction of rockburst[A].2008 Fifth International Conference on Fuzzy Systems and Knowledge Discovery[C].IEEE,2008,5:34-38.
[38] MCCULLOCH W S,PITTS W.A logical calculus of the ideas immanent in nervous activity[J].The Bulletin of Mathematical Biophysics,1943,5( 4 ):115-133.
[39] ROSENBLATT F.The perceptron:A probabilistic model for information storage and organization in the brain[A].Neurocomputing:Foundations of Research[C].MIT Press,1988.
[40] HUBEL D H,WIESEL T N.Receptive fields,binocular interaction and functional architecture in the cat's visual cortex[J].The Journal of Physiology,1962,160( 1 ):106-154.
[41] RUMELHART D E,HINTON G E,WILLIAMS R J.Learning internal representations by error propagation [J].Readings in Cognitive Science,1988,323( 6088 ):399-421.
[42] LECUN Y,BOSER B,DENKER J S,et al.Backpropagation applied to handwritten zip code recognition[J].Neural Computation,1989,1( 4 ):541-551.
[43] SAFAVIAN S R,LANDGREBE D.A survey of decision tree classifier methodology[J].IEEE Transactions on Systems ,Man and Cybernetics,1991,21( 3 ):660-674.
[44] CORTES C,VAPNIK V.Support-vector networks[J].Machine Learning,1995,20( 3 ):273-297.
[45] FREUND Y,SCHAPIRE R E.Experiments with a new boosting algorithm DRAFT—Please do not distribute[A].Thirteenth International Conference on International Conference on Machine Learning[C].Morgan Kaufmann Publishers Inc,1996:148-156.
[46] SCHMIDHUBER J.Deep learning in neural networks:An overview[J].Neural Networks,2015,61:85-117.
[47] HINTON G E,SALAKHUTDINOV R R.Reducing the dimensionality of data with neural networks[J].Science,2006,313( 5786 ):504-507.
[48] LECUN Y,BENGIO Y,HINTON G.Deep learning[J].Nature,2015,521( 7553 ):436.
[49] CYBENKO G.Approximation by superpositions of a sigmoidal function[J].Mathematics of Control,Signals and Systems,1989,2( 4 ):303-314.
[50] FENG X T,WANG L.Rockburst prediction based on neural networks[J].Transactions of Nonferrous Metals Society of China,1994,4( 1 ):7-14.
[51] BAI M Z,WANG L J,XU Z Y.Study on a neutral network model and its application in predicting the risk of rock blast[J].China Safety Science Journal,2002( 4 ):68-72.
[52] CHEN H.Prediction of rockburst by artificial neural network[J].Chinese Journal of Rock Mechanics and Engineering,2003,22( 5 ):762-768.
[53] WANG X.Application of BP neural network into prediction of rockburst in tunneling[A].Proceedings of the 2004 International Symposiumon Safety Science and Technology[C].2004:617-621.
[54] ZHANG X Z.Prediction of rock burst at underground works based on artificial neural network[J].Yangtze River,2005,36( 5 ):17-18.
[55] ZHANG Y,LIU X,HU Z.Rock burst forecast based on artificial neural network in underground engineering[J].Hunan Nonferrous Metal,2007,23( 3 ):1-4.
[56] XUAN Z B,XU H.The forecasting of rockburst in deep-buried tunnel with adaptive neural network[A].In 2009 International Conference on Industrial and Information Systems[C].IEEE,2009.
[57] ZHANG G,GAO Q,DU J,et al.Rockburst criterion based on artificial neural networks and nonlinear regression[J].Journal of Central South University ( Science and Technology ),2013,44( 7 ):2977-2981.
[58] 張樂(lè)文,張德永,李術(shù)才,等.基于粗糙集理論的遺傳-RBF神經(jīng)網(wǎng)絡(luò)在巖爆預(yù)測(cè)中的應(yīng)用[J].巖土力學(xué),2012,33( S1 ):270-276.ZHANG Lewen,ZHANG Deyong,LI Shucai,et al.Application of RBF neural network to rockburst prediction based on rough set theory[J].Rock and Soil Mechanics,2012,33( S1 ):270-276.
[59] 馮夏庭,趙洪波.巖爆預(yù)測(cè)的支持向量機(jī)[J].東北大學(xué)學(xué)報(bào)( 自然科學(xué)版 ),2002,23( 1 ):59-62.FENG Xiating,ZHAO Hongbo.Prediction of rockburst using support vector machine[J].Journal of Northeastern University ( Natural Science ),2002,23( 1 ):59-62.
[60] 趙洪波.巖爆分類的支持向量機(jī)方法[J].巖土力學(xué),2005,26( 4 ):642-644.ZHAO Hongbo.Classification of rockburst using support vector machine[J].Rock and Soil Mechanics,2005,26( 4 ):642-644.
[61] ZHOU J,LI X,SHI X.Long-term prediction model of rockburst in underground openings using heuristic algorithms and support vector machines[J].Safety Science,2012,50( 4 ):629-644.
[62] 祝云華,劉新榮,周軍平.基于V-SVR算法的巖爆預(yù)測(cè)分析[J].煤炭學(xué)報(bào),2008,33( 3 ):277-281.ZHU Yunhua,LIU Xinrong,ZHOU Junping.Rockburst prediction analysis based on V-SVR algorithm[J].Journal of China Coal Society,2008,33( 3 ):277-281.
[63] PU Y Y,APEL D B,WANG C.Evaluation of burst liability in kimberlite using support vector machine[J].Acta Geophysica,2018,66( 5 ):973-982.
[64] 蘇國(guó)韶,張小飛,燕柳斌.基于案例推理的巖爆預(yù)測(cè)方法[J].采礦與安全工程學(xué)報(bào),2008,25( 1 ):63-67.SU Guoshao,ZHANG Xiaofei,YAN Liubin.Rockburst prediction method based on case reasoning pattern recognition[J].Journal of Mining & Safety Engineering,2008,25( 1 ):63-67.
[65] DONG L J,LI X B,KANG P.Prediction of rockburst classification using Random Forest[J].Transactions of Nonferrous Metals Society of China,2013,23( 2 ):472-477.
[66] 葛啟發(fā),馮夏庭.基于AdaBoost組合學(xué)習(xí)方法的巖爆分類預(yù)測(cè)研究[J].巖土力學(xué),2008,29( 4 ):943-948.GE Qifa,F(xiàn)ENG Xiating.Classification and prediction of rockburst using AdaBoost combination learning method[J].Rock And Soil Mechanics,2008,29( 4 ):943-948.
[67] PU Y Y,APEL D B,LINGGA B.Rockburst prediction in kimberlite using decision tree with incomplete data[J].Journal of Sustainable Mining,2018,17( 3 ):158-165.
[68] 王元漢,李臥東,李啟光,等.巖爆預(yù)測(cè)的模糊數(shù)學(xué)綜合評(píng)判方法[J].巖石力學(xué)與工程學(xué)報(bào),1998,17( 5 ):3-5.WANG Yuanhan,LI Wodong,LI Qiguang,et al.Method of fuzzy comprehensive evaluations for rockburst prediction[J].Chinese Journal of Rock Mechanics and Engineering,1998,17( 5 ):3-5.
[69] ZHOU J,LI X,MITRI H S.Classification of rockburst in underground projects:Comparison of ten supervised learning methods[J].Journal of Computing in Civil Engineering,2016,30( 5 ):04016003.
[70] 譚以安.巖爆巖石斷口掃描電鏡分析及巖爆漸進(jìn)破壞過(guò)程[J].電子顯微學(xué)報(bào),1989( 2 ):41-48.TAN Yi'an.Analysis of fractured face of rockburst with scanning electron microscope and its progressive failure process[J].Journal of Chinese Electron Microscopy Society,1989( 2 ):41-48.
[71] ПЕТУХОВ И,ЛИНЬКОВ А,СИДОРОВ В.Расчетные методы в механике горных ударов и выбросов:Справочное пособие( in Russian )[J].Недра,1992.
[72] RUSSENES B F.Analyses of rockburst in tunnels in valley sides[D].Trondheim:Norwegian Institute of Technology,1974.
[73] BISHOP C M.Pattern recognition and machine learning[M].Springer,2006.
[74] SCULLEY D,HOLT G,GOLOVIN D,et al.Hidden technical debt in machine learning systems[A].Advances in Neural Information Processing Systems[C].2015:2503-2511.
[75] BOOKER A ,MITRONOVAS W.An application of statistical discrimination to classify seismic events[J].Bulletin of the Seismological Society of America,1964,54( 3 ):961-971.
[76] KIM W Y,AHARONIAN V,LERNER-LAM A L,et al.Discrimination of earthquakes and explosions in southern Russia using regional highfrequency three-component data from the IRIS/JSP Caucasus Network[J].Bulletin of the Seismological Society of America,1997,87( 3 ):569-588.
[77] WüSTER J.Discrimination of chemical explosions and earthquakes in central Europe—A case study[J].Bulletin of the Seismological Society of America,1993,83( 4 ):1184-1212.
[78] VALLEJOS J A,MCKINNON S D.Logistic regression and neural network classification of seismic records[J].International Journal of Rock Mechanics and Mining Sciences,2013,62:86-95.
[79] DEL PEZZO E ,ESPOSITO A ,GIUDICEPIETRO F ,et al.Discrimination of earthquakes and underwater explosions using neural networks[J].Bulletin of the Seismological Society of America,2003,93( 1 ):215-223.
[80] FORD S R,WALTER W R.Aftershock characteristics as a means of discriminating explosions from earthquakes[J].Bulletin of the Seismological Society of America,2010,100( 1 ):364-376.
[81] MUSIL M,PLE?INGER A.Discrimination between local microearthquakes and quarry blasts by multi-layer perceptrons and Kohonen maps[J].Bulletin of the Seismological Society of America,1996,86( 4 ):1077-1090.
[82] YILDIRIM E,GüLBA? A,HORASAN G,et al.Discrimination of quarry blasts and earthquakes in the vicinity of Istanbul using soft computing techniques[J].Computers & Geosciences,2011,37( 9 ):1209-1217.
[83] DONG L,LI X,XIE G.Nonlinear methodologies for identifying seismic event and nuclear explosion using random forest,support vector machine,and naive Bayes classification[A].Abstract and Applied Analysis[C].Hindawi,2014.
[84] RUANO A E,MADUREIRA G,BARROS O,et al.Seismic detection using support vector machines[J].Neurocomputing,2014,135:273-283.
[85] DONG L,WESSELOO J,POTVIN Y,et al.Discrimination of mine seismic events and blasts using the fisher classifier,naive bayesian classifier and logistic regression[J].Rock Mechanics and Rock Engineering,2016,49( 1 ):183-211.
[86] NG A Y,JORDAN M I.On discriminative vs.generative classifiers:A comparison of logistic regression and naive bayes[A].Advances in Neural Information Processing Systems[C].2002:841-848.
[87] ANZAI Y.Pattern recognition and machine learning[M].Elsevier,2012.
[88] KUYUK H S,YILDIRIM E,DOGAN E,et al.An unsupervised learning algorithm:Application to the discrimination of seismic events and quarry blasts in the vicinity of Istanbul[J].Natural Hazards and Earth System Sciences,2011:11( 1 ):93-100.
[89] MIROSLAV Kubat.An introduction to machine learning[M].Springer International Publishing Switzerland,2015.