周海軍,陳銀燕
天然地震和人工爆破的識(shí)別是當(dāng)今地震研究領(lǐng)域的一個(gè)重要方面,及時(shí)、方便、快速地識(shí)別出天然地震和人工爆破事件對(duì)于防震減災(zāi)事業(yè)和國(guó)家安全都具有重要意義。由于地震信號(hào)是非平穩(wěn)的時(shí)變信號(hào),但是在充分短的時(shí)間內(nèi)的地震信號(hào)可以看成是平穩(wěn)的,因此可以運(yùn)用分幀技術(shù)來(lái)分析地震信號(hào)的短時(shí)特性[1]。天然地震和人工爆破的識(shí)別實(shí)際就是地震類型的識(shí)別。
天然地震的震源是非對(duì)稱的剪切源,震源一般位于地底深處,能量衰減較慢,頻率成分復(fù)雜。人工爆破的震源是對(duì)稱的膨脹源,發(fā)生在地表淺層處,持續(xù)時(shí)間較短,能量衰減快。爆破波的高頻成份一般多于地震波,他們震動(dòng)頻率有較大差異[2]。同時(shí)P波和S波的形態(tài)也有所差異,爆破的面波表現(xiàn)的比較明顯,其信號(hào)的譜包絡(luò)變化也有所差異[3]。
目前,國(guó)內(nèi)外對(duì)地震和爆破的識(shí)別進(jìn)行了大量的研究[1-3],提出了很多特征來(lái)識(shí)別地震和爆破,例如能量比、振幅比、小波變換特征參數(shù)、瞬態(tài)譜。而在本文中采用LPCC特征參數(shù)和GMM模式識(shí)別方法來(lái)識(shí)別天然地震和人工爆破。
復(fù)倒譜是信號(hào)通過Z變換以后取對(duì)數(shù),再求反Z變換得到的。LPCC也是一種復(fù)倒譜,是震動(dòng)信號(hào)通過線性預(yù)測(cè)模型進(jìn)行同態(tài)分析,再通過迭代算法求得的,可以作為識(shí)別天然地震和人工爆破的特征參數(shù)。
線性預(yù)測(cè)分析是一種譜分析方法[4-5],本文中系統(tǒng)H(z)頻率響應(yīng)反應(yīng)信號(hào)的頻率響應(yīng)和譜包絡(luò),通過線性預(yù)測(cè)分析得到的系統(tǒng)模型的系統(tǒng)函數(shù)為:
其中,p是線性預(yù)測(cè)的階數(shù),沖擊響應(yīng)為c(n),根據(jù)倒譜的定義可以得到:
將(1)式代入(2),并對(duì)z-1求偏導(dǎo)數(shù),得到
令左右兩邊的相應(yīng)系數(shù)相等,得到cn與ak的關(guān)系:
其中ak為L(zhǎng)PC系數(shù),p為L(zhǎng)PC階數(shù),ck為L(zhǎng)PCC參數(shù),k為L(zhǎng)PCC的階數(shù),本文實(shí)驗(yàn)中k取為20。
實(shí)現(xiàn)天然地震和人工爆破的識(shí)別需要注意幾個(gè)問題:(a)原始地震信號(hào)的濾波和P波初至點(diǎn)的選取,以P波初至點(diǎn)為起始點(diǎn),面波結(jié)束點(diǎn)為終點(diǎn)。(b)LPCC特征的提取,本文的LPCC階數(shù)使用20階,分幀的幀長(zhǎng)64,幀移50,為了保證在訓(xùn)練和識(shí)別結(jié)果的穩(wěn)定性,最好所有測(cè)試數(shù)據(jù)和訓(xùn)練數(shù)據(jù)選取的結(jié)構(gòu)一致,即矩陣的大小一致,否則容易誤判實(shí)驗(yàn)結(jié)果。(c)GMM模型的訓(xùn)練和建立。(d)模型匹配中相似性判斷的依據(jù)。
本文的實(shí)驗(yàn)數(shù)據(jù)來(lái)自于2002年到2008年的首都圈地震帶的27個(gè)天然地震事件和23個(gè)人工爆破事件,根據(jù)實(shí)際需要選取離他們震中距最近的5個(gè)臺(tái)站記錄的垂直方向的波形數(shù)據(jù),并人工的從每個(gè)事件的5個(gè)臺(tái)站中選擇3個(gè)最好記錄波形數(shù)據(jù),然后對(duì)每一個(gè)選取后的波形數(shù)據(jù)濾波和P波初至點(diǎn)的判斷,再以P波初至點(diǎn)為起始點(diǎn),截取2640個(gè)點(diǎn)的數(shù)據(jù)作為地震信號(hào)。從而得到2640*81個(gè)天然地震樣本點(diǎn)的波形數(shù)據(jù)集和2640*69個(gè)人工爆破樣本點(diǎn)的波形數(shù)據(jù)集。最后,提取LPCC特征參數(shù),為了消除時(shí)間、震級(jí)等不利因素的影響,需要對(duì)線性預(yù)測(cè)倒譜系數(shù)數(shù)據(jù)集進(jìn)行歸一化,本文采用極差歸一化法,公式如式5所示。
高斯混合模型 (Gaussian Mixture Model,GMM)的訓(xùn)練就是給定一組數(shù)據(jù),依據(jù)某種準(zhǔn)則確定模型的參數(shù),其結(jié)構(gòu)原理如圖1所示。
圖1 地震和爆破的GMM
訓(xùn)練數(shù)據(jù)是從實(shí)驗(yàn)數(shù)據(jù)集中隨機(jī)選取15個(gè)地震事件和15個(gè)爆破事件的3個(gè)臺(tái)站,即共計(jì)90個(gè)記錄波形為訓(xùn)練數(shù)據(jù),剩下的60個(gè)記錄波形數(shù)據(jù)為測(cè)試數(shù)據(jù)。震動(dòng)信號(hào)的特征參數(shù)采用20階的LPCC參數(shù)。
首先對(duì)兩種類型數(shù)據(jù)提取特征參數(shù)并歸一化,然后建立兩個(gè)包含期望、方差、權(quán)值的震動(dòng)信號(hào)的參考模型,權(quán)值的數(shù)量與LPCC參數(shù)的階數(shù)數(shù)量一致。在訓(xùn)練過程中不斷修正期望和方差,改變權(quán)值,使數(shù)據(jù)的似然性最大,從而得到圖1中的參考模型庫(kù)(即天然地震和人工爆破的兩個(gè)模型)。最后用測(cè)試數(shù)據(jù)與兩種模型比較,根據(jù)Bayes理論[6],最大后驗(yàn)概率可以表示為:
其中P(X|λ)的對(duì)數(shù)形式是:
測(cè)試信號(hào)屬于哪一類地震模型可以表示為:
其中,自然數(shù)i是要識(shí)別的地震信號(hào)。若i=1,表示該測(cè)試信號(hào)為天然地震;若i=2,表示該信號(hào)為人工爆破。
本文先以單波為單位使用GMM模型來(lái)進(jìn)行判斷是天然地震還是人工爆破。對(duì)60個(gè)待判斷的信號(hào)波分別進(jìn)行判斷,測(cè)試每一個(gè)信號(hào)波的地震類型。圖2和圖3是判斷60個(gè)測(cè)試地震波進(jìn)行100次實(shí)驗(yàn)中的一次具體的實(shí)驗(yàn)結(jié)果。在圖2中,藍(lán)色的星號(hào)表示測(cè)試信號(hào)與天然地震模型匹配得到的相似度值r1,紅色圓圈表示測(cè)試信號(hào)與人工爆破模型匹配得到的相似度值r2。在圖3中,紅色星號(hào)表示實(shí)際的測(cè)試信號(hào)類型,藍(lán)色圓圈表示GMM的識(shí)別結(jié)果,Y軸上的1表示天然地震信號(hào),2表示人工爆破信號(hào)。
圖2 模型匹配相似性度量值
從圖2和圖3可以看出,對(duì)同一個(gè)測(cè)試信號(hào),若與天然地震模型匹配得到的相似度值r1大于與人工爆破模型匹配得到的相似度值r2,則該測(cè)試信號(hào)被識(shí)別為天然地震(例如第3個(gè)測(cè)試信號(hào))。反之,被識(shí)別為人工爆破(例如第1個(gè)測(cè)試信息)。當(dāng)r1和r2的值越接近時(shí),對(duì)單波采用LPCC特征參數(shù)來(lái)進(jìn)行判斷,其誤識(shí)別率可能會(huì)較高。
圖3 震源類型識(shí)別結(jié)果
從圖3中可以看出,對(duì)前36個(gè)待測(cè)試的天然地震波形進(jìn)行GMM識(shí)別,誤識(shí)別個(gè)數(shù)為5,則誤識(shí)別率為13.9%;對(duì)后24個(gè)待測(cè)試的人工爆破波形識(shí)別,誤識(shí)個(gè)數(shù)為7,則誤識(shí)別率為29.1%。本次總的誤識(shí)別率為20%。而對(duì)單波進(jìn)行100次實(shí)驗(yàn)的平均識(shí)別率為81.5%。說(shuō)明了LPCC特征參數(shù)作為地震特征參數(shù)是可行的。
再以事件為單位進(jìn)行GMM地震類型識(shí)別。以同一個(gè)事件的3個(gè)臺(tái)站記錄波形數(shù)據(jù)進(jìn)行判斷此次事件的類型。判斷的依據(jù)是:只要同一事件中有兩個(gè)或兩個(gè)以上記錄波形識(shí)別為同一地震類型的時(shí)候,則系統(tǒng)將該震源類型作為此次事件的類型。例如一個(gè)事件中有2個(gè)記錄波形為天然地震,則該事件為天然地震事件。
表1列出了20個(gè)地震事件(其中12個(gè)天然地震,8個(gè)人工爆破)進(jìn)過100次實(shí)驗(yàn)的最后平均實(shí)驗(yàn)結(jié)果。從表1可看出人工爆破的誤識(shí)別率高于天然地震,這可能與選取的波形有很大的關(guān)系,天然地震事件波形記錄比較明顯,而由于人工爆破波形容易受到環(huán)境的干擾,使得P波初至點(diǎn)判斷比較困難,GMM對(duì)原始波形起始點(diǎn)和選取長(zhǎng)度的要求很高。
從表1中,可知道以事件為單位的總識(shí)別率為85%。本文以事件識(shí)別率和單波識(shí)別率的結(jié)果,可以判斷該系統(tǒng)是比較穩(wěn)定,也是可用的。再根據(jù)隨機(jī)實(shí)驗(yàn)結(jié)果,以事件為單位的識(shí)別率高于以單波為單位的識(shí)別率。
表1 以事件為單位的識(shí)別率
在天然地震和人工爆破識(shí)別研究領(lǐng)域中,實(shí)際上遇到了很多問題,并且這些問題得不到很好地解決??梢钥紤]其他學(xué)科運(yùn)用的方法,可能在一定程度上會(huì)更好地解決問題。LPCC在語(yǔ)音識(shí)別應(yīng)用中已經(jīng)很成熟了,它能反映信號(hào)的頻率與譜包絡(luò)的關(guān)系,天然地震和人工爆破在這方面存在一定的差異,在理論上存在一定的可行性,所以本文將LPCC作為一種新的特征來(lái)識(shí)別天然地震和人工爆破,并取得了一定的實(shí)驗(yàn)成果。由于地震信號(hào)的復(fù)雜性,單一特征在識(shí)別天然地震和人工爆破時(shí)還存在識(shí)別率不高的缺陷,所以可以考慮將LPCC與其它地震信號(hào)特征聯(lián)合識(shí)別天然地震和人工爆破,應(yīng)該能達(dá)到更高的識(shí)別率。
[1]盧世軍,黃漢明.基于能量比的天然地震與人工爆破自動(dòng)識(shí)別算法研究[J].華南地震,2010,30(1),34-39.
[2]黃漢明,邊銀菊,盧世軍,等.天然地震與人工爆破的波形小波特征研究[J].地震學(xué)報(bào),2010,32(3),270-276.
[3]邊銀菊.遺傳BP網(wǎng)絡(luò)在地震和爆破識(shí)別中的應(yīng)用[J].地震學(xué)報(bào),2002,24(5),516-524.
[4]Jifeng Wang,Yantian Zuo,Yichang Huang,et al.Arc Sound Recognizing Penetration State Using LPCC Features [J].Robotic Welding,Intelligence and Automation,2010,229-233.
[5]蔡蓮紅.現(xiàn)代語(yǔ)音技術(shù)基礎(chǔ)與應(yīng)用[M].北京:清華大學(xué)出版社,2003,232-242.
[6]劉永紅.說(shuō)話人識(shí)別系統(tǒng)的研究[D].成都:西南交通大學(xué),2003.