鄒柏賢 許少武 苗 軍 逯燕玲
1(北京聯(lián)合大學(xué)應(yīng)用文理學(xué)院 北京 100191)2(北京信息科技大學(xué)計(jì)算機(jī)學(xué)院 北京 100101)3(網(wǎng)絡(luò)文化與數(shù)字傳播北京市重點(diǎn)實(shí)驗(yàn)室(北京信息科技大學(xué)) 北京 100101)
安防監(jiān)測(cè)系統(tǒng)的關(guān)鍵部分在于光纖振動(dòng)傳感器和信號(hào)識(shí)別模塊.當(dāng)?shù)孛媸艿酵饬D壓時(shí),埋在地下的光纖振動(dòng)傳感器會(huì)因振動(dòng)而產(chǎn)生不同的光強(qiáng)波動(dòng)信號(hào);當(dāng)光纖振動(dòng)傳感器受到外力直接觸及時(shí),也會(huì)產(chǎn)生不同的光強(qiáng)波動(dòng)信號(hào)[1].如果在軍事基地、機(jī)場(chǎng)、石油和天然氣場(chǎng)站等需要重點(diǎn)保護(hù)區(qū)域的周界地下鋪設(shè)光纜及光纖傳感器,當(dāng)這些區(qū)域遭到來自外界的入侵時(shí),傳感器能探測(cè)感知到外界產(chǎn)生的振動(dòng).安防系統(tǒng)對(duì)探測(cè)到的光強(qiáng)波動(dòng)信號(hào)進(jìn)行處理和分析,并在獲取不同入侵行為的信號(hào)特征后,運(yùn)用有效的識(shí)別技術(shù),可以實(shí)現(xiàn)對(duì)系統(tǒng)監(jiān)測(cè)區(qū)域的實(shí)時(shí)監(jiān)測(cè)和入侵預(yù)警,從而提高對(duì)這些重點(diǎn)區(qū)域的安全保障能力.光纖安防監(jiān)測(cè)系統(tǒng)具有監(jiān)測(cè)范圍大、識(shí)別能力強(qiáng)、反應(yīng)快等特點(diǎn),且能實(shí)現(xiàn)高精度定位,其實(shí)際應(yīng)用日益增多.
Fig. 1 Model of optical fiber security monitoring system圖1 光纖安防監(jiān)測(cè)系統(tǒng)結(jié)構(gòu)圖
光纖安防系統(tǒng)由馬赫-澤德干涉儀光纖傳感器、激光器、光電隔離器、光纖、耦合器、探測(cè)器組成,如圖1所示[2-3].在光纖安防系統(tǒng)示意圖中,光信號(hào)產(chǎn)生于激光器,經(jīng)隔離器分離出上、下2束相干光.上、下2束光信號(hào)分別沿著順時(shí)針、逆時(shí)針方向傳播,探測(cè)器光纖將受到外界信號(hào)調(diào)制的光波傳輸?shù)焦馓綔y(cè)器進(jìn)行檢測(cè),將外界入侵信號(hào)從光波中提取出來并按需要進(jìn)行數(shù)據(jù)處理.
由于外界導(dǎo)致光纖振動(dòng)的監(jiān)測(cè)信號(hào)具有很強(qiáng)的不確定性,在統(tǒng)計(jì)上呈現(xiàn)為隨機(jī)性、非平穩(wěn)性和間歇性,這直接導(dǎo)致入侵事件類型的識(shí)別難度加大.隨著光纖安防監(jiān)測(cè)應(yīng)用的日益增多,分析研究光纖安防監(jiān)測(cè)信號(hào)的特點(diǎn)、改進(jìn)外界入侵事件類型的識(shí)別方法,具有十分重要的意義.
時(shí)頻分析(time frequency analysis)是光纖振動(dòng)監(jiān)測(cè)信號(hào)處理的常用方法.若光纖振動(dòng)信號(hào)為S(t),與其對(duì)應(yīng)的解析信號(hào)為Z(t),則其時(shí)頻分布(time frequency distribution, TFD)可以表示為[4-5]:
(1)
其中,KZ(t,τ)=Z(t+τ2)·Z(t-τ2)是瞬時(shí)自相關(guān)積,是S(t)的希爾伯特變換,F(xiàn)是傅里葉變換,表示時(shí)間卷積(time convolution),G(t,τ)是時(shí)滯核(time-lag kernel),即
這里α是一個(gè)正實(shí)數(shù),也稱作正規(guī)化因子.
傳感光纖是光纖安防監(jiān)測(cè)系統(tǒng)的重要組成部分,通常埋設(shè)在所保護(hù)區(qū)域周圍且在地面之下,這樣具有一定的隱蔽性.由于傳感光纖具有靈敏特性,它對(duì)各種觸碰或未直接觸碰傳導(dǎo)而至的外力入侵行為產(chǎn)生振動(dòng),進(jìn)而引起光纖內(nèi)部光信號(hào)傳輸產(chǎn)生擾動(dòng).在復(fù)雜的現(xiàn)實(shí)環(huán)境中,各種人為或非人為的自然干擾因素很多,這使得安防監(jiān)測(cè)系統(tǒng)正確識(shí)別入侵事件是一個(gè)挑戰(zhàn),要解決這個(gè)問題,應(yīng)當(dāng)從提取信號(hào)特征和識(shí)別方法著手.分析光纖安防系統(tǒng)監(jiān)測(cè)信號(hào)的時(shí)頻特征是一種重要方法[6].
近年來,光纖安防監(jiān)測(cè)信號(hào)的特征提取和識(shí)別方法取得許多研究成果.光纖振動(dòng)信號(hào)的特征提取方法主要有采用小波分解、采用其他分解模型以及采用信號(hào)波形統(tǒng)計(jì)參數(shù)的直觀特征提取方法.對(duì)光纖入侵事件的識(shí)別方法主要有神經(jīng)網(wǎng)絡(luò)識(shí)別方法、經(jīng)驗(yàn)閾值識(shí)別方法、支持向量機(jī)識(shí)別方法.
在各種光纖振動(dòng)信號(hào)的特征提取方法中,小波分解法是最為常用的一類方法,主要包括小波或小波包分解、小波降噪等.小波包比小波更為精細(xì),小波包的每一級(jí)能同時(shí)分解低頻和高頻分量,提高了時(shí)頻分辨率,提取的特征信息更豐富,有助于增強(qiáng)監(jiān)測(cè)系統(tǒng)的識(shí)別能力,但它對(duì)系統(tǒng)存儲(chǔ)和計(jì)算資源提出了更高要求.小波分解法應(yīng)用場(chǎng)合比較廣泛,尤其適合于信號(hào)中短時(shí)間內(nèi)突發(fā)異常的情形.
饒?jiān)平热薣7]采取多尺度邊緣檢測(cè)方法進(jìn)行信號(hào)分割和2層小波分解等處理,提取信號(hào)的峰值、長(zhǎng)度、幅度、周期等參數(shù)特征,根據(jù)提取的信號(hào)特征用經(jīng)驗(yàn)閾值法識(shí)別研究了4種報(bào)警行為:人工行走、奔跑、汽車行駛、物體跳躍振動(dòng).在對(duì)振動(dòng)信號(hào)進(jìn)行噪聲預(yù)處理和小波包分解之后,Jiang等人[8]提取系統(tǒng)監(jiān)測(cè)信號(hào)的3階小波包能量特征,用反向傳播(back propagation, BP)神經(jīng)網(wǎng)絡(luò)識(shí)別針對(duì)機(jī)場(chǎng)的3種入侵行為,即人工行走、汽車行駛、小動(dòng)物爬行.趙杰等人[9]則對(duì)光纖振動(dòng)信號(hào)進(jìn)行5層小波包分解,得到32個(gè)子頻帶的小波包系數(shù),在小波重構(gòu)之后提取各頻帶內(nèi)的信號(hào)分量,計(jì)算能量譜的特征向量,采用BVC-RBF神經(jīng)網(wǎng)絡(luò)(radial basis function neural network with boundary value constraints)算法識(shí)別振動(dòng)信號(hào)類型.羅光明等人[10]利用小波對(duì)振動(dòng)信號(hào)各頻帶進(jìn)行時(shí)域分析并計(jì)算各頻帶信號(hào)的能量,用小波各尺度上的能量構(gòu)造了特征向量.由于不同入侵事件引起的振動(dòng)信號(hào)及其變化會(huì)反映到各頻帶的能量上,這使得不同入侵事件的特征向量也不相同,最后采用經(jīng)驗(yàn)閾值法識(shí)別入侵事件.萬遂人等人[11]同樣進(jìn)行5層小波包分解,提取32維能量譜特征,再利用支持向量機(jī)分類器對(duì)光纖信號(hào)進(jìn)行分類.楊正理[12]利用2層小波分解光纖振動(dòng)信號(hào),提取2層小波系數(shù),通過經(jīng)驗(yàn)閾值法判斷男子攀爬及弱擾動(dòng)信號(hào)事件(風(fēng)雨、來往車輛震動(dòng)、飛鳥起降).喻驍芒等人[13]提取3層小波包分解頻帶能量特征,首先用閾值法判斷入侵事件和環(huán)境噪聲,當(dāng)檢測(cè)到發(fā)生入侵事件時(shí),用BP神經(jīng)網(wǎng)絡(luò)方法識(shí)別行人、小汽車、小動(dòng)物越境這3種入侵事件.楊正理等人[14]對(duì)降噪后的振動(dòng)信號(hào)進(jìn)行4層小波分解,求出振動(dòng)信號(hào)的小波能量熵分布特征,然后根據(jù)不同入侵事件產(chǎn)生的信號(hào)擾動(dòng)能量熵閾值范圍在不同小波尺度上的分布特點(diǎn)識(shí)別入侵事件.朱程輝等人[2]首先用閾值法判斷是否發(fā)生入侵事件,在發(fā)生入侵事件的情況下,對(duì)光纖振動(dòng)信號(hào)進(jìn)行小波變換,由能量譜和持續(xù)時(shí)間構(gòu)成特征向量,再用支持向量機(jī)分類算法識(shí)別入侵事件.李凱彥等人[15]利用希爾伯特變換、最大能量、最高信噪比挑選出振動(dòng)信號(hào)的特征段,用特征段持續(xù)時(shí)間和小波包能量譜構(gòu)成復(fù)合特征向量.在入侵事件類型識(shí)別階段采用二叉樹支持向量機(jī)方法識(shí)別入侵事件.朱程輝等人[16]根據(jù)監(jiān)測(cè)信號(hào)的小波變換系數(shù)計(jì)算短時(shí)能量分布特征,結(jié)合短時(shí)平均過零率特征,用對(duì)比法判斷是否發(fā)生入侵事件,再以小波各尺度上的能量分布特征與經(jīng)驗(yàn)值進(jìn)行比較后識(shí)別入侵事件類型.
這類特征提取方法包括7種:1)根據(jù)監(jiān)測(cè)信號(hào)的標(biāo)準(zhǔn)差、均值和方差等建立回歸方程的方法;2)根據(jù)監(jiān)測(cè)信號(hào)參數(shù)進(jìn)行動(dòng)態(tài)規(guī)劃的頻率-時(shí)間特征提取法;3)對(duì)監(jiān)測(cè)信號(hào)進(jìn)行本征模態(tài)模型分解法;4)采用高階譜分析的譜分析法;5)基音特征分析法;6)傅里葉分解法;7)提取門限過零率和稀疏編碼的特征提取法.
在回歸方程特征提取方法中,采用校驗(yàn)和多元回歸方法選擇最顯著的脈沖、方差和時(shí)間這3個(gè)參量作為特征向量,然后用閾值法識(shí)別信號(hào)類型[17].在頻率-時(shí)間特征提取方法中,提取光纖振動(dòng)信號(hào)的短時(shí)過零率特性,分段后建立相應(yīng)的特征參數(shù)模型,通過動(dòng)態(tài)規(guī)劃算法求出最優(yōu)特征參數(shù)作為信號(hào)的特征向量,采用人工神經(jīng)網(wǎng)絡(luò)方法識(shí)別入侵事件類型[18].蔣立輝等人[19]提出本征模態(tài)分解特征提取法,對(duì)混入白噪聲的光纖振動(dòng)信號(hào)進(jìn)行經(jīng)驗(yàn)?zāi)B(tài)分解,提取本征模態(tài)函數(shù)特征分量,利用支持向量機(jī)(support vector machine, SVM)及二值分類方法識(shí)別入侵事件.在譜分析特征提取方法中,對(duì)監(jiān)測(cè)信號(hào)先后進(jìn)行本征模態(tài)分解、小波分解和重構(gòu),然后提取監(jiān)測(cè)信號(hào)的高階譜分析特征,最后用SVM和反向傳播神經(jīng)網(wǎng)絡(luò)進(jìn)行信號(hào)分類[20].在畢福昆等人[21]提出的基于基音分析特征提取方法中,提取監(jiān)測(cè)信號(hào)的平均幅差特征參數(shù)作為信號(hào)的特征向量,再用門限閾值法區(qū)分4種入侵事件.在傅里葉分解的特征提取方法[22]中,對(duì)監(jiān)測(cè)信號(hào)傅里葉變換后計(jì)算不同信號(hào)在各頻段的能量占比特征,作為識(shí)別不同入侵事件的特征,最后采用線性判別分析分類器識(shí)別信號(hào)類型.在運(yùn)用門限過零率和稀疏編碼的特征提取方法[23]中,分為2個(gè)步驟:首先提取過零率,用于識(shí)別入侵振動(dòng)事件是否存在;然后,用稀疏自編碼神經(jīng)網(wǎng)模型提取信號(hào)的高維特征,并用神經(jīng)網(wǎng)絡(luò)方法識(shí)別4種模擬的入侵事件.
提取信號(hào)波形圖特征的方法,即提取監(jiān)測(cè)信號(hào)示意圖的直觀信號(hào)統(tǒng)計(jì)特征的提取方法.Seedahmed等人[24-25]提出光纖振動(dòng)信號(hào)的過零率概念,過零率表示在一定時(shí)間內(nèi),信號(hào)線與預(yù)定閾值線的相交次數(shù).用信號(hào)的過零率及其表示的其他統(tǒng)計(jì)參數(shù)組成特征向量,然后用閾值方法檢測(cè)或識(shí)別入侵事件.Seedahmed等人[26]還提取電平過零率、持續(xù)時(shí)間、最大振幅強(qiáng)度等參量,組成特征向量,利用人工神經(jīng)網(wǎng)絡(luò)及決策樹方法識(shí)別入侵事件.
在對(duì)光纖信號(hào)特征提取的3種方法中,大多數(shù)采用小波分解特征提取方法,其特點(diǎn)是計(jì)算量較大,特征向量的維數(shù)也較大,在應(yīng)用中需要占用較大的計(jì)算資源,適用于探測(cè)在正常信號(hào)中夾帶的瞬變反常信號(hào)并分析其成分;第2類特征提取方法則適用于一些特殊情形,如基于視頻分析的方法適用于具有明顯非平穩(wěn)特征的故障信號(hào)識(shí)別,本征模態(tài)分解法適用于非平穩(wěn)性、非線性過程信號(hào)的特征提取,傅里葉分解的方法則是計(jì)算時(shí)間較長(zhǎng);基于波形統(tǒng)計(jì)參數(shù)的特征提取法變化敏感,應(yīng)用中容易產(chǎn)生誤報(bào)現(xiàn)象,缺乏通用性.
在上述3種光纖入侵事件的識(shí)別方法中,經(jīng)驗(yàn)閾值識(shí)別法需人工確定閾值,適應(yīng)性較差.支持向量機(jī)識(shí)別方法不適用于解決多分類問題,需要人工確定核函數(shù).閾值法和支持向量機(jī)方法都有一定的局限性,而神經(jīng)網(wǎng)絡(luò)識(shí)別方法則應(yīng)用比較廣泛.但是神經(jīng)網(wǎng)絡(luò)識(shí)別方法要求采集較多的實(shí)驗(yàn)樣本,且目前對(duì)光纖入侵事件的正確識(shí)別率(或測(cè)試識(shí)別率)不高.
本文對(duì)光纖振動(dòng)信號(hào)進(jìn)行可視化分析,提取包括時(shí)域和空域的2維光纖振動(dòng)信號(hào)的特征,運(yùn)用約束極速學(xué)習(xí)機(jī)(constrained extreme learning machine, CELM)算法識(shí)別5種光纖入侵事件,實(shí)驗(yàn)表明,CELM算法提高了正確識(shí)別率.
在沒有受到外界入侵時(shí),光纖安防監(jiān)測(cè)系統(tǒng)工作在正常情況;當(dāng)有外界入侵事件發(fā)生時(shí),光纖振動(dòng)監(jiān)測(cè)信號(hào)發(fā)生變化,主要表現(xiàn)為短暫和突發(fā)振動(dòng).在時(shí)頻分析方法中,處理的參量主要是過零率和能量(也稱作短時(shí)平均能量)[27].
假定信號(hào)序列為x(n),n=0,1,…,N-1,這里N為窗函數(shù)的時(shí)長(zhǎng),則能量函數(shù)表達(dá)式為
(2)
其中ω(n)為窗序列值,n=M-1,M-2,…,N-1,M是相鄰窗之間的位移對(duì)應(yīng)的采樣點(diǎn)數(shù).
當(dāng)信號(hào)的連續(xù)2個(gè)采樣值的符號(hào)不同時(shí),若把信號(hào)當(dāng)作連續(xù)函數(shù)對(duì)待,則信號(hào)必須經(jīng)過零值,稱作過零,每秒時(shí)間內(nèi)過零的次數(shù)稱為過零率,它被用來描述信號(hào)頻譜的大致特性.過零率的表達(dá)式為
(3)
挖掘機(jī)挖掘、人工挖掘、汽車正常行駛這3種光纖振動(dòng)事件引起的光纖振動(dòng)信號(hào)見圖2~4所示(人員行走和噪聲這2種入侵事件的光纖振動(dòng)信號(hào)圖略).其中,圖2(a)、圖3(a)、圖4(a)是過零率示意圖;圖2(b)、圖3(b)、圖4(b)是能量圖;圖中橫坐標(biāo)是采樣地點(diǎn),采樣點(diǎn)間隔約為1 m;縱軸是采樣次數(shù),采樣時(shí)間周期大概是426 ms;豎軸表示過零率或能量.
Fig. 2 Optical fiber vibration signal caused by excavator excavation圖2 挖掘機(jī)挖掘事件的光纖振動(dòng)信號(hào)圖
Fig. 3 Optical fiber vibration signal caused by manual excavation圖3 人工挖掘事件的光纖振動(dòng)信號(hào)圖
Fig. 4 Optical fiber vibration signal caused by driving vehicle圖4 汽車行駛事件的振動(dòng)信號(hào)圖
在沒有外界入侵事件發(fā)生時(shí),安防系統(tǒng)監(jiān)測(cè)信號(hào)的過零率和能量都較小且是平穩(wěn)的;當(dāng)有入侵事件發(fā)生時(shí),監(jiān)測(cè)信號(hào)的振幅和頻率都會(huì)增大,過零率和能量也將增大.在一些弱小的入侵事件發(fā)生時(shí),監(jiān)測(cè)信號(hào)的能量變化可能不突出,但此時(shí)信號(hào)的過零率和平常信號(hào)仍存在一定差異.綜上分析,能量和過零率的變化信息能比較客觀地反映光纖安防監(jiān)測(cè)系統(tǒng)是否受到外界入侵事件的干擾.
基于3.1節(jié)的分析,本節(jié)探索5種光纖振動(dòng)監(jiān)測(cè)信號(hào)的多種特征提取方法.一般來說,信號(hào)的特征參數(shù)越多,描述信號(hào)特征的能力越強(qiáng).基于這樣的考慮,嘗試同時(shí)運(yùn)用過零率、能量、包絡(luò)(取16個(gè)分量)、傅里葉變換參數(shù)(取64個(gè)分量)這4個(gè)參數(shù),組成1個(gè)82維的特征向量,這里包絡(luò)是指反映高頻信號(hào)幅度變化的曲線;此外,對(duì)這4個(gè)參數(shù)的各種組合,如三元組(過零率、能量、包絡(luò))、(過零率、能量、傅里葉變換參數(shù))、(能量、包絡(luò)、傅里葉變換參數(shù)),二元組(過零率、能量)、(能量、包絡(luò))、(能量、傅里葉變換參數(shù)),以及單個(gè)參數(shù)作為特征向量,對(duì)5種入侵事件進(jìn)行了探索性的實(shí)驗(yàn),發(fā)現(xiàn)本文所提的特征提取方法具有較好的效果.
本文從各個(gè)實(shí)驗(yàn)的能量數(shù)據(jù)中,選擇位于奇數(shù)階方塊的中心能量值超過預(yù)定值的n×n(n=3,5,7,…)區(qū)域數(shù)據(jù),以及在過零率數(shù)據(jù)中相同位置和時(shí)間的同樣大小數(shù)據(jù)塊,將兩者結(jié)合起來組成1×(2×n×n)維的特征向量,作為實(shí)驗(yàn)樣本.
如圖5~7分別是挖掘機(jī)挖掘、人工挖掘、汽車行駛這3種入侵事件的監(jiān)測(cè)信號(hào)的過零率和能量特征樣本示意圖(人員行走和自然噪聲這2種入侵事件的光纖振動(dòng)信號(hào)圖略).圖中的特征樣本小方塊以矩陣方式排列,坐標(biāo)的橫軸和縱軸分別表示特征樣本小方塊所在的行號(hào)和列號(hào).圖5(a)、圖6(a)、圖7(a)是過零率的特征樣本,圖5(b)、圖6(b)、圖7(b)是能量的特征樣本,圖5~7中1個(gè)小方塊代表1個(gè)3×3的特征樣本,而圖5~7都含有20×20個(gè)這樣的小方塊.
Fig. 5 The characteristic sample of optical fiber vibration signal caused by excavator excavation圖5 挖掘機(jī)挖掘的光纖振動(dòng)信號(hào)特征樣本
Fig. 6 The characteristic sample of optical fiber vibration signal caused by manual excavation圖6 人工挖掘的光纖振動(dòng)信號(hào)特征樣本
Fig. 7 The characteristic sample of optical fiber vibration signal caused by driving vehicle圖7 汽車行駛的光纖振動(dòng)信號(hào)特征樣本
從圖2~7可見,不同類型的入侵事件引起的過零率和能量特征樣本各不相同,且外觀結(jié)構(gòu)比較復(fù)雜,特征不顯著.極速學(xué)習(xí)機(jī)算法能夠從大量復(fù)雜數(shù)據(jù)中找出規(guī)律,抓住信號(hào)的本質(zhì)特征,并建立模型.這是采用約束極速學(xué)習(xí)機(jī)方法識(shí)別光纖振動(dòng)入侵事件類型的出發(fā)點(diǎn).
按照入侵事件的危害性,把挖掘機(jī)挖掘、人工挖掘、汽車行駛、人員行走和自然噪聲這5種事件分為3個(gè)等級(jí):1)緊急事件,指有很強(qiáng)的破壞性,需緊急處理的入侵事件,包括挖掘機(jī)挖掘、人工挖掘;2)重要事件,指有較大的破壞性,需盡快處理的入侵事件,包括汽車行駛、人員行走;3)一般事件,指沒有破壞性的事件,包括自然噪聲事件.緊急的破壞事件的預(yù)警級(jí)別應(yīng)當(dāng)先于其他事件,而重要事件應(yīng)當(dāng)先于一般的噪聲事件.經(jīng)過實(shí)驗(yàn)表明,對(duì)于機(jī)器學(xué)習(xí)方法,采用二分類任務(wù)決策樹模型的正確識(shí)別率比一次性完成多分類的正確識(shí)別率更高,因此,采用決策樹二分類模型,在決策樹每個(gè)結(jié)點(diǎn)對(duì)應(yīng)一個(gè)識(shí)別任務(wù).
2004年,Huang等人[28]提出的極速學(xué)習(xí)機(jī)(extreme learning machine, ELM)模型,很快得到廣泛應(yīng)用[29].極速學(xué)習(xí)機(jī)是一類前饋神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)算法,其主要特點(diǎn)是隱含層節(jié)點(diǎn)參數(shù)可以隨機(jī)或人為給定且不需要調(diào)整,學(xué)習(xí)過程僅需計(jì)算輸出權(quán)重.ELM具有學(xué)習(xí)效率高、泛化能力強(qiáng)的優(yōu)點(diǎn),被廣泛應(yīng)用于分類、回歸、聚類、特征學(xué)習(xí)等問題的研究中。
極速學(xué)習(xí)機(jī)中隱含層權(quán)重參數(shù)的完全隨機(jī)性,往往無法表示出輸入樣本的判別性特征.這些非約束隨機(jī)參數(shù)使得極速學(xué)習(xí)機(jī)需要產(chǎn)生很多隱層節(jié)點(diǎn),才能達(dá)到比較滿意的泛化性能.但是,更多的隱節(jié)點(diǎn)意味著更長(zhǎng)的訓(xùn)練和測(cè)試時(shí)間,以及出現(xiàn)過擬合的可能性增加.有研究表明[30],類間樣本差向量對(duì)于分類任務(wù)是很有效的.文獻(xiàn)[31]提出的約束極速學(xué)習(xí)機(jī)方法,用基于樣本的類別先驗(yàn)信息產(chǎn)生從輸入層到隱含層的權(quán)值,即以樣本向量的線性組合作為極速學(xué)習(xí)機(jī)網(wǎng)絡(luò)結(jié)構(gòu)中的隱層權(quán)值.其目的是在特征空間中將不同類別的樣本分割在不同的區(qū)域內(nèi),即在隱含層中提取判別性特征.
約束極速學(xué)習(xí)機(jī)算法通過將極速學(xué)習(xí)機(jī)中完全隨機(jī)的權(quán)值向量參數(shù)約束在一定范圍之內(nèi),并不是完全隨機(jī)的向量.基于類間樣本差向量的約束極速學(xué)習(xí)機(jī)(constrained difference extreme learning machine, CDELM)算法是把不同類型樣本之間的差向量作為權(quán)值向量,而基于混合向量的約束極速學(xué)習(xí)機(jī)(constrained mixed extreme learning machine, CMELM)算法則是把類間樣本差向量、類內(nèi)樣本和向量作為權(quán)值向量.通過在典型數(shù)據(jù)集上驗(yàn)證表明,各約束極速學(xué)習(xí)機(jī)的正確識(shí)別率都有不同程度的提高.
利用基于樣本向量之差極速學(xué)習(xí)機(jī)和基于混合向量約束極速學(xué)習(xí)機(jī)方法識(shí)別5種光纖入侵事件.
3.3.1 決策樹模型
決策樹模型是一種常用的分類方法,基于樹結(jié)構(gòu)進(jìn)行決策.決策樹是一種監(jiān)督學(xué)習(xí)模型,給定一個(gè)樣本集,通過學(xué)習(xí)得到一個(gè)分類器,能夠?qū)π鲁霈F(xiàn)的對(duì)象進(jìn)行正確的分類.這里采用二分類任務(wù)決策樹模型,根結(jié)點(diǎn)對(duì)應(yīng)全部的樣本,葉結(jié)點(diǎn)是相應(yīng)的決策結(jié)果,其他結(jié)點(diǎn)則對(duì)應(yīng)某種屬性測(cè)試;從根結(jié)點(diǎn)到每個(gè)葉結(jié)點(diǎn)所經(jīng)過的路徑對(duì)應(yīng)一個(gè)屬性判定序列.
對(duì)光纖振動(dòng)監(jiān)測(cè)信號(hào)的識(shí)別流程見圖8所示.按照入侵事件等級(jí)劃分,建立決策樹中各結(jié)點(diǎn)對(duì)應(yīng)的樣本類型,并將圖8中各結(jié)點(diǎn)的分類任務(wù)分別標(biāo)記為第1~4階段任務(wù).
Fig. 8 Flow chart for identifying optical fiber vibration signals圖8 安防監(jiān)測(cè)信號(hào)識(shí)別流程圖
3.3.2 約束極速學(xué)習(xí)機(jī)算法
對(duì)于任意N個(gè)不同樣本(xi,yi) ,其中xi=(xi1,xi2,…,xin)T∈Rn,yi=(yi1,yi2,…,yim)T∈Rm,則前饋神經(jīng)網(wǎng)絡(luò)的輸出可表示為
(4)
xj∈Rn,ai∈Rn,βi∈Rm,
其中,x=(x1,x2,…,xN),G()是激勵(lì)函數(shù),L是隱層節(jié)點(diǎn)數(shù),ai=(ai1,ai2,…,ain)T是輸入層到第i個(gè)隱層節(jié)點(diǎn)的輸入權(quán)值系數(shù),bi是第i個(gè)隱節(jié)點(diǎn)偏置;βi=(βi1,βi2,…,βim)T是第i個(gè)隱節(jié)點(diǎn)的輸出權(quán)值向量;ai·xi是向量ai和xi的內(nèi)積.
若該神經(jīng)網(wǎng)絡(luò)能以零誤差逼近N個(gè)樣本,則存在ai,bi,βi,使
(5)
j=1,2,…,L,
式(5)可以化簡(jiǎn)為Hβ=Y,其中:
H(a1,a2,…,aL,b1,b2,…,bL,x1,x2,…,xL)=
(6)
H是神經(jīng)網(wǎng)絡(luò)的隱層輸出系數(shù)矩陣,在極速學(xué)習(xí)機(jī)算法[25]中,可任意給定輸入層系數(shù)和偏置,上述前饋神經(jīng)網(wǎng)絡(luò)的訓(xùn)練要求出輸入層系數(shù)的最小二乘解,輸出層系數(shù)矩陣β可由下式計(jì)算得到
其中,H+表示H的偽逆矩陣.
在約束極速學(xué)習(xí)機(jī)算法[31]中,輸入權(quán)值和偏置向量不是隨機(jī)給定,而是從訓(xùn)練集得到.
在基于類間樣本差向量的約束極速學(xué)習(xí)機(jī)算法中,從訓(xùn)練集中隨機(jī)選出2個(gè)不同類別的樣本Xc1和Xc2,得到差向量Xc2-Xc1,對(duì)其進(jìn)行標(biāo)準(zhǔn)化后得
以此作為輸入層到隱含層節(jié)點(diǎn)的一個(gè)權(quán)值向量,由L對(duì)樣本組成輸入權(quán)值矩陣.
同時(shí),計(jì)算相應(yīng)的偏置向量
(7)
其中L2表示向量的2-范數(shù).
(8)
偏置向量的另一半分量在實(shí)數(shù)區(qū)間[-1,1]中均勻選取.
理論上,CDELM嘗試在隱含層中提取判別性特征.極速學(xué)習(xí)機(jī)的隱含層中完全隨機(jī)參數(shù)不總是能夠表示判別性的特征.有研究表明,類間樣本差向量對(duì)于分類任務(wù)很有效.將極速學(xué)習(xí)機(jī)的權(quán)值向量參數(shù)隨機(jī)產(chǎn)生約束在類間樣本差向量的封閉集合中,而不是任意向量的開放集合中.從輸入層到隱含層的神經(jīng)元的本質(zhì)是將原始樣本映射到這些向量張成的判別性特征空間中.在該特征空間中,樣本可以很好地分開.隨機(jī)使用類間樣本差向量產(chǎn)生從輸入層到隱含層的權(quán)值向量,類間樣本差向量可以將樣本映射到比極速學(xué)習(xí)機(jī)更具有判別性的空間中.用基于樣本的類別先驗(yàn)信息來產(chǎn)生從輸入層到隱含層的權(quán)值.這樣做的目的是在特征空間中將不同類別的樣本分割在不同的區(qū)域內(nèi).CDELM的本質(zhì)是約束隱神經(jīng)元的輸入連接權(quán)的方向和從一類到另一類的方向一致,因此將隨機(jī)權(quán)值選取約束在由類間樣本差向量的集合中.
CMELM使用類間樣本差向量和類內(nèi)樣本和向量的混合向量,構(gòu)建從輸入層到隱含層的權(quán)值.CMELM首先按照基于類間樣本差向量的約束極速學(xué)習(xí)機(jī)產(chǎn)生一半數(shù)目的隱層權(quán)值和相應(yīng)的偏置;然后按照基于類內(nèi)樣本和向量的約束極速學(xué)習(xí)機(jī)產(chǎn)生一半數(shù)目的隱層權(quán)值和相應(yīng)的偏置;最后將從輸入層到隱含層的權(quán)值設(shè)為這些向量和偏置.由于最后一層的線性性質(zhì),CMELM事實(shí)上是基于類內(nèi)樣本和向量的約束極速學(xué)習(xí)機(jī)和基于類間樣本差的約束極速學(xué)習(xí)機(jī)的模型平均.
實(shí)驗(yàn)的目的是: 1)參數(shù)尋優(yōu),即尋找光纖信號(hào)特征提取方法的合適參數(shù),包括實(shí)驗(yàn)樣本的數(shù)據(jù)塊大小n、約束極速學(xué)習(xí)機(jī)算法中的激勵(lì)函數(shù)和隱層節(jié)點(diǎn)數(shù)目;2)約束極速學(xué)習(xí)機(jī)識(shí)別光纖入侵事件的效果.實(shí)驗(yàn)數(shù)據(jù)來自合作方提供的真實(shí)數(shù)據(jù),包括人工挖掘、挖掘機(jī)挖掘、汽車行駛、人員行走和噪聲分別產(chǎn)生的光纖振動(dòng)數(shù)據(jù),采集的數(shù)據(jù)主要有過零率、能量以及相應(yīng)的光纖傳感器空間位置.
1) 實(shí)驗(yàn)平臺(tái).聯(lián)想品牌的筆記本Y400、內(nèi)存12 GB、機(jī)械硬盤120 GB、微軟Windows 10 專業(yè)版操作系統(tǒng),應(yīng)用軟件Matlab(2016a).
2) 實(shí)驗(yàn)設(shè)計(jì).在參數(shù)尋優(yōu)的實(shí)驗(yàn)中,分別選取3種尺寸大小(n×n,n=3,5,7)的數(shù)據(jù)方塊作為樣本;約束極速學(xué)習(xí)機(jī)算法中的激勵(lì)函數(shù),考慮常見的5種激勵(lì)函數(shù)為Sigmoid,Sine,Hardlim,Triangular basis,Radial basis分別對(duì)2種約束極速學(xué)習(xí)機(jī)算法進(jìn)行訓(xùn)練和測(cè)試;在隱層神經(jīng)元個(gè)數(shù)的尋優(yōu)中,考慮的隱層神經(jīng)元個(gè)數(shù)分別為100,200,500,700,1 000,2 000,5 000,7 000,10 000.通過實(shí)驗(yàn)結(jié)果表明,分別選取3種不同大小(n×n,n=3,5,7)的數(shù)據(jù)塊作為訓(xùn)練和測(cè)試樣本對(duì)事件的正確識(shí)別率的影響不顯著,但提取3×3數(shù)據(jù)塊的特征樣本的正確識(shí)別率略高.另外,激勵(lì)函數(shù)對(duì)CELM算法實(shí)驗(yàn)結(jié)果的影響不顯著,此外,我們還對(duì)不同隱層神經(jīng)元數(shù)量對(duì)正確識(shí)別率的影響進(jìn)行實(shí)驗(yàn).提取的實(shí)驗(yàn)樣本總數(shù)約為4萬,樣本集的23用于訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,另外13用于測(cè)試.實(shí)驗(yàn)中的識(shí)別過程按照?qǐng)D8所示的識(shí)別流程進(jìn)行,對(duì)光纖振動(dòng)信號(hào)整個(gè)識(shí)別過程分為4個(gè)階段:第1階段分辨出緊急事件和非緊急事件;第2階段在發(fā)生緊急事件時(shí)判斷緊急事件的類型,即事件屬于挖掘機(jī)挖掘還是人工挖掘事件;第3階段是在發(fā)生非緊急事件的情況下判斷是否是自然噪聲,如果不是則進(jìn)入第4階段任務(wù),識(shí)別汽車行駛和人員行走.
識(shí)別算法中,首先需要確定特征向量.上文已經(jīng)完成選取特征向量工作的一部分,但特征向量的維數(shù)仍待定.其次,CDELM和CMELM這2種算法中,隱層節(jié)點(diǎn)個(gè)數(shù)和激勵(lì)是待定參數(shù).下面的實(shí)驗(yàn)將為特征向量的維數(shù)、隱層節(jié)點(diǎn)個(gè)數(shù)和激勵(lì)函數(shù)的確定提供支撐.
4.1.1 數(shù)據(jù)塊大小對(duì)識(shí)別率的影響實(shí)驗(yàn)
根據(jù)圖8所示的實(shí)驗(yàn)流程,用3種大小的n×n(n=3,5,7)的數(shù)據(jù)樣本進(jìn)行實(shí)驗(yàn),其中大小為3×3的數(shù)據(jù)塊樣本總數(shù)約為4萬,分別用CDELM算法、CMELM算法在各階段的實(shí)驗(yàn)結(jié)果見表1、表2以及圖9、圖10.
Table 1 Experiments of CDELM on Different Size Samples表1 CDELM對(duì)樣本不同維數(shù)的實(shí)驗(yàn)
Table 2 Experiments of CMELM on Different Size Samples表2 CMELM對(duì)樣本不同維數(shù)的實(shí)驗(yàn)
Fig. 9 The recognition rate of CDELM for different size samples圖9 CDELM對(duì)樣本不同維數(shù)的識(shí)別率
Fig. 10 The recognition rate of CMELM for different size samples圖10 CMELM對(duì)樣本不同維數(shù)的識(shí)別率
從表1和表2中可見,除個(gè)別情況之外,2種約束極速學(xué)習(xí)機(jī)算法對(duì)于3×3樣本的識(shí)別率都略高于用5×5和7×7樣本進(jìn)行實(shí)驗(yàn)的識(shí)別率,但相差不大.另外,在訓(xùn)練時(shí)間上的差異明顯,這是由于樣本數(shù)量上的差異造成的.
4.1.2 激勵(lì)函數(shù)對(duì)識(shí)別率的影響實(shí)驗(yàn)
分別用5個(gè)常見激勵(lì)函數(shù)Sigmoid,Sine,Triangular basis,Radial basis,Hardlim對(duì)2種約束極速學(xué)習(xí)機(jī)算法進(jìn)行訓(xùn)練和測(cè)試,這里的特征樣本取3×3數(shù)據(jù)塊,隱層節(jié)點(diǎn)個(gè)數(shù)為500.這些激勵(lì)函數(shù)在各實(shí)驗(yàn)階段的結(jié)果見圖11和圖12.可以看出,CDELM和CMELM算法在激勵(lì)函數(shù)為Sigmoid時(shí)在各階段的正確識(shí)別率較高,且表現(xiàn)較為平穩(wěn).
Fig. 11 The correct recognition rate of CDELM for different excitation functions圖11 CDELM對(duì)不同激勵(lì)函數(shù)的正確識(shí)別率
Fig. 12 The correct recognition rate of CMELM for different excitation functions圖12 CMELM對(duì)不同激勵(lì)函數(shù)的正確識(shí)別率
4.1.3 隱層節(jié)點(diǎn)個(gè)數(shù)對(duì)正確識(shí)別率的影響實(shí)驗(yàn)
選擇3×3的特征樣本,激勵(lì)函數(shù)選擇Sigmoid,對(duì)2種約束極速算法中的隱層節(jié)點(diǎn)不同個(gè)數(shù)進(jìn)行模型訓(xùn)練和測(cè)試.表3和表4中都表明,當(dāng)隱層節(jié)點(diǎn)為500個(gè)時(shí),識(shí)別率達(dá)到最高.實(shí)驗(yàn)表明,在其余3個(gè)階段的實(shí)驗(yàn)結(jié)果是類似的.
根據(jù)4.1節(jié)分析結(jié)果,在CDELM和CMELM算法的實(shí)驗(yàn)中,選擇樣本大小為3×3的數(shù)據(jù)塊,選擇激勵(lì)函數(shù)用Sigmoid函數(shù),500個(gè)隱層節(jié)點(diǎn);ELM算法中的參數(shù)與之相同.BP算法實(shí)驗(yàn)中,同樣選擇用500個(gè)隱層節(jié)點(diǎn),迭代次數(shù)上限為1 000.SVM算法實(shí)驗(yàn)采用系統(tǒng)默認(rèn)選項(xiàng).
Table 3 Experiments of CDELM on Different Numbers of Hidden Layer Nodes表3 CDELM對(duì)不同隱節(jié)點(diǎn)數(shù)的實(shí)驗(yàn)
Table 4 Experiments of CMELM on Different Numbers of Hidden Layer Nodes表4 CMELM對(duì)不同隱節(jié)點(diǎn)數(shù)的實(shí)驗(yàn)
第1階段識(shí)別緊急事件和非緊急事件,表5中給出了實(shí)驗(yàn)結(jié)果.實(shí)驗(yàn)說明CDELM和CMELM算法的識(shí)別率高于其他3種算法,雖然訓(xùn)練時(shí)間與ELM算法相近,但比BP,SVM算法則大大縮短.
在第1階段檢測(cè)出發(fā)生緊急事件時(shí),對(duì)挖掘機(jī)挖掘還是人工挖掘事件的識(shí)別任務(wù)在第2階段進(jìn)行,實(shí)驗(yàn)結(jié)果見表6.CDELM和CMELM算法在測(cè)試準(zhǔn)確率上略高于其他3種算法,在訓(xùn)練時(shí)間上比BP,SVM顯著縮短.5種算法對(duì)2種破壞事件的正確識(shí)別率都較高,說明不同事件特征明顯.
Table 5 Experiment of Stage 1表5 第1階段實(shí)驗(yàn)
Table 6 Experiment of Stage 2表6 第2階段實(shí)驗(yàn)
在第1階段檢測(cè)出發(fā)生非緊急事件時(shí),識(shí)別自然噪聲還是非自然噪聲的任務(wù)在第3階段進(jìn)行.實(shí)驗(yàn)結(jié)果見表7.從表7中可見,2種約束極速學(xué)習(xí)機(jī)算法CDELM及CMELM的識(shí)別率比其他3種算法都高, CDELM和CMELM算法的訓(xùn)練時(shí)間比BP算法明顯縮短,但測(cè)試時(shí)間略高于ELM,BP算法.
Table 7 Experiment of Stage 3表7 第3階段實(shí)驗(yàn)
在第3階段檢測(cè)出發(fā)生非重要事件時(shí),識(shí)別汽車行駛還是人員行走的任務(wù)在第4階段進(jìn)行.表8中的實(shí)驗(yàn)結(jié)果表明,2種約束極速學(xué)習(xí)機(jī)算法的識(shí)別率比其余3種方法的識(shí)別率都高,在訓(xùn)練時(shí)間上,差別不大(除BP算法之外),而測(cè)試時(shí)間幾乎相同.
綜合上述實(shí)驗(yàn)結(jié)果,在第1~4階段,2種約束極速學(xué)習(xí)機(jī)算法CDELM及CMELM的正確識(shí)別率都高于其他3種算法,在模型訓(xùn)練時(shí)間、訓(xùn)練正確率上也具備明顯的優(yōu)勢(shì).圖13對(duì)5種算法的實(shí)驗(yàn)結(jié)果進(jìn)行比較,表明2種約束極速學(xué)習(xí)機(jī)算法在各階段的正確識(shí)別率都高于其他算法.從各實(shí)驗(yàn)結(jié)果還表明,CDELM和CMELM這2種約束極速學(xué)習(xí)機(jī)算法在各實(shí)驗(yàn)階段正確識(shí)別率相差很小(低于0.002),前者略高于后者,所以圖13中2條識(shí)別率曲線顯示重合.
Table 8 Experiment of Stage 4表8 第4階段實(shí)驗(yàn)
根據(jù)光纖振動(dòng)信號(hào)識(shí)別流程圖,綜合在第1~4階段的實(shí)驗(yàn)結(jié)果,按照2個(gè)關(guān)系式進(jìn)行計(jì)算:事件的識(shí)別率(葉結(jié)點(diǎn))=從根結(jié)點(diǎn)到葉結(jié)點(diǎn)各階段測(cè)試識(shí)別率相乘;事件的識(shí)別時(shí)間(葉結(jié)點(diǎn))=從根結(jié)點(diǎn)到葉結(jié)點(diǎn)各階段測(cè)試時(shí)間相加.5種入侵事件的正確識(shí)別率和檢測(cè)過程所需時(shí)間,結(jié)果如表9所示.可以看出,運(yùn)用約束極速學(xué)習(xí)機(jī)算法,對(duì)各類事件的正確識(shí)別率都有顯著提高,且訓(xùn)練模型和識(shí)別時(shí)間差別很小,計(jì)算復(fù)雜性沒有明顯增加.
Fig. 13 Comparison of correct recognition rate among five algorithms圖13 5種算法的正確識(shí)別率比較
Table 9 Recognition Rate and Time of Five Types of Events表9 對(duì)5類事件的識(shí)別率及識(shí)別時(shí)間
由于外界導(dǎo)致光纖振動(dòng)的監(jiān)測(cè)信號(hào)具有很強(qiáng)的不確定性,在統(tǒng)計(jì)上呈現(xiàn)為隨機(jī)性、非平穩(wěn)性和間歇性,導(dǎo)致正確識(shí)別光纖振動(dòng)的事件類型難度較大,現(xiàn)有的各種特征提取方法和識(shí)別方法有很強(qiáng)的局限性.對(duì)光纖信號(hào)的預(yù)處理以小波分解處理為主,在實(shí)際應(yīng)用中缺乏自適應(yīng)性;在對(duì)光纖振動(dòng)信號(hào)的識(shí)別方法中,以神經(jīng)網(wǎng)絡(luò)方法、經(jīng)驗(yàn)閾值判別法及支持向量機(jī)識(shí)別方法為主,但正確識(shí)別率不高.為提高正確識(shí)別率,應(yīng)對(duì)安防系統(tǒng)監(jiān)測(cè)信號(hào)進(jìn)行深入研究,準(zhǔn)確地描述不同入侵事件的本質(zhì)特征.
通過實(shí)驗(yàn),我們提出的特征提取方法和識(shí)別方法顯著提高了光纖入侵事件的識(shí)別率.即在過零率采集數(shù)據(jù)中,提取3×3的數(shù)據(jù)塊作為特征向量,要求數(shù)據(jù)塊中心對(duì)應(yīng)的能量值超過預(yù)定閾值.采用二分類任務(wù)決策樹模型,分別用CDELM和CMELM這2種約束極速學(xué)習(xí)機(jī)算法識(shí)別入侵事件,與ELM,BP和SVM算法相比,顯著提高了事件的正確識(shí)別率,模型訓(xùn)練時(shí)間大大縮短,但測(cè)試用時(shí)相差不大.
本文特征提取方法的新意主要體現(xiàn)在3方面:
1) 傳統(tǒng)的特征提取方法多是在時(shí)域維度提取1維的向量信息,而本文提取的樣本特征數(shù)據(jù)則同時(shí)包括時(shí)域和空域2個(gè)維度的信息,這里空域是指物理位置相鄰的信號(hào)采樣點(diǎn),即提取連續(xù)時(shí)間、相鄰的信號(hào)采樣點(diǎn)的過零率數(shù)據(jù)構(gòu)成的2維矩陣作為實(shí)驗(yàn)樣本,因此,提取2維信息將比1維信息更加豐富,這符合常理,從我們的實(shí)驗(yàn)中證明了這一點(diǎn).
2) 通過對(duì)數(shù)據(jù)可視化結(jié)果分析,發(fā)現(xiàn)在高能量的信號(hào)采樣點(diǎn)的過零率特征、在2個(gè)維度(時(shí)域和空域)上隨不同事件類型而不同,由此決定選取相應(yīng)區(qū)域的過零率數(shù)據(jù)(2維矩陣)作為選取特征樣本數(shù)據(jù).
3) 經(jīng)過實(shí)驗(yàn)證明,本文的特征提取方法能滿足實(shí)時(shí)處理、識(shí)別和預(yù)警的要求.