吳 虎,孔 勇,王振偉,丁 偉,李 歡
(上海工程技術(shù)大學(xué)電子電氣工程學(xué)院,上海 201620)
DAS因其抗電磁、監(jiān)測范圍大等優(yōu)點(diǎn)在管道監(jiān)測、周界預(yù)警、地震預(yù)測、入侵檢測等領(lǐng)域得到了廣泛應(yīng)用?;讦?OTDR的DAS與其他光纖入侵傳感器相比,具有靈敏度高、全分布方式、成本相對較低、可實(shí)現(xiàn)遠(yuǎn)程入侵檢測等優(yōu)點(diǎn),是一項(xiàng)很有發(fā)展前途的技術(shù)[1-5]。在對入侵事件進(jìn)行識別的過程中,主要可分為四個(gè)模塊:對入侵振動(dòng)信號進(jìn)行預(yù)處理;特征提取;制作數(shù)據(jù)集;使用識別算法進(jìn)行分類。由于在實(shí)際環(huán)境中存在大量的振動(dòng)源,但是對振動(dòng)事件的識別主要是其中的部分振動(dòng),其余的振動(dòng)信號為噪聲,如果不對采集的信號進(jìn)行濾波處理,對最后的識別結(jié)果影響會(huì)非常大,因此對振動(dòng)信號進(jìn)行預(yù)處理是非常有必要的,常用的去噪方式有小波包去噪[6]、變分模態(tài)分解(VMD)[7]等,在文獻(xiàn)[8]中提出使用EMD將φ-OTDR采集的振動(dòng)信號分解為一系列的固有模態(tài)函數(shù)(IMF)和殘差分量。使用PCC選擇出無振動(dòng)的位置,通過去除多個(gè)IMFs來消除高頻噪聲,該方式將100 Hz和1.2 kHz的振動(dòng)事件的信噪比分別提高到42.52 dB和39.58 dB。常用的特征提取方式有提取振動(dòng)信號的傅里葉變換特征、短時(shí)能量、梅爾倒頻系數(shù)等[9-11],或者使用EMD[12]、VMD[13]、小波變換[14]算法將信號分解后提取相關(guān)的統(tǒng)計(jì)學(xué)特征。典型的分類算法主要有:支持向量機(jī)(SVM)[15]、極值梯度下降(XGBOOST)[16]、隨機(jī)森林樹[17]。這些方法雖然可以比較準(zhǔn)確地識別出入侵事件的類別,但是其運(yùn)算量大,非常耗時(shí),所以當(dāng)DAS的監(jiān)測距離很大時(shí),這些方式的識別時(shí)間會(huì)隨著監(jiān)測距離的增加而增加。由于特征提取會(huì)耗費(fèi)大量時(shí)間,故開始使用二維卷積神經(jīng)網(wǎng)絡(luò)[18]、概率神經(jīng)網(wǎng)絡(luò)[19]、多層卷積神經(jīng)網(wǎng)絡(luò)[20]結(jié)合的方式對振動(dòng)信號進(jìn)行識別,在文獻(xiàn)[21]中提出使用一維卷積神經(jīng)網(wǎng)絡(luò)結(jié)合SVM對油氣管道入侵事件進(jìn)行識別,該方式直接將經(jīng)過預(yù)處理的振動(dòng)信號喂入一維卷積神經(jīng)網(wǎng)絡(luò),達(dá)到了與二維卷積神經(jīng)網(wǎng)絡(luò)相近的準(zhǔn)確率,降低了識別時(shí)間。
因此在本次研究提出使用EMD算法分解振動(dòng)信號,然后再使用PCC選擇出有效的IMF分量,并使用WTD對有效的IMF分量進(jìn)行去噪,將去噪后的IMF分量進(jìn)行重構(gòu),最后將重構(gòu)信號輸入一維卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行識別。實(shí)驗(yàn)表明該方式能有效識別出入侵事件類別。
φ-OTDR[22]的結(jié)構(gòu)與OTDR的結(jié)構(gòu)相近,不同的是φ-OTDR使用的激光器為窄線寬激光器,其注入光為強(qiáng)相干光[23]。φ-OTDR的原理為:在傳感光纖中找出三個(gè)間隔相等的點(diǎn),分別命名為a點(diǎn)、b點(diǎn)、c點(diǎn),a點(diǎn)產(chǎn)生的后向瑞利散射光(BRS)不會(huì)與b、c點(diǎn)產(chǎn)生的BRS發(fā)生干涉,但是脈沖光由a點(diǎn)傳播到c點(diǎn)產(chǎn)生的BRS會(huì)與在b點(diǎn)產(chǎn)生的BRS發(fā)生干涉,當(dāng)在c點(diǎn)有振動(dòng)時(shí),c點(diǎn)的BRS的相位會(huì)發(fā)生變化,因此干涉后的BRS中攜帶了由于振動(dòng)引起的相位變化信息。不同類型的振動(dòng)事件所引起的相位變化也不同,最后形成的波形也不盡相同,因此可以采用相應(yīng)識別算法對振動(dòng)事件波形進(jìn)行識別。
基于φ-OTDR的DAS結(jié)構(gòu)如圖1所示,在圖1中,分布式反饋激光器(DFB-LD)作為系統(tǒng)光源,激光經(jīng)過聲光調(diào)制器(AOM)后被調(diào)制為脈沖光。脈沖光經(jīng)過摻鉺光纖放大器(EDFA)放大后使用帶通濾波器(BPF)濾除由EDFA產(chǎn)生的放大自發(fā)輻射(ASE)噪聲。經(jīng)過濾波的脈沖光通過光環(huán)形器(OC)進(jìn)入傳感光纖,在傳感光纖中產(chǎn)生的BRS往回傳播。BRS通過OC被注入EDFA中進(jìn)行放大,并且使用BPF濾除ASE噪聲。經(jīng)過濾波的BRS被光電探測器(PD)轉(zhuǎn)為電信號,最后被DAQ采集。
圖1 φ-OTDR系統(tǒng)結(jié)構(gòu)圖Fig.1 Structure of φ-OTDR system
EMD能將非平穩(wěn)時(shí)間序列、非線性信號分解成K個(gè)從高頻到低頻的IMF分量(Ei)和殘余函數(shù)(Wi),如公式(1)所示。
(1)
分解出的各分量應(yīng)滿足兩點(diǎn)要求:分量信號的極值和過零點(diǎn)數(shù)量最多不超過一個(gè);分量信號的任意局部最大包絡(luò)與最小包絡(luò)的均值應(yīng)為0。EMD算法的步驟如下:
(1)得出待分解信號全部的極大值點(diǎn)以及極小值點(diǎn),使用三次樣條插值法得出待分解信號的上包絡(luò)線與下包絡(luò)線。
(2)計(jì)算出上下包絡(luò)線均值p(t),將p(t)與待分解信號x(t)相減得到y(tǒng)(t),若y(t)滿足IMF條件,則y(t)為首個(gè)IMF記為E1,若不滿足IMF條件則重復(fù)步驟(1)和(2)直到滿足IMF條件為止。引入標(biāo)準(zhǔn)差SD判斷振源信號分解是否結(jié)束,SD值通常在0.2至0.3之間[24]。
(2)
(3)將E1從待分解信號中分離得到W1=x(t)-E1,W1為殘差函數(shù)。
(4)將步驟(3)得到的W1視為新的待分解信號,重復(fù)步驟(1)到步驟(3)得到E2,E3,…,En,當(dāng)Wn的絕對值很小或者變?yōu)闇p函數(shù)時(shí),停止分解。
PCC是用來計(jì)算兩種變量相關(guān)性的一種方式。計(jì)算PCC會(huì)得到兩個(gè)指標(biāo):相關(guān)系數(shù)(R)、相關(guān)指數(shù)(P)。其中R的值在-1到1之間,當(dāng)R越接近于1說明兩種變量正相關(guān)程度越高,當(dāng)R越接近于-1說明兩種變量負(fù)相關(guān)程度越高,當(dāng)R越接近0說明兩種變量越不相關(guān)。P的值越小說明相關(guān)程度越高,P是相關(guān)程度判斷的第一準(zhǔn)則,當(dāng)P值大于0.05時(shí),不用考慮R值,直接判斷兩種變量不相關(guān)。
PCC的計(jì)算公式如下:
(3)
(4)
EMD能基于信號本身特性進(jìn)行自適應(yīng)分解,但會(huì)引入了模態(tài)混疊問題[25]。模態(tài)混疊出現(xiàn)在IMF分量中會(huì)導(dǎo)致該IMF分量不具備物理意義,因此采用PCC計(jì)算每個(gè)IMF分量與原始信號的R,P。設(shè)置一個(gè)閾值,當(dāng)計(jì)算得出的P值大于0.05將IMF分量視為無效分量,當(dāng)P值小于0.05且R值小于0.1,也將該IMF分量視為無效IMF分量將其丟棄。
基于LeNet-5 1-D CNN的結(jié)構(gòu)如圖2所示,主要包括三個(gè)卷積層、三個(gè)池化層、兩個(gè)全連接層、一個(gè)softmax分類層。卷積層和池化層主要用于提取一維信號的特征,全連接層主要將提取到的特征映射由多維特征轉(zhuǎn)為一維特征。Softmax分類層輸出各類識別事件的概率值,越接近于1說明是該事件的概率越大。在1-D CNN中,通常使用的激活函數(shù)為ReLU激活函數(shù),損失函數(shù)為交叉熵。
圖2 LeNet-5型一維卷積神經(jīng)網(wǎng)絡(luò)Fig.2 LeNet-5 one-dimensional convolutional neural network
實(shí)驗(yàn)系統(tǒng)如圖1所示。傳感系統(tǒng)采用的是基于φ-OTDR的DAS。該系統(tǒng)使用線寬為3 kHz、輸出功率為10 mW的分布式反饋激光器(DFB-LD)作為光源,使用帶寬為100 MHz的AOM對激光進(jìn)行調(diào)制,被調(diào)制后的脈沖光經(jīng)過放大增益為27 dB的EDFA進(jìn)行放大。使用帶寬為200 MHz的PD去檢測BRS,最后使用采樣位數(shù)為12位、采樣速率為200 MHz/s的DAQ進(jìn)行信號的采集。傳感光纖被埋在中國上海市的文翔東路和滬松路的施工現(xiàn)場中,埋藏深度大約在1~2 m。該分布式傳感系統(tǒng)主要采集汽車通過、挖掘機(jī)挖掘、破路機(jī)工作時(shí)的振動(dòng)信號。其中破路機(jī)工作是指將挖掘機(jī)鏟斗更換為破碎錘進(jìn)行破碎工作時(shí)采集的振動(dòng)信號。本次研究主要為識別單個(gè)振動(dòng)事件,對于混合型振動(dòng)事件的識別在目前仍是非常具有挑戰(zhàn)性的。采集到的汽車通過、挖掘機(jī)挖掘、破路機(jī)工作的原始振動(dòng)如圖3所示。
圖3 原始振動(dòng)圖像Fig.3 Raw vibration images
在使用基于φ-OTDR的分布式光纖傳感系統(tǒng)采集到各類事件的振動(dòng)信號后,在每類振動(dòng)事件中選擇出300個(gè)樣本,每個(gè)樣本的幀長為2 s,總共900個(gè)樣本。將每種類型的事件信號進(jìn)行EMD分解,獲得每個(gè)振動(dòng)樣本的IMF分量,汽車通過事件的IMF分量如圖4所示。圖4(a)中,IMF分量未經(jīng)過WTD,可以看出在IMF分量的高頻分量中含有大量噪聲,分解出的頻率越低含有的噪聲越少;圖4(b)中,IMF分量經(jīng)過WTD后,IMF0、IMF1中的大部分噪聲被去除,而隨著IMF分量的頻率越來越低,經(jīng)過去噪后的變化也越來越不明顯。
圖4 汽車通過振動(dòng)事件的IMFS分量Fig.4 IMFS component of a vehicle passing a vibration event
得到IMF分量后,計(jì)算出每個(gè)IMF分量與原事件信號的PCC。如果得出的P值大于0.05則將該IMF分量視為無效分量,反之,再判斷其R值是否大于0.1,若小于0.1則也將該IMF分量視為無效信號。得到各個(gè)事件振動(dòng)信號的有效IMF分量后,由于還有部分噪聲存在于低頻的IMF分量中,故對每個(gè)IMF分量進(jìn)行WTD。將去噪后的各個(gè)事件的IMF分量分別求和,得到重構(gòu)的事件振動(dòng)信號,汽車通過、挖掘機(jī)挖掘、破路機(jī)工作的重構(gòu)信號如圖5所示。將得到的900個(gè)重構(gòu)信號樣本隨機(jī)打亂后劃分出506個(gè)樣本作為訓(xùn)練集,225個(gè)樣本作為驗(yàn)證集、169個(gè)樣本作為測試集,訓(xùn)練集用于訓(xùn)練識別模型,驗(yàn)證集用于驗(yàn)證識別模型是否有效,測試集用于驗(yàn)證訓(xùn)練好的模型對未知數(shù)據(jù)是否有效。
圖5 去噪重構(gòu)信號Fig.5 De-noised reconstruction signal
本次使用的1-D CNN結(jié)構(gòu)如圖2所示。該LeNet-5 1-D CNN的參數(shù)如表1所示。為了減小1-D CNN的過擬合現(xiàn)象在每個(gè)池化層后都加入了Dorpout層,并且全連接層(FC)也使用L2正則化去減小過擬合現(xiàn)象,Dropout層的丟棄率設(shè)置為0.2,L2正則化的參數(shù)設(shè)置為0.01,整個(gè)網(wǎng)絡(luò)的學(xué)習(xí)率設(shè)置為0.01,Optimizer設(shè)置為SGD。網(wǎng)絡(luò)的損失函數(shù)使用的是稀疏分類交叉熵(sparse categorical crossentropy)損失函數(shù)。1-D CNN網(wǎng)絡(luò)是使用基于python編程語言的keras框架實(shí)現(xiàn)的。
表1 1-D CNN參數(shù)Tab.1 Paramenters of 1-D CNN
在本次研究中,對比了使用不同分解算法對最終識別準(zhǔn)確率的影響。使用VMD分解算法將振動(dòng)信號分解為3階的有限帶寬的固有模態(tài)分量(BLIMFS)后使用PCC提取出有效的BLIMFS,然后使用WTD對每個(gè)BLIMFS進(jìn)行去噪,最后對所有BLIMFS進(jìn)行求和得到振動(dòng)信號的重構(gòu)信號。使用1-D CNN對重構(gòu)信號進(jìn)行識別。兩種方式的驗(yàn)證集準(zhǔn)確率如圖6所示。從圖6中可以看出,使用1-D CNN對EMD分解后得到的重構(gòu)信號的識別準(zhǔn)確率明顯高于VMD分解后得到的重構(gòu)信號,這說明使用EMD對振動(dòng)信號分解后構(gòu)成的重構(gòu)信號能更好的表征出不同振動(dòng)事件的特點(diǎn)。
圖6 驗(yàn)證集準(zhǔn)確率Fig.6 Validation set accuracy
從圖6中還可以看出,EMD分解得到的重構(gòu)信號在進(jìn)行訓(xùn)練時(shí)能更快達(dá)到穩(wěn)定,僅使用不到3 min便能完成訓(xùn)練,因此1-D CNN能在極短時(shí)間內(nèi)完成對新振動(dòng)事件的訓(xùn)練,這對于快速增加識別事件具有積極意義。將訓(xùn)練好的模型保存,使用測試集對該模型進(jìn)行測試,測試該模型是否具有很好的泛化能力。1-D CNN對測試集得出的混淆矩陣如圖7所示。在圖7(a)中,使用EMD分解的方式,1-D CNN對汽車通過、挖掘機(jī)挖掘、破路機(jī)工作的識別準(zhǔn)確率分別為100 %、98 %、97 %;在圖7(b)中,使用VMD分解的方式,1-D CNN對汽車通過、挖掘機(jī)挖掘、破路機(jī)工作的識別準(zhǔn)確率分別為95 %、92 %、97 %。使用EMD分解方式的識別準(zhǔn)確率更高,這說明使用EMD分解方式重構(gòu)的信號的可分類性更強(qiáng),以及訓(xùn)練模型具有很好的泛化能力。
圖7 測試集混淆矩陣Fig.7 Test set confusion matrix
提出使用EMD分解算法對光纖入侵振動(dòng)事件進(jìn)行分解,使用PCC提取出有效的IMF分量,對有效的IMF分量進(jìn)行WTD,將去噪后的IMF分量重構(gòu)為振動(dòng)信號。重構(gòu)的事件信號采用1-D CNN進(jìn)行識別,對汽車通過、挖掘機(jī)挖掘、破路機(jī)工作的識別準(zhǔn)確率分別為100 %、98 %、97 %,平均識別率為98.3 %。