帥 師,王 翦,吳紅艷,賈 波,艾 鑫
(1.復(fù)旦大學(xué) 材料科學(xué)系,上海 200433; 2.上海復(fù)旦智能監(jiān)控成套設(shè)備有限公司,上海 201906)
隨著光纖技術(shù)的發(fā)展,光纖傳感系統(tǒng)在通信、醫(yī)療、航空、軍事、能源和安防等方面得到了高度的重視和廣泛的應(yīng)用[1-5].光纖傳感系統(tǒng)是集光學(xué)技術(shù)、電學(xué)技術(shù)、信號處理技術(shù)于一體的綜合性系統(tǒng),可用于測量應(yīng)力、溫度、聲音等多種物理量,具有抗電磁干擾、耐腐蝕、靈敏度高、結(jié)構(gòu)簡單、安全可靠等優(yōu)點,能夠應(yīng)用于一些傳統(tǒng)傳感器無法使用的環(huán)境,比如核磁共振室、長距離野外管道以及海洋等極端環(huán)境[6-8].
分布式光纖傳感技術(shù)是光纖傳感技術(shù)中的一個重要分支,該技術(shù)利用光纖的一維空間特性對環(huán)境中的物理量進行測量,光纖既作傳感元件,又作傳輸介質(zhì).目前,常用的分布式光纖傳感技術(shù)有光時域反射技術(shù)(Optical Time Domain Reflection, OTDR)、光纖雙光束干涉技術(shù)和準分布式光纖布拉格光柵復(fù)用技術(shù)[9-11],其中OTDR技術(shù)存在盲區(qū)且儀器體積較大,布拉格光柵復(fù)用結(jié)構(gòu)比較復(fù)雜,而光纖雙光束干涉法構(gòu)造簡單、精度高[12-14],故本文采用這種方法.
將該系統(tǒng)布設(shè)在所需環(huán)境中,可以對各種入侵信號進行監(jiān)測和報警.目前,入侵信號定位技術(shù)已很成熟,以往的算法通常是將采集到的信號直接進行定位[5].在實際應(yīng)用中,系統(tǒng)因其極高的靈敏度可能對入侵信號和非入侵信號均進行定位計算和報警,既浪費系統(tǒng)內(nèi)存,又因誤報對使用單位造成困擾.因此,對光纖傳感系統(tǒng)所采集的信號預(yù)先進行模式識別,準確區(qū)分入侵信號與非入侵信號是一個亟待解決的問題.目前,關(guān)于分布式光纖傳感系統(tǒng)模式識別的研究較少,常見的方法是提取出時域或頻域信號中的某一特征參量,如強度、方差、短時平均能量、短時過電平率等,然后利用統(tǒng)計學(xué)方法進行分類[7,15-18].這些方法的實現(xiàn)步驟較為復(fù)雜,識別準確率較低,容易受到外界干擾,在復(fù)雜環(huán)境中的可靠性較低.
本文將語音信號模式識別中常用的Mel頻率倒譜系數(shù)(Mel Frequency Cepstrum Coefficient, MFCC)特征提取法應(yīng)用于分布式光纖傳感系統(tǒng)的信號特征提取,并用支撐向量機(Support Vector Machine, SVM)分類器進行模式識別.對實際應(yīng)用中的敲擊、剪切等入侵信號和吹風(fēng)(用電風(fēng)扇模擬)、下雨(用澆水模擬)等非入侵信號進行了分析,達到了良好的識別效果,實現(xiàn)了較高的識別率.該技術(shù)可以有效屏蔽風(fēng)雨的干擾,提高系統(tǒng)的運行效率,具有很強的實用價值.
本文所使用的分布式光纖傳感系統(tǒng)的結(jié)構(gòu)如圖1所示.本系統(tǒng)是MZ干涉儀與Sagnac干涉儀的混合結(jié)構(gòu),如圖1所示,其中: SLD為超輻射發(fā)光二極管光源;C 1為3×3耦合器;TD為延遲線圈;C 2為2×2耦合器;FRM為法拉第旋轉(zhuǎn)鏡;PIN 1、PIN 2為兩個光電探測器;DAQ為數(shù)據(jù)采集卡,采集到的數(shù)據(jù)最終輸入計算機進行處理.
圖1 分布式光纖傳感器結(jié)構(gòu)圖Fig.1 Schematic diagram of the distributed optical fiber sensor
光源發(fā)出的光經(jīng)過3×3耦合器C 1后分為兩路: 一路經(jīng)延遲線圈進入2×2耦合器C 2;另一路直接進入2×2耦合器C 2,從2×2耦合器C 2出來的光經(jīng)擾動點后在法拉第旋轉(zhuǎn)鏡處返回,經(jīng)過2×2耦合器C 2后又分為兩路,所以最終有4種路徑的光信號匯集到光電探測器: 路徑1(1-5-7-8-9-10-9-8-6-4);路徑2(1-4-6-8-9-10-9-8-7-5);路徑3(1-5-7-8-9-10-9-8-7-5);路徑4(1-4-6-8-9-10-9-8-6-4).
由于只有光程差小于光源相干長度的兩束光才能發(fā)生干涉,所以本系統(tǒng)中只有路徑1與路徑2兩束光可以互相干涉.當(dāng)有外界擾動時,兩束光產(chǎn)生相位變化,由于這兩束光到達擾動點的時間不同,因此形成相位差,進而在3×3耦合器C 1處發(fā)生干涉,干涉信號由光電探測器轉(zhuǎn)換,經(jīng)采集卡輸入計算機進行解調(diào).
根據(jù)光彈效應(yīng),光傳播過程中相位的變化與外界擾動信號成正比[19-20].假設(shè)t時刻在距反射鏡L位置處有頻率為ω的正弦擾動信號,其引起光纖中傳輸?shù)墓獾南辔蛔兓癁棣?sinω(t),光束經(jīng)路徑1回到3×3耦合器C 1處的相位變化可以表示為:
Δφ1(t)=φ0sinω(t)+φ0sin[ω(t+τL)],
(1)
其中:ω為外界擾動頻率;τL=2neffL/c;neff為光纖有效折射率;c為真空中光速.同理,光束經(jīng)路徑2回到3×3耦合器C 1處的相位變化可以表示為:
Δφ2(t)=φ0sin[ω(t+τD)]+φ0sin[ω(t+τD+τL)],
(2)
其中τD為光束經(jīng)過延遲線圈的時間.所以,發(fā)生干涉的兩束光的相位差可以表示為:
Δφ(t)=Δφ2(t)-Δφ1(t).
(3)
光電探測器PIN 1和PIN 2探測到的兩束光信號的光功率可以表示為:
(4)
根據(jù)文獻[21]介紹的相位還原方法,將光電探測器探測到的信號經(jīng)光電轉(zhuǎn)換輸入計算機進行解調(diào),即可還原出擾動引起的光相位變化φ0sinω(t).
MFCC模擬了人耳的聽覺特性,人耳對不同頻率的聲音有不同的感知,人耳聽到的頻率與實際頻率存在這樣的映射關(guān)系[22]:
(5)
其中:fMel為Mel頻率;f為實際頻率.根據(jù)式(5)可以作出如圖2所示的曲線圖,可以發(fā)現(xiàn),在1kHz以下Mel頻率和實際頻率近似為線性關(guān)系,在1kHz以上近似為對數(shù)關(guān)系.
在分布式光纖傳感系統(tǒng)中,外界擾動信號本質(zhì)上是由振動引發(fā)的音頻信號[23],這種傳感信號與語音都具有長時非平穩(wěn)、短時平穩(wěn)、不連續(xù)等性質(zhì)[24],所以可以將用于語音信號特征提取的MFCC方法用于光纖傳感系統(tǒng)的信號.MFCC的計算流程如圖3所示.
圖2 Mel頻率與實際頻率的關(guān)系圖Fig.2 Graphical relationship between Mel frequency and real frequency
圖3 MFCC參數(shù)計算流程示意圖Fig.3 Block diagram of MFCC extraction algorithm
首先,對經(jīng)過解調(diào)后的信號進行分幀和加窗處理,因為外界擾動信號具有短時(10~30ms)平穩(wěn)的特性,所以需要把一段長信號劃分為每段長度為10~30ms的短信號,并對分割后的信號加漢明窗;然后,對時域信號進行快速傅里葉變換(Fast Fourier Transform, FFT)轉(zhuǎn)化到頻域,將得到的線性頻譜通過Mel頻率濾波器組后得到Mel頻譜S(k),其中Mel頻率濾波器組是一組梳狀濾波器,每個濾波器的中心頻率在Mel尺度上是等間距的,前一濾波器的中心頻率是后一濾波器的起始頻率,濾波器個數(shù)由信號截止頻率決定;最后,將Mel頻譜取對數(shù),并進行離散余弦變換(Discrete Cosine Transform, DCT)變化,得到Mel倒譜:
(6)
文獻[25]的研究表明,聲音信號的大部分信息都保留在低頻部分,因此,我們只取C(1)到C(12)這12維MFCC參數(shù).
20世紀90年代,Vapnik等基于統(tǒng)計理論中的結(jié)構(gòu)風(fēng)險最小化原理提出了SVM模型,該方法建立一個分類超平面作為決策平面,使得兩類數(shù)據(jù)之間的隔離邊緣最大化[26-27].SVM適應(yīng)能力強、分辨準確率高,相較于決策樹算法、貝葉斯算法、遺傳算法、關(guān)聯(lián)規(guī)則分類等分類算法,它在解決小樣本、非線性及高維模式識別中有許多特有的優(yōu)勢,在模式識別領(lǐng)域有重要應(yīng)用[28].光纖傳感系統(tǒng)需要長時間布設(shè)在野外,樣本庫的訓(xùn)練通常在前期完成,因此“小樣本訓(xùn)練、高識別率”的SVM算法非常適合于該系統(tǒng).
當(dāng)兩類信號線性可分時,可以用線性SVM找到空間中的最優(yōu)平面劃分兩類數(shù)據(jù).在分布式光纖傳感系統(tǒng)中,由于噪聲的存在,采集到的信號是線性不可分的,此時需要將線性不可分的樣本映射到高維空間,使其線性可分,映射后空間的最優(yōu)分界面為:
(7)
(8)
(9)
(10)
將式(10)代入式(9)可將目標函數(shù)化簡為:
(11)
相應(yīng)的分類決策函數(shù)為:
(12)
(13)
本文需要區(qū)分多種類型的擾動信號,本質(zhì)上是一個多分類問題.SVM常用于二分類問題,但是它也適用于多分類情況,假設(shè)輸入數(shù)據(jù)共有k類樣本,現(xiàn)有的算法主要有以下幾種[29]:
(1) “一對多”判決法
依次用一個二分類SVM分類器(以下簡稱分類器)將一類樣本從剩余樣本中區(qū)分出來,對于k類樣本共需要k個分類器;
(2) “一對一”判決法
在任意兩類樣本間都設(shè)計一個分類器,對于k類樣本共需要k(k-1)/2個分類器.當(dāng)未知樣本輸入時,每個分類器都對其進行識別,給出一個類別判斷,最后“得票最多”的類別即為最后的識別結(jié)果;
(3) 層次判決法
層次分類法是一個倒立的二叉樹結(jié)構(gòu),首先將輸入樣本劃分為2個子類,再將各子類再次劃分成次級子類,如此循環(huán)下去,直到得到一個單獨的類別為止.層次判決法可以有不同的二叉樹結(jié)構(gòu),在使用時需要合理選擇分類結(jié)構(gòu).
研究[30]表明,“一對一”判決法SVM分類器具有良好的分類效果,我們實驗中也選擇了這種方法.
圖4 實驗算法示意圖Fig.4 Block diagram of the experiment
搭建如圖4所示的光路系統(tǒng),將傳感光纜(即圖1中8~10段)布設(shè)在圍欄上,系統(tǒng)所用光纖為標準單模光纖,光源為波長為1310nm的激光光源,數(shù)據(jù)采集卡使用NIDAQPCI-6122,采樣率為200kHz,信號處理部分由LabVIEW 2015和MATLAB R2015b共同完成,算法示意圖由圖4所示.
對布設(shè)在圍欄上的光纜實施動作,采集敲擊、剪切、吹風(fēng)、下雨(其中吹風(fēng)以電風(fēng)扇模擬、下雨以澆水模擬)4類信號各100個、共400個信號,每個信號長度為0.5s,即100k點.為了提高數(shù)據(jù)的可靠性,每種信號均由4位實施者完成.為了提高運算速度與準確率,我們對每個數(shù)據(jù)進行降采樣處理,降采樣因子為10,信號點數(shù)由100k點下降為10k點.典型的原始信號時域圖和頻域圖如圖5所示,
圖5 原始信號時域圖與頻域圖Fig.5 Original signals and relevant frequency spectra
可以看到每種信號的頻帶都集中在1kHz以下,剪切信號的主頻帶在100Hz和250Hz附近,敲擊信號的主頻帶在80Hz和200Hz附近,吹風(fēng)信號頻譜和下雨信號頻譜的幅值均很小,50Hz左右的低頻信號為環(huán)境噪聲,所以這兩類信號的主頻帶分別在400Hz處和250Hz處.4類信號有明顯的頻譜特征,由此可以推斷基于頻譜變換的MFCC特征提取方法是有效的.
接下來,為了進一步提取出有用信號,排除無效環(huán)境噪聲的影響,對信號進行端點檢測,通過短時平均能量方法識別信號發(fā)生起跳點,從起跳點開始截取3k點,至此這3k點包含的就是有效擾動信號.經(jīng)過這些處理后,按圖3流程提取每個信號的MFCC參數(shù),這4類信號的MFCC參數(shù)如圖6所示.
圖6 4類信號的MFCC特征參數(shù)Fig.6 Four kinds of original signals’ MFCC
表1 識別結(jié)果
注: 1)為平均值.
最后,構(gòu)建SVM模型,選定合適的模型參數(shù),從4類信號中隨機選擇20個樣本作為訓(xùn)練集送入SVM分類器進行訓(xùn)練.訓(xùn)練結(jié)束后,將剩余的每類80個樣本作為測試集輸入分類器進行識別,識別結(jié)果如表1所示.
從識別結(jié)果可以看出,MFCC和SVM模型相結(jié)合的模式識別方法具有良好的識別效果,對敲擊、剪切兩類入侵信號的識別率分別為97.50%和95.00%,對吹風(fēng)、下雨兩類非入侵信號的識別率均為100.00%,對4類信號的綜合識別率為98.13%.人為入侵信號具有一定隨機性,不同的實施者所制造的擾動信號在強度、持續(xù)時間等方面都有差別,而自然環(huán)境聲音等非入侵信號相對穩(wěn)定,此即實驗中非入侵信號識別率略高于入侵信號的原因.光纖傳感系統(tǒng)通常布設(shè)在野外環(huán)境,受到環(huán)境噪聲的影響很大,本文提出的模式識別技術(shù)能夠準確區(qū)分入侵信號與非入侵信號,識別結(jié)束后,系統(tǒng)僅需對入侵信號進行定位和報警,節(jié)省了系統(tǒng)內(nèi)存空間,提高了系統(tǒng)運行效率.將該系統(tǒng)布設(shè)于某中學(xué)周界,將光纖綁在鐵藝圍欄上用于傳感和信號傳輸,系統(tǒng)連續(xù)運行一個月,風(fēng)雨天氣實現(xiàn)零誤報.
本文基于分布式光纖傳感系統(tǒng)所采集到信號的特點,借鑒傳統(tǒng)的語音信號檢測方法,提出了一種用MFCC方法提取特征參數(shù)、用SVM模型進行識別的分布式光纖傳感系統(tǒng)信號模式識別方法,能夠準確區(qū)分入侵信號與非入侵信號.實驗中僅選取每類信號中20個樣本作為訓(xùn)練集,而80個樣本作為測試集,分類結(jié)果驗證了SVM算法在小樣本訓(xùn)練集上的優(yōu)異性能.本文提出的分類算法計算流程簡單,識別準確率高,受環(huán)境影響小,具有很強的實用性.實驗系統(tǒng)運行穩(wěn)定,性能良好,能夠推廣到實際應(yīng)用中,先利用本算法對光纖傳感系統(tǒng)采集到的信號進行模式預(yù)判,排除風(fēng)雨等非入侵信號的干擾,僅對入侵信號進行定位和報警,很大程度上降低了誤報率,能夠提升分布式光纖傳感器的工作性能.