孫 茜,曾周末,李 健
(天津大學精密測試技術與儀器國家重點實驗室,天津 300072)
相關向量機在光纖預警系統(tǒng)模式識別中的應用
孫 茜,曾周末,李 健
(天津大學精密測試技術與儀器國家重點實驗室,天津 300072)
由于傳統(tǒng)模式識別方法存在過學習、訓練時間長等缺陷,不能滿足光纖預警系統(tǒng)實時在線監(jiān)測的要求.相關向量機能夠克服傳統(tǒng)方法的缺點,識別精度高,向量機個數(shù)需求少,因此,將相關向量機應用于光纖預警系統(tǒng)模式識別中,采用小波能譜和小波信息熵的特征提取方法,在測試階段采用有向無環(huán)圖的方法進行多類識別.通過對威脅管道安全的事件進行實驗,識別精度達到92.67%,向量機個數(shù)只有2個,驗證了相關向量機方法應用于光纖預警系統(tǒng)的可行性和有效性.
光纖預警;模式識別;相關向量機;有向無環(huán)圖
光纖傳感器因其頻帶范圍寬、動態(tài)范圍大、不受電磁場干擾、具有極高的靈敏度和分辨率,已被廣泛應用于橋梁、大壩、石油測井及油氣管道的應力應變及振動信號的監(jiān)測、預警系統(tǒng)中[1-2],為保障工業(yè)生產安全、減少能源損失做出了巨大的貢獻.如何對光纖傳感器采集到的信號進行準確識別,減少誤報,避免不必要的資源浪費是光纖預警系統(tǒng)研究的關鍵性問題.已有的研究采用人工神經網絡[3]及支持向量機(SVM)[4]等方法來對光纖預警信號進行分類識別,但是這些傳統(tǒng)方法在實際應用中都存在許多缺陷:人工神經網絡容易陷入局部最優(yōu)并且在訓練過程中容易產生過擬合,影響識別精度;SVM[5]在對這種非平穩(wěn)、隨機性的振動信號進行識別的過程中缺乏必要的概率信息,對于分類問題無法獲取預測中的不確定性,在核函數(shù)選擇上受梅西定理的限制,在樣本訓練之前要設置懲罰因子,設置不當會引起過學習等問題.因此,急需一種更準確、更快速的模式識別方法來滿足工業(yè)現(xiàn)場需求.相關向量機(relevance vector machine,RVM)是基于貝葉斯框架構建的學習機,不受梅西定理的限制,可以構建任意的核函數(shù),比SVM更加稀疏,因此測試時間較短,識別精度高,適用于光纖預警系統(tǒng)在線檢測.RVM 已經應用于齒輪故障診斷、高光譜影像分類、軸承故障檢測等領域,并且取得了很好的效果[6-10].
本文利用光纖預警系統(tǒng)對威脅埋地管道安全的事件進行模式識別,威脅管道安全的入侵事件主要包括大車路過、人工挖掘及機械挖掘等.本文針對信號的非平穩(wěn)和隨機性的特點,采用小波能譜(wavelet energy spectrum,WES)和小波信息熵(wavelet information entropy,WIE)相結合的特征提取方法.在分類器的設計中采用一對一的多類分類方法對 RVM分類器進行訓練,在測試階段采用有向無環(huán)圖(directed acyclic graph,DAG)的方法對樣本進行測試.實驗中利用管道安全事件振動信號的分類識別問題驗證了本文方法較其他模式識別方法的優(yōu)越性.
1.1 相關向量機模型
首先定義向量 x∈Rn為光纖預警系統(tǒng)采集到信號特征的模式輸入,t=[t1, t2, t3]T為 3類目標向量.RVM本身是針對二分類問題設計的,為了識別3類問題,本文為每兩個類別構建分類器,一共需要構建3個RVM分類器.每個分類器xi(i=1,2,…,M)是大小為M的訓練樣本,其中已知xi屬于類別ti,目標向量t中的ti∈{-1,1},RVM的分類模 型為
式中:N為數(shù)據(jù)的長度;w 為權值向量,w=[ω0,為大小為N×(N+1)的矩陣,Φ=為核函數(shù),高斯核函數(shù)有很好的學習能力和適應能力,是目前較為常用的一種核基函數(shù),因此本文中選擇高斯核函數(shù)K(x , xi)=整個數(shù)據(jù)集的似然函數(shù)為
式中 ()σ·為 sigmoid函數(shù).由結構風險最小化原則,在有限的訓練樣本下,學習機器的VC維越高則置信范圍越大,真實風險與經驗風險之間可能的差別越大,如果不對權值進行約束,直接最大化公式(2)會導致過擬合[11].因此為避免過擬合,確保模型的稀疏性,稀疏貝葉斯方法對權值向量 w賦予零均值高斯先驗分布,即
對目標函數(shù)J求關于權值向量w的梯度,即
采用最大化邊緣似然函數(shù)的方法,按式(9)更新超參數(shù)α
式中:Σii為Σ中第i項對角線元素;iμ為第i項平均后驗權值.獲得超參數(shù)αnew后重新估計權重的后驗均值并計算協(xié)方差矩陣,重復迭代過程直至滿足收斂條件,根據(jù)最大后驗權值輸出RVM模型.
MnO2@MoO3核殼納米材料的制備及其電容性能的研究………………邱文達,黎彧,肖紅兵,譚新宇,黃健玲,黎惠娟,李娟華,羅安(1)
1.2 有向無環(huán)圖多分類方法
3個RVM分類器構建完成后,采用DAG方法對 3類樣本進行分類,DAG多類分類方法不僅計算時間較少,而且能夠克服傳統(tǒng)一對一方法對樣本進行投票決策時可能出現(xiàn)的多個類票數(shù)相同以及泛化誤差無界等缺點.DAG識別過程如圖 1所示,為 3類樣本的有向無環(huán)圖,在樣本訓練階段與傳統(tǒng)的一對一方法相同.當對測試樣本進行分類,首先從根節(jié)點開始,即分類器 1~3,根據(jù)根節(jié)點的分類結果用下一層的左節(jié)點或者右節(jié)點分類器繼續(xù)分類,直到達到底層某個葉節(jié)點為止.DAG方法不但能夠提高分類器的效率,而且不存在誤分、拒分區(qū)域.
圖1 有向無環(huán)圖Fig.1 Directed acyclic graph
1.3 相關向量機參數(shù)的設定
RVM模型中的超參數(shù)αi可以通過訓練自適應得到,無需人為設定.為了保證RVM模型的最優(yōu)性能,核函數(shù)中γ的確定至關重要,本文選擇具有快速、準確的 PSO[12]智能優(yōu)化算法對 RVM 中每個參數(shù)進行優(yōu)化.采用如下的適應度函數(shù):
式中ty、y分別為正確分類的樣本數(shù)和樣本總數(shù).
光纖預警系統(tǒng)采集到的信號波形中一些起伏變化劇烈的部分往往蘊含了豐富的目標特征信息.因此,提取出這些局域波形發(fā)生突變的特征,就相當于得到了不同事件之間的差異,從而利用模式識別的手段能夠區(qū)分不同的事件類別.小波分析[13]是對振動信號進行分析、提取信號頻率特征的有效手段,因此選擇小波能譜作為特征向量有助于提高分類識別精度.
首先由式(11)對采集到的信號x (n) 進行小波分解
式中:U為樣本點的長度;Dk( l)為尺度k上小波分解系數(shù),是在尺度 k上信號x(n)的小波能譜.
為更充分反映信號的本質特征,提高識別精度,采用小波能譜和小波信息熵相結合的方法提取信號的特征.小波信息熵能夠反映信號潛在的動態(tài)信息,能衡量信號的平均不確定性和復雜程度[14-15].為了反映不同事件信號的局部非線性特征,本文定義了滑動時間窗.計算時間窗內的小波信息熵,通過滑動時間窗來觀察小波熵的變化,從而得到不同信號間的差異.首先計算模擬電壓信號x(n)的長度 P,然后對信號進行小波分解,得到某一尺度k上的離散小波系數(shù)Dk( i).時間窗的長度為L,滑動步長為δ,某一尺度上確定時間窗內的信號能量計算式為
某一時間窗內的總能量為所有尺度上的能量之和,公式為
某一時間窗內信號的相對能量為
式中kp為不同尺度下的能量分布.帶有時間窗的小波信息熵(簡稱小波熵)定義為
令滑動窗口編號 r=r+1,若rδ+L≥P則結束;若rδ+L〈P,則繼續(xù)計算下一時間窗內的小波熵.由式(15)可以得到隨著時間窗的滑動小波信息熵的變化規(guī)律.
實驗系統(tǒng)為大港-棗莊成品油管道分布式光纖管道安全監(jiān)測系統(tǒng),監(jiān)測距離約 35,km.系統(tǒng)采用的傳感光纜為與管道同溝敷設的 GYTA六芯單模通訊光纜,位于管道正上方約 30,cm處,與地面垂直距離約1.5,m.采樣頻率為 20,kHz,每組數(shù)據(jù)長 1,s,共含有20,000個采樣點.采集每種事件在管道沿線不同位置的振動信號,現(xiàn)場測得的典型的信號波形如圖2所示.圖 2(a)為大車路過管道沿線產生的振動信號,圖 2(b)人工挖掘管道上方土壤時產生的振動信號,圖2(c)為機械挖掘時產生的振動信號.
圖3 3種事件的小波能譜Fig.3 Wavelet energy spectrum of three cases
圖2 3種管道安全事件振動信號Fig.2 Vibration signals of three pipeline safety events
本文中,對3種典型安全事件的振動信號進行小波能譜特征提?。甦b小波具有好的局部特性,能夠在各種瞬變波形中較好地提取有用信號成分,可將信號正交地分解到各個獨立頻帶內,實現(xiàn)對非平穩(wěn)信號的整體描述,是通用的非平穩(wěn)信號的分析工具.綜合考慮信號分解的頻帶劃分和計算量的大小,經反復實驗和比對最終采用 db6小波進行 7層小波分解.由于篇幅所限,實驗過程不再贅述.利用式(12)計算振動信號的小波能譜.3種事件8個頻帶的歸一化能量如圖3所示.
從圖 3中可以看出 3種事件在某些頻帶的能量有較大的差別,從而為分類器準確識別這3種事件提供了較好的特征信息.
為了去除冗余并減少分類器運算時間,采用每種事件的小波熵最大值和小波能譜一起構成特征向量.小波熵滑動窗口寬度為 100~500,滑動步長為1,根據(jù)式(16)得到不同窗口寬度下的小波熵最大值如表1所示.
表1 不同窗口寬度下的小波熵最大值Tab.1 Maximum wavelet information entropy of different window widths
從表1中可以看出,不同事件信號的平穩(wěn)程度存在較大差別,人工挖掘事件因人工操作的隨機性,地基受力的不均勻造成熵值較大.相反,大車路過相較其他兩種事件信號較為平穩(wěn),因此熵值最?。煌翱趯挾认?3種事件小波熵值差別不同,窗口寬度為100時3種事件的小波熵差異最為明顯,因此選擇窗口寬度為 100的小波熵最大值與小波能譜共同構成特征向量.
本文為3種威脅管道安全的事件分別選擇50個樣本對分類器進行訓練,另外選擇 50個樣本對分類器進行測試,測試結果如表2所示.
表2 3種事件識別結果Tab.2 Recognition accuracy of different pipeline safety events
從表 2中可以看出 3種事件均有被誤分的情況發(fā)生.由于 3種事件受外界環(huán)境和人為因素的影響較大,造成部分信號頻率特征相似.在特征提取過程中,部分信號的小波能量分布趨勢相近,容易產生模式重疊現(xiàn)象,在選取訓練樣本時雖然已經盡可能地使訓練樣本涵蓋所有狀況對應的數(shù)據(jù),但仍不能避免出現(xiàn)遺漏情況.雖然每種事件的識別準確率沒能達到百分之百,但均達到了 90%以上,大大降低了誤報、漏報的情況,權衡光纖預警系統(tǒng)對模式識別精度和識別效率的要求,本文方法能夠很好地滿足系統(tǒng)要求.
表 3為不同模式識別方法對 3種事件進行分類識別的結果.
表3 不同模式識別方法對比Tab.3 Recognition accuracy of different methods
從表3中可以看出,有向無環(huán)圖的應用不但提高了識別的精度,同時縮短了算法時間.相關向量機分類器的準確率要高于支持向量機,并且向量個數(shù)和算法運算時間要遠遠小于支持向量機,實驗結果充分顯示了相關向量機的優(yōu)越性.
本文針對光纖預警系統(tǒng)采集信號的特點,采用相關向量機的模式識別分類方法對 3種預警信號進行分類識別,在測試階段采用有向無環(huán)圖的方法對樣本進行測試,并應用小波能譜和小波熵相結合的特征提取方法提取信號特征.實驗分析表明,小波能譜和小波熵的特征提取方法能夠充分反映不同振動信號間的本質區(qū)別,有向無環(huán)圖的應用有助于提高分類識別精度,縮短算法時間.RVM 具有相關向量數(shù)量更少、稀疏性更高、測試時間更短、可以輸出后驗概率分布等優(yōu)點.該方法非常適用于光纖預警在線故障監(jiān)測等實時性要求高的領域.
[1] 王 鵬,李心凱,劉曉丹,等. 油氣管道位移光纖安全監(jiān)測技術定位理論以及預警信號特征研究[J]. 工業(yè)安全與環(huán)保,2012,38(4):37-38.
Wang Peng,Li Xinkai,Liu Xiaodan,et al. Study on orientation theory and signal character of the distributed optical fiber pipeline detection and pre-warning technology[J]. Industrial Safety and Environmental Protection,2012,38(4):37-38(in Chinese).
[2] 侯俊芳,裴 麗,李卓軒,等. 光纖傳感技術的研究進展及應用[J]. 光電技術應用,2012,27(1):49-53.
Hou Junfang,Pei Li,Li Zhuoxuan,et al. Development and application of optical fiber sensing technology[J]. Electro-Optic Technology Application,2012,27(1):49-53(in Chinese).
[3] 曲志剛,靳世久,周 琰,等. 基于 RBF網絡的油氣管道侵入事件識別方法研究[J]. 化工自動化及儀表,2007,34(3):58-61.
Qu Zhigang,Jin Shijiu,Zhou Yan,et al. Recognition of oil or gas pipeline intrusion events based on RBF network method [J]. Control and Instruments in Chemical Industry,2007,34(3):58-61(in Chinese).
[4] 曲志剛,封 皓,靳世久,等. 基于支持向量機的油氣管道安全監(jiān)測信號識別方法[J]. 天津大學學報,2009,42(5):465-470.
Qu Zhigang,F(xiàn)eng Hao,Jin Shijiu,et al. An SVM-based recognition method for safety monitoring signals of oil and gas pipeline[J]. Journal of Tianjin University,2009,42(5):465-470(in Chinese).
[5] 綦宏志,明 東,萬柏坤,等. 基于支持向量特征篩選方法的想象動作識別[J]. 納米技術與精密工程,2012,10(4):348-353.
Qi Hongzhi,Ming Dong,Wan Baikun,et al. Motor imagery recognition based on support vector feature selection method[J]. Nanotechnology and Precision Engineering,2012,10(4):348-353(in Chinese).
[6] Zio Enrico,Di Maio Francesco. Fatigue crack growthestimation by relevance vector machine [J]. Expert Systems with Application,2012,39(12):10681-10692.
[7] Demir B,Erturk S. Hyperspectral image classification using relevance vector machines[J]. IEEE Geoscience and Remote Sensing Letters,2007,4(4):586-590.
[8] Dong Chao,Tian Lianfang,Zhang Jing. Detecting lung nodules in chest CT images with ensemble relevance vector machine[C]// Hu J W,Su J,ed. Applied Mechanics and Materials. Switzerland:Trans Tech Publications,2012:544-549.
[9] Maio Francesco Di,Tsui Kwok Leung,Zio Enrico. Combining relevance vector machines and exponential regression for bearing residual life estimation[J]. Mechanical Systems and Signal Processing,2012,31:405-427.
[10] Zhao Hongbo,Yin Shunde,Ru Zhongliang. Relevance vector machine applied to slope stability analysis [J]. International Journal for Numerical and Analytical Methods in Geomechanics,2012,36(5):643-652.
[11] 張學工. 關于統(tǒng)計學習理論與支持向量機[J]. 自動化學報,2000,26(1):32-42.
Zhang Xuegong. Introduction to statistical learning theory and support vector machines[J]. Acta Automatica Sinica,2000,26(1):32-42(in Chinese).
[12] 趙永滿,何 楨,何曙光,等. 基于PSO的支持向量機多元控制圖均值偏移診斷模型[J]. 天津大學學報:自然科學與工程技術版,2013,46(5):469-475.
Zhao Yongman,He Zhen,He Shuguang,et al. Support vector machine based on particle swarm optimization for monitoring mean shift signals in multivariate control charts[J]. Journal of Tianjin University:Science and Technology,2013,46(5):469-475(in Chinese).
[13] 李 霖,楊洪耕. 基于二維離散平穩(wěn)小波的電能質量擾動分類[J]. 電力系統(tǒng)自動化,2007,31(10):21-26.
Li Lin,Yang Honggeng. Power quality disturbance classification based on 2-D static wavelet transform [J]. Automation of Electric Power Systems,2007,31(10):21-26(in Chinese).
[14] 袁浩東,陳 宏,侯亞丁. 基于全矢小波包能量熵的滾動軸承智能診斷[J]. 機械設計與制造,2012(2):233-235.
Yuan Haodong,Chen Hong,Hou Yading. Intelligent diagnosis of rolling bearing based on full vector wavelet packet energy entropy[J]. Machinery Design & Manufacture,2012(2):233-235(in Chinese).
[15] EI-Zonkoly A M,Desouki H. Wavelet entropy based algorithm for fault detection and classification in FACTS compensated transmission line[J]. International Journal of Electrical Power and Energy Systems,2011,33(8):1368-1374.
(責任編輯:趙艷靜)
Application of Relevance Vector Machine in Pattern Recognition of Optical Fiber Pre-Warning System
Sun Qian,Zeng Zhoumo,Li Jian
(State Key Laboratory of Precision Measuring Technology and Instruments,Tianjin University,Tianjin 300072,China)
Because of severe over-fitting and high computation cost,traditional pattern recognition methods cannot meet the demands for the online monitoring of optical fiber pre-warning system. Relevance vector machines(RVMs) can overcome the disadvantages of traditional methods,which have higher identity precision and fewer vector number,therefore,in this paper RVM was used as recognition method in optical fiber pre-warning system. Wavelet energy and wavelet information entropy were also used as feature extraction method,and directed acyclic graph was used to test multi-types of samples. The experiment on pipeline safety events shows that the recognition accuracy of RVM can reach 92.67%,and the vector number is only 2. The method proposed in this paper is proved to be feasible and effective for optical fiber pre-warning system.
optical fiber pre-warning;pattern recognition;relevance vector machine;directed acyclic graph
TN247;TN911.6
A
0493-2137(2014)12-1115-06
10.11784/tdxbz201309073
2013-09-18;
2013-12-18.
國家自然科學基金資助項目(61240038).
孫 茜(1977— ),女,博士研究生.
李 健,tjupipe@tju.edu.cn.
時間:2014-09-04. 網絡出版地址:http://www.cnki.net/kcms/detail/12.1127.N.20140904.0913.001.html.