朱 聰
(中鐵二院工程集團有限責任公司,四川成都 610031)
多個傳感器監(jiān)測一個對象,將多個傳感器數(shù)據(jù)融合成一個值稱為同質(zhì)傳感器數(shù)據(jù)融合。綜合管廊作為現(xiàn)今保障城市運行的重要基礎(chǔ)設施,其內(nèi)部存在種類繁多、數(shù)量龐大的傳感器群。為降低數(shù)據(jù)傳輸成本,提高數(shù)據(jù)精度,增加數(shù)據(jù)魯棒性,近年來主要采用多傳感器數(shù)據(jù)融合的方式處理傳感器數(shù)據(jù)。
針對傳感器的數(shù)據(jù)融合,國內(nèi)外學者進行了深入的研究[1-9]。其中,代啟林等[1]以電化學氣體傳感器為研究對象,提出了基于線性神經(jīng)網(wǎng)絡的數(shù)據(jù)融合算法,解決了常規(guī)測量在較大測量范圍的精密測量問題。徐建亮等[2]為消除傳感器間可能存在的虛假或錯誤數(shù)據(jù),提出了一種基于粒子濾波算法(PFA)的改進貝葉斯算法(IBA),提高了數(shù)據(jù)融合精度。左延紅等[3]針對制造系統(tǒng)中檢測節(jié)點環(huán)境與設備的的差異性,提出了基于分數(shù)階微分的多傳感器檢測數(shù)據(jù)融合算法,提高了數(shù)據(jù)的可靠性。曹守啟等[4]為解決水產(chǎn)運輸過程中多傳感器檢測數(shù)據(jù)誤差大的問題,提出了一種結(jié)合分批估計和自適應加權(quán)的數(shù)據(jù)融合算法,增強了數(shù)據(jù)穩(wěn)定性。陳英等[5]根據(jù)數(shù)據(jù)多樣性提出一種利用小波變換閾值去噪的多傳感器融合算法,對信息的保留效果有較大提高。H. S. Zhai[6]提出了基于無損Kalman濾波及小波變換的多傳感器數(shù)據(jù)融合方法,對數(shù)據(jù)先分解后重構(gòu),提高了融合數(shù)據(jù)的抗干擾性及準確性。K. Kim等[7]以韓國的高鐵為研究主體,提出了基于Kalman濾波的非完整控制數(shù)據(jù)融合算法,有效解決了列車通過隧道時RFID部署間距、定位的不準確性及GDPS錯誤等問題。璩晶磊等[8]為提高數(shù)據(jù)融合精度,提出了基于模糊證據(jù)理論的多傳感器融合算法,該方法無需歷史數(shù)據(jù),在單次測量中融合效果較好。潘啄金等[9]為減少數(shù)據(jù)傳輸量,提出結(jié)合了深度自編碼的WSN融合算法,該方法有效提高了數(shù)據(jù)傳輸效率。
DS(dempster-shafer)方法認為多個傳感器之間通常具有數(shù)據(jù)一致性,能夠相互驗證。如果某個傳感器數(shù)據(jù)明顯異于其他傳感器,說明其他傳感器不支持該異常傳感器,該傳感器的可信度低?;谏鲜鏊悸?,DS方法將每個傳感器定義為目標傳感器,對于每個目標傳感器,將所有傳感器作為支撐該目標傳感器的證據(jù),通過這些證據(jù)計算目標傳感器的可信度。根據(jù)可信度對所有目標傳感器加權(quán)平均獲得最終融合值。現(xiàn)有DS方法主要是針對單傳感器的誤差或多傳感器融合的精度進行研究。但都未考量各傳感器的時空特征,導致數(shù)據(jù)的可信度較低或完全丟失。針對DS方法中的噪聲和異常數(shù)據(jù),以及容易丟失數(shù)據(jù)特征的問題,提出一種基于時空預處理的DS證據(jù)方法(spatio-temporal DS,ST-DS),用于多傳感器數(shù)據(jù)融合。本文設計了一種時空預處理機制,根據(jù)數(shù)據(jù)的空間和歷史變化規(guī)律剔除異常和噪聲,并尋找數(shù)據(jù)特征區(qū)域。同時結(jié)合DS方法,根據(jù)數(shù)據(jù)空間分布和特征區(qū)域位置計算證據(jù)的信任分配。首先對傳統(tǒng)DS證據(jù)理論進行改進,在此基礎(chǔ)上引入時空預處理,對爭議點數(shù)據(jù)進行可信度判斷,最后通過融合證據(jù)獲得同質(zhì)傳感器的融合數(shù)據(jù)。本文算法的結(jié)構(gòu)框圖如圖1所示。將傳感器所探測到的數(shù)據(jù)進行時空預處理;進行ST-DS數(shù)據(jù)融合;獲得最終融合值。
圖1 本文算法流程
采用本方法對綜合管廊中的甲烷濃度傳感器數(shù)據(jù)進行融合,實驗結(jié)果表明在發(fā)生甲烷泄漏的情況下,本文融合數(shù)值明顯高于其他方法,并在甲烷未發(fā)生泄漏時基本保持一致,認為本文方法有較高的有效性及實用性。
本文以綜合管廊一個防火分區(qū)中布置的甲烷傳感器為研究對象,沿防火分區(qū)布置多個甲烷氣體濃度傳感器采集數(shù)據(jù)。多個同質(zhì)傳感器按線性布置,位置s處的傳感器數(shù)據(jù)為J(s),s=1~S,S為傳感器總數(shù)。引入時間信息后,s處,t時刻的傳感器數(shù)據(jù)為J(t,s),t=1~T,T為最新時刻。對于任意t (1) 設計3個指標用于檢測噪聲和異常數(shù)據(jù):空間均值、空間一致性、時間一致性。采用區(qū)域熵尋找特征區(qū)域,例如數(shù)據(jù)出現(xiàn)明顯變化,或出現(xiàn)峰值的區(qū)域。 1.1.1 空間均值 最新時刻T時,所有位置處數(shù)據(jù)的均值可表示為 (2) 目標時序N定義為時間變化的最新時序。 1.1.2 空間一致性 T時刻s處,數(shù)據(jù)的空間變化率為Δs(s),如式(3)所示。當數(shù)據(jù)變化趨勢為增大時,Δs(s)>0,當數(shù)據(jù)減小時,Δs(s)<0。 Δs(s)=J(T,s)-J(T,s-1) (3) s與其左鄰域s-1處的數(shù)據(jù)變化趨勢一致,則s與其左鄰域數(shù)據(jù)具有空間一致性。定義Cleft(s)為左鄰域空間一致性,如式(4)所示。若Cleft(s)>0,s的左鄰域滿足空間一致性。 Cleft(s)=Δs(s-1)·Δs(s) (4) 與Cleft(s)同理,定義Cright(s),如式(5)所示,若Cright(s)>0,s的右鄰域滿足空間一致性。 Cright(s)=Δs(s+1)·Δs(s+2) (5) 根據(jù)空間一致性,可以排除異常的噪聲點,當某個傳感器失效或者出現(xiàn)較大噪聲時,該傳感器數(shù)據(jù)與左右兩側(cè)數(shù)據(jù)的變化趨勢不同,不滿足空間一致性要求。當Cleft(s)或Cright(s)為負數(shù)時,將數(shù)據(jù)點s刪除,從而保證空間一致性。 1.1.3 時間一致性 t時刻s處數(shù)據(jù)的時間變化率為Δt(t,s),如式(6)所示: Δt(t,s)=J(t,s)-J(t,s-1) (6) T時刻的數(shù)據(jù)與前一段時間的變化趨勢相同時,則數(shù)據(jù)具有時間一致性。定義Ctime(s)如式(7)所示。Ctime(s)>0,s處的數(shù)據(jù)滿足時間一致性。 Ctimes(s)=Δs(T-1,s)·Δs(T,s) (7) 由于外部環(huán)境突變,可能導致傳感器異常,例如電壓電流變化、撞擊等,通過Ctime(s)可以判斷傳感器當前時刻與歷史時刻的數(shù)據(jù)變化情況是否一致,從而發(fā)現(xiàn)異常。 1.1.4 區(qū)域熵 N(s,R)表示一個位于s附近,半徑為R的區(qū)域,覆蓋數(shù)據(jù)矩陣JT×S從T-2R到T行,從s-R到s+R列的數(shù)據(jù)塊。通過區(qū)域熵E(s)度量N(s)內(nèi)的信息量。 E(s)表示為[10]: (8) (9) E(s)越大,表示N(s)中的信息越豐富,區(qū)域中的數(shù)據(jù)出現(xiàn)了顯著的變化,是需要重點關(guān)注的特征區(qū)域。其中將E(s)最大的區(qū)域N(s)標注為特征區(qū)域regionF。 本文模型通過時空預處理保留同組傳感器的數(shù)據(jù)特征,避免傳統(tǒng)DS證據(jù)融合因個別數(shù)據(jù)異常,降低其可信度或剔除數(shù)據(jù)導致融合結(jié)果失去環(huán)境特征。本文時空預處理步驟如下所示。 步驟1:輸入原始數(shù)據(jù){J(t,s)|t=1~T,s=1~S}; 步驟2:根據(jù)式(2),計算空間均值; 步驟3:計算T時刻各位置數(shù)據(jù)與空間均值的差值,當某位置處的差值絕對值大于等于閾值σ時,標記為爭議點數(shù)據(jù)si; 步驟4:根據(jù)式(3)~式(7),計算疑似爭議點數(shù)據(jù)si的空間一致性及時間一致性,剔除異常數(shù)據(jù); 步驟5:根據(jù)式(8)、式(9)計算區(qū)域熵獲得特征區(qū)域regionF; 步驟6:輸出時空預處理后數(shù)據(jù){J(s)|s=1~S′}。 其中,σ為傳感器數(shù)據(jù)與目標時序數(shù)據(jù)均值差額的閾值,本文主要研究綜合管廊甲烷氣體傳感器的數(shù)據(jù)融合,取經(jīng)驗值為0.15。其次通過時空預處理,剔除了部分位置處的異常數(shù)據(jù)及噪聲數(shù)據(jù),因而S′≤S。對于空間一致性,因存在特殊情況如目標傳感器為邊緣傳感器,故若僅滿足左側(cè)一致或右側(cè)一致,則認為其滿足空間一致性。 D-S證據(jù)理論由Dempster和Shafer提出[11]。在D-S證據(jù)理論中,辨識框架Θ表示有限個完備而互斥的元素{θ1,θ2,…,θn},2θ為辨識框架冪集,證據(jù)理論通過定義基本信任分配描述元素之間的差異性。任一關(guān)注命題都對應于識別框架Θ的一個子集。若式(10)成立,則稱m∶2θ→[0,1]為Θ上的Mass函數(shù)。 (10) 式中m(A)為基元的基本信任分配函數(shù)(BPA)。 若m(A)>0,則稱基元A為焦元。所有焦元并稱為BPA的核。信任函數(shù)(Bel)和似真函數(shù)(Pl)分別定義為: (11) (12) 對于辨識框架Θ中的命題(或事件)A,可構(gòu)成信度區(qū)間[Bel(A),Pl(A)],用于描述命題A發(fā)生可能性的取值范圍。即證據(jù)理論是利用信度區(qū)間來描述命題的不確定性。證據(jù)理論中Mass函數(shù)的賦值m(Θ)∈[0,1]用于描述未知性。需要指出的是依據(jù)貝葉斯全概率理論,全集的總概率P(Θ)=1。 基于Dempster規(guī)則,可獲取獨立證據(jù)m1和m2的組合或融合結(jié)果,如式(13)所示: (13) 多個證據(jù)組合時,Dempster規(guī)則滿足結(jié)合律和交換律,這有利于信息融合系統(tǒng)的分布式實現(xiàn)。 針對綜合管廊同質(zhì)傳感器的數(shù)據(jù)融合,傳統(tǒng)的數(shù)據(jù)融合方式存在許多不完善的地方,比如在某一時刻部分位置傳感器數(shù)據(jù)明顯高于其他傳感器均值時,決策系統(tǒng)可能將其歸列為錯誤數(shù)據(jù)并將其剔除,未參與最后的融合處理,這類融合數(shù)據(jù)方式易丟失監(jiān)測環(huán)境中的特征信息,對融合后的數(shù)據(jù)應用(例如火災預警等)造成不良影響。為了克服傳統(tǒng)融合方式的缺陷,本文利用對各傳感器間的數(shù)據(jù)一致性,以所有傳感器作為支撐目標傳感器的證據(jù),通過這些證據(jù)計算目標傳感器的可信度,最后根據(jù)可信度對所有目標傳感器進行加權(quán)融合。 對于多個傳感器,選取任意一個作為目標傳感器,將所有傳感器作為支撐目標的證據(jù)。設目標傳感器為J(n),n=1~S′。對于每個目標傳感器,向J(n)提供證據(jù)支撐的證據(jù)傳感器為J(i),i=1~S′。J(i)對J(n)的支撐程度稱為證據(jù)的基本信任分配mi(n)。根據(jù)所有證據(jù)獲得目標的可信度m(n)。若某個傳感器數(shù)據(jù)在數(shù)值大小及時空信息明顯異于其他傳感器,即說明其他傳感器不支持該傳感器數(shù)據(jù),則該傳感器可信度較低。相反的,若其他傳感器各類信息充分支持目標傳感器,則該傳感器數(shù)據(jù)可信度較高。 2.2.1 證據(jù)劃分及信任分配 根據(jù)證據(jù)與目標的相對位置關(guān)系及特征區(qū)域位置,定義證據(jù)的基本信任分配。根據(jù)證據(jù)傳感器與目標傳感器之間的距離,將證據(jù)劃分為鄰域證據(jù)集ΨN和一般證據(jù)集ΨM。另外,特征區(qū)域regionF內(nèi)的傳感器組成特征證據(jù)集ΨF。根據(jù)不同證據(jù)集的特性確定不同的信任分配。 (14) (15) 當J(i)靠近J(n),認為J(i)為鄰域證據(jù),所有鄰域證據(jù)組成鄰域證據(jù)集ΨN。反之,若J(i)距離J(n)較遠,則J(i)為一般證據(jù),所有一般證據(jù)組成一般證據(jù)集ΨM。 (16) 鄰域證據(jù)靠近目標傳感器,對目標的支撐度大,而一般證據(jù)對目標的支撐度較小,因此,需要為鄰域證據(jù)和一般證據(jù)確定不同的信任分配。mi(n)為證據(jù)傳感器i對目標傳感器n的基本信任分配。KN、KM分別是ΨN、ΨM中元素的數(shù)量。 (17) 若證據(jù)J(i)位于特征區(qū)域regionF中,則J(i)∈ΨF。此時,取消原來的信任分配,重新定義mi(n),其中2R+1是特征區(qū)域regionF的寬度。 (18) 通過時空預處理中的空間位置和特征區(qū)域信息劃分證據(jù),有效改善了DS信任分配過程,有利于后續(xù)根據(jù)證據(jù)的信任分配計算目標可信度。 2.2.2 信任分配更新 (19) (20) 其次,對于ΨN、ΨM、ΨF等不同集合中的證據(jù)J(i),定義wi(n)滿足一定約束。設為J(i1)為所有J(i)中的一個證據(jù),J(i2)為所有J(i)中的另一個證據(jù)。J(i1)、J(i2)對應的組合權(quán)值分別為wi1(n)、wi2(n)。wi1(n)和wi2(n)滿足以下約束,如式(21)所示,L為全體傳感器覆蓋的總長度,當相鄰傳感器距離為1時,L=S。 (21) 式(21)的物理意義為:(1)若J(i1)、J(i2)都屬于鄰域傳感器,則證據(jù)與目標的距離越近,組合權(quán)重越大,權(quán)值與距離成反比。(2)通過時空預處理所得的特征區(qū)域產(chǎn)生的特征證據(jù)比鄰域證據(jù)更重要,因此特征證據(jù)的權(quán)重理應大于鄰域證據(jù)及一般證據(jù)。(3)鄰域證據(jù)比一般證據(jù)更重要,故鄰域證據(jù)權(quán)重理應更大。 另外,當兩個證據(jù)均為一般證據(jù)或者特征證據(jù)時,組合權(quán)重相同。 (22) 由此,完成證據(jù)更新。 2.2.3 證據(jù)組合 將所有證據(jù)對目標的支撐程度mi(n)組合在一起,計算目標可信度m(n),如式(23)所示: (23) 以可信度m(n)作為J(n)的權(quán)重,多傳感器加權(quán)融合結(jié)果為J0,J0表示為 (24) 為驗證本文算法的實效性及優(yōu)越性,文獻[12-13]中使用模擬軟件FLUENT對綜合管廊一個防火分區(qū)中各位置甲烷傳感器的數(shù)據(jù)模擬情況以及文獻[14]對綜合管廊通風情況的模擬,建立實驗數(shù)據(jù)集共10組,其中1~7組設置為甲烷存在泄漏,8~10組設置為甲烷無泄漏,并在第10組加入異常值干擾。因篇幅限制,僅列出第1組實驗數(shù)據(jù),如表1所示,其中位置為傳感器線性排列放置的位置,時刻為傳感器收集數(shù)據(jù)的時序,6為最新時刻。實驗PC處理器為Inter(R) Core(TM) i7-4710HQ CPU @2.50 GHz,內(nèi)存8.00GB,在Matlab2016環(huán)境下進行實驗。 表1 第1組甲烷傳感器監(jiān)測值 最新時刻數(shù)據(jù)圖如圖2所示,其中特征區(qū)域傳感器為3、4、5。從傳感器數(shù)據(jù)圖可以看出,傳感器4附近位置發(fā)生甲烷泄漏,故該時刻此防火分區(qū)最終融合值應在0.5左右才能夠有效表現(xiàn)甲烷泄漏情況。 圖2 最新時刻數(shù)據(jù)圖 本文以第1組實驗為例,分別以位置1、4處的作為目標傳感器J(n=1)、J(n=4),給出各證據(jù)的信任分配計算步驟: 步驟2:根據(jù)式(16)~式(18)計算各證據(jù)的初始信任分配; 步驟3:根據(jù)歸一化約束式(20),權(quán)重關(guān)系約束式(21),計算各證據(jù)的組合權(quán)重; {wi(n=4)|i=1~8}={0.196,0.188,0.153,0.136, 0.136,0.05,0.07,0.07} {wi(n=4)|i=1~8}={0.039,0.144,0.198,0.198, 0.198,0.144,0.039,0.039} 步驟4:根據(jù)式(22)更新證據(jù)信任分配; 0.167,0.167,0.006,0,0}, 0.244,0.107,0.018,0.018} 步驟5:根據(jù)式(23)獲得目標可信度,由式(24)計算最終融合值,J0=0.405。由于本文方法最終融合值較接近0.5,故能夠快速有效地表現(xiàn)該時刻防火分區(qū)發(fā)生的甲烷泄漏情況。 表2 算法生成的證據(jù)對比 此外,對實驗集中的10組實驗數(shù)據(jù)進行數(shù)據(jù)融合實驗,對比算法包括文獻[8]的算法和算術(shù)平均法。實驗結(jié)果如圖3所示。 圖3 數(shù)據(jù)融合結(jié)果對比 從圖3中可以看出:對于無甲烷泄漏的第8~9組實驗數(shù)據(jù),3種算法的融合值基本一致,即ST-DS保持了傳統(tǒng)數(shù)據(jù)融合算法的良好融合能力。對于無甲烷泄漏但存在異常值的第10組實驗數(shù)據(jù),本文算法與文獻[8]算法均具有排除異常值的能力,其中文獻[8]依據(jù)方均歐式距離剔除異常值,而本文算法通過時空預處理,充分考慮異常位置的數(shù)據(jù)變化情況,判斷異常值。第8~10組實驗結(jié)果表明,本文算法保證了在無泄漏情況下的數(shù)據(jù)融合精度。對于存在甲烷泄漏的第1~7組實驗數(shù)據(jù),ST-DS的最終融合值明顯高于文獻[8]的算法和算術(shù)平均法,融合值越高越容易觸發(fā)泄漏報警,同時更快的引起監(jiān)測人員關(guān)注。因此,融合值越高算法性能越好。 這是由于ST能夠監(jiān)測甲烷的時空信息,通過時空預處理,能夠最大程度保留泄漏點的環(huán)境特征,從而合理分配證據(jù)融合中各傳感器的權(quán)值。文獻[8]僅通過方均歐氏距離閾值差距大小判斷異常值,導致最終融合值的可靠度不高。算術(shù)平均法對數(shù)據(jù)的敏感性較低且無法排除異常值,如對于第4~5組實驗數(shù)據(jù),在泄漏點濃度較小時,其融合值與本文算法融合值的差異較??;對于第6~7組實驗數(shù)據(jù),在泄漏點濃度較大時,其融合值與本文算法融合值的差異較大。綜上所述,ST-DS不再以單一數(shù)據(jù)的數(shù)值差距作為融合依據(jù),對綜合管廊甲烷濃度感知更加敏感,最終的融合結(jié)果能夠?qū)Ξ敃r管廊甲烷環(huán)境起到表征作用,提高了最終融合數(shù)據(jù)的實用性和有效性。 綜合管廊中的監(jiān)測數(shù)據(jù)具有種類多、總量大的特點。本文選用甲烷氣體濃度的監(jiān)測為研究對象,以D-S證據(jù)理論為研究基礎(chǔ),結(jié)合綜合管廊中甲烷氣體傳感器的布置方案,通過進行時空預處理的方式,充分挖掘傳感器監(jiān)測數(shù)據(jù)特有的時空信息,提出一種基于ST-DS的數(shù)據(jù)融合算法。實驗結(jié)果表明,與其他文獻算法相比,本文算法通過進行時空預處理不僅能夠保留原有數(shù)據(jù)內(nèi)的特征信息,而且能夠消除異常值,為后續(xù)的數(shù)據(jù)應用提高了實用性及有效性。1.1 時空預處理方法
1.2 時空預處理步驟
2 基于ST-DS的數(shù)據(jù)融合算法
2.1 D-S 證據(jù)理論
2.2 基于時空預處理的D-S融合方法
3 實驗結(jié)果與分析
4 結(jié)論