匡 亮,施 珮,季云峰,平震宇,陳北京
(1. 江蘇信息職業(yè)技術(shù)學(xué)院物聯(lián)網(wǎng)工程學(xué)院,無(wú)錫 214153;2. 南京信息工程大學(xué)計(jì)算機(jī)與軟件學(xué)院,南京 210044;3. 中國(guó)水產(chǎn)科學(xué)研究院淡水漁業(yè)研究中心,農(nóng)業(yè)部淡水漁業(yè)和種質(zhì)資源利用重點(diǎn)實(shí)驗(yàn)室,無(wú)錫 214081;4. 江南大學(xué)物聯(lián)網(wǎng)工程學(xué)院,無(wú)錫 214122)
無(wú)線傳感器網(wǎng)絡(luò)(Wireless Sensor Networks,WSN)以其靈活的部署、低成本,小體積等優(yōu)勢(shì)被廣泛應(yīng)用于軍事偵察、工業(yè)監(jiān)測(cè)、農(nóng)業(yè)監(jiān)測(cè)和醫(yī)療監(jiān)控等各個(gè)領(lǐng)域[1-7]。在水質(zhì)監(jiān)測(cè)中,通過(guò)部署傳感器節(jié)點(diǎn)來(lái)收集水質(zhì)數(shù)據(jù),實(shí)現(xiàn)監(jiān)測(cè)區(qū)域內(nèi)水質(zhì)參數(shù)的實(shí)時(shí)監(jiān)控。然而,當(dāng)監(jiān)測(cè)區(qū)域較大時(shí),由于監(jiān)測(cè)區(qū)域中水質(zhì)參數(shù)值分布不均勻的問(wèn)題,使得單一位置的監(jiān)測(cè)數(shù)據(jù)不能很好的體現(xiàn)整個(gè)監(jiān)測(cè)區(qū)域的真實(shí)情況[8]。同時(shí),傳感器網(wǎng)絡(luò)中數(shù)據(jù)的丟失、異常情況時(shí)有發(fā)生[9],而水下環(huán)境的復(fù)雜性增加了異常情況處理的難度。為了實(shí)現(xiàn)水質(zhì)的準(zhǔn)確監(jiān)測(cè),保障數(shù)據(jù)的準(zhǔn)確性和可靠性,正確評(píng)估水體實(shí)際情況,需要利用數(shù)據(jù)融合技術(shù)對(duì)不同位置的傳感器數(shù)據(jù)進(jìn)行融合,從而提高水質(zhì)監(jiān)測(cè)系統(tǒng)的魯棒性。
數(shù)據(jù)融合可以有效地減少數(shù)據(jù)冗余、提高數(shù)據(jù)質(zhì)量[10-12]?;诓煌碚摰臄?shù)據(jù)融合方法在使用過(guò)程中會(huì)呈現(xiàn)各自的局限性[13-14]。目前較為常用的數(shù)據(jù)融合方法包括統(tǒng)計(jì)型算法、人工智能型算法和信息論型算法等。以貝葉斯理論為代表的統(tǒng)計(jì)類算法需要在融合多傳感器數(shù)據(jù)之前獲取先驗(yàn)知識(shí)和概率分布來(lái)計(jì)算傳感器的可靠性[15]。以人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,ANN)為代表的人工智能型算法可以處理不清楚、不確定的非線性系統(tǒng)的問(wèn)題,但復(fù)雜的結(jié)構(gòu)和隨機(jī)參數(shù)會(huì)導(dǎo)致融合結(jié)果不穩(wěn)定[16]?;谥С侄群瘮?shù)的融合算法是典型的信息論型算法,該方法能夠獲得數(shù)據(jù)間的關(guān)系,避免不可信數(shù)據(jù)對(duì)融合結(jié)果產(chǎn)生的不良影響[17]。國(guó)內(nèi)外學(xué)者已經(jīng)對(duì)支持度函數(shù)的數(shù)據(jù)融合算法展開(kāi)了深入地研究。Luo等[18]提出一種支持度函數(shù),它利用置信概率距離來(lái)表征數(shù)據(jù)間支持度值,從而構(gòu)建數(shù)據(jù)的關(guān)聯(lián)矩陣完成數(shù)據(jù)融合。然而這種支持度函數(shù)需要進(jìn)行積分運(yùn)算,函數(shù)計(jì)算量較大。羅本成等[19]基于肖維涅統(tǒng)計(jì)思想構(gòu)建的支持度函數(shù),依據(jù)設(shè)置好的傳感器數(shù)據(jù)偏差的閾值來(lái)計(jì)算傳感器一致性矩陣。該支持度函數(shù)在計(jì)算時(shí)依賴于人為設(shè)置的閾值,數(shù)據(jù)融合誤差不穩(wěn)定。Yager[20]利用指數(shù)衰減型支持度函數(shù)獲取傳感數(shù)據(jù)間的支持度矩陣,再通過(guò)冪均方加權(quán)計(jì)算數(shù)據(jù)融合結(jié)果。該方法能夠有效地避免支持度函數(shù)非1 即0 的絕對(duì)性問(wèn)題,但指數(shù)衰減型支持度函數(shù)在參數(shù)的設(shè)置和計(jì)算復(fù)雜度上還有待改進(jìn)。熊迎軍等[21]運(yùn)用灰色系統(tǒng)接近度思想提出了一種改進(jìn)指數(shù)衰減型支持度函數(shù)。該算法不能對(duì)時(shí)間序列型數(shù)據(jù)進(jìn)行分析,數(shù)據(jù)融合過(guò)程忽略了數(shù)據(jù)在時(shí)間上的特征。段青玲等[22]對(duì)指數(shù)衰減型支持度函數(shù)進(jìn)行了改進(jìn),然而該算法在實(shí)際應(yīng)用中的融合精度有待提高。
針對(duì)上述支持度函數(shù)融合算法存在的問(wèn)題,本研究提出一種基于改進(jìn)的動(dòng)態(tài)時(shí)間彎曲距離支持度函數(shù)(Improved Dynamic Time Warping Distance Optimized Support Function,IDTW-SF)的加權(quán)融合算法。利用灰關(guān)聯(lián)分析理論改進(jìn)傳統(tǒng)指數(shù)衰減型支持度函數(shù)中的指數(shù)運(yùn)算,降低指數(shù)運(yùn)算復(fù)雜度。同時(shí),改變單一時(shí)刻點(diǎn)支持度的計(jì)算為時(shí)間段內(nèi)支持度的計(jì)算,并利用動(dòng)態(tài)時(shí)間彎曲距離(Dynamic Time Warping Distance,DTW)算法度量時(shí)間段內(nèi)互支持度值。再通過(guò)時(shí)間分割策略來(lái)降低算法復(fù)雜度,從而實(shí)現(xiàn)WSN 水質(zhì)數(shù)據(jù)的融合。
由于同類傳感器不同位置感知數(shù)據(jù)在時(shí)間和空間上的相關(guān)性,本研究在無(wú)線傳感網(wǎng)絡(luò)水質(zhì)監(jiān)測(cè)系統(tǒng)中,采用數(shù)據(jù)融合機(jī)制來(lái)提高數(shù)據(jù)質(zhì)量,其主要步驟包括:
1)通過(guò)數(shù)據(jù)的一致性檢測(cè)操作對(duì)感知的原始數(shù)據(jù)進(jìn)行檢測(cè),在檢測(cè)離群值的基礎(chǔ)上對(duì)丟失數(shù)據(jù)進(jìn)行重新構(gòu)建,獲得新的數(shù)據(jù)集。
2)當(dāng)無(wú)線傳感網(wǎng)絡(luò)中某個(gè)傳感器發(fā)生故障時(shí),利用基于IDTW-SF 支持度函數(shù)的數(shù)據(jù)融合算法對(duì)故障傳感器的異常數(shù)據(jù)進(jìn)行融合校正。其融合過(guò)程如圖 1 所示,N個(gè)傳感器節(jié)點(diǎn)采集的數(shù)據(jù)經(jīng)過(guò)一致性檢測(cè)后構(gòu)成數(shù)據(jù)集X={X1,X2, …,XN}。若傳感器1 為故障傳感器,則系統(tǒng)利用融合機(jī)制將傳感器節(jié)點(diǎn)X2= {x21,x22,…,x2t},X3= {x31,x32,…,x3t}和XN= {xN1,xN2,…,xNt}進(jìn)行處理,并獲取融合數(shù)據(jù)X1’,其中t為采集時(shí)刻。
3)基于融合機(jī)制的水質(zhì)監(jiān)測(cè)系統(tǒng)使用融合結(jié)果X1’來(lái)替換故障傳感器1 中的數(shù)據(jù)X1,從而提高數(shù)據(jù)質(zhì)量,為后續(xù)的數(shù)據(jù)分析和監(jiān)測(cè)提供更可靠的信息。
圖1 水質(zhì)監(jiān)測(cè)系統(tǒng)數(shù)據(jù)融合流程Fig.1 Process of data fusion in water quality monitoring
在水質(zhì)監(jiān)測(cè)中,傳感器在水下受到的影響因素遠(yuǎn)比在空氣中多。復(fù)雜的影響因素使得傳感器更易發(fā)生故障和傳輸錯(cuò)誤。對(duì)于傳輸中丟失的數(shù)據(jù),采用線性插值法[23]對(duì)這些數(shù)據(jù)進(jìn)行修補(bǔ)。同時(shí),利用自滑動(dòng)移動(dòng)平均模型( Model Average Moving Integrated Autoregressive ,ARIMA)[24]實(shí)現(xiàn)感知數(shù)據(jù)的一致性檢測(cè),其主要步驟包括:
1)首先對(duì)水質(zhì)參數(shù)時(shí)間序列數(shù)據(jù)間的相關(guān)性進(jìn)行分析,測(cè)試各感知數(shù)據(jù)Xi的穩(wěn)定性,本研究以水體溶解氧濃度為例。
2)確定ARIMA 模型的自回歸階數(shù)p和移動(dòng)平均階數(shù)q,基于設(shè)定的參數(shù)構(gòu)建最優(yōu)ARIMA 模型。
3)利用確定的ARIMA 模型獲取判定數(shù)據(jù)異常的置信區(qū)間PI,如式(1)所示
式中oi(t)為t時(shí)刻的傳感器感知數(shù)據(jù),xi(t)為 ARIMA 模型的預(yù)測(cè)值,C為代價(jià)函數(shù)[25]。式(2)為預(yù)測(cè)值x的PI預(yù)測(cè)區(qū)間。
式中n是樣本大小,s為標(biāo)準(zhǔn)偏差,t分布為遵循自由度為(n-1)的分布函數(shù)。
1.2.1 支持度函數(shù)
基于支持度函數(shù)(Support Function,SF)的融合算法是一種使用較為廣泛的數(shù)據(jù)融合算法。它能夠有效地獲取數(shù)據(jù)間的潛在關(guān)系,進(jìn)而獲得數(shù)據(jù)間的支持度。支持度函數(shù)即sup(a,b),用于表征兩元素a和b之間的接近程度[26]。當(dāng)進(jìn)行數(shù)據(jù)融合時(shí),可信度高的數(shù)據(jù)擁有高的權(quán)值,可信度低的數(shù)據(jù)則擁有低的權(quán)值。
目前,較為常用的支持度函數(shù)為高斯型支持度函數(shù)(Gaussian support function,G),也可稱作為指數(shù)衰減型支持度函數(shù)[20,27],如式(3)所示
式中K為函數(shù)的振幅,β為函數(shù)的衰減系數(shù)。當(dāng)兩元素間接近程度越高時(shí),函數(shù)的支持度值也越高。當(dāng)a=b時(shí),sup(a,b)= K。即,a、b間差距越大,則sup(a,b)越趨近于0。
由于該支持度函數(shù)具有對(duì)稱性,且運(yùn)算過(guò)程是基于指數(shù)運(yùn)算,故sup(a,b)的計(jì)算也相對(duì)復(fù)雜和耗時(shí)。劉思峰等[28]利用灰色關(guān)聯(lián)分析理論表達(dá)兩元素間的接近程度,即支持度。本研究在這種思想的基礎(chǔ)上提出一種支持度函數(shù),對(duì)高斯型支持度函數(shù)進(jìn)行改進(jìn),從而降低函數(shù)的計(jì)算復(fù)雜度,其函數(shù)表達(dá)式如式(4)所示
水質(zhì)監(jiān)測(cè)中,同一深度的溶解氧濃度的數(shù)據(jù)差異<2 mg/L,即(a–b)∈[–2, 2]。則本研究所提出的支持度函數(shù) SF(a,b,K,β)其特性曲線如圖 2 所示。(a–b)為不同溶解氧傳感器感知數(shù)據(jù)的差值。為了更有效地獲取數(shù)值間偏差影響,體現(xiàn)各信息權(quán)重對(duì)支持度的影響,本研究中確定參數(shù)K=1,β=3。
圖 2 顯示,G(a,b,1,3)、D(a,b,1,3)[21]、SN(a,b,1,3)[22]和 SF(a,b,1,3)分別表示各支持度函數(shù)的特性曲線,且當(dāng)(a–b)∈[–1, 1]時(shí),SF(a,b,1,3)能夠更好的接近G(a,b,1,3)。事實(shí)上,在水質(zhì)監(jiān)測(cè)中,溶解氧濃度的差異值大多數(shù)集中在[?1,1]。在水質(zhì)監(jiān)測(cè)中使用本研究提出的支持度函數(shù)SF(a,b,1,3)能夠較好地反映傳感網(wǎng)絡(luò)數(shù)據(jù)之間的關(guān)系。
圖2 不同支持度函數(shù)特性曲線Fig.2 Characteristic curve of different support functions
1.2.2 動(dòng)態(tài)彎曲距離改進(jìn)支持度函數(shù)
在高斯型支持度函數(shù)中,t時(shí)刻2 個(gè)元素間的接近程度為sup(a,b),其表達(dá)式如式(3)所示。然而在處理時(shí)間序列數(shù)據(jù)時(shí),會(huì)丟失數(shù)據(jù)前后之間的關(guān)聯(lián)信息。考慮到水質(zhì)參數(shù)序列數(shù)據(jù)在時(shí)間上的連續(xù)性,本研究對(duì) 2 個(gè)時(shí)間序列U和V之間的接近程度進(jìn)行分析,完成時(shí)間序列間接近程度sup(U,V)的度量,從而提出基于時(shí)間序列的動(dòng)態(tài)彎曲距離改進(jìn)的支持度函數(shù)(DTW-SF)。DTW 是一種廣泛用于度量時(shí)間序列之間相似性的算法之一[29]。本研究選擇DTW 來(lái)度量2 個(gè)序列數(shù)據(jù)之間的接近程度,結(jié)合SF 支持度函數(shù),從而獲得DTW-SF 支持度函數(shù),其表達(dá)式如式(5)所示
式中 dist 表征時(shí)間序列U= {u1,u2, …,up, … ,um}(1≤p≤m)和序列V= {v1,v2, …,vq, …,vn} (1≤q≤n)的動(dòng)態(tài)彎曲距離,m和n分別為序列的維數(shù)。S(U, V)表征2 個(gè)時(shí)間序列的相似度,即dist 距離,其表達(dá)式如式(6)所示
式中w= {w1,w2, ...,wk}為DTW 中的規(guī)整路徑,wk為w中的第k個(gè)元素;dpq=(up-vq)2。為了獲得最小路徑距離,定義dist 為累加距離,dist(U, V)為當(dāng)前格點(diǎn)dpq距離的總和[30]。
1.2.3 優(yōu)化的動(dòng)態(tài)彎曲距離改進(jìn)支持度函數(shù)
在傳統(tǒng)DTW 中,使用較為常見(jiàn)的歐氏距離來(lái)測(cè)量m維空間中兩點(diǎn)間距離。然而水質(zhì)數(shù)據(jù)時(shí)間序列的相似度測(cè)量具有時(shí)間連續(xù)性,單純采用歐式距離度量各維度數(shù)據(jù)的相似性往往會(huì)忽視各維度之間的內(nèi)在相關(guān)性,故本研究選擇馬氏距離替代歐式距離來(lái)改進(jìn)DTW 算法。同時(shí),DTW算法的復(fù)雜度較高,故引入時(shí)間序列分割策略[31],從而降低DTW 算法的時(shí)間復(fù)雜度,提高運(yùn)算效率。通過(guò)該分割策略,將兩個(gè)時(shí)間序列劃分為若干子序列,完成時(shí)間序列的分割,并構(gòu)建優(yōu)化的動(dòng)態(tài)彎曲距離改進(jìn)的支持度函數(shù)(IDTW-SF)。
在IDTW-SF 支持度函數(shù)中,設(shè)置分割時(shí)間序列長(zhǎng)度T=L。則在時(shí)間T內(nèi),由式(7)可得時(shí)間序列U(T) 和V(T)之間的支持度函數(shù),其表述式如式(8)所示
在水質(zhì)監(jiān)測(cè)中,溶解氧傳感器的感知數(shù)據(jù)經(jīng)過(guò)一致性檢測(cè)后構(gòu)成Xi。在時(shí)間間隔T內(nèi),可得傳感器i和傳感器j的數(shù)據(jù)分別Xi(T)和Xj(T)(i,j∈{1,2,…,N}),傳感器間的相互支持度sij可表達(dá)為式(9)所示
由此可獲得各傳感器之間的相互支持度矩陣如式(10)所示
則在N個(gè)傳感器組成的傳感器組中,T時(shí)間間隔內(nèi)的N-1 個(gè)傳感器對(duì)傳感器i的支持度之和如式(11)所示
利用加權(quán)融合算法,則傳感器i的融合估計(jì)值如式(12)所示
本研究以江蘇省無(wú)錫市南泉養(yǎng)殖基地試驗(yàn)池塘水質(zhì)監(jiān)測(cè)系統(tǒng)采集的溶解氧數(shù)據(jù)為試驗(yàn)對(duì)象,獲取2017 年5月 24 日至 2017 年 5 月 29 日 6 d 的溶解氧數(shù)據(jù)。圖 3a 所示試驗(yàn)池塘長(zhǎng)80 m,寬50 m。根據(jù)養(yǎng)殖專家的經(jīng)驗(yàn)分別在池塘的不同位置部署 5 個(gè)溶解氧傳感器和增氧機(jī)。它們的部署深度相同,均位于水下 0.6 m 處,其位置分布(圖 3)。其中,1 號(hào)傳感器數(shù)據(jù)控制1 號(hào)、2 號(hào)和3 號(hào)增氧機(jī),2 號(hào)傳感器數(shù)據(jù)控制4 號(hào)增氧機(jī),5 號(hào)傳感器數(shù)據(jù)控制 5 號(hào)增氧機(jī)。當(dāng)某一傳感器發(fā)生故障時(shí),系統(tǒng)則通過(guò)數(shù)據(jù)融合機(jī)制對(duì)其余傳感器的數(shù)據(jù)進(jìn)行融合,獲取高質(zhì)量的融合數(shù)據(jù)。各傳感器節(jié)點(diǎn)每10 min 采樣數(shù)據(jù),共計(jì) 864 個(gè)數(shù)據(jù)點(diǎn)。所有數(shù)據(jù)經(jīng)網(wǎng)關(guān)發(fā)送至上位機(jī)存儲(chǔ),并供后臺(tái)數(shù)據(jù)處理軟件進(jìn)行分析處理。
Fig.3 養(yǎng)殖池塘的水質(zhì)監(jiān)測(cè)設(shè)備部署圖Fig.3 Deployment diagram of water quality monitoring devices in the aquaculture pond
本研究使用ARIMA 完成864 個(gè)樣本數(shù)據(jù)的一致性檢測(cè),其中異常數(shù)據(jù)共35 個(gè),丟失數(shù)據(jù)16 個(gè)。通過(guò)仿真試驗(yàn)對(duì)樣本數(shù)據(jù)進(jìn)行測(cè)試,設(shè)置置信區(qū)間為 95%,獲得樣本數(shù)據(jù)的異常檢測(cè)率(Detection Rate,DR,%)為94.29%。其中,異常檢測(cè)率 DR=TP·100%/(TP+FN);正確率(True Positive,TP,%)為異常數(shù)據(jù)被正確檢測(cè)出的個(gè)數(shù);準(zhǔn)確率(False Negative,F(xiàn)N,%)為異常數(shù)據(jù)被錯(cuò)誤檢測(cè)的個(gè)數(shù)。本研究中所有試驗(yàn)程序均在MATLAB 2014a 環(huán)境下上運(yùn)行和實(shí)現(xiàn),計(jì)算機(jī)操作系統(tǒng)為Windows 10 (64 bit),運(yùn)行內(nèi)存為16 GB,CPU 頻率為2.7 GHz。
本研究選擇平均絕對(duì)誤差(Mean Absolute Error,MAE)和運(yùn)行時(shí)間(Time,s)作為數(shù)據(jù)融合算法性能評(píng)估的指標(biāo)。6 d 內(nèi)基于IDTWS-SF 支持度函數(shù)的融合算法的性能結(jié)果(圖4)。
如圖4 所示,6 d 內(nèi)IDTWS-SF 的融合精度MAE 值隨著分割長(zhǎng)度的不斷增大無(wú)明顯變化,處于較穩(wěn)定狀態(tài)。而運(yùn)行時(shí)間參數(shù)隨著分割長(zhǎng)度的不斷增大幾乎呈線性變化趨勢(shì)。由此可見(jiàn),分割長(zhǎng)度對(duì)融合精度MAE 值的影響較小,對(duì)算法運(yùn)行時(shí)間有較大的影響。即分割長(zhǎng)度越小,IDTWS-SF 支持度函數(shù)的綜合性能越好。綜上所述,本研究確定時(shí)間序列的分割長(zhǎng)度L=2。
2.3.1 支持度函數(shù)性能分析
基于上述參數(shù)設(shè)置情況,使用基于 IDTWS-SF 支持度函數(shù)的加權(quán)融合算法對(duì)水質(zhì)參數(shù)數(shù)據(jù)進(jìn)行融合,本研究以溶解氧濃度為例進(jìn)行試驗(yàn)。6 d 內(nèi)溶解氧濃度的融合輸出曲線如圖5 所示,IDTWS-SF 支持度函數(shù)融合輸出值能較好的擬合觀測(cè)值,6 d 內(nèi)融合值曲線與觀測(cè)值曲線較為一致,無(wú)明顯的融合異常情況。圖6 為IDTWS-SF 支持度函數(shù)加權(quán)融合算法的融合誤差率,圖中所有測(cè)試樣本的融合誤差率均低于 0.25,且大部分樣本點(diǎn)的融合誤差率低于0.05。試驗(yàn)結(jié)果證明,該算法有較好的融合效果,能有效地實(shí)現(xiàn)水質(zhì)參數(shù)溶解氧濃度的多傳感器數(shù)據(jù)融合。
圖4 優(yōu)化的動(dòng)態(tài)彎曲距離改進(jìn)支持度函數(shù)六天內(nèi)不同分割長(zhǎng)度融合性能對(duì)比圖Fig.4 Performance comparison of IDTWS-SF with different segment lengths in six days
圖5 優(yōu)化的動(dòng)態(tài)彎曲距離改進(jìn)支持度函數(shù)加權(quán)融合結(jié)果Fig.5 Results of IDTWS-SF support degree function weighted fusion
為了有效地評(píng)估IDTW 算法對(duì)支持度函數(shù)SF 的改進(jìn)效果,分別選擇SF 支持度函數(shù)、余弦?jiàn)A角[32]改進(jìn)SF 支持度函數(shù)(Cosine Angle Improved SF Function, Cos-SF)、傳統(tǒng)DTW 改進(jìn)SF 支持度函數(shù)進(jìn)行對(duì)比試驗(yàn)。對(duì)6 d 內(nèi)的水質(zhì)參數(shù)溶解氧濃度的融合殘差值進(jìn)行對(duì)比,融合殘差結(jié)果(圖7)。
圖6 優(yōu)化的動(dòng)態(tài)彎曲距離改進(jìn)支持度函數(shù)融合誤差率Fig.6 Fusion error rate of IDTWS-SF
圖7 為不同的改進(jìn)SF 支持度函數(shù)的加權(quán)融合算法的融合殘差結(jié)果對(duì)比圖。通過(guò)觀察這4 種支持度函數(shù)融合算法的殘差曲線的浮動(dòng)范圍可以發(fā)現(xiàn),6 d 內(nèi)測(cè)試數(shù)據(jù)集中Cos-SF 支持度函數(shù)融合算法的殘差浮動(dòng)范圍明顯大于其他3 個(gè)支持度函數(shù)。SF、DTW-SF 和IDTW-SF 3 種支持度函數(shù)的融合殘差浮動(dòng)情況較為接近。為了更好地對(duì)4 種支持度算法的性能進(jìn)行對(duì)比分析,對(duì)支持度函數(shù)融合精度指標(biāo)MAE 和時(shí)間進(jìn)行計(jì)算,各支持度函數(shù)融合結(jié)果(表1)。
表1 顯示IDTW-SF 支持度函數(shù)加權(quán)融合算法的性能明顯優(yōu)于其他3 個(gè)支持度函數(shù)融合算法。就MAE 指標(biāo)而言,IDTW-SF 的MAE 值相較于DTW-SF、Cos-SF 和SF分別降低了6.308 7%、54.214 5%和16.306 9%。由此可見(jiàn),改進(jìn)的DTW 方法能夠有效地提高支持度函數(shù)的融合精度。在運(yùn)行時(shí)間上,IDTW-SF 比DTW-SF 快3.576 s,相較于Cos-SF 和SF 支持度函數(shù)融合算法僅慢0.001 1 s和0.003 5 s,運(yùn)行速度相差很小。
圖7 不同的改進(jìn)支持度函數(shù)SF 的融合殘差對(duì)比圖Fig.7 Comparison of different optimized SF support degree functions for fused residual
表1 不同的改進(jìn)SF 支持度函數(shù)算法的融合結(jié)果Table 1 Weighted fusion results of different optimized support degree functions
DTW-SF 與Cos-SF、SF 支持度函數(shù)融合結(jié)果的對(duì)比試驗(yàn)發(fā)現(xiàn),DTW-SF 支持度函數(shù)有較高的MAE 值。這一結(jié)果表明,DTW 比余弦距離和歐式距離更適用于度量時(shí)間序列間的支持度,它與 SF 支持度函數(shù)的結(jié)合能夠有效的提高融合精度。而馬氏距離和時(shí)間分割策略改進(jìn)的 DTW 算法,不僅提高算法的融合精度,而且保障了算法的運(yùn)行效率。綜合融合精度和效率兩方面考慮,IDTW-SF 支持度函數(shù)更適用于水質(zhì)監(jiān)測(cè)數(shù)據(jù)的融合。
2.3.2 不同的支持度函數(shù)融合結(jié)果分析
為了深入評(píng)估本研究提出的IDTW-SF 支持度融合算法的效果,選擇高斯型支持度函數(shù)G函數(shù)[20]、改進(jìn)支持度函數(shù)D函數(shù)[21]、改進(jìn)支持度函數(shù)SN 函數(shù)[22]3 種支持度函數(shù)作為對(duì)比函數(shù)。將6 d 內(nèi)4 種支持度函數(shù)的溶解氧融合結(jié)果殘差值進(jìn)行對(duì)比分析(圖8)。
圖8 為4 種支持度函數(shù)的加權(quán)融合結(jié)果的殘差對(duì)比圖。通過(guò)觀察 4 種支持度函數(shù)融合算法的殘差曲線浮動(dòng)范圍可以發(fā)現(xiàn),盡管IDTW-SF 支持度函數(shù)的融合殘差值的浮動(dòng)范圍比其他 3 個(gè)支持度函數(shù)大,但其殘差值更接近0。結(jié)果表明,該算法的融合值與實(shí)際值差異更小。其他 3 個(gè)支持度函數(shù)融合殘差浮動(dòng)范圍則較為接近,無(wú)明顯的差異度。為了深入分析各支持度函數(shù)性能,將指標(biāo)MAE 和運(yùn)行時(shí)間作為評(píng)價(jià)指標(biāo),獲得如表2 所示的支持度函數(shù)融合性能結(jié)果。
圖8 4 種支持度函數(shù)融合殘差對(duì)比圖Fig.8 Comparison of four support degree functions for fused residual
表2 四種支持度函數(shù)的融合性能對(duì)比Table 2 Weighted fusion results of four support degree functions
由表2 可以清楚地發(fā)現(xiàn),相較于其他3 種支持度函數(shù),IDTWS-SF 的融合性能有明顯的優(yōu)勢(shì)。就MAE 值而言,IDTWS-SF 相較于G函數(shù)、D函數(shù)和SN 函數(shù)分別降低了16.656 7%、22.637 9%和21.661 1%。在算法運(yùn)行速度上,IDTWS-SF 比G函數(shù)、D函數(shù)和SN 函數(shù)分別多耗時(shí)0.000 5、0.002 1 和0.002 8 s,運(yùn)行時(shí)間差異較小。D函數(shù)和 SN 函數(shù)均為高斯支持度函數(shù)改進(jìn)后的支持度函數(shù)。2 種支持度函數(shù)的融合運(yùn)行時(shí)間比高斯函數(shù)快0.001 6和0.002 3 s,在融合精度上差異較小。
上述結(jié)果表明,將改進(jìn)的DTW 算法引入到SF 支持度函數(shù)中可以有效地提高加權(quán)融合算法的融合性能?;谛椭С侄群瘮?shù) IDTWS-SF 的數(shù)據(jù)融合算法擁有較好的融合性能,更適用于實(shí)際的水質(zhì)監(jiān)測(cè)。
針對(duì)水質(zhì)監(jiān)測(cè)系統(tǒng)對(duì)多傳感器數(shù)據(jù)融合的高精度、快速響應(yīng)要求,本研究提出一種采用IDTW-SF (Improved Dynamic Time Warping Distance Optimized Support Function)支持度函數(shù)的數(shù)據(jù)融合算法。該支持度函數(shù)在改進(jìn)傳統(tǒng)指數(shù)衰減支持度函數(shù)的基礎(chǔ)上,對(duì)時(shí)間段內(nèi)傳感數(shù)據(jù)間互支持度進(jìn)行計(jì)算。IDTW-SF 無(wú)需自行設(shè)定閾值,能夠有效的避免傳統(tǒng)支持度函數(shù)非1 即0 的問(wèn)題。在IDTW-SF 中,DTW 算法對(duì)SF 函數(shù)的改進(jìn)能夠有效地獲取時(shí)間序列數(shù)據(jù)在時(shí)間上的關(guān)聯(lián)性。同時(shí),引入的馬氏距離和時(shí)間序列分割策略能夠降低 DTW 算法的復(fù)雜度,提高算法的融合精度?;贗DTW-SF 支持度函數(shù)融合算法有較高的融合精度,其融合平均絕對(duì)誤差值為0.279 2%。算法的運(yùn)算效率較高,運(yùn)行時(shí)間僅0.021 2 s。本研究以江蘇省無(wú)錫市南泉養(yǎng)殖基地試驗(yàn)池塘水質(zhì)參數(shù)為試驗(yàn)對(duì)象,對(duì)引起魚(yú)類異常死亡重要因素之一的溶解氧數(shù)據(jù)進(jìn)行融合,結(jié)果表明IDTW-SF 支持度函數(shù)的融合效果相較于指數(shù)衰減型支持度函數(shù)和其他對(duì)比的支持度函數(shù)有較大程度的提高,能夠應(yīng)用于無(wú)線傳感網(wǎng)絡(luò)水質(zhì)監(jiān)測(cè)系統(tǒng)中,對(duì)提高魚(yú)類存活效率,降低漁民養(yǎng)殖風(fēng)險(xiǎn)有重要意義。