摘"要:多傳感器的多源異構(gòu)數(shù)據(jù)融合處理時,大量的冗余數(shù)據(jù)及復(fù)雜的非線性可分空間導(dǎo)致能耗較大,為此,提出了BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)的多源異構(gòu)數(shù)據(jù)融合算法。以數(shù)據(jù)關(guān)系構(gòu)建約束條件,利用BP神經(jīng)網(wǎng)絡(luò)算法建立數(shù)據(jù)清洗模型,判定節(jié)點變量的活躍程度,優(yōu)化數(shù)據(jù)輸入;建立數(shù)據(jù)集合,提取數(shù)據(jù)特征向量;利用支持向量機(jī)泛化能力強、凸優(yōu)化的特點,獲取特征的最優(yōu)分類超平面,獲得非線性可分多源數(shù)據(jù)集轉(zhuǎn)化為高維線性可分空間的最優(yōu)決策值,輸出結(jié)果。實驗結(jié)果表明,該算法融合多源異構(gòu)數(shù)據(jù)的能量消耗小、延遲低,融合效果好。
關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò);支持向量機(jī);多源異構(gòu)數(shù)據(jù);數(shù)據(jù)清洗;數(shù)據(jù)融合
中圖分類號:TP393""""""文獻(xiàn)標(biāo)識碼:A
Multi"Sensor"Heterogeneous"Data"Fusion"Algorithm"Based"on"BPNN"and"SVM
WANG"Xiaoqi,CHEN"Yingcong,"XIE"Minmin,"ZHANG"Jiahui,"CAI"Shang
(Meizhou"Power"Supply"Bureau"of"Guangdong"Power"Grid"Co.,"Ltd.,Meizhou,Guangdong"514021,China)
Abstract:In"the"process"of"multisensor"multisource"heterogeneous"data"fusion"processing,"a"large"number"of"redundant"data"and"complex"nonlinear"separable"space"lead"to"high"energy"consumption."Therefore,"a"multisource"heterogeneous"data"fusion"algorithm"based"on"BP"neural"network"and"support"vector"machine"is"proposed."Based"on"the"data"relationship,"the"constraint"conditions"were"established,"and"the"BP"neural"network"algorithm"was"used"to"establish"the"data"cleaning"model,"and"the"activity"degree"of"node"variables"was"determined"to"optimize"the"data"input."To"set"up"data"set"and"extract"data"feature"vector;"Based"on"the"support"vector"machine’s"strong"generalization"ability"and"convex"optimization,"the"optimal"classification"hyperplane"of"the"features"is"obtained,"and"the"optimal"decision"value"of"the"nonlinear"separable"multisource"data"set"is"obtained"into"the"highdimensional"linear"separable"space."Experimental"results"show"that"this"algorithm"has"low"energy"consumption,"low"delay"and"good"fusion"effect.
Key"words:BP"neural"network;"support"vector"machine;"multi"source"heterogeneous"data;"data"cleaning;"data"fusion
通常,一次性全部上傳多個傳感器的數(shù)據(jù)至云端,大量的多源異構(gòu)數(shù)據(jù)會降低處理效率。由此,需要將多源異構(gòu)數(shù)據(jù)轉(zhuǎn)換成分布式數(shù)據(jù)[1]上傳。但是,由于其數(shù)據(jù)屬性形式呈現(xiàn)多模態(tài),存在噪聲構(gòu)成復(fù)雜的非線性可分空間,導(dǎo)致轉(zhuǎn)化過程復(fù)雜,因此需要對不同傳感器設(shè)備采集的多源異構(gòu)數(shù)據(jù)[2]實施融合處理。
文獻(xiàn)[3]提出基于BP神經(jīng)網(wǎng)絡(luò)構(gòu)建數(shù)據(jù)融合模型,將環(huán)境影響因子作為輸入變量,期望變化值作為輸出數(shù)據(jù),進(jìn)行相關(guān)性計算,完成模型的求解。但該算法缺少對數(shù)據(jù)的清洗處理,導(dǎo)致數(shù)據(jù)融合效果差。文獻(xiàn)[4]提出利用數(shù)據(jù)之間的結(jié)構(gòu)稀疏性以及時間關(guān)聯(lián)性,建立正則化融合模型,利用梯度下降優(yōu)化算法求解。但該算法構(gòu)建模型過程中計算量較大,導(dǎo)致數(shù)據(jù)融合延遲高。文獻(xiàn)[5]提出根據(jù)數(shù)據(jù)定位結(jié)果,結(jié)合神經(jīng)網(wǎng)絡(luò)算法構(gòu)建數(shù)據(jù)融合模型,再使用遺傳算法優(yōu)化模型。但該算法在優(yōu)化模型時易陷入局部最優(yōu),融合能量消耗大。
為此,本文提出BP神經(jīng)網(wǎng)絡(luò)(back"propagation"neural"network,BPNN)和支持向量機(jī)(support"vector"machine,SVM)的傳感器設(shè)備多源異構(gòu)數(shù)據(jù)融合算法。利用BP神經(jīng)網(wǎng)絡(luò)對數(shù)據(jù)進(jìn)行清洗,初步排除噪聲干擾,消除冗余數(shù)據(jù);利用SVM算法進(jìn)行數(shù)據(jù)融合運算,借助其泛化能力強且穩(wěn)定的優(yōu)勢,尋找并訓(xùn)練最優(yōu)分類面,避免陷入局部最優(yōu)等情況發(fā)生,確保分類的有效性,從而使構(gòu)建的多源異構(gòu)數(shù)據(jù)融合結(jié)果更為可靠。
1"基于BP的多源異構(gòu)數(shù)據(jù)清洗算法
利用機(jī)器學(xué)習(xí)算法中的BP神經(jīng)網(wǎng)絡(luò)構(gòu)建多源異構(gòu)數(shù)據(jù)清洗處理模型,去除多傳感器設(shè)備上傳數(shù)據(jù)的大量冗余數(shù)據(jù)。其機(jī)理是先通過設(shè)定多源異構(gòu)數(shù)據(jù)的相似性約束關(guān)系,實現(xiàn)數(shù)據(jù)內(nèi)部結(jié)構(gòu)的關(guān)聯(lián)性,不僅可以提高后期BP神經(jīng)網(wǎng)絡(luò)內(nèi)部數(shù)據(jù)清洗運行的速度,還能夠提升數(shù)據(jù)清洗工作效率。BP神經(jīng)網(wǎng)絡(luò)中最基本的分類器是分類回歸樹,主要就是在上述關(guān)聯(lián)性的約束下,通過對多源異構(gòu)數(shù)據(jù)結(jié)果進(jìn)行相互整合與分類,獲取更為精準(zhǔn)的多源異構(gòu)數(shù)據(jù)關(guān)系,排除無用數(shù)據(jù)關(guān)系,從而完成數(shù)據(jù)清洗。
1.1"獲取多源異構(gòu)數(shù)據(jù)的相似度關(guān)系約束
多個傳感器設(shè)備上傳的原始多源異構(gòu)數(shù)據(jù)以數(shù)據(jù)表的形式存在,設(shè)定數(shù)據(jù)表為b,數(shù)據(jù)總量為p,以此建立數(shù)據(jù)表集合B=b1,b2,…,bp,數(shù)據(jù)屬性集合為φ=e1,e2,…,eg,使用曼哈頓距離算法[6-7]獲取多源異構(gòu)數(shù)據(jù)之間的相似度,過程如下式所示:
lbiφ,bjφ=∑Sφ=1biφ-bjφ"(1)
式中,多源異構(gòu)數(shù)據(jù)i與數(shù)據(jù)j之間的相似度用lbik,bjk表示;樣本數(shù)據(jù)屬性用φ表示;數(shù)據(jù)i的屬性特征標(biāo)記biφ形式;數(shù)據(jù)j的屬性特征標(biāo)記bjφ形式;數(shù)據(jù)維度標(biāo)記S形式?;谏鲜鲇嬎憬Y(jié)果可知,數(shù)據(jù)之間距離越大,相似度就越小。
依據(jù)上述分析結(jié)果,設(shè)定數(shù)據(jù)之間的相關(guān)系數(shù)為ρbibj,制定數(shù)據(jù)的參數(shù)閾值λ,并將其作為數(shù)據(jù)清洗模型約束條件,過程如下式所示:
λ=λgt;ρbibj,"bi,bj不相關(guān)
λ≤ρbibj,"bi,bj相關(guān)(2)
基于上述構(gòu)建的約束條件,構(gòu)建數(shù)據(jù)清洗模型。
1.2"基于BPNN的數(shù)據(jù)清洗模型
基于上述建立的約束條件,利用BP神經(jīng)網(wǎng)絡(luò)[8-9]構(gòu)建數(shù)據(jù)清洗模型,將傳統(tǒng)神經(jīng)網(wǎng)絡(luò)中模型的中間層實施限制處理。設(shè)定多源異構(gòu)數(shù)據(jù)清洗模型為T,模型中包含N層節(jié)點,具體模型結(jié)構(gòu)如圖1所示。
BPNN數(shù)據(jù)清洗模型[10]在反向傳播時,無監(jiān)督玻爾茲曼機(jī)(Restricted"Boltzmann"machine,RBM)作為模型的主要部件,是解決多源異構(gòu)數(shù)據(jù)冗余數(shù)據(jù)去除以及特征提取的關(guān)鍵。
在多源異構(gòu)數(shù)據(jù)的清洗模型中,每一層的RBM結(jié)構(gòu)中都存在可視層以及隱含層數(shù)據(jù),設(shè)定輸入層數(shù)據(jù)節(jié)點有c=α1,α2,…,αc個,隱含層節(jié)點有d=β1,β2,…,βd個,以此構(gòu)建多源異構(gòu)數(shù)據(jù)的清洗模型的層級之間的節(jié)點權(quán)重矩陣,過程如下式所示:
ξ=ω11ω12…ω1d
ω21ω22…ω2d
ωc1ωc2…ωcd"(3)
式中,構(gòu)建的節(jié)點權(quán)重矩陣描述成ξ形式;矩陣向量標(biāo)記ωcd形式?;跇?gòu)建的節(jié)點權(quán)重矩陣結(jié)合RBM能量函數(shù),獲取多源異構(gòu)數(shù)據(jù)的節(jié)點能量函數(shù),過程如下式所示:
A(αi,βj)=∑ci=1αiδi-∑cj=1βjγj-∑ci,j=0αiβiωij(4)
式中,節(jié)點數(shù)據(jù)αi的偏置系數(shù)用δi表示;節(jié)點數(shù)據(jù)βj的偏置系數(shù)用γj表示;數(shù)據(jù)權(quán)重標(biāo)記ωij形式;常數(shù)用i、j表示;模型中輸入層數(shù)據(jù)的節(jié)點數(shù)量用c表示;獲取的數(shù)據(jù)節(jié)點能量函數(shù)描述成A(αi,βj)形式。
依據(jù)構(gòu)建的節(jié)點能量函數(shù)對模型輸入層節(jié)點以及隱含層節(jié)點的數(shù)據(jù)分布概率展開測試,測試結(jié)果如下式所示:
Q(αi,βj)=ε-A(αi,βj)∑ci,j=0ε-A(αi,βj)"(5)
式中,數(shù)據(jù)能量函數(shù)的歸一化系數(shù)描述成∑αi,j=0ε-A(αi,βj)形式;分布因子描述成ε形式;數(shù)據(jù)分布概率用Q(αi,βj)表示。
基于上述獲取的數(shù)據(jù)分布概率能夠有效獲取模型節(jié)點變量的活躍程度,優(yōu)化清洗模型。一般來說,將多源異構(gòu)數(shù)據(jù)樣本輸入清洗模型中,模型中間層數(shù)據(jù)節(jié)點之間狀態(tài)相互獨立,假定隱含層節(jié)點βj為1時,獲取數(shù)據(jù)分布概率的約束條件,過程如下式所示:
Q(βj=1|αi,ωij)=η(φj+∑ci,j=1αi·ωij)(6)
式中,建立的約束條件用Q(βj=1|αi,ωij)表示;二值型Sigmoid函數(shù)標(biāo)記η形式;數(shù)據(jù)狀態(tài)系數(shù)表述成φj形式?;谏鲜鲇嬎憬Y(jié)果可知,當(dāng)Sigmoid函數(shù)[11]自變量取值區(qū)間在0,1時,數(shù)據(jù)的概率分布函數(shù)會呈現(xiàn)單一的連續(xù)變化狀態(tài)。
利用上述計算流程激活神經(jīng)網(wǎng)絡(luò)模型隱含層節(jié)點后,輸入βj對模型實施反向傳播,實現(xiàn)模型的訓(xùn)練。根據(jù)訓(xùn)練結(jié)果中抓取的節(jié)點能量異常和分布離散的數(shù)據(jù),進(jìn)行去除處理,完成多源異構(gòu)數(shù)據(jù)的清洗[12]。
2"SVM的多源異構(gòu)數(shù)據(jù)融合算法
基于上述數(shù)據(jù)清洗結(jié)果,對多傳感器設(shè)備的多源異構(gòu)數(shù)據(jù)特征展開提取處理。SVM是一種以統(tǒng)計為基礎(chǔ)的二分類方法。該方法的基本思路是:在訓(xùn)練集合內(nèi),通過訓(xùn)練求出一個最小的邊界函數(shù),從而使每個數(shù)據(jù)之間的最短距離達(dá)到最大。其具有結(jié)構(gòu)風(fēng)險最小化原理,具有很好的泛化能力,并且是一個凸優(yōu)化問題,只要確定局部最優(yōu)解就一定是全局最優(yōu)解,避免了陷入局部最優(yōu)的問題。使用SVM算法獲取特征的最優(yōu)分類超平面,構(gòu)建數(shù)據(jù)融合模型,最后通過建立的數(shù)據(jù)融合模型,實現(xiàn)多源異構(gòu)數(shù)據(jù)的融合。
2.1"提取多源異構(gòu)數(shù)據(jù)特征
基于上述數(shù)據(jù)清洗結(jié)果,更新多源異構(gòu)數(shù)據(jù)集合為Yij(t),樣本數(shù)據(jù)量為M個,數(shù)據(jù)狀態(tài)為t,使用均值標(biāo)準(zhǔn)化方法對數(shù)據(jù)實施標(biāo)準(zhǔn)化處理,結(jié)果如下式所示:
Yij(t)=Yij(t)j"(7)
式中,數(shù)據(jù)的標(biāo)準(zhǔn)化結(jié)果標(biāo)記Yij(t)形式;數(shù)據(jù)均值標(biāo)記j形式;常數(shù)標(biāo)記i、j形式。基于上述數(shù)據(jù)得到標(biāo)準(zhǔn)化處理結(jié)果,提取多源異構(gòu)數(shù)據(jù)i在第j個屬性時的特征向量,計算結(jié)果如下式所示:
φ(Yij)=∑Tt=1Yij(t)/T"(8)
式中,多源異構(gòu)數(shù)據(jù)的特征向量用φ(Yij)表示;數(shù)據(jù)屬性記錄時期用T表述。
2.2"多源異構(gòu)數(shù)據(jù)融合算法
利用SVM算法[13]通過核函數(shù)加快收斂速度,控制空間的維數(shù),將數(shù)據(jù)特征非線性向量空間映射到線性可分空間中,獲取最優(yōu)的分類超平面,構(gòu)建多源異構(gòu)數(shù)據(jù)的數(shù)據(jù)融合模型。
設(shè)定獲取的數(shù)據(jù)特征向量為輸入向量yi,核函數(shù)為K(·),特征向量集為y,輸出向量為ui,以此獲取數(shù)據(jù)的最優(yōu)超平面,過程如下式所示:
u=sgn"∑mi=τiuiK(yi,y)+(9)
式中,獲取得到最優(yōu)超平面用u表示;加權(quán)系數(shù)用τi表示;偏置項用表示;特征向量數(shù)量用m表示;常數(shù)標(biāo)記i形式。
基于獲取的最優(yōu)超分類面,將多源異構(gòu)數(shù)據(jù)劃分成h組數(shù)據(jù),且不同組別的數(shù)據(jù)來自不同的傳感器。設(shè)定數(shù)據(jù)的實際值為u,訓(xùn)練輸出為U,泛化參數(shù)為χ,以此建立SVM的多源異構(gòu)數(shù)據(jù)的融合模型[14-15],如下式所示:
J=min"12∑gi,j=1(li-li)(lj-lj)K(yi,y)""+χ∑gi=1(li-li)∑gj=1ui(li-li)s.t.(li-li)=0(10)
式中,構(gòu)建的數(shù)據(jù)融合模型用J表示;數(shù)據(jù)i、j的最優(yōu)解標(biāo)記li、lj形式;最優(yōu)解均值標(biāo)記li、lj形式;約束條件標(biāo)記s.t.(li-li)形式;傳感器數(shù)量用g表示。
基于確定的數(shù)據(jù)最優(yōu)解,建立數(shù)據(jù)的決策函數(shù),完成模型求解,實現(xiàn)數(shù)據(jù)的融合,過程如下式所示:
f(x)=∑gi=1(g-lg)K(yi,y)+"(11)
式中,構(gòu)建的決策函數(shù)用f(x)表示;傳感器g的數(shù)據(jù)均值集合標(biāo)記g形式;數(shù)據(jù)最優(yōu)解標(biāo)記lg形式。多源異構(gòu)數(shù)據(jù)融合流程如圖2所示。
最后基于上述數(shù)據(jù)融合流程,將完成訓(xùn)練處理的數(shù)據(jù)錄入數(shù)據(jù)融合模型,根據(jù)核函數(shù)、損失函數(shù)和泛化參數(shù),對所構(gòu)建數(shù)據(jù)融合模型進(jìn)行驗證,輸出融合結(jié)果。在進(jìn)行多源數(shù)據(jù)融合時,需要同時將相關(guān)數(shù)據(jù)庫的數(shù)據(jù)進(jìn)行封裝存儲和查詢,以便隨時進(jìn)行業(yè)務(wù)處理、檢索查詢和在線優(yōu)化等操作。對完成上述處理的多源異構(gòu)數(shù)據(jù),按照數(shù)據(jù)的特征進(jìn)行歸類,通過此種方式,即可實現(xiàn)對多源數(shù)據(jù)特征的數(shù)據(jù)清洗處理,可以減少重復(fù)記錄多源異構(gòu)數(shù)據(jù),快速處理空缺記錄,有效提高數(shù)據(jù)的質(zhì)量,完成高效的數(shù)據(jù)清洗,實現(xiàn)多源異構(gòu)數(shù)據(jù)的融合。
3"實驗
3.1"實驗準(zhǔn)備
為了解決大量的冗余數(shù)據(jù)及復(fù)雜的非線性可分空間導(dǎo)致能耗較大的問題,驗證多傳感器的BPNN和SVM多源異構(gòu)數(shù)據(jù)融合算法的整體有效性,需要對此方法進(jìn)行測試。以某變電站室內(nèi)傳感器采集的數(shù)據(jù)為測試樣本,包括濕度傳感器、氣體傳感器、溫度傳感器,將2022年1月1日至4月30日的數(shù)據(jù)作為訓(xùn)練集,將2022年5月1日至5月31日的數(shù)據(jù)作為測試集。不同的參數(shù)組合影響著多源異構(gòu)數(shù)據(jù)融合算法的測試效果,同時也是BP神經(jīng)網(wǎng)絡(luò)算法和SVM算法研究的難點。主要通過仿真實驗,在Matlab平臺上構(gòu)建BP神經(jīng)網(wǎng)絡(luò)算法和SVM算法,依據(jù)每個參數(shù)對BP神經(jīng)網(wǎng)絡(luò)算法和SVM算法的最優(yōu)路徑的影響,確定每個參數(shù)較為合理的取值范圍,因此設(shè)置BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練誤差為0.05,最大迭代次數(shù)為40000,訓(xùn)練次數(shù)為5000,權(quán)重衰減次數(shù)為0.001,步長為0.02。設(shè)置SVM算法的處罰因子為1,高斯核函數(shù)寬度參數(shù)為0.5,距離中值為5,加權(quán)系數(shù)為2。
在仿真平臺上,輸入濕度傳感器、氣體傳感器、溫度傳感器采集的數(shù)據(jù),將眾多輸入數(shù)據(jù)參數(shù)類別及其可能取到的值放在一起進(jìn)行融合,當(dāng)所有可能的組合被檢索一遍后,得到最優(yōu)參數(shù)組合即為最佳值,由此進(jìn)行參數(shù)調(diào)優(yōu)。由于數(shù)據(jù)之間呈現(xiàn)多源異構(gòu)特性,數(shù)據(jù)分布如圖3所示。
分析圖3可知,通過仿真平臺采集濕度傳感器、氣體傳感器、溫度傳感器三組多源異構(gòu)原始數(shù)據(jù),得到的原始數(shù)據(jù)是不規(guī)律分布的。根據(jù)傳感器多源異構(gòu)數(shù)據(jù)分布情況,對該數(shù)據(jù)進(jìn)行BPNN清洗處理,結(jié)果如圖4所示。
清洗處理過程中,判斷數(shù)據(jù)的來源與渠道,在此過程中若多源異構(gòu)數(shù)據(jù)存在丟失或異常情況,則需要清洗去除異常情況。完成處理后,將數(shù)據(jù)錄入計算機(jī),使用本文設(shè)計算法提取多源異構(gòu)數(shù)據(jù)集合中的特征信息。在此基礎(chǔ)上,選擇不同的鏈路得到數(shù)據(jù)在終端的融合處理結(jié)果。通過圖4可以看出,本文的清洗算法可以很好地排除數(shù)據(jù)干擾,數(shù)據(jù)優(yōu)化效果明顯。
3.2"實驗結(jié)果及分析
采用所提算法對上述傳感器多源異構(gòu)數(shù)據(jù)進(jìn)行融合處理,在進(jìn)行BP神經(jīng)網(wǎng)絡(luò)清洗后,利用SVM算法獲得最優(yōu)融合結(jié)果,設(shè)定錯誤項的懲罰系數(shù)為3。實驗中,核函數(shù)分別采用了‘RBF’:徑像核函數(shù)/高斯核、線性核函數(shù)、多項式核函數(shù),得到了不同的分類結(jié)果。多項式核函數(shù)的階數(shù)3,只對多項式核函數(shù)有用,默認(rèn)值為3。多源異構(gòu)傳感數(shù)據(jù)分類結(jié)果如圖5所示。
根據(jù)所得清洗后的傳感數(shù)據(jù)結(jié)果,在終端調(diào)用后臺sklearn庫數(shù)據(jù),實時統(tǒng)計并記錄數(shù)據(jù)融合情況,分析不同算法下能量消耗、融合延遲、包交換率以及融合誤差測試結(jié)果。
在數(shù)據(jù)融合過程中,數(shù)據(jù)融合算法的融合性能是檢測算法優(yōu)劣的關(guān)鍵,為體現(xiàn)性能的優(yōu)越性,選取數(shù)據(jù)融合過程中的能量消耗、融合延時、包交換率測試及融合誤差四個方面進(jìn)行測試,將所提算法基于BP神經(jīng)網(wǎng)絡(luò)的滑坡監(jiān)測多源異構(gòu)數(shù)據(jù)融合算法(文獻(xiàn)[3]算法)、基于時間光滑正則化的序列診療數(shù)據(jù)融合算法(文獻(xiàn)[4]算法)進(jìn)行對比,因文獻(xiàn)[5]算法和文獻(xiàn)[3]算法具有相同的融合算法和實驗條件,在一定程度上具有相似的驗證效果,所以此處省略與文獻(xiàn)[5]的對比。
(1)能量消耗測試。
應(yīng)用了數(shù)據(jù)融合算法后,節(jié)點傳播的生命長度將大大延長,隨著傳播節(jié)點數(shù)量的增多,在多個節(jié)點上傳播數(shù)據(jù)會消耗大量的電量,融合數(shù)據(jù)后,節(jié)點的能耗將大幅度降低。采用所提算法、文獻(xiàn)[3]算法以及文獻(xiàn)[4]算法開展數(shù)據(jù)融合時,對上述3種算法在數(shù)據(jù)融合時產(chǎn)生的能量消耗展開測試,測試結(jié)果如圖6所示。
分析圖6實驗數(shù)據(jù)可知,隨著數(shù)據(jù)融合時間的不斷增加,3種數(shù)據(jù)融合算法檢測出的融合能量消耗均出現(xiàn)了不同程度的上升。但是,所提算法檢測出的數(shù)據(jù)融合能量消耗是3種算法中最低的,當(dāng)節(jié)點總數(shù)為600時,達(dá)到了最高,為6.4"J。
(2)融合延遲測試。
數(shù)據(jù)在融合過程中會產(chǎn)生延遲現(xiàn)象,延遲時間越長,說明數(shù)據(jù)融合算法的融合性能越差,反之則越好。采用所提算法、文獻(xiàn)[3]算法以及文獻(xiàn)[4]算法開展數(shù)據(jù)融合時,測試上述3種算法在數(shù)據(jù)融合時產(chǎn)生的延遲,結(jié)果如圖7所示。
分析圖7可知,隨著待融合數(shù)據(jù)量的增加,3種算法檢測出的數(shù)據(jù)融合延遲都出現(xiàn)了不同程度的上升。其中,所提算法在數(shù)據(jù)融合時,產(chǎn)生的融合延遲低于文獻(xiàn)[3]算法以及文獻(xiàn)[4]算法的測試結(jié)果,當(dāng)待融合數(shù)據(jù)量為3000個時,延遲時間達(dá)到最高,為0.1"s。
(3)包交換率測試。
基于上述測試結(jié)果,選取包交換率作為數(shù)據(jù)融合效果檢測指標(biāo),數(shù)據(jù)融合過程中,檢測出的數(shù)據(jù)包交換率越高,說明數(shù)據(jù)的融合效果越好,反之則越差。測試數(shù)據(jù)在所提算法、文獻(xiàn)[3]算法以及文獻(xiàn)[4]算法下開展數(shù)據(jù)融合時的融合效果,結(jié)果如圖8所示。
分析圖8實驗數(shù)據(jù)可知,隨著待融合數(shù)據(jù)的增加,3種數(shù)據(jù)融合算法檢測出的包交換率都呈現(xiàn)不同程度的下降。但是,所提算法在數(shù)據(jù)融合時檢測出的包交換率是3種算法中最高的,最低為96%。
(4)融合誤差測試。
以多傳感器采集的實驗數(shù)據(jù)來源為根據(jù),設(shè)定傳感器數(shù)據(jù)分析的需求協(xié)方差值,對比不同算法的追蹤需求誤差,結(jié)果如圖9所示。
分析圖9實驗數(shù)據(jù)可知,不同算法均可以滿足設(shè)定的需求協(xié)方差值,但是文獻(xiàn)[3]的數(shù)據(jù)融合算法追蹤融合需求誤差能力較低,浪費了數(shù)據(jù)融合處理的精度,文獻(xiàn)[4]的數(shù)據(jù)融合誤差一直處于較為穩(wěn)定的狀態(tài),沒有根據(jù)需求的精度進(jìn)行自適應(yīng)調(diào)整,可見在傳感器數(shù)據(jù)處理中應(yīng)用效果較差,而所提算法可以持續(xù)地保持追蹤需求協(xié)方差值,具有較好的融合精度。
綜上所述,所提算法在數(shù)據(jù)融合時,能量消耗低、融合延遲低、包交換率高,且可保持較好的融合精度,說明所提算法在數(shù)據(jù)融合時的融合性能好。這主要是因為所提算法在數(shù)據(jù)融合前,使用BP神經(jīng)網(wǎng)絡(luò)算法對數(shù)據(jù)實施了清洗處理,去除了冗余數(shù)據(jù)的干擾,增強了數(shù)據(jù)融合的效果,提升了包交換率。并在此基礎(chǔ)上,利用SVM算法獲得了最優(yōu)超分類面,避免陷入局部最優(yōu),大大減少了循環(huán)運算量,所以所提算法在數(shù)據(jù)融合時產(chǎn)生的能量消耗及融合延遲均低于其他兩種數(shù)據(jù)融合方法。
4"結(jié)"論
隨著云端計算技術(shù)使用范圍的增加,多源異構(gòu)數(shù)據(jù)融合算法就變得尤為重要。針對傳統(tǒng)數(shù)據(jù)融合算法中存在的問題,提出應(yīng)用BPNN和SVM的多傳感器設(shè)備的多源異構(gòu)數(shù)據(jù)融合算法。該算法以BP神經(jīng)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)清洗,構(gòu)建多源異構(gòu)數(shù)據(jù)集合,提取數(shù)據(jù)特征;結(jié)合SVM算法構(gòu)建數(shù)據(jù)融合模型,通過模型輸出完成數(shù)據(jù)的融合。通過上述研究,得到如下結(jié)論。
(1)本文算法檢測出的數(shù)據(jù)在節(jié)點總數(shù)為600時達(dá)到最高,融合能量消耗為6.4"J。
(2)本文算法在數(shù)據(jù)融合時,產(chǎn)生的融合延遲低于其他算法的測試結(jié)果,當(dāng)待融合數(shù)據(jù)量為3000個時,延遲達(dá)到最高,為0.1"s。
(3)本文算法在數(shù)據(jù)融合時檢測出的包交換率較高,均為95%以上。
(4)本文算法可以持續(xù)地保持追蹤需求協(xié)方差值,具有較好的融合精度。
但是該算法在提取數(shù)據(jù)特征時,還存在一定問題,今后會針對該項缺陷繼續(xù)優(yōu)化該數(shù)據(jù)融合算法,具體內(nèi)容如下。
(1)在進(jìn)行數(shù)據(jù)特征提取時,未考慮由原始輸入形成的新特征,忽略了提取過程中的復(fù)雜性,導(dǎo)致提取速度較慢,所以在下一步的工作中需要重點研究此問題;
(2)多源異構(gòu)數(shù)據(jù)網(wǎng)絡(luò)由一個節(jié)點代表一個實體,該物體的有向邊代表實體間的關(guān)聯(lián)。在此基礎(chǔ)上,今后的研究工作可以強化實體間的關(guān)聯(lián),提取數(shù)據(jù)特征,同時快速處理空缺記錄,提高多源異構(gòu)數(shù)據(jù)融合速度。
參考文獻(xiàn)
[1]"張新宇.基于分布式云的醫(yī)療數(shù)據(jù)共享系統(tǒng)[J].信息技術(shù),2021(8):59-63+69.
[2]"侯慧,于士文,肖祥,等.基于空間多源異構(gòu)數(shù)據(jù)的臺風(fēng)下輸電桿塔風(fēng)險評估[J].電力系統(tǒng)自動化,2020,44(10):127-134.
[3]"王智偉,王利,黃觀文,等.基于BP神經(jīng)網(wǎng)絡(luò)的滑坡監(jiān)測多源異構(gòu)數(shù)據(jù)融合算法研究[J].地質(zhì)力學(xué)學(xué)報,2020,26(4):575-582.
[4]"鄭毅,胡祥培.基于時間光滑正則化的序列診療數(shù)據(jù)融合方法[J].管理科學(xué),2021,34(4):61-70.
[5]"劉宇,惠鴻飛,路永樂,等.基于遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的多源信息融合室內(nèi)定位方法[J].中國慣性技術(shù)學(xué)報,2020,28(1):67-73.
[6]"竇家維,葛雪,王穎囡.保護(hù)隱私的曼哈頓距離計算及其推廣應(yīng)用[J].計算機(jī)學(xué)報,2020,43(2):352-365.
[7]"李浩君,張鵬威,郭海東.基于種群曼哈頓距離的自適應(yīng)多目標(biāo)粒子群優(yōu)化算法[J].計算機(jī)集成制造系統(tǒng),2020,26(4):1019-1032.
[8]"郭杰,蘇路,朱海浪,等.基于IBASBP神經(jīng)網(wǎng)絡(luò)的短期風(fēng)電功率預(yù)測[J].信息技術(shù),2021(10):38-43."
[9]"韓正新,喬耀華,呂守國,等.基于HC顯著算法與BP神經(jīng)網(wǎng)絡(luò)的機(jī)器視覺系統(tǒng)[J].信息技術(shù),2020,44(3):54-58."
[10]姜山,丁治明,朱美玲,等.面向時空圖建模的圖小波卷積神經(jīng)網(wǎng)絡(luò)模型[J].軟件學(xué)報,2021,32(3):726-741.
[11]VERDOOLAEGE"G,"KAYE"S"M,"ANGIONI"C,"et"al."The"updated"ITPA"global"Hmode"confinement"database:"description"and"analysis[J]."Nuclear"Fusion,"2021,"61(7):76-105.
[12]時珉,尹瑞,胡傲宇,等.基于滑動標(biāo)準(zhǔn)差計算的光伏陣列異常數(shù)據(jù)清洗辦法[J].電力系統(tǒng)保護(hù)與控制,2020,48(6):108-114."
[13]楊濱峰,趙杰.一種新的物聯(lián)網(wǎng)傳感器數(shù)據(jù)融合方法[J].信息技術(shù),2022(5):13-17+24.
[14]HASHIM"H"A,"ELTOUKHY"A."Landmark"and"IMU"data"fusion:systematic"convergence"geometric"nonlinear"observer"for"SLAM"and"velocity"bias[J]."IEEE"Transactions"on"Intelligent"Transportation"Systems,"2021,"31(3):1-10.
[15]GHAZIPOUR"F,"MAHJOURI"N."A"multimodel"data"fusion"methodology"for"seasonal"drought"forecasting"under"uncertainty:"application"of"Bayesian"maximum"entropy[J]."Journal"of"Environmental"Management,"2022,"304(15):114-120.