劉蘭淇,向青松
(河南財經(jīng)政法大學,河南 鄭州 450046)
現(xiàn)代大數(shù)據(jù)和云計算技術的飛速發(fā)展,基于網(wǎng)絡節(jié)點的無線傳感網(wǎng)絡(Wireless Sensor Network,WSN)已經(jīng)率先進入遞增交換時代。作為當代最常用的無線通信網(wǎng)絡,載荷節(jié)點的應用無論是在構建無線網(wǎng)絡傳感器上還是獲取網(wǎng)絡環(huán)境數(shù)據(jù)上,均具有重要意義。網(wǎng)絡數(shù)據(jù)傳輸交換時節(jié)點載荷會出現(xiàn)變化,為了保證網(wǎng)絡平衡, 需要對其進行調度,因此網(wǎng)絡數(shù)據(jù)交換下的復合載荷節(jié)點監(jiān)督成為當前網(wǎng)絡建設的重要研究領域[1-2]。
半監(jiān)督的思想主要基于訓練學習模型的假設值,包括聚類假設和流行假設,常用的數(shù)據(jù)算法有特征訓練,節(jié)點模型、協(xié)同訓練算法、半監(jiān)督支持向量機算法等。目前。網(wǎng)絡復合載荷節(jié)點半監(jiān)督相關研究已經(jīng)出現(xiàn)了較多成果。常用的主要要基于源數(shù)據(jù)的復合載荷節(jié)點半監(jiān)督方法。這種方法就是在進行節(jié)點監(jiān)督時,利用源數(shù)據(jù)共享模式組建共享模型,再結合當前的共性特征標準,通過模塊化的數(shù)據(jù)集合完成復合載荷節(jié)點的半監(jiān)督[3]。這種方法監(jiān)督穩(wěn)定性較強,但是整體效率極低,對網(wǎng)絡源數(shù)據(jù)要求較高,不宜推廣應用。此外美國研究學者提出了以數(shù)據(jù)存儲共享為核心的復合載荷節(jié)點半監(jiān)督方法,然而此方法在監(jiān)督過程中,需要依靠數(shù)據(jù)交換共享體系下的邏輯分析, 無法進行量化評估,其整體精確度較低,此外還有三方節(jié)點并存的半監(jiān)督技術,這種技術主要依靠構建三方節(jié)點的流式數(shù)據(jù),完成異步消息的確認,但是整體精確度較低[4]。對此,如何構建一種精確度較高且資源能耗在正常范圍內的復合載荷節(jié)點半監(jiān)督方法, 成為目前需要解決的重點問題。針對上述問題,提出了網(wǎng)絡數(shù)據(jù)交換下復合載荷節(jié)點半監(jiān)督方法,力求為該領域的研究提供一定支撐[5]。
為提高后續(xù)節(jié)點半監(jiān)督的準確性,需監(jiān)測當前網(wǎng)絡節(jié)點數(shù)據(jù)的異常數(shù)據(jù)。因為需要檢測的數(shù)據(jù)格式大多為異構數(shù)據(jù),所以此次研究的核心為異構數(shù)據(jù)異常值監(jiān)測[6]。確定當前節(jié)點范圍內的候選異構數(shù)據(jù)點集合。在當前監(jiān)督窗口W中,隨機讀取當前異構數(shù)據(jù)x,利用式(1)分別計算當前窗口的異構數(shù)據(jù)讀數(shù)均值μ,其中最大值和最小值分別用max和min表示
(1)
根據(jù)上述計算過程,利用式(2)可以獲取w個異構數(shù)據(jù)讀數(shù)的距離,其表達公式為
(2)
上述公式主要表示不同節(jié)點交換數(shù)據(jù)的讀數(shù)距離,考慮到交換數(shù)據(jù)之間存在的時間關聯(lián)性,以及異構數(shù)據(jù)的干擾性,可以肯定其距離越大,交換數(shù)據(jù)異常程度越高[7]。
將上述獲取的距離值進行正向排序,選取前面多個讀數(shù)作為載荷節(jié)點異常數(shù)據(jù)的集合節(jié)點CO。在數(shù)據(jù)群中,需保留近期節(jié)點原始數(shù)據(jù),并根據(jù)上述計算結果,傳輸?shù)娇臻g臨界節(jié)點上。在第二個監(jiān)測窗口w中,先將max和min的屬性值進行初始化,再根據(jù)上述數(shù)據(jù),通過滑動數(shù)據(jù)窗口計算μ2和dist(·),假設當前交換達到數(shù)據(jù)為x1那么
(3)
根據(jù)式(3)對節(jié)點的數(shù)據(jù)增量進行計算即可,距離式按照式(2)完成。按照上述步驟,將當前網(wǎng)絡下各復合載荷節(jié)點的空間鄰域關系進行輸入和輸出。同時在各時間區(qū)間W內,接收各鄰居節(jié)點傳輸數(shù)據(jù)。數(shù)據(jù)接收完畢后,對當前空間鄰域進行更新,結合空間距離和式(2)獲取當前各節(jié)點時間空間關系數(shù)據(jù)的偏離度,并將此作為當前局部異常系數(shù)。偏離度越高表示當前數(shù)據(jù)異常值越高。
綜上空間讀數(shù)xi和空間鄰域距離st可以由以下公式獲取
(4)
(5)
在上述式(4)和式(5)中,k代表當前網(wǎng)絡數(shù)據(jù)交換下復合載荷節(jié)點實際空間鄰居量,η代表當前檢測系數(shù),其值為0到1。檢測系數(shù)越大,則代表當前時間距離的對應比例也就越大,空間鄰居對應比值也就越小[8]。因提取st值的可以實現(xiàn)當前候選異常網(wǎng)絡節(jié)點數(shù)據(jù)的檢測,所以通常情況下,η值的取值為0。通過上述式(4)和式(5)判斷節(jié)點當前的異常值。利用分布式跳躍通信模式,記錄數(shù)據(jù)交換的傳輸路徑,將其匯聚到復合載荷節(jié)點上。接收局部節(jié)點信息后,對st值進行反向序列排列,排列在前端的異常數(shù)據(jù)間即為當前數(shù)據(jù)交換時的異常數(shù)據(jù)點集合,用LO表示。最后利用卡爾曼濾波器,對當前異常點進行檢測,獲取網(wǎng)絡數(shù)據(jù)交換時正常的數(shù)據(jù)點集合
(6)
由以上步驟完成異構網(wǎng)絡數(shù)據(jù)異常值檢測。
基于上述檢測后的數(shù)據(jù),進行數(shù)據(jù)輸入和輸出。因節(jié)點位置不同,數(shù)據(jù)表示也具有差異性。需對當前交互節(jié)點進行重新定位,交互定位的基本概念如表1所示。
表1 節(jié)點定位基本信息概念
根據(jù)2.1節(jié)對異構網(wǎng)絡數(shù)據(jù)異常值檢測得到的結果,對當前WSN數(shù)據(jù)信息進行節(jié)點定位。在此基礎上需保證節(jié)點間的聯(lián)通性,利用信標節(jié)點位置估算當前未知節(jié)點[9]。在對未知節(jié)點進行定位,不同的定位算法具有較大差異性,為解決該問題以仿真的方法(MATLAB)進行節(jié)點定位。首先應用三邊仿真策略,節(jié)點初始數(shù)據(jù)。三遍仿真策略的實際原理如圖1所示。
圖1 三邊仿真定位
通過不同節(jié)點的定位距離原理,可以確定方程組
(7)
根據(jù)式(7)獲取當前未知節(jié)點的實際坐標
(8)
根據(jù)以上坐標和三邊數(shù)據(jù)信息,進行三角測量。設D為未知節(jié)點,A、B、C分別為當前網(wǎng)絡數(shù)據(jù)的信標節(jié)點。各節(jié)點的信標坐標,需要基于式(7)和式(8)以及三邊定位下的坐標圓心,確定未知距離,已知未知節(jié)點對于各信標節(jié)點A、B、C的角度分別為∠ADB、∠ADC、∠BDC。
圖2 三角測量
對于當前網(wǎng)絡節(jié)點A、C以及對應的角∠ADC,假設當前弧AC在三角形ABC的內側,則此時弧AC只能在特定的圓內,設當前坐標距離半徑為r1,根據(jù)以下等式
β=∠AO1C=(2π-2∠ADC)
(9)
通過當前節(jié)點距離求取結果,可以得出以下公式
(10)
根據(jù)上述方程組可獲取當前圓心和半徑的距離值,由此可估算出當前交互接節(jié)點B和交互節(jié)點C。根據(jù)上述三邊定位法計算公式,可確定未知節(jié)點的真實位置。其整體算法過程如下:
Step1:部署網(wǎng)絡環(huán)境,將當前網(wǎng)絡數(shù)據(jù)區(qū)域建立在[0,L]×[0,L]的二維平面上。假設在當前區(qū)域內隨機分布的n個節(jié)點{s1,s2,…,sk}。設當前節(jié)點中有k個信標節(jié)點即{s1,s2,…,sk},剩余的均為位置節(jié)點,假設所有的數(shù)據(jù)節(jié)點均通過信息半徑R,且當前節(jié)點的計算能力一致。
Step3:獲取節(jié)點的跳數(shù)向量,假設當前信標節(jié)點的跳數(shù)為h,此時可以獲取所有信標節(jié)點的跳數(shù)向量:
h1=[h(si,sl),h(si,s2),…h(huán)(sj,sk)]
(11)
Step4:將當前信標節(jié)點的所有編號跳數(shù)作為訓練參數(shù)執(zhí)行訓練樣本生成。
Step5:根據(jù)當前訓練模型的未知網(wǎng)絡編號,制備對應的節(jié)點評估值,完成節(jié)點定位。
依靠上述節(jié)點定位結果和異常數(shù)據(jù)處理結果,采用OCHS算法實現(xiàn)當前網(wǎng)絡數(shù)據(jù)交換下復合載荷節(jié)點的半監(jiān)督[10]。因為當前網(wǎng)絡傳感器中的異構數(shù)據(jù)主要是根據(jù)數(shù)據(jù)間勾股定理選取能耗最小的路徑加入數(shù)據(jù)簇的,所以OCHS算法支持分布式運算。
為提高網(wǎng)絡異構數(shù)據(jù)的交換性能,需要引入初始能量較高的數(shù)據(jù)節(jié)點。各初始能量通過模糊變量的數(shù)據(jù)EG表征計算截止到目前時刻的鄰居節(jié)點總調配數(shù)。設定當前網(wǎng)絡M區(qū)域內存在N個數(shù)據(jù)節(jié)點,此時最佳的簇首數(shù)量為Kopt,其表達公式如下
(12)
由此可根據(jù)擇優(yōu)選擇方法,確定簇首集合表示如下
(13)
將當前節(jié)點的最優(yōu)簇首提取并集合完畢后,等待仿真數(shù)據(jù)加入到該節(jié)點中。設當前CHj代表每輪遴選出的數(shù)據(jù)簇首結合,則d(i,CHj)代表當前交換節(jié)點數(shù)據(jù)i和簇首CHj之間的聯(lián)通距離,d(CHj,BS)代表數(shù)據(jù)簇首集合CHj到傳感網(wǎng)絡異構數(shù)據(jù)之間的距離。為使節(jié)點數(shù)據(jù)選取最短路徑數(shù)據(jù)進行交換,引入數(shù)據(jù)勾股定理,獲取當前復合載荷節(jié)點數(shù)據(jù)最短路徑表達公式:
d(i,BS)2=d(i,CHj)2+d(CHj,BS)2
(14)
根據(jù)上述式(14)等待交換節(jié)點數(shù)據(jù),選取一條最小值交換路徑,完成數(shù)據(jù)交換。根據(jù)數(shù)據(jù)交換結果,對比完整拓撲結構下復合載荷節(jié)點半監(jiān)督方法的真實位置,如果位置一致,則證明當前節(jié)點符合監(jiān)督標準,反之則證明當前節(jié)點處于不平衡狀態(tài)。
為了檢測當前設計的網(wǎng)絡數(shù)據(jù)交換下復合載荷節(jié)點半監(jiān)督方法的有效性,需要進行對比實驗。實驗環(huán)境如下:IntelCore i5-3470CPU@3.20GHz內存為4GB。實驗所用的數(shù)據(jù)交換機示意圖如圖3所示。
圖3 網(wǎng)絡數(shù)據(jù)交換設備
仿真的開發(fā)平臺選擇PyCHarm2019。通過平臺內Python語言數(shù)據(jù)包pandas等分析包比較。當前設計的復合載荷節(jié)點半監(jiān)督方法與傳統(tǒng)的以數(shù)據(jù)存儲共享和以三方節(jié)點并存為核心的監(jiān)督方法。實驗指標為:數(shù)據(jù)監(jiān)督缺陷率及數(shù)據(jù)節(jié)點開源度。
數(shù)據(jù)監(jiān)督缺陷是復合載荷節(jié)點半監(jiān)督和監(jiān)督方法經(jīng)常涉及到的評測指標,用于確定當前監(jiān)督方法對節(jié)點位置的評測情況。在當前實驗環(huán)境和仿真軟件以及下屬評測數(shù)據(jù)的支持下,分別應用實驗用的幾種設計方法,進行分析評測,其結果如圖4所示。
圖4 缺陷率對比結果
由圖4可知,隨著信標節(jié)點比例的不斷增加,三種仿真方法的監(jiān)督缺陷率均出現(xiàn)變化,但是此次設計的復合載荷節(jié)點半監(jiān)督方法的平均缺陷率明顯低于對比的兩種實驗方法,該監(jiān)督方法的缺陷率比傳統(tǒng)監(jiān)督方法降低了至少30%,初步證明了該方法的準確性。
節(jié)點開源度是數(shù)據(jù)節(jié)點在進行數(shù)據(jù)交換時數(shù)據(jù)源的匹配度系數(shù),開源度越高,整體監(jiān)督效果也就越好。設計同樣根據(jù)上述實驗方法,進行開源度對比,其結果如圖5所示。
圖5 開源對比實驗結果
根據(jù)圖5實驗結果可以看出,本次設計的復合載荷節(jié)點半監(jiān)督方法的最高開源度達到90%,平均整體開源度為50%;文獻[2]方法的最高開源度為78%,平均整體開源度低于20%;文獻[3]方法最高開源度為75%,平均整體開源度為30%。研究方法的開源性遠高于兩種傳統(tǒng)方法,平均提高比例超過17%,說明研究方法監(jiān)督效果更好。
復合載荷節(jié)點的應用對于無線網(wǎng)絡傳感器的構建,實現(xiàn)網(wǎng)絡負載均衡具有重要意義。為確定復合載荷節(jié)點在網(wǎng)絡負荷變化時的數(shù)據(jù)表征,提高對其監(jiān)督的精確度,設計提出網(wǎng)絡數(shù)據(jù)交換下復合載荷節(jié)點半監(jiān)督方法。復合載荷節(jié)點的半監(jiān)督方法可以有效監(jiān)督當前節(jié)點工作情況,緩和網(wǎng)絡數(shù)據(jù)交換時的數(shù)據(jù)負載,保證負載均衡。此次仿真設計通過對節(jié)點的定位和數(shù)據(jù)篩選,對比初始節(jié)點位置,完成監(jiān)督仿真,實驗證明該方法真實有效,具有推廣性。