秦 飛,宗序平
(1.揚州市職業(yè)大學 師范學院,江蘇 揚州 225000;2.揚州大學 數(shù)學科學學院,江蘇 揚州 225000)
物聯(lián)網(wǎng)通過客戶端和服務器端的數(shù)據(jù)交換,在交通、救災、通信等方面取得了廣泛應用[1-2].物聯(lián)網(wǎng)在廣域范圍內(nèi)可以采用多種數(shù)據(jù)傳輸格式完成傳輸,對于不同的數(shù)據(jù)傳輸格式,對其均有快捷方便、減少遠程數(shù)據(jù)訪問次數(shù)等要求.因此,建立數(shù)據(jù)傳輸效率模型,尋找最合適、效率最高的數(shù)據(jù)傳輸格式具有重要意義[3-4].
現(xiàn)階段數(shù)據(jù)傳輸效率建模相關(guān)研究取得了較大發(fā)展,在區(qū)域化的物聯(lián)網(wǎng)環(huán)境中,將資源傳輸任務分配給不同站點,根據(jù)物聯(lián)網(wǎng)負載情況調(diào)節(jié)不同站點的數(shù)據(jù)傳輸任務量,增強對網(wǎng)絡突變情況的應變能力,保證站點傳輸網(wǎng)絡資源的同時,能夠獲得穩(wěn)定的數(shù)據(jù)傳輸量[5-6].文獻[7]提出了基于大數(shù)據(jù)融合的數(shù)據(jù)傳輸效率建模方法,通過傳輸效率采樣矩陣還原鐵路通信網(wǎng)絡的動態(tài)數(shù)據(jù),但該方法融合后的多源通信信號缺失,選擇的數(shù)據(jù)格式傳輸速率較慢.文獻[8]采用了一種監(jiān)控網(wǎng)絡測點的數(shù)據(jù)傳輸效率建模方法,對監(jiān)控網(wǎng)絡中的測點信號進行濾波處理后,模擬了測點數(shù)據(jù)傳輸過程,但該方法測點數(shù)據(jù)傳輸時間不固定,數(shù)據(jù)格式傳輸速率不理想.文獻[9]研究了基于數(shù)據(jù)組織的信息傳輸效率建模方法,利用全變差正則化方法搜索動態(tài)數(shù)據(jù),并整合為多源信息,統(tǒng)計等待傳輸?shù)牡貓D信息數(shù)據(jù)序列,但該方法為地圖集提供的參考依據(jù)不充分,數(shù)據(jù)格式傳輸速率同樣較慢.
針對以上問題,提出了基于數(shù)學統(tǒng)計模型的物聯(lián)網(wǎng)資源數(shù)據(jù)傳輸效率建模方法,通過數(shù)學統(tǒng)計模型表示數(shù)據(jù)特征的數(shù)學關(guān)系,并分類封包資源數(shù)據(jù),根據(jù)數(shù)據(jù)的主頻特征選擇高速率傳輸?shù)臄?shù)據(jù)傳輸格式,執(zhí)行分配的數(shù)據(jù)傳輸動態(tài)任務.
采用最優(yōu)分類平面法分類物聯(lián)網(wǎng)資源數(shù)據(jù)流,對相同類別數(shù)據(jù)進行封包傳輸.分析物聯(lián)網(wǎng)資源數(shù)據(jù)流輸入輸出特性,按照物聯(lián)網(wǎng)資源中各個數(shù)據(jù)流的優(yōu)先等級,劃分數(shù)據(jù)傳輸特征矢量集合的種類[10].將數(shù)據(jù)流分類問題轉(zhuǎn)換為最優(yōu)分類平面求解問題,假定資源數(shù)據(jù)輸入輸出過程中產(chǎn)生非線性變換,則利用內(nèi)積表示最優(yōu)分類函數(shù)中的點積,計算t時刻的數(shù)據(jù)傳輸損失K(t).
(1)
其中,a(t)為t時刻的數(shù)據(jù)傳輸負載,A為物聯(lián)網(wǎng)信號損失參量,ni為第i類數(shù)據(jù)傳輸特征矢量集合[11].通過公式(1),整合物聯(lián)網(wǎng)資源傳輸?shù)臄?shù)據(jù)流,過程中產(chǎn)生的包絡特征b(t)表達式為
(2)
其中,r(t)、d(t)分別為t時刻的時頻、幅值.將與b(t)值相近的物聯(lián)網(wǎng)資源數(shù)據(jù)進行聚類,根據(jù)聚類結(jié)果將數(shù)據(jù)流劃分為多個子集,從而獲得子集內(nèi)的數(shù)據(jù)特征矢量,以此為基礎(chǔ)分解特征矢量.
使用修正分解后特征矢量中的高位特征矢量,并對其進行量化處理,處理后利用數(shù)學統(tǒng)計模型,定量描述數(shù)據(jù)特征矢量、數(shù)據(jù)屬性值、數(shù)據(jù)傳輸時間之間的數(shù)學關(guān)系.將高位特征矢量作為自變量,屬性值和傳輸時間作為因變量[12],得到關(guān)于數(shù)據(jù)特征矢量的數(shù)學統(tǒng)計模型表達式為
(3)
其中,u(t)為t時刻的高位特征矢量量化值,P為修正權(quán)向量,f為統(tǒng)計參量,Li(t)為t時刻在第i類特征矢量集合中提取的高位特征矢量,Z(t)為t時刻數(shù)據(jù)流輸入輸出的時間窗函數(shù),B為資源數(shù)據(jù)流嵌入維數(shù),Hi為第i類集合中的數(shù)據(jù)屬性值,m為集合包含的特征矢量類別總數(shù)[13].
計算所有數(shù)據(jù)的量化特征矢量u(t),需要在一個分類平面上設置特征矢量的量化限值,將限值范圍內(nèi)的數(shù)據(jù)歸納到同一分類平面中,然后對分類平面進行約束.因此,設定約束條件為
(4)
其中,bi為第i集合輸出的物聯(lián)網(wǎng)資源數(shù)據(jù)特征,c為數(shù)據(jù)干擾頻率,O為各平面數(shù)據(jù)的分類距離[14].過濾不滿足約束條件的分類平面后,獲得資源數(shù)據(jù)流輸入輸出的最優(yōu)分類平面,根據(jù)相應的數(shù)據(jù)傳輸格式,對同類數(shù)據(jù)進行封包傳輸.至此完成基于數(shù)學統(tǒng)計模型的物聯(lián)網(wǎng)資源數(shù)據(jù)分類封包傳輸.
在上述同類數(shù)據(jù)封包傳輸過程中,定位資源數(shù)據(jù)分類封包傳輸信道,并從中提取單分量主頻特征,具體實現(xiàn)過程如下.
截取封包傳輸?shù)奈锫?lián)網(wǎng)資源數(shù)據(jù),并對資源數(shù)據(jù)進行解析,統(tǒng)計解析后數(shù)據(jù)中包含的信息,表達式為
S={S1,S2,S3,S4,S5},
(5)
其中,S為資源數(shù)據(jù)包含的信息集合,S1為物聯(lián)網(wǎng)端口號,S2為物聯(lián)網(wǎng)通信數(shù)據(jù),S3為物聯(lián)網(wǎng)其它信息、S4為物聯(lián)網(wǎng)IP地址、S5為物聯(lián)網(wǎng)資源數(shù)據(jù)傳輸格式[15].
采用數(shù)據(jù)傳輸格式S5特有的編碼形式、語法規(guī)則定義數(shù)據(jù)輸入輸出規(guī)則集,達到遠程通信的目的后,再利用IP地址S4和端口號S1定位資源數(shù)據(jù)中包含的源端口、目的端口,保證物聯(lián)網(wǎng)資源從服務器端有效傳輸至客戶端,進而確定數(shù)據(jù)通信過程中的傳輸信道[16].
物聯(lián)網(wǎng)資源數(shù)據(jù)傳輸信道搜索完畢后,通過數(shù)據(jù)集中的隨機簇頭節(jié)點組建數(shù)據(jù)傳輸信道的信息流P,公式為
(6)
其中,x(t)為t時刻物聯(lián)網(wǎng)資源整合傳輸過程中的冗余數(shù)據(jù),E為數(shù)據(jù)輸入輸出的有限數(shù)據(jù)集,f為數(shù)據(jù)高位特征矢量重組后的加權(quán)系數(shù),Wj為發(fā)送數(shù)據(jù)傳輸任務時第j個簇頭節(jié)點的向量加權(quán)系數(shù),n為隨機簇頭節(jié)點數(shù)量[17].利用自適應級聯(lián)方法對傳輸數(shù)據(jù)的碼間干擾進行雙線性變換,根據(jù)傳輸信道中物聯(lián)網(wǎng)資源數(shù)據(jù)輸入輸出時的迭代關(guān)系,在信息流P中提取單分量的信號結(jié)構(gòu),表達式為
(7)
其中,U(Pc)為信息流P在傳輸信道中第c次迭代后的單分量主頻特征,l為線性關(guān)聯(lián)系數(shù),k為l高位特征量化參數(shù),d(t)為t時刻資源數(shù)據(jù)傳輸?shù)娜哂鄶?shù)據(jù)分量.
通過信息流的單分量信號結(jié)構(gòu)掌握資源數(shù)據(jù)分類封包傳輸?shù)淖V寬度、信號序列時間尺度以及客戶端接收數(shù)據(jù)包時的擴展瞬時頻率[18].自適應均衡處理單分量主頻特征并對其進行分解.在特征分解初期,獲得物聯(lián)網(wǎng)輸入資源數(shù)據(jù)的數(shù)學統(tǒng)計特性;在特征分解中期,獲得數(shù)據(jù)期望響應的數(shù)學統(tǒng)計特性;在特征分解后期,物聯(lián)網(wǎng)輸出資源數(shù)據(jù)的數(shù)學統(tǒng)計特性.至此完成分類封包傳輸數(shù)據(jù)單分量主頻特征的提取.
根據(jù)提取的分類封包數(shù)據(jù)包中的單分量主頻特征,分配物聯(lián)網(wǎng)資源數(shù)據(jù)傳輸?shù)膭討B(tài)任務,并建立數(shù)據(jù)傳輸效率模型.
將單分量主頻特征U(Pc)映射到物理位置,獲取從服務器端到客戶端的負載向量,計算物聯(lián)網(wǎng)資源數(shù)據(jù)并行傳輸、條狀傳輸過程中負載向量的差值,獲得每個隨機簇頭節(jié)點的差向量Cj,計算公式為
(8)
按照差向量Cj由大到小的順序?qū)Υ仡^節(jié)點進行排序,依次分配各個節(jié)點的資源數(shù)據(jù)傳輸任務.設數(shù)據(jù)傳輸任務的順序分配向量為Y={y1,y2,…,yn},則每個簇頭節(jié)點獲得的任務量D計算公式為
(9)
其中,N為物聯(lián)網(wǎng)資源均分份數(shù),T為由資源數(shù)據(jù)傳輸格式確定的簇頭節(jié)點分配因子,每個節(jié)點分配因子相同.
考慮到物聯(lián)網(wǎng)資源數(shù)據(jù)的傳輸信道存在動態(tài)變化,為此每隔一段時間計算一次負載向量,并更新簇頭節(jié)點任務量.計算信道中的數(shù)據(jù)包概率密度R,公式為
(10)
其中,Δt為數(shù)據(jù)包到達客戶端的時間間隔隨機數(shù),F(xiàn)為每秒內(nèi)到達客戶端的數(shù)據(jù)包個數(shù),g為傳輸信道緩沖區(qū)的數(shù)據(jù)包增量,w為任意時刻到達信道緩沖區(qū)的數(shù)據(jù)包個數(shù)[20].
將通信信道的緩沖時間劃分為多個時間段,把關(guān)于簇頭節(jié)點的傳輸功率函數(shù)視作凸函數(shù),并對節(jié)點傳輸?shù)臄?shù)據(jù)包進行懲罰項約束,當傳輸功率趨于恒定值時,判定簇頭節(jié)點能量全部用完,此時構(gòu)建能夠表示數(shù)據(jù)傳輸效率的數(shù)學模型G,表達式為
(11)
其中,h為引入的懲罰項,X為傳輸信道緩沖區(qū)的劃分時間段,qj為第j個簇頭節(jié)點的恒定功率,x為客戶端收到數(shù)據(jù)傳輸請求的時間.通過G值表示數(shù)據(jù)傳輸效率,即數(shù)據(jù)包到達、處理、接收速率.
至此完成物聯(lián)網(wǎng)資源數(shù)據(jù)傳輸效率模型的構(gòu)建,實現(xiàn)基于數(shù)學統(tǒng)計模型的物聯(lián)網(wǎng)資源數(shù)據(jù)傳輸效率建模分析.
將本文設計方法與基于大數(shù)據(jù)融合的數(shù)據(jù)傳輸效率建模方法、基于監(jiān)控網(wǎng)絡測點的數(shù)據(jù)傳輸效率建模方法和基于數(shù)據(jù)組織的數(shù)據(jù)傳輸效率建模方法進行對比實驗,比較4種方法下所選擇的數(shù)據(jù)傳輸格式的傳輸速率.
選取GridFTP數(shù)據(jù)傳輸工具,利用Globus Tookit 5.0搭建區(qū)域化的物聯(lián)網(wǎng)環(huán)境,物聯(lián)網(wǎng)環(huán)境共包含4個不同區(qū)域,區(qū)域之間采用全連接方式.為避免資源數(shù)據(jù)輸入輸出時共享同一條傳輸信道,選擇110 Mbps的物理線路進行傳輸,傳輸過程為其中一個區(qū)域發(fā)送數(shù)據(jù)傳輸請求,從4個區(qū)域中獲取物聯(lián)網(wǎng)資源.采用NS2模擬器設置物聯(lián)網(wǎng)數(shù)據(jù)傳輸?shù)木W(wǎng)絡參數(shù),具體如表1所示.
表1 搭建物聯(lián)網(wǎng)環(huán)境網(wǎng)絡參數(shù)
客戶端瀏覽大量不同網(wǎng)頁,并從中訪問感興趣的項目,向服務器端發(fā)送數(shù)據(jù)傳輸請求,利用LoadRunner測試工具測試4種方法作用下的資源數(shù)據(jù)傳輸性能.
為了驗證基于數(shù)學統(tǒng)計模型的物聯(lián)網(wǎng)資源數(shù)據(jù)傳輸效率的有效性,從物聯(lián)網(wǎng)資源數(shù)據(jù)發(fā)送速率和接收速率兩個方面設計對比實驗.
實驗分別設定兩組條件,分別為不同數(shù)據(jù)包大小和不同簇頭節(jié)點數(shù)量,即數(shù)據(jù)包大小分別為64 Bytes、128 Bytes、256 Bytes、512 Bytes、1024 Bytes、1500 Bytes;簇頭節(jié)點數(shù)量分別為10個、20個、30個、40個、50個、60個.設定具體實驗流程如圖1所示.
圖1 實驗流程
根據(jù)圖1所示的實驗流程,分別從發(fā)送速率和接收速率兩個方面進行實驗.
發(fā)送速率實驗中,4種方法分別對不同數(shù)據(jù)傳輸格式的傳輸效率進行建模分析,從中選取最優(yōu)的數(shù)據(jù)傳輸格式,傳輸物聯(lián)網(wǎng)資源數(shù)據(jù).比較不同數(shù)據(jù)傳輸格式下的數(shù)據(jù)發(fā)送速率e,計算公式為
(12)
其中,L為網(wǎng)卡持續(xù)發(fā)送數(shù)據(jù)包的大小,M1為發(fā)送數(shù)據(jù)包個數(shù),T為發(fā)送數(shù)據(jù)包時的記錄時間.
接收速率實驗中,4種方法分別對不同數(shù)據(jù)傳輸格式的傳輸效率進行建模分析,從中選取最優(yōu)的數(shù)據(jù)傳輸格式,傳輸物聯(lián)網(wǎng)資源數(shù)據(jù).比較4種方法的數(shù)據(jù)接收速率z,計算公式為
(13)
其中,M2為接收數(shù)據(jù)包個數(shù).
2.3.1 發(fā)送速率實驗結(jié)果
在加載網(wǎng)卡驅(qū)動的條件下,改變數(shù)據(jù)包大小得到發(fā)送速率實驗對比結(jié)果如圖2所示.
由圖2可知,針對不同數(shù)據(jù)包大小,本文設計方法選擇的傳輸格式平均發(fā)送速率為1 490 Mbps,基于大數(shù)據(jù)融合的數(shù)據(jù)傳輸效率建模方法平均發(fā)送速率為1 310 Mbps,基于監(jiān)控網(wǎng)絡測點的數(shù)據(jù)傳輸效率建模方法平均發(fā)送速率為1 280 Mbps,基于數(shù)據(jù)組織的數(shù)據(jù)傳輸效率建模方法平均發(fā)送速率為1 210 Mbps,綜合上述數(shù)據(jù)分析可知,本文設計方法的數(shù)據(jù)發(fā)送速率相較于對比方法更高,其主要原因是該設計方法通過數(shù)學統(tǒng)計模型分類封包資源數(shù)據(jù),根據(jù)數(shù)據(jù)的主頻特征選擇高速率傳輸?shù)臄?shù)據(jù)傳輸格式,提高了數(shù)據(jù)發(fā)送效率.
網(wǎng)卡驅(qū)動512 Bytes數(shù)據(jù)包,改變簇頭節(jié)點數(shù)量比較不同節(jié)點數(shù)量下的數(shù)據(jù)發(fā)送速率,實驗結(jié)果如圖3所示.
圖2 不同數(shù)據(jù)包大小下的發(fā)送速率實驗結(jié)果圖3 不同節(jié)點數(shù)量下的發(fā)送速率實驗結(jié)果
由圖3可知,當簇頭節(jié)點數(shù)量發(fā)生改變時,本文設計方法選擇的傳輸格式平均發(fā)送速率為1 610 Mbps,基于大數(shù)據(jù)融合的數(shù)據(jù)傳輸效率建模方法平均發(fā)送速率為1 390 Mbps,基于監(jiān)控網(wǎng)絡測點的數(shù)據(jù)傳輸效率建模方法平均發(fā)送速率為1 290 Mbps,基于數(shù)據(jù)組織的數(shù)據(jù)傳輸效率建模方法平均發(fā)送速率為1 260 Mbps,設計方法數(shù)據(jù)發(fā)送速率分別提高了220 Mbps、320 Mbps、350 Mbps,由此可知,本文設計方法在不同節(jié)點數(shù)量下具有更高的發(fā)送速率,其主要原因是該設計方法將與包絡特征值相近的物聯(lián)網(wǎng)資源數(shù)據(jù)進行聚類,并根據(jù)聚類結(jié)果獲取劃分子集內(nèi)的數(shù)據(jù)特征矢量,減少了數(shù)據(jù)識別時間,提高了發(fā)送速率.
2.3.2 接收速率實驗結(jié)果
不同數(shù)據(jù)包大小下的接收速率實驗對比結(jié)果如圖4所示.
由圖4可知,數(shù)據(jù)接收速率普遍小于發(fā)送速率,不同數(shù)據(jù)包大小下,設計方法選擇的傳輸格式平均接收速率為1340 Mbps,基于大數(shù)據(jù)融合的數(shù)據(jù)傳輸效率建模方法平均接收速率為1230 Mbps,基于監(jiān)控網(wǎng)絡測點的數(shù)據(jù)傳輸效率建模方法平均接收速率為1190 Mbps,基于數(shù)據(jù)組織的數(shù)據(jù)傳輸效率建模方法平均接收速率為1110 Mbps.綜合上述數(shù)據(jù)分析可知,本文設計方法的數(shù)據(jù)接收速率更高,其主要原因是該設計方法在同類數(shù)據(jù)封包傳輸過程中,定位了資源數(shù)據(jù)分類封包傳輸信道,并從中提取單分量主頻特征,提高了數(shù)據(jù)接收效率.
不同節(jié)點數(shù)量下的接收速率實驗結(jié)果如圖5所示.
圖4 不同數(shù)據(jù)包大小下的接收速率實驗結(jié)果圖5 不同節(jié)點數(shù)量下的接收速率實驗結(jié)果
由圖5可知,不同節(jié)點數(shù)量下,本文設計方法選擇的傳輸格式平均接收速率為1410 Mbps,基于大數(shù)據(jù)融合的數(shù)據(jù)傳輸效率建模方法平均接收速率為1230 Mbps,基于監(jiān)控網(wǎng)絡測點的數(shù)據(jù)傳輸效率建模方法平均接收速率為1210 Mbps,基于數(shù)據(jù)組織的數(shù)據(jù)傳輸效率建模方法平均接收速率為1110 Mbps,本文設計方法數(shù)據(jù)接收速率分別提高了180 Mbps、200Mbps、300 Mbps.綜上述數(shù)據(jù)分析可知,本文設計方法在不同節(jié)點數(shù)量下具有更高的接收速率,其主要原因是通過信息流的單分量信號結(jié)構(gòu)掌握資物聯(lián)網(wǎng)資源數(shù)據(jù)的擴展瞬時頻率,并利用自適應均衡方法處理單分量主頻特征,根據(jù)提取結(jié)果分配物聯(lián)網(wǎng)資源數(shù)據(jù)傳輸?shù)膭討B(tài)任務,優(yōu)化了數(shù)據(jù)接收性能.
此研究結(jié)合數(shù)學統(tǒng)計模型,對物聯(lián)網(wǎng)資源數(shù)據(jù)傳輸效率進行建模分析,建立模型選擇的數(shù)據(jù)傳輸速率更快.但此研究仍存在一定不足,在今后的研究中,會從傳輸開銷、反序列化效率等角度出發(fā),進一步進行建模分析,為數(shù)據(jù)傳輸格式開發(fā)人員,提供更加全面的參考意見.