深圳供電局有限公司 毛雯新
當(dāng)需要采集的原始數(shù)據(jù)量較大時,數(shù)據(jù)處理效率較低,且數(shù)據(jù)采集中會產(chǎn)生較大的能耗,為此提出基于壓縮感知的移動終端數(shù)據(jù)實時采集方法。稀疏表示原始數(shù)據(jù),以實現(xiàn)低采樣率條件下的高效率數(shù)據(jù)采集;通過建立隨機(jī)路由,優(yōu)化壓縮感知的數(shù)據(jù)觀測矩陣,降低數(shù)據(jù)采集失誤率;使用AIC 算法精確重構(gòu)數(shù)據(jù),建立基于壓縮感知的數(shù)據(jù)采集框架,周期性采集數(shù)據(jù),實現(xiàn)移動終端數(shù)據(jù)的實時采集。實驗結(jié)果表明,該方法的數(shù)據(jù)采集效率較高,且較數(shù)據(jù)采集方法的能耗更低。
當(dāng)前,無線通信網(wǎng)絡(luò)技術(shù)飛速發(fā)展,技術(shù)的變革帶來的是網(wǎng)絡(luò)規(guī)模的進(jìn)一步擴(kuò)大,移動終端的出現(xiàn),更是使網(wǎng)絡(luò)數(shù)據(jù)量膨脹式增長[1]。在處理網(wǎng)絡(luò)數(shù)據(jù)的過程中,需要通過移動終端收集數(shù)據(jù),并將數(shù)據(jù)進(jìn)行傳輸,經(jīng)過Web 服務(wù)器處理后,用戶才能夠得到服務(wù)器反饋的與所需信息相關(guān)的數(shù)據(jù)[2]。然而,傳統(tǒng)的移動終端數(shù)據(jù)采集方法存在局限性[3],當(dāng)采集的原始數(shù)據(jù)量較大時,使得數(shù)據(jù)處理效率極低,這就導(dǎo)致數(shù)據(jù)采集過程需要消耗更多的能量。為此,本文在壓縮感知理論的基礎(chǔ)上,針對移動終端,研究一種數(shù)據(jù)實時采集方法。
本文設(shè)計了基于壓縮感知的數(shù)據(jù)實時采集方法,將數(shù)據(jù)進(jìn)行稀疏表示,以實現(xiàn)低采樣率情況下的高效率數(shù)據(jù)采集;同時,為了降低數(shù)據(jù)采集誤差,建立隨機(jī)路由,優(yōu)化壓縮感知的數(shù)據(jù)觀測矩陣;使用AIC 算法精確重構(gòu)數(shù)據(jù);建立了壓縮感知的數(shù)據(jù)采集框架,周期性地采集數(shù)據(jù),實現(xiàn)移動終端數(shù)據(jù)的實時采集。最后進(jìn)行實驗論證,對比了本文設(shè)計的采集方法與傳統(tǒng)的采集方法,實驗結(jié)果表明,該方法數(shù)據(jù)采集效率高,較傳統(tǒng)的數(shù)據(jù)采集方法耗能更低,對提高網(wǎng)絡(luò)資源利用效率具有明顯的實際意義。
使用壓縮感知方法實現(xiàn)數(shù)據(jù)的實時采集,首先需要將數(shù)據(jù)進(jìn)行稀疏表示,以實現(xiàn)低采樣率情況下的高效率數(shù)據(jù)采集。對此,本文使用K-SVD 算法估計移動終端互聯(lián)網(wǎng)數(shù)據(jù)的稀疏度。
假設(shè)移動終端互聯(lián)網(wǎng)數(shù)據(jù)的稀疏度為x,對于無線網(wǎng)絡(luò)數(shù)據(jù)的傳感節(jié)點來說,每過一個t時長的周期,便采集一次數(shù)據(jù)。在壓縮數(shù)據(jù)的過程中,x的參數(shù)值越大,那么后期重構(gòu)數(shù)據(jù)所耗費的能量就越多,但x的參數(shù)值過小,又會影響數(shù)據(jù)采集效率。對此,需要對x進(jìn)行動態(tài)估計,以不斷實現(xiàn)數(shù)據(jù)采集的動態(tài)調(diào)整。
K-SVD 算法具有自適應(yīng)特性,在動態(tài)估計數(shù)據(jù)稀疏度方面具有明顯的計算優(yōu)勢,根據(jù)壓縮感知理論,使用S-階稀疏來定量地表示信號稀疏的程度,假設(shè)信號的稀疏度系數(shù)為q,那么數(shù)據(jù)稀疏表示模型可以用公式(1)表示為:
式(1)中,D表示的是字典集合,其滿足α表示的是信號參數(shù);s表示的是中線性系數(shù)。
基于這一模型,可以在周期性采集的數(shù)據(jù)信息中抽取部分樣本,需要注意的是,抽取采用的是隨機(jī)的方式,需要保證樣本的多樣性。那么對于該模型的標(biāo)準(zhǔn)化處理如公式(2)所示:
式(2)中,i表示的是移動終端數(shù)據(jù);di表示的是移動終端數(shù)據(jù)維度。
在進(jìn)行初始化處理之后,為減少數(shù)據(jù)誤差,還需要對字典進(jìn)行更新,以不斷優(yōu)化,最終形成自適應(yīng)的稀疏字典D。
在數(shù)據(jù)采集的過程中,需要保證數(shù)據(jù)能夠完全重構(gòu),避免數(shù)據(jù)采集出現(xiàn)失誤。同時,還需要保證數(shù)據(jù)采集的傳輸效率,降低能量消耗。為此,構(gòu)建數(shù)據(jù)觀測矩陣,并對其進(jìn)行優(yōu)化。本文通過隨機(jī)路由對稀疏表示后的數(shù)據(jù)觀測矩陣進(jìn)行優(yōu)化。具體流程如圖1 所示。
圖1 數(shù)據(jù)觀測矩陣優(yōu)化流程圖Fig.1 Flow chart of data observation matrix optimization
如圖1 所示,假設(shè)移動終端網(wǎng)絡(luò)傳輸?shù)倪^程中,進(jìn)行數(shù)據(jù)采集的節(jié)點的數(shù)量為n,為保證數(shù)據(jù)壓縮感知的過程中,盡量減少能量損耗,本文增加了一個聚集節(jié)點K,該節(jié)點位于整個數(shù)據(jù)采集節(jié)點矩陣的外側(cè)。在此基礎(chǔ)上,將各節(jié)點按距離K點的遠(yuǎn)近,從前到后進(jìn)行排列編號。也就是說,該數(shù)據(jù)節(jié)點矩陣中,首個節(jié)點為1,下一節(jié)點為2,以此類推,尾節(jié)點為
在確定好節(jié)點編號后,就可以隨機(jī)生成數(shù)據(jù)傳輸路由。首先,隨機(jī)選擇一個初始節(jié)點作為數(shù)據(jù)傳輸?shù)钠鹗键c,根據(jù)數(shù)據(jù)路由的概率參數(shù),生成隨機(jī)路徑。
在優(yōu)化數(shù)據(jù)感知觀測矩陣的過程中,假設(shè)一共隨機(jī)產(chǎn)生了m個數(shù)據(jù)傳輸路由,將數(shù)據(jù)傳輸至聚集節(jié)點,計算相應(yīng)的觀測參數(shù),并對矩陣進(jìn)行更新優(yōu)化。
在優(yōu)化了壓縮感知的數(shù)據(jù)觀測矩陣后,能夠?qū)?shù)據(jù)進(jìn)行壓縮傳輸,然后將數(shù)據(jù)進(jìn)行恢復(fù)重構(gòu),本文使用AIC 算法來恢復(fù)重構(gòu)數(shù)據(jù)。
假設(shè)信號傳輸?shù)墓?jié)點的數(shù)量參數(shù)為N,經(jīng)過稀疏表示處理,能夠得到相應(yīng)的離散稀疏參數(shù),對數(shù)據(jù)進(jìn)行采樣。在壓縮感知的數(shù)據(jù)采集框架內(nèi),假設(shè)每個節(jié)點數(shù)據(jù)采集的周期為t,那么節(jié)點的輸入信號可以表示為xi(t),經(jīng)過隨機(jī)路由會產(chǎn)生不同的隨機(jī)序列,假設(shè)該序列參數(shù)為zi(t),其計算公式如式(3)所示:
式(3)中,ei(t)表示的是該序列內(nèi)的積分參數(shù),通過上述公式,能夠獲得切片序列參數(shù)值,對數(shù)據(jù)進(jìn)行解調(diào)處理。
在最終節(jié)點的輸出端,能夠獲取最終的輸出信號G(t),假設(shè)其在壓縮感知時觀測矩陣中的觀測系數(shù)為yi,那么其計算公式如式(4)所示:
式(4)中,h表示的是卷積函數(shù),m表示的是輸出節(jié)點的數(shù)量參數(shù)。經(jīng)過優(yōu)化計算,能夠以yi為參數(shù),實現(xiàn)壓縮數(shù)據(jù)的原始信號重建,提高數(shù)據(jù)重構(gòu)的成功率。
在實現(xiàn)數(shù)據(jù)重構(gòu)的基礎(chǔ)上,本文建立了壓縮感知的數(shù)據(jù)采集框架。假設(shè)壓縮感知的數(shù)據(jù)觀測矩陣為?,該矩陣中的元素表示為aij,且滿足條件i=1,2,…,n、j=1,2,…,n、n? 0。使用壓縮感知進(jìn)行數(shù)據(jù)采集的具體方法如下:
(1)設(shè)置一個初始數(shù)據(jù)節(jié)點,該節(jié)點在移動終端中進(jìn)行初始數(shù)據(jù)采集,將這些數(shù)據(jù)與矩陣元素ai1相乘,能夠得到一個參數(shù)ai1q1;
(2)將前一節(jié)點中,將計算得到的參數(shù)ai1q1向下一節(jié)點發(fā)送,在次級數(shù)據(jù)采集節(jié)點中,也同樣進(jìn)行步驟一類似的計算操作,就得到了參數(shù)ai1q1+ai2q2;
(3)將數(shù)據(jù)繼續(xù)進(jìn)行傳輸,到下一級節(jié)點繼續(xù)進(jìn)行同樣的步驟,以此類推,直到每一個數(shù)據(jù)采集節(jié)點都有自己的數(shù)據(jù)參數(shù),且與觀測矩陣對應(yīng);
通過循環(huán)上述操作,在終極節(jié)點中,能夠獲得收集的所有數(shù)據(jù)的加權(quán)參數(shù),也就是說,在每進(jìn)行一次數(shù)據(jù)采集的過程中,都進(jìn)行了一次數(shù)據(jù)壓縮。每一個數(shù)據(jù)采集周期內(nèi),節(jié)點的數(shù)據(jù)量變化會產(chǎn)生一定的累計誤差,因此,需要在數(shù)據(jù)采集的過程中,周期性地監(jiān)測每一個數(shù)據(jù)傳輸節(jié)點的階梯變化。
為了提高數(shù)據(jù)采集的效率,降低數(shù)據(jù)采集的能量消耗,本文在壓縮感知理論的基礎(chǔ)上,設(shè)計了針對移動終端的數(shù)據(jù)實時采集方法。為了驗證該方法的有效性,進(jìn)行實驗論證,由于實際數(shù)據(jù)采集流程較為復(fù)雜,因此本文采用計算機(jī)模擬的方法進(jìn)行仿真實驗。
本文使用的計算機(jī)硬件為實驗室原有的PC機(jī),該機(jī)的CPU 配置為Intel Core i5-4590,刷新頻率為8GHz,該主機(jī)系統(tǒng)為64 位Windows7,內(nèi)存容量8GB,能夠滿足數(shù)據(jù)采集模擬的硬件需求。
基于本文設(shè)計的實時采集方法,對模擬的移動端數(shù)據(jù)進(jìn)行隨機(jī)采集,為降低模型的處理難度,本文選取理想稀疏度的數(shù)據(jù)作為原始信號。同時,為了保證實驗的嚴(yán)謹(jǐn)性,本文分別使用傳統(tǒng)壓縮采樣方法以及本文設(shè)計的隨機(jī)采樣方法進(jìn)行實驗,記錄兩種方法的實驗數(shù)據(jù)以及仿真實驗結(jié)果。
設(shè)數(shù)據(jù)采集周期為5min,根據(jù)上述仿真實驗設(shè)置,本文對比兩種數(shù)據(jù)采集方法的數(shù)據(jù)傳輸效率,記錄了兩種方法不同采集周期的數(shù)據(jù)傳輸量,單位周期內(nèi)傳輸?shù)臄?shù)據(jù)量越大,說明數(shù)據(jù)采集的效率越高。具體實驗結(jié)果如表1 所示:
表1 兩種方法的數(shù)據(jù)傳輸量對比Tab.1 Comparison of the data transmission volume of the two methods
如表1 所示,本文設(shè)計的數(shù)據(jù)采集方法,隨著傳輸時間的延長,數(shù)據(jù)傳輸量明顯高于傳統(tǒng)的數(shù)據(jù)采集方法。對比平均數(shù)據(jù)傳輸量可以看出,前期兩種方法差別不大,本文設(shè)計方法的效率優(yōu)勢并不是很明顯。然而隨著傳輸周期的增加,傳統(tǒng)數(shù)據(jù)采集方法明顯在數(shù)據(jù)采集效率方面劣于本文設(shè)計的數(shù)據(jù)采集方法,使得輸出的平均傳輸量不斷降低。而本文設(shè)計的數(shù)據(jù)采集方法明顯更加穩(wěn)定,數(shù)據(jù)采集效率更高,能夠在不斷增加的數(shù)據(jù)傳輸周期的情況下,保持穩(wěn)定的數(shù)據(jù)輸出,數(shù)據(jù)采集的效果更好。
為驗證本文設(shè)計數(shù)據(jù)采集方法在節(jié)約能耗方面的有效性,本文對比了兩種數(shù)據(jù)采集的能耗結(jié)果,在此,本文設(shè)計傳輸多種類型的移動數(shù)據(jù),記錄了不同數(shù)據(jù)類型下兩種方法的能耗參數(shù),繪制成了曲線圖,具體結(jié)果如圖2 所示。
圖2 兩種方法數(shù)據(jù)采集能耗對比圖Fig.2 Comparison of energy consumption for data collection by two methods
由圖2 可知,在數(shù)據(jù)采集類型不斷增加的情況下,兩種方法的能耗都是不斷增加的,而本文設(shè)計方法的能耗情況明顯優(yōu)于傳統(tǒng)方法。傳統(tǒng)方法能耗增長幾乎呈直線趨勢。而對比傳統(tǒng)方法,本文設(shè)計的數(shù)據(jù)采集方法,隨著數(shù)據(jù)類型數(shù)量的增多,能耗是緩慢增長的,增長量較小,說明該方法在減小數(shù)據(jù)處理能耗,提高網(wǎng)絡(luò)資源利用率方面具有明顯的實際意義。
綜合分析上述實驗結(jié)果可知,本文設(shè)計的數(shù)據(jù)采集方法無論是在數(shù)據(jù)傳輸效率還是在能量消耗方面均具有明顯的優(yōu)勢,充分驗證了該方法的應(yīng)用價值。這是因為本文方法在數(shù)據(jù)采集之前,通過稀疏表示原始數(shù)據(jù),提高了數(shù)據(jù)采集效率;并通過建立隨機(jī)路由優(yōu)化壓縮感知的數(shù)據(jù)觀測矩陣,降低了數(shù)據(jù)采集失誤率,避免由于數(shù)據(jù)采集失誤導(dǎo)致的數(shù)據(jù)重復(fù)采集,降低了數(shù)據(jù)采集能耗。
為了提高數(shù)據(jù)采集的效率,降低數(shù)據(jù)采集的能量消耗,本文在研究壓縮感知理論的基礎(chǔ)上,設(shè)計了針對移動終端的數(shù)據(jù)實時采集方法。實驗結(jié)果表明,該方法數(shù)據(jù)采集效率高,較傳統(tǒng)的數(shù)據(jù)采集方法耗能更低,對提高網(wǎng)絡(luò)資源利用效率具有明顯的實際意義。希望本文的研究能夠為移動終端數(shù)據(jù)實時采集方法的發(fā)展提供理論依據(jù)。
引用
[1] 楊杉,譚博,郭靜波.基于壓縮感知的新一代能源互聯(lián)網(wǎng)的數(shù)據(jù)采集方法[J].可再生能源,2022,40(7):952-958.
[2] 楊青海,楊敏.基于低秩稀疏分解快速算法的動態(tài)MRI重建[J].軟件工程,2022,25(7):33-36+32.
[3] 周桂平,李石強(qiáng),于華楠,等.基于壓縮感知的電力擾動數(shù)據(jù)采集與分類方法[J].吉林大學(xué)學(xué)報(信息科學(xué)版),2021,39(6):637-646.