晏然
本文針對(duì)5G通信時(shí)代物聯(lián)網(wǎng)應(yīng)用的新趨勢(shì)和新特點(diǎn),分析了海量傳感器使用以及相應(yīng)產(chǎn)生的采集海量數(shù)據(jù)的處理需求,并提出了在本地智能節(jié)點(diǎn)進(jìn)行數(shù)據(jù)預(yù)處理和融合的概念,從而能顯著減輕通信網(wǎng)絡(luò)的負(fù)荷,以及云端服務(wù)平臺(tái)的處理壓力。本文以智能家居場(chǎng)景為例,分析了利用模糊算法進(jìn)行數(shù)據(jù)融合的方法,以及該方法在嵌入式平臺(tái)下實(shí)現(xiàn)的局限性。本文針對(duì)性地提出了優(yōu)化算法,并結(jié)合實(shí)驗(yàn)和仿真數(shù)據(jù),驗(yàn)證了該方法的有效性。
電信技術(shù)迅猛發(fā)展,即將進(jìn)入5G時(shí)代。5G通信最重要的應(yīng)用之一是基于物聯(lián)網(wǎng)的各種應(yīng)用場(chǎng)景,比如智能家居,智能工廠,環(huán)境監(jiān)控等等。
各類(lèi)物聯(lián)網(wǎng)應(yīng)用的基礎(chǔ)是環(huán)境數(shù)據(jù)的采集,這是靠物聯(lián)網(wǎng)感知層來(lái)完成,具體而言,是各類(lèi)型的傳感器節(jié)點(diǎn)。而物聯(lián)網(wǎng)應(yīng)用的發(fā)展有以下幾個(gè)趨勢(shì):
(一)更大的部署空間:需求的發(fā)展,要求我們?cè)诟蟮目臻g范圍內(nèi)實(shí)現(xiàn)物聯(lián)網(wǎng)布置,如更大型的智能化工廠,如智能家居應(yīng)用場(chǎng)景由普通居室向別墅,酒店發(fā)展,等等。而通信技術(shù)的發(fā)展,為更大空間內(nèi)實(shí)現(xiàn)節(jié)點(diǎn)互聯(lián)提供了實(shí)現(xiàn)的可能性。更大的空間意味著更多的感知節(jié)點(diǎn),更多的采集數(shù)據(jù)。
(二)更精細(xì)的采集頻度:許多需求對(duì)實(shí)時(shí)性要求在提高,如智能駕駛,又如智能家居領(lǐng)域,要獲取更好的控制體驗(yàn)和控制精度等等。采集頻度的增加必然會(huì)帶來(lái)數(shù)據(jù)量的增加。
(三)對(duì)環(huán)境變化和測(cè)量誤差的容忍度要求更高:復(fù)雜的應(yīng)用場(chǎng)景和海量的數(shù)據(jù),必然會(huì)帶來(lái)大量的測(cè)量誤差和噪聲數(shù)據(jù),對(duì)這些噪聲數(shù)據(jù)合理平滑將成為重要的技術(shù)難點(diǎn)。
從技術(shù)層面觀察,這些應(yīng)用發(fā)展趨勢(shì)帶給我們的是海量的數(shù)據(jù),以及帶有噪聲的數(shù)據(jù)。如何對(duì)這些數(shù)據(jù)進(jìn)行預(yù)處理,減輕節(jié)點(diǎn)通信的壓力,以及集中處理云平臺(tái)的壓力,是值得研究的課題。我們通過(guò)引進(jìn)數(shù)據(jù)預(yù)處理和數(shù)據(jù)融合模塊來(lái)實(shí)現(xiàn)這些功能。
以智能家居系統(tǒng)為例,引進(jìn)數(shù)據(jù)預(yù)處理和數(shù)據(jù)融合功能的系統(tǒng)總體架構(gòu)如圖1所示:
為減輕網(wǎng)絡(luò)流量的壓力,數(shù)據(jù)融合模塊將在本地節(jié)點(diǎn)完成。考慮到計(jì)算能力和數(shù)據(jù)獲取的方便性,該功能將部署在智能家居網(wǎng)關(guān)設(shè)備上。
數(shù)據(jù)預(yù)處理和融合模塊將實(shí)現(xiàn)以下功能:
1、對(duì)異構(gòu)數(shù)據(jù)進(jìn)行預(yù)處理,統(tǒng)一數(shù)據(jù)格式和封裝。數(shù)據(jù)的異構(gòu)性來(lái)源于感知層各類(lèi)型傳感器的不同。
2、對(duì)噪聲數(shù)據(jù)的平滑。噪聲數(shù)據(jù)可能來(lái)自于測(cè)量精度的影響,環(huán)境的突發(fā)性變化,以及通信過(guò)程中產(chǎn)生的傳輸誤差等等。平滑的數(shù)據(jù)將對(duì)后續(xù)數(shù)據(jù)處理環(huán)節(jié)的效率產(chǎn)生積極影響。
3、對(duì)海量數(shù)據(jù)進(jìn)行融合,減少有效數(shù)據(jù)量,在不影響感知精度的情況下盡量減少通信網(wǎng)流量壓力和后續(xù)數(shù)據(jù)處理負(fù)荷量。
下文將重點(diǎn)分析數(shù)據(jù)融合的實(shí)現(xiàn)方法以及在物聯(lián)網(wǎng)環(huán)境下的優(yōu)化實(shí)現(xiàn)。
(一)數(shù)據(jù)融合算法簡(jiǎn)介
數(shù)據(jù)融合算法是各類(lèi)數(shù)據(jù)融合技術(shù)的核心研究?jī)?nèi)容。選擇數(shù)據(jù)融合算法,要綜合考慮數(shù)據(jù)的類(lèi)型,數(shù)據(jù)特征分布,數(shù)據(jù)分析目的等等差異,還要考慮到實(shí)現(xiàn)的難度和計(jì)算量差異。
常見(jiàn)的數(shù)據(jù)融合算法有以下四種
1、加權(quán)平均算法
加權(quán)平均算法就是對(duì)待融合數(shù)據(jù)進(jìn)行加權(quán)平均,從而得到融合結(jié)果。
假設(shè)對(duì) n 個(gè)采集點(diǎn)進(jìn)行融合,第 i 個(gè)節(jié)點(diǎn)數(shù)據(jù)為Ai,權(quán)重為 Wi,i=1…n,則融合結(jié)果如下式1所示:
加權(quán)平均算法是一種簡(jiǎn)單直接的融合算法,它要求確切的獲知每個(gè)節(jié)點(diǎn)的權(quán)重信息,而在具體物聯(lián)網(wǎng)應(yīng)用中這往往是很繁瑣的,難以做到的,而且可能是頻繁變化的,因此應(yīng)用場(chǎng)景有限。
2、D-S 證據(jù)理論算法
證據(jù)理論是Dempster于1967年首先提出,由他的學(xué)生Shafer于1976年進(jìn)一步發(fā)展起來(lái)的一種不精確推理理論最早應(yīng)用于專(zhuān)家系統(tǒng)中,具有處理不確定信息的能力。作為一種不確定推理方法,證據(jù)理論的主要特點(diǎn)是:滿(mǎn)足比貝葉斯概率論更弱的條件;具有直接表達(dá)“不確定”和“不知道”的能力。
設(shè)m1和m2是由兩個(gè)獨(dú)立的證據(jù)源(傳感器)導(dǎo)出的基本概率分配函數(shù),則Dempster組合規(guī)則可以計(jì)算這兩個(gè)證據(jù)共同作用產(chǎn)生的反映融合信息的新的基本概率分配函數(shù)。
3、神經(jīng)網(wǎng)絡(luò)算法
人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,ANN)系統(tǒng)是 20 世紀(jì) 40 年代后出現(xiàn)的。它是由眾多的神經(jīng)元可調(diào)的連接權(quán)值連接而成,具有大規(guī)模并行處理、分布式信息存儲(chǔ)、良好的自組織自學(xué)習(xí)能力等特點(diǎn)。
神經(jīng)網(wǎng)絡(luò)規(guī)則建立需要大量數(shù)據(jù)的訓(xùn)練。由于分布式的特點(diǎn),對(duì)噪聲數(shù)據(jù)具有天然的容忍性。
4、模糊理論算法
模糊理論(Fuzzy Logic)是在美國(guó)加州大學(xué)伯克利分校電氣工程系的L.A.zadeh(扎德)教授于1965年創(chuàng)立的模糊集合理論的數(shù)學(xué)基礎(chǔ)上發(fā)展起來(lái)的,其基本精神是接受模糊性現(xiàn)象存在的事實(shí),而以處理概念模糊不確定的事物為其研究目標(biāo),并積極的將其嚴(yán)密的量化成計(jì)算機(jī)可以處理的訊息,不主張用繁雜的數(shù)學(xué)分析即模型來(lái)解決模型。
模糊理論將數(shù)據(jù)概率化,獲取的數(shù)據(jù)理解為某具體值的概率分布,融合過(guò)程轉(zhuǎn)化為概率函數(shù)的融合。
以上幾種融合算法中,加權(quán)平均算法簡(jiǎn)單直接,但實(shí)用性有限;D-S 證據(jù)理論算法和神經(jīng)網(wǎng)絡(luò)算法均存在復(fù)雜性較高,計(jì)算量大的問(wèn)題,對(duì)嵌入式硬件平臺(tái)性能要求比較高。本文將選擇模糊理論算法進(jìn)行重點(diǎn)研究。
(二)基于模糊理論的數(shù)據(jù)融合算法
模糊理論算法的基本思想是將數(shù)據(jù)模糊化,概率化。
對(duì)于傳感器網(wǎng)絡(luò)內(nèi)某個(gè)傳感器組合A,其融合值由函數(shù)三元組{ F(A),R(A),M(A) },表達(dá)。
其中F(A)為融合函數(shù),它定義了具體的融合算法。常見(jiàn)的融合算法有最大(小)值法,中間值法,均值法等等。
R(A)為容許度函數(shù),它定義了數(shù)據(jù)間的相似程度。R函數(shù)的取值范圍在[0,1]之間,值越接近 1,說(shuō)明數(shù)據(jù)相似度越高,相似度越高則融合難度越低。
M(A)為模糊測(cè)度函數(shù),它代表了融合的傳感器組代表數(shù)據(jù)的可靠度。參與融合的節(jié)點(diǎn)數(shù)占總節(jié)點(diǎn)數(shù)比例越多,則M的值越大,反之則越小。
假設(shè)某個(gè)待融合的傳感器網(wǎng)絡(luò)共有n個(gè)采集節(jié)點(diǎn),這些節(jié)點(diǎn)可以任意組合,形成的傳感器組合的數(shù)量為2n-1。根據(jù)模糊算法理論,該傳感器網(wǎng)絡(luò)最終融合輸出為:
其中i的取值為1~2n-1。AND運(yùn)算為取最小值,OR運(yùn)算為取最大值。
由上式可見(jiàn),模糊算法的計(jì)算量由節(jié)點(diǎn)數(shù)n來(lái)決定,隨著節(jié)點(diǎn)數(shù)n的增加,算法計(jì)算量將成指數(shù)級(jí)增長(zhǎng),從而對(duì)在嵌入式硬件環(huán)境中實(shí)現(xiàn)算法增加難度,因此有必要對(duì)算法進(jìn)行優(yōu)化。
(三)針對(duì)嵌入式平臺(tái)的算法優(yōu)化
嵌入式硬件平臺(tái)一般偏重于控制而計(jì)算力較弱,對(duì)算法優(yōu)化的重點(diǎn)為減少計(jì)算量和數(shù)據(jù)存儲(chǔ)量。
根據(jù)上文介紹可知,降低計(jì)算量的關(guān)鍵在于參與節(jié)點(diǎn)數(shù)n。如果能夠設(shè)法降低n的值,則能夠大大降低總體計(jì)算量,適應(yīng)嵌入式環(huán)境的要求。在一個(gè)固定系統(tǒng)中,物理節(jié)點(diǎn)數(shù)量n一般是固定的,我們的思路是減少有效節(jié)點(diǎn)數(shù)。
一般而言,節(jié)點(diǎn)采集數(shù)據(jù)都存在一定的冗余度,這種冗余度體現(xiàn)在空間分布冗余和時(shí)間采樣冗余兩個(gè)方面。例如:如果一段時(shí)間內(nèi)待監(jiān)測(cè)環(huán)境參數(shù)沒(méi)有發(fā)生大的波動(dòng),可是適當(dāng)減少采樣的頻度;如果檢測(cè)環(huán)境參數(shù)的空間分布有一定的平滑性,可以適當(dāng)降低有效節(jié)點(diǎn)的分布密度。通過(guò)兩個(gè)維度對(duì)數(shù)據(jù)進(jìn)行合理丟棄,就等效降低了參與融合的節(jié)點(diǎn)數(shù)。
以智能家居系統(tǒng)的溫度變化監(jiān)控為例:
圖2為背景溫度為8℃,啟動(dòng)空調(diào)加熱至23℃的溫度變化曲線,在開(kāi)始兩分鐘以?xún)?nèi),空調(diào)主機(jī)處于預(yù)熱階段,溫度上升較慢;在13分鐘以后,達(dá)到設(shè)定目標(biāo)溫度,溫度變化率變緩。在上述兩個(gè)時(shí)間段內(nèi),可以通過(guò)合理丟棄采集數(shù)據(jù)的思路,降低數(shù)據(jù)融合的計(jì)算量。
對(duì)數(shù)據(jù)進(jìn)行丟棄,需要考慮兩個(gè)要點(diǎn):
1、冗余數(shù)據(jù)丟棄閥值
我們?cè)O(shè)定一個(gè)空間值:
其中C為上次融合輸出結(jié)果,?為一個(gè)設(shè)定常數(shù),代表了被測(cè)量值的合理波動(dòng),合理選擇?需要對(duì)于環(huán)境有一定的先驗(yàn)知識(shí)。T即為衡量數(shù)據(jù)是否冗余的閥值空間。
當(dāng)待融合數(shù)據(jù)沒(méi)有進(jìn)入上述值空間,代表該數(shù)據(jù)需要進(jìn)入正常的融合算法過(guò)程;當(dāng)待融合數(shù)據(jù)進(jìn)入該值空間范圍,則代表該數(shù)據(jù)的冗余度較大,可以考慮丟棄。
2、數(shù)據(jù)權(quán)重值
對(duì)每個(gè)待融合數(shù)據(jù),賦予其伴隨權(quán)重值記為W。W取值為正整數(shù),初值為1。W表達(dá)了與該數(shù)據(jù)相似的數(shù)據(jù)量,W越大,表示該數(shù)據(jù)代表的數(shù)據(jù)量越多;W=1表示該數(shù)據(jù)只代表自己。
當(dāng)某數(shù)據(jù)落入丟棄閥值空間內(nèi)時(shí),我們將它丟棄;但是丟棄的數(shù)據(jù)量太多時(shí),往往會(huì)造成計(jì)算精度的下降。因此,通過(guò)引進(jìn)數(shù)據(jù)權(quán)重,我們給定該數(shù)據(jù)一定機(jī)會(huì)重新參與融合。
對(duì)該數(shù)據(jù)賦予重新融合的機(jī)會(huì)通過(guò)修改模糊測(cè)度函數(shù)來(lái)實(shí)現(xiàn)。
(一)仿真試驗(yàn)場(chǎng)景
仿真實(shí)驗(yàn)場(chǎng)景設(shè)定為某智能家居現(xiàn)場(chǎng),空間范圍為100m 100m。傳感器節(jié)點(diǎn)類(lèi)型設(shè)定為溫度傳感器,傳感器感知范圍為20m。
為了方便對(duì)比,使用普通的模糊融合算法和基于權(quán)重丟棄的改進(jìn)算法兩種方法進(jìn)行數(shù)據(jù)融合實(shí)驗(yàn),融合次數(shù)設(shè)定為50次。
傳感器節(jié)點(diǎn)位置為隨機(jī)均勻分布,如圖4所示:
(二)仿真試驗(yàn)結(jié)果
基于算法原理分析可知,實(shí)際參加融合的有效節(jié)點(diǎn)數(shù)是衡量算法改進(jìn)效率的重要指標(biāo),模擬實(shí)驗(yàn)首先對(duì)兩種算法的有效參與節(jié)點(diǎn)數(shù)進(jìn)行了統(tǒng)計(jì),結(jié)果如圖5:
圖中紅色點(diǎn)線為傳統(tǒng)融合算法參與節(jié)點(diǎn)的數(shù)量,基本在100左右小幅波動(dòng);藍(lán)色點(diǎn)線為改進(jìn)后的算法對(duì)應(yīng)的節(jié)點(diǎn)參與數(shù)量,從第三次融合迭代開(kāi)始,參與節(jié)點(diǎn)數(shù)降低到50個(gè)左右,降低了一半。傳統(tǒng)算法中幾乎所有節(jié)點(diǎn)都參與了每次融合過(guò)程;而改進(jìn)后的算法能大大降低參與節(jié)點(diǎn)數(shù),從而能更大程度降低算法的計(jì)算量需求。
在達(dá)到降低參與節(jié)點(diǎn)數(shù)的設(shè)計(jì)目標(biāo)的同時(shí),我們還要確保算法融合結(jié)果的正確性和精度指標(biāo),對(duì)此我們對(duì)兩種算法的融合結(jié)果值進(jìn)行了比較,如圖6:
圖中紅藍(lán)兩色點(diǎn)線對(duì)應(yīng)的分別是傳統(tǒng)算法和改進(jìn)算法的融合值擬合曲線,兩者對(duì)比可知,改進(jìn)算法的準(zhǔn)確度和精度能達(dá)到設(shè)計(jì)要求。
本文首先分析了5G通信網(wǎng)背景下物聯(lián)網(wǎng)應(yīng)用場(chǎng)景新的需求,指出傳感器網(wǎng)絡(luò)擴(kuò)展和海量數(shù)據(jù)帶來(lái)的技術(shù)問(wèn)題。文章提出了在本地智能節(jié)點(diǎn)進(jìn)行數(shù)據(jù)預(yù)處理和數(shù)據(jù)融合的必要性和重要性。隨后分析比較了常見(jiàn)的幾種數(shù)據(jù)融合算法。本文選擇模糊理論基礎(chǔ)上的數(shù)據(jù)融合算法進(jìn)行重點(diǎn)研究,并針對(duì)嵌入式硬件環(huán)境對(duì)算法進(jìn)行了改進(jìn)。通過(guò)基于閥值和權(quán)重的丟棄處理機(jī)制,能降低參與融合計(jì)算的有效節(jié)點(diǎn)數(shù)量,從而大大降低計(jì)算量和對(duì)硬件的要求。仿真模擬實(shí)驗(yàn)結(jié)果證明,改進(jìn)算法能夠達(dá)到傳統(tǒng)模糊算法能達(dá)到的準(zhǔn)確度和精度,是一種有效的算法。
基金項(xiàng)目:本文系湖南省教育廳科學(xué)研究項(xiàng)目《基于智能決策的智能家居系統(tǒng)研究》論文,項(xiàng)目編號(hào):17C1343。