李若南 李金寶
(齊魯工業(yè)大學(山東省科學院)山東省人工智能研究院 濟南 250014)(黑龍江大學計算機科學技術學院 哈爾濱 150080)(黑龍江大學軟件學院 哈爾濱 150080)
近年來,室內(nèi)區(qū)域定位廣泛應用于室內(nèi)療養(yǎng)院活動區(qū)域監(jiān)控、智能場景(如機場、商場、博物館等)區(qū)域?qū)Ш?、室?nèi)監(jiān)獄犯人活動區(qū)域的標識和警戒、產(chǎn)區(qū)(如石油、化工等)電子圍欄區(qū)域化管控、智慧大樓企業(yè)核心機密區(qū)域預警與室內(nèi)施工場所(如地鐵、隧道等)危險區(qū)域警報等各個領域.隨著城市智能化的逐步發(fā)展,室內(nèi)區(qū)域定位受到越來越多的關注[1].現(xiàn)有的室內(nèi)區(qū)域定位技術中,低功耗藍牙(bluetooth low energy, BLE)技術因低成本、低功耗、測量范圍長等優(yōu)勢而得到廣泛應用.基于BLE的室內(nèi)區(qū)域定位方法主要包括近鄰法、三邊測量和指紋識別法[2-3].近鄰法通過接收一些有限制范圍的物理信號來判斷用戶是否出現(xiàn)在某一個錨節(jié)點附近,并指定最接近該用戶的錨節(jié)點的區(qū)域為用戶區(qū)域,該方法只提供粗略的區(qū)域信息,定位精度不高.三邊測量利用無線設備與多個參考點的距離信息來進行區(qū)域定位,但是,由于噪聲和障礙物阻隔使得信號衰減嚴重,進而導致測量的距離信息誤差較大.指紋識別法包括離線階段和在線階段2部分,離線階段通過從接收信號強度(received signal strength, RSS)序列中提取區(qū)域位置的相關參數(shù)構建指紋數(shù)據(jù)庫,在線階段利用從指紋數(shù)據(jù)庫中查找的最匹配的RSS指紋,將當前RSS序列映射到參考區(qū)域,該方法定位效果較好,但實際操作復雜且指紋庫更新與維護難度較大.RSS是一種不穩(wěn)定的信號,其測量值在位置和時間上差異較大,致使上述方法都存在較大的定位誤差.
本文提出了基于深度學習的室內(nèi)區(qū)域定位模型,該模型利用注意力機制結(jié)合卷積神經(jīng)網(wǎng)絡(con-volutional neural network, CNN)和雙向長短時記憶(bidirectional long short-term memory, BiLSTM)網(wǎng)絡獲取區(qū)域位置在空間維度和時間維度上的粗細粒度特征,實現(xiàn)室內(nèi)區(qū)域定位.本文的主要貢獻總結(jié)于3個方面:
1) 提出了新的基于注意力機制的CNN-BiLSTM室內(nèi)區(qū)域定位模型(CNN-BiLSTM indoor regional positioning model based on attention mechanism, AMCLP),利用注意力機制,選取一些顯著影響區(qū)域位置的RSS粗細粒度特征,在降低數(shù)據(jù)維度和計算復雜度的同時顯著改善室內(nèi)區(qū)域定位的性能;
2) 采用AdaBoost-SVM分類模型去除非視距(non-light of sight, NLOS)數(shù)據(jù),并且通過截斷傅里葉變換去除環(huán)境噪聲來完成數(shù)據(jù)預處理,提高RSS序列的穩(wěn)定性;
3) 利用走廊和會議室的真實數(shù)據(jù)構建數(shù)據(jù)集,對所提出的區(qū)域定位模型進行性能評估,證明了本文方法的有效性和對環(huán)境的適應能力.
在基于BLE的室內(nèi)區(qū)域定位方法中,最主要的誤差來源于無線電信道效應的多徑傳播、反射、信道衰落等所引起的信號變化[4].目前,研究者主要采用近鄰法、三邊測量和指紋識別的方法解決上述問題.一些研究者采用近鄰法和三邊測量的方法,如Yu等人[5]提出的群集KNN(k-nearest neighbor)算法,該算法通過選擇最佳最近鄰點來減少環(huán)境干擾,提高區(qū)域定位性能.Jahan等人[6]結(jié)合三邊測量和卡爾曼濾波算法來實現(xiàn)工業(yè)環(huán)境中的區(qū)域定位,其區(qū)域定位算法在2級產(chǎn)業(yè)環(huán)境[7](工業(yè)制造)中的定位樣本準確率達到85.0%.目前,大多數(shù)研究人員使用基于RSS的指紋識別方法,該方法通常分為確定性算法(deterministic algonithm, DM)、概率性算法(probabilistic algorithm, PM)、模式識別算法(pattern recognition algorithm, PRM)三類.
DM是通過比較信號特征(如向量)與指紋庫中計算出的統(tǒng)計值[8]來估計目標區(qū)域.Tsai等人[9]提出利用模糊邏輯技術定義RSS的分布為離散函數(shù),通過將數(shù)據(jù)聚類成模糊集來解決RSS不穩(wěn)定的問題;Jun等人[10]利用AP(access point)序列的度量來處理RSS的時間波動和設備異質(zhì)性的問題,并且通過動態(tài)區(qū)域劃分機制減少所需參考區(qū)域的數(shù)量;Mohsin等人[11]通過選擇和組合來自幾何和指紋方法的理想元素來構建RSS距離模型來追蹤患者,獲取患者所在的病房;Tian等人[12]提出基于RSS的指紋特征向量算法,通過匹配在線獲取的RSS序列向量和RSS指紋數(shù)據(jù)庫特征向量之間的相似性,估計用戶所在網(wǎng)格區(qū)域,但該方法需要大量的環(huán)境測量和校準,難以實際應用;Li等人[13]提出基于原始細胞(cell of origin, COO)和接收的信號強度指示(received signal strength indication, RSSI)指紋的混合算法,通過目標與細胞區(qū)域的連接范圍來估計目標的區(qū)域,在辦公室和走廊環(huán)境下,定位在距離圓形目標區(qū)域的中心點2.32 m和2.06 m的樣本準確率都為80.0%,該方法易于實施和維護,但成本高、誤差較大.
PM是通過計算信號特征屬于存儲在指紋庫中某個分布的可能性來估計目標區(qū)域.Youssef等人[14]通過構建的基于概率的推理模型,將RSS序列建模為時域和頻域中的隨機變量;Yadav等人[15]提出基于貝葉斯推理算法的區(qū)域定位模型;Sikeridis等人[16]采用無監(jiān)督的學習算法,根據(jù)區(qū)域感知架構,構建基于網(wǎng)格區(qū)域的綜合概率定位模型,在部署的多層設施測試平臺上,定位在距離網(wǎng)格區(qū)域中心點0.80 m的樣本準確率為88.5%,該模型對未標記區(qū)域有較好的定位效果,但依賴于邊緣設備的計算和集中式的3層基礎架構.
PRM是通過離線階段收集RSS序列訓練模型,在線階段利用實時的RSS序列預測區(qū)域位置.Zhuang等人[17]利用信道分離多項式回歸模型將指紋識別和擴展卡爾曼濾波融合來進行室內(nèi)區(qū)域定位;Cao等人[18]提出基于車輛的概率和模式識別方法,該方法利用RSS概率分布函數(shù)表示網(wǎng)格區(qū)域的RSS值,并通過人工神經(jīng)網(wǎng)絡(artificial neural network, ANN)建立輸入RSS序列和輸出位置之間的對應關系,該方法在距離目標區(qū)域中心點0.96 m的樣本準確率為96.4%,但訓練復雜度高;Sánchez-Rodríguez等人[19]使用C4.5算法組合RSS和方向信息來建立了低計算復雜度模型,該模型在距離區(qū)域中心點2.60 m的樣本準確率為95.0%,并且能夠在輕量級設備上應用.
本文提出通過注意力機制捕獲RSS序列與區(qū)域位置粗細粒度特征的映射關系,進而獲取區(qū)域位置信息.相對于目前定位效果最好的網(wǎng)格區(qū)域綜合概率定位模型[16],本文提出的方法在走廊和會議室環(huán)境中都取到了更高的定位精度和樣本準確率.其中,2 m×2 m網(wǎng)格采集中走廊環(huán)境下,距離網(wǎng)格中心點小于0.50 m和小于0.75 m的樣本準確率分別達到86.6%和96.4%;會議室環(huán)境下,距離網(wǎng)格中心點小于0.50 m和小于0.75 m的樣本準確率分別高達96.5%和98.2%.
目前,利用RSS序列的室內(nèi)區(qū)域定位研究已經(jīng)取得了一些較好的研究成果,但這些研究或者存在定位精度差、準確率偏低的問題,或者存在算法過于復雜、依賴基礎設施部署等問題.本文提出一種AMCLP模型,該模型通過CNN獲取區(qū)域中心點的細粒度特征,利用BiLSTM根據(jù)時序規(guī)律獲取區(qū)域范圍的粗粒度特征,并且采用注意力機制捕獲粗細粒度特征中與區(qū)域位置相關的特征,來獲取區(qū)域位置信息.
圖1是本文提出的室內(nèi)區(qū)域定位系統(tǒng)架構.AMCLP的過程分3個步驟:1)利用構建的藍牙Mesh網(wǎng)絡,通過智能手機收集走廊和會議室環(huán)境中每個參考區(qū)域的RSS數(shù)據(jù);2)利用AdaBoost-SVM分類模型去除原始數(shù)據(jù)中NLOS數(shù)據(jù),并且通過截斷傅里葉變換去除環(huán)境噪聲來完成數(shù)據(jù)預處理;3)利用AMCLP模型獲取區(qū)域位置信息.
如圖2(a)所示,由于無線電信道效應[20]的多徑傳播、反射、信道衰落的影響,致使RSS在同一個參考區(qū)域信號波動較大.如圖2(b)所示,不同錨節(jié)點的RSS序列中位數(shù)差別較小,統(tǒng)計特征不明顯,難以在時域空間辨別噪聲.本文采用AdaBoost-SVM分類模型去除NLOS數(shù)據(jù),增強信息穩(wěn)定性,然后通過傅里葉變換將RSS序列轉(zhuǎn)換到頻域空間,在頻域空間里通過選用合適的濾波函數(shù)去除環(huán)境噪聲.
Fig. 2 Timing diagram and box plot of anchor node RSS sequence and regional center point圖2 錨節(jié)點RSS序列和參考區(qū)域的時序圖和箱線圖
2.1.1 AdaBoost-SVM分類模型
將本文的AdaBoost-SVM融合模型與一些常用的機器學習分類模型,如支持向量機(support vector machine, SVM)模型、自適應增強(adaptive boosting, AdaBoost)模型、隨機森林+決策樹(random forest+decision tree, RF+DT)模型,對走廊和會議室環(huán)境中NLOS和視距(light of sight, LOS)情況下的RSS數(shù)據(jù)進行建模分析,通過對比分析實驗發(fā)現(xiàn)AdaBoost對于LOS環(huán)境下的RSS序列具有較好的分類效果,而SVM對于NLOS環(huán)境下的RSS序列具有較好的分類效果,因此本文建立AdaBoost-SVM分類模型,利用AdaBoost模型先區(qū)分大部分LOS環(huán)境下的RSS數(shù)據(jù),SVM再從分錯的樣本中區(qū)分大部分NLOS環(huán)境下的RSS數(shù)據(jù),通過2次分類能夠去除大部分NLOS環(huán)境下數(shù)據(jù).
AdaBoost是用于分類的常用的增強算法,它是一種結(jié)合相同類型弱分類器的自適應迭代算法.在本文中,弱分類器選用后向傳播(back propagation, BP)神經(jīng)網(wǎng)絡,AdaBoost算法對訓練集中每個BP神經(jīng)網(wǎng)絡,以0.1的學習速率,通過800次迭代訓練原始的RSS序列并獲取每個序列的權重,然后根據(jù)權重參數(shù),通過學習速率增加值為1.05和減少值為0.7的自適應學習算法對網(wǎng)絡進行優(yōu)化,并對RSS序列進行NLOSLOS的分類預測,之后對分錯的樣本進行標記,并用SVM進行2次分類,最后對獲取NLOS數(shù)據(jù)進行剔除.其中,BP神經(jīng)網(wǎng)絡的層數(shù)為3,網(wǎng)絡個數(shù)為8,隱含層神經(jīng)元采用S型正切函數(shù),輸出層神經(jīng)元采用S型對數(shù)函數(shù),隱含層神經(jīng)元個數(shù)n2和輸入層神經(jīng)元個數(shù)n1之間的關系為
n2=2n1+1.
(1)
2.1.2 截斷傅里葉變換去噪
文獻[10]指出RSS序列為高斯分布,并且傅里葉變換對時序信號的全局噪聲去除效果好,所以本文選用與信號峰相同的頻域高斯形濾波器,利用傅里葉變換將信號由時域轉(zhuǎn)換到頻域,然后在頻域通過高斯濾波函數(shù)去除高頻噪聲.信號f(w)經(jīng)過離散傅里葉變換得到F(w):
(2)
其中,N為樣本總數(shù);σ為高斯寬度,σ越大,高斯濾波器的頻帶越寬,平滑程度越好.反變換過程將頻域信號恢復成時域信號:
(3)
F(w)=0時頻率稱為截斷頻率F0,設定1個截斷頻率F0,小于F0為噪聲,其值置為0,F(xiàn)0過高,去噪效果差,F(xiàn)0過低,去噪過度損失正常的信號.本文根據(jù)經(jīng)驗設定σ=20,F(xiàn)0=50時可以有效地去除高頻噪聲.通過傅里葉反變換可獲得去噪后的信號.
如圖2(a)所示,RSS是不穩(wěn)定時序信號,其短序列特征存在較大差異,且同一參考位置、不同錨節(jié)點的RSS序列具有相似響應波形,錨節(jié)點之間的RSS序列相互關聯(lián).針對時序數(shù)據(jù)這一特性,本文利用CNN處理局部數(shù)據(jù)的關聯(lián)性和特征提取,通過BiLSTM捕獲數(shù)據(jù)時序性和依賴性,并結(jié)合注意力機制實現(xiàn)室內(nèi)區(qū)域定位,如圖3所示,AMCLP模型主要由3部分構成:CNN層、BiLSTM層、注意力機制.
Fig. 3 Model of AMCLP圖3 AMCLP模型
CNN層采用64個1×1卷積核作為區(qū)域中心點的特征提取器,利用權重共享提取輸入的序列信息中包含區(qū)域中心點的細粒度特征,為了防止過擬合,在CNN層后添加丟棄層,丟棄率設定為經(jīng)驗值0.2,且CNN層和丟棄層的激活函數(shù)為Relu.此外,文獻[21]指出在CNN中,淺層神經(jīng)元傾向于學習一些簡單的特征,比如邊緣、位置等,深層神經(jīng)元能夠檢測到一些抽象的特征,比如動作、表情等.對于時序數(shù)據(jù)來說,隨著網(wǎng)絡深度的增加,模型的復雜度也會增加,所以為了降低模型復雜度并保證網(wǎng)絡性能,本文根據(jù)經(jīng)驗將卷積層設置為2層.
BiLSTM層在循環(huán)神經(jīng)網(wǎng)絡(recurrent neural networks, RNN)的結(jié)構上加入記憶門與3個門控單元,通過64個LSTM單元來對歷史和未來消息進行有效的控制.如式(4)~(9)所示,遺忘門ft的權重矩陣(Wxf,Whf,Wcf,bf)用來控制是否忘記當前狀態(tài),輸入門it的權重矩陣(Wxi,Whi,Wci,bi)用來控制是否應存儲輸入,輸出門ot的權重矩陣(Wxo,Who,Wco,bo)用來控制是否輸出狀態(tài),這3個門通過設置xt,ht-1,ct-1的狀態(tài)來決定是否接受輸入,是否忘記之前存儲的內(nèi)容并輸出稍后生成的狀態(tài).其中,xt表示當前時刻的輸入,ct-1表示上一時刻神經(jīng)元細胞狀態(tài),ht-1表示上一時刻的隱層向量狀態(tài),ht表示當前時刻的隱層向量狀態(tài),ct表示當前時刻神經(jīng)元細胞狀態(tài),ct可通過ct-1和it的加權之和獲得:
it=σ(Wxixt+Whiht-1+Wcict-1+bi),
(4)
ft=σ(Wxfxt+Whfht-1+Wcfct-1+bf),
(5)
gt=Relu(Wxcxt+Whcht-1+Wccct-1+bc),
(6)
ct=itgt+ftct-1,
(7)
ot=σ(Wxoxt+Whoht-1+Wcoct-1+bo),
(8)
ht=otRelu(ct).
(9)
BiLSTM[22]通過引入第2層,擴展了單向LSTM網(wǎng)絡,即在原有的正向LSTM網(wǎng)絡層上增加1層反向的LSTM層,在第2層中隱層的連接以相反的時間順序流動,因此該模型能夠充分利用來自過去和未來的信息.我們使用逐元素和來組合正向和反向傳遞輸出:
(10)
Iv表示v個錨節(jié)點的RSS序列向量,C(·)表示CNN粗粒度特征提取,H(·)表示LSTM細粒度特征提取.BiLSTM的3個門的交互操作使得BiLSTM能夠根據(jù)當前數(shù)據(jù)與過去、未來數(shù)據(jù)的關聯(lián),抽取潛藏時序規(guī)律的區(qū)域范圍的粗粒度特征Bi.此外,其存儲記憶特性可以有效地解決反向傳播中梯度消失的問題:
(11)
注意力機制的原理是對輸入序列的不同局部,賦予不同的重要性,即權重,而對于不同的輸出序列局部,輸入局部給不一樣的賦值規(guī)劃或者方案,即輸出序列局部由上一階段輸出和當前階段的輸入局部構成.注意力機制利用激活函數(shù)為Sigmoid的128個神經(jīng)元生成權重參數(shù)Ai,Ai作為注意力分配的系數(shù),從序列中學習每1個粗細粒度特征的重要程度,并按重要程度將特征合并,采用加權的方式對RSS序列上下文信息進行1次基于權重的篩選,讓網(wǎng)絡能夠?qū)W習捕獲RSS序列上下文在時序上、空間上的結(jié)構關系.
Ai=Sigmoid(wTBi),
(12)
Li=Bi×Ai,
(13)
其中,i表示樣本序列數(shù),Ai表示第i個RSS序列的權重參數(shù),Bi表示第i個RSS序列的細粒度特征,Li表示室內(nèi)區(qū)域的位置信息.隨著RSS序列的不斷增加,由于不同的時間片和空間位置信息量的差別明顯,使得模型根據(jù)時間步方式捕獲特征的能力越來越差,而注意力機制可以有效利用序列差別信息,提升序列學習效果.根據(jù)經(jīng)驗,設置樣本批次為100,迭代次數(shù)為230,優(yōu)化算法為Adam(adaptive moment estimation)算法.
在本研究中,實際測量數(shù)據(jù)表明:當相鄰藍牙裝置相隔3~4 m時,所測信號最穩(wěn)定,定位效果最好.為充分利用節(jié)點資源,如圖4所示,當5個錨節(jié)點在走廊與會議室中不呈現(xiàn)隨機分布而分別近似呈線性分布與星型分布時,實驗定位的精度和準確度呈現(xiàn)最佳效果.
Fig. 4 Experimental scene圖4 實驗場景
實驗環(huán)境是某實驗樓的1段走廊和1個會議室,實際場景分別如圖4(d)和圖4(b)所示,空心箭頭(黃色箭頭)表示5個錨節(jié)點M1,M2,M3,M4,M5的位置.圖4(c)為走廊環(huán)境平面圖,寬3 m,長30 m,錨節(jié)點線性分布,相鄰錨節(jié)點距離為3 m;圖4(a)為會議室環(huán)境平面圖,寬7 m,長8 m,淺色區(qū)域(黃色區(qū)域)表示障礙物,相鄰錨節(jié)點距離3 m或4 m.表1為實驗場景參數(shù),其中T表示每個場景觀察的周期,H表示每個參考區(qū)域觀察時長,S_com表示場景復雜度,A_num表示錨節(jié)點數(shù)量,A_distri表示錨節(jié)點分布,A_Dis表示相鄰錨節(jié)點的距離,S_size表示場景規(guī)格,M_size表示網(wǎng)格尺寸,D_dim表示數(shù)據(jù)集維數(shù),S_num表示樣本數(shù),R_num表示網(wǎng)格個數(shù).
Table 1 Experimental Scene Characteristics and Parameters表1 實驗場景參數(shù)
如圖4所示,利用走廊和會議室環(huán)境下部署的BLE錨節(jié)點構建Mesh網(wǎng)絡,其中BLE設備以相同的傳輸功率周期性廣播錨節(jié)點信息,根據(jù)被定位目標因遮擋和陰影效應對無線信號的影響,判斷目標所在的區(qū)域.首先將定位環(huán)境均勻地劃分為R_num個網(wǎng)格,記錄網(wǎng)格中心點坐標,通過智能手機在每個網(wǎng)格區(qū)域的中心點,采集由目標遮擋和陰影效應引起的錨節(jié)點RSS序列變化值,每個網(wǎng)格區(qū)域采集5~6 min的數(shù)據(jù),測試周期為1周.網(wǎng)格尺寸分為1 m×1 m,1 m×2 m,2 m×2 m這3種類型,根據(jù)網(wǎng)格尺寸和測試環(huán)境構建6個不同訓練集,每個訓練集(D_X,D_Y)中,D_X表示RSS的樣本數(shù),D_Y表示錨節(jié)點的RSS序列(IRSS1,IRSS2,IRSS3,IRSS4,IRSS5)和標記的網(wǎng)格中心點坐標(X_center,Y_center).如表1所示,走廊環(huán)境下,樣本總數(shù)分別為33 532,11 210,5 388,尺寸為1 m×1 m,1 m×2 m,2 m×2 m的網(wǎng)格數(shù)量分別為63,21,11.會議室環(huán)境下,樣本總數(shù)分別為22 001,10 935,5 667,尺寸為1 m×1 m,1 m×2 m,2 m×2 m的網(wǎng)格數(shù)量分別為42,20,11,訓練集與測試集的樣本比例為7∶3.
如圖5所示,本文選用4種濾波算法對錨節(jié)點M1的RSS進行測試,其中,圖5(a)~(e)分別表示原始數(shù)據(jù)圖、中值濾波圖、窗口平均濾波圖、算術平均濾波圖、截斷傅里葉變換濾波圖.通過比較可以發(fā)現(xiàn):中值濾波在不改變樣本數(shù)量的前提下能夠過濾特別明顯的異常噪聲,但是對于不太明顯的異常噪聲和一般噪聲效果不好.窗口平均濾波法不能去除掉明顯的異常噪聲和異常噪聲.算術平均濾波法能夠過濾特別明顯的異常噪聲,但對于一般噪聲效果不好,并且樣本的數(shù)量會有所減少.截斷傅里葉變換濾波法可以在不改變信號波形和樣本數(shù)量的情況下,去除絕大部分的噪聲使信號更加穩(wěn)定.因此,本文選用截斷傅里葉變換濾除噪聲.
Fig. 5 Comparison of filtering effect of five different filtering algorithms圖5 5種不同濾波算法濾波效果比較
為了驗證本文提出的AdaBoost-SVM融合模型的NLOSLOS分類性能,如表2所示,分別將本文的融合模型與單SVM模型、單AdaBoost模型、AdaBoost+預處理、融合RF+DT模型進行對比實驗,其中,表2中黑體部分表示本文的融合模型的實驗效果.此外,本文根據(jù)基于混淆矩陣的標準度量評估這些機器學習算法性能,4類分別為TP(true positive),TN(true negative),F(xiàn)P(false positive),F(xiàn)N(false negative).應用的分類性能指標為:
Table 2 NLOS Classification Performance表2 NLOS分類性能
AdaBoost模型中BP作為弱分類器參與建模,SVM的時間復雜度為O(N2M),AdaBoost的時間復雜度為O(NMlgM),AdaBoost-SVM的時間復雜度為O(NMlgM+N2M),N為特征維度,M為樣本數(shù).由表2可知,預處理后的單個機器學習模型AdaBoost與常用的組合模型RF+DT相比,分類精度提高3.1%,靈敏度提高1.4%,F(xiàn)1提高2.4%.此外,AdaBoost對LOS數(shù)據(jù)具有較好的分類效果,而SVM對于NLOS數(shù)據(jù)具有較好的分類性能,因此本文通過將SVM和AdaBoost進行結(jié)合,利用2次分類來提高NLOS的分類性能.與傳統(tǒng)的單個機器學習模型SVM和AdaBoost相比,AdaBoost-SVM融合模型時間復雜度分別增加O(NMlgM)和O(N2M),但是準確度提高了16.5%和21.3%,分類精度提高了26.7%和27.9%,F(xiàn)1提高了13.7%和14.0%,AdaBoost-SVM模型在離線訓練階段以執(zhí)行時間為代價獲得高精度和高準確度.與常用的組合模型RF+DT相比,AdaBoost-SVM融合模型分類性能最優(yōu),其分類準確率和精度分別高達97.6%和99.9%,F(xiàn)1達到97.5%,靈敏度達到95.2%.
本文設置距離定位區(qū)域中心點小于0.40 m,0.50 m和0.75 m為評估區(qū)域,如表3所示,采用樣本與區(qū)域中心點坐標之間的平均平方誤差MSE(mean squared error)、平均絕對誤差MAE(mean absolute error)、樣本預測準確率NUM_pre(number prediction accuracy)作為評估指標:
(14)
其中,NUMT表示落入?yún)⒖紖^(qū)域樣本數(shù),NUMF表示沒有落入?yún)⒖紖^(qū)域樣本數(shù).
不同情況下定位效果如表3所示,其中G_dis表示評估區(qū)域,即距離定位區(qū)域中心點誤差分布的區(qū)間“<0.40 m”,“<0.50 m”和“<0.75 m”.Tr_num表示訓練集樣本數(shù),Te_num表示測試集的樣本數(shù).Scene表示實驗環(huán)境,Edge表示測試樣本是否位于邊緣區(qū)域,其中,“×”表示測試樣本不在邊緣區(qū)域,“Right”表示測試樣本位于右邊緣區(qū)域,“Left”表示測試樣本位于左邊緣區(qū)域,De_no表示是否進行數(shù)據(jù)去噪,其中,“√”表示對數(shù)據(jù)進行去噪處理,“×”表示對數(shù)據(jù)不進行去噪處理.
3.3.1 不同環(huán)境的室內(nèi)區(qū)域定位效果
如表3所示,走廊和會議室平均平方誤差分別為0.11m和0.03 m,平均絕對誤差分別為0.12 m和0.05 m,差別很小.表4為走廊和會議室樣本準確率差值,走廊、會議室樣本準確率在“<0.40 m”,“<0.50 m”,“<0.75 m”的平均差值分別為10.3%,7.0%,2.3%.圖6(a)~(c)分別是1 m×1 m,1 m×2 m,2 m×2 m網(wǎng)格區(qū)域中走廊和會議室環(huán)境下的樣本準確率.如圖6(c)所示,2 m×2 m網(wǎng)格環(huán)境下,走廊和會議室評估區(qū)域為“<0.75 m”的樣本準確率為94.4%和98.2%.綜上可知:本文的AMCLP區(qū)域定位算法在不同環(huán)境、不同錨節(jié)點布局下定位準確度和精度都較好.
Table 3 Positioning Effect in Different Situations表3 不同情況下的定位效果
Table 4 Corridor and Meeting Room Positioning Accuracy Difference
Fig. 6 Positioning accuracy of different environments and different anchor nodes圖6 不同環(huán)境和不同錨節(jié)點布局定位樣本準確率
3.3.2 邊緣位置的室內(nèi)區(qū)域定位效果
左邊緣和右邊緣區(qū)域分別表示距離左墻壁和右墻壁10 cm的區(qū)域,正常區(qū)域表示距離墻壁大于1 m的區(qū)域,評估區(qū)域G_dis表示定位到區(qū)域中心點的誤差距離“<0.40 m”,“<0.50 m”,“<0.75 m”的區(qū)域.
如圖7所示,和正常區(qū)域位置相比,當評估區(qū)域為“<0.40 m”時,左邊緣區(qū)域和右邊緣區(qū)域的樣本準確率分別降低15.6%和4.6%;評估區(qū)域為“<0.50 m”時,左邊緣和右邊緣的樣本準確率分別降低10.7%和2.2%;評估區(qū)域為“<0.75 m”時,左邊緣和右邊緣的樣本準確率分別降低2.2%和1.4%.所以與正常區(qū)域相比,當評估區(qū)域為“<0.40 m”和“<0.50 m”時,左邊緣區(qū)域的樣本準確率變化較大,當評估區(qū)域為“<0.75 m”時左邊緣區(qū)域的樣本準確率變化不大.
Fig. 7 Edge position location sample accuracy圖7 邊緣位置定位樣本準確率
而右邊緣區(qū)域在不同評估區(qū)域內(nèi)的樣本準確率變化始終很小.此外,評估區(qū)域為“<0.75 m”時,左邊緣、右邊緣及正常區(qū)域的樣本準確率分別是97.5%,99.7%,98.3%.因此,本文的AMCLP區(qū)域定位算法在邊緣區(qū)域定位也取得了很好的效果.
3.3.3 不同網(wǎng)格區(qū)間室內(nèi)區(qū)域定位效果
圖8為不同網(wǎng)格樣本的準確率,與1 m×2 m網(wǎng)格相比,會議室環(huán)境下,不同網(wǎng)格的樣本準確率差別很小.走廊環(huán)境下,當評估區(qū)域為“<0.40 m”時,1 m×1 m和2 m×2 m網(wǎng)格的樣本準確率相差14.6%和17.1%;當評估區(qū)域為“<0.50 m”時,1 m×1 m和2 m×2 m網(wǎng)格的樣本準確率相差10.4%和12%;當評估區(qū)域為“<0.75 m”時,1 m×1 m和2 m×2 m網(wǎng)格的樣本準確率相差3.1%和5.3%,故AMCLP區(qū)域定位算法在不同網(wǎng)格下樣本準確率和定位精度較好.
本文將AMCLP與現(xiàn)有的區(qū)域定位模型原始COO指紋[13]、無監(jiān)督綜合概率[16]、ANN[18]、C4.5[19]進行了性能比較,表5為不同算法的區(qū)域定位效果,其中,表5中黑體部分表示本文算法的定位誤差和定位準確度.
由表5可知,本文的AMCLP方法在1 m×2 m網(wǎng)格采集下,距離網(wǎng)格中心點0.50 m的樣本準確率為97.4%,相比于無監(jiān)督綜合概率定位模型[16],網(wǎng)格區(qū)域中心點距離至少提高0.30 m,樣本準確率提高8.9%,與文獻[18]的方法相比,網(wǎng)格區(qū)域中心點距離提高0.46 m,樣本準確率提高1.0%,所以,本文的AMCLP方法得到了最好的樣本準確率和定位精度.
Table 5 Regional Positioning Effect of Different Algorithms表5 不同算法的區(qū)域定位效果
本文提出AMCLP模型,該模型利用注意力機制,通過融合粗細粒度特征,學習RSS序列特征與區(qū)域位置的映射關系來獲取區(qū)域位置.預處理時,利用AdaBoost-SVM分類模型去除NLOS數(shù)據(jù),其分類準確率和精度分別達到了97.6%和99.9%,F(xiàn)1達到97.5%,靈敏度高達95.2%.實驗結(jié)果表明,距離網(wǎng)格中心點小于0.75 m的樣本準確率,在走廊環(huán)境和會議室環(huán)境,1 m×1 m網(wǎng)格采集下分別高達96.6%和99.2%,1 m×2 m網(wǎng)格采集下分別高達98.3%和99.2%,2 m×2 m網(wǎng)格采集下分別高達94.4%和98.2%.與文獻[16]相比,距離網(wǎng)格中心點的距離至少提高0.05 m,其中,走廊環(huán)境和會議室環(huán)境中的樣本準確率在1 m×1 m網(wǎng)格采集下提高了8.1%和10.7%,在1 m×2 m網(wǎng)格采集下提高了9.8%和10.7%,在2 m×2 m網(wǎng)格采集下提高了5.9%和9.7%.未來工作中,計劃在更復雜的室內(nèi)環(huán)境下進行實驗,獲取更多區(qū)域位置的RSS序列特征信息以進一步驗證本文的室內(nèi)區(qū)域定位模型AMCLP.