常 俊,楊錦朋,于怡然,余 江
(云南大學信息學院,昆明,650500)
隨著室內(nèi)無線通信技術的進步,依托各種成熟使用的無線通信技術的室內(nèi)定位方案層出不窮,室內(nèi)定位的理論基礎和技術方法受到廣泛重視[1?4]。由于WiFi 網(wǎng)絡的高性能和低價格,已在室內(nèi)環(huán)境獲得大規(guī)模部署,基于WiFi 通信信號位置指紋的室內(nèi)定位研究備受關注,然而由于設備異構(gòu)性問題引起的位置指紋的大尺度波動,造成位置指紋漂移,發(fā)生誤匹配,嚴重影響了定位的準確性和健壯性[5]。
目前,解決指紋定位設備異構(gòu)問題的方法主要有兩類,校準的方法和免校準的方法。校準的方法在離線階段學習參考設備和用戶的移動終端在相同位置處RSS 的關系模型,在線階段通過關系模型對用戶設備在待定位點的接收信號強度(Received signal strength,RSS)向量進行補償,該方法直接而有效,在早期得到了廣大研究者的關注和研究,但從研究走到應用,仍然有著限制,校準過程需要學習參考設備RSS 值與用戶移動終端RSS 值的關系模型,時延高,不能滿足設備大規(guī)模接入的實時應用。另一種免校準的方法就是對原始指紋進行統(tǒng)一的處理,獲得健壯性更好的新指紋。近年來,得到了廣泛的關注和研究[6]。Kjaergaard 提出了一種雙曲線位置指紋(Hyperbolic location fingerprinting,HLF)方法[7],用成對的接入點信號強度比值作為新指紋,對于異構(gòu)的設備問題,采用HLF 指紋比起未處理的指紋有更好的定位精度,但這種方法增加了指紋的維數(shù),從而增加了指紋比對的計算復雜度。文獻[8]采用信號強度差(Signal strength difference,SSD)的方法,通過取相鄰最強接入點(Access point,AP)的接收信號強度指示(Received signal strength indicator,RSSI)的差值來作為指紋,新指紋表示了不同AP 的RSSI 的相對強弱關系,把這種關系作為指紋,新指紋一定程度減弱了設備異構(gòu)的影響,但指紋特征會減少。Zou 等[9]提出了一種信號趨勢指數(shù)(Signal tendency index,STI)的方法,把處理后參考點指紋和測試點指紋的歐式距離作為STI,采用加權(quán)平均從關鍵參考指紋構(gòu)建出新的測試點指紋,該方法不改變指紋維度,但計算量大。
傳統(tǒng)的免校準方法大多考慮對原始指紋變形,對指紋變形的方法雖然一定程度可以緩解異構(gòu)設備的影響,但是由于RSS 的時變特性和空間變化影響,使得RSS 含有大量的噪聲,傳統(tǒng)免校準對原始指紋變形的方法,獲得的只是表層特征,雖然可以減弱異構(gòu)設備對于RSSI 的大尺度影響,但對于噪聲引起小尺度影響,顯得無能為力,嚴重限制了WiFi 指紋定位精度的進一步提高。所以針對傳統(tǒng)免校準方法的不足,本文提出一種對原始指紋特征挖掘的免校準方法:CLAS?SDAE?WKNN 定位算法。結(jié)合最強AP 分類,普氏分析(Procrustes analysis),堆疊降噪自編碼(Stacked denoising autoencoder,SDAE)獲取深度特征指紋,在線階段,利用加權(quán)最近鄰算法(Weightedk?nearest neighbor,WKNN)的方法與深度特征子指紋庫匹配,獲得估計的位置。
設備異構(gòu)性問題是室內(nèi)WiFi 指紋定位中一個不可忽視的問題。設備異構(gòu)性主要是由于設備軟硬件的差異引起的[6]。如表1 所示采用了4 種不同型號的手機來進行實驗,4 種手機的軟硬件和材質(zhì)都存在差異。
表1 手機信息Table 1 Mobile phone information
利用表1 中4 種手機在相同的位置各采集30 次來自8 個AP 的RSS 數(shù)據(jù),取30 次數(shù)據(jù)的均值,作出如圖1 所示的4 種手機的RSS 曲線。
從圖1 可以清晰地看出不同手機在同一個位置所接收到來自8 個AP 的RSS 值是明顯不同的,MI 4LTE 手機采集自 AP1 的 RSS 與 LG?ls990、ONE E1001 手機相差約 10 dB·m,LG?ls990 與 ONE E1001 手 機 采 集 自 AP3 的 RSS 相差約 10 dB·m,MI 4LTE 手機與 vivo X5ProD手機相對接近,LG?ls990 手機與 ONE E1001 手機差距相對大。說明了設備異構(gòu)性確實存在,從不同手機采集來的大量數(shù)據(jù)來看,同一位置接收信號強度值最大相差15 dB·m,對于基于指紋的定位方法來說是一個不可忽視的問題。
除了設備異構(gòu)問題嚴重影響WiFi 指紋定位的性能,原始的指紋特征隨時間和空間變化而波動,表現(xiàn)出不穩(wěn)定性,造成定位性能的下降。指紋庫的穩(wěn)定性影響著定位系統(tǒng)的性能,所以尋找穩(wěn)定的指紋特征,建立穩(wěn)定的指紋庫顯得尤為必要。
圖2 是4 種手機在實驗環(huán)境中相同位置處,在3 min 內(nèi),各采集的同一AP 的RSS 數(shù)據(jù)30 次繪制的曲線,從圖2 中可以看出由異構(gòu)設備引起的不同的手機RSS 的波動要大于時間變化引起的RSS 的波動。
圖3 是ONE E1001 在實驗環(huán)境中一個參考點處,相隔5 d 時間,各采集30 次7 個AP 的RSS 數(shù)據(jù)的均值繪制的曲線,對比不同手機造成的RSS 差異,同種手機采集的RSS 受到時間和空間的影響相對較小,但仍存在差異。
圖1 4 種手機AP 編號與RSS 值曲線Fig.1 AP numbers and RSS value curves of four mobile
圖2 4 種手機同一位置短時間內(nèi)采集的同一AP 的RSSFig.2 RSS of the same AP collected by four mobile phones in a short time
圖3 同一手機不同時間段采集的7 個AP 的RSSFig.3 RSS of 7 APs collected in different time peri?ods of the same mobile phone
對指紋變形的方法雖然一定程度可以緩解異構(gòu)設備的影響,但是由于RSS 的時變特性和空間變化影響,使得RSS 含有大量的噪聲,傳統(tǒng)免校準對原始指紋變形的方法,獲得的只是表層特征,雖然可以減弱異構(gòu)設備對于RSS 的大尺度影響,但對于噪聲引起小尺度影響,收效甚微,嚴重限制了WiFi 指紋定位精度的進一步提高。
圖4 是本文提出的CLAS?SDAE?WKNN 室內(nèi)定位方法的流程圖,分為離線訓練階段和在線定位階段。離線訓練階段綜合最強AP 分類和普氏分析的方法處理參考設備采集得到的指紋,獲得標準化子指紋庫,然后將其通過SDAE 進行訓練,獲得不同類指紋的最優(yōu)的深度特征學習模型和深度特征子指紋庫,最終將不同類的深度特征子指紋庫存儲,作為比對的特征。
圖4 CLAS-SDAE-WKNN 流程Fig.4 Process of CLAS-SDAE-WKNN
在線定位階段采用最強AP 分類和普氏分析的方法處理測試設備采集的RSS 向量,假設處理后指紋的分類標簽是k,將其輸入到第k類SDAE 訓練得到的深度特征學習模型進行訓練,得到第k類的深度特征向量,最終利用WKNN 的方法將其與深度子指紋庫k中的特征進行比對,獲得估計的位置。
本文提出的CLAS?SDAE?WKNN 室內(nèi)定位方法,采用最強AP 法和普氏分析法預處理指紋,結(jié)合SDAE 訓練深度特征和WKNN 匹配的方法。綜合最強AP 法和普氏分析法的優(yōu)勢,能夠顯著降低異構(gòu)設備的影響,提高SDAE 訓練的速度和精度。把預處理后的指紋經(jīng)過SDAE 進行非線性特征提取與變換,有效地降低指紋的噪聲,獲取深層的指紋特征,進一步提升定位系統(tǒng)的穩(wěn)定性與魯棒性。由于訓練得到的深度特征的穩(wěn)定性,經(jīng)典的WKNN 方法也可以獲得較好的定位效果,WKNN 的簡單高效也可以保障綜合方法定位的有效性。
定義:假設實驗環(huán)境中設置m個參考點,n個AP,WiFi 指紋庫表示為FDB(L,F(xiàn)P),其中L為位置集合,F(xiàn)P為參考設備在參考點采集自所有AP 的RSS 向量集合。第i個位置的指紋表示為Fi=(li,fpi),F(xiàn)i∈ FDB,i=1,2,…,m,其中第i個位置的坐標li=(xi,yi),li∈L,第i個位置在第j次采集的 RSS 向量fpi,j=表示 在 第i個位置第j次采集來 自 第n個 AP的RSS。
經(jīng)過分類的指紋庫表示 FDB={f1,f2,…,fn};標準化指紋庫表示為 STDFDB={s1,s2,…,sn};把經(jīng) SDAE 訓練得到的深度指紋庫表示為 DCFDB={d1,d2,…,dn}。
測試設備在本文實驗環(huán)境內(nèi)某一個待定位點采集來自所有參考AP 的RSS 值,表示為ti=第k類向量表示為。標準化處理后的表示為,k∈1,2,…,n。經(jīng)SDAE 提取和變換后的指紋表示為dt,它的維度與SDAE 網(wǎng)絡參數(shù)相關。
假設指紋最大RSS 對應第k個AP,就把這條指紋歸為第k類,所有的指紋都進行相同的分類處理,把指紋庫 FDB 的所有指紋劃分為n類,即i=1,2,…,m;j=1,2,…,30。fk中所有的最大 RSS,都來自第k個 AP,這類指紋的位置與第k個AP 比較接近,同一類指紋,物理坐標更為接近。
對分類后的指紋庫FDB 中每個子指紋庫fk中每個位置的指紋進行如下的標準化處理:
把ti先按照最強AP 的方法對其進行分類,得到
對平移處理
式中
經(jīng)均勻縮放處理為
式中
采用最強AP 法相較于其他分類方法可以快速對指紋進行分類,保證不同手機的同一類指紋特征的相似性,縮小定位的范圍,實現(xiàn)粗定位;普氏分析方法處理分類的指紋,可以把RSS 分布變?yōu)橐粋€標準正態(tài)分布,使得不同手機采集的RSS 有同一分布,減少不同數(shù)據(jù)域之間分布的差異,接近一個統(tǒng)一標準指紋,為堆疊降噪自編碼器(Stacked denoising autoencoder,SDAE)網(wǎng)絡提供穩(wěn)定的特征輸入。
SDAE 是由多個降噪自編碼器堆疊而成的深度神經(jīng)網(wǎng)絡。結(jié)構(gòu)如圖5 所示。
堆疊降噪自編碼器的結(jié)構(gòu)如圖5 所示堆疊了n個降噪自編碼器[10?11],把上一個 DAE 的輸出作為下一個 DAE 的輸入,經(jīng)過編碼和解碼過程以最小重構(gòu)誤差為目標,不斷迭代訓練得到各層降噪自編碼器的編碼函數(shù)和解碼函數(shù)中的權(quán)值矩陣和偏置向量。通過訓練的SDAE 網(wǎng)絡是一個具備深度特征挖掘的深度神經(jīng)網(wǎng)絡,可以從原始的含有噪聲的數(shù)據(jù)中挖掘到更具有魯棒性的特征,提高SDAE 的泛化能力,并為后面的算法模型提供穩(wěn)定的數(shù)據(jù)輸入。
圖5 堆疊降噪自編碼結(jié)構(gòu)Fig.5 Stacked denoising autoencoder
把標準化子指紋庫STDFDB 中,每類位置指紋sfk中,所有 的加入掩模噪聲,k∈ 1,2,…,n,其中1,2,…,30。 最 終 得 到 加 噪 的 標 準 化 子 指 紋 庫 ,表 示 為其 中s=f k表 示 加 噪 后 的 標 準 化 指 紋 。
編碼器和解碼器每層的學習過程如下
式(6)為堆疊降噪自編碼器學習過程,編碼階段加噪的標準化指紋為網(wǎng)絡的輸入,每層網(wǎng)絡的輸入是上一層網(wǎng)絡的輸出經(jīng)過編碼器激活函數(shù)的向量,分別為編碼器各層網(wǎng)絡的權(quán)值矩陣和偏置矩陣。解碼階段編碼器最后一層的輸出作為解碼器的輸入,每層網(wǎng)絡的輸入是上一層網(wǎng)絡的輸出經(jīng)過解碼器激活函數(shù)的向量,分別為各層網(wǎng)絡的權(quán)值矩陣和偏置矩陣。
標準化指紋經(jīng)過解碼和編碼后,根據(jù)標準化指紋和重構(gòu)指紋之間的誤差,重構(gòu)誤差即表示為第(L-l)層的編碼特征與第l層解碼特征的歐氏距離。
構(gòu)建損失函數(shù)J(θ),通過優(yōu)化更新每層編碼器和解碼器的參數(shù)
使用自適應矩估計(Adam)法對參數(shù)進行估計,對于某一神經(jīng)元的參數(shù)在第t次迭代,中的元素更新過程為
式中:β1,β2為指數(shù)衰減率,β1=0.9,β2=0.999;mt為第t次梯度指數(shù)移動均值,m0=0;vt為第t次平方梯度,v0=0;α為學習速率,ε為常數(shù)中第nl個元素中元素也按照式(8—10)更新。
本文實驗場景如圖6 所示,包括了3 條長度分別為60,63.6,40.5 m 的走廊。在整個區(qū)域內(nèi)布置了22 個接入點在天花板上,距離地面約2.5 m,分布如圖7 中所示,在實驗環(huán)境中劃分網(wǎng)格,建立坐標,設置了參考點和待定位點。密集的過道按(1.2 m×1.2 m)的網(wǎng)格劃分,空曠的大廳區(qū)域按照(2.4 m×2.4 m)的網(wǎng)格劃分,網(wǎng)格的中心設置為采集點,共158 個,選取了143 個作為參考點,15 個作為待定位點。建立坐標系,x軸和y軸與兩條過道重合,便于坐標的選取,方便設置采集點。15 個待定位點分布在不同的的過道,不與參考點重合,可以更好驗證算法的有效性。
圖6 實驗場景平面圖Fig.6 Experimental scene
在離線階段,實驗人員用MI 4LTE 手機在143 個采集點分別采集RSSI 數(shù)據(jù),采集時手機保持在相同的高度1.2 m,同一朝向,每個點采集30 次,每隔3 s 采集一次,采集完成后,把一些在參考點處測不到的AP 的RSSI 值賦為-100 dBm,使每個位置的指紋維度一致,即合理反映了測不到的位置特性,又方便算法的驗證。把整理后的143 個參考點的位置指紋進行儲存,建立起離線階段的指紋庫。在線定位階段,為了討論設備異構(gòu)性問題,使用4 種異構(gòu)類型的手機分別在15 個待定位點采集數(shù)據(jù),每個點同樣采集30 次,每3 s 采集一次,各從中選取200 個樣本作為測試數(shù)據(jù),實驗用的手機分別是MI 4LTE,LG?ls990,ONE E1001,vivo X5ProD,具體信息見表1。
在本文的實驗場景下,采集數(shù)據(jù),利用CLAS?SDAE?ELM 的方法對測試點進行定位,分析本文方法的性能,具體步驟如下:
算法 1CLAS?SDAE?WKNN
訓練階段:
輸入:標準化子指紋庫STDFDB;每個隱含層的神經(jīng)元個數(shù)為n1,n2,…,nl;學習率ρ;激活函數(shù):s(·)。
輸出:第k類模型的編碼器各層的參數(shù)。
深度特征子指紋庫DCFDB。
fork= 1,2,3,…,n
(1)隨機產(chǎn)生編碼器的參數(shù)θe和解碼器的參數(shù)θd;
(2)對第k類子指紋庫sfk中 每條指 紋中數(shù)據(jù)加入掩模噪聲,得到;
(3)訓練編碼器的參數(shù)θe和解碼器的參數(shù)θd;
(4)保存第k類模型參數(shù)θe、θd和網(wǎng)絡模型;
(5)訓練得到深度特征子指紋庫DCFDB。
end for
測試階段:
輸出:第i個測試點的估計坐標
fori=1,2,3,…,d(d是的數(shù)量)
(1)對進行分類,得到分類號k;
(2)加載第k類SDAE 模型參數(shù)參數(shù)θe和θd網(wǎng)絡模型,訓練得到深度特征dtk;
(3)計算dtk和第k類深度子指紋庫dk中每條特征的歐式距離;
end for
實驗參數(shù)的設置如表2 所示。
表2 SDAE 參數(shù)Table 2 Parameters of SDAE
SDAE 中參數(shù)學習率是控制著基于損失梯度調(diào)整神經(jīng)網(wǎng)絡權(quán)值的速度的超參數(shù)。學習率的大小影響著損失函數(shù)的變化速度,所以學習率的大小影響著收斂的快慢,設置大的學習率,模型收斂較快,但是容易錯過局部最小值,設置小的學習率,模型收斂速度慢,但不會錯過局部最小值。所以選取合適的學習率,能夠平衡好訓練模型的效率與模型的性能,從圖7 可以看出學習率取0.000 1 時為最佳。
相同的學習率下自適應矩估計(Adam)的收斂效果優(yōu)于梯度下降法(Gradient descent),如圖8 所示,Adam 每次迭代更新參數(shù)時考慮了上次的迭代梯度信息,調(diào)節(jié)步長,接近全局最優(yōu),而Gradient de?scent 易陷入局部最優(yōu),難以得到最優(yōu)的參數(shù),所以本文采用Adam。
圖7 不同學習率的收斂效果Fig.7 Convergence effect of different learning rates
圖8 兩種優(yōu)化方法的收斂效果Fig.8 Convergence effect of two optimization methods
圖9 是 CLAS?SDAE?WKNN、CLAS?STDRSS?ELM、CLAS?STDRSS?KNN 3 種定位方法在相同實驗環(huán)境下得到的相同數(shù)據(jù)集的定位誤差性能的比較??梢钥闯? 種定位方法的性能 CLAS?SDAE?WKNN 最好,CLAS?STDRSS?ELM次之,CLAS?STDRSS?KNN 最差。其中 CLAS?SDAE?WKNN 4 種手機的平均定位誤差為2.72 m,CLAS?STDRSS?ELM 是 2.89 m,CLAS?STDRSS?KNN 是 3.11 m,CLAS?SDAE?WKNN 比起 CLAS?STDRSS?ELM 提升了 5.9% 的性能,對比 CLAS?STDRSS?KNN 提升了 12.5%。
圖9 3 種定位方法性能比較Fig.9 Performance comparison of three po?sitioning methods
針對原始指紋特征變形的免校準方法難以抑制時空變化引起的指紋小尺度波動,提出一種對原始指紋特征挖掘的免校準方法CLAS?SDAE?WKNN。先采用最強AP 分類和普氏分析的方法處理指紋,構(gòu)建標準化子指紋庫,再把標準化子指紋庫通過SDAE深度網(wǎng)絡訓練得到深度特征子指紋庫,最后利用WKNN 比對深度特征來估計待定位點的位置??偟膩碚f,該方法與標準化指紋庫的方法比較,不僅定位精度有5.9%和12.5%的提高,而且能夠有效緩解設備變化引起的RSS 大尺度差異和減低噪聲帶來的小尺度差異,保持了模型良好的魯棒性能。提高檢測時指紋提取算法和指紋庫匹配算法的計算效率是下一步的研究工作。