周牧,龍玥辛,蒲巧林,王勇,何維
(1.重慶郵電大學通信與信息工程學院,重慶 400065;2.重慶郵電大學移動通信技術重慶市重點實驗室,重慶 400065)
隨著移動互聯(lián)網(wǎng)時代向物聯(lián)網(wǎng)時代的逐步發(fā)展,基于位置的服務(LBS,location-based service)得到了越來越廣泛的應用。全球定位系統(tǒng)(GPS,global positioning system)[1]和蜂窩定位系統(tǒng)[2]是目前最成熟的2 種室外定位系統(tǒng),它們可為室外用戶提供準確的位置信息,但由于室內環(huán)境的復雜性以及人員走動對信號傳播的影響,用戶在室內難以穩(wěn)定地接收來自衛(wèi)星和蜂窩基站的信號。為此,眾多學者展開研究并提出了射頻識別定位系統(tǒng)、ZigBee定位系統(tǒng)、藍牙定位系統(tǒng)、Wi-Fi 定位系統(tǒng)等多種室內定位系統(tǒng)。其中,由于Wi-Fi 網(wǎng)絡具有部署成本低、環(huán)境適應性強、覆蓋范圍廣等優(yōu)勢,Wi-Fi室內定位系統(tǒng)[3]得到了廣泛應用。
Wi-Fi 室內定位系統(tǒng)通常使用2 種測量特征:接收信號強度(RSS,received signal strength)和信道狀態(tài)信息(CSI,channel state information)。RSS指紋特征維數(shù)低且空間分辨率低,導致定位精度低。相比于RSS,CSI 包含了信號傳輸過程中更細粒度和多樣化的物理層信息(如多通道子載波相位和幅度信息),可用于刻畫信號散射、衰落和功率隨距離衰減的綜合效應,從而被廣泛應用于Wi-Fi高精度定位系統(tǒng)。近年來,國內外學者提出了基于幾何、基于指紋以及基于數(shù)據(jù)融合等的多種CSI 室內定位技術,其中,基于CSI 指紋的室內定位技術因其處理效率高、抗干擾性強、定位精度高等優(yōu)點得到了廣泛應用,但仍然面臨諸多挑戰(zhàn)。
首先,由于手機采集的CSI 相較于RSS 來說,更容易受到環(huán)境的影響,穩(wěn)定性較差,因此需要進行降噪處理。早期的局部平滑濾波算法,如高斯濾波[4]和均值濾波[5],通過平滑處理來去除噪聲,但這類方法難以處理圖像的紋理信息等非平滑部分,所以不能在降噪的同時有效保留紋理信息。空域降噪算法[6]以隨機噪聲的零和特點為理論基礎進行降噪處理,但其主要針對隨機噪聲的降噪,而未去除因設備缺陷導致的一些脈沖噪聲。考慮到矩陣的表示形式容易破壞數(shù)據(jù)的原始空間結構,文獻[7]提出了一種基于非局部相似的非負Tucker 分解方法,實現(xiàn)了空間域的非局部相似性和光譜域的全局相似性。該方法利用非局部相似性,在合適的窗口大小下,將高光譜圖像中提取的三維全波段斑塊進行分組并形成三階張量。實驗結果表明,該方法在減少計算量的同時提高了高光譜圖像的質量。
其次,降噪后的CSI 中稀疏分布著有用的結構和成分,為了提取其隱含的特征,需要進行特征提取。文獻[8-9]提出一種主體組合成分分析和線性決策分析的方法來提取最相關的特征向量以減少維數(shù)。文獻[10]提出了一種基于二維離散小波變換的跨域尺度變換方法,在對序列圖像進行二維小波變換獲得主要特征點的同時,實現(xiàn)了數(shù)據(jù)的降維和噪聲抑制;構造了一種新的歸一化相關代價函數(shù),并利用黃金分割算法高效地找到最優(yōu)旋轉角速度。但由于二維小波變換僅著眼于數(shù)據(jù)的頻域相關特性,忽略了時域?頻域之間的潛在關系和重要的判別信息,因此其無法適用于三維CSI 的高低頻信號變化信息的特征提取。
另外,基于CSI 指紋的定位技術在室內定位領域受到了廣泛關注,如何利用CSI 實現(xiàn)高精度的室內定位成為眾多學者研究的方向。文獻[11]提出了一種基于CSI 幅值指紋的窄帶物聯(lián)網(wǎng)定位算法,其采用多維標度分析方法計算目標點與參考點之間的歐氏距離和時間反轉共振強度,然后采用K 近鄰(KNN,K nearest neighbor)算法進行位置估計。多維標度分析方法通過直觀的空間圖再現(xiàn)研究對象之間的關系,它的缺陷在于認為各維度對目標的貢獻相同。文獻[12]提出了一種基于位置不確定性約束的機器人室內定位方法,并利用貪婪算法來求解優(yōu)化問題。但貪婪算法依賴于當前已經(jīng)做出的選擇,所以其無法保證得到最優(yōu)解。文獻[13]提出利用矢量格式的CSI 數(shù)據(jù)作為位置指紋,再將三層半連接神經(jīng)網(wǎng)絡和一層全連接神經(jīng)網(wǎng)絡相組合用于位置估計。然而,當面對較復雜的非線性問題時,神經(jīng)網(wǎng)絡容易產生收斂速度慢、網(wǎng)絡不穩(wěn)定和陷入局部最優(yōu)等一系列問題。
針對上述問題,本文提出了一種基于CSI 張量分解的室內Wi-Fi 指紋定位方法,方法流程如圖1 所示。
鑒于三階張量可以描述CSI 的信息和結構,本文采用張量的形式來表達復雜的CSI。其目的在于保留數(shù)據(jù)原有形式的同時,最大限度地保留圖像內在的結構信息,通過建立一種以多維度分析為主線的張量處理框架,實現(xiàn)張量的降噪處理和特征提取,提升數(shù)據(jù)處理分析的能力。
一般地,智能手機采集到的原始CSI 可表示為一幅X軸為子載波、Y軸為數(shù)據(jù)包且Z軸為CSI 幅值的三維圖像[14],如圖2 所示,子載波、數(shù)據(jù)包、CSI 幅值的數(shù)量分別為L1、L2、L3。由于子載波的CSI 幅值在不同時刻的波動較大且容易受到環(huán)境的影響,導致原始CSI 的三維圖像中出現(xiàn)了較多的奇異值,進而影響指紋庫的構建甚至定位的性能,因此需對原始CSI 進行降噪處理。
本文將原始CSI 三維圖像表示為一個二元三階張量(其元素僅包含0 和1)。具體而言,令張量的形狀為[L1,L2,L3],即第i(i=1,…,3)維(或稱“階”)有Li個元素,將該張量記為O∈RL1×L2×L3,并通過秩一張量的線性組合將其表示為
其中,μr(∈RL1)、υr(∈RL2)和ωr(∈RL3)分別為第r(r=1,…,M)個秩一張量在含噪張量O的3 個維度上分解得到的單位向量;符號°表示向量的外積運算;λ為第rr個秩一張量的組分奇異值,其刻畫了第r個秩一張量的組分在整體中的比重;M為用于重構O的秩一張量的個數(shù)。
為了利用CSI 的時域?頻域互補信息,在保持幅值連續(xù)性的同時實現(xiàn)高保真降噪的目的,本文提出基于平行因子(PARAFAC,parallel factor)分析模型的張量分解算法(如圖3 所示)來估計用于重構O中無噪張量S(即S=O?N)的秩一張量的個數(shù)(即分解級數(shù))k,其中,N為張量O中的噪聲。由于該算法未對各維度進行平滑處理,因此沒有引入額外的信息,保持了圖像時域?頻域的一致性,其相較于其他張量分解算法,可以取得更好的降噪效果以提升圖像質量。此外,k的表達式為
其中,SNR 為張量O的信噪比(即信號和噪聲的強度比),Li和Ki分別為張量S中第i維度的維度數(shù)和張量秩。
由于SNR 等價于信號和噪聲的方差比,因此本文對含噪張量O分塊進行信號和噪聲的方差估計。先將張量O分成A個體積相等的子張量,再將每個子張量分為B個體積相等的局部張量。將第f(f=1,…,A)個子張量的方差表示為,其中,為第f個子張量中第e個局部張量的灰度值,為第f個子張量的平均灰度值,則噪聲方差的估計值可表示為
其中,為第f個子張量的方差,為A個子張量的方差的平均值。此時,信號方差的估計值可表示為
于是,可得
為了得到無噪張量S在第i維度上的張量秩Ki,本文根據(jù)赤池信息準則(AIC,Akaike information criterion)[15-16]進行估計,其估計式(具體推導過程見附錄1)為
張量S在3 個維度上的展開過程如圖4 所示,為了使重構的無噪張量S盡可能逼近理想無噪張量,本文令兩者之間的均方根誤差最小,即。同時,考慮到張量模型中各維度的秩一張量可在求解中合并為因子矩陣,本文采用交替最小二乘(ALS,alternate least squares)迭代算法[17]來求解上述最優(yōu)化問題。為此,令迭代次數(shù)為t,第t次迭代得到的各維度因子矩陣分別為和,且第t次迭代得到的權矩陣為。ALS 迭代算法的基本思路為固定2 個矩陣來求解剩余矩陣,本文選擇固定矩陣V和W來求解矩陣U。由于3 個因子矩陣均未知,現(xiàn)初始化因子矩陣為全1 矩陣,權矩陣Λ0為單位矩陣。將第t?1 次迭代結果的第 1 維度展開矩陣表示為,則第t次迭代得到的加權因子矩陣分別為
利用更新后的因子矩陣可得重構第t次迭代結果為
降噪后的張量中稀疏分布著有用的結構和成分,為了找到其隱含的結構和成分,需對張量進行特征提取,以找到具有一定物理意義的數(shù)據(jù)表示。然而,現(xiàn)有的特征提取算法主要著眼于二維數(shù)據(jù)的頻域相關特性,忽略了時域?頻域存在的潛在關系,損失了重要的判別信息。因此,本文引入張量小波分解算法來獲取子載波、數(shù)據(jù)包以及CSI 幅值這3 個維度上的高低頻信號變化信息來實現(xiàn)CSI 特征提取。張量分解后得到的高低頻分量的關系為
其中,符號⊕和?分別表示張量的直和運算和克羅內克積運算,L和H分別表示作用于X、Y和Z這3 個維度上的離散小波低通和帶通濾波器。此時,將得到的八組小波子成分分別記為LLL、LLH、LHL、LHH、HLL、HLH、HHL和HHH。
其中,Pm(i,j,k)為小波子成分中位于(i,j,k)處的元素值。由于張量小波子成分所包含的多方向和多頻率信息已被文獻[18]證明能夠提供類別判別信息,因此本文將其應用于構造CSI 位置指紋。具體而言,構造第n(n=1,…,Nf)個參考點處的CSI 位置指紋為,其中,Nf為參考點的個數(shù),為第n個參考點處第m組小波子成分的小波系數(shù)。CSI 降噪處理及特征提取過程如算法1 所示。
算法1CSI 預處理算法
CSI 指紋定位方法包括2 個階段:離線階段和在線階段。離線階段設置參考點并進行CSI 的采集和預處理以得到標簽樣本(含參考點的CSI 位置指紋和位置坐標),然后建立定位模型;在線階段設置測試點并進行CSI 的采集和預處理以得到待定位樣本(含測試點的CSI 位置指紋),然后將其代入定位模型以得到測試點的位置坐標估計。
為了研究CSI 位置指紋和位置坐標之間多重相關變量的相互依賴關系,本文以參考點的CSI 位置指紋為自變量且位置坐標(x n,yn)為因變量,利用偏最小二乘回歸(PLSR,partial least squares regression)算法進行多因變量對多自變量的線性回歸建模。PLSR 算法不僅可以解決典型相關分析中無法獲得自變量到因變量直接映射的問題,又可避免多元線性回歸分析中因為自變量之間存在相關性而導致的過擬合問題。
為了求解w1和c1,引入拉格朗日乘子L為
分別對w1和c1求偏導并令其為0,得到
經(jīng)推導,可得w1和c1分別為對稱矩陣XTYYTX和YTXXTY的最大特征值所對應的單位特征向量。將求解后的w1和c1分別代入t1=Xw1和u1=Yc1,可得X和Y的第一對主成分t1和u1。
為了解決從X到Y的映射問題,根據(jù)主成分回歸思想將X和Y分別對它們的主成分t1和u1進行回歸建模,得到,其中,E1和G1為殘差矩陣。將X中主成分t1不能解釋的殘差矩陣E1作為新的X,且Y中主成分u1不能解釋的殘差矩陣G1作為新的Y,不斷提取新的主成分,直到主成分數(shù)量達到上限(即X的秩),算法結束。令算法結束時共得到a對主成分,則可將初始X和Y分別表示為
本文實驗分別在走廊(即場景1)和實驗室(即場景2)中進行,如圖5 所示。場景1 和場景2 的面積分別為42.08 m×3.12 m和22.72 m×8.04 m。圖5 中,圓點表示參考點(RP,reference point),三角形表示測試點(TP,test point)。場景1 和場景2中各設置了40 個RP,并隨機設置了6 個和8 個TP。本文實驗選擇商用D-Link 作為無線接入點(AP,access point)以及裝有Nexmon 測試平臺的Google Nexus 6 智能手機作為接收端。在每個位置處,接收端采集300 個包含64 個子載波(帶寬為20 MHz)的CSI 數(shù)據(jù)包,并將采集到的CSI 轉換為一個二元三階張量以進行降噪處理和特征提取。
在不同場景中采集到的CSI 受到不同程度的噪聲干擾,導致某些子載波在不同時刻采集到的CSI幅值出現(xiàn)較大偏差,且由于手機采集到的CSI 本身具有波動幅度大、穩(wěn)定性差等問題,因此本文實驗需對原始CSI 數(shù)據(jù)進行子載波篩選。原始CSI 分布如圖6(a)和圖6(b)所示,圖6 中“+”表示在采樣過程中CSI 幅值出現(xiàn)極值的情況,“箱線”表示各子載波的CSI 幅值分布,其從上到下依次表示CSI幅值的最大值、上四分位值、中位值、下四分位值和最小值。由于場景1 相對空曠,人員流動少,因此相比于場景2,在場景1 中采集到的數(shù)據(jù)受到噪聲的干擾更小,極值也更少。為了在降低計算開銷的同時剔除幅值偏差較大的子載波,本文篩選出采樣過程中幅值方差的均值最小的30 個最優(yōu)子載波,如圖6(c)和圖6(d)所示。由圖6 可知,經(jīng)過篩選后各子載波的CSI 幅值分布更加集中,極值也更少。
本文引入小波降噪算法作為對比算法,選擇的小波基及其設置的分解層數(shù)N分別為:Haar(N=5)、Coiflet3(N=1)、Symlet8(N=8)。另外,在實驗過程中,這3 種算法閾值選取都采用固定閾值估計,閾值函數(shù)都選用硬閾值,并規(guī)定了閾值處理不隨噪聲水平變化。將篩選后的CSI 分別采用本文提出的基于PARAFAC 分析模型的張量分解算法和傳統(tǒng)的小波降噪算法(如Haar 小波降噪、Coiflets 小波降噪和Symlets 小波降噪)進行降噪處理,得到圖7 和圖8所示的降噪效果??梢钥闯?,經(jīng)本文算法處理得到的圖像更加平滑,CSI 幅值分布更加集中,偏差也更小,由此說明本文算法的降噪效果優(yōu)于其他3 種算法。為了更準確地比較和分析不同算法的降噪性能,本文采用SNR、均方誤差(MSE,mean square error)以及峰值信噪比(PSNR,peak signal noise ratio)3 個參數(shù)對2 種場景下采用不同算法進行降噪處理的性能進行評估,如圖9 所示。
由圖9 可知,分別在場景1 和場景2 中采集到的數(shù)據(jù)經(jīng)本文算法處理后的CSI 圖像的SNR 分別為64.7 dB 和61.8 dB,相比于原始CSI 圖像的SNR,提升了15 dB 以上;MSE 分別為6.21 和6.20,較傳統(tǒng)小波降噪算法,經(jīng)本文算法處理后的圖像更接近于理想無噪圖像;PSNR分別為40.20 dB 和40.21 dB,進一步證實了本文算法具有更好的降噪性能。分別對比同一場景下不同算法的性能參數(shù)可知,針對場景1中采集到的數(shù)據(jù),選用本文算法或Symlets 小波降噪算法[20]進行降噪處理的性能更優(yōu);而針對場景2中采集到的數(shù)據(jù),選用本文算法或Haar 小波降噪算法[21]進行降噪處理的性能更優(yōu)。由此進一步驗證了本文算法在2 種場景下都具有更優(yōu)的降噪性能。
圖10 對比了各小波子成分在不同數(shù)據(jù)包個數(shù)下所對應的ASM 值分布,可見經(jīng)張量小波分解得到的不同位置處同一小波子成分的ASM 值分布是相對集中的,且由于小波子成分HHH作為細節(jié)分量包含了分解前CSI 的絕大部分信息,因此當選取不同個數(shù)的數(shù)據(jù)包時,小波子成分HHH的ASM 值為8 個小波子成分中最大的,并隨著數(shù)據(jù)包個數(shù)的增加,相同數(shù)據(jù)包個數(shù)下不同小波子成分ASM 值的差值增大。
4.4.1 定位誤差分析
在保留本文所提其余算法的情況下,本節(jié)依次更換了降噪處理、特征提取和定位階段的算法來分析本文中3 種主要算法(即PARAFAC、張量小波分解和PLSR)對定位性能的影響,如圖11 所示。
基于PARAFAC分析模型的張量分解算法在去除噪聲分量的同時,最大限度地保留了數(shù)據(jù)內在的結構信息。圖11(a)比較了在RP 取不同個數(shù)的情況下,分別經(jīng)本文算法降噪處理和無降噪處理時的定位誤差累積分布函數(shù)(CDF,cumulative distribution function)。當RP 個數(shù)相同時,經(jīng)本文算法進行降噪處理后的定位性能明顯優(yōu)于無降噪處理時的定位性能,且隨著RP 數(shù)的增加,算法的定位性能也越好。歸其原因,在于當RP 數(shù)越多時,經(jīng)降噪處理和特征提取后得到的標簽樣本也越多,于是基于更多的樣本進行回歸建模所得到的模型將更接近于真實模型,進而最終的定位結果也會更加準確。圖11(b)比較了選用不同降噪算法時的定位CDF。觀察可知,本文算法在定位誤差為4 m 時的置信概率(即CDF 的值)為94.88%,高于其他3 種小波降噪算法的置信概率,分別為91.52%、85.88%和80.21%。
由圖11(c)可知,相較于方向梯度直方圖(HOG,histogram of oriented gradient)特征算法[22](定位誤差為4 m 時置信概率為84.84%)和局部二值模式(LBP,local binary pattern)特征算法[23](定位誤差為4 m 時置信概率為83.08%),采用本文算法進行特征提取將對定位性能的提升提供更大幫助。此外,由圖11(d)可知,本文算法在定位誤差為4 m 時的置信概率(即94.88%)優(yōu)于加權K 近鄰(WKNN,weighted K nearest neighbor)算法[24]的 84.9%(Np=3)、88.54%(Np=5)、82.72%(Np=7)和79.97%(Np=9),近似最佳三角形內點測試(APIT,approximate perfect point-in-triangulation test)算法[25]的81.97%以及貝葉斯(Bayes)算法[26]的73.14%,其中,Np 表示鄰近點個數(shù)。
4.4.2 時間開銷分析
除了定位誤差以外,時間開銷也是評估定位性能的重要指標。不同RP 數(shù)下4 種定位算法的運行時間如表1 所示,用于定位的RP 數(shù)越多,對應的運行時間也越長。但無論有多少個RP,本文所提PLSR 算法的運行時間都是最短的。以RP=40 為例,此時WKNN、APIT 和Bayes 算法的運行時間分別為0.83 s、0.75 s 和0.74 s,均大于本文算法的運行時間0.67 s,這表明本文算法在計算復雜度方面比WKNN、APIT 和Bayes 算法更有優(yōu)勢。
表1 不同RP 數(shù)下4 種定位算法的運行時間
本文提出采用張量的形式來表達CSI 的優(yōu)勢在于,保留數(shù)據(jù)原有存在形式的同時最大限度地保留了圖像內在的結構信息。本文首先研究了基于PARAFAC 分析模型的張量分解算法和ALS 迭代算法相結合用于降噪處理的可行性;然后,利用張量小波分解算法在CSI 的3 個維度上進行小波分解實現(xiàn)特征提取,有效降低了CSI 維數(shù)并得到CSI 位置指紋;最后,基于PLSR 算法建立定位模型,對位置坐標進行預測,進而實現(xiàn)定位。實驗結果表明,本文算法在定位誤差3.5 m、4 m 和4.5 m 內的置信概率分別為89.81%、94.88%和98.05%,均明顯優(yōu)于其他現(xiàn)有算法,由此驗證了本文提出的基于CSI張量分解的室內Wi-Fi 指紋定位方法在提升數(shù)據(jù)處理分析能力和擬合CSI 位置指紋和位置坐標關系的同時,還具有更優(yōu)的定位性能。
基于Tucker分析模型的CSI降噪處理是一個值得研究的問題,下一步工作將對該問題進行深入探討;此外,CSI 圖像的灰度共生矩陣是進行特征提取的有力工具,但它不能直接提供進行類別判斷的特性,所以作者還將在灰度共生矩陣的基礎上研究用于定量描述圖像特征的統(tǒng)計屬性,并由這些統(tǒng)計屬性來構造用于室內Wi-Fi 指紋定位的CSI位置指紋。
附錄1 式(6)推導過程
將式(6)改寫為
為了求解張量秩K,需從可供選擇的模型中選擇AIC值最小的模型。AIC 的構造如下
假設噪聲是與信號無關的均值為0 的高斯隨機過程,則噪聲的協(xié)方差矩陣可表示為σ2I。為了確定r(r≤min (L,N))的值,構造模型x=As+n,其中,矩陣A∈RL×r,向量s∈Rr×1。于是,可得模型的協(xié)方差矩陣R=Ψ+σ2I,矩陣Ψ=ASAH,信號的協(xié)方差矩陣S=E(ssH)。假設矩陣A為列滿秩,則A(Φj)線性無關,并假設矩陣S為滿秩,則Ψ秩為r,那么Ψ的L?r個最小特征值等于0。矩陣R∈RL×L的各特征值之間的關系為λ1≥λ2≥…≥λL,其中,最小的L?r個特征值等于σ2,即λr+1=λr+2=…=λ L=σ2,前r個特征值對應的特征向量表示為Vj。
r的值可由矩陣R的最小特征值的多重性(即個數(shù))推測得到,但實際上協(xié)方差矩陣R是未知的,所以基于線性代數(shù)中的譜表示定理,將R( r)=Ψ(r)+σ2I中的R(r)表示為,模型的參數(shù)向量表示為。利用最大似然估計算法來計算已知樣本X={x1,…,xN}所對應的參數(shù)向量。因此,計算樣本的聯(lián)合概率密度為
步驟 2求解Num。由于Θ(r)中參數(shù)個數(shù)為(r+1 +2Lr),則此時的自由度為(r+2Lr),又由于Θ(r)中自由參數(shù)的個數(shù)等于由Θ(r)所張成的空間的自由度,因此需對特征向量進行正交化和標準化處理,可得
觀察可知,式(31)中的未知量僅為r。于是,可通過調整r∈{0,…,L?1}的取值來改變AIC 的值,AIC 取得最小值時所對應的r即張量秩K。