姚海云,舒紅,汪善華,曾坤
(1.武漢大學測繪遙感信息工程國家重點實驗室,湖北 武漢 430079; 2. 深圳市地籍測繪大隊,廣東 深圳 518034;3.武漢益士天慧科技有限公司,湖北 武漢 430000)
由于障礙物遮擋、墻壁阻隔和多路徑效應等因素存在以及室內(nèi)環(huán)境極為復雜,全球衛(wèi)星定位系統(tǒng)無法實現(xiàn)室內(nèi)精確定位。近年來,隨著近距離無線通信和移動網(wǎng)絡技術發(fā)展,基于位置的服務(LBS)越來越受到重視[1]。根據(jù)美國環(huán)境保護局報告統(tǒng)計,人們有近70% ~ 90%的時間是在室內(nèi)度過[2]。為了克服衛(wèi)星定位缺陷并實現(xiàn)在室內(nèi)環(huán)境中的精確定位,國內(nèi)外研究人員在室內(nèi)定位中引入了紅外傳播、WLAN、超聲波、射頻識別(RFID)、低功耗藍牙、紫蜂(ZigBee)、無線傳感器網(wǎng)絡(WSNs)等多種技術[3],但是以上技術多數(shù)要布設相應定位設備方可展開定位工作。室內(nèi)定位源合理布設對于最終的定位精度存在很大的影響。文獻[4]將評價衛(wèi)星空間幾何布局結構的定位精度影響的PDOP指標借鑒到UWB技術室內(nèi)定位中,仿真PDOP值研究了室內(nèi)定位測站布設的定位精度影響,結論是合理位置的測站布設會降低環(huán)境對信號的干擾,提高定位精度。本文通過特征向量空間濾波模型分離表達定位源結果的空間自相關獲得更為可靠的定位結果。為了更方便表征定位源的空間布局,仿真的定位源是發(fā)射定位源,即需要布設相應測站的定位源,仿真情景參考現(xiàn)實場景,如應用UWB、Wi-Fi、LED、超聲波、藍牙等一系列定位源定位時均需要布設測站。
1970年,美國地理學家W.R.Tobler提出了“地理學第一定律(Everything is related to everything else,but near things are more related than distant things)”[5],指導著自然地理和人文地理的觀測數(shù)據(jù)分析。室內(nèi)定位中,眾多定位源結果可以看作是多個相關隨機變量的一次實現(xiàn)。同樣,眾多定位源存在一定的空間布局及空間結構效應,可以統(tǒng)計解釋為定位源結果的空間自相關??臻g自相關會導致不同定位源影響系數(shù)(回歸系數(shù))的方差膨脹效應,方差膨脹導致參數(shù)估值的不確定性被低估[6],導致回歸模型正確性檢驗不顯著,定位粗差的誤判性也將大大增加。從定位系統(tǒng)功能角度,定位粗差可近似解譯為系統(tǒng)故障。Griffith(2000,2003)、Tiefelsdorf和Griffith(2007)提出了特征向量空間濾波方法,空間濾波的基本思想是通過對空間鄰接矩陣進行特征向量分解,從中提取一組特征向量作為解釋變量或空間結構代理變量加入模型中,這樣可以保證回歸模型滿足空間獨立性前提假設(非空間自相關假設)[7,8]。該方法最大的優(yōu)勢在于利用這些代理變量有助于空間數(shù)據(jù)空間自相關性識別并分離開來,使得空間結構效應分離后的隨機變量間是彼此獨立的,再使用傳統(tǒng)回歸模型來分析數(shù)據(jù)。空間濾波的思想來源于時間序列濾波的思想,通過不同手段來分離表征時間或空間自相關性??臻g統(tǒng)計及空間計量經(jīng)濟學中,空間濾波(Spatial Filtering)可以看作地理數(shù)據(jù)穩(wěn)健統(tǒng)計方法,構造的數(shù)理算子用于將空間結構效應(正向結構信息或負向冗余影響)、趨勢和噪聲從信號中逐一分離出來,最終獲得更加自然更加準確的統(tǒng)計推斷結果[8]。
本文設定一種定位源布設,在此基礎上展開研究。通過空間鄰接矩陣來表達定位源的空間布局,對空間鄰接矩陣進行特征向量的分解,運用特征向量空間濾波模型來分離定位源空間自相關。仿真結果表明,通過特征向量空間濾波模型,使得用戶定位結果和回歸系數(shù)的估值得到了明顯的提高。本文研究為定位源空間自相關的分離表達提供了一種簡便可行的方法。
空間鄰接矩陣(Spatial Adjacency Matrix,SAM)直接表達了定位源之間的鄰接關系或空間布局。同時,空間鄰接的確定也是度量空間相關性的基礎,猶如集合鄰域定義作為拓撲模型的基礎?;诙ㄎ辉磧蓛煽梢?無信號傳輸遮擋)來定義定位源空間鄰接矩陣。定位源之間可見,則認為它們是空間鄰接(直接鄰接或一階鄰接),設置權重值為1,反之,權重值為0。具體的表達式為:
(1)
其中,i和j是不同的定位源,假設有n個定位源,則空間鄰接矩陣W是n×n階。這里,假設場景存在12個定位源,一種定位源布局如圖1所示,圖中帶有雙向箭頭的線段表示定位源是互相可見的。由定位源布局圖以及式(1)進而可以給出多定位源鄰接矩陣如表1所示:
圖1 室內(nèi)定位定位源布局示意圖
定位源鄰接矩陣 表1
由表1可知,定位源網(wǎng)絡是一個無向圖,SAM是對稱方陣。
特征向量空間濾波模型使用了一組特征向量合成的代理變量,特征向量通過表達多定位源空間結構關系的n×n空間鄰接矩陣W分解獲得,這些代理變量表征并分離了定位源數(shù)據(jù)空間相關性。代理或控制變量加入一個傳統(tǒng)設定模型(線性回歸模型),就可以用于具有空間結構的多定位源變量或觀測變量的數(shù)據(jù)融合分析。
空間統(tǒng)計中,存在兩種空間自相關性建模方式:①空間濾波中空間代理變量的回歸系數(shù);②空間自回歸中Moran系數(shù)。空間濾波中,空間結構代理變量直接來自鄰接矩陣的特征向量分解。自然地,表達空間自相關性的這兩種方法存在內(nèi)在聯(lián)系。
給出n×n空間權重矩陣W,取值為0和1,則隨機變量y的空間自相關度量可以用Moran系數(shù)表示:
(2)
寫成矩陣形式可表示為:
(3)
(4)
進而可解得n個特征值λ=λ1,λ2,…,λn,亦可通過(W*-λI)E=0解得特征向量E,每個特征值λj都有一組對應的特征向量Eij=E1j,E2j,…,Enj,這些特征向量的均值為0,并且互為正交。對于每個獨特的空間組合,Moran系數(shù)由對應的特征值決定:
(5)
多個定位源協(xié)同工作時,單個定位源融合以得到精度更高的用戶定位結果。我們研究應用特征向量空間濾波分離表達不同定位源空間自相關,暫且沒有給定不同類型定位源的具體觀測方程,這里將多元線性回歸模型作為定位源數(shù)據(jù)融合模型。通常,Wi-Fi指紋匹配定位和LED等定位方式下,觀測方程均為線性觀測方程。再者,一般非線性化觀測方程可進行線性化觀測方程。所以這里的定位源數(shù)據(jù)融合模型采用多元線性回歸模型。
假設場景存在6個定位源正常工作,分別記為X1,X2,X3,X4,X5,X6,最終的多定位源數(shù)據(jù)融合的統(tǒng)計模型如下表示:
Y=β1X1+β2X2+β3X3+β4X4+β5X5+β6X6+ε
(6)
其中,ε表示擾動項,假設擾動項為服從獨立同分布的高斯變量,Y表示最終融合的用戶定位結果。
在上述模型中加入空間代理變量后,模型結構調(diào)整為:
Y=β1X1+β2X2+β3X3+β4X4+β5X5+β6X6
(7)
其中,空間代理變量Eq是從W*中提取的向量,γq是空間效應系數(shù)。關于n維定位源向量中提取有代表性的特征向量作為空間代理項,Griffith(2009)給出了一種經(jīng)驗方案,即從所有的特征向量中提取一組特征值大于某一閾值的候選特征向量,該閾值滿足下列Moran系數(shù)條件式(8):
I/Imax>0.25
(8)
上式中I是通過式(5)求出的Moran系數(shù),Imax為Moran系數(shù)最大值。
正如引言中提到的,定位源結果是存在一定空間自相關的。所以在本文研究中,實驗數(shù)據(jù)采用高斯分布空間自相關隨機變量的計算機抽樣隨機數(shù)。由于高斯分布具有線性變換下保持分布規(guī)律不變的性質(zhì),因此多維相關高斯分布隨機數(shù)可以通過協(xié)方差矩陣的Cholesky因子對獨立高斯分布隨機變量抽樣序列進行線性變換來產(chǎn)生[9~14]。令每個變量Xi(i=1,2,…,n) 均為m個隨機數(shù)序列構成的列向量,Xm×n=(X1,X2,…,Xn)為需要產(chǎn)生的n維統(tǒng)計相關的高斯分布隨機變量抽樣序列,其均值為μ=(μ1,μ2,…,μn),協(xié)方差矩陣為:
(9)
則產(chǎn)生隨機變量X的n維相關高斯分布的隨機數(shù)步驟如下:
(1)產(chǎn)生n維獨立標準高斯分布隨機變量隨機數(shù),Ym×n=(Y1,Y2,…,Yn),每個序列的隨機變量隨機數(shù)個數(shù)為m;
(3)進行線性變換,令:
Xm×n=Ym×n·Cv+μm×n
(10)
即可生成n維相關高斯分布隨機變量Xm×n=(X1,X2,…,Xn)抽樣序列。
相對于室外定位,比如在大型商場、電影院、展館、機場等室內(nèi)環(huán)境相當復雜,外界干擾無法控制。運用仿真分析方法可控制上述無法預測的環(huán)境干擾,實現(xiàn)局部環(huán)節(jié)技術的針對性研究。因而,本文研究場景采用仿真的方式實現(xiàn),定位源布局采用2.1中的解決方案。
根據(jù)3.2章節(jié)內(nèi)容生成實驗數(shù)據(jù),假設場景有6個定位源工作,假設它們定位結果均值分別為 0.8 m、1.7 m、1.0 m、0.5 m、1.6 m、0.7 m,定位源融合后均值為 1.0 m。協(xié)方差矩陣為設定的滿足對稱正定7×7矩陣。令式(10)中的m=12,n=7,將X12×7矩陣中的第7列作為多定位源數(shù)據(jù)融合結果,X12×7矩陣中的第1~第6列作為各個定位源結果。生成的這些數(shù)據(jù)均為高斯分布相關隨機變量的樣本,對其應用多元線性回歸分析,顯著性水平α=0.01,得到結果如表2所示:
傳統(tǒng)多元線性回歸模型估計結果 表2
表2中,R2表示判定系數(shù),R2越接近1說明回歸方程越顯著;F表示統(tǒng)計量,F(xiàn)值越大,說明回歸方程越顯著,p值越小說明模型參數(shù)越顯著,RMSE表示多定位源數(shù)據(jù)融合結果的中誤差。
在4.1的基礎上,在一般多元線性回歸變量中根據(jù)式(8)加入空間代理變量,再次進行特征向量空間濾波模型ESF分析,回歸分析結果如表3所示:
空間濾波模型估計結果 表3
以上結果均是在0.01顯著性水平下得到的估計結果。顯然,由表2和表3對比可以看出,在傳統(tǒng)多元回歸模型的基礎上加入空間代理變量后的空間濾波模型,衡量模型擬合優(yōu)度的判決系數(shù)R2從 0.701 9提高至 0.946 7,F(xiàn)統(tǒng)計量從 37.689 5增大到 58.324 9。RMSE從 1.437 4 m降低到 1.121 0 m。其次,空間濾波模型回歸系數(shù)估計值以及回歸系數(shù)置信區(qū)間相對于多元線性回歸系數(shù)估計值以及置信區(qū)間也有所改善。
應用特征向量空間濾波,我們將多定位源空間布局這一重要因素通過空間代理變量加入多元線性回歸模型中,進行多定位源數(shù)據(jù)融合分析。仿真分析表明,在多元線性回歸模型的基礎上加入空間代理變量可分離表征回歸原始解釋變量的空間自相關,消除回歸變量系數(shù)估計的方差膨脹。特征向量空間濾波模型更加顯著(統(tǒng)計模型更加符合實際定位源數(shù)據(jù)結構),融合定位精度得到了進一步提高。
事實上,考慮空間結構信息(空間自相關效應),不僅可以改善統(tǒng)計推斷(參數(shù)估計和假設檢驗)準確性,而且可以優(yōu)化統(tǒng)計抽樣設計(即室內(nèi)定位的定位源網(wǎng)絡布設方案設計)。室內(nèi)定位融合分析(統(tǒng)計推斷)與室內(nèi)定位源布設(統(tǒng)計抽樣)存在辯證關系,優(yōu)化室內(nèi)定位源布局有助于提高室內(nèi)定位精度。下一步,我們將繼續(xù)考慮特征向量空間濾波模型來優(yōu)化室內(nèi)定位源觀測網(wǎng)絡布局。