張千坤,陳任翔,鐘志剛,周國棟(.中訊郵電咨詢設(shè)計院有限公司,北京 00048;.中訊郵電咨詢設(shè)計院有限公司鄭州分公司,河南鄭州 450007)
根據(jù)定位環(huán)境,無線定位系統(tǒng)可分為2種:室內(nèi)無線定位系統(tǒng)和室外無線定位系統(tǒng),室外無線定位系統(tǒng),主要采用的是GPS 定位[1-2],而室內(nèi)定位主要采用的是無線網(wǎng)[3-5]、藍牙[6]、超寬帶(UWB)[7]等技術(shù)。5G網(wǎng)絡(luò)的大帶寬、低時延、高可靠特性,為業(yè)務(wù)提供必要的網(wǎng)絡(luò)基礎(chǔ),推動業(yè)務(wù)的不斷豐富。業(yè)務(wù)應(yīng)用場所有80%以上在室內(nèi),而室內(nèi)定位由于GPS 信號弱無法滿足室內(nèi)業(yè)務(wù)位置服務(wù)的需求。隨著業(yè)務(wù)的發(fā)展,室內(nèi)定位的需求越來越強烈。由于室內(nèi)環(huán)境復(fù)雜,如物體位置的隨機移動、多路徑散射、電磁干擾等,在室內(nèi)進行精確的目標(biāo)定位相比室外來說要困難得多。因此5G 室內(nèi)場景急需一種定位精度高、復(fù)雜度低,且對設(shè)備以及終端沒有要求的定位方法。
本文首先將采集到的CSI[8]通過逆傅里葉變換轉(zhuǎn)換到時域,在時域進行濾波,消除多徑的影響,然后再將濾波后的CSI轉(zhuǎn)到頻域,在頻域進行加權(quán)求和處理,減少頻率選擇性衰落的影響,得到有效的CSI,同時,為得到更加準(zhǔn)確的CSI 序列,本文還采用灰色預(yù)測模型GM(1.1)[9],對頻域的CSI 序列進行預(yù)測,構(gòu)建新的CSI序列,減少了采集CSI的數(shù)量,降低了計算復(fù)雜度,然后用新的CSI 序列帶入路徑損耗模型進行距離估計。室內(nèi)定位的難點主要在于室內(nèi)路徑損耗模型的建立,傳統(tǒng)的路徑損耗模型主要是基于經(jīng)驗或者確定性方法[10],經(jīng)驗性模型比如對數(shù)-正態(tài)模型,這些模型的參數(shù)都是基于特定的環(huán)境,在比較復(fù)雜的室內(nèi)環(huán)境,效果比較差,確定性模型比如射線跟蹤模型,一般來說可以較好地還原室內(nèi)環(huán)境的傳播特性,但是缺乏計算效率,同時需要室內(nèi)環(huán)境的幾何信息以及材質(zhì)信息,一旦傳播環(huán)境發(fā)生變化就需要重新計算。因此本文基于機器學(xué)習(xí)方法,構(gòu)建新的路徑損耗模型,在室內(nèi)不同的采樣點采集CSI 并計算UE 與天線之間的距離,并將這2 種信息輸入到?jīng)Q策樹構(gòu)建新的路徑損耗模型,用于距離估計。最后結(jié)合多個天線并采用最小二乘法實現(xiàn)用戶的準(zhǔn)確定位(見圖1)。
圖1 定位架構(gòu)
本文采集到的原始CSI 數(shù)據(jù)表征的是頻域上的值,為信道頻率響應(yīng)(CFR),OFDM 通信系統(tǒng)中不同的子載波的CSI可以表示為:
式中:
D——信號的路徑
αk——第k條路徑的信號衰減
τk——第k條路徑的信號傳播時間
fn——載波頻率,fn=f0+nΔf
Δf——相鄰2個子載波之間的頻率差
CSI 可以通過快速傅里葉逆變換(IFFT)變換到時域,表示形式為信道脈沖響應(yīng)(CIR):
式中:
φi和τi——對應(yīng)的相位和時延
如果可以得到時域信號的信道脈沖響應(yīng),便可以區(qū)分不同路徑的信號。本文根據(jù)CSI 的這種特性,對信號進行分離得到主徑信號,提高距離估計的精度。
本文選擇CIR 最大幅值的50%作為閾值,將低于50%的部分濾除從而減少多徑衰減的影響,然后利用快速傅里葉變換(FFT)將時域CSI 轉(zhuǎn)換到頻域。濾波前和濾波后的CSI時域幅值如圖2(a)和2(b)所示。
圖2 濾波前和濾波后的CSI時域幅值
從圖2可以看出,經(jīng)過濾波以后,保留了直射徑以及信號比較強的反射路徑部分,信號比較弱的路徑在時域受到了抑制。
將濾波后的時域CSI 進行FFT 變換得到的頻域CSI幅值如圖3所示。
從圖3中可以看出,CSI在進行時域濾波以后幅值相比濾波前更加穩(wěn)定,可以提高距離估計的精度。
圖3 原始頻域CSI以及濾波后的CSI幅值
2.1.2 頻域幅值衰落補償
由于在5G NR 系統(tǒng)中,帶寬最小為100 MHz,在市區(qū)特別是室內(nèi)環(huán)境下,系統(tǒng)帶寬大于相干帶寬,采集到的CSI數(shù)據(jù)會受到頻率選擇性衰落的影響,如圖4所示。
圖4 CSI幅值信息
圖4 為在同一地點采集到CSI,從圖4 中可以看出不同子載波的幅值相差比較大,如果只選擇最大的CSI 幅值帶入距離估計模型進行計算則會導(dǎo)致較大的距離估計誤差。因此本文選擇聯(lián)合所有的子載波的幅值一起進行距離估計,本文將所有的子載波都賦予不同的權(quán)值,并對加權(quán)以后的所有子載波進行求均值計算得到一個有效的CSI,可以表示為:
最終得到的CSI可以表示為:
式中:
fk——第k個子載波的載波頻率
K——子載波的個數(shù)
f0——信號的中心頻率
e-jφi——第i個子載波的相位
CSIeff,i——第i個子載波的有效CSI
將圖4中采集到的CSI的幅值按照式(4)進行處理得到的有效CSI幅值如圖5所示,相比圖4,圖5的幅值跨度在1以內(nèi),要穩(wěn)定的多。
圖5 有效CSI幅值
灰色系統(tǒng)理論是關(guān)于信息不完全或不確定的系統(tǒng)的控制理論,為了預(yù)測發(fā)展趨勢,可以有效提高建模序列的平滑性。
灰色預(yù)測的基礎(chǔ)是采用灰色預(yù)測模型,本文采用GM(1.1)模型,設(shè)置原始的有效CSI數(shù)據(jù)序列,表示為:
其中n為有效CSI的數(shù)量。
灰色預(yù)測模型的過程如下,首先生成新的數(shù)據(jù)列:
其中a,u為待解系數(shù),分別稱為發(fā)展系數(shù)和灰色作用量。
對累加生成數(shù)據(jù)做均值生成B與常數(shù)項向量:
利用最小二乘法求解灰參數(shù),
將灰參數(shù)帶入式(7),得到
將上述結(jié)果累減還原,即可得到預(yù)測值
根據(jù)灰色預(yù)測模型的式(6)~式(12),可以得到預(yù)測的CSI值為:
得到預(yù)測CSI 值以后,本文采用加權(quán)預(yù)測方法,即:
其中,這里w1和w2根據(jù)測試結(jié)果選取0.5 時,精度最高。
基于機器學(xué)習(xí)的路徑損耗模型主要包括以下幾個步驟。
b)對這些輸入輸出數(shù)據(jù)進行歸一化處理,具體如下:
其中x表示的是需要歸一化的特征值,xN表示的是歸一化后的特征值。
c)模型選擇,本文選擇隨機森林對模型進行訓(xùn)練,如圖6 所示,在室內(nèi)空間設(shè)置N個采樣點,采集天線到終端的距離、天線距離地面的高度以及CSI 作為樣本值D,表示為:
圖6 隨機森林流程圖
yi——第i個采樣點與天線的水平距離
采用有放回的方式每次隨機抽取m個樣本,抽取T次,則可以得到T個子集,記為Di,i=1,2,…,T。
在訓(xùn)練數(shù)據(jù)集所在的輸入空間中,遞歸地將每個區(qū)域劃分為2 個子區(qū)域并決定每個子區(qū)域上的輸出值,構(gòu)建二叉決策樹,具體如下:
選擇最優(yōu)切分變量j與切分點s,求解:
閱讀不是讓學(xué)生記住多少知識,而是在閱讀的過程中最終學(xué)會閱讀。因此,家長在閱讀繪本的過程中可以滲透相關(guān)繪本閱讀的策略,比如,看圖獲取信息并進行推斷,對后來發(fā)生的事進行預(yù)測,閱讀中的自我提問,結(jié)合學(xué)生的實際等。家長們可以根據(jù)自己的優(yōu)勢和特長自主設(shè)計大膽嘗試,讓孩子們充分體驗閱讀帶給他們的快樂,進一步提升他們的閱讀能力,培養(yǎng)他們熱愛閱讀的濃厚興趣和良好習(xí)慣,從而讓孩子們逐漸學(xué)會閱讀繪本,構(gòu)建閱讀力。
遍歷變量j,對固定的切分變量j掃描切分點s,選擇使式(17)達到最小值的(j,s);
用選定的(j,s)劃分區(qū)域并決定相應(yīng)的輸出值:
繼續(xù)對2 個子區(qū)域調(diào)用式(17)和式(18),直至滿足停止條件。
將輸入空間劃分成M個區(qū)域R1,R2,…,RM,生成決策樹:
其中I為指標(biāo)函數(shù)。訓(xùn)練得到?jīng)Q策樹后即可得到室內(nèi)環(huán)境下的路徑損耗模型。
新的預(yù)測值可以對T個決策樹的預(yù)測取平均,表示為:
其中T為決策樹的數(shù)量。
用構(gòu)建的隨機森林模型進行預(yù)測后,需要建立恰當(dāng)?shù)脑u價指標(biāo)來驗證模型的準(zhǔn)確性。在模型驗證時,可以用均方根誤差(RMSE)、平均絕對百分比誤差(MAPE)、平均絕對誤差(MAE)來反映誤差的大小,計算值越小說明模型訓(xùn)練的效果越好。
其中PLq為測量值,PLq′為預(yù)測值,本文采用RMSE和MAE來表征模型預(yù)測的效果。
利用路徑損耗模型,可得到用戶與天線之間的水平距離之間的關(guān)系,在室內(nèi)某一位置采集到CSI以后,可得到用戶與天線之間的距離,聯(lián)合多個天線與用戶之間的距離,對用戶進行定位,假設(shè)有3 臺基站,位置分別為(xa,ya)、(xb,yb)、(xc,yc),根據(jù)幾何關(guān)系得到:
式中:
dab、dbc、dac——目標(biāo)到第1 個AP 與到第2 個AP 的距離之差、目標(biāo)到第2 個AP 與到第3 個AP 的距離之差、目標(biāo)到第1個AP與到第3個AP的距離之差
(xi,yi)表示目標(biāo)的位置點,如圖7所示。
圖7 多基站定位模型
本文采用數(shù)據(jù)集來驗證路徑損耗模型的效果,本文將基于隨機森林的訓(xùn)練模型與基于ANN 的訓(xùn)練模型進行對比,得到的結(jié)果如圖8所示。
圖8 誤差分布
從圖8 可以看出,基于隨機森林訓(xùn)練的模型要優(yōu)于人工神經(jīng)網(wǎng)絡(luò),本文計算這2 種模型的MSE 和MAE并與對數(shù)-正態(tài)模型(log-Distance)進行對比,得到的結(jié)果如表1所示。
表1 3種模型的MSE和MAE對比
本文分別將這3種模型的預(yù)測值與真實值進行對比,得到的結(jié)果如圖9所示。
圖9 預(yù)測值與真實值的對比
從圖9 中可以看出,基于隨機森林的預(yù)測結(jié)果與真實值最為接近,而基于對數(shù)-正態(tài)模型的預(yù)測結(jié)果最差,這是因為對數(shù)正態(tài)模型只是一個經(jīng)驗值,并不能代表室內(nèi)信號傳播的真實情況,誤差相對較大。將預(yù)處理后的CSI輸入到訓(xùn)練好的模型即可得到距離信息,然后聯(lián)合多個天線的水平距離信息即可得到用戶的位置,定位結(jié)果如圖10所示。
圖10 定位結(jié)果
從圖10中可以看出,本文提出的基于機器學(xué)習(xí)的定位效果要明顯優(yōu)于基于對數(shù)-正態(tài)模型,其中對數(shù)正態(tài)模型是在室內(nèi)進行校準(zhǔn)過,所使用的參數(shù)為最優(yōu)參數(shù)。
隨著5G網(wǎng)絡(luò)的開發(fā)和部署,網(wǎng)絡(luò)規(guī)劃對路徑損耗預(yù)測的準(zhǔn)確性、復(fù)雜度和通用性提出了更高的要求。同時路徑損失模型在室內(nèi)定位方面也起著重要的作用,建立距離與能量之間的對應(yīng)關(guān)系對定位的精度有很大的影響?;跈C器學(xué)習(xí)的方法,特別是監(jiān)督學(xué)習(xí),可以建立復(fù)雜的非線性關(guān)系,提高路徑損耗預(yù)測的準(zhǔn)確性。本文提出一種基于機器學(xué)習(xí)的適用于數(shù)字化室分的室內(nèi)定位方法,采集信道狀態(tài)信息數(shù)據(jù),并通過時頻域處理以及灰度預(yù)測模型提高數(shù)據(jù)采集的準(zhǔn)確性、穩(wěn)定性、減少數(shù)據(jù)采集的數(shù)量,并根據(jù)機器學(xué)習(xí)算法在室內(nèi)訓(xùn)練路徑損耗模型,更加真實地反映室內(nèi)的信號傳播特性,仿真結(jié)果表明,該方法相比傳統(tǒng)的對數(shù)-正態(tài)模型預(yù)測精度有很大的提升,將此模型用于距離估計以及定位將極大地的提高定位的精度,同時可以解決目前5G定位中需要設(shè)備之間同步的問題。