彭戀戀
對于優(yōu)化工作來說,移動用戶的體驗與切換成功率密切相關,而準確的數(shù)據(jù)是保障優(yōu)化工作正常進行的關鍵。基于對3GPP協(xié)議、用戶體驗等的不同理解,不同廠家的設備,采集的數(shù)據(jù)及指標算法各有特色。以某市聯(lián)通為例,目前其設備廠商有兩家。兩個設備廠商所采集的數(shù)據(jù)被用于優(yōu)化中的日常監(jiān)控及考核,因此,其所表征的用戶體驗是否一致,數(shù)據(jù)惡化所反饋的問題是否相同,考核的門限對兩家是否公平等,都需要優(yōu)化工作對所涉及的重要數(shù)據(jù)進行深入分析及研究。本文基于某市聯(lián)通現(xiàn)網(wǎng)情況,以體現(xiàn)覆蓋的切換指標為例,分析了其在兩個設備廠家的算法差異及影響,并針對該部分差異,提出相應的優(yōu)化建議。
LTE基本為同頻組網(wǎng),因此在移動過程中,小區(qū)與小區(qū)間的切換大都屬于同頻切換。而也正是因為如此,物理邊緣上的干擾易惡化,而加上覆蓋易重疊,使得該部分用戶的體驗相對較差,故對切換的優(yōu)化勢在必行。為了更精準地完成切換的優(yōu)化,本節(jié)對兩個設備廠家的切換算法進行了深入研究。而異頻在信令層面的流程基本與同頻類似,因此不做討論。
當用戶處于連接態(tài)的移動過程中,與其連接的小區(qū)將發(fā)生變化,為保證業(yè)務的不中斷,終端會選擇質(zhì)量最好小區(qū)執(zhí)行切換操作。目前,LTE網(wǎng)絡主要有基于網(wǎng)絡覆蓋、負荷、業(yè)務等的硬切換。切換的目標小區(qū)通過測量報告(MR)篩選得到,MR分為周期性測量與事件性測量,切換的測量屬于后者。
最常見的事件A3是同頻切換的判決條件[1]。當測量滿足該條件時,終端則會通過S1口或X2口發(fā)出切換請求。其中基站間的切換是通過X2口完成的。對基于A3事件的切換,3GPP協(xié)議TS 36.331規(guī)定如下[2]:
圖1 基站間切換信令流程
其中,n代表目標鄰區(qū),p代表主服務小區(qū)。若測量數(shù)據(jù)為RSRP,由式(1)可知,目標鄰區(qū)與主服務小區(qū)之間的強度差值由6個參數(shù)(偏置、遲滯等)決定。這些參數(shù)會由優(yōu)化人員根據(jù)現(xiàn)網(wǎng)實際話務模型及網(wǎng)絡情況進行調(diào)整,以達到更加平滑的切換效果,避免乒乓切換等問題。
以基站間切換為例,滿足以上條件后,網(wǎng)絡按圖1所示流程,發(fā)起切換。
目標小區(qū)收到切換請求后,進行資源評估后回復確認,eNB向UE發(fā)送攜帶mobilityControlInfo的“RRC連接重配置”消息,指示小區(qū)間同頻切換出執(zhí)行請求。eNB收到MME發(fā)送的“UE上下文釋放命令”消息[3]或目標eNB發(fā)送的“UE上下文釋放”消息[4],指示同頻切換出成功。因此,同頻切換的基本定義為:
各廠家根據(jù)基本定義及協(xié)議規(guī)定的統(tǒng)計點,結(jié)合自身特色,完成對應廠家指標的數(shù)據(jù)采集及實現(xiàn)。下文將以某市聯(lián)通的廠家A和廠家B為例具體分析。
小區(qū)級KPI指標數(shù)據(jù)的統(tǒng)計在硬件實現(xiàn)上以基站為單位,在不同的信令點布置不同的計數(shù)器進行打點。根據(jù)協(xié)議規(guī)定及運營商的各類規(guī)范,多個計數(shù)器組合運算,形成指標。協(xié)議規(guī)定,同頻切換的請求次數(shù),以源站點向UE發(fā)送的攜帶mobility Control Info的RRC連接重配置消息為統(tǒng)計點,基站內(nèi)切換的成功次數(shù)以目標基站收到UE發(fā)送對應的RRC連接重配置完成為統(tǒng)計點,基站間切換的成功次數(shù)則以目標eNB發(fā)送的“UE上下文釋放”消息為統(tǒng)計點。根據(jù)以上描述,廠家算法的實現(xiàn)如下:
(1)廠家A公式:
式(3)中采用了廠家原始的英文counter名,pm表示性能,H表示切換,Exe表示執(zhí)行(或者激活),IntraF表示同頻,Att表示請求(或者嘗試)。故pmHoExeSucccLteIntraF為LTE同頻切換成功次數(shù),pmHoExeAttLteIntraF為LTE同頻切換請求執(zhí)行次數(shù)。基站間的切換部分信令流程圖如圖2所示。式(2)中的計數(shù)器統(tǒng)計點在圖中都有呈現(xiàn)??梢钥吹?,其計數(shù)規(guī)則與3GPP協(xié)議規(guī)定相符,且切換的成功次數(shù)和請求次數(shù)都有更小粒度的分QCI統(tǒng)計,能為優(yōu)化分析提供了更有針對性的數(shù)據(jù)。
(2)廠家B公式如式(4)所示,其中,L代表LTE網(wǎng)絡,HHO表示切換,IntraeNB及IntereNB分別表示基站內(nèi)和基站間,IntraFreq表示同頻,ExecAttOut表示切換嘗試(或者請求),ReEst2Src表示重建回源小區(qū)。故L.HHO.IntraeNB.IntraFreq(IntereNB).ExecSuccOut(ExeAttOut)為基站內(nèi)(基站間)同頻切換成功(請求)次數(shù),L.HHO.IntraeNB(IntereNB).IntraFreq.Succ.ReEst2Src為基站內(nèi)(基站間)切換中成功重建回源小區(qū)的次數(shù)。對于統(tǒng)計點,從信令流程圖看廠家B與廠家A完全一致,不再贅述。
單純從算法公式上看,相對于廠家A,廠家B的切換公式將基站間及基站內(nèi)的切換統(tǒng)計分開了,特別需要注意的是,它還減去了基站間和基站內(nèi)切換失敗但通過重建回到源小區(qū)的次數(shù)。該操作也說明,切換的打點計算存在切換內(nèi)重建計算的區(qū)分。而這部分在廠家A的公式中并未體現(xiàn),也無法直接判斷其是否包含,需從信令層面進行打點解析驗證。
圖2 基站間切換counter統(tǒng)計流程
圖3 同頻切換成功率分廠家數(shù)據(jù)統(tǒng)計圖(15點)
在信令解析前,從數(shù)據(jù)層面進行差異驗證。根據(jù)以上公式從后臺提取相關數(shù)據(jù),對數(shù)據(jù)進行了分析處理。目前,全網(wǎng)小區(qū)的切換成功率都是根據(jù)以上公式計算而來。
本文從現(xiàn)網(wǎng)數(shù)據(jù)著手,進行了初步分析,統(tǒng)計了連續(xù)兩周每日15點的全網(wǎng)同頻切換成功率數(shù)據(jù),結(jié)果如圖3所示。
由圖3可知,廠家數(shù)據(jù)沒有交疊,存在明顯的平行差。廠家B的切換成功率平均比廠家A大2.5%左右。從概率角度出發(fā),在數(shù)據(jù)量足夠大的情況下初步推斷,兩者算法上存在一定的差異。且從公式表達來看,廠家A在重建部分的考慮是否與廠家B一致不得而知。為了解決以上疑問,下文從信令實例等方面進行了解析驗證,并分析了其影響。
指標counter的打點,底層原理上是以特定的信令為計算點來實現(xiàn)的,故本文解析了部分原始信令文件,從打點時間及打點信令詳解分析算法的細節(jié)。
以15點的廠家A廠家信令文件為例進行解析(時間節(jié)點需往后延8小時):用logtool工具解析了15點到15點15分的文件,然后以ueRef為標識,篩取了其中一個用戶的信令。在同一個業(yè)務過程中,該標識不會變化。解析出的文件結(jié)果如圖4所示,解析結(jié)果按時間順序以一個個事件(event)為單位呈現(xiàn)。
信令一共64行,描述了該UE從RRC接入到切換到重建的過程。從第44行開始,UE測量鄰區(qū)并請求通過X2口進行切換,切換成功響應,在35 s的時候,UE發(fā)起RRC重配置的請求,但在38 s前,并未收到重配置完成的消息。
圖4 信令文件解析結(jié)果
圖5 INTERNAL_PROC_HO_EXEC_X2_OUT內(nèi)容詳解
UE開始嘗試進行重建恢復連接。圖4中的INTERNAL_PROC_HO_EXEC_X2_OUT事件內(nèi)容顯示,重建切換執(zhí)行失敗。因此,由該實例可知,廠家A的重建發(fā)生在切換后,不計入切換成功次數(shù)。且從圖3的時間點可知,重建發(fā)生在現(xiàn)網(wǎng)切換定時器T304規(guī)定的時間(2 000 ms)后,即切換失敗且定時器T304超時后,UE才會通過重建連接到小區(qū)。
解析廠家B信令的流程一致,根據(jù)解析結(jié)果,結(jié)合counter定義可知,UE一旦切換失敗,在不考慮T304是否超時的情況下就會進行重建。且重建成功計入切換成功次數(shù)中,故在公式中減去了重建到源小區(qū)的次數(shù)。但由于重建到目標小區(qū)的消息中,沒有攜帶源小區(qū)的切換信息,故無法減去該部分數(shù)據(jù)。
日常的優(yōu)化及考核,切換是重點指標之一。根據(jù)上文所述,兩個廠家在算法上有一定的差異,表現(xiàn)在重建的時間點和統(tǒng)計上。為了分析該差異的影響,我們統(tǒng)計了某天內(nèi)廠家A的重建在切換失敗中所占的比例,如表1所示。
從表1可知,占比最大的切換失敗原因值為RRC的重建。由于該部分的重建與其他原因引起的重建無法區(qū)分,因此我們考慮全網(wǎng)的RRC重建成功率,目前大約80%左右。廠家A的切換指標中加上這一部分的成功次數(shù),指標將有一定的提升。由于廠家B的公式中減去了重建回源小區(qū)部分,故我們解析了信令文件,手動統(tǒng)計了所有切換失敗導致重建成功次數(shù)中,重建回目標小區(qū)和重建到源小區(qū)的比例如圖6所示:
表1 切換失敗原因值統(tǒng)計
圖6 重建類型占比
由圖6可知,在廠家A的切換過程中,目標小區(qū)重建的比例達到38.83%。因此,這部分數(shù)據(jù)的影響對指標的影響不容小覷。為了更直觀地看看這部分數(shù)據(jù)在日常監(jiān)控中的影響,本文選取了一個小區(qū)的數(shù)據(jù)進行分析。表2是小區(qū)A連續(xù)三天的切換指標值:
表2 同頻切換指標修正案例
在數(shù)據(jù)修正前,按照目前公式計算,小區(qū)A的切換成功率指標都在95%以下。小區(qū)A在該時間點前,因為弱覆蓋,在連續(xù)一周切換成功率低于80%的情況下,被定義為差小區(qū)。目前的指標值是在優(yōu)化工作完成后的顯示值,但差小區(qū)處理完成的標準為95%以上。而數(shù)據(jù)修正后,即加上重建成功部分,指標值得到了很大的改善。
由此可見,算法的差異會帶來優(yōu)化工作效率的降低,在廠家未解決產(chǎn)品修正的情況下,建議區(qū)分考核。而在優(yōu)化過程中,對切換指標,建議結(jié)合RRC重建次數(shù)及其成功率指標綜合考慮,提高工作的針對性。當然,對于優(yōu)化來說,算法的差異不止于統(tǒng)計細節(jié),還有參數(shù),如T304的設置、切換遲滯及頻偏的設置等,在此不一一描述??傊鄰S家覆蓋的區(qū)域,深究廠家間數(shù)據(jù)算法的差異,保障數(shù)據(jù)體現(xiàn)的一致性,能有效地提高優(yōu)化效率,使其更具有針對性,從而更接近用戶體驗。
本文從理論上研究分析了兩個廠家在目前網(wǎng)絡內(nèi)使用的同頻切換公式及其統(tǒng)計機制,并通過解析實例信令證明了兩者之間的差異,證明了其在切換后重建的統(tǒng)計差別。在此理論基礎上,以差小區(qū)為例,測試驗證了這種統(tǒng)計差異在優(yōu)化監(jiān)控考核中的影響。因此,在以后的日常監(jiān)控及優(yōu)化處理過程中,應結(jié)合用戶對應廠家區(qū)域,充分考慮其算法統(tǒng)計機制及其他因素在其中的影響。