劉璐,陳睿杰,李嘉
研究與開發(fā)
基于MDT重疊覆蓋度數(shù)據(jù)的NN-DBSCAN參數(shù)自適應(yīng)調(diào)優(yōu)研究
劉璐1,陳睿杰2,李嘉2
(1. 中國移動通信集團(tuán)設(shè)計院有限公司重慶分公司,重慶 401121;2. 中國移動通信集團(tuán)云南有限公司,云南 昆明 650228)
傳統(tǒng)網(wǎng)絡(luò)優(yōu)化中路測工作存在難以全量測試道路及樓宇、測試工作量大、工作效率低、周期長、受人為因素影響等顯性缺點,無法動態(tài)關(guān)注每個區(qū)域網(wǎng)絡(luò)質(zhì)量情況,且常規(guī)測量報告(measurement report,MR)數(shù)據(jù)不具備定位信息,無法精確定位如重疊覆蓋度問題發(fā)生位置?;谧钚』窚y(minimization drive test,MDT)精準(zhǔn)定位系統(tǒng)通過采集底層基站MDT數(shù)據(jù),并根據(jù)重疊覆蓋度算法輸出高重疊覆蓋度柵格,再通過自適應(yīng)最近鄰-具有噪聲的基于密度的聚類方法(-nearest neighbor density-based spatial clustering of applica-tions with noise,NN-DBSCAN)聯(lián)合算法解決了DBSCAN算法對參數(shù)設(shè)置敏感性問題,并對問題柵格進(jìn)行非監(jiān)督聚類,收斂問題連片區(qū)域,通過小區(qū)采樣貢獻(xiàn)度進(jìn)行柵格區(qū)域映射,最終達(dá)到精準(zhǔn)調(diào)整全局最高優(yōu)先級(TOP)小區(qū),降低小區(qū)高重疊覆蓋度的目的。
NN-DBSCAN算法;MDT數(shù)據(jù);重疊覆蓋度;小區(qū)貢獻(xiàn)度
隨著近幾年網(wǎng)絡(luò)建設(shè)的大力發(fā)展,LTE業(yè)務(wù)量不斷增長、網(wǎng)優(yōu)規(guī)模急劇擴(kuò)大,干擾問題日益嚴(yán)重,網(wǎng)絡(luò)容量、覆蓋和質(zhì)量檢查矛盾日趨凸顯。LTE網(wǎng)絡(luò)主要以D/F頻段組網(wǎng),無法通過頻率規(guī)劃的方法精確有效降低同頻干擾,必須對網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行調(diào)整與優(yōu)化。目前常規(guī)采用手段如路測、測量報告(measurement report,MR)數(shù)據(jù)和道路掃頻等數(shù)據(jù)進(jìn)行優(yōu)化,但由于路測數(shù)據(jù)獲取成本較高,MR數(shù)據(jù)未攜帶定位信息,掃頻數(shù)據(jù)也僅局限于道路,以及現(xiàn)網(wǎng)工參準(zhǔn)確性較差等,重疊覆蓋分析誤判較多,難以準(zhǔn)確定位和分析問題,無法達(dá)到優(yōu)化預(yù)期效果。
最小化路測(minimization of drive test,MDT)技術(shù)功能主要通過擴(kuò)展現(xiàn)有無線資源管理(radio resource management,RRM)測量功能和跟蹤功能實現(xiàn),MDT數(shù)據(jù)測量及解析流程如圖1所示。
基站根據(jù)網(wǎng)管配置的MDT測量任務(wù)下發(fā)相關(guān)測量配置至終端UE,終端UE在滿足測量條件時測量并上報測量信息,包含參考信號接收功率(reference signal receiving power,RSRP)、參考信號接收質(zhì)量(reference signal receiving quality,RSRQ)等字段,最重要的是攜帶相關(guān)終端UE的定位信息(GPS經(jīng)度、緯度)[1],基站將收到的終端測量結(jié)果和基站自身的測量結(jié)果按數(shù)據(jù)標(biāo)準(zhǔn)要求上報至網(wǎng)管或MDT數(shù)據(jù)存儲處理服務(wù)器。
目前MDT支持的測量項主要包括3類,MDT支持測量項見表1。
重疊覆蓋問題主要指在網(wǎng)絡(luò)拓?fù)淇臻g內(nèi),彼此存在深度交疊區(qū)域,如RSRP較好但SINR較差,或者多個小區(qū)間乒乓切換造成用戶感知差問題,重疊覆蓋原因示意圖如圖2所示。
圖1 MDT數(shù)據(jù)測量及解析流程
表1 MDT支持測量項
圖2 重疊覆蓋原因示意圖
MDT柵格:采用目前主流GeoHash位置服務(wù)技術(shù),實現(xiàn)柵格定位普通精度為38 m×19 m及5 m× 5 m高精度的GIS渲染。
基于上述MDT柵格進(jìn)行高重疊覆蓋度柵格的計算,涉及以下指標(biāo)內(nèi)容:
(1)重疊覆蓋采樣點:在基站服務(wù)小區(qū)RSRP≥?110 dBm,同時鄰區(qū)與主服小區(qū)RSRP的絕對差值在6 dB范圍內(nèi)的小區(qū)數(shù)量[2-3],即:|主服小區(qū)RSRP?鄰區(qū)RSRP|≤6 dB。
(2)柵格重疊覆蓋度:柵格重疊覆蓋度≥3的采樣點/柵格總采樣點×100%。
(3)高重疊覆蓋度柵格:柵格重疊覆蓋度≥15%,該閾值可根據(jù)實際情況進(jìn)行動態(tài)調(diào)整。
重疊覆蓋度柵格內(nèi)小區(qū)采樣貢獻(xiàn)度:柵格內(nèi)總共有個小區(qū)覆蓋,其中,個小區(qū)重疊覆蓋采樣點共計個,第N個小區(qū)的重疊覆蓋采樣點為n個,則第N小區(qū)重疊覆蓋采樣貢獻(xiàn)度=n/。
傳統(tǒng)高重疊覆蓋問題優(yōu)化主要是基于DT路測數(shù)據(jù)以及MR數(shù)據(jù)進(jìn)行渲染,呈現(xiàn)高重疊覆蓋區(qū)域,在獲取數(shù)據(jù)便捷性、成本性、時效性、精準(zhǔn)性上均劣于MDT數(shù)據(jù)評估分析效果。
傳統(tǒng)高重疊覆蓋優(yōu)化流程如圖3所示,傳統(tǒng)高重疊覆蓋優(yōu)化流程及判定分析方法均是側(cè)重尋優(yōu)單例問題小區(qū),而本文主要是對傳統(tǒng)高重疊覆蓋問題評估階段進(jìn)行改進(jìn)優(yōu)化,采用較為精準(zhǔn)的MDT數(shù)據(jù),并依據(jù)GeoHash算法形成柵格級數(shù)據(jù),通過目前較為成熟的NN與DBSCAN聯(lián)合非監(jiān)督機(jī)器學(xué)習(xí)算法,進(jìn)行高重疊覆蓋度柵格的聚類,在此問題聚類區(qū)域進(jìn)一步計算TOP小區(qū)貢獻(xiàn)度,綜合性、全局性地調(diào)整TOP小區(qū)以實現(xiàn)最終尋優(yōu)目的。
由于目前密集城區(qū)高重疊覆蓋度問題相對凸顯,且DBSCAN算法在樣本集的密度不均勻、聚類間距差相差很大時聚類質(zhì)量較差等原因,在分析場景上選取站間距較小、MDT高重疊覆蓋數(shù)據(jù)采樣的稀疏程度相似、簇密度數(shù)據(jù)差異不明顯的密集城區(qū)進(jìn)行研究。
圖3 傳統(tǒng)高重疊覆蓋優(yōu)化流程
(1)MDT測量采樣策略
考慮全省MR以及MDT數(shù)據(jù)測量項同時開啟、數(shù)據(jù)服務(wù)器負(fù)荷因素,可以只開啟以下基本測量項。
●全省開啟IMM-MDT的M1測量(RSRP、RSRQ,由UE測量)。
●M2測量(PHR最大發(fā)射功率余量,由UE測量)。
●M3測量(RIP接收干擾功率測量,由eNB測量)。
●同時開啟LOGGED-MDT以及RLF-MDT測量項。
(2)MDT采樣周期
全省每個月集中采樣10天,取最終全量并集數(shù)據(jù)。
(3)MDT補(bǔ)采數(shù)據(jù)機(jī)制
通過步驟(1)和步驟(2)中數(shù)據(jù)采集策略及采集周期可能會出現(xiàn)因廠商MDT服務(wù)器IP地址差異、服務(wù)器傳輸模式如SFTP但省端采集側(cè)配置為FTP等問題出現(xiàn)數(shù)據(jù)采集不全的情況,所以需要針對上述原因補(bǔ)采MDT數(shù)據(jù)。
(4)MDT數(shù)據(jù)ETL策略
根據(jù)步驟(1)~步驟(3)獲取初步MDT數(shù)據(jù),經(jīng)IT支撐平臺進(jìn)行預(yù)處理,可輸出MDT采樣數(shù)據(jù),MDT采樣樣例數(shù)據(jù)見表2,按優(yōu)化經(jīng)驗對該數(shù)據(jù)做進(jìn)一步數(shù)據(jù)分析處理。
●柵格總采樣點>5采樣點。
●柵格重疊覆蓋度>15%。
聯(lián)合上述兩個條件輸出對應(yīng)高重疊覆蓋度柵格作為研究候選對象柵格。
選取按第2.1節(jié)中條件過濾后的高重疊覆蓋度柵格,將柵格經(jīng)度、緯度通過編程工具進(jìn)行GIS渲染,并使用DBSCAN密度聚類算法將多個鄰近高重疊覆蓋度柵格聚為一類。
(1)DBSCAN密度聚類尋優(yōu)流程[4-5]如算法1所示。
算法1 DBSCAN密度聚類尋優(yōu)流程
輸入:數(shù)據(jù)源集(高重疊覆蓋度柵格)
表2 MDT采樣樣例數(shù)據(jù)
(2)實現(xiàn)經(jīng)典DBSCAN主要過程
高重疊覆蓋柵格簇群GIS渲染如下。
利用PlotClusterinResult(X,IDX1)函數(shù),可得出在超參數(shù)搜索半徑、MinPts擬合模型函數(shù),設(shè)置不同超參數(shù)的聚類效果如圖4所示。
由圖4可知,DBSCAN算法的搜索半徑、MinPts參數(shù)需要人為設(shè)定,聚類結(jié)果敏感度、準(zhǔn)確度受其超參數(shù)影響較大,需要在高重疊覆蓋干擾簇群范圍大小與噪點包含度進(jìn)行尋優(yōu)平衡,如干擾簇群搜索半徑過大,其涵蓋小區(qū)過多會導(dǎo)致干擾簇群內(nèi)小區(qū)貢獻(xiàn)度指標(biāo)被弱化,無法凸顯最嚴(yán)重干擾小區(qū);而干擾簇群搜索半徑過小可能會導(dǎo)致無法包含相近樣本,從而誤判為噪點情況,所以為降低減少人為干預(yù),需要進(jìn)行機(jī)器自適應(yīng)的DBSCAN超參數(shù)調(diào)優(yōu)的研究。
圖4 設(shè)置不同超參數(shù)的聚類效果
根據(jù)式(2)中密度閾值過大,可能會導(dǎo)致同簇群中內(nèi)部被劃分為多個集合;如密度閾值過小,則可能引起不同簇群集合間的合并,所以選取合適的密度閾值非常重要。-均值DBSCAN算法需要人為設(shè)定初始聚類中心,不能很好地解決聚類結(jié)果隨機(jī)性問題;AF-DBSCAN算法需要選擇種子代表對象的數(shù)量,代表對象過多則無法發(fā)揮算法效率,過少則容易造成對象丟失,影響算法聚類質(zhì)量。為盡可能減少人為干預(yù),確保聚類效果,本文采用自適應(yīng)參數(shù)NN-DBSCAN算法構(gòu)建最小距離矩陣,并通過分析數(shù)據(jù)的NN的數(shù)學(xué)統(tǒng)計規(guī)律,尋優(yōu)密度閾值列表中的超參數(shù)取值,本文算法主要適用于低維且簇密度差異不明顯的數(shù)據(jù)集。
(1)確定搜索半徑具體算法思路有以下3個步驟。
步驟2 采用NN算法[8]及knnsearch函數(shù)[IDX,Dist]=knnsearch(a,b)遍歷計算每個柵格位置與其他柵格位置的距離,并將最小距離值存儲至Dist中,記錄其數(shù)據(jù)行號索引值存儲至IDX中。
尋優(yōu)策略執(zhí)行:輸入第2.2節(jié)的數(shù)據(jù),按照上述算法進(jìn)行步驟(1)~步驟(3)調(diào)優(yōu),并使用編程工具建模仿真,搜索半徑尋優(yōu)過程1和2分別如圖5、圖6所示。
由圖5可知,在第4個數(shù)據(jù)點處出現(xiàn)明顯數(shù)據(jù)凸起,說明在第4~5個點處出現(xiàn)數(shù)值階躍現(xiàn)象。其在圖6曲線上則反映A、B兩點的拐點處縱坐標(biāo)階躍值最大,說明該B點的縱坐標(biāo)為搜索半徑=0.004 49。
(2)確定MinPts值具體算法思路有以下3個步驟。
圖5 搜索半徑尋優(yōu)過程1
圖6 搜索半徑尋優(yōu)過程2
尋優(yōu)策略執(zhí)行:按上述確定MinPts值具體算法思路及步驟采用編程實現(xiàn),對不同取值曲線進(jìn)行圖形化渲染,MinPts參數(shù)尋優(yōu)過程如圖7可知,取離散值1,2,…,15等15條曲線基本形似,呈“前緩后陡”趨勢。
圖7 MinPts參數(shù)尋優(yōu)過程
圖8 自適應(yīng)KNN-DBSCAN聯(lián)合算法調(diào)優(yōu)聚類效果
(3)自適應(yīng)NN-DBSCAN聯(lián)合算法模型的實效性評估
●噪點率=noise噪點數(shù)/對象數(shù)。
●最大簇群內(nèi)TOP問題小區(qū)貢獻(xiàn)度占比=最大簇群中高重疊覆蓋度柵格所轄TOP5小區(qū)的采樣點/最大簇群中高重疊覆蓋度柵格所有小區(qū)采樣點。
通過表3可知,在自適應(yīng)NN-DBSCAN聯(lián)合算法調(diào)優(yōu)層面,當(dāng)簇群C一定時,噪點率越小越好;在實際網(wǎng)絡(luò)優(yōu)化層面,解決高重疊覆蓋小區(qū)需要以優(yōu)化最少小區(qū)為代價獲得最好收效,即最大簇群內(nèi)TOP問題小區(qū)貢獻(xiàn)度的占比越高,該簇群的問題小區(qū)收斂性越好。
實驗組別9、10的噪點率最小,同為4.83%,而最大簇群內(nèi)TOP問題小區(qū)貢獻(xiàn)度僅為38.97%;實驗組別6、7、8最大簇群內(nèi)TOP問題小區(qū)貢獻(xiàn)度同為59.32%,但噪點率依次為9.03%、13.24%、15.34%,均略高于實驗組別9、10。另實驗組別6與實驗組別5在同為8個簇群前提下,雖然實驗組別6比實驗組別5噪點率稍劣于2.73%,但在最大簇內(nèi)TOP問題小區(qū)貢獻(xiàn)度占比方面實驗組別6大幅優(yōu)于實驗組別5,領(lǐng)先幅度為20.60%。
表3 不同超參數(shù)設(shè)置下算法模型KPI驗證結(jié)果
對MDT高重疊覆蓋度柵格基于NN-DBSCAN的聯(lián)合算法研究,利用編程工具對DBSCAN密度閾值Density參數(shù)中搜索半徑、MinPts兩個超參數(shù)進(jìn)行自適應(yīng)尋優(yōu),從而解決了該算法對參數(shù)設(shè)置敏感性問題。結(jié)合實際網(wǎng)絡(luò)優(yōu)化工作特性,高效、快速構(gòu)建優(yōu)化區(qū)域內(nèi)高重疊覆蓋度簇群,精準(zhǔn)識別其簇群中TOP小區(qū),為一線生產(chǎn)提供有效的優(yōu)化解決方案,確保移動用戶的良好感知體驗。
[1] 譚鈺山, 周文金, 何延. 基于MDT數(shù)據(jù)的重疊覆蓋優(yōu)化思路及實踐[J]. 通訊世界, 2019, 26(12): 6-7.
TAN Y S, ZHOU W J, HE Y. Overlapping coverage optimization idea and practice based on MDT data[J]. Telecom World, 2019, 26(12): 6-7.
[2] 張吉, 趙夙, 朱曉榮. 基于大數(shù)據(jù)挖掘的LTE網(wǎng)絡(luò)重疊覆蓋優(yōu)化方法[J]. 南京郵電大學(xué)學(xué)報(自然科學(xué)版), 2020, 40(6): 92-99.
ZHANG J, ZHAO S, ZHU X R. Optimization method for overlapping coverage of LTE networks based on big data mining[J]. Journal of Nanjing University of Posts and Telecommunications (Natural Science Edition), 2020, 40(6): 92-99.
[3] 谷欣杏. LTE網(wǎng)絡(luò)覆蓋優(yōu)化及無線定位優(yōu)化算法的研究[D]. 北京: 北京郵電大學(xué), 2019.
GU X X. Research on LTE network coverage optimization and wireless positioning algorithm[D]. Beijing: Beijing University of Posts and Telecommunications, 2019.
[4] 宋金玉, 郭一平, 王斌. DBSCAN聚類算法的參數(shù)配置方法研究[J]. 計算機(jī)技術(shù)與發(fā)展, 2019, 29(5): 44-48.
SONG J Y, GUO Y P, WANG B. Research on parameter configuration method of DBSCAN clustering algorithm[J]. Computer Technology and Development, 2019, 29(5): 44-48.
[5] 趙文, 夏桂書, 茍智堅, 等. 一種改進(jìn)的DBSCAN算法[J]. 四川師范大學(xué)學(xué)報(自然科學(xué)版), 2013, 36(2): 312-316.
ZHAO W, XIA G S, GOU Z J, et al. An improved DBSCAN algorithm[J]. Journal of Sichuan Normal University (Natural Science), 2013, 36(2): 312-316.
[6] 何正風(fēng). MATLAB在數(shù)學(xué)方面的應(yīng)用[M]. 北京: 清華大學(xué)出版社, 2012.
HE Z F. Application of MATLAB in mathematics[M]. Beijing: Tsinghua University Press, 2012.
[7] 李文杰, 閆世強(qiáng), 蔣瑩, 等. 自適應(yīng)確定DBSCAN算法參數(shù)的算法研究[J]. 計算機(jī)工程與應(yīng)用, 2019, 55(5): 1-7, 148.
LI W J, YAN S Q, JIANG Y, et al. Research on method of self-adaptive determination of DBSCAN algorithm parameters[J]. Computer Engineering and Applications, 2019, 55(5): 1-7, 148.
[8] 王紫薇, 徐凱, 侯益明. 基于不同距離公式的NN算法對鳶尾花的分類[J]. 無線互聯(lián)科技, 2021, 18(13): 105-106.
WANG Z W, XU K, HOU Y M. Classification of iris based onNN algorithm with different distance formulas[J]. Wireless Internet Technology, 2021, 18(13): 105-106.
[9] 周紅芳, 王鵬. DBSCAN算法中參數(shù)自適應(yīng)確定方法的研究[J].西安理工大學(xué)學(xué)報, 2012, 28(3): 289-292.
ZHOU H F, WANG P. Research on adaptive parameters determination in DBSCAN algorithm[J]. Journal of Xi’an University of Technology, 2012, 28(3): 289-292.
Research on adaptive optimization ofNN-DBSCAN parameters based on MDT overlapping coverage data
LIU Lu1, CHEN Ruijie2, LI Jia2
1. Chongqing Branch of China Mobile Communications Group Design Institute Co., Ltd., Chongqing 401121, China 2. Yunnan Branch of China Mobile Communications Group Co., Ltd., Kunming 650228, China
In the traditional network optimization, the drive test (DT) work has obvious disadvantages, such as difficult to fully test roads and buildings, large test workload, low work efficiency, long cycle, affected by human factors, unable to dynamically pay attention to the network quality of each area, and the conventional measurement report (MR) data does not have positioning information, so it is impossible to accurately locate the location where the overlapping coverage problem occured. Based on minimization drive test (MDT), the precision positioning system collected the MDT data of the underlying base station and outputted the grid with high overlapping coverage according to the overlapping coverage algorithm. Then, the sensitivity of DBSCAN algorithm to parameter setting was solved through the adaptive-nearest neighbor density-based spatial clustering of applications with noise (NN-DBSCAN) joint algorithm. The problem grid was unsupervised clustered, the problem contiguous area was converged, and the grid area was mapped through the cell sampling contribution. Finally, the global top cell was accurately adjusted to optimize the high overlap coverage.
NN-DBSCAN algorithm, MDT data, overlapping coverage, cell contribution
TN929.5
A
10.11959/j.issn.1000?0801.2022010
2021?09?09;
2022?01?09
劉璐,18323064733@139.com
劉璐(1986?),男,中國移動通信集團(tuán)設(shè)計院有限公司重慶分公司工程師、高級咨詢設(shè)計師,主要研究方向為無線網(wǎng)絡(luò)智能優(yōu)化。
陳睿杰(1987?),男,中國移動通信集團(tuán)云南有限公司工程師,主要研究方向為大數(shù)據(jù)分析、AI、智慧運維。
李嘉(1989?),男,現(xiàn)就職于中國移動通信集團(tuán)云南有限公司,主要研究方向為大數(shù)據(jù)分析、AI、智慧運維等。