馬 聰 柏 勇
中國移動通信集團江蘇有限公司
2020年初由中國工業(yè)和信息化部指導,中國信息通信研究院聯(lián)合中國電信、中國移動、中國聯(lián)通三家基礎電信企業(yè)共同推出的公益性行程查詢服務,通過大數(shù)據(jù)中心整合3家運營商提供的用戶手機所處基站位置數(shù)據(jù),提供個人查詢前14天以內所到過國家及停留滿4小時的國內地市行程軌跡證明,為全國各地精準制定新冠疫情防控措施提供了技術保障。
通信大數(shù)據(jù)行程卡提供的位置查詢服務數(shù)據(jù),來源于手機話單數(shù)據(jù)與信令數(shù)據(jù),其中信令數(shù)據(jù)包含了用戶通信使用的基站位置信息。為了保障移動信號覆蓋無死角,當用戶處于行政區(qū)交界處時,會出現(xiàn)基站信號交叉覆蓋現(xiàn)象,從而造成行程結果的偏差。當前疫情常態(tài)化防控狀態(tài)下,行程卡作為全國民眾日常出行的重要憑證,每當部分區(qū)域發(fā)生疫情時,就會出現(xiàn)行程軌跡與實際不符的投訴工單突增。
本文重點從分析邊界漫游行程不準的投訴入手,因地制宜制定“三合一”行程碼優(yōu)化方案,實現(xiàn)數(shù)據(jù)與算法的完美結合,提供更準確的技術支撐。
用戶處于行政區(qū)劃分交接地區(qū),由于無線信號扇形傳播的特點,基站信號的覆蓋范圍難以與行政區(qū)劃的邊界完全吻合,用戶手機被兩地或兩地以上(省級或地市級)基站信號交叉覆蓋,這種現(xiàn)象稱為“邊界漫游”,如圖1所示。如果兩地信號強弱不同,就可能造成用戶實際定位處于A地行政區(qū)內,卻使用了B地行政區(qū)的基站信號,而產(chǎn)生邊界漫游話單或信令,信號覆蓋范圍受到天氣、地形、建筑等因素影響,會出現(xiàn)不穩(wěn)定的情況,用戶手機位置將取決于哪一邊的網(wǎng)絡信號強。
圖1 邊界漫游示意圖
隨著各地網(wǎng)絡大規(guī)模建設與擴容,無法避免帶來部分邊界漫游地區(qū),造成基站信號越界覆蓋的情況。為解決由于邊界漫游帶來的數(shù)據(jù)問題,移動計費系統(tǒng)會對處于邊漫區(qū)域的基站進行獨立標記,并對這些基站小區(qū)內產(chǎn)生的通信數(shù)據(jù),根據(jù)應用場景重新處理。自取消手機國內長途漫游費與取消流量漫游費后,在邊界使用占用兩邊基站都是一樣計費,用戶不用擔心邊界漫游帶來的計費問題,但是,行政區(qū)劃之間有一條界限,在交界處手機能收到來自兩個地區(qū)的信號,這個問題一直存在,因此,當通信大數(shù)據(jù)行程卡使用通信數(shù)據(jù)作為定位依據(jù),處于交界處的手機則可能出現(xiàn)定位不準的問題,使用戶對行程卡結果產(chǎn)生質疑。
通信大數(shù)據(jù)行程卡服務是通過客戶手機號碼通信數(shù)據(jù)計算,根據(jù)使用的基站信息識別,主要應用于個人用戶通過10086、二維碼、互聯(lián)網(wǎng)客戶端查詢本人手機號碼截至查詢時的漫游城市,用于輔助識別手機號持有人是否經(jīng)歷疫區(qū)。
支撐系統(tǒng)首先匯總通信數(shù)據(jù),進行初步的加工,使其具備統(tǒng)計條件,通信數(shù)據(jù)類型包括:語音話單、流量話單、手機信令等信息。
話單是指客戶原始通信記錄信息,又可稱之為詳單,以語音話單為例,主要記錄以下信息:流水號、用戶標識、主叫號碼、被叫號碼、起始時間、結束時間、通話時長、通話性質等關鍵信息。除語音話單之外,話單記錄的信息還包括V網(wǎng)、流量等其他類型,記錄格式與語音話單類似。用戶在通話或上網(wǎng)過程中,核心網(wǎng)網(wǎng)元記錄相關計費信息,并發(fā)送計費消息到計費系統(tǒng),再由計費系統(tǒng)生成話單。有些核心網(wǎng)網(wǎng)元可以直接產(chǎn)生話單,并發(fā)送到計費系統(tǒng)或計費中心。
信令是指客戶手機與網(wǎng)絡的交互信息,通訊設備之間任何實際應用信息的傳送總是伴隨著一些控制信息的傳遞,它們按照既定的通訊協(xié)議工作,將應用信息安全、可靠、高效地傳送到目的地。為檢測客戶手機是否在網(wǎng),即使客戶不打電話或上網(wǎng),手機也會與網(wǎng)絡設備之間信息交互。信令包括:MC、MME、N1N2、VOLTE、CSFB等類型。
匯總數(shù)據(jù)后,進行數(shù)據(jù)準備工作:(1)選取與用戶行程信息有關聯(lián)的字段;(2)獲取省區(qū)內用戶T-1賬期的通信數(shù)據(jù)進行合并;(3)根據(jù)跟蹤區(qū)域代碼、位置區(qū)碼、蜂窩小區(qū)號,求取基站歸屬地市以及基站歸屬邊漫地市;(4)按所有話單開始時間、結束時間排序;(5)按相同基站歸屬地以及相同歸屬邊漫地市進行聚合。
通信記錄字段示意如表1所示。該模式下,用戶行為軌跡是根據(jù)其通信信息歸屬的行政區(qū)地域計算,而在邊界漫游區(qū)域中,存在終端信號漂移、通信基站歸屬模糊、位置駐留時間長短等干擾因素,導致最終結果精度不高,隨著疫情防控形勢逐步嚴峻,引發(fā)邊漫用戶投訴比例升高。
表1 通信記錄字段示意表
序號 字段名 說明2 USER_ID 用戶編碼3 MSC 移動交換中心4 RA 跟蹤區(qū)域代碼5 LAC 位置區(qū)碼6 CELL_ID 蜂窩小區(qū)號7 VISIT_AREA_CODE 到訪地8 START_TIME 開始時間9 END_TIME 結束時間10 …… ……
通信大數(shù)據(jù)行程卡邊界漫游的準確性取決于界定邊漫基站的準確性和計算用戶到訪地算法的科學性。
此部分詳細介紹了計算用戶在邊界漫游地區(qū)位置過程中的幾個重要方法。
對于邊漫基站信號處理方面,設備既需兼顧邊界漫游基站的通話質量,又需實現(xiàn)基站位置的相對準確性,可通過合理調整雙邊基站的天線方向角,輸出功率等基站參數(shù),增強B地的覆蓋場強,減弱A地的覆蓋場強,使用戶在B地更多占用B地基站信號。
在邊漫基站科學識別方面,支撐系統(tǒng)可采用一套維護閉環(huán)管理流程,如圖2所示。
圖2 邊漫基站維護流程圖
第一步,支撐系統(tǒng)通過數(shù)據(jù)模型每周自動生成邊界漫游差異小區(qū),模型設定用戶在短時間內基站在邊界地市切換的閾值,輸出邊界漫游疑似基站,再將計算數(shù)據(jù)與網(wǎng)絡部配置的邊界漫游小區(qū)的數(shù)據(jù)對比,并結合近期用戶投訴過的基站信息,綜合分析得出邊界漫游差異基站;第二步,交由網(wǎng)絡部對系統(tǒng)識別出的邊界漫游差異,進行地圖打點等全面的核查,經(jīng)過專業(yè)的確認后及時修正數(shù)據(jù),刪除無邊漫特征的基站。通過固化這套對邊界漫游基站的維護流程,可實現(xiàn)動態(tài)、及時地添加符合特征的邊漫基站,從而減少用戶行程爭議的概率,并建立良好的閉環(huán)管理機制。
對于用戶全天在全邊界漫游地區(qū)的情況,可采用以下規(guī)則計算:根據(jù)邊界漫游基站歸屬排序分別統(tǒng)計A與B地市的駐留集合時長,取A、B兩地駐留時長相對較長的地市作為整個邊界漫游到訪地歸屬。全邊漫用戶行程如圖3所示。
圖3 全邊漫用戶行程示意圖
求取全邊漫駐留集合時長的算法簡單說明如下:
(1)遍歷用戶當天的所有通信數(shù)據(jù),當全天記錄均為邊界漫游,則分別計算出每條話單的時長,如果話單數(shù)據(jù)存在時長重疊的情況,則將后一條話單的開始時間減去前一條話單的開始時間作為前一天話單的時長。
(2)按照基站歸屬地市、基站所在漫游地市集合、時長進行匯總,相同的“基站歸屬地市、基站所在漫游地市集合”數(shù)據(jù)進行時長的匯總,得到集合結果數(shù)據(jù)。數(shù)據(jù)結構為:歸屬地市、漫游地市集合、時長,例如:0511-[025,0511] 2分鐘。根據(jù)匯總集合的結果數(shù)據(jù),對每條話單的基站歸屬地市和邊漫地市進行時長判斷,采用時長更長的地市作為該條邊漫話單的到訪地。
(3)完成邊界漫游的更新后,再根據(jù)用戶詳單數(shù)據(jù)的開始時間、結束時間進行排序。相鄰為連續(xù)地市時,將數(shù)據(jù)進行合并,開始時間為該地市的最早開始時間,結束時間為該地市的最晚結束時間。地市數(shù)據(jù)排序后,如果出現(xiàn)前一地市與后一地市的時間產(chǎn)生交叉,則將后一個到訪地數(shù)據(jù)的開始時間作為前一個到訪地市的結束時間。
(4)得到集合列表,計算出用戶的連續(xù)地市時長。根據(jù)時長計算判定,完成后續(xù)數(shù)據(jù)加工、排重、翻譯等步驟,最終計算出用戶行程。
對于用戶部分時間在邊界漫游地區(qū)內,部分時間在非邊界漫游地區(qū)的情況,采用以下規(guī)則計算:取有駐留時長絕對優(yōu)勢的地市,作為邊漫話單的到訪地結果,即用戶駐留所在地域的時長遠比另一邊界地域長,則假設用戶出現(xiàn)在該地區(qū)的腹地(中心區(qū)),以減少邊漫話單的到訪地求取誤差。部分邊漫用戶行程如圖4所示。
圖4 部分邊漫用戶行程示意圖
求取部分邊界漫游時長的算法簡單說明如下:
(1)遍歷用戶當天的所有通信數(shù)據(jù),當部分記錄為邊界漫游時,則分別匯總非邊界漫游基站時長和邊界漫游基站時長。時長按照地市匯總,存儲結構包括:歸屬地市、漫游地市集合、駐留時長。
(2)設定2個閾值:非邊界漫游地市時間差a、邊界漫游地市時間差b。閾值a、b根據(jù)30天內無投訴用戶邊界漫游地區(qū)駐留時長平均取整得到,在實際生產(chǎn)運營中可根據(jù)運營情況靈活調整。
(3)取通信記錄基站中邊界漫游集合,根據(jù)地市時長進行判斷并更新歸屬地市:在基站邊界漫游集合中,地市的非邊界漫游時長均為0,則取通信數(shù)據(jù)中包含基站漫游地市的最長時間地市作為基站歸屬地;在基站邊界漫游集合中,地市的非邊界漫游不為0,則計算最大時長和第二大時長差值,如果大于等于設置閾值a,取最大時長的地市作為邊界漫游基站地市;在基站邊界漫游集合中,地市的非邊界漫游最大時長和第二大時長差值小于閾值a,再判斷邊界漫游基站的地市時長,如果邊界漫游地市的最大和第二大時長大于差值,大于等于閾值b,取邊界漫游地市中最大時長的地市作為邊界漫游基站地市;在基站邊界漫游集合中,地市的非邊界漫游最大時長和第二大時長差值小于閾值a,判斷邊界漫游基站的地市時長,如果邊界漫游地市的最大和第二大時長大于差值,小于閾值b,邊界漫游基站地市取為未知地市(無法判斷)。
(4)完成邊界漫游數(shù)據(jù)更新后,進行非常駐地市剔除:如果基站的邊界漫游地市包含在常駐地市中,但判定結果地市不包含在常駐地中,則該條基站記錄到訪地判別為未知。
(5)最后進行投訴用戶地市剔除:如果基站判別地為用戶的投訴不認可地市,則該條基站記錄到訪地判別為未知。(6)輸出用戶基站歸屬信息,完成后續(xù)行程計算。
本文介紹了通信大數(shù)據(jù)行程卡的實現(xiàn)原理和邊界漫游投訴的產(chǎn)生原因,結合對邊漫投訴案例進行系統(tǒng)分析研究,分析出邊界漫游基站準確性與位置算法的影響因子,提出了因地制宜的“三合一”解決方案,實現(xiàn)對邊漫易引起的行程卡到訪地數(shù)據(jù)進行糾偏,從而保障用戶行程卡數(shù)據(jù)的準確性。通過長期的實際反復驗證與測試,行程碼邊漫投訴量有效減少了95%,萬投比降低至0.34,解決了疫情期間客戶投訴的實際問題。
隨著國內外疫情不斷變化,通信大數(shù)據(jù)行程卡的使用場景越來越多,傳統(tǒng)簡單基站判斷的方式已經(jīng)很難解決用戶實際訴求。下一步系統(tǒng)將持續(xù)探索調優(yōu)新思路,引入用戶主動上報的GPS定位數(shù)據(jù),用于輔助判定邊界漫游位置,研究邊界漫游算法校準方法。通過科技革新,可實際解決群眾的行程數(shù)據(jù)邊界漫游投訴,從嚴從細從實做好常態(tài)化疫情防控工作,同時也體現(xiàn)了中國移動作為一家央企,用信息化手段助力疫情防控工作的企業(yè)社會責任。