[林高全]
本文提出了一種5G[1]無線網(wǎng)絡數(shù)據(jù)采集的設計方法。新一代信息技術的5G 網(wǎng)絡作為使能千行百業(yè)的基礎網(wǎng)絡,要求具備全覆蓋、高速率、廣連接、低時延等能力來滿足各行業(yè)的需求,另一方面,5G 可以使用較高的頻段,必然帶來網(wǎng)絡部署的復雜性,網(wǎng)絡自動化必然是5G 的一個最直接的需求。而網(wǎng)絡自動化包括自動網(wǎng)絡駕駛與網(wǎng)絡人工智能,2021 年4 月,第三代伙伴項目(3rd Generation Partnership Project,3GPP)決定從5G R18[2](5G 第18版本)即5G-Advanced 中引入人工智能(AI,Artificial Intelligence)/機器學習(ML,Machine Learning),并進一步增強自組織網(wǎng)絡(SON,Self-Organising Networks)即自動網(wǎng)絡駕駛;眾所周知,“無數(shù)據(jù)不智能”,即5G網(wǎng)絡的AI/SON 依賴于5G 網(wǎng)絡的大數(shù)據(jù),而5G 網(wǎng)絡大數(shù)據(jù)又依賴于5G 網(wǎng)絡數(shù)據(jù)采集。因此,5G 網(wǎng)絡數(shù)據(jù)采集是5G 網(wǎng)絡自動駕駛與人工智能的一個前提條件,而數(shù)據(jù)采集方法是需要設計的。所以,本文介紹了數(shù)據(jù)采集設計的方法,在考慮了采集的數(shù)據(jù)內(nèi)容、數(shù)據(jù)的組織方式、數(shù)據(jù)采集的觸發(fā)規(guī)則、以及數(shù)據(jù)采集周期等信息的基礎上,根據(jù)確定的設計原則設計不同的事件塊及其字段內(nèi)容來滿足5G 人工智能等應用的需求,以促進5G 與AI/SON 的共同發(fā)展。
國家十四五規(guī)劃中,新一代信息技術產(chǎn)業(yè)包括下一代信息網(wǎng)絡產(chǎn)業(yè)、電子核心產(chǎn)業(yè)、新興軟件和新型信息技術服務、互聯(lián)網(wǎng)與云計算大數(shù)據(jù)服務、人工智能等行業(yè),其應用橫跨國民經(jīng)濟中的農(nóng)業(yè)、工業(yè)和服務業(yè)等三大產(chǎn)業(yè)。而其中的下一代信息網(wǎng)絡產(chǎn)業(yè)主要是指5G 網(wǎng)絡,它是新一代信息技術產(chǎn)業(yè)的基礎。5G 作為基礎網(wǎng)絡,就要保證100%的無線網(wǎng)絡覆蓋,當前,以5G 為代表的新一代信息技術正日益成為推動經(jīng)濟社會數(shù)字化、網(wǎng)絡化、智能化轉型升級的關鍵驅動力,并成為國家戰(zhàn)略的一部分,例如,現(xiàn)在國家大力推動的智慧城市建設,需要物聯(lián)網(wǎng)設備連接到互聯(lián)網(wǎng)以訪問來自這些設備的數(shù)據(jù)。我們知道,由于5G 使用的頻率較高,根據(jù)無線信號衰減原理,信號衰減與頻率的平方成正比,可知,5G 的無線覆蓋就會受到限制,特別是在FR2(頻率2,即大于6 GHz)頻率下,相同覆蓋面積要求的基站數(shù)量差不多要增加一個數(shù)量級,由于基站密集且數(shù)量眾多,基站的密集部署會要求網(wǎng)絡做到自維護、自優(yōu)化,因為大量的基站不可能靠人工來維護與優(yōu)化,另一方面,提供全覆蓋、廣連接且穩(wěn)定、可靠、高效的5G 網(wǎng)絡成為必然要求,而要達成這些目標,考慮到5G 網(wǎng)絡的復雜性,在5G 網(wǎng)絡中引入SON,與AI/ ML技術就成為一種必然趨勢。我們知道,自動網(wǎng)絡駕駛與人工智能技術都是依賴于大數(shù)據(jù)的,即所謂的“無數(shù)據(jù)不智能”,因此,數(shù)據(jù)采集技術就成為5G 引入SON 與AI 技術的必然前提條件。
3GPP 于12 月6 日-17 日召開RAN#94-e 次會議,確定了R18 的首批28 個課題成功立項,標志著5G-Advanced標準化正式啟動,相應的技術研究和標準化進入實際性階段,其中表1 中的3 個課題都需要數(shù)據(jù)采集才能支持。
表1 5G-Advanced 確定的其中3 個課題
其中表1 中的序號2、24、25 這3 個課題即5G 無線空口的人工智能/機器學習(AI/ML)、5G 無線網(wǎng)絡的人工智能/機器學習(AI/ML)、SON/MDT自動網(wǎng)絡駕駛增強,它們都依賴于無線網(wǎng)絡數(shù)據(jù)信息的采集。正如我們所知道的,“無數(shù)據(jù)不智能”,所有的人工智能/機器學習一定是建立在大數(shù)據(jù)之上的,而大數(shù)據(jù)本身除了分析之外,最基本的還包括數(shù)據(jù)的來源、數(shù)據(jù)的有效性、數(shù)據(jù)的采集方法等內(nèi)容,本課題正是針對最基本的數(shù)據(jù)源采集的技術研究。下面是引用的5G R18 中幾個最新的提案內(nèi)容。
5G 無線空口的人工智能:確定引入人工智能/機器學習的目標是增強性能與降低復雜度與開銷,主要研究AI/ML 在物理層的應用,包括智能波束管理/移動性自動預測、信道狀態(tài)信息(CSI)智能反饋、非視距(NLOS)的定位精度提升、基站與終端協(xié)作級別、空口AI 的建模架構與評估方法,以及評估AI/ML 帶來的性能增益與潛在影響等內(nèi)容。該項課題對數(shù)據(jù)源的實時性要求比較高,因此,數(shù)據(jù)的采集與上報要求毫秒級或者準實時完成。
5G 無線網(wǎng)絡的人工智能:為了更好的支持基于AI/ML(機器學習)的業(yè)務,研究數(shù)據(jù)采集增強、支持現(xiàn)有NG-RAN 接口的信令流程、以及基于AI/ML 的網(wǎng)絡能源節(jié)約、負載均衡與移動性優(yōu)化的整體架構設計,包括不分離架構與分離架構。該課題對數(shù)據(jù)源的有效性與完備性要求較高,能夠支撐無線網(wǎng)絡的智能控制,而對實時性要求不高,數(shù)據(jù)的采集與上報要求秒級完成。
SON/MDT 增強:支持SON 特性的數(shù)據(jù)采集,包括支持雙連接、多載波、系統(tǒng)間語音切換等,支持隨機接入信道(RACH)增強的SON/MDT(Minimization of Drive Test)增強,推動5G 網(wǎng)絡實現(xiàn)更高效的自動網(wǎng)絡駕駛功能。該課題對數(shù)據(jù)源的有效性與完備性要求較高,能夠支撐無線網(wǎng)絡的智能控制,而對實時性要求不高,數(shù)據(jù)的采集與上報可以分鐘級完成。
我們都知道,人工智能與網(wǎng)絡自動駕駛必然基于網(wǎng)絡數(shù)據(jù),而網(wǎng)絡數(shù)據(jù)的采集就成為了首要條件。人工智能以及網(wǎng)絡自動駕駛都依賴于無線網(wǎng)絡數(shù)據(jù),而無線網(wǎng)絡數(shù)據(jù)包括無線信號質(zhì)量類數(shù)據(jù)、無線網(wǎng)絡本身運行的數(shù)據(jù)、無線業(yè)務數(shù)據(jù)、無線網(wǎng)絡KPI 數(shù)據(jù)等,需要強調(diào)的是,這些數(shù)據(jù)可能產(chǎn)生于不同的節(jié)點,本文聚焦5G 網(wǎng)絡無線基站的數(shù)據(jù)采集技術,即包括:為了滿足5G 空口的人工智能化、無線網(wǎng)絡的人工智能化與無線網(wǎng)絡自動駕駛三種應用,應該采集什么樣的數(shù)據(jù)、數(shù)據(jù)的組織方式、數(shù)據(jù)采集的觸發(fā)規(guī)則與采集&上報的時間&頻度等,從而保證數(shù)據(jù)采集的及時性/實時性、高效性與可靠性,滿足該場景下人工智能與自動網(wǎng)絡駕駛的應用需求。
為了便于下面的設計方法理解,圖1 給出了5G 無線網(wǎng)絡的簡化架構及接口[19,20],其中的核心網(wǎng)用5GC(5G Core)表示,Ng 接口是5G 基站gNB 與5GC 之間的接口,Xn 接口是gNB 與gNB 之間的接口,F(xiàn)1 接口是gNB 內(nèi)部分離成的gNB-CU(Central Unit,中心單元)與gNB-DU(Distributed Unit,分布單元)之間的接口。
圖1 5G 網(wǎng)絡簡化架構及接口
3.2.1 采集數(shù)據(jù)的設計原則
根據(jù)5G 網(wǎng)絡的數(shù)據(jù)生成規(guī)則及對象,我們把數(shù)據(jù)分為三大類,第一類是網(wǎng)絡KPI(Key Performance Indicator)數(shù)據(jù),主要對象是小區(qū)級的非實時數(shù)據(jù),一般按照分鐘級統(tǒng)計(說明:站點級別的數(shù)據(jù)主要是傳輸網(wǎng)絡的數(shù)據(jù),本文暫不涉及),對應話統(tǒng)指標,主要用于網(wǎng)絡觀察與評估;第二類是用戶級或用戶承載級或小區(qū)級的準實時數(shù)據(jù),一般按照秒級統(tǒng)計,主要用于解決網(wǎng)絡故障與無線網(wǎng)絡優(yōu)化;第三類是用戶級或承載級的實時數(shù)據(jù)采集,一般是毫秒級別,主要用于實時算法。三類數(shù)據(jù)的關系是第三類數(shù)據(jù)是TTI(傳輸時間間隔,Transmission Time Interval)級的采樣或檢測,但不進行數(shù)據(jù)采集,即數(shù)據(jù)用后即丟棄,所以不在本文的討論范圍;第一類數(shù)據(jù)可以由第二類數(shù)據(jù)匯總而成,可以認為是第二類數(shù)據(jù)的大尺度匯總統(tǒng)計結果。因此,本文聚焦第二類數(shù)據(jù)源的采集方法研究。
根據(jù)5G 網(wǎng)絡數(shù)據(jù)源產(chǎn)生的時間規(guī)則,我們把數(shù)據(jù)源分為兩種類型,即事件性數(shù)據(jù)源與周期性數(shù)據(jù)源。事件性數(shù)據(jù)源就是網(wǎng)絡中的某個事件觸發(fā)產(chǎn)生的數(shù)據(jù),比如網(wǎng)絡發(fā)生切換時,會首先有UE 測量上報事件,對應標準定義的事件性A1/A2/A3/A4/A5/A6/B1/B2 測量報告,然后是切換事件,切換事件由于涉及到切出基站與切入基站,而兩個基站間不可能協(xié)同產(chǎn)生一份切換事件數(shù)據(jù),因此,需要切出基站產(chǎn)生一個切出事件的數(shù)據(jù),而切入基站產(chǎn)生一個切入事件的數(shù)據(jù),上層應用如果要針對切換過程進行分析,就至少需要關聯(lián)這兩個切出與切入事件的數(shù)據(jù)。周期性數(shù)據(jù)源是周期性的檢測或統(tǒng)計的數(shù)據(jù),比如UE 周期性測量上報的無線信號質(zhì)量信息,對應標準定義的周期性測量報告(MR,Measurement Report)。
眾所周知,數(shù)據(jù)源只是一些基礎數(shù)據(jù),而各種上層應用可能需要其中一部分數(shù)據(jù),也可能需要較多數(shù)據(jù),而5G 網(wǎng)絡產(chǎn)生數(shù)據(jù)的方式跟數(shù)據(jù)來源強相關,比如用戶級數(shù)據(jù)是針對每個網(wǎng)絡用戶產(chǎn)生的數(shù)據(jù)源信息,而用戶承載級數(shù)據(jù)是針對各用戶的承載來產(chǎn)生的數(shù)據(jù)源,而小區(qū)級數(shù)據(jù)則是小區(qū)內(nèi)各用戶匯總的瞬時統(tǒng)計量/累積統(tǒng)計量。為了滿足上層應用的統(tǒng)計分析,需要有相關數(shù)據(jù)事件的關聯(lián)信息,比如屬于同一個用戶的兩個事件塊關聯(lián)分析,就要求兩個事件塊是同一個用戶的,而且時間點上要對齊,同時基站上的用戶標識都是臨時有效的,即相同的標識在不同時刻可能表示不同用戶。
3.2.2 事件塊名稱與事件塊頭設計
基于前面的設計原則,我們首先區(qū)分不同事件塊的級別,分為站點級、小區(qū)級、用戶級、用戶承載級4 個級別,并且用事件名稱的開頭字母分別區(qū)分,比如站點級的為S_開頭命名,小區(qū)級的為C_開頭命名,用戶級的為U_開頭命名,用戶承載級的為B_開頭命名,且事件塊標識(ID)也進行相應的區(qū)分,比如用戶級的為1 開頭的事件ID,用戶承載級的為3 開頭的事件ID。具體設計的事件塊命名示例如表2 所示。
為了方便多事件塊的關聯(lián)分析,每個事件塊都設計了相同的事件塊頭,即事件塊頭包含時間信息、運營商設備信息、小區(qū)信息、用戶臨時標識、Ng 接口應用標識APID、F1 接口應用標識APID、事件塊本身標識等信息,具體的事件塊頭設計示例如表3 所示。
3.2.3 典型事件塊設計示例
表2 事件塊命名示例(僅含典型的幾個事件塊)
表3 事件塊頭設計示例(僅含主要字段)
為了更好地描述事件塊設計的方法,下面以前面介紹過的切換出事件塊與同頻周期性事件塊作為示例介紹設計思路,其他事件塊的設計可以參考借鑒,再贅述。
切換出事件塊設計思路:需要包含切換原因,切換類型,比如Xn 口切換、Ng 口切換等不同切換類型,切換的Xn 接口的應用標識APID,目標基站信息及其頻點,切換時長以及可能的切換失敗原因等內(nèi)容,特別是可以巧妙設計的最后一條失敗信令可用于快速判定失敗點。具體的切換出事件塊設計示例如表4所示。
周期性同頻測量事件塊設計思路:需要包含頻點信息,服務小區(qū)與鄰小區(qū)的物理小區(qū)標識及其無線信號測量結果,以及滿足條件的SSB(Synchronization Signal and Physical Broadcast CHannel block,同步信號和PBCH 塊)波束的無線信號測量結果,為了方便分析建議波束的排序按照RSRP(Reference Signal Receiving Power,參考信號接收功率)的信號強弱排序。具體的周期性同頻測量事件塊設計示例如表5 所示。
3.2.4 設計的數(shù)據(jù)源采集
前面只是設計了相關的事件塊,但真實的數(shù)據(jù)采集需要在基站設備中選擇希望采集的事件塊名稱以及配置相關參數(shù)才能觸發(fā)采集流程。所有事件塊都有小區(qū)、采集起止時間等參數(shù),而周期性事件塊還需要輸入周期參數(shù),比如采集周期是5 秒或者10 秒等數(shù)值。需要說明的是,可以在網(wǎng)管操作界面或者其他方式來設置這些參數(shù),只要有對應的配置接口即可。另外,采集到的數(shù)據(jù)還需要考慮保存到何處,比如基站的OMU(操作維護單元)或者保存在網(wǎng)管平臺。
本文介紹的5G 數(shù)據(jù)采集的設計方法已經(jīng)在相關設備廠商的5G 基站設備中實現(xiàn)了數(shù)據(jù)采集,并已逐步用于5G SON 設計。隨著5G 引入AI,對基站設備的數(shù)據(jù)采集會提出更多的需求,當然反過來也會助推AI 在5G 的快速落地與應用。本文的數(shù)據(jù)采集設計方法除了可應用于5G 基站,也可以適用于其他類似的無線站點的數(shù)據(jù)采集設計,包括未來的6G 基站等。
表4 切換出事件塊設計示例(僅含主要字段)
表5 周期性同頻測量事件塊設計示例(僅含主要字段)