(中國聯(lián)合網(wǎng)絡通信有限公司網(wǎng)絡技術研究院,北京 100048)
隨著移動通信網(wǎng)絡建設規(guī)模逐年增加,通信設備對能源的需求與日俱增,移動通信網(wǎng)絡的能耗在運營商的運營成本(OPEX,Operating Expense)占比已高于15%。經(jīng)過5G 試商用網(wǎng)絡的測試驗證,5G 單站功耗是4G 單站功耗的3~4 倍,運營商面臨基站設備能耗大幅增加OPEX費用的運營壓力。當通信行業(yè)邁入5G 時代,通信設備的智能節(jié)能對降低5G 網(wǎng)絡運營成本,實現(xiàn)通信行業(yè)節(jié)能減排目標具有重要意義。
傳統(tǒng)的基站設備節(jié)能方案依賴于主設備廠家在硬件、軟件等產(chǎn)品設計和持續(xù)優(yōu)化能力。硬件方案,新設備可以通過使用新工藝、新材料、新設計等創(chuàng)新技術方案,實現(xiàn)降低設備硬件的基本能耗。軟件節(jié)能方案,通過智能符號關斷、深度休眠、通道關斷等軟件功能,在某些場景下實現(xiàn)降低基站能耗。硬件方案受限于器件、工藝的發(fā)展情況。軟件方案已支持單站的節(jié)能策略的配置,更需要綜合考慮全網(wǎng)節(jié)能最優(yōu)策略。
隨著5G 網(wǎng)絡智能化、云化架構的發(fā)展趨勢,結合大數(shù)據(jù)技術、人工智能技術等技術方案,5G 網(wǎng)絡智能能耗管理可以實現(xiàn)節(jié)能策略智能化選擇、參數(shù)配置自動化、效果評估全面化,從而達到全網(wǎng)運行效率最優(yōu)、綜合節(jié)能效率最優(yōu)的“雙優(yōu)目標”。
為了滿足5G 豐富的業(yè)務場景的要求,3GPP R15 規(guī)范定義了NR 新空口標準,對5G 基站設備的硬件能力、軟件功能等都提出更高要求。例如,5G 基站需要支持更大帶寬,在Sub 6 GHz 頻段支持100 MHz 帶寬,毫米波頻段支持400 MHz 至800 MHz 帶寬,大帶寬對軟件、硬件處理能力要求更高,5G 基站的功耗需求也更大。
5G 有源天線處理單元(AAU,Active Antenna Unit)與傳統(tǒng)的4G 射頻拉遠單元(RRU,Radio Remote Unit)設備有很大差別,例如AAU 內(nèi)部集成了天線陣列、支持高達64 個射頻通道以及部分基帶功能等,這些使得AAU內(nèi)部在功放模塊、數(shù)字基帶、收發(fā)機等器件的功耗數(shù)值和功耗占比都有較大幅度增加。此外,AAU 的功耗還要考慮時鐘模塊、電源模塊、濾波器等其它模塊增加的熱耗。根據(jù)5G 基站功耗的測試數(shù)據(jù)分析,基站設備中AAU 設備(64T64R AAU)在5G 基站設備總能耗占比約90%,提高AAU 的能效水平可有效降低單站總能耗。
基站設備功耗包括靜態(tài)功耗和動態(tài)功耗,如圖1 所示。目前,5G 基站設備基礎功耗平均占比58%,動態(tài)功耗平均占比42%。基站的靜態(tài)功耗與基站設備硬件有關,可以通過硬件平臺升級來降低設備的基礎功耗?;净A功耗的降低手段包括基帶資源共享、器件動態(tài)關斷、AAU設備快速喚醒等硬件節(jié)能方案,主要依靠主設備廠家不斷演進硬件工藝、提高集成度來完成。動態(tài)功耗(主要是AAU 設備功耗)隨業(yè)務負荷波動,功耗變化與AAU設備業(yè)務負荷(業(yè)務量)變化相關,通過軟件功能優(yōu)化可提高動態(tài)能耗的有效利用率。軟件功能節(jié)能方式包括符號關斷、通道關斷、載波關斷、小區(qū)休眠、電源管理等。本文主要從軟件節(jié)能方案角度出發(fā),通過AI 算法預測忙閑時段的業(yè)務量,智能化設定不同基站的節(jié)電時間、節(jié)電方式,有效控制空閑基站的耗電量。
傳統(tǒng)的軟件節(jié)能方案主要依賴于話務統(tǒng)計經(jīng)驗,無法實現(xiàn)實時、跨網(wǎng)絡、靈活智能的節(jié)能管理全天候跨網(wǎng)絡智能化節(jié)能,管理效率與節(jié)能小區(qū)數(shù)量成反比,管理難度高、節(jié)能效果欠佳。隨著計算機硬件性能大幅提升及AI 技術的日益成熟,智能節(jié)能技術將突破傳統(tǒng)節(jié)能方案的實現(xiàn)瓶頸,可通過在網(wǎng)管系統(tǒng)增加AI 模塊用于智能節(jié)能控制,實現(xiàn)4G/5G 多制式網(wǎng)絡智能協(xié)同,支持網(wǎng)絡區(qū)域級、單基站、單扇區(qū)不同顆粒度的智能節(jié)能,并且達到高效、實時、靈活的基站能耗管理目標。
基站智能節(jié)能方案主要通過自動采集4G/5G 基站的業(yè)務量、性能數(shù)據(jù)、工參數(shù)據(jù)、運行指標、告警數(shù)據(jù)、B域數(shù)據(jù)等,按場景、區(qū)域、基站性質對基站進行分級管理,利用AI 算法對歷史業(yè)務量數(shù)據(jù)進行建模,通過業(yè)務量模型對基站進行業(yè)務預測,根據(jù)業(yè)務預測結果為基站制定差異化的節(jié)能策略,自動生成節(jié)能任務通過指令下發(fā)基站,在業(yè)務空閑時實施符號關斷、通道關斷、載波關斷、小區(qū)休眠、電源關斷等操作,在業(yè)務高峰時則自動將節(jié)能模式切換為正常模式,從而達到全天候、跨廠家、多網(wǎng)協(xié)同的系統(tǒng)級節(jié)能效果,如圖2 所示。
圖1 基站功耗分析示意圖
圖2 基站智能節(jié)能方案
數(shù)據(jù)采集需要按照基站業(yè)務過程、信令交換原則等,通過對接不同的數(shù)據(jù)來源庫,以一定粒度獲取需要的數(shù)據(jù)源,包括PM、MR、工參、基站配置等數(shù)據(jù)。然后,對獲取的數(shù)據(jù)進行提取解析、關聯(lián)匯聚,將原始數(shù)據(jù)存儲到節(jié)能方案所需的數(shù)據(jù)庫表格中。另外,需要對數(shù)據(jù)的規(guī)模進行探索分析,對不同規(guī)模的數(shù)據(jù)采取不同的存儲方式和處理工具。為了方便后續(xù)為基站節(jié)能提供深層次支撐服務,需要通過各種技術手段對數(shù)據(jù)進行組織或分析,包括缺失數(shù)值的處理、數(shù)據(jù)編碼、數(shù)據(jù)標準化、數(shù)據(jù)降維等。
數(shù)據(jù)采集和分析的過程中需要建立數(shù)據(jù)質量評估和監(jiān)控體系。在數(shù)據(jù)采集之后,需對數(shù)據(jù)質量進行評估,確定數(shù)據(jù)的可用性,以免因數(shù)據(jù)質量問題影響后續(xù)節(jié)能策略的分析。在數(shù)據(jù)處理的過程中需要監(jiān)控數(shù)據(jù)處理的步驟、時間、有效性等,避免因數(shù)據(jù)處理過程的中斷或錯誤導致后續(xù)節(jié)能分析的錯誤。
智能節(jié)能方案需結合運營商需求,按場景、價值區(qū)域、基站性質等對小區(qū)進行分級管理,即對節(jié)能小區(qū)制定差異化的節(jié)能調(diào)度方案,并且對不同小區(qū)設置節(jié)能調(diào)度優(yōu)先級。根據(jù)業(yè)務量特點可將小區(qū)劃分為不同場景,不同場景可實施不同的節(jié)能手段,具體小區(qū)可分為如圖3所示的場景1 至場景8 等情況。例如:場景1,話務量高、潮汐效應明顯小區(qū)(寫字樓、商場等),可實行載波關斷或深度休眠;場景5,話務量高、潮汐效應不明顯且持續(xù)高業(yè)務量區(qū)域(汽車站、火車站等),可實行符號關斷、通道關斷;場景6,白天和節(jié)假日話務量高(景區(qū)等),可實行載波關斷、符號關斷、通道關斷;場景7,夜間完全無業(yè)務(地鐵站等),可實行深度休眠、電源關斷。
圖3 小區(qū)場景分類圖
不同價值區(qū)域基站智能節(jié)能方案需要自動化設定不同的優(yōu)先級,對于熱點區(qū)域、口碑區(qū)域、重保區(qū)域盡量不實施節(jié)能操作,對于其他區(qū)域可依照整體話務量的多少分先后次序執(zhí)行節(jié)能策略。基站的性質對于節(jié)能方案的制定也有重要作用,比如使用頻段、4G/5G 網(wǎng)絡制式、是否為容量層等都會影響節(jié)能分級管理的策略。節(jié)能智能化分級管理主要通過AI 分類、聚類算法實現(xiàn)。每個小區(qū)的各項特征都由一個矩陣來描述,計算基站矩陣之間的距離,依據(jù)距離的大小將全部的基站分為不同的類簇,后續(xù)可為每個類簇制定節(jié)能優(yōu)先級并且選擇不同的預測模型。
業(yè)務精準預測的目的是在獲取的數(shù)據(jù)基礎上,通過歷史數(shù)據(jù)挖掘、實時業(yè)務統(tǒng)計、分場景業(yè)務模型分析得出待節(jié)能小區(qū)的預測結果。目前應用于業(yè)務量預測的智能算法主要有差分自回歸移動平均模型(ARIMA,Autoregressive Integrated Moving Average Model)、Prophet 模型、長短時記憶網(wǎng)絡(LSTM,Long Short Term Memory Network)模型等。差分自回歸移動平均模型是一種可加性回歸模型,該模型的特點是能夠對時間序列數(shù)據(jù)進行較準確的預測,但需要人工確定多個參數(shù),不利于批量模型的訓練。Prophet 模型也是一種可加性回歸模型,該模型的特點是建模效率高、模型準確性較高、適用性好、能夠自動適應空值、可配節(jié)假日、事件時間屬性等。LSTM 模型是基于循環(huán)神經(jīng)網(wǎng)絡的順序數(shù)據(jù)算法,該算法包含內(nèi)部存儲器,可以解決循環(huán)神經(jīng)網(wǎng)絡無法處理長距離的依賴的問題。LSTM 模型的特點是對于長期的時序數(shù)據(jù)有較好的預測準確性,但其建模的硬件性能與時間消耗較大,不利于批量訓練模型。
基站業(yè)務量由于受各種因素影響較多,變化趨勢呈現(xiàn)較多特性,往往利用單一時間序列預測算法或已有算法不能得到理想結果,在實際應用中還需要根據(jù)不同區(qū)域數(shù)據(jù)的特點設計算法、組合應用。
在不同的時間段,不同的區(qū)域,基站的使用率是不同的,為了更好地達到節(jié)電效果,需要實時地更改節(jié)能的策略。節(jié)能策略根據(jù)2.2 小節(jié)的小區(qū)分級結果及2.3 小節(jié)的業(yè)務量預測結果,根據(jù)不同節(jié)電策略對網(wǎng)絡的影響以及節(jié)電效果配置不同的生成時間段以及持續(xù)時長,通過策略為抓手使節(jié)能效果與網(wǎng)絡性能達到最佳狀態(tài)。節(jié)能策略需智能化地設定節(jié)能模型的優(yōu)先級、生效時長、節(jié)能閾值等。
節(jié)能策略的執(zhí)行需與設備廠商硬件網(wǎng)管OMC 對接,實現(xiàn)節(jié)能調(diào)度任務下發(fā)、節(jié)能方案執(zhí)行等功能。如圖4 所示,策略執(zhí)行主要是將生成的節(jié)能策略轉化為可在OMC 執(zhí)行的指令,然后獲取節(jié)能小區(qū)的互斥權限,判斷該小區(qū)是否正在執(zhí)行與節(jié)能指令互斥的操作,并且對節(jié)能小區(qū)的現(xiàn)網(wǎng)狀態(tài)及告警進行查詢解析,如果節(jié)能小區(qū)不存在互斥操作且狀態(tài)正常,則執(zhí)行小區(qū)節(jié)能關斷操作并且同步相應網(wǎng)元,執(zhí)行完成后需釋放小區(qū)的互斥權限并且檢查小區(qū)執(zhí)行后的狀態(tài)及告警。
圖4 節(jié)能策略執(zhí)行流程
智能節(jié)能方案需要建立全面的、一體化的評估體系,以保證網(wǎng)絡在實施節(jié)能策略時不降低網(wǎng)絡的運行質量,保證用戶的良好體驗。智能節(jié)能方案的評估體系主要包括指標評估、感知評估、節(jié)能評估、操作評估四個方面。指標評估主要是指針對執(zhí)行節(jié)能小區(qū)及補償小區(qū)構建實時指標分析機制,確保重要KPI 指標滿足要求,如指標惡化效果不佳及時進行回退處理。感知評估是指對節(jié)能方案實施后對用戶感知的分析,構建用戶感知指標分析機制,確保不生成犧牲用戶感知得來的節(jié)能方案。節(jié)能評估指對生成的節(jié)能方案產(chǎn)生的節(jié)能效果進行計算,評估節(jié)能效果,并根據(jù)評估的節(jié)能效果不斷優(yōu)化節(jié)能策略。操作評估主要是指對下發(fā)OMC 的節(jié)能指令執(zhí)行日志進行實時解析、分析,及時發(fā)現(xiàn)執(zhí)行失敗的指令,根據(jù)關鍵字段獲取小區(qū)的實時狀態(tài)。
與4G 網(wǎng)絡相比,5G 網(wǎng)絡能提供更高速率、更低時延、更大連接密度等網(wǎng)絡能力,也在承擔顯著增加的OPEX成本。據(jù)估算,5G 基站功耗是OPEX 成本中增量較大、增幅較高的支出成本。高效智能化的基站設備節(jié)能是未來5G 網(wǎng)絡發(fā)展的必然趨勢。5G 基站智能節(jié)能方案應結合通信行業(yè)產(chǎn)業(yè)鏈的實際發(fā)展情況,逐步降低商用設備基礎功耗,加快節(jié)能軟件功能的研發(fā)進度。同時,運營商需利用智能化技術,從網(wǎng)絡層面協(xié)同管理4G/5G 等多制式系統(tǒng)的能耗,推動4G/5G 智能協(xié)同節(jié)能方案的落地,以達到降低網(wǎng)絡能耗的目標。