• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      應(yīng)用梯度提升樹的小區(qū)域無線網(wǎng)絡(luò)多標簽流量預測*

      2022-06-28 06:53:04杜施默陳國軍周海驕
      電訊技術(shù) 2022年6期
      關(guān)鍵詞:無線網(wǎng)絡(luò)基站標簽

      杜施默,陳國軍,陸 敏,張 晨,周海驕

      (中國移動通信集團浙江有限公司杭州分公司,杭州 310015)

      0 引 言

      隨著科學技術(shù)的進步以及互聯(lián)網(wǎng)內(nèi)容的延伸發(fā)展,網(wǎng)絡(luò)早已從一種先進的傳播方法發(fā)展成為人們一種不可或缺的生活方式。根據(jù)思科對網(wǎng)絡(luò)發(fā)展的預測,用戶數(shù)與無線流量不斷攀升,移動流量將以每年42%的速度增長[1],然而重要城區(qū)內(nèi)基站密度已趨于飽和,無線承載網(wǎng)絡(luò)面臨巨大的壓力。因此,收集各項歷史信息發(fā)掘基站流量變化規(guī)律以對鏈路流量進行準確的預測極為必要[2]。合適的網(wǎng)絡(luò)流量預測方法一方面能夠指導網(wǎng)絡(luò)管理與調(diào)度,提高整個網(wǎng)絡(luò)的數(shù)據(jù)傳送效率[3-4];另一方面針對流量預測結(jié)果優(yōu)化資源配置,防止流量擁塞,提高用戶體驗質(zhì)量[5]。

      當前研究多是探尋歷史流量間的關(guān)聯(lián)關(guān)系從而進行預測,然而考慮到無線基站流量與其覆蓋范圍內(nèi)用戶數(shù)及用戶流量使用行為息息相關(guān),上述方法存在一定局限性,即預測樣本較為單一,并未將基站周邊多維度環(huán)境因素考慮進來。因此,有學者將目光轉(zhuǎn)向基于環(huán)境因素的無線網(wǎng)絡(luò)流量預測[2,6-7]。然而,當前無線通信一個重要的特點是與用戶聚集性和聚集群體的偏好強相關(guān),上述幾種方法均是將相對平穩(wěn)的外界信息源作為預測模型的輸入,并未將此類突發(fā)性納入考慮。

      因此,本文以指導無線網(wǎng)絡(luò)臨時性活動保障前軟硬件擴容為目的,將有效捕獲影響臨時性流量的波動特征,并在該特征的基礎(chǔ)上實現(xiàn)對臨時性流量預測作為本文研究思路的核心,提出基于梯度提升樹(Gradient Boosting Decision Tree,GBDT)的多標簽無線網(wǎng)絡(luò)流量預測方法。本文以無線網(wǎng)絡(luò)中忙時流量預測為框架,以“天”為采集時間間隔,以“小時”為采集樣本粒度,研究適合小區(qū)域突發(fā)性流量的預測方法(每天最大單小時流量),以指導臨時性活動前的資源分配。

      對于小區(qū)域內(nèi)的網(wǎng)絡(luò)資源投入,由于缺乏準確有效的流量預測方法,當前的網(wǎng)絡(luò)資源主要根據(jù)活動類型,依靠優(yōu)化人員經(jīng)驗測算此區(qū)域在后續(xù)時間段內(nèi)的流量最大值,從而計算資源投入量。本文從電力負荷預測中環(huán)境因素的相關(guān)概念方法中得到啟示,將外部環(huán)境考量用于小區(qū)域的網(wǎng)絡(luò)流量預測,以應(yīng)對現(xiàn)網(wǎng)用戶區(qū)域性聚集及流量突發(fā)性增長。

      1 小區(qū)域無線網(wǎng)絡(luò)流量特征分析

      1.1 日常無線網(wǎng)絡(luò)流量趨勢分析

      鑒于無線網(wǎng)絡(luò)流量是由該基站覆蓋區(qū)域內(nèi)的用戶行為信息匯聚而成,流量預測本質(zhì)上說就是將用戶行為引發(fā)的流量變動趨勢挖掘出來。從圖1可以發(fā)現(xiàn),大區(qū)域流量由于范圍擴大模糊了小區(qū)域流量中用戶聚集帶來的突發(fā)性,其自相關(guān)性明顯增強,大區(qū)域流量預測方法不再適用于小區(qū)域。

      (a)小區(qū)域流量變動趨勢

      (a)大區(qū)域流量變動趨勢圖1 無線網(wǎng)絡(luò)忙時流量變動趨勢

      因此,針對突發(fā)性明顯的無線網(wǎng)流量序列,僅利用歷史數(shù)據(jù)中包含的信息不足以形成精確預測。因此,本文進行反向思考,從影響用戶行為的外部因素入手,量化外部因素的貢獻度,從而實現(xiàn)預測流量。

      1.2 外部各因素影響分析

      考慮引起用戶聚散、流量突增或陡降的原因,大體可分為天氣因素、覆蓋場景、日類型、活動事件類型等,小區(qū)域內(nèi)主要影響因素的選擇直接影響到預測精度。為選取合適的外部影響因素,衡量對于流量變動的貢獻,本文以信息增益分析。

      1.2.1 天氣對流量影響分析

      天氣因素對當日流量大小有著較大影響,例如發(fā)生高溫、降雨等。由于天氣因素對于當日流量的影響具有“隱含性”,即天氣因素對于流量的貢獻度隱含于歷史流量序列中,當天氣因素無明顯變動時僅使用平穩(wěn)時間序列預測便有可能利用隱含天氣信息得出較準確的預測結(jié)果;但當天氣因素明顯改變時,其信息無法從歷史流量序列中體現(xiàn)出來,必須另作考量。參照基本成熟的電力負荷預測領(lǐng)域[8],流量預測相關(guān)天氣特征提取如表1所示。

      表1 天氣因素特征提取及說明

      1.2.2 覆蓋場景對流量影響分析

      日常運維發(fā)現(xiàn),基站流量與其覆蓋場景強相關(guān),為量化各覆蓋場景類型對流量的貢獻度,本文采用2020年8~10月OMC上采集的基站流量數(shù)據(jù),計算信息增益進行衡量。為突顯覆蓋場景對于流量影響,本文對同一地市內(nèi)同類型場景進行流量匯聚,以平衡特殊活動事件帶來的影響。

      對全網(wǎng)基站忙時流量分布進行統(tǒng)計,得到其概率分布(Probability Density Function,PDF)如圖2所示。

      圖2 全網(wǎng)基站忙時流量概率分布圖

      分析圖2可知,覆蓋場景對于基站忙時流量有著明顯的影響。以全網(wǎng)綜合流量分別作為對照,忙時流量分布近似于對數(shù)正態(tài)分布,風景區(qū)流量的分布較為集中,醫(yī)院場景流量的分布較為平均。為進一步量化覆蓋場景對于忙時流量的貢獻大小,本文以熵為切入點,計算考慮覆蓋場景后忙時流量不確定性減少的程度(即信息增益)。

      綜合場景內(nèi)的忙時流量可看作是一個連續(xù)信源,則不考慮場景時忙時流量的信息熵為

      (1)

      式中:X代表綜合場景下的某站的忙時流量,流量的大小用x表示,p(x)則代表此忙時流量為x的概率,Hc(X)為X的信息熵即事件X出現(xiàn)的不確定性。

      當加入X的場景信息Y后,X的不確定性降低至式(2)所示:

      (2)

      式中:yi(i=1,2,…,n)表示n個場景中的某一種(如y1代表居民區(qū))。如此可得到每類場景對應(yīng)忙時流量的不確定性減少量,如式(3)所示:

      Gaini(X,Y)=Hc(X)-Hc(X|Y=yi)。

      (3)

      得到各場景下的信息增益如圖3所示,其中山農(nóng)木林由于流量較小,且與現(xiàn)網(wǎng)其他場景流量相比最為明顯,其信息增益最大;居民區(qū)、集貿(mào)市場的流量由于用戶活動行為與現(xiàn)網(wǎng)無明顯差異,其信息增益較小。根據(jù)信息增益篩選貢獻明顯的覆蓋場景作為特征項,選取“風景區(qū)、交通樞紐、鄉(xiāng)鎮(zhèn)村莊、校園(高校)、校園(中小學)、寫字樓/企事業(yè)單位、休閑娛樂場所、工業(yè)園區(qū)、醫(yī)院、山農(nóng)牧林、大型場館/廣場公園、其他”分別用0~11表示。

      圖3 覆蓋場景信息增益

      1.2.3 日類型對流量影響分析

      基于電力負荷預測中對于日類型的影響的分析,本文選取相關(guān)特征因素如表2所示。

      表2 日類型因素特征提取及說明

      1.2.4 活動事件對流量影響分析

      本文通過整理日常網(wǎng)絡(luò)運維過程中的輿情上報信息,選取特殊活動事件如表3所示。

      表3 活動事件因素特征提取及說明

      2 基于GBDT的流量預測方法

      基于第1小節(jié)中的流量特征分析可以得出,天氣、場景及特殊事件對無線網(wǎng)絡(luò)流量的影響不可忽視。然而,當前對于網(wǎng)絡(luò)流量的研究成果中并沒有考慮此類因素的影響,導致無法精確指導優(yōu)化維護人員進行網(wǎng)絡(luò)擴容[9-10]。因此,本文在充分考慮整合移動平均自回歸(Autoregressive Integrated Moving Average,ARIMA)模型與日常網(wǎng)絡(luò)流量自相似性的匹配優(yōu)勢的基礎(chǔ)上,結(jié)合決策樹對多標簽樣本預測的方法,將日常等比流量預測結(jié)果嵌入到?jīng)Q策樹中,構(gòu)建多標簽預測模型。

      2.1 多標簽流量預測模型

      考慮到手機已然成為日常生活中不可或缺的社交工具,當前無線流量中承載著豐富的用戶行為活動信息,如此流量的波動趨勢必然與用戶的活動息息相關(guān)。進一步,本文在日常流量自相似性模型的基礎(chǔ)上,從終端行為考慮用決策樹分類方法加以校正。預測模型總體結(jié)構(gòu)如圖4所示。

      圖4 多標簽流量預測模型

      2.2 基于ARIMA的日常增長等比預測方法

      為最大程度上弱化流量的突發(fā)性,本文借助宏觀上全網(wǎng)大尺度流量變動趨勢,模糊場景及特殊事件對局部流量的影響,以觀測日常流量增長趨勢。本文中以日常等比預測指代。

      利用擴展的迪克富勒檢驗(Augmented Dickey-Fuller,ADF)判斷流量序列平穩(wěn)性,得到p值為0.167,大于判斷標準值0.05,說明流量序列為非平穩(wěn)序列。進一步,對原始流量進行一階差分得到P值為0.000 013,一階差分序列滿足平穩(wěn)性要求。圖5為對差分后的數(shù)據(jù)定階,可以看到自相關(guān)和偏相函數(shù)均具有拖尾的特點,且都存在明顯一階相關(guān)性,即可用ARIMA模型(1,1,1)擬合,如式(4)所示。

      (a)自相關(guān)函數(shù)(ACF)

      (b)偏自相關(guān)函數(shù)(PACF)圖5 流量相關(guān)分析

      (1-αB)(1-B)×Xt=(1-βB)×εt。

      (4)

      式中:B為滯后算子,(1-αB)為自回歸系數(shù),(1-B)為差分算子,(1-βB)稱為滑動平均系數(shù),εt為零均值白噪聲。

      2.3 基于梯度模型樹的流量預測方法

      鑒于無線網(wǎng)絡(luò)流量對于外部因素的敏感性,本文以GBDT引入外部影響因素y參與訓練流量序列Xt的預測模型訓練提高預測準確性,初始化弱學習器如式(5)所示:

      (5)

      式中:N為訓練樣本數(shù)量,F(xiàn)0為初始模型,γ為使損失函數(shù)L最小的常數(shù)值。對于第m次迭代(迭代輪數(shù)m=1,2,…,M),以找到損失L最小的弱學習器為目標,更新強學習器。其中m次迭代的第t個值的損失函數(shù)負梯度可表示為

      (6)

      用(yt,rmt)擬合第m顆CART回歸樹,針對葉子節(jié)點區(qū)域Rmj(j=1,2,…,J,J為葉子節(jié)點個數(shù))計算最佳擬合值:

      (7)

      即m次迭代后的預測模型Fm為

      (8)

      式中:I為指示函數(shù),

      (9)

      得到強學習器:

      (10)

      3 預測效果驗證與分析

      3.1 模型預測結(jié)果

      本文采集2020年10月某小區(qū)域的流量樣本進行預測效果對比分析。由于本文目的是借助流量預測結(jié)果指導資源投放,因此采用每日忙時流量(一小時內(nèi)最大流量)進行預測效果驗證。

      首先選取同時段大區(qū)域流量進行ARIMA一步預測(即根據(jù)10月1~16日數(shù)據(jù)擬合模型參數(shù))進行對比分析,第2節(jié)中已根據(jù)自相關(guān)與偏自相關(guān)函數(shù)確定模型階數(shù)為ARIMA(1,1,1),本文使用Python建立ARIMA模型,預測結(jié)果如圖6所示。

      圖6 流量預測結(jié)果對比

      同時,BP神經(jīng)網(wǎng)絡(luò)(Back Propagation Neural Network,BPNN)的預測值也在圖6中示出,取500個數(shù)據(jù)用于訓練預測模型,鑒于流量序列具有一定的周關(guān)聯(lián)性,輸入層節(jié)點數(shù)為7(即以上一周的流量數(shù)據(jù)為輸入數(shù)據(jù)),單隱藏層由三個隱藏節(jié)點組成,且輸入時滯為5、輸出層節(jié)點數(shù)為1(預測一天的數(shù)據(jù),即一步預測)。

      多標簽預測則是首先建立ARIMA(1,1,1)模型,其參數(shù)與對比算法相同,后用Python 的機器學習擴展包sklearn 實現(xiàn),將300組歷史數(shù)據(jù)集用于GBDT訓練,輸入為第1節(jié)中分析的各特征項及ARIMA預測結(jié)果。其中參數(shù)設(shè)置通過網(wǎng)格搜索法選取最佳參數(shù),損失函數(shù)采用均方誤差。最終模型訓練結(jié)果為:學習率0.1,決策樹最大深度4,決策樹個數(shù)160。

      從圖6可以看出,由于匯聚區(qū)域較小,實際流量具有很大的突發(fā)性,ARIMA模型由于僅依靠歷史數(shù)據(jù)進行訓練很難適應(yīng)外部因素引起的突發(fā)趨勢;神經(jīng)網(wǎng)絡(luò)模型雖然同樣依靠歷史數(shù)據(jù),但部分影響流量的外界因素已隱含在訓練序列中,如“工作日”“活動場所”等,其預測準確度相對于ARIMA有所提升;多標簽預測則由于盡可能多地將外部影響因素考慮進來,預測結(jié)果更加準確,尤其在突發(fā)趨勢擬合上更具優(yōu)勢。

      3.2 預測誤差對比

      本文以相對均方根誤差(Relative Root Mean Square Error,RRMSE)和平均相對誤差(Mean Absolute Percentage Error,MAPE)為衡量標準,分別如式(11)和(12)所示:

      (11)

      (12)

      小區(qū)域多標簽預測模型與ARIMA預測、PBNN預測結(jié)果的比較(訓練模型與3.1節(jié)相同,共選取100個區(qū)域參與模擬預測,即N=100),各項預測算法誤差在表4中列出。

      表4 預測結(jié)果比較

      從表4中的預測結(jié)果可以得出,多標簽預測在RRMSE、MAPE上表現(xiàn)出明顯的優(yōu)越性;ARIMA預測由于僅依據(jù)近期流量本身的信息進行參數(shù)擬合,將其用于突發(fā)性極強的小區(qū)域流量預測會產(chǎn)生較大的誤差;神經(jīng)網(wǎng)絡(luò)方法雖然在預測領(lǐng)域廣為應(yīng)用,但同樣由于未考慮外部影響因素,其預測誤差高于多標簽預測方法。

      4 結(jié) 論

      本文在充分分析小區(qū)域通信網(wǎng)絡(luò)流量特征之后,利用外部因素對流量的影響程度構(gòu)建適用于小區(qū)域范圍內(nèi)通信網(wǎng)流量的預測算法。仿真結(jié)果表明,本文提出的多標簽預測算法相對于當前單純依靠歷史數(shù)據(jù)的流量預測方法能夠提供更加準確的預測結(jié)果,從而為下一步的網(wǎng)絡(luò)資源合理分配提供研究基礎(chǔ),實現(xiàn)網(wǎng)絡(luò)運維工作由被動防御走向主動優(yōu)化。

      猜你喜歡
      無線網(wǎng)絡(luò)基站標簽
      濾波器對無線網(wǎng)絡(luò)中干擾問題的作用探討
      無懼標簽 Alfa Romeo Giulia 200HP
      車迷(2018年11期)2018-08-30 03:20:32
      不害怕撕掉標簽的人,都活出了真正的漂亮
      海峽姐妹(2018年3期)2018-05-09 08:21:02
      可惡的“偽基站”
      探索科學(2017年4期)2017-05-04 04:09:47
      無線網(wǎng)絡(luò)的中間人攻擊研究
      基于GSM基站ID的高速公路路徑識別系統(tǒng)
      標簽化傷害了誰
      TD-LTE無線網(wǎng)絡(luò)高層建筑覆蓋技術(shù)研究與應(yīng)用
      移動通信(2015年17期)2015-08-24 08:13:12
      小基站助力“提速降費”
      移動通信(2015年17期)2015-08-24 08:13:10
      基于多進制查詢樹的多標簽識別方法
      計算機工程(2015年8期)2015-07-03 12:20:27
      时尚| 鲜城| 湖南省| 历史| 大渡口区| 合作市| 尖扎县| 突泉县| 巴彦县| 枞阳县| 福安市| 鄢陵县| 萨迦县| 夏河县| 苗栗市| 阿克| 永登县| 庆阳市| 汉源县| 化州市| 罗平县| 灵川县| 洱源县| 天水市| 东乡县| 饶河县| 鞍山市| 新闻| 合川市| 曲阳县| 北流市| 舞阳县| 金乡县| 三明市| 勐海县| 淮南市| 牟定县| 旬邑县| 七台河市| 临高县| 江西省|