李愛華,吳曉波,陳超,魏彬,史嫄嫄
(1.中國移動通信有限公司研究院,北京 100053;2.維沃移動通信有限公司,廣東 東莞 523000)
作為信息通信的基礎設施,5G將從“服務于人”走向“全面服務于數字化社會”。5G支持大帶寬、低延時和海量連接等場景,可服務于自動駕駛、工業(yè)控制、XR、云游戲等多樣化業(yè)務;同時,5G網絡云化帶來資源調度和運營管理的新挑戰(zhàn),多接入制式共存的網絡環(huán)境引發(fā)網絡協(xié)同的新難度,切片和邊緣計算等新技術對網絡可靈活編排和部署提出新訴求。5G多樣的業(yè)務需求、復雜的網絡形態(tài)以及靈活的部署要求,對網絡的規(guī)劃設計、開通部署、運維、運營都帶來了重大挑戰(zhàn),傳統(tǒng)的方式已經無法適應。但與此同時,多樣化的業(yè)務和海量終端,將為網絡提供更豐富的數字信息,為 5G網絡的發(fā)展和演進帶來新機遇。
人工智能(artificial intelligence,AI)技術在解決高計算量數據分析、跨領域特性挖掘、動態(tài)策略生成等方面,具備天然優(yōu)勢。5G網絡擁有海量數據,為人工智能賦能5G網絡大數據分析提供了重要基石。網絡大數據智能分析技術通過將網絡技術與人工智能技術、大數據技術深度融合,實現5G網絡的自動化和智能化功能,提高5G網絡的部署效益,優(yōu)化運行效率和資源利用率,降低網絡的運維成本。
網絡智能化在實際開展時,會面臨網絡體系大、領域多、規(guī)模大、端到端協(xié)同困難、網絡資源受限以及實時性、安全性、可靠保障性要求高等挑戰(zhàn)。因此,5G網絡大數據智能分析技術迫切需要思考并解決3個熱點問題,包括數據隱私的安全保護問題、跨平臺的模型共享問題以及網絡對業(yè)務識別的實時性和精準性問題。本文在總結 5G網絡大數據智能分析標準進展的基礎上,提出了 5G大數據智能分析系統(tǒng)架構和特征,并進一步分析和研究了5G網絡大數據智能分析的關鍵技術。
本節(jié)介紹了國際化標準機構在 5G網絡智能化方向的研究進展,包括第三代合作伙伴項目(3rd Generation Partnership Project,3GPP)、國際電信聯盟(International Telecommunication Union,ITU)和歐洲電信標準組織(European Telecommunications Standards Institute,ETSI)。
3GPP SA2 工作組在 3GPP Release15(Rel-15)首次引入了 5G網絡大數據分析網元網絡數據分析功能(network data analysis function,NWDAF),其功能單一,主要用于智能化切片選擇,于2017年12月完成;3GPP Rel-16定義了面向5G大數據分析服務的集中式架構,引入用戶體驗分析等6個特性,但在部署靈活性、可擴展性上存在局限,于2019年6月完成;3GPP Rel-17設計了分層智能網絡架構,提供AI平臺化能力,并將應用拓展到垂直行業(yè),具備在大型5G網絡商用的條件,于2021年12月完成;3GPP Rel-18面向toB/toC行業(yè),研究分布式智能架構、新型分析機制、新應用場景和跨域智能協(xié)同等課題,全面適應智能化試驗落地的需求,于2022年2月啟動相關研究工作。
面向網絡生命周期自動化的規(guī)劃、建設、維護、優(yōu)化等方面,3GPP SA5工作組開展了意圖驅動網絡、網管數據分析、5G能耗優(yōu)化等多項標準化工作,提出了管理數據分析功能(management data analytic function,MDAF),為網絡服務管理與編排帶來了智能化和自動化。MDAF基于網絡管理數據的數據處理和分析功能,可實現對網管領域數據價值挖掘,還可結合人工智能和機器學習技術輸出分析報告及相應的網絡管理操作建議,實現網管域的閉環(huán)管理。
ITU的 SG13研究組,聚焦于下一代網絡發(fā)展,工作重點是云計算、泛在網絡、分布式服務網絡、網絡虛擬化、軟件定義網絡、物聯網和節(jié)能網絡。SG13研究組于2017年11月成立了ML5G(Machine Learning for Futurre Netwok including 5G ,包含5G的未來網絡機器學習)焦點組,該小組在面向包括 5G在內的未來網絡方向起草了機器學習技術規(guī)范,包括接口、網絡架構、協(xié)議、算法和數據格式。ML5G焦點組在2019年6月至2020年7月,發(fā)布了“面向 IMT-2020 及未來網絡的機器學習數據處理框架標準”“面向IMT-2020和未來網絡的機器學習用例”“AI集成跨域網絡架構”以及“基于AI輔助分析的網絡切片管理編排”等智能化項目。
ETSI于 2017年 2月成立體驗式網絡智能(Experiential Networked Intelligence,ENI)行業(yè)規(guī)范小組,定義了認知網絡管理架構,即使用人工智能技術為 5G網絡提供自動化的服務提供、運營、保障以及優(yōu)化的切片管理和資源調度。ENI致力于研究使用人工智能技術來協(xié)助包括 5G在內的未來網絡的部署和運營等工作,并發(fā)布了應用案例、網絡需求與架構、網絡自治、智能等級分級及其評估方法、數據處理機制等多個系列規(guī)范和報告。
為了使AI更好地融合于5G核心網,在5G網絡中構建了以網絡數據分析實體 NWDAF為中心的智能化閉環(huán)運行網絡。NWDAF作為獨立的邏輯功能,專門負責數據采集、數據分析和分析結果反饋,5G大數據智能分析系統(tǒng)總體架構如圖1所示。
圖1 5G大數據智能分析系統(tǒng)總體架構
NWDAF是5G網絡的AI+大數據引擎,具備AI能力標準化、匯聚網絡數據、實時性更高、支持閉環(huán)可控等特點,滿足5G多樣化業(yè)務場景的需求。NWDAF作為3GPP在5GC中引入的標準化網元,其網絡架構、能力特性、接口及交互流程皆已規(guī)范化;NWDAF可打通5G控制面、管理面以及應用提供者應用功能(application function,AF),同時還具備獲取5G用戶面數據、UE側數據的能力,是網絡數據的匯聚點;NWDAF支持基于場景的定制化軟采的數據采集能力,其實時性處理和輸出能力更高;遵循 5G服務化架構,NWDAF分析結果能以服務調用的形式直接提供給策略控制等相關網元,形成基于信息感知的反饋和進一步閉環(huán)優(yōu)化,實現5G網絡的自優(yōu)化、自治、自愈。NWDAF為5G網絡端到端引入基于數據分析的AI提供了規(guī)范化的能力依據,可從根本解決異廠商割據等問題,有效凝聚產業(yè)力量,促進5G網絡和AI技術的深度融合。
本節(jié)針對目前行業(yè)內聚焦的5G網絡大數據智能分析技術迫切需要解決的熱點問題,提出了3項關鍵技術。其中,分布式可信智能數據分析技術能夠基于聯邦學習解決由于隱私保護等原因產生的數據“孤島”問題;跨平臺AI/ML模型共享技術基于公共的模型表示標準生成中間模型以實現跨平臺模型共享;智能業(yè)務識別技術能夠基于網絡數據結合NWDAF來解決應用標識與數據流量匹配的問題。
出于數據隱私保護考慮、漫游數據難以聚合、運營商和垂直行業(yè)之間數據無法互通等原因,5G網絡大數據往往以“孤島”的形式出現,且無法匯聚,數據集中式的模型訓練將無法開展,這在一定程度上制約了網絡智能化的發(fā)展;同時,移動網絡狀態(tài)隨機性高,在一些場景下,用于訓練的數據呈現分布式、碎片化、小樣本的特點,模型性能無法保障。因此,如何合理合法、充分高效地利用數據,成為5G網絡智能化迫切需要解決的問題。本文提出基于聯邦學習的5G分布式可信智能數據分析技術,通過5G與聯邦學習的結合,可在參與各方數據不出本地的基礎上,基于加密機制實現聯合訓練和共同建模,既保證了數據隱私的安全,還能充分利用各方數據,減少數據傳輸所帶來的帶寬占用。
3.1.1 分布式可信AI架構
為推動聯邦學習技術與5G網絡的結合,以及滿足用戶、運營商和行業(yè)的聯合建模需求,中國移動提出了面向聯邦學習的分布式可信AI架構,如圖2所示。
圖2 面向聯邦學習的分布式可信AI架構
在 5G網絡面向聯邦學習的分布式可信 AI架構中,根據聯邦學習涉及的領域,可分為域內聯邦、跨域聯邦以及全局聯邦 3個層次,涉及對象包括用戶、運營商和行業(yè)等建模需求方。中心協(xié)調者(central coordinator)提供跨界互通、任務協(xié)同、資源調度、安全認證等功能,運營商作為用戶與行業(yè)的紐帶,可作為中心協(xié)調者,在提供優(yōu)質服務的同時,協(xié)助用戶與行業(yè)解決跨域隱私的問題,打通數據“孤島”,打造先進的數據生態(tài)鏈、構建共享的產業(yè)生態(tài)、形成良好的智能商業(yè)模式。運營商側主要涵蓋網管和網絡功能節(jié)點(network function,5GNF),這些節(jié)點可承擔客戶(client)和協(xié)調者(coordinator)的雙重角色,作為協(xié)調者時協(xié)調域內/域間各節(jié)點間的聯邦學習,作為客戶時參與域內/域間各節(jié)點間的聯邦學習,例如核心網中 NWDAF既可協(xié)調域內NF/其他域聯邦學習,又可參與域內NF/其他域聯邦學習;用戶側UE與行業(yè)側AF均可作為協(xié)調者/客戶實現域內/域間聯邦學習。
3.1.2 關鍵使能技術
5G與聯邦學習需從場景、數據安全特性、網絡數據特點等角度進行定制化的深度融合。本文從場景角度考慮,介紹了面向5G網絡的橫向聯邦學習方法和縱向聯邦學習方法;從安全角度考慮,介紹了加密技術;從網絡數據特點及網絡性能需求角度考慮,介紹了面向聯邦學習的5G QoS保障技術。
(1)面向5G網絡的橫向聯邦學習
橫向聯邦學習也稱為特征對齊的聯邦學習(feature-aligned federated learning),即橫向聯邦學習的參與者的數據特征是對齊的,適用于參與者的數據特征重疊較多、而用戶ID重疊較少的情況。在橫向聯邦學習中,協(xié)調者負責模型安全聚合以及聚合后的模型參數加密分發(fā),參與方負責本地模型學習、加密上報。其典型應用場景(如不同區(qū)域的切片或子網)中 UE或者業(yè)務流的數據特征相同,需要聯合學習提高模型的泛化能力,如聯合業(yè)務檢測、聯合用戶行為分析等。
橫向聯邦學習在5G網絡架構中的應用如圖3所示,可以在5G核心網內部同一類型網元上針對不同用戶做相同特征的分析。中心NWDAF作為協(xié)調者,統(tǒng)一負責觸發(fā)模型訓練、終止模型訓練、獲取模型。區(qū)域 NWDAF及與 NF合同設立的NWDAF作為參與方,負責本地模型學習、加密上報與本地模型更新。5G NF并不直接參與數據共享,而是先由內部合設NWDAF進行數據分析,再發(fā)送加密后的子模型梯度給中心 NWDAF,中心NWDAF進行安全聚合后再發(fā)送更新后的模型梯度給區(qū)域 NWDAF或與 NWDAF合同設立的5G NF,區(qū)域NWDAF或與NWDAF合同設立的5G NF對模型進行更新。
圖3 橫向聯邦學習在5G網絡架構中的應用
(2)面向5G網絡的縱向聯邦學習
縱向聯邦學習也稱為樣本對齊的聯邦學習(sample-aligned federated learning),即縱向聯邦學習的參與者的訓練樣本是對齊的,適用于參與方的用戶ID重疊較多,但是數據特征重疊較少。在縱向聯邦學習中,協(xié)調者主要負責公鑰分發(fā)、模型參數加解密以及判斷模型訓練是否終止,參與方負責樣本對齊、本地模型參數學習、加密上報。其典型應用場景如同一個 UE或者同一個業(yè)務流的數據分布在不同域(如終端、網絡或者業(yè)務提供方)上,需要跨域數據分析,如業(yè)務體驗分析、聯合信用等級評估等。
縱向聯邦學習在5G網絡架構中的應用如圖4所示,可以用來解決5G網絡中基站、核心網、與應用服務器之間的數據隱私與數據隔離問題。無線基站、核心網以及應用服務器之間由于數據加密的限制,無法進行數據直接共享。NWDAF作為協(xié)調者,統(tǒng)一負責觸發(fā)模型訓練、終止模型訓練、獲取模型。
圖4 縱向聯邦學習在5G網絡架構中的應用
在數據采集過程中,每個數據隔離源都包括兩部分:可上報數據和不可上報數據。以線性回歸為例,需要考慮非線性模型的復雜度,并結合特征維度、樣本個數、迭代次數等評估中間變量傳輸帶來的信令開銷。比如,以線性回歸為例考慮在每次迭代時,各個數據隔離源都需要傳輸每個樣本的數據中間結果給AI訓練平臺,AI訓練平臺再傳輸每個樣本的數據中間結果給各個數據隔離源,輔助更新本地模型。縱向聯邦學習在5G網絡架構中的算法如圖5所示。
圖5 縱向聯邦學習在5G網絡架構中的算法
(3)面向5G網絡的加密技術
面向5G網絡的聯邦學習研究,需面向網絡場景,研究聯邦學習技術、安全多方計算、同態(tài)加密、差分隱私、可信執(zhí)行環(huán)境等隱私計算技術,進行定制化的研究、優(yōu)化和應用,實現聯邦學習在信息通信中的高效可靠落地。
縱向聯邦學習在 5G網絡的中的框架如圖6所示,可采用隱私集合求交進行基于用戶的數據對齊,對非交集內的用戶數據進行保護;可引入同態(tài)加密技術等來加密保護中間過程的信息,如梯度和參數信息,但是加密會帶來額外的計算代價,降低了運算的效率。
圖6 縱向聯邦學習在5G網絡中的框架
在5G網絡中的聯邦學習場景下,客戶端和服務端會傳遞梯度數據,而梯度的本質是原始數據的函數,所以通過梯度可以反推得到參與方的原始數據。無論是回歸方法還是深度學習,梯度的泄露可能會導致原始數據的泄露。為了避免原始數據的泄露,可采用差分隱私技術添加噪聲實現梯度的隱私保護,然而這種方式會降低分布式學習的收斂速度,一定程度上會損失訓練模型的精度??尚艌?zhí)行環(huán)境是一種芯片級的硬件安全計算技術,聯邦學習可以依靠這種方式實現更高的硬件層面的安全性能??傊槍W絡智能化應用場景,需選擇合適的安全解決方案,構建安全的大數據聯合學習框架,通過網絡、聯邦學習與其他安全技術有機融合、協(xié)同發(fā)展,在數據加密、計算加密、模型加密的基礎上,實現安全和效率的合理平衡。
(4)面向聯邦學習的5G QoS保障技術
面向5G網絡的聯邦學習研究,考慮5G網絡的數據特點以及對AI的性能需求特點,引入面向聯邦學習的QoS調度機制的網絡技術,從傳輸、QoS保障等方面支持聯邦學習,實現聯邦學習在信息通信中的高效可靠落地。
在聯盟準備階段,為選擇合適的節(jié)點進行聯邦學習,5G網絡需要將每個參與方節(jié)點的性能信息提供給協(xié)調者。聯邦參與方節(jié)點的性能需要從節(jié)點本身進行 AI處理的計算時間和模型結果的傳輸時間兩方面進行考慮,聯邦節(jié)點的性能分布如圖7所示。
圖7 聯邦節(jié)點的性能分布
其中,模型結果的傳輸時間與模型結果大小、QoS策略有關。因此,5G網絡應能夠感知UE的AI處理時間和需要傳輸的模型大小,從而相應地調整QoS策略。此外,參與聯邦學習的節(jié)點形成一個群體(flock),對于一個群體,總資源應該保持不變(或保持最大),以避免占用太多的無線資源而影響其他服務的正常使用。群體中的一個或幾個節(jié)點因上述的節(jié)點性能差異而落后于其他節(jié)點,會直接影響整個聯合學習的迭代效率。因此,可采用一種新的基于群組的QoS參數,從而使得網絡可以通過新的QoS策略,對組中各節(jié)點的QoS參數進行調整。由于整個群組的輸出性能受群組中最弱節(jié)點的性能的限制,因此,當這種情況發(fā)生時,網絡可以根據群組的QoS參數調整一些終端的 QoS 參數,為那些計算性能落后的UE分配更多的通信資源,為那些計算能力領先的終端分配更少的通信資源,分配給不同終端的資源至少保持一次迭代。通過這種方式,可以在保證不超過為整個群組分配的總資源的情況下,平衡不同節(jié)點的性能差異,實現聯邦學習的同步。
由于存在多個運營商網絡、多個終端/芯片廠商以及多個網絡設備廠商等復雜場景,如果AI/ML模型無法跨廠商/跨平臺共享,將極大限制5G智能化應用。因此,需要一個合適的模型共享方式,以保證在不同的操作環(huán)境(如Windows、UNIX等)、不同的編程語言(如C、Python等)以及不同的AI框架下都可以共享網絡結構和權重參數,實現不同節(jié)點之間AI模型信息的交互。
3.2.1 跨平臺模型共享通用架構
3GPP SA2在3GPP Rel-17定義了NWDAF的分析邏輯功能(analytics logical function,AnLF)和NWDAF 的模型訓練邏輯功能(model training logical function,MTLF)之間的AI/ML模型交互機制。AI/ML模型作為一個文件,只能在同廠商或者同一AI框架下使用,導致AI/ML無法跨廠商跨平臺共享,如圖8所示。
圖8 3GPP SA2 定義的單廠商AI/ML模型共享
3GPP Rel-18將研究AI/ML模型是否標準化、如何標準化等問題,并討論UE和網絡之間如何交互AI/ML模型,即終端可能需要使用從網絡下載的AI/ML模型。本文提出了一種跨平臺模型共享的通用架構來解決上述問題,如圖9所示。模型訓練平臺所使用的AI框架平臺為“TensorFlow”,模型消費者平臺所使用的AI框架平臺為“Caffe”,由于所使用的AI框架平臺不同,如果將TensorFlow平臺的模型直接傳遞給Caffe平臺,后者將無法識別和使用該模型。因此,對于這種不同AI框架平臺間的模型共享,首先需要將模型訓練平臺中的AI模型轉化為公共AI模型描述語言下的中間模型,再由模型消費者識別該中間模型,并轉化為自己所支持的框架平臺格式。
圖9 跨平臺模型共享通用架構
3.2.2 基于ONNX的跨平臺模型共享技術
開放式神經網絡交換(open neural network exchange,ONNX)是深度學習網絡的描述標準,是一種開放式的文件格式,可以用于存儲訓練好的模型。常用的深度學習框架都可以支持ONNX模型的加載和保存,其中,官方支持加載ONNX模型的框架包括 PyTorch、CNTK、Caffe2、MXNet等,TensorFlow等也有非官方的支持。本文提出了基于ONNX的模型跨平臺共享方式,如圖10所示,NWDAF(MTLF)通過把訓練完成的AI模型轉換為ONNX格式的中間模型,NWDAF(AnLF)再把ONNX中間模型解析成推理所用的AI模型。
圖10 基于ONNX的模型跨平臺共享方式
其中,ONNX標準的基本結構如圖11所示,ModelProto包含了模型的作者版本等信息,GraphProto用于記錄模型結構并保存整個網絡結構和參數,NodeProto、ValueInfoProto和TensorProto完成網絡的基本描述,具體如下。
圖11 ONNX標準的基本結構
? NodeProto用于描述網絡拓撲結構,ONNX將網絡的每個算子都描述成一個節(jié)點,每個節(jié)點的輸入和輸出的名稱都是全局唯一的,通過名稱的匹配關系來描述整個網絡的結構。ONNX通過 NodeProto所屬的AttributeProto字段來記錄節(jié)點功能,如卷積層、乘法層等,賦予對應的節(jié)點功能。節(jié)點功能的權重參數保存在TensorProto字段,其維度保存在ValueInfoProto字段。
? ValueInfoProto用于描述所有輸入、輸出的信息,包括維度和元素類型,表明了對應元素的大小,每一個輸入、輸出的名稱和NodeProto中的記錄對應。
? TensorProto用于存儲具體權重參數的數值,根據每個節(jié)點輸入、輸出的名稱去存儲位置獲取對應的參數。
ONNX應用于通信系統(tǒng)中,ONNX標準可以進一步改良。一方面,ONNX的基礎模塊需要被重新定義以符合通信中常用的網絡,使得同一個網絡的 ONNX描述是相同的并同時減少 ONNX的開銷;另一方面,ONNX結構可進一步壓縮,如將節(jié)點所占的bit數固定,并按照約定的順序排列,減少數據標識開銷。
業(yè)務識別技術作為一種基礎的運營商網絡能力,可以輔助運營商針對不同的業(yè)務流進行差異化處理,如QoS保障、切片或者網元負載均衡、空口資源調度。現有業(yè)務識別技術中的深度流檢測(deep flow inspection,DFI)方法可以基于應用功能(application function,AF)提供的業(yè)務流描述(packet flow description,PFD)信息,即業(yè)務標識(application ID,App ID)與IP三元組(服務器地址、服務器端口號、通信協(xié)議名稱)的對應關系做業(yè)務識別。在實際操作中,業(yè)務的IP三元組往往不斷發(fā)生變化,當AF不及時更新時,UPF就無法檢測新的IP三元組所對應的App ID。因此本文基于DFI業(yè)務識別技術提出了一種智能業(yè)務識別技術,通過引入NWDAF來構建App ID對應的業(yè)務分類器或者業(yè)務流量特征,來解決UPF無法確定業(yè)務流對應的App ID問題。
3.3.1 智能業(yè)務識別架構
DFI技術架構如圖12所示,NWDAF可以通過網絡開放功能(network exposure function,NEF)獲取AF的App ID信息,通過SMF獲取UPF的流量信息,UPF可以通過SMF返回流量信息,也可以直接反饋給NWDAF信息。NWDAF根據AF提供的歷史App ID以及通過SMF獲取UPF對應的流量數據(IP1),在NWDAF內部進行模型訓練與智能分析,構建業(yè)務分類器或者App ID對應的流量特征。當新的流量信息(IP2)產生時,NWDAF可以根據其流量特征分析,輔助UPF將該流量信息(IP2)對應到與流量信息(IP1)相同的App ID上。
圖12 DFI技術架構
此外,NWDAF經過長時間的推理后,還可以進一步地學習確定某個特定的IP三元組是對應到某個App ID的,在后續(xù)推理過程中,無須通過上述多分類器或者業(yè)務特征匹配確定App ID,只需提取新的流量數據中的IP三元組,即可確定新的流量數據對應的App ID。
3.3.2 智能業(yè)務識別技術
NWDAF的訓練功能模塊根據App ID對應的歷史PFD信息以及流量信息訓練業(yè)務分類器或者學習每個業(yè)務的流量特征,然后將其安裝在NWDAF的推理功能模塊,在推理過程中,將實時的業(yè)務流對應的流量數據輸入業(yè)務分類器或者與業(yè)務的流量特征進行匹配,即可以確定該業(yè)務流的App ID。具體步驟如下。
步驟1NWDAF通過SMF向UPF訂閱并獲取流量信息,具體內容見表1。
表1 流量信息輸入數據
步驟2假設NWDAF在生成訓練數據集的過程,訓練數據集中只有3個App ID,共N個樣本數據,見表2。針對一個來自UPF的流量信息,NWDAF首先從其IP五元組中抽取得到服務器IP地址、服務器端口號以及協(xié)議號,然后從PFD信息中查詢該服務器IP地址、服務器端口號以及協(xié)議號對應的App ID,進而通過這種數據關聯方式就可以確定一個樣本數據。
表2 用于訓練業(yè)務識別模型或者確定業(yè)務流量特征的訓練數據集
步驟 3在此過程中,為了避免 AF提供的PFD信息欺騙網絡情況,也就是說存在PFD中的某些IP三元組原本應該對應到App IDX,但是實際用來傳輸App IDY的情況。在生成App IDX的訓練數據集過程中,NWDAF需要對App IDX的原始訓練集進行聚類。假設有K個類別,NWDAF取K個類別中包括樣本數據最多的樣本數據集,作為該App IDX處理后的訓練數據集。
步驟 4基于上述訓練數據集,一方面,NWDAF可以針對多個業(yè)務(如上述3個業(yè)務)訓練業(yè)務識別模型;另一方面,NWDAF可以針對多個業(yè)務中的每個業(yè)務訓練或者學習該業(yè)務對應的流量特征。
NWDAF訓練業(yè)務識別模型的過程采用有監(jiān)督的機器學習算法,如邏輯回歸(logistic regression,LR)、支持向量機(support vector machine,SVM)等訓練分類器。以邏輯回歸為例,該分類器(以二分類為例,App ID 1以及非App ID 1)可以表示為:
其中,
其中,yi為第i個業(yè)務數據流的流量數據的業(yè)務分類結果,如果yi=1,則為App ID 1,如果yi=0,則非App ID 1;zi為xi經過線性回歸所得中間數據值;xi={xi0,xi1,xi2,xi3, … ,xiD}是由第i個業(yè)務數據流的流量數據轉換成的向量,其中xi0,xi1,xi2,xi3, … ,xiD為業(yè)務數據流的流量數據,如通信或交互的起始時間、上行或下行包時延、上行或下行包個數等;w= {w0,w1,w2,w3, … ,wD}為權重。
NWDAF確定每個業(yè)務的業(yè)務特征的過程,采用無監(jiān)督學習的方法(如K-Means)。如針對App ID 1對應的訓練數據集,NWDAF采用K-Means算法將訓練數據集聚成K個類別,并取K個類別中包括樣本數據最多的類別的質心,作為App ID 1對應的流量特征。
步驟5當NWDAF通過UPF獲取新的IP五元組對應的流量數據后,通過業(yè)務識別模型或業(yè)務特征的推理數據直接確定對應的App ID。
步驟6NWDAF經過統(tǒng)計分析,對大量出現并且不存在該業(yè)務歷史PFD信息的業(yè)務,生成一條新的PFD信息,并更新給NEF。NEF新產生的PFD信息分發(fā)給 SMF/UPF,UPF在安裝新 PFD后可以直接推斷得到業(yè)務標識,不再需要重復的模型推斷和特征匹配過程。
此外,針對 AF不提供 PFD信息的情況,NWDAF可以學習得到某個IP三元組對應一個業(yè)務,則可以借助第三方確定該業(yè)務的 App ID。NWDAF通過無監(jiān)督的學習方法,確定IP三元組對應到某個業(yè)務,發(fā)送給NEF后,NEF可以與第三方AF查詢,確定該IP三元組對應的業(yè)務標識,然后得到完整的PFD信息,輔助用戶面業(yè)務檢測。
面向5G及未來網絡的多樣化業(yè)務、差異化需求和極致化體驗要求,核心網作為網絡和業(yè)務的樞紐,其發(fā)展和演進對運營商網絡有著舉足輕重的作用。在5G核心網中引入人工智能技術,可實現網絡向自動化和智能化的躍遷,以應對網絡所面臨的需求和挑戰(zhàn)。當前網絡智能化產業(yè)正處于快速發(fā)展階段,本文希望通過對5G網絡大數據智能分析技術中架構及關鍵問題的分析,為業(yè)界同仁在網絡智能化的發(fā)展和落地研究中提供參考和啟示,推動網絡逐步實現智能和智慧。