楊靜雅,唐曉剛,周一青,劉玲,Jiangzhou Wang
(1.中國科學院計算技術(shù)研究所處理器芯片全國重點實驗室,北京 100190;2.中國科學院大學計算機科學與技術(shù)學院,北京 100049;3.航天工程大學航天信息學院,北京 101400;4.肯特大學工學院,坎特伯雷 CT2 7NZ)
隨著5G 在全球逐步進入商用,產(chǎn)業(yè)界和學術(shù)界已經(jīng)加速對6G 的研發(fā)[1-6]。為了支撐未來萬物智聯(lián)時代智慧生活、智賦生產(chǎn)、智煥社會等催生出的新興應(yīng)用場景,例如,腦機通信、智慧交通、精準醫(yī)療等[7-9],6G 被廣泛認為將是人-機-物三元融合的智能網(wǎng)絡(luò),內(nèi)生智能、開放性將成為6G 智能網(wǎng)絡(luò)的關(guān)鍵特征。6G 需要通過節(jié)點原生智能、網(wǎng)絡(luò)協(xié)同共建支持智能感知、自主決策、自動執(zhí)行的能力,滿足“智慧泛在,自治自洽”的未來愿景。發(fā)展6G 智能網(wǎng)絡(luò)的驅(qū)動力主要來自新業(yè)務(wù)的碎片化極致化需求、網(wǎng)絡(luò)管理和運維的復雜性倍增以及新技術(shù)的涌現(xiàn)與變革。
首先,未來人-機-物萬物智聯(lián)將持續(xù)催生新的應(yīng)用,現(xiàn)有網(wǎng)絡(luò)僅依靠“打補丁”“疊加資源”的方式將難以滿足新業(yè)務(wù)碎片化、極致化的需求。一方面,由于用戶行為、信息環(huán)境在時間和空間上不斷改變,導致用戶服務(wù)需求動態(tài)化、碎片化。另一方面,隨著數(shù)字化、智能化發(fā)展,未來6G 網(wǎng)絡(luò)中增強現(xiàn)實(AR,augmented reality)/虛擬現(xiàn)實(VR,virtual reality)、工業(yè)自動化、遠程駕駛等新業(yè)務(wù)場景的需求將呈現(xiàn)出極致化發(fā)展趨勢。例如,在AR/VR 中,沉浸式交互體驗要求數(shù)據(jù)速率至少達到10 Gbit/s、端到端的時延小于1 ms、隨時隨地一致性體驗等[8-10]。工業(yè)自動化的典型需求是控制面時延達到0.1 ms、可靠性高達10-9級等[8]。遠程駕駛中要求用戶面時延達到3 ms,同時可靠性達到10-5級[11]。與此同時,一些新的網(wǎng)絡(luò)性能指標,如機器通信的安全性、觸覺通信(如遠程醫(yī)療)中環(huán)境的高精度感知、計算效率等的引入,要求未來6G 能夠根據(jù)業(yè)務(wù)動態(tài)極致的性能需求、柔性設(shè)計和構(gòu)建網(wǎng)絡(luò),對整網(wǎng)資源進行最優(yōu)化調(diào)度[12]。然而,現(xiàn)有網(wǎng)絡(luò)架構(gòu)單一固定,遵循端到端的網(wǎng)絡(luò)范式,提供盡力而為的交付服務(wù),將難以應(yīng)對未來6G 網(wǎng)絡(luò)中業(yè)務(wù)碎片化、極致化的性能需求[13]。因此,迫切需要一種靈活簡潔、整網(wǎng)資源可敏捷調(diào)度的智慧網(wǎng)絡(luò),能夠高效準確地預(yù)測業(yè)務(wù)的動態(tài)化需求,如吞吐量、時延、可靠性等,結(jié)合業(yè)務(wù)偏好特征并借助云網(wǎng)融合等技術(shù),彈性構(gòu)建不同網(wǎng)絡(luò)形態(tài),通過彈性感知、彈性通信、彈性計算等實現(xiàn)網(wǎng)絡(luò)的彈性構(gòu)筑,以適配未來網(wǎng)絡(luò)智能業(yè)務(wù)的高度動態(tài)性和不確定性。
其次,現(xiàn)有網(wǎng)絡(luò)管理和運維的復雜度隨著網(wǎng)絡(luò)節(jié)點的異構(gòu)性和網(wǎng)絡(luò)動態(tài)性的增強急劇上升,而傳統(tǒng)基于人工的網(wǎng)絡(luò)管理效率低,難以支撐網(wǎng)絡(luò)的持續(xù)性發(fā)展,迫切需要智能的網(wǎng)絡(luò)管理。一方面,面向萬物智聯(lián),6G 將向著空天地海一體化的方向發(fā)展。不同制式的接入技術(shù),如地面蜂窩通信、Wi-Fi、專用短程通信技術(shù)、衛(wèi)星通信等需要協(xié)同融合;但不同的網(wǎng)絡(luò)節(jié)點,如宏基站、微基站和衛(wèi)星等,其運營商、技術(shù)特征、3C 資源(通信、計算和存儲)、性能指標等存在顯著差異,難以協(xié)同。另一方面,網(wǎng)絡(luò)動態(tài)性隨著未來空-天網(wǎng)絡(luò)中無人機、低軌衛(wèi)星等高移動性設(shè)備的引入而增強;同時移動通信頻段不斷上移,隨著毫米波、太赫茲的引入,由于其波束的覆蓋范圍有限,易受建筑物、人體等障礙物帶來的遮擋和阻塞,信道變化的動態(tài)性增強[14-15],這些都為網(wǎng)絡(luò)資源的優(yōu)化管控帶來了極大的挑戰(zhàn)。因此,如何根據(jù)業(yè)務(wù)需求實現(xiàn)跨網(wǎng)協(xié)同、如何適配網(wǎng)絡(luò)和信道的動態(tài)變化實現(xiàn)高效管控是未來6G網(wǎng)絡(luò)面臨的重要挑戰(zhàn)。然而,目前網(wǎng)絡(luò)管理仍采用傳統(tǒng)人工模式,即人工設(shè)計、配置網(wǎng)絡(luò)參數(shù)等,這僅適用于相對簡單、靜態(tài)的網(wǎng)絡(luò)。面向未來復雜動態(tài)的網(wǎng)絡(luò),人工管理的成本高,并且性能和用戶服務(wù)質(zhì)量也難以保障[16]。未來網(wǎng)絡(luò)需要一個具備自感知、自編排、自配置、自運營能力的智慧自治網(wǎng)絡(luò)來打破傳統(tǒng)人工管理和編排的局限性。這就需要6G 能夠?qū)Ξ悩?gòu)網(wǎng)絡(luò)進行統(tǒng)一表征,實時感知與分析網(wǎng)絡(luò)動態(tài)信息,利用自動化和閉環(huán)優(yōu)化方式對異構(gòu)、動態(tài)網(wǎng)絡(luò)進行統(tǒng)一管理和協(xié)同調(diào)度,基于深度融合實現(xiàn)網(wǎng)絡(luò)快速自動配置,滿足用戶需求。
最后,當前新技術(shù)不停涌現(xiàn)與變革,將有可能支撐6G 網(wǎng)絡(luò)內(nèi)生智能功能愿景的實現(xiàn)。借助網(wǎng)絡(luò)功能虛擬化(NFV,network function virtualization)、軟件定義網(wǎng)絡(luò)(SDN,software defined network)和人工智能(AI,artificial intelligence)等技術(shù),網(wǎng)絡(luò)將具有更高的靈活性和可擴展性以支撐更加多樣化、精細化服務(wù)。其中,NFV 是在單個物理網(wǎng)絡(luò)上安裝一系列虛擬化網(wǎng)絡(luò)功能(如路由器、防火墻、域名服務(wù)等),從而建立多個邏輯網(wǎng)絡(luò)。每個邏輯網(wǎng)絡(luò)具有特定的網(wǎng)絡(luò)能力和特性,通過啟用虛擬隔離機制在一個物理基礎(chǔ)設(shè)施上可部署多種網(wǎng)絡(luò)服務(wù),減少硬件使用數(shù)量,提升網(wǎng)絡(luò)柔性適變能力,從而提高網(wǎng)絡(luò)架構(gòu)的靈活性和可擴展性[17]。而在SDN 中,網(wǎng)絡(luò)控制可直接編程,并與數(shù)據(jù)流的轉(zhuǎn)發(fā)分離,控制平面定義數(shù)據(jù)流的路由與資源的分配,從而提升網(wǎng)絡(luò)管理與編排的靈活性。因此,SDN 作為NFV 的互補技術(shù),解耦控制平面和數(shù)據(jù)平面,主要進行路由和網(wǎng)絡(luò)操作;NFV 解耦軟硬件,主要提供計算和處理服務(wù)。以SDN、NFV 等技術(shù)為基礎(chǔ),未來6G 將有可能實現(xiàn)網(wǎng)絡(luò)的高效柔性可重構(gòu),支撐更加靈活多樣的網(wǎng)絡(luò)服務(wù)。此外,基于AI 技術(shù),6G 將有可能智能適應(yīng)動態(tài)變化的網(wǎng)絡(luò)環(huán)境和信道條件。例如,根據(jù)實時采集的大量信道數(shù)據(jù),采用深度神經(jīng)網(wǎng)絡(luò)進行非線性近似,對未知復雜信道進行動態(tài)預(yù)測與建模,獲取信道知識,給系統(tǒng)決策和管控提供重要信息[12]??梢?,網(wǎng)絡(luò)產(chǎn)生的大數(shù)據(jù)加快了技術(shù)的演進與發(fā)展,新技術(shù)的創(chuàng)新與變革也推動了6G 網(wǎng)絡(luò)的智能化轉(zhuǎn)型。
在上述驅(qū)動力的推動下,近年來智能網(wǎng)絡(luò)的研究空前發(fā)展。歐洲電信標準化協(xié)會(ETSI)、國際電信聯(lián)盟電信標準分局(ITU-T)、第三代合作伙伴計劃(3GPP,3rd generation partnership project)等已啟動網(wǎng)絡(luò)智能化研究,從架構(gòu)設(shè)計、場景描述、關(guān)鍵技術(shù)等方面推進智能網(wǎng)絡(luò)標準化進展。其中,網(wǎng)絡(luò)架構(gòu)的功能設(shè)計是未來6G 網(wǎng)絡(luò)賦能行業(yè)應(yīng)用的重要基礎(chǔ)。
在各種新型網(wǎng)絡(luò)架構(gòu)中,意圖是未來網(wǎng)絡(luò)實現(xiàn)智能化的關(guān)鍵之一。2017 年2 月,ETSI 經(jīng)驗式網(wǎng)絡(luò)智能(ENI,experiential network intelligence)工作組定義了一個基于意圖感知的智能網(wǎng)絡(luò)架構(gòu)——ENI 架構(gòu),主要包含情景感知、網(wǎng)絡(luò)大數(shù)據(jù)分析和策略管理等功能模塊,其中,情景感知模塊負責接收應(yīng)用程序意圖,然后利用網(wǎng)絡(luò)大數(shù)據(jù)分析、策略管理等模塊翻譯為網(wǎng)元配置指令,下發(fā)到底層基礎(chǔ)設(shè)施中[18]。2019 年1 月,ITU-T 提出基于機器學習(ML,machine learning)的未來網(wǎng)絡(luò)統(tǒng)一邏輯架構(gòu),包含管理子系統(tǒng)、多層ML管道和閉環(huán)子系統(tǒng)[19]。其中,運營商借助“意圖”指定機器學習用例,然后借助管理子系統(tǒng)和多層ML 管道進行編排和實現(xiàn),并持續(xù)進行環(huán)境感知和策略優(yōu)化。2020 年3 月,3GPP 提出了意圖驅(qū)動的管理服務(wù)閉環(huán)自動化機制,其中,用戶只需表達自身意圖,即希望特定實體達到特定狀態(tài),而服務(wù)提供者負責將意圖轉(zhuǎn)化為網(wǎng)絡(luò)設(shè)備管理需求,進行網(wǎng)絡(luò)配置,并持續(xù)監(jiān)測意圖實現(xiàn)狀態(tài),調(diào)整網(wǎng)絡(luò)配置滿足意圖要求[20]。
以上網(wǎng)絡(luò)智能化研究指出了意圖對于未來內(nèi)生智能網(wǎng)絡(luò)發(fā)展的重要性,基于人類意愿自動智能搭建和操作網(wǎng)絡(luò),降低網(wǎng)絡(luò)管理復雜度,提升網(wǎng)絡(luò)運維效率,保障網(wǎng)絡(luò)體驗。
2015 年,開放網(wǎng)絡(luò)基金會北向接口工作組主席David Lenrow 提出基于意圖的網(wǎng)絡(luò)(IBN,intent-based networking)概念,并將意圖定義為“Intent: don’t tell me what to do! (tell me what you want)”[21]。2016 年,開放網(wǎng)絡(luò)基金會發(fā)布“Intent NBI -definition and principles”白皮書,描述了基于意圖的北向接口(NBI,northbound interface)屬性和結(jié)構(gòu),將意圖理解為網(wǎng)絡(luò)服務(wù)請求(如connect Bob to the (public) Internet)[22]。2017 年,Gartner 發(fā)布報告定義了基于意圖的網(wǎng)絡(luò)功能,包括意圖翻譯和驗證、網(wǎng)絡(luò)狀態(tài)感知、自動化配置、意圖保障和自動修復。其中,IBN 將意圖定義為業(yè)務(wù)策略(如新建一個虛擬機),而意圖翻譯和驗證負責將意圖轉(zhuǎn)化為網(wǎng)絡(luò)策略和配置[23]。2019 年,開放數(shù)據(jù)中心標準推進委員會發(fā)布“意圖網(wǎng)絡(luò)技術(shù)與應(yīng)用白皮書”,在Gartner 提出的IBN 的基礎(chǔ)上增加了用戶意圖輸入和網(wǎng)絡(luò)基礎(chǔ)設(shè)施2 個部分,進一步完善了IBN 的功能模塊[24]。以上報告和白皮書所提出的基于意圖的網(wǎng)絡(luò)架構(gòu)中將意圖理解為“What to do”,而不是“What you want”。因此,網(wǎng)絡(luò)亟須提升智能,從“What you want”中抽象出“What to do”。
目前,學術(shù)界關(guān)于基于意圖的網(wǎng)絡(luò)的研究集中在網(wǎng)絡(luò)架構(gòu)、平臺和接口[25-27]。文獻[25]提出一種基于意圖的網(wǎng)絡(luò)切片編排框架。首先接收意圖請求(用戶所需服務(wù)名稱和服務(wù)等級),然后提取服務(wù)關(guān)鍵字并映射為虛擬化網(wǎng)絡(luò)功能,最后采用Swarm 管理器分配CPU、內(nèi)存和帶寬資源。不同于文獻[25],文獻[26]搭建了基于意圖的網(wǎng)絡(luò)切片生成與管理平臺。首先設(shè)計圖形界面接收用戶意圖請求,即用戶服務(wù)質(zhì)量(QoS,quality of service)需求,然后采用意圖管理器將意圖請求轉(zhuǎn)換為切片配置策略,并分配資源以創(chuàng)建切片實例。與非基于意圖的機制相比,文獻[25-26]中用戶只需要對網(wǎng)絡(luò)提出需求,不需要關(guān)注底層如何實現(xiàn),提升了網(wǎng)絡(luò)切片生成與管理的自動化程度。不同于文獻[25-26],文獻[27]針對OpenFlow 控制器,擴展一個名為“意圖引擎”的新組件,并以用戶移動性管理為例展示了基于意圖的網(wǎng)絡(luò)接口提高了傳輸吞吐量。文獻[25-27]進行網(wǎng)絡(luò)決策時,采用預(yù)先安裝的意圖管理器或控制器,將意圖請求轉(zhuǎn)化為預(yù)先制定好的若干固定網(wǎng)絡(luò)配置策略之一,缺乏對網(wǎng)絡(luò)狀態(tài)數(shù)據(jù)的學習與分析,難以應(yīng)對動態(tài)變化的網(wǎng)絡(luò)環(huán)境。此外,人類進行決策時通常需要結(jié)合感知與推理來解決問題,其中,感知可以通過數(shù)據(jù)驅(qū)動的機器學習實現(xiàn),而推理可以通過規(guī)則驅(qū)動的邏輯推理(如一階邏輯)實現(xiàn)[28]。那么未來網(wǎng)絡(luò)要想實現(xiàn)智能決策,需要融合機器學習和邏輯推理能力,使兩者能夠協(xié)同工作,優(yōu)勢互補。
綜上,針對6G 智能網(wǎng)絡(luò)的發(fā)展目標,現(xiàn)有基于意圖的網(wǎng)絡(luò)研究提出的網(wǎng)絡(luò)功能架構(gòu)中強調(diào)了自動化能力的必要性,旨在提高網(wǎng)絡(luò)運維的效率,并將“意圖”理解為用戶服務(wù)需求,目標是實現(xiàn)“What to do”與“How to configure the network”之間的解耦。然而,意圖的本質(zhì)應(yīng)是實現(xiàn)“What you want”。因此,實現(xiàn)意圖網(wǎng)絡(luò)需要3 個重要步驟,首先,獲取“What you want”;其次,從“What you want”中獲取“What to do”;最后,根據(jù)“What to do”明確并完成“How to configure the network”?,F(xiàn)有研究集中在第一步和第三步,通常認為獲取的“What to do”等價于“What you want”,而針對第二步,尚未提出明確的解決方案。同時,第三步以知識定義網(wǎng)絡(luò)為例,缺乏邏輯推理能力,難以支撐未來網(wǎng)絡(luò)的智能管控。因此,未來基于意圖的網(wǎng)絡(luò)一方面需要深入理解并抽象用戶意圖,由“What you want”得到“What to do”;另一方面需要學習獲取網(wǎng)絡(luò)知識,基于知識實現(xiàn)網(wǎng)絡(luò)智能決策,由“What to do”完成“How to configure the network”。
目前,知識定義網(wǎng)絡(luò)利用網(wǎng)絡(luò)遙測、機器學習等技術(shù)收集網(wǎng)絡(luò)數(shù)據(jù)、挖掘網(wǎng)絡(luò)知識,可為基于意圖的網(wǎng)絡(luò)中的智能管控,即根據(jù)“What to do”完成“How to configure the network”,提供重要信息。2003 年,Clark 等[29]針對現(xiàn)有網(wǎng)絡(luò)出現(xiàn)問題時需要大量人工進行配置、診斷和設(shè)計,導致高昂管理成本的問題,基于AI 和認知理論提出知識平面(KP,knowledge plane)的概念,抽象和隔離高層目標與底層操作,通過學習網(wǎng)絡(luò)歷史配置經(jīng)驗(如配置動作和網(wǎng)絡(luò)結(jié)果等),輔助網(wǎng)絡(luò)進行自主決策、自動配置。然而,網(wǎng)絡(luò)是分布式系統(tǒng),其中每個節(jié)點(如交換機、路由器)只擁有網(wǎng)絡(luò)部分視圖和控制權(quán),從這些節(jié)點中難以學習到全網(wǎng)特性,因此控制整個網(wǎng)絡(luò)是存在挑戰(zhàn)的。2017 年,Mestres 等[30]考慮利用SDN 范式中邏輯集中式的控制平面可以查看和操作整個網(wǎng)絡(luò)的特點,認為Clark 等的愿景可以被實現(xiàn),進而在傳統(tǒng)控制平面、管理平面和數(shù)據(jù)平面的基礎(chǔ)上添加知識平面,提出知識定義網(wǎng)絡(luò)(KDN,knowledge defined network)架構(gòu)。KDN 首先利用控制和管理平面獲得網(wǎng)絡(luò)狀態(tài)信息,如深度包檢測信息,并利用機器學習算法轉(zhuǎn)化為知識(例如網(wǎng)絡(luò)配置模型);然后,基于網(wǎng)絡(luò)知識自動或人工進行網(wǎng)絡(luò)配置決策(如網(wǎng)絡(luò)路由決策)。
目前,關(guān)于KDN 的研究集中在架構(gòu)設(shè)計、策略生成等方面。文獻[31]基于KDN 提出知識定義的光電混合網(wǎng)絡(luò)編排架構(gòu),包含2 個控制器,分別編排計算和帶寬資源,并設(shè)計3 個深度神經(jīng)網(wǎng)絡(luò)從網(wǎng)絡(luò)流量數(shù)據(jù)中獲取網(wǎng)絡(luò)知識,即流量特征和計算任務(wù),協(xié)同實現(xiàn)網(wǎng)絡(luò)流量、虛擬機需求預(yù)測,進行光電混合網(wǎng)絡(luò)配置(如光路交換機配置)決策。文獻[32]基于KDN 閉環(huán)網(wǎng)絡(luò)架構(gòu),研究智能路由策略生成機制。其關(guān)注數(shù)據(jù)包間隔遵循指數(shù)分布的流量數(shù)據(jù),采用卷積神經(jīng)網(wǎng)絡(luò)抽象數(shù)據(jù)流間延遲和丟包率特征,提出確定性策略梯度算法,生成網(wǎng)絡(luò)流量路由策略,提高復雜網(wǎng)絡(luò)路由配置性能。此外,文獻[33]針對6G 網(wǎng)絡(luò)需求增長與資源消耗的矛盾,在6G 管控體系中引入管控知識空間模塊,負責收集和抽取網(wǎng)絡(luò)管控經(jīng)驗和知識,并提出一種基于知識空間的6G 網(wǎng)絡(luò)管控體系,通過閉環(huán)控制實現(xiàn)網(wǎng)絡(luò)按需服務(wù)。其中,知識獲取主要由收集的網(wǎng)絡(luò)數(shù)據(jù),通過數(shù)據(jù)分析提取而得。文獻[34]在網(wǎng)絡(luò)架構(gòu)中將知識驅(qū)動與數(shù)據(jù)驅(qū)動相結(jié)合,在傳統(tǒng)深度學習、強化學習方式中,引入用戶特征和網(wǎng)絡(luò)參數(shù)(如各子網(wǎng)實現(xiàn)的需求流量、傳輸效率等)知識變量,通過歷史大數(shù)據(jù)支持知識+數(shù)據(jù)驅(qū)動模型的學習,提升網(wǎng)絡(luò)運行的性能(如提高傳輸效率)。
綜上,KDN 采用數(shù)據(jù)驅(qū)動的機器學習技術(shù)進行網(wǎng)絡(luò)決策(如路由決策),可以簡化人工管理與操作流程。目前,知識定義網(wǎng)絡(luò)中的“知識”是基于數(shù)據(jù)事實,利用機器學習技術(shù),包含監(jiān)督學習、非監(jiān)督學習和強化學習算法學習獲取而得的[30]。例如,對于有監(jiān)督學習而言,“知識”是采用監(jiān)督學習算法(如深度學習),基于有標記的網(wǎng)絡(luò)數(shù)據(jù)學習一個網(wǎng)絡(luò)變量與網(wǎng)絡(luò)操作相關(guān)聯(lián)的函數(shù)(如網(wǎng)絡(luò)性能作為流量負載和網(wǎng)絡(luò)配置的函數(shù))。然而從人類決策來看,需要結(jié)合機器學習和邏輯推理才能得到最優(yōu)的策略[28,35]。
文獻[35]提出了融合機器學習和邏輯推理的新框架。首先采用機器學習算法從訓練數(shù)據(jù)中學習一個初始模型,并使用該模型決策,然后采用邏輯子句表示決策結(jié)果,并輸入推理系統(tǒng);推理系統(tǒng)采用邏輯推理規(guī)則對求解問題進行形式化,并使用從機器學習獲取的邏輯子句,通過誘因性邏輯程序等進行機器推理,若推理結(jié)果與人工總結(jié)的推理規(guī)則不一致,則通過邏輯反繹生成最小化不一致的假設(shè)修訂,反饋給機器學習,從而重新訓練機器學習模型。以分類任務(wù)為例,在僅利用機器學習的方法中,假設(shè)訓練數(shù)據(jù)為{(x1,y1),…,(xm,ym)},xi∈X表示第i個訓練實例,yi∈Y表示類標簽,目標是學習輸入空間X到輸出空間Y的映射f:X→Y,該映射可以預(yù)測X空間中不屬于訓練實例的數(shù)據(jù)的類標簽。與上述方法不同,在結(jié)合機器學習和邏輯推理的方法中,以 {(x1,f(x1) ),…,(xm,f(xm))}為基礎(chǔ)的邏輯事實還需要與知識庫KB 中的邏輯規(guī)則一致。假定給定一組數(shù)據(jù){x1,x2,…,xi}、一個知識庫KB 和一個分類器C,目標是尋找一個函數(shù)f對未知數(shù)據(jù)進行預(yù)測[35]
其中,O是由xi和f表示的邏輯事實,表示邏輯蘊含。如果O與式(2)中的KB 一致,則返回當前的f,否則,如式(3)所示,首先通過邏輯反繹生成Δ(O),然后根據(jù) Δ(O)更新f。在分類手寫等式任務(wù)中,結(jié)合機器學習和邏輯推理相較于傳統(tǒng)僅基于機器學習的方法,可以顯著提升分類精度[28]。
綜上,在根據(jù)“What to do”去實現(xiàn)“How to configure the network”的過程中,現(xiàn)有知識定義網(wǎng)絡(luò)的架構(gòu)研究雖然有一定智能決策的能力,但其在進行網(wǎng)絡(luò)決策的過程中僅考慮機器學習方式,缺少邏輯推理能力(如一階邏輯表示)。因此,現(xiàn)有網(wǎng)絡(luò)架構(gòu)都難以實現(xiàn)未來6G 內(nèi)生智能的目標,亟須提出新型智能網(wǎng)絡(luò)架構(gòu)。
面向未來6G 內(nèi)生智能的目標,現(xiàn)有6G 網(wǎng)絡(luò)架構(gòu)相關(guān)研究中首先缺乏意圖的理解和抽象,即如何從“What you want”中獲取“What to do”;其次,在根據(jù)“What to do”實現(xiàn)“How to configure the network”的過程中進行網(wǎng)絡(luò)策略生成時僅考慮機器學習方式,缺乏邏輯推理能力,降低了決策的準確性。因此,本文提出一種意圖抽象與知識聯(lián)合驅(qū)動的6G 內(nèi)生智能網(wǎng)絡(luò)架構(gòu),相較于現(xiàn)有6G 網(wǎng)絡(luò)架構(gòu),將意圖抽象平面和認知平面引入6G 網(wǎng)絡(luò)架構(gòu)體系,其中,在意圖抽象平面中,本文設(shè)計意圖獲取、意圖轉(zhuǎn)譯、意圖映射和意圖建模,實現(xiàn)從“What you want”到“What to do”轉(zhuǎn)換。其次,基于知識平面提出了認知平面,通過機器學習和邏輯推理聯(lián)合動態(tài)優(yōu)化獲取網(wǎng)絡(luò)知識,支撐網(wǎng)絡(luò)從“What to do”實現(xiàn)“How to configure the network”的智能決策。同時,分析了支撐6G 內(nèi)生智能實現(xiàn)的用戶意圖映射、網(wǎng)絡(luò)信息測量、網(wǎng)絡(luò)策略生成、網(wǎng)絡(luò)策略驗證等關(guān)鍵技術(shù)及未來挑戰(zhàn)。
目前,學術(shù)界與產(chǎn)業(yè)界對內(nèi)生智能的定義和目標正在持續(xù)討論中,本文認為,6G 內(nèi)生智能是指6G 網(wǎng)絡(luò)支持感知-通信-決策-控制能力,能夠自主感知周圍環(huán)境以及應(yīng)用服務(wù)特性,進行自動化決策與閉環(huán)控制,目標是實現(xiàn)網(wǎng)絡(luò)零接觸、可交互、會學習。然而,當前針對智能網(wǎng)絡(luò)的研究工作還停留在外掛式設(shè)計的階段,僅采用人工智能技術(shù)解決特定的網(wǎng)絡(luò)優(yōu)化問題,通過補丁式、增量式增強現(xiàn)有網(wǎng)絡(luò)功能,將難以滿足未來網(wǎng)絡(luò)動態(tài)復雜的業(yè)務(wù)需求。
面向6G 網(wǎng)絡(luò)管理與控制的內(nèi)生智能需求,本文提出意圖抽象與知識聯(lián)合驅(qū)動的6G 內(nèi)生智能網(wǎng)絡(luò)架構(gòu),融合了基于意圖的網(wǎng)絡(luò)與知識定義網(wǎng)絡(luò)的優(yōu)勢,首先抽象用戶意圖和感知網(wǎng)絡(luò)狀態(tài),然后基于網(wǎng)絡(luò)知識進行管控策略的生成與部署,最終有望實現(xiàn)內(nèi)生智能網(wǎng)絡(luò)的目標。圖1 展示了意圖抽象與知識聯(lián)合驅(qū)動的6G 內(nèi)生智能網(wǎng)絡(luò)架構(gòu),包含5 個平面,分別為意圖抽象平面、認知平面、管理平面、控制平面和數(shù)據(jù)平面。本文將意圖抽象平面和認知平面引入6G 網(wǎng)絡(luò)管控體系,首先,通過意圖獲取、意圖轉(zhuǎn)譯、意圖映射和意圖建模步驟,實現(xiàn)從“What you want”得到“What to do”。然后,基于知識平面提出了認知平面,包括知識獲取和知識應(yīng)用。其中,知識獲取是通過機器學習模型和邏輯推理規(guī)則聯(lián)合動態(tài)優(yōu)化獲取網(wǎng)絡(luò)知識(如網(wǎng)絡(luò)配置模型)。知識應(yīng)用是基于網(wǎng)絡(luò)知識實現(xiàn)策略生成、策略驗證等功能,從而由“What to do”實現(xiàn)“How to configure the network”。
圖1 意圖抽象與知識聯(lián)合驅(qū)動的6G 內(nèi)生智能網(wǎng)絡(luò)架構(gòu)
值得注意的是,由于所提架構(gòu)的實驗驗證需要涉及大量的設(shè)備和軟件,且各個功能模塊的仿真需要基于人工智能技術(shù),采集、處理與標注大量通信網(wǎng)絡(luò)相關(guān)數(shù)據(jù)進行模型訓練與測試,短期內(nèi)難以進行仿真和實驗驗證。另一方面,相較于現(xiàn)有的網(wǎng)絡(luò)架構(gòu)體系[33-34,36],所提架構(gòu)主要引入的新功能模塊包含意圖抽象平面和認知平面。因此本文將圍繞所提出的新功能模塊,通過實例說明該模塊的可實現(xiàn)性。在此基礎(chǔ)上,對所提出的新功能模塊與現(xiàn)有網(wǎng)絡(luò)架構(gòu)中的平面,包含管理平面、控制平面以及數(shù)據(jù)平面之間的閉環(huán)交互進行深入分析,明確系統(tǒng)工作時不同平面之間的數(shù)據(jù)流轉(zhuǎn),進一步支撐整個系統(tǒng)的可實現(xiàn)性。
意圖抽象平面的目標是從“What you want”獲取“What to do”,通過意圖獲取、意圖轉(zhuǎn)譯、意圖映射和意圖建模4 個步驟運行和實現(xiàn)。接下來,本文將具體描述上述功能模塊的實現(xiàn)過程和相關(guān)技術(shù)。
意圖獲取是根據(jù)“What you want”獲取用戶的“意圖需求”。經(jīng)濟學中,“意圖需求”主要體現(xiàn)的是用戶的心理規(guī)律,難以建模與評估,需要結(jié)合實際場景分析。一種可能的方法是利用系統(tǒng)的人機接口和傳感界面對用戶心理的意圖需求進行采樣提取,其主要基于自然語言處理、語音識別等技術(shù),通過分詞標注、命名實體識別、詞典查詢、情感分析等處理過程獲取用戶的意圖關(guān)鍵詞[37]。例如,根據(jù)專家經(jīng)驗制作意圖詞庫,包含自然語言表述和意圖關(guān)鍵詞間的對應(yīng)關(guān)系,利用意圖詞庫,可以通過語言分詞、詞典查詢等過程找到意圖詞庫中相關(guān)詞匯作為意圖關(guān)鍵詞。
意圖轉(zhuǎn)譯是將用戶的“意圖需求”轉(zhuǎn)化為“實際需求”(用戶對通信業(yè)務(wù)期望的體驗效果),可以采用深度學習、決策樹技術(shù)實現(xiàn)。具體而言,首先收集用戶意圖和用戶主觀體驗質(zhì)量(QoE,quality of experience)關(guān)鍵詞轉(zhuǎn)譯數(shù)據(jù),然后利用深度神經(jīng)網(wǎng)絡(luò)學習上述轉(zhuǎn)譯關(guān)系。當獲取到用戶意圖關(guān)鍵詞時,利用訓練好的意圖轉(zhuǎn)譯模型直接轉(zhuǎn)譯為QoE 關(guān)鍵詞(業(yè)務(wù)類型、期望狀態(tài)等),從而得到用戶主觀體驗質(zhì)量,即獲得用戶的“實際需求”。
意圖映射是將用戶主觀體驗質(zhì)量映射為網(wǎng)絡(luò)服務(wù)質(zhì)量指標,可以借助一些擬合工具,如綜合優(yōu)化分析計算軟件平臺(1stOpt,first optimization)等,通過數(shù)據(jù)擬合獲得以用戶主觀體驗質(zhì)量為自變量的網(wǎng)絡(luò)服務(wù)質(zhì)量指標映射函數(shù),也可以利用現(xiàn)有的機器學習模型(如深度神經(jīng)網(wǎng)絡(luò))獲得映射模型。其中,意圖映射過程通常包含2 個步驟:首先選擇合適的客觀QoE 指標(如圖像視頻質(zhì)量評估,即使用數(shù)學模型計算參考圖像和評估圖像之間像素和整體結(jié)構(gòu)的相似度或差異值),僅考慮業(yè)務(wù)(如圖像、視頻)本身特征,將用戶主觀QoE 映射為一組客觀QoE 指標[38-39];然后,選擇合適的網(wǎng)絡(luò)QoS指標(如吞吐量、時延、抖動、丟包等)[40],將上述客觀QoE 指標映射為網(wǎng)絡(luò)QoS 指標[41]。另外,也可以直接收集用戶主觀QoE 和網(wǎng)絡(luò)QoS 指標數(shù)據(jù),采用深度神經(jīng)網(wǎng)絡(luò)學習用戶主觀QoE 與網(wǎng)絡(luò)QoS指標之間的映射關(guān)系,從而得到意圖映射模型。例如,在視頻業(yè)務(wù)中,可以選擇視頻質(zhì)量度量(VQM,video quality metric)作為客觀QoE 指標,而丟包率、抖動性和時延作為網(wǎng)絡(luò)QoS 指標,并采集大量視頻樣本,觀察不同網(wǎng)絡(luò)QoS 指標對VQM 值的影響,通過曲線擬合工具1stOpt 得出網(wǎng)絡(luò)QoS 指標與客觀QoE 指標之間的映射函數(shù)關(guān)系式[42]。此外,以語音業(yè)務(wù)為例,目前“IQX 假設(shè)”給出了平均意見得分(MOS,mean opinion score)與網(wǎng)絡(luò)丟包率ploss的關(guān)系[43],如式(4)所示。
意圖建模主要基于網(wǎng)絡(luò)QoS 指標,設(shè)計目標函數(shù)和約束條件,建立優(yōu)化模型,從而得到“What to do”。目標函數(shù)可以是通信性能指標(如傳輸速率、時延、能量效率、頻譜效率等),也可以是感知性能指標(如定位精度、感知范圍等)和計算性能指標(如計算服務(wù)響應(yīng)時間、計算資源利用率等)[44],并且目標函數(shù)通常是多目標優(yōu)化函數(shù),例如,研究多目標決策的QoS 路由算法時,選擇時延和丟包率作為優(yōu)化目標,帶寬作為約束條件,建立多目標非線性整數(shù)優(yōu)化模型[45]。此外,意圖建模的結(jié)果一方面發(fā)送給認知平面,利用網(wǎng)絡(luò)知識優(yōu)化得到網(wǎng)絡(luò)策略;另一方面?zhèn)鬟f給意圖獲取模塊,作為先驗信息優(yōu)化意圖獲取過程。此外,對于“What to do”的精準度的評估,一方面可以在各個功能模塊中設(shè)計合適的損失函數(shù)(如交叉熵損失)定量評估每個功能模塊執(zhí)行的準確性,從而進一步評估“What to do”的精準度;另一方面可以借助數(shù)字孿生技術(shù),通過在虛擬空間構(gòu)建數(shù)字孿生體,通過仿真和測試可初步預(yù)測由“What to do”優(yōu)化生成的策略的執(zhí)行和協(xié)同狀況,反饋給意圖抽象平面,而意圖抽象平面根據(jù)預(yù)測的結(jié)果,并結(jié)合網(wǎng)絡(luò)QoS 指標進一步評估“What to do”的精準度。
總體而言,借助現(xiàn)有的一些技術(shù),如自然語言處理、語音識別等,所提出的意圖抽象平面中的意圖獲取、意圖轉(zhuǎn)譯、意圖映射和意圖建模功能模塊將有望實現(xiàn)。因此,所提出的意圖抽象平面具有一定的可實現(xiàn)性。
認知平面的目標根據(jù)“What to do”得到實現(xiàn)“How to configure the network”的管控策略,通過知識獲取和知識應(yīng)用實現(xiàn)。其中,知識獲取是采用機器學習和邏輯推理聯(lián)合動態(tài)優(yōu)化獲取網(wǎng)絡(luò)知識。首先,基于管理平面和控制平面收集到的網(wǎng)絡(luò)運行和配置數(shù)據(jù),采用機器學習方式進行網(wǎng)絡(luò)學習,并將學習得到的結(jié)果表示為邏輯子句,然后通過邏輯程序?qū)τ谠撨壿嬜泳溥M行機器推理,并將推理結(jié)論反饋給機器學習模型。整個過程迭代進行,直到機器學習和邏輯推理得到的結(jié)果統(tǒng)一[28,35]。
以“手寫等式解密”(即識別圖片中的數(shù)學符號并破解等式背后的“異或”法則)任務(wù)為例,神經(jīng)邏輯機框架如圖2 所示,其主要包含3 個部分,卷積神經(jīng)網(wǎng)絡(luò)(CNN,convolutional neural network)模型對應(yīng)反繹學習中的機器學習,主要用于識別等式符號;無梯度優(yōu)化算法主要用于最大化模型與領(lǐng)域知識、樣本標記的一致性[28];誘因性邏輯程序?qū)?yīng)反繹學習中的邏輯反繹,一方面借助領(lǐng)域知識(如一階邏輯公式)和樣本標記,根據(jù)CNN 識別結(jié)果學習數(shù)據(jù)中的加法形式(如邏輯異或),另一方面在存在不一致時推理得到更可能正確的等式符號,訓練開始時,首先CNN 嘗試識別手寫等式圖片為偽標簽符號“1”“+”“0”和“=”,根據(jù)圖片順序?qū)⑸鲜龇栞斎胝T因性邏輯程序。然后,誘因性邏輯程序根據(jù)領(lǐng)域知識判斷識別出符號的最終標記是否和樣本標記一致,若不一致,通過無梯度優(yōu)化算法學習判斷錯誤位置的函數(shù),標記出等式中出現(xiàn)識別錯誤概率較大的位置。誘因性邏輯程序借助領(lǐng)域知識和樣本標記對錯誤進行修改,給出修改依據(jù)的加法規(guī)則(如0+1=1),并將修改結(jié)果用于重新訓練CNN 模型,直到誘因性邏輯程序和CNN 得到的結(jié)果一致[28]。
圖2 神經(jīng)邏輯機框架
知識應(yīng)用是基于網(wǎng)絡(luò)知識進行網(wǎng)絡(luò)策略(如流量轉(zhuǎn)發(fā)策略)生成、策略驗證、意圖檢測、自動修復。其中,策略生成是基于上述知識推理得到網(wǎng)絡(luò)策略。策略驗證是采用形式化驗證技術(shù)驗證上述生成的網(wǎng)絡(luò)策略的可執(zhí)行性(即網(wǎng)絡(luò)能否按照用戶預(yù)期的目標實現(xiàn))。當網(wǎng)絡(luò)中同時存在多個策略時,需要進一步驗證策略間是否發(fā)生沖突,若存在沖突,需要進行沖突消解。意圖檢測是利用網(wǎng)絡(luò)信息測量技術(shù)檢測意圖是否發(fā)生變化和網(wǎng)絡(luò)運行是否出現(xiàn)問題。自動修復是根據(jù)意圖檢測的結(jié)果,若發(fā)現(xiàn)用戶意圖難以滿足,則通過網(wǎng)絡(luò)知識進行網(wǎng)絡(luò)分析與故障修復。
總之,利用無梯度優(yōu)化算法,聯(lián)合優(yōu)化機器學習和邏輯推理獲取網(wǎng)絡(luò)知識,相較于僅機器學習的方法可以提升準確度[28]。因此,借助一些現(xiàn)有的技術(shù),所提出的認知平面具有一定的可實現(xiàn)性。
管理平面一方面從認知平面獲取策略建議,優(yōu)化網(wǎng)絡(luò)數(shù)據(jù)采集,另一方面負責監(jiān)測網(wǎng)絡(luò)數(shù)據(jù)平面狀況,收集網(wǎng)絡(luò)運行狀態(tài)數(shù)據(jù),傳輸給認知平面進行網(wǎng)絡(luò)知識獲取與應(yīng)用。其中,管理平面主要依賴一些網(wǎng)絡(luò)測量協(xié)議,包含主動測量協(xié)議(如Ping、Traceroute 等)、被動測量協(xié)議(如NetFlow 等)和帶內(nèi)網(wǎng)絡(luò)遙測(INT,in-band network telemetry)協(xié)議等,從數(shù)據(jù)平面收集網(wǎng)絡(luò)流量數(shù)據(jù)、業(yè)務(wù)分布數(shù)據(jù)等,并對數(shù)據(jù)進行預(yù)處理(如缺失值處理、重復數(shù)據(jù)清除等),然后傳輸給認知平面進行管控策略生成與驗證。
控制平面從認知平面獲取網(wǎng)絡(luò)策略,利用一些網(wǎng)絡(luò)協(xié)議,如OpenFlow 協(xié)議、簡單網(wǎng)絡(luò)管理協(xié)議(SNMP,simple network management protocol)等,轉(zhuǎn)化為網(wǎng)絡(luò)設(shè)備可以識別的配置指令,自動下發(fā)到數(shù)據(jù)平面中的網(wǎng)絡(luò)設(shè)備中。其中,OpenFlow 協(xié)議允許控制平面控制和管理數(shù)據(jù)平面交換機(如指示交換機如何處理流量)。此外,目前可編程協(xié)議無關(guān)報文處理(P4,programming protocol independent packet processors)作為一種與協(xié)議無關(guān)的編程語言,可以對可編程的轉(zhuǎn)發(fā)設(shè)備(如交換機、網(wǎng)卡等)的轉(zhuǎn)發(fā)邏輯進行編程。同時,控制平面也可以給認知平面提供網(wǎng)絡(luò)配置信息,優(yōu)化網(wǎng)絡(luò)決策。
數(shù)據(jù)平面根據(jù)控制平面下發(fā)的網(wǎng)絡(luò)配置規(guī)則,完成相應(yīng)的配置操作和狀態(tài)更新(如數(shù)據(jù)包的存儲、轉(zhuǎn)發(fā)和處理),其主要由可編程的網(wǎng)絡(luò)設(shè)備(如交換機)組成。
值得注意的是,本文以基于意圖和知識的管控閉環(huán)為例分析所提出的新功能模塊與現(xiàn)有網(wǎng)絡(luò)架構(gòu)中一些功能所在的平面,包含管理平面、控制平面以及數(shù)據(jù)平面的閉環(huán)交互,明確系統(tǒng)工作時不同平面之間的數(shù)據(jù)流轉(zhuǎn),從而為整個系統(tǒng)的可實現(xiàn)性提供支撐。該管控閉環(huán)具體為數(shù)據(jù)平面→管理平面、管理平面&意圖抽象平面→認知平面、認知平面→控制平面、控制平面→數(shù)據(jù)平面。其中,對于數(shù)據(jù)平面→管理平面,管理平面的目標是從數(shù)據(jù)平面采集網(wǎng)絡(luò)狀態(tài)數(shù)據(jù)(如流粒度信息、網(wǎng)絡(luò)拓撲等),主要依賴于測量協(xié)議(如帶內(nèi)網(wǎng)絡(luò)遙測協(xié)議)實現(xiàn)。對于管理平面&意圖抽象平面→認知平面,管理平面對獲取的網(wǎng)絡(luò)狀態(tài)數(shù)據(jù)進行預(yù)處理(如缺失值處理、重復數(shù)據(jù)清除等),去除噪聲的干擾,將處理后的數(shù)據(jù)傳輸?shù)秸J知平面,意圖抽象平面將用戶意圖抽象得到的網(wǎng)絡(luò)優(yōu)化目標傳輸?shù)秸J知平面。認知平面利用從意圖抽象平面獲取的優(yōu)化目標和管理平面?zhèn)鬏數(shù)木W(wǎng)絡(luò)狀態(tài)數(shù)據(jù),采用機器學習和邏輯推理聯(lián)合動態(tài)優(yōu)化獲取網(wǎng)絡(luò)知識,并利用知識生成網(wǎng)絡(luò)策略。對于認知平面→控制平面,認知平面可以采用聲明式語言將網(wǎng)絡(luò)策略下發(fā)到控制平面。對于控制平面→數(shù)據(jù)平面,控制平面主要利用一些網(wǎng)絡(luò)協(xié)議將獲取的網(wǎng)絡(luò)策略轉(zhuǎn)化為網(wǎng)絡(luò)設(shè)備可以識別的配置指令,并部署到數(shù)據(jù)平面中的網(wǎng)絡(luò)設(shè)備中。
由意圖抽象與知識聯(lián)合驅(qū)動的6G 內(nèi)生智能網(wǎng)絡(luò)架構(gòu)可知,內(nèi)生智能網(wǎng)絡(luò)的實現(xiàn)依賴于一系列關(guān)鍵技術(shù),涉及心理學、計算機和通信等領(lǐng)域,需要通過各個領(lǐng)域技術(shù)的交叉融合,才能支撐未來網(wǎng)絡(luò)的內(nèi)生智能。為了確保所提架構(gòu)高效工作,需要攻克用戶意圖映射、網(wǎng)絡(luò)信息測量、網(wǎng)絡(luò)策略生成、網(wǎng)絡(luò)策略驗證等關(guān)鍵技術(shù)。
意圖抽象平面的核心功能是從“What you want”中獲取“What to do”。其中,“What you want”和“What to do”的關(guān)鍵要素分別是用戶主觀QoE和網(wǎng)絡(luò)QoS 指標。而用戶意圖映射技術(shù)作為鏈接二者的重要橋梁,將用戶主觀QoE 準確映射為網(wǎng)絡(luò)QoS 指標。如圖3 所示,意圖映射過程可以建模為兩步,首先將用戶主觀QoE(如MOS 等)映射為一組客觀QoE 指標,然后將上述客觀QoE 指標映射為網(wǎng)絡(luò)QoS 指標[40-41]。以多媒體服務(wù)為例,客觀QoE 指標包含結(jié)構(gòu)相似度(SSIM,structural similarity index)、峰值信噪比(PSPR,peak signal-to-noise ratio)和視頻質(zhì)量度量(VQM)等,網(wǎng)絡(luò)QoS 指標包含丟包率、時延、吞吐量等[38-39]。
圖3 意圖映射過程
目前,已有研究關(guān)注用戶主觀QoE 與客觀QoE指標、網(wǎng)絡(luò)QoS 指標之間的映射過程[39,46]。文獻[39]研究MOS 與VQM、SSIM 之間的相關(guān)性,采用一個包含24 個場景的視頻庫,通過主觀實驗得到MOS數(shù)據(jù),并利用客觀視頻質(zhì)量評價程序獲取視頻的VQM 和SSIM 值。測試表明,VQM 和SSIM 與MOS 之間具有高度相關(guān)性。文獻[46]研究PSNR、SSIM 等6 種客觀QoE 指標與MOS 之間的相關(guān)性,提出了一種映射機制,利用3 個開源視頻質(zhì)量評估數(shù)據(jù)集,評估所提映射機制的性能。
由上述研究可知,現(xiàn)有關(guān)于用戶意圖映射的工作主要針對視頻業(yè)務(wù)[39,46],然而,未來6G 網(wǎng)絡(luò)將存在紛繁多變的業(yè)務(wù),包括沉浸化、智慧化業(yè)務(wù)(如AR/VR、遠程醫(yī)療等)。面向動態(tài)變化的業(yè)務(wù),如何定義和選取合適的QoE 和QoS 指標參數(shù),構(gòu)建用戶主觀QoE、客觀QoE 指標和網(wǎng)絡(luò)QoS 指標之間的映射關(guān)系,實現(xiàn)用戶意圖的準確映射,這仍是一個開放問題。
值得注意的是,近年來,機器學習技術(shù)迅速發(fā)展,可從數(shù)據(jù)中學習,進行特征選擇,建立輸入輸出特征映射函數(shù)。因此,現(xiàn)有研究針對視頻業(yè)務(wù)利用機器學習技術(shù)選擇QoE 和QoS 指標參數(shù)(如帶寬、視頻分辨率等),并學習它們之間的映射關(guān)系[47]。然而,機器學習方法需要大量用戶主觀QoE 和網(wǎng)絡(luò)QoS 指標作為數(shù)據(jù)集進行學習與訓練。
這些數(shù)據(jù)可能涉及用戶隱私問題,用戶分享隱私數(shù)據(jù)進行模型訓練,導致數(shù)據(jù)將有可能被接收方或第三方惡意竊取和利用。最近,聯(lián)邦學習(FL,federated learning)這種分布式機器學習框架將有可能處理上述問題。在聯(lián)邦學習中,用戶可在本地存儲QoE 和QoS 數(shù)據(jù),并訓練本地QoE 和QoS 映射模型,然后將模型上傳至遠程云服務(wù)器,由服務(wù)器進行模型聚合,下發(fā)給參與用戶,如此完成多輪模型訓練。因此,未來對于用戶主觀QoE 和網(wǎng)絡(luò)QoS指標映射模型的構(gòu)建和訓練可以采用聯(lián)邦學習模式,降低用戶隱私數(shù)據(jù)的泄露風險??紤]本地-云服務(wù)器聯(lián)邦學習模式造成的高時延問題,分析其主要來自通信時延[48],可以采用數(shù)據(jù)準備,通過模型稀疏、壓縮和量化等方法降低通信數(shù)據(jù)量;資源分配,選擇通信質(zhì)量較好的客戶端參與訓練,提高聯(lián)邦學習的通信效率以及分層聯(lián)邦學習等方法解決。此外,現(xiàn)有研究通常直接使用面向圖像分類,目標檢測問題的機器學習模型與算法,導致學習效果較差,未來需要針對通信網(wǎng)絡(luò)相關(guān)的指標、數(shù)據(jù),設(shè)計更加可靠、泛化能力更強的機器學習算法,準確映射用戶意圖。
網(wǎng)絡(luò)信息測量技術(shù)作為數(shù)據(jù)平面→管理平面的關(guān)鍵技術(shù),通常借助一些測量協(xié)議,包含主動測量協(xié)議、被動測量協(xié)議和帶內(nèi)網(wǎng)絡(luò)遙測等,全面感知網(wǎng)絡(luò)狀態(tài)信息,如網(wǎng)絡(luò)拓撲、帶寬、吞吐量等,為網(wǎng)絡(luò)智能化提供關(guān)鍵數(shù)據(jù)支撐。主動測量的原理如圖4 中的實線所示,控制主機P1向主機P2發(fā)送探測報文,根據(jù)該報文序列在目標網(wǎng)絡(luò)傳輸后發(fā)生的變化推測主機P1和P2之間的網(wǎng)絡(luò)性能參數(shù),如可達性、路由情況等。目前,主動測量協(xié)議包含Traceroute、IP 等。其中,Traceroute 利用互聯(lián)網(wǎng)控制消息協(xié)議報文得到源主機和目的主機之間的路由情況。優(yōu)點是部署方便,用戶僅在本地發(fā)送探測包,觀察網(wǎng)絡(luò)響應(yīng)即可,缺點是增加了網(wǎng)絡(luò)負載,可能引起海森堡效應(yīng),即額外的流量會干擾網(wǎng)絡(luò)。被動測量的原理如圖4 中的虛線所示,采集數(shù)據(jù)的裝置M1和M3可以直接接入設(shè)備R1和R3中,從而捕捉流經(jīng)設(shè)備R1和R3的信息。目前,被動測量協(xié)議包含NetFlow、采樣流(SFlow,sampled flow)等。其中,NetFlow 以流為粒度進行網(wǎng)絡(luò)測量,設(shè)置固定的采樣時間間隔捕獲流經(jīng)交換機的信息,然后導出聚合數(shù)據(jù)。優(yōu)點是不產(chǎn)生額外的網(wǎng)絡(luò)負載,缺點是只能獲得局部網(wǎng)絡(luò)數(shù)據(jù),難以獲取端到端的網(wǎng)絡(luò)信息。
圖4 主動測量和被動測量原理
考慮主動測量和被動測量技術(shù)分別存在“旁觀者效應(yīng)”和“不精確測量效應(yīng)”,研究者提出了一種新的網(wǎng)絡(luò)數(shù)據(jù)收集和處理技術(shù),即帶內(nèi)網(wǎng)絡(luò)遙測技術(shù)采用上報模式,即網(wǎng)絡(luò)設(shè)備主動上報數(shù)據(jù)信息(如設(shè)備級信息、入端口信息、出端口信息等),可從物理網(wǎng)元或虛擬網(wǎng)元上遠程采集數(shù)據(jù),不需要注入額外的數(shù)據(jù)包,并可以獲得端到端的網(wǎng)絡(luò)運行信息,有望解決以上問題[49-50]。
目前,有研究提出利用帶內(nèi)網(wǎng)絡(luò)遙測技術(shù)收集網(wǎng)絡(luò)運行數(shù)據(jù)[51-53]。其中,文獻[51]在有線網(wǎng)絡(luò)場景中采用帶內(nèi)遙測技術(shù)收集交換機ID、跳延遲、隊列擁塞狀態(tài)等信息。其中,網(wǎng)絡(luò)數(shù)據(jù)作為元數(shù)據(jù)附加在虛擬擴展局域網(wǎng)數(shù)據(jù)包中,當數(shù)據(jù)包離開測量網(wǎng)絡(luò)域時,從INT 數(shù)據(jù)包中剝離INT 數(shù)據(jù)并轉(zhuǎn)發(fā)到監(jiān)測主機。不同于文獻[51],文獻[52-53]考慮在無線網(wǎng)絡(luò)中引入帶內(nèi)網(wǎng)絡(luò)遙測技術(shù)。文獻[52]基于IEEE 802.15.4e 標準的工業(yè)無線傳感器網(wǎng)絡(luò),利用IEEE 802.15.4e 幀設(shè)計了一種新的網(wǎng)絡(luò)遙測機制,主要思想是利用幀中剩余空間封裝收集網(wǎng)絡(luò)節(jié)點標識號、接收信號強度指示(RSSI,received signal strength indication)、信道狀態(tài)等信息。文獻[53]關(guān)注IEEE 802.11 網(wǎng)絡(luò),基于SDN 架構(gòu)設(shè)計一種低吞吐量的帶內(nèi)遙測技術(shù),將收集到的RSSI、數(shù)據(jù)速率、信道信息、接收時間等信息封裝到網(wǎng)絡(luò)介質(zhì)訪問控制層和網(wǎng)絡(luò)層報頭之間。文獻[53]采用帶內(nèi)遙測技術(shù)定制化收集網(wǎng)絡(luò)數(shù)據(jù),相比于主動測量技術(shù)帶寬開銷減少了80%以上。
綜上,雖然帶內(nèi)網(wǎng)絡(luò)遙測相比主動測量和被動測量技術(shù)具有優(yōu)勢,但是目前帶內(nèi)網(wǎng)絡(luò)遙測的研究成果僅處于“剛能測量”的階段,還存在很多技術(shù)挑戰(zhàn)。首先,INT 中定義了網(wǎng)絡(luò)設(shè)備可以主動上報數(shù)據(jù)信息,但數(shù)據(jù)包自身無法選擇路徑轉(zhuǎn)發(fā),無法實時獲得全網(wǎng)狀態(tài)的網(wǎng)絡(luò)視圖。其次,遙測指令和數(shù)據(jù)的構(gòu)造、封裝、填充和提取等不僅消耗了網(wǎng)絡(luò)帶寬,而且增加了交換機處理時延。此外,目前INT主要針對單個網(wǎng)絡(luò)進行網(wǎng)絡(luò)數(shù)據(jù)的收集,而未來6G內(nèi)生智能網(wǎng)絡(luò)需要全面實時感知與分析異構(gòu)網(wǎng)絡(luò)動態(tài)信息,因此,未來需要對跨異構(gòu)網(wǎng)絡(luò)遙測、通用化遙測模型等進行深入研究,才能為網(wǎng)絡(luò)智能決策提供數(shù)據(jù)支撐。
認知平面主要負責根據(jù)“What to do”完成“How to configure the network”,最終將用戶意圖轉(zhuǎn)換為網(wǎng)絡(luò)配置操作。其中,網(wǎng)絡(luò)策略生成技術(shù)是認知平面的重要使能技術(shù),將運用網(wǎng)絡(luò)知識,基于用戶意圖實現(xiàn)網(wǎng)絡(luò)各層(如接入網(wǎng)、核心網(wǎng)等)功能和資源的智能決策。網(wǎng)絡(luò)策略生成可以采用傳統(tǒng)優(yōu)化方法和智能優(yōu)化方法。其中,傳統(tǒng)優(yōu)化方法通常要求目標函數(shù)是凸函數(shù),可行域是凸集等條件,限制了可解決的問題范圍。目前,廣泛使用的策略生成方法是智能優(yōu)化方法,通常采用強化學習算法,從環(huán)境交互中學習。根據(jù)網(wǎng)絡(luò)優(yōu)化目標和環(huán)境信息設(shè)計智能體,包含定義智能體動作函數(shù)、獎勵函數(shù)和狀態(tài)函數(shù),通過最大化累積獎勵從而獲得最優(yōu)或次優(yōu)的一系列網(wǎng)絡(luò)動作,即網(wǎng)絡(luò)策略(如計算卸載策略)。如圖5 所示,智能體當前狀態(tài)定義為s(t)∈S,然后與環(huán)境交互,即采取動作a(t)∈A,獲得相應(yīng)的獎勵r(t+1) =U r(s(t);a(t)),并轉(zhuǎn)移到下一個狀態(tài)s(t+1),如此迭代,通過最大化累積獎勵,獲得最優(yōu)的網(wǎng)絡(luò)策略。其中,累積獎勵函數(shù)可以定義為
圖5 強化學習執(zhí)行過程
其中,γ∈ [0,1]是折扣率,表示未來獎勵相對于當前獎勵的重要程度。
文獻[54]將強化學習應(yīng)用于虛擬化網(wǎng)絡(luò)功能(VNF,virtual network function)最優(yōu)放置中,首先將VNF 放置過程建模為馬爾可夫決策過程,然后利用強化學習,將遷移成本和資源超載懲罰的負值定義為獎勵,智能體通過與VNF 放置環(huán)境進行交互,最大化長期累積獎勵得到滿足用戶QoS 的VNF放置策略。文獻[55]將深度強化學習用于計算卸載方案設(shè)計中,首先將任務(wù)之間的依賴關(guān)系建模為有向無環(huán)圖,并和卸載方案一起作為狀態(tài)空間,然后采用卸載和本地執(zhí)行表示動作,將卸載時延的負增量定義為獎勵,通過最大化累積獎勵,即最小化總時延得到最優(yōu)的卸載策略。文獻[56]將深度強化學習算法用于車聯(lián)網(wǎng)服務(wù)遷移方案設(shè)計中,將服務(wù)供應(yīng)商的內(nèi)存臟頁速率、服務(wù)距離和車輛移動速度定義為環(huán)境狀態(tài),采用服務(wù)遷移和不遷移表示動作,將系統(tǒng)效用(遷移凈收入)定義為獎勵,通過與環(huán)境交互學習得到基于移動速度的自適應(yīng)遷移決策,最大化系統(tǒng)效用。
綜上,網(wǎng)絡(luò)功能和資源管控策略生成作為智能網(wǎng)絡(luò)決策的核心功能,通過生成合適的網(wǎng)絡(luò)配置策略,提升網(wǎng)絡(luò)業(yè)務(wù)的服務(wù)質(zhì)量。目前,基于強化學習的策略生成方案需要預(yù)先定義好環(huán)境狀態(tài)、獎勵和動作3 個部分,目標是最大化累積獎勵。其中,獎勵函數(shù)的定義直接影響最終學習到的網(wǎng)絡(luò)策略。若獎勵設(shè)計不合適,會降低智能體學習的效率,給最終網(wǎng)絡(luò)策略的生成帶來挑戰(zhàn)。此外,現(xiàn)有研究僅能針對單一場景和任務(wù)(如計算卸載)進行網(wǎng)絡(luò)策略的制定與優(yōu)化。而未來6G 需要同時滿足多類場景的需求,現(xiàn)有方法將難以實現(xiàn)全場景管控。因此,亟須為智能網(wǎng)絡(luò)探索新的決策框架與機制,基于網(wǎng)絡(luò)知識而不是基于任務(wù)獲取最優(yōu)的網(wǎng)絡(luò)策略,借助人工智能技術(shù)對網(wǎng)絡(luò)狀態(tài)變化規(guī)律進行動態(tài)分析與建模[57],提高智能網(wǎng)絡(luò)應(yīng)對復雜環(huán)境的穩(wěn)健性和自適應(yīng)性。
網(wǎng)絡(luò)策略生成后,若直接通過一些操作(如網(wǎng)絡(luò)配置協(xié)議)下發(fā)到數(shù)千臺甚至數(shù)萬臺網(wǎng)絡(luò)設(shè)備中,一旦出錯,將產(chǎn)生巨大的影響。因此,在認知平面完成“How to configure the network”之前需要進行網(wǎng)絡(luò)策略驗證。策略驗證首先需要進行策略的正確性驗證,其次若包含多個策略,需要進一步進行策略間的沖突性驗證。
網(wǎng)絡(luò)策略的正確性驗證通常采用模型檢測與定理證明方法。模型檢測的基本原理是使用狀態(tài)空間搜索方法檢測一個有限狀態(tài)系統(tǒng)是否滿足一個規(guī)范或規(guī)約[58-59]。優(yōu)點是自動化程度較高,若系統(tǒng)性質(zhì)不滿足,反饋該性質(zhì)不滿足的原因,據(jù)此原因系統(tǒng)可以進一步改進;缺點是可能出現(xiàn)狀態(tài)空間爆炸,由于檢測程序需要對系統(tǒng)整個狀態(tài)空間進行搜索,系統(tǒng)狀態(tài)圖的大小與系統(tǒng)模型的狀態(tài)數(shù)成正比,而系統(tǒng)模型的狀態(tài)數(shù)與并發(fā)系統(tǒng)的大小呈指數(shù)關(guān)系,因此,隨著待檢測系統(tǒng)規(guī)模的增大,所需搜索的狀態(tài)空間呈指數(shù)增大。定理證明方法的基本原理是通過逐步推導表明系統(tǒng)性質(zhì)的公式來驗證系統(tǒng)的正確性。優(yōu)點是可以應(yīng)用于包含無限狀態(tài)空間的系統(tǒng);缺點是自動化程度不高,大多數(shù)定理證明是交互式的,需要具有較強數(shù)學能力的專家引導。
策略的沖突性驗證主要驗證不同策略間是否產(chǎn)生沖突關(guān)系,若存在沖突關(guān)系則需要進行沖突消解(如移除低優(yōu)先級的策略)。目前,根據(jù)策略匹配域(如地址空間)的關(guān)系和策略執(zhí)行的動作定義以下策略的沖突關(guān)系:冗余、覆蓋、相關(guān)和泛化[60]。其中,冗余是策略A 和策略B 包含的操作對象相同,且對應(yīng)的操作結(jié)果相同,但策略A 擁有更高的優(yōu)先級;覆蓋是策略A 和策略B 包含的操作對象相同,但對應(yīng)對象的操作結(jié)果不同,策略A 擁有更高的優(yōu)先級;相關(guān)是策略A 和策略B 包含的操作對象不同但存在交集關(guān)系,并且相同對象的操作結(jié)果不同,并且策略A 擁有更高的優(yōu)先級;泛化是策略A 和策略B 包含的操作對象不同但存在子集關(guān)系,相同對象的操作結(jié)果相同,并且策略B 擁有更高的優(yōu)先級[60-61]。策略的沖突性驗證的優(yōu)點是在策略下發(fā)前,檢查策略間是否存在沖突關(guān)系,從而提高了整個系統(tǒng)的穩(wěn)定性;缺點是增加了系統(tǒng)的復雜性,系統(tǒng)需要分析策略間沖突關(guān)系,并進行沖突消解,可能導致較長的系統(tǒng)響應(yīng)時間[62]。
文獻[63]采用機器學習方法(如決策樹)執(zhí)行計算樹模型檢測過程,不僅可以驗證系統(tǒng)設(shè)計的正確性,而且減少了模型檢測消耗的時間。文獻[64-65]主要進行策略的沖突性驗證。文獻[64]提出異常檢測與分析方案進行不同策略間的沖突驗證與修復。文獻[65]基于SDN 增加策略沖突管理模塊,檢測策略沖突并采用沖突解決方法向網(wǎng)絡(luò)管理員提供沖突解決建議,協(xié)助網(wǎng)絡(luò)管理員解決策略沖突問題。
綜上,策略的正確性驗證主要驗證所生成的策略能否正確應(yīng)用于系統(tǒng),然而,當前驗證技術(shù)的發(fā)展還處于初級階段,側(cè)重于驗證一些軟件和硬件方面的問題,在可擴展性方面是受限的。在未來6G網(wǎng)絡(luò)中,網(wǎng)絡(luò)驗證不僅涉及軟件和硬件方面,還有網(wǎng)絡(luò)自身的特性,例如,鏈路時延、丟包率和帶寬抖動性等各種指標,這將給網(wǎng)絡(luò)策略驗證技術(shù)帶來巨大的挑戰(zhàn)。此外,目前策略的沖突性驗證主要是檢測所生成的網(wǎng)絡(luò)策略間是否存在沖突關(guān)系,并進行沖突消解。一方面,現(xiàn)有研究將策略間的沖突關(guān)系僅定義為冗余、覆蓋、相關(guān)和泛化,隨著6G 網(wǎng)絡(luò)發(fā)展,用戶意圖將更加多樣化,導致策略間的沖突關(guān)系更加復雜,因此,未來還需探索策略間新的沖突關(guān)系定義與檢測方式。另一方面,目前沖突消解的方法通常設(shè)置優(yōu)先級,即移除低優(yōu)先級策略,更新高優(yōu)先級策略的條件限制,導致難以保障低優(yōu)先級用戶的服務(wù)性能,因此,未來還需進一步創(chuàng)新策略沖突消解方案,滿足不同用戶差異化的性能需求。此外,考慮未來6G 網(wǎng)絡(luò)的動態(tài)性將逐步增強,因此,進行策略正確性和沖突性驗證時還需要考慮如何全生命周期保障用戶意圖請求,這也是一個開放問題。值得注意的是,最近,數(shù)字孿生技術(shù)通過收集物理實體的模型參數(shù)和運行數(shù)據(jù),借助仿真、建模等技術(shù),在虛擬空間構(gòu)建一個與物理實體一致的孿生體,進行物理世界的數(shù)字化映射[66],可初步驗證由“What to do”優(yōu)化生成的策略的執(zhí)行和協(xié)同狀況,同時反饋給意圖抽象平面從而進一步評估“What to do”的精準度。因此,未來對于網(wǎng)絡(luò)策略驗證可以采用數(shù)字孿生技術(shù),基于實時收集的網(wǎng)絡(luò)數(shù)據(jù),對網(wǎng)絡(luò)策略的全生命周期運行狀況進行驗證。因此,未來對于網(wǎng)絡(luò)策略驗證可以采用數(shù)字孿生技術(shù),基于實時收集的網(wǎng)絡(luò)數(shù)據(jù),對網(wǎng)絡(luò)策略的全生命周期運行狀況進行驗證。
未來6G 網(wǎng)絡(luò)既要以“數(shù)據(jù)”為基礎(chǔ),也要以“智能”為核心,通過“計算-通信-控制”有機融合,構(gòu)建智聯(lián)服務(wù),支持動態(tài)多變的IT3.0 時代業(yè)務(wù)需求。本文綜合基于意圖的網(wǎng)絡(luò)和知識定義網(wǎng)絡(luò)的優(yōu)勢,提出意圖抽象與知識聯(lián)合驅(qū)動的6G 內(nèi)生智能網(wǎng)絡(luò)架構(gòu),首先設(shè)計意圖抽象模塊,從“What you want”準確獲取“What to do”,其次提出認知模塊,利用機器學習和邏輯推理聯(lián)合動態(tài)優(yōu)化獲取網(wǎng)絡(luò)知識,從而根據(jù)“What to do”高效完成“How to configure the network”,實現(xiàn)知識從內(nèi)部驅(qū)動網(wǎng)絡(luò)智能決策,意圖從外部驅(qū)動網(wǎng)絡(luò)自動化部署,提高網(wǎng)絡(luò)應(yīng)用普適性,最終實現(xiàn)網(wǎng)絡(luò)自治。目前,內(nèi)生智能網(wǎng)絡(luò)架構(gòu)和關(guān)鍵技術(shù)正在完善中,隨著網(wǎng)絡(luò)日益復雜,服務(wù)需求也逐漸增多,未來還需進一步融合人-機-物、人工智能等技術(shù),提高網(wǎng)絡(luò)服務(wù)效率。