孫 滔 周 鋮 段曉東 陸 璐 陳丹陽 楊紅偉 朱艷宏 劉 超 李 琴 王 曉 沈 震 瞿逢重 蔣懷光 王飛躍
隨著5G、物聯(lián)網(wǎng)和云計算技術(shù)的發(fā)展以及層出不窮的網(wǎng)絡新業(yè)務涌現(xiàn),網(wǎng)絡負載不斷增加,網(wǎng)絡規(guī)模持續(xù)擴大.由此帶來的網(wǎng)絡復雜性,使得網(wǎng)絡的運行和維護變得越來越復雜[1-2].同時,由于網(wǎng)絡運營的高可靠性要求,網(wǎng)絡故障的高代價以及昂貴的試驗成本,網(wǎng)絡的變動往往牽一發(fā)而動全身,新技術(shù)的部署愈發(fā)困難.具體來說,超大規(guī)模網(wǎng)絡發(fā)展面臨的典型挑戰(zhàn)總結(jié)如下.
1) 網(wǎng)絡靈活性不足.伴隨物聯(lián)網(wǎng)技術(shù)的興起,網(wǎng)絡通信由最初的人與人通信,發(fā)展至人與物通信,并進一步發(fā)展至物與物通信.通信模式不斷更新,網(wǎng)絡承載的業(yè)務類型、網(wǎng)絡所服務的對象、連接到網(wǎng)絡的設備類型等呈現(xiàn)出多樣化發(fā)展的態(tài)勢,均對網(wǎng)絡本身提出了更高的要求,網(wǎng)絡需具備更高的靈活性與可擴展性.
2) 網(wǎng)絡新技術(shù)研發(fā)周期長、部署難度大.作為基礎設施,網(wǎng)絡具有高可靠性要求,網(wǎng)絡運營商的現(xiàn)網(wǎng)環(huán)境很難直接用于科研人員的網(wǎng)絡創(chuàng)新技術(shù)研究.僅僅基于線下仿真平臺的研究會大大影響結(jié)果的有效性,從而降低網(wǎng)絡創(chuàng)新技術(shù)的發(fā)展速度.此外,新技術(shù)的失敗風險和失敗代價會阻礙對網(wǎng)絡創(chuàng)新應用的嘗試.
3) 網(wǎng)絡管理運維復雜.隨著云計算、虛擬化技術(shù)的發(fā)展,傳統(tǒng)網(wǎng)絡已經(jīng)開始向軟件化、可編程轉(zhuǎn)變,呈現(xiàn)了許多新的特點,如資源的云化、業(yè)務的按需設計、資源的編排等,這使得網(wǎng)絡的運行和維護面臨著前所未有的壓力.由于缺乏有效的統(tǒng)一仿真、分析和預測平臺,很難從現(xiàn)有的預防性運維轉(zhuǎn)向理想的預測性運維.
4) 網(wǎng)絡優(yōu)化成本高、風險大.由于缺乏有效的虛擬驗證平臺,網(wǎng)絡優(yōu)化操作不得不直接作用在現(xiàn)網(wǎng)基礎設施中,造成較長的時間消耗以及較高的現(xiàn)網(wǎng)運行業(yè)務風險,從而加大網(wǎng)絡的運營成本.
為解決上述困難,網(wǎng)絡智能化越來越為產(chǎn)業(yè)界所重視.“基于意圖的網(wǎng)絡”[3-4],“自動駕駛網(wǎng)絡”[5-6],“零接觸(Zero-Touch)網(wǎng)絡”[7]等概念和技術(shù)相繼被業(yè)界提出和推廣,希望借助網(wǎng)絡智能化技術(shù),實現(xiàn)網(wǎng)絡自動化和自主化運行的愿景.數(shù)字孿生網(wǎng)絡構(gòu)建物理網(wǎng)絡的實時鏡像,可增強物理網(wǎng)絡所缺少的系統(tǒng)性仿真、優(yōu)化、驗證和控制能力,助力上述網(wǎng)絡新技術(shù)的部署,更加高效地應對網(wǎng)絡問題和挑戰(zhàn).
將數(shù)字孿生技術(shù)應用于網(wǎng)絡,創(chuàng)建物理網(wǎng)絡設施的虛擬鏡像,即可搭建數(shù)字孿生網(wǎng)絡平臺.通過物理網(wǎng)絡和孿生網(wǎng)絡實時交互,相互影響,數(shù)字孿生網(wǎng)絡平臺能夠助力網(wǎng)絡實現(xiàn)低成本試錯、智能化決策和高效率創(chuàng)新.數(shù)字孿生網(wǎng)絡的研究和應用在產(chǎn)業(yè)和學術(shù)界還處于起步階段.本文結(jié)構(gòu)如下:第1 節(jié)介紹數(shù)字孿生的研究與應用現(xiàn)狀,第2 節(jié)描述數(shù)字孿生網(wǎng)絡的定義和架構(gòu)并給出應用示例,第3節(jié)描述數(shù)字孿生網(wǎng)絡的關鍵技術(shù),第4 節(jié)描述數(shù)字孿生網(wǎng)絡的目標價值,最后是總結(jié)和展望.
數(shù)字孿生的概念最早由美國學者M.Grieves教授提出[8],并定義為三維模型,包括實體產(chǎn)品、虛擬產(chǎn)品以及二者間的連接.2012 年,美國空軍研究實驗室和美國國家航空航天局 (National Aeronautics and Space Administration,NASA)合作提出構(gòu)建未來飛行器的數(shù)字孿生體[9],并定義數(shù)字孿生為高度集成的多物理場、多尺度、多概率的仿真模型.近年來,隨著多學科建模與仿真技術(shù)的飛速發(fā)展,數(shù)字孿生技術(shù)研究成為熱點,并在虛擬樣機、數(shù)字孿生車間、數(shù)字孿生衛(wèi)星、能源交通、醫(yī)療健康等諸多領域得到成功運用[10-12].面向未來網(wǎng)絡,伴隨著云計算、大數(shù)據(jù)、人工智能等技術(shù)的不斷發(fā)展以及信息的泛在化,數(shù)字孿生技術(shù)也將更廣泛地運用于人體活動監(jiān)控與管理、家居生活和科學研究等領域,使得整個社會走向虛擬與現(xiàn)實結(jié)合的“數(shù)字孿生”世界.國際電信聯(lián)盟電信標準化部 (International Telecommunication Union — Telecommunication Standardization Sector,ITU-T)面向未來網(wǎng)絡的Network2030 焦點組的技術(shù)報告[13-14]也將數(shù)字孿生作為未來網(wǎng)絡12 個代表性用例之一.
數(shù)字孿生模型框架目前尚無統(tǒng)一定義.商業(yè)公司、科研機構(gòu)和標準組織都在嘗試定義通用或者專用的模型框架.Gartner 在其物聯(lián)網(wǎng)(Internet of things,IoT)數(shù)字孿生技術(shù)報告[15]中提出構(gòu)建一個物理實體的數(shù)字孿生體需要4 個關鍵要素:模型、數(shù)據(jù)、監(jiān)控和唯一性.文獻[10]提出了數(shù)字孿生的五維模型 {PE,VE,Ss,DD,CN},其中,PE 表示物理實體,VE 表示虛擬實體,Ss 表示服務,DD 表示孿生數(shù)據(jù),CN 表示各部分之間的連接.國際標準化組織(International Organization for Standardization,ISO)發(fā)布了面向制造的數(shù)字孿生系統(tǒng)框架標準草案[16-17],提出包含數(shù)據(jù)采集域、設備控制域、數(shù)字孿生域和用戶域的參考框架,該草案即將成為數(shù)字孿生領域第一個國際標準.
與數(shù)字孿生觀念緊密相關的理論,是由中國科學院自動化研究所王飛躍研究員于2004 年提出的平行系統(tǒng)理論[18-19].平行系統(tǒng)理論同數(shù)字孿生理論在虛實映射、動態(tài)仿真等方面有相似性.但是,兩者在研究對象、核心思想、實現(xiàn)方法、功能等方面均有所區(qū)別[20].數(shù)字孿生主要研究由信息空間和物理空間組成的空間物理系統(tǒng) (Cyber physical system,CPS)[21],而平行系統(tǒng)主要研究社會網(wǎng)絡、信息資源和物理空間深度融合的社會物理信息系統(tǒng) (Cyber physical social system,CPSS)[22],包含社會活動的部分,考慮社會的反映和影響.平行系統(tǒng)相對于數(shù)字孿生的“形似”,更注重“神似”.數(shù)字孿生通過數(shù)字化空間構(gòu)建物理空間的鏡像,而平行系統(tǒng)更強調(diào)計算實驗和外在行為的干預,基于人工系統(tǒng)生成場景.平行系統(tǒng)理論在平行醫(yī)療[23-24]、平行自動駕駛[25]、平行軍事[26]等領域同樣有較多應用.類似于數(shù)字孿生及平行系統(tǒng)理論,文獻[27]提出了智能空間設想,探討了基于智能交通空間,實現(xiàn)智能化車輛和交通基礎設施控制的可行性.
隨著數(shù)字孿生技術(shù)的發(fā)展及其在生產(chǎn)制造等多個產(chǎn)業(yè)的應用,數(shù)字孿生技術(shù)理念在通信網(wǎng)絡領域的應用也逐漸被業(yè)界研究和關注.華為公司提出在意圖驅(qū)動網(wǎng)絡的網(wǎng)絡云化引擎(Network cloud engine,NCE)中[28],在物理網(wǎng)絡和商業(yè)意圖之間構(gòu)建數(shù)字孿生,將過去離散的數(shù)據(jù)進行關聯(lián)并轉(zhuǎn)為在線共享,構(gòu)建全生命周期的數(shù)字化運維能力.Aria公司的產(chǎn)品 STEP-T (Strategic traffic engineering and planning tool)[29]在運營商客戶的骨干網(wǎng)上建立數(shù)字孿生體,運用人工智能 (Artificial intelligence,AI)技術(shù)在大規(guī)模復雜骨干網(wǎng)上完成了路由優(yōu)化和故障仿真.文獻[30-31]提出基于賽博孿生(Cybertwin)的下一代網(wǎng)絡架構(gòu),通過人和物在虛擬世界的數(shù)字表示,提供通信助理、日志記錄和數(shù)字資產(chǎn)等功能,適于未來網(wǎng)絡從端到端連接至云到端連接的演進.文獻[32]建立了5G 移動邊緣計算(Mobile edge computing,MEC)網(wǎng)絡的數(shù)字孿生體,利用孿生體離線訓練基于強化學習的資源分配優(yōu)化和歸一化節(jié)能算法,然后將方案更新至MEC 網(wǎng)絡.文獻[33]提出一種工業(yè)互聯(lián)網(wǎng)對應的數(shù)字孿生網(wǎng)絡集成框架,利用強化學習算法在此框架下尋求最優(yōu)隨機計算卸載和資源分配策略.文獻[34]建立了面向6G 移動邊緣計算系統(tǒng)的數(shù)字孿生邊緣網(wǎng)絡,其中邊緣服務器的孿生體評估實體服務器的狀態(tài),移動邊緣計算系統(tǒng)的孿生體提供數(shù)據(jù)用于訓練卸載策略,方案在降低卸載延時的同時減少了系統(tǒng)開銷.此外,數(shù)字孿生技術(shù)在無線頻譜等方面的感知與管理也有了相關的探索.
中國科學院自動化所王飛躍研究員將平行系統(tǒng)理論用于網(wǎng)絡系統(tǒng),提出“平行網(wǎng)絡(Parallel networks)”網(wǎng)絡架構(gòu)[35-37],通過建立相應的人工網(wǎng)絡系統(tǒng),開展相關計算實驗,對網(wǎng)絡進行全面、準確和及時的評估.數(shù)字孿生網(wǎng)絡與平行網(wǎng)絡在概念和目標上有一定的相似性,主要設計思想都是類似于狀態(tài)觀測器的設計思路,通過構(gòu)造出類似原系統(tǒng)的衍生系統(tǒng),再針對所構(gòu)造的人工網(wǎng)絡系統(tǒng)或者孿生系統(tǒng)間接的修正實際系統(tǒng)的狀態(tài),從而調(diào)整網(wǎng)絡優(yōu)化資源管理,達到網(wǎng)絡性能優(yōu)化的目的.同時,二者在架構(gòu)和實現(xiàn)方法上有所區(qū)別:平行網(wǎng)絡中的人工網(wǎng)絡并非總是實際網(wǎng)絡的完全映射;數(shù)字孿生網(wǎng)絡的孿生體強調(diào)物理網(wǎng)絡的實時鏡像.平行網(wǎng)絡中的人工網(wǎng)絡基于軟件定義網(wǎng)絡(Software defined network,SDN)[38-39]技術(shù)和理念,實現(xiàn)集中控制、整體優(yōu)化和決策的功能;數(shù)字孿生網(wǎng)絡的孿生層不依賴SDN 技術(shù)進行構(gòu)建,而是根據(jù)物理網(wǎng)絡中網(wǎng)元和拓撲的實際形態(tài)進行抽象建模.在實現(xiàn)方法上,平行網(wǎng)絡可基于有限數(shù)據(jù)進行計算實驗和平行執(zhí)行,不依賴于全面、準確的數(shù)據(jù)即可建模;數(shù)字孿生網(wǎng)絡強調(diào)基于全面且準確的數(shù)據(jù),進行精準建模,達成虛實網(wǎng)絡實時交互.
數(shù)字孿生網(wǎng)絡技術(shù)的相關研究目前還處于初級階段.盡管數(shù)字孿生技術(shù)在網(wǎng)絡中的應用已經(jīng)起步,但目前的應用側(cè)重于特定的物理網(wǎng)絡中、特定的場景(如網(wǎng)絡運維)中,或者將網(wǎng)絡數(shù)字孿生平臺作為網(wǎng)絡仿真工具.結(jié)合數(shù)字孿生技術(shù)的特點以及在其他行業(yè)的應用,本文認為數(shù)字孿生網(wǎng)絡可以作為網(wǎng)絡系統(tǒng)的一個有機整體,成為未來涉及物理網(wǎng)絡的全生命周期的通用架構(gòu),服務于網(wǎng)絡規(guī)劃、建設、維護、優(yōu)化,以及網(wǎng)絡自動駕駛、意圖網(wǎng)絡等網(wǎng)絡創(chuàng)新技術(shù)的應用,提升網(wǎng)絡的自動化和智能化水平.
數(shù)字孿生網(wǎng)絡業(yè)界尚無統(tǒng)一的定義,本文將“數(shù)字孿生網(wǎng)絡”定義為:一個具有物理網(wǎng)絡實體及虛擬孿生體,且二者可進行實時交互映射的網(wǎng)絡系統(tǒng).
在此系統(tǒng)中,各種網(wǎng)絡管理和應用可利用數(shù)字孿生技術(shù)構(gòu)建的網(wǎng)絡虛擬孿生體,基于數(shù)據(jù)和模型對物理網(wǎng)絡進行高效的分析、診斷、仿真和控制.基于此定義,數(shù)字孿生網(wǎng)絡應當具備4 個核心要素:數(shù)據(jù)、模型、映射和交互,如圖1 所示.
圖1 數(shù)字孿生網(wǎng)絡的核心要素Fig.1 The core elements of digital twin networks
1) 數(shù)據(jù)是構(gòu)建數(shù)字孿生網(wǎng)絡的基石,通過構(gòu)建統(tǒng)一的數(shù)據(jù)共享倉庫作為數(shù)字孿生網(wǎng)絡的單一事實源,高效存儲物理網(wǎng)絡的配置、拓撲、狀態(tài)、日志、用戶業(yè)務等歷史和實時數(shù)據(jù),為網(wǎng)絡孿生體提供數(shù)據(jù)支撐.
2) 模型是數(shù)字孿生網(wǎng)絡的能力源,功能豐富的數(shù)據(jù)模型可通過靈活組合的方式創(chuàng)建多種模型實例,服務于各種網(wǎng)絡應用.
3) 映射是物理網(wǎng)絡實體通過網(wǎng)絡孿生體的高保真可視化呈現(xiàn),是數(shù)字孿生網(wǎng)絡區(qū)別于網(wǎng)絡仿真系統(tǒng)的最典型特征.
4) 交互是達成虛實同步的關鍵,網(wǎng)絡孿生體通過標準化的接口連接網(wǎng)絡服務應用和物理網(wǎng)絡實體,完成對于物理網(wǎng)絡的實時信息采集和控制,并提供及時診斷和分析.
基于四要素構(gòu)建的網(wǎng)絡孿生體可借助優(yōu)化算法、管理方法、專家知識等對物理網(wǎng)絡進行全生命周期的分析、診斷、仿真和控制,實現(xiàn)物理網(wǎng)絡與孿生網(wǎng)絡的實時交互映射,幫助網(wǎng)絡以更低成本、更高效率、更小的現(xiàn)網(wǎng)影響部署各種網(wǎng)絡應用,助力網(wǎng)絡實現(xiàn)極簡化和智慧化運維.
根據(jù)數(shù)字孿生網(wǎng)絡的定義和四個核心要素,數(shù)字孿生網(wǎng)絡可以設計為如圖2 所示的“三層三域雙閉環(huán)”架構(gòu):三層指構(gòu)成數(shù)字孿生網(wǎng)絡系統(tǒng)的物理網(wǎng)絡層、孿生網(wǎng)絡層和網(wǎng)絡應用層;三域指孿生網(wǎng)絡層數(shù)據(jù)域、模型域和管理域,分別對應數(shù)據(jù)共享倉庫、服務映射模型和網(wǎng)絡孿生體管理三個子系統(tǒng);“雙閉環(huán)”是指孿生網(wǎng)絡層內(nèi)基于服務映射模型的“內(nèi)閉環(huán)”仿真和優(yōu)化,以及基于三層架構(gòu)的“外閉環(huán)”對網(wǎng)絡應用的控制、反饋和優(yōu)化.
1) 物理網(wǎng)絡層.物理實體網(wǎng)絡中的各種網(wǎng)元通過孿生南向接口同網(wǎng)絡孿生體交互網(wǎng)絡數(shù)據(jù)和網(wǎng)絡控制信息.作為網(wǎng)絡孿生體的實體對象,物理網(wǎng)絡既可以是蜂窩接入網(wǎng)、蜂窩核心網(wǎng),也可以是數(shù)據(jù)中心網(wǎng)絡、園區(qū)企業(yè)網(wǎng)、工業(yè)物聯(lián)網(wǎng)等;既可以是單一網(wǎng)絡域(例如,無線或有線接入網(wǎng)、傳輸網(wǎng)、核心網(wǎng)、承載網(wǎng)等)子網(wǎng),也可以是端到端的跨域網(wǎng)絡.既可以是網(wǎng)絡域內(nèi)所有的基礎設施,也可以是網(wǎng)絡域內(nèi)特定的基礎設施(例如,無線頻譜資源、核心網(wǎng)用戶面網(wǎng)元等).
2) 孿生網(wǎng)絡層.孿生網(wǎng)絡層是數(shù)字孿生網(wǎng)絡系統(tǒng)的標志,包含數(shù)據(jù)共享倉庫、服務映射模型和網(wǎng)絡孿生體管理三個關鍵子系統(tǒng).數(shù)據(jù)共享倉庫子系統(tǒng)負責采集和存儲各種網(wǎng)絡數(shù)據(jù),并向數(shù)據(jù)映射模型子系統(tǒng)提供數(shù)據(jù)服務和統(tǒng)一接口;服務映射模型子系統(tǒng)完成基于數(shù)據(jù)的建模,為各種網(wǎng)絡應用提供數(shù)據(jù)模型實例,最大化網(wǎng)絡業(yè)務的敏捷性和可編程性;網(wǎng)絡孿生體管理子系統(tǒng)負責網(wǎng)絡孿生體的全生命周期管理以及可視化呈現(xiàn).
3) 網(wǎng)絡應用層.網(wǎng)絡應用通過孿生北向接口向?qū)\生網(wǎng)絡層輸入需求,并通過模型化實例在孿生網(wǎng)絡層進行業(yè)務的部署.充分驗證后,孿生網(wǎng)絡層通過南向接口將控制更新下發(fā)至物理實體網(wǎng)絡.網(wǎng)絡運維和優(yōu)化、網(wǎng)絡可視化、意圖驗證、網(wǎng)絡自動駕駛等網(wǎng)絡創(chuàng)新技術(shù)及各種應用能夠以更低的成本、更高的效率和更小的現(xiàn)網(wǎng)業(yè)務影響實現(xiàn)快速部署.
圖2 數(shù)字孿生網(wǎng)絡架構(gòu)Fig.2 Digital twin network architecture
從數(shù)字孿生網(wǎng)絡的架構(gòu)可以看出,數(shù)字孿生網(wǎng)絡不局限于軟件定義網(wǎng)絡SDN 的架構(gòu);同平行網(wǎng)絡相似,數(shù)字孿生網(wǎng)絡能夠基于虛擬層的仿真,實現(xiàn)SDN 管理和控制層無法實現(xiàn)的復雜網(wǎng)絡動態(tài)控制和優(yōu)化.表1 進一步對比了數(shù)字孿生網(wǎng)絡、軟件定義網(wǎng)絡和平行網(wǎng)絡在物理對象、架構(gòu)層次、虛實映射和分析方法等方面的區(qū)別.
2.3.1 數(shù)據(jù)共享倉庫
數(shù)據(jù)共享倉庫通過南向接口采集并存儲網(wǎng)絡實體的各種配置和運行數(shù)據(jù),形成數(shù)字孿生網(wǎng)絡的單一事實源,為各種服務于應用的網(wǎng)絡模型提供準確完備的數(shù)據(jù),包括但不限于網(wǎng)絡配置信息、網(wǎng)絡運行狀態(tài)和用戶業(yè)務數(shù)據(jù)等.數(shù)據(jù)共享倉庫主要有以下四項職責.
1) 數(shù)據(jù)采集.完成網(wǎng)絡數(shù)據(jù)的抽取、轉(zhuǎn)換、加載,以及清洗和加工,便于大規(guī)模的數(shù)據(jù)實現(xiàn)高效分布式存儲.
2)數(shù)據(jù)存儲.結(jié)合網(wǎng)絡數(shù)據(jù)的多樣化特性,利用多種數(shù)據(jù)存儲技術(shù),完成海量網(wǎng)絡數(shù)據(jù)的高效存儲.
3)數(shù)據(jù)服務.為服務映射模型子系統(tǒng)提供包括快速檢索、并發(fā)沖突、批量服務、統(tǒng)一接口等多種數(shù)據(jù)服務.
4)數(shù)據(jù)管理.完成數(shù)據(jù)的資產(chǎn)管理、安全管理、質(zhì)量管理和元數(shù)據(jù)管理.
作為數(shù)字孿生網(wǎng)絡的基石,數(shù)據(jù)共享倉庫中的數(shù)據(jù)越完備越準確,數(shù)據(jù)模型的豐富性和準確性就越高.
2.3.2 服務映射模型
服務映射模型包括基礎模型和功能模型兩部分.
基礎模型是指基于網(wǎng)元基本配置、環(huán)境信息、運行狀態(tài)、鏈路拓撲等信息,建立的對應于物理實體網(wǎng)絡的網(wǎng)元模型和拓撲模型,實現(xiàn)對物理網(wǎng)絡的實時精確描述.
功能模型是指針對特定的應用場景,充分利用數(shù)據(jù)倉庫中的網(wǎng)絡數(shù)據(jù),建立的網(wǎng)絡分析、仿真、診斷、預測、保障等各種數(shù)據(jù)模型.功能模型可以通過多個維度構(gòu)建和擴展:按照網(wǎng)絡類型構(gòu)建,可以有服務于單網(wǎng)絡域(如移動接入網(wǎng)、傳輸網(wǎng)、核心網(wǎng)、承載網(wǎng)等)的模型或者服務于多網(wǎng)絡域的模型;按照功能類型劃分,可分為狀態(tài)監(jiān)測、流量分析、安全演練、故障診斷、質(zhì)量保障等模型;按照適用范圍劃分,可以劃分為通用模型和專用模型;按照網(wǎng)絡生命周期管理劃分,可分為規(guī)劃、建設、維護、優(yōu)化和運營等模型.將多個維度結(jié)合在一起,可以創(chuàng)建面向更為具體應用場景的數(shù)據(jù)模型,例如,可以建立園區(qū)網(wǎng)絡核心交換機上的流量均衡優(yōu)化模型,通過模型實例服務于相應的網(wǎng)絡應用.
基礎模型和功能模型通過實例或者實例的組合向上層網(wǎng)絡應用提供服務,最大化網(wǎng)絡業(yè)務的敏捷性和可編程性.同時,模型實例需要通過程序驅(qū)動在虛擬孿生網(wǎng)元或網(wǎng)絡拓撲中對預測、調(diào)度、配置、優(yōu)化等目標完成充分的仿真和驗證,保證變更控制下發(fā)到物理網(wǎng)絡時的有效性和可靠性.
2.3.3 網(wǎng)絡孿生體管理
網(wǎng)絡孿生體管理完成數(shù)字孿生網(wǎng)絡的管理功能,全生命周期記錄,可視化呈現(xiàn)和管控網(wǎng)絡孿生體的各種元素,包括拓撲管理、模型管理和安全管理.
1)拓撲管理基于基礎模型,生成物理網(wǎng)絡對應的虛擬拓撲,并對拓撲進行多維度、多層次的可視化展現(xiàn).
2)模型管理服務于各種數(shù)據(jù)模型實例的創(chuàng)建、存儲、更新以及模型組合、應用關聯(lián)的管理.同時,可視化地呈現(xiàn)模型實例的數(shù)據(jù)加載、模型仿真驗證過程和結(jié)果.
3)安全管理與共享數(shù)據(jù)倉庫中的數(shù)據(jù)管理一起,負責數(shù)字孿生網(wǎng)絡數(shù)據(jù)和模型安全保障相關的鑒權(quán)、認證、授權(quán)、加密和完整性保護.
表1 DTN、SDN 和平行網(wǎng)絡對比Table 1 Comparison of DTN,SDN and parallel networks
意圖網(wǎng)絡[3]是可以使用“用戶意圖”進行管理的網(wǎng)絡,它能夠識別和接收操作員或用戶的意圖,并根據(jù)用戶意圖自主地配置和調(diào)整自己,從而實現(xiàn)預期的結(jié)果,而無需用戶指定用于如何實現(xiàn)結(jié)果的詳細技術(shù)步驟.圖3 所示為一種基于數(shù)字孿生網(wǎng)絡架構(gòu)實現(xiàn)意圖網(wǎng)絡的參考框架.其中意圖網(wǎng)絡的基礎設施對應于DTN 架構(gòu)中的物理網(wǎng)絡層,意圖網(wǎng)絡的配置驗證、意圖保障和自動修復等關鍵功能可基于孿生網(wǎng)絡層的多種服務映射模型實現(xiàn),實時保障來自網(wǎng)絡應用層的用戶意圖.
圖3 基于DTN 的意圖網(wǎng)絡框架Fig.3 Intent network architecture
1) 基于服務映射模型的配置驗證.用戶意圖經(jīng)過意圖翻譯后,生成大量物理網(wǎng)絡能執(zhí)行的網(wǎng)絡配置,如果將這些配置直接下發(fā)到物理網(wǎng)絡上可能影響其他業(yè)務正常處理,所產(chǎn)生的影響無法預估.利用數(shù)字孿生網(wǎng)絡的服務映射模型,提前校驗和模擬配置下發(fā),提前發(fā)現(xiàn)配置中的一些異常問題,例如地址沖突、路由環(huán)路、路由不可達等.驗證配置既能滿足用戶業(yè)務意圖,又對其他已有業(yè)務沒有影響后,再將配置下發(fā)到物理網(wǎng)絡.
2) 基于服務映射模型的意圖保障和自動修復.通過數(shù)據(jù)采集將物理網(wǎng)絡運行狀態(tài)傳遞到孿生網(wǎng)絡層的數(shù)據(jù)共享倉庫,服務映射模型不斷驗證用戶意圖是否被滿足.當發(fā)現(xiàn)網(wǎng)絡偏離了用戶業(yè)務意圖,可利用AI 等智能化技術(shù)做根因分析,生成修復策略.因為當前AI 技術(shù)還不能保證修復策略完全可靠且能解決問題,所以一般需要人工確認無誤后再下發(fā)到物理網(wǎng)絡,拉低了故障修復效率.利用數(shù)字孿生網(wǎng)絡的服務映射模型先驗證修復策略,保證正確無誤后,再通過自動化配置模塊下發(fā)到物理網(wǎng)絡,既提高了運維效率,又推動了AI 技術(shù)的應用落地.
綜上,意圖網(wǎng)絡可基于數(shù)字孿生網(wǎng)絡架構(gòu),實現(xiàn)網(wǎng)絡配置的提前驗證和用戶業(yè)務意圖的實時保障等關鍵功能,這將有助于意圖網(wǎng)絡的有效落地部署.
構(gòu)建數(shù)字孿生網(wǎng)絡系統(tǒng)面臨以下主要問題和挑戰(zhàn):
1) 兼容性問題.網(wǎng)絡中不同廠商設備的技術(shù)實現(xiàn)和支持的功能不一致,因此建立面向全網(wǎng)絡域的數(shù)據(jù)共享倉庫,設計適配異廠家設備的接口以進行統(tǒng)一數(shù)據(jù)采集和處理的難度較高.
2) 建模難度大.基于大規(guī)模網(wǎng)絡數(shù)據(jù),數(shù)據(jù)建模既要保證模型功能的豐富性,也需考慮模型的靈活性和可擴展性,這些需求進一步加大了構(gòu)建高效的、層次化的基礎模型和功能模型的難度.
3) 實時性挑戰(zhàn).對于實時性要求較高的業(yè)務,模型仿真和驗證在數(shù)字孿生網(wǎng)絡上的處理會增加延遲,所以模型的功能和流程需要增加多種網(wǎng)絡應用場景下的處理機制;同時,實時性要求也會進一步增加系統(tǒng)的軟硬件性能需求.
4) 規(guī)模性難題.通信網(wǎng)絡通常網(wǎng)元數(shù)量多、覆蓋地域廣、服務時間長,因此網(wǎng)絡數(shù)字孿生體必將是一個規(guī)模龐大的復雜巨系統(tǒng),這會顯著增加數(shù)據(jù)的采集和存儲、模型的設計和運用等方面的復雜度,對系統(tǒng)的軟硬件要求也會非常高.
為了解決以上問題和挑戰(zhàn),本文將基于第2.2 節(jié)提出數(shù)字孿生網(wǎng)絡參考架構(gòu),擬采用目標驅(qū)動的網(wǎng)絡數(shù)據(jù)采集、多元網(wǎng)絡數(shù)據(jù)存儲和服務、多維全生命周期網(wǎng)絡建模、交互式可視化呈現(xiàn)、以及接口協(xié)議體系五大關鍵使能技術(shù),完成數(shù)字孿生網(wǎng)絡系統(tǒng)的構(gòu)建.
數(shù)據(jù)采集是構(gòu)建數(shù)據(jù)倉庫的基礎,作為物理網(wǎng)絡的數(shù)字鏡像,數(shù)據(jù)越全面、準確,數(shù)字孿生網(wǎng)絡越能高保真的還原物理網(wǎng)絡.數(shù)據(jù)采集應當采用目標驅(qū)動模式,數(shù)據(jù)采集的類型、頻率和方法以滿足數(shù)字孿生網(wǎng)絡的應用為目標,兼具全面、高效的特征.當對特定網(wǎng)絡應用進行數(shù)據(jù)建模時,所需的數(shù)據(jù)均可以從網(wǎng)絡孿生層的數(shù)據(jù)共享倉庫中高效獲取.以目標應用為驅(qū)動,只有全面、高效地采集模型所需數(shù)據(jù),才能構(gòu)建精準數(shù)據(jù)模型,為目標應用提供良好服務.
網(wǎng)絡數(shù)據(jù)采集方式有很多,例如技術(shù)成熟、應用廣泛的SNMP (Simple network management protocol)、Netconf,可采集原始碼流的NetFlow、sFlow,支持數(shù)據(jù)源端推送模式的網(wǎng)絡遙測(Network telemetry)等;不同的數(shù)據(jù)采集方案具備不同的特點,適用于不同的應用場景.結(jié)合數(shù)字孿生網(wǎng)絡對數(shù)據(jù)采集全面、高效的要求,本文認為可選擇網(wǎng)絡遙測技術(shù)作為數(shù)據(jù)采集的解決方案.
目前,業(yè)界通常認為,網(wǎng)絡遙測是指自動化遠程收集網(wǎng)絡多源異構(gòu)狀態(tài)信息,進行網(wǎng)絡測量數(shù)據(jù)存儲、分析及使用的技術(shù).網(wǎng)絡遙測系統(tǒng)具備如下主要特征[40]:
1)推送模式.設備支持通過推送(Push)模式主動向遙測服務器發(fā)送采集數(shù)據(jù).
2)大容量和實時性.網(wǎng)絡遙測數(shù)據(jù)可直接被系統(tǒng)使用,因此支持大容量和實時數(shù)據(jù).
3)模型驅(qū)動.數(shù)據(jù)使用YANG 模型描述,可擴展性好.
4)定制化.支持網(wǎng)絡管理員基于特定應用需求定制網(wǎng)絡采集方案.
圖4 所示為網(wǎng)絡遙測系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)關系.數(shù)字孿生網(wǎng)絡的數(shù)據(jù)主要包括用戶業(yè)務數(shù)據(jù)、網(wǎng)絡配置及運行狀態(tài)數(shù)據(jù)三大類數(shù)據(jù),依據(jù)網(wǎng)絡遙測系統(tǒng)的數(shù)據(jù)結(jié)構(gòu),各類數(shù)據(jù)源使用統(tǒng)一的數(shù)據(jù)建模語言YANG,而數(shù)據(jù)流編碼格式、數(shù)據(jù)流輸出協(xié)議和傳輸承載協(xié)議根據(jù)不同的數(shù)據(jù)源按需擇優(yōu)選擇.
圖4 網(wǎng)絡遙測系統(tǒng)數(shù)據(jù)結(jié)構(gòu)Fig.4 Data structure of network telemetry system
按照測量與轉(zhuǎn)發(fā)是否分離,網(wǎng)絡遙測可分為帶外遙測和帶內(nèi)遙測.帶外遙測具有網(wǎng)絡開銷較小、測量信息種類較多的優(yōu)點,但很難滿足對用戶數(shù)據(jù)流檢測的實時性和準確性要求,同時可編程性也較弱,包括NetFlow、IPFIX[41]、PBT[42]等方案;帶內(nèi)遙測的隨路檢測特性能夠保證獲取業(yè)務測量的準確性,能夠?qū)W(wǎng)絡拓撲、網(wǎng)絡性能和網(wǎng)絡流量實現(xiàn)更細粒度的測量,同時具有較好的可編程性,包括INT[43]、In-situ OAM[44]、iFIT[45]等方案.
針對不同網(wǎng)絡建模需求可按需選擇最適合的網(wǎng)絡遙測方案.以網(wǎng)絡運行狀態(tài)數(shù)據(jù)中的時延數(shù)據(jù)為例,可使用帶內(nèi)網(wǎng)絡遙測(Inband network telemetry,INT)技術(shù)進行采集:數(shù)據(jù)報文經(jīng)過每一臺交換機時都將設備時延數(shù)據(jù)插入數(shù)據(jù)包,插入的位置依據(jù)報文封裝格式不同而不同,最后一跳交換機將收集所有的轉(zhuǎn)發(fā)時延,通過gRPC 協(xié)議輸出至數(shù)字孿生數(shù)據(jù)共享倉庫.
數(shù)據(jù)倉庫是一個面向主題的、集成的、隨時間變化的、但信息本身相對穩(wěn)定的數(shù)據(jù)集合,用于對管理決策過程的支持[46].數(shù)據(jù)共享倉庫是數(shù)字孿生網(wǎng)絡的單一事實源,存儲海量的網(wǎng)絡歷史數(shù)據(jù)和實時數(shù)據(jù),并將各種數(shù)據(jù)集成到統(tǒng)一的環(huán)境中,為數(shù)據(jù)建模提供統(tǒng)一的數(shù)據(jù)接口和服務.針對網(wǎng)絡數(shù)據(jù)規(guī)模大、種類多、速度快等特點,可綜合應用多元存儲和服務技術(shù)構(gòu)建數(shù)字孿生網(wǎng)絡的數(shù)據(jù)共享倉庫,參考功能框架如圖5 所示.
1) 數(shù)據(jù)采集層.負責將網(wǎng)絡采集的源數(shù)據(jù)進行抽取、轉(zhuǎn)換和加載(Extract-Transform-Load,ETL),完成數(shù)據(jù)清洗和優(yōu)化,以盡可能小的代價將數(shù)據(jù)導入分布式數(shù)據(jù)倉庫.
2) 數(shù)據(jù)存儲層.根據(jù)網(wǎng)絡數(shù)據(jù)的應用場景、數(shù)據(jù)格式和實時性要求等特性的不同,選用多種數(shù)據(jù)存儲技術(shù)構(gòu)建多源異構(gòu)數(shù)據(jù)庫,分別存儲結(jié)構(gòu)化、非結(jié)構(gòu)化的網(wǎng)絡數(shù)據(jù).結(jié)合數(shù)字孿生網(wǎng)絡的建模數(shù)據(jù)以結(jié)構(gòu)化數(shù)據(jù)為主的特點,可基于大規(guī)模并行處理MPP (Massive parallel processing)數(shù)據(jù)庫構(gòu)建DTN 的主數(shù)據(jù)倉庫.Hadoop 云平臺存儲和處理技術(shù)可用于管理非/半結(jié)構(gòu)化數(shù)據(jù),采用分布式文件系統(tǒng)HDFS (Hadoop distributed file system)存儲文件,使用分布式并行計算框架MapReduce 并行執(zhí)行計算操作.NoSQL 數(shù)據(jù)庫支持半結(jié)構(gòu)化或者非結(jié)構(gòu)化數(shù)據(jù)的海量存儲、高擴展性、高可用及并發(fā)要求,其中的圖形數(shù)據(jù)庫和列存儲數(shù)據(jù)庫適用于網(wǎng)絡特定場景下的數(shù)據(jù)處理,可作為傳統(tǒng)數(shù)據(jù)庫的有效補充.
3) 數(shù)據(jù)服務層.面向數(shù)字孿生網(wǎng)絡的服務映射模型,通過統(tǒng)一的數(shù)據(jù)服務接口提供建模所需數(shù)據(jù),同時提供包括快速搜索、數(shù)據(jù)聯(lián)邦、并發(fā)沖突、批量服務、服務組合、歷史快照與回退等各種服務.
4)數(shù)據(jù)管理.負責數(shù)據(jù)采集、存儲和服務過程中的數(shù)據(jù)準確性、安全性和完整性,具體包括元數(shù)據(jù)管理、數(shù)據(jù)安全管理、數(shù)據(jù)質(zhì)量管理和數(shù)據(jù)資產(chǎn)管理.
3.4.1 基于本體的基礎模型建模
數(shù)字孿生網(wǎng)絡的基礎模型通過定義基于本體[47]的統(tǒng)一數(shù)據(jù)模型,實現(xiàn)多源異構(gòu)網(wǎng)絡數(shù)據(jù)的一致性融合表征,為構(gòu)建數(shù)字孿生網(wǎng)絡奠定基礎.基礎模型中網(wǎng)元模型和拓撲模型的構(gòu)建包括如下三個步驟:構(gòu)建本體模型、構(gòu)建“統(tǒng)一表征數(shù)據(jù)庫”及構(gòu)建網(wǎng)元模型和拓撲模型.具體流程如圖6 所示.
圖5 數(shù)據(jù)共享倉庫功能框架Fig.5 Data sharing warehouse functional framework
1)本體模型構(gòu)建.孿生網(wǎng)絡本體模型是實現(xiàn)多源異構(gòu)網(wǎng)絡數(shù)據(jù)一致性表征的基礎,可指導生成“統(tǒng)一表征數(shù)據(jù)庫”.具體實現(xiàn)方式可結(jié)合網(wǎng)絡領域知識,定義本體的組成要素〈類,屬性,關系,公理,實例〉,繼而通過本體對多源異構(gòu)數(shù)據(jù)進行一致性表征[48].以交換機為例,其本體模型的組成要素可以設計如下:
〈類:對應交換機的種類,如二層、三層、四層等類型交換機.
屬性:對應交換機的基本屬性:物理屬性包括交換機的尺寸、功耗、端口數(shù)量等;功能屬性包括交換機支持的各種轉(zhuǎn)發(fā)功能、管理功能等.
關系:對應交換機實例之間或者交換機同其他網(wǎng)元之間的關系,例如物理直連、邏輯互聯(lián)、IP 可達等.
公理:交換機公知的規(guī)則及原理,例如存儲轉(zhuǎn)發(fā)需要耗時、互聯(lián)互通時需要統(tǒng)一的接口和協(xié)議等.
實例:基于交換機種類創(chuàng)建的多個個體.〉
2)統(tǒng)一表征數(shù)據(jù)庫的構(gòu)建.基于孿生網(wǎng)絡本體模型構(gòu)建,通過語義反求工程、語義映射過程和多源異構(gòu)數(shù)據(jù)一致性融合表征實例化操作,形成具有統(tǒng)一格式的數(shù)據(jù),完成從多源異構(gòu)數(shù)據(jù)到統(tǒng)一表征數(shù)據(jù)的映射.
圖6 基于本體的網(wǎng)元和拓撲模型構(gòu)建流程Fig.6 The process of constructing network element and topology model based on ontology
3)網(wǎng)元模型和拓撲模型的構(gòu)建.根據(jù)不同網(wǎng)元模型的功能或拓撲模型的結(jié)構(gòu),可基于統(tǒng)一表征的數(shù)據(jù)庫,按需組合構(gòu)建網(wǎng)絡基礎模型,從而實現(xiàn)孿生網(wǎng)絡和物理網(wǎng)絡的虛實映射.
3.4.2 全生命周期功能模型建模
功能模型面向?qū)嶋H網(wǎng)絡功能需求,通過全生命周期的多種功能模塊,實現(xiàn)動態(tài)演進的網(wǎng)絡推理決策.如第2.3.2 節(jié)所述,功能模型可以根據(jù)各種網(wǎng)絡應用的需求,通過多個維度構(gòu)建和擴展.本文從數(shù)字孿生網(wǎng)絡的功能模型服務于物理網(wǎng)絡的全生命周期運維的維度,描述規(guī)劃、建設、維護、優(yōu)化及運營五個方面數(shù)據(jù)建模時分別適用的關鍵算法.
1)網(wǎng)絡規(guī)劃和建設的建模.基于數(shù)據(jù)倉庫中的網(wǎng)絡及業(yè)務相關的數(shù)據(jù),利用深度學習、機器學習(隨機森林[49]、梯度提升決策樹 (Gradient boosting decision tree,GBDT)[50])等人工智能算法對業(yè)務預測、網(wǎng)絡性能預測、覆蓋優(yōu)化、容量規(guī)劃及站址規(guī)劃等場景進行一一建模,通過數(shù)據(jù)倉庫不斷補充、更新訓練數(shù)據(jù)到模型中,進行模型更新迭代,形成一種AI模型的自適應機制,以實現(xiàn)更加精確的模型推理.
2)網(wǎng)絡維護的建模.網(wǎng)絡維護是一項龐大而復雜的工程,面對網(wǎng)絡維護中存在的各種故障定位及定界問題,當前已有的抽象出來的數(shù)學算法還不具備對現(xiàn)存問題全面準確的表達能力.面向網(wǎng)絡維護的建模,基于經(jīng)驗知識的推理規(guī)則通常更加有效.因此,我們引入知識圖譜[51]作為數(shù)字孿生體中一種重要的核心技術(shù),人類的經(jīng)驗知識通過知識圖譜固化下來.知識圖譜的規(guī)模隨著不同的場景域相關經(jīng)驗知識的不斷沉淀,構(gòu)建的事物之間的關聯(lián)關系體系愈發(fā)龐大,所累積的背景知識亦不斷增加.將網(wǎng)絡專家自身的經(jīng)驗轉(zhuǎn)換為推理規(guī)則集成于知識圖譜,可實現(xiàn)對故障診斷及定位等網(wǎng)絡維護場景的精準推理.
3)網(wǎng)絡優(yōu)化的建模.網(wǎng)絡優(yōu)化包括諸如資源調(diào)配、流量工程、內(nèi)容分發(fā)網(wǎng)絡調(diào)度等多種場景.對于網(wǎng)絡優(yōu)化模型的建模,由于其問題的非凸性、非平穩(wěn)性、隨機性等困難,可采用進化類算法,如遺傳算法[52]、差分進化算法[53]、免疫算法[54]等,或者采用群智能算法,如蟻群算法[55]、粒子群算法[56]等.另外,對于復雜的動態(tài)調(diào)度優(yōu)化場景,可引入強化學習[57].基于強化學習的智能調(diào)度方法組合了動態(tài)規(guī)劃、隨機逼近和函數(shù)逼近的思想,與傳統(tǒng)調(diào)度方法相比,無需建立精確的問題模型,適合解決基于動態(tài)調(diào)度的網(wǎng)絡優(yōu)化問題.
4)網(wǎng)絡運營的建模.網(wǎng)絡運營包括基于網(wǎng)絡所提供的多種服務,如話音、數(shù)據(jù)流量等基礎業(yè)務以及多媒體社交和娛樂等富媒體業(yè)務.建模過程中需要有針對性的采集相關網(wǎng)絡與業(yè)務數(shù)據(jù),借助深度學習、集成算法等進行模型訓練,為了節(jié)省計算資源,對于不同領域之間或者相似領域內(nèi)的不同場景的建模,可借助遷移學習[58],針對不同情況利用基于實例的遷移、特征的遷移及共享參數(shù)的遷移等方法進行快速精準建模.以視頻用戶體驗評估 (Quality of experience) 為例,采集網(wǎng)絡側(cè)關鍵性能指標數(shù)據(jù)和用戶側(cè)視頻體驗數(shù)據(jù)(如初緩時延、卡頓等)進行關聯(lián),利用深度學習算法構(gòu)建視頻用戶體驗的評估模型,實現(xiàn)運營商對用戶體驗的智能感知評估.鑒于視頻業(yè)務的相似性,可將一個視頻業(yè)務訓練好的模型利用遷移學習應用于另外的視頻業(yè)務,以達到快速精準建模.
利用網(wǎng)絡可視化技術(shù),高保真地可視化呈現(xiàn)網(wǎng)絡孿生體中的數(shù)據(jù)和模型 直觀反映物理網(wǎng)絡實體和網(wǎng)絡孿生體的交互映射,是數(shù)字孿生網(wǎng)絡系統(tǒng)的內(nèi)在要求.圖形化展示網(wǎng)絡數(shù)據(jù)和模型,一方面可以輔助用戶認識網(wǎng)絡的內(nèi)部結(jié)構(gòu),另一方面有助于挖掘隱藏在網(wǎng)絡內(nèi)部的有價值信息.數(shù)字孿生網(wǎng)絡的可視化面臨孿生網(wǎng)絡規(guī)模大、虛實映射實時性要求高、數(shù)據(jù)模型的可解釋性偏低等挑戰(zhàn),需要探索高效、實時、精確、互動性強的可視化呈現(xiàn)方法.根據(jù)需求范圍不同,網(wǎng)絡孿生體可視化呈現(xiàn)分為以下三類:
1)網(wǎng)絡拓撲可視化.網(wǎng)絡拓撲結(jié)構(gòu)是通信網(wǎng)絡各種元素(鏈路、節(jié)點等) 的排列,是圖論的應用,其中通信設備被建模為節(jié)點,設備之間的連接被建模為節(jié)點之間的鏈路.作為數(shù)字孿生網(wǎng)絡可視化的基礎,網(wǎng)絡拓撲可視化將網(wǎng)絡節(jié)點和鏈路以點和線構(gòu)成圖形進行呈現(xiàn),清晰直觀地反映網(wǎng)絡運行狀況,輔助人們對網(wǎng)絡進行評估和分析.可視化布局算法是拓撲可視化的核心.一個好的拓撲布局算法需要滿足3 個條件:a)有效避免拓撲圖中節(jié)點的重疊;b)拓撲結(jié)構(gòu)圖中邊的交叉盡可能減少;c)網(wǎng)絡拓撲滿足基本美學標準,如區(qū)域最小原則、邊交叉最小原則、節(jié)點密度均勻原則[59].文獻[60]列舉了常用的拓撲布局算法,結(jié)合通信網(wǎng)絡規(guī)模大、隧道多、分域自治等特點,數(shù)字孿生網(wǎng)絡的拓撲可視化可選用層次型布局、啟發(fā)式布局或力導向布局等算法(或者幾種算法的組合)進行拓撲布局.同時,網(wǎng)絡拓撲可視化需要反映網(wǎng)絡數(shù)據(jù)時間的動態(tài)變化,連續(xù)顯示網(wǎng)絡拓撲的狀態(tài)或者按需顯示任意時刻的網(wǎng)絡拓撲快照.
2)功能模型可視化.數(shù)字孿生網(wǎng)絡功能模型的可視化是指將模型實例的創(chuàng)建、數(shù)據(jù)的加載、模型的仿真驗證過程和結(jié)果利用網(wǎng)絡可視化技術(shù)呈現(xiàn)出來,幫助用戶更好理解、探索和推演模型.近些年來,諸多網(wǎng)絡領域包括網(wǎng)絡流量和資源規(guī)劃、安全威脅描述[61]、網(wǎng)絡異常分析[62]、網(wǎng)絡攻擊檢測[63]等已實現(xiàn)了網(wǎng)絡功能的可視化呈現(xiàn).將相關的可視化技術(shù)運用到數(shù)字孿生網(wǎng)絡的流量建模、故障診斷、質(zhì)量保障、安全建模等功能模型中,基于網(wǎng)絡孿生體完成功能驗證的同時實現(xiàn)可視化呈現(xiàn),可進一步直觀體現(xiàn)統(tǒng)一數(shù)據(jù)模型作為數(shù)字孿生網(wǎng)絡能力源所發(fā)揮的作用.
3) 可視化動態(tài)交互.動態(tài)交互是用戶通過與系統(tǒng)之間的對話和互動操作理解數(shù)據(jù)的過程.交互操作可有效緩解有限的可視化空間和數(shù)據(jù)過載之間的矛盾,拓展可視化中信息表達的空間.數(shù)字孿生網(wǎng)絡的網(wǎng)絡拓撲和數(shù)據(jù)模型需要盡可能提供動態(tài)交互功能,讓用戶更好地參與對網(wǎng)絡數(shù)據(jù)和模型的理解和分析,幫助用戶探索數(shù)據(jù)、提高視覺認知.常用的網(wǎng)絡可視化動態(tài)交互方法有直接交互、焦點+上下文交互、關聯(lián)性交互和沉浸式模擬[60],數(shù)字孿生網(wǎng)絡系統(tǒng)可根據(jù)不同的應用場景選用不同的交互方法或通過多種交互方法的組合實現(xiàn)虛實網(wǎng)絡的可視化動態(tài)交互映射.
面對構(gòu)建大規(guī)模數(shù)字孿生網(wǎng)絡的兼容性和擴展性需求,數(shù)字孿生網(wǎng)絡系統(tǒng)需要設計標準化的接口和協(xié)議體系.基于本文數(shù)字孿生網(wǎng)絡的參考架構(gòu),系統(tǒng)主要包含三種接口:
1) 孿生南向接口.包括孿生網(wǎng)絡層和物理網(wǎng)絡層之間的數(shù)據(jù)采集接口和控制下發(fā)接口.數(shù)據(jù)采集接口負責完成孿生網(wǎng)絡層數(shù)據(jù)共享倉庫的數(shù)據(jù)采集,控制下發(fā)接口負責將服務映射模型仿真驗證后的控制指令下發(fā)至物理網(wǎng)絡層的網(wǎng)元.
2) 孿生北向接口.包括網(wǎng)絡應用層和孿生網(wǎng)絡層之間的意圖翻譯接口和能力調(diào)用接口.網(wǎng)絡應用層可以通過意圖翻譯接口,將應用層意圖傳遞給孿生網(wǎng)絡層,為功能模型提供抽象化的需求輸入.孿生網(wǎng)絡層可以通過能力調(diào)用接口,把其內(nèi)部的數(shù)據(jù)和算法模型能力,提供給上層的各式各樣的應用調(diào)用,滿足網(wǎng)絡應用對數(shù)字孿生體的數(shù)據(jù)和模型的調(diào)用,簡易實現(xiàn)對實體狀態(tài)的監(jiān)控、診斷和預測等功能.
3) 孿生內(nèi)部接口.包括孿生網(wǎng)絡層內(nèi)部數(shù)據(jù)倉庫和功能模型之間的接口、功能模型和數(shù)字孿生體管理之間的接口、功能模型之間的接口等一簇接口.孿生層內(nèi)部基于功能模型對網(wǎng)絡應用進行閉環(huán)控制和持續(xù)驗證,內(nèi)部數(shù)據(jù)的交互數(shù)量和頻率將非常高,因此內(nèi)部接口通過標準化定義保證擴展性的同時,需要使用高效的協(xié)議保證數(shù)據(jù)傳輸?shù)男?
隨著網(wǎng)絡規(guī)模的發(fā)展,上層應用系統(tǒng)越來越多,下層的物理網(wǎng)元數(shù)量也會逐步增加,導致網(wǎng)絡接口的實際數(shù)量將會迅速增加.為了新應用、新功能的快速引入和集成,需要在孿生網(wǎng)絡接口設計時考慮采用統(tǒng)一的、擴展性強的、易用的標準化接口.
1) 孿生北向可以考慮使用輕量級的、易擴展的RESTful 接口.表現(xiàn)層狀態(tài)轉(zhuǎn)移 (Representational state transfer,restful)以資源為核心[64],將資源的CRUD (create,read,update,delete)操作映射為HTTP 的GET、PUT、POST、DELETE 等方法.由于REST 式的web 服務提供了統(tǒng)一的接口和資源定位,簡化了服務接口的設計和實現(xiàn),降低了服務調(diào)用的復雜度.
2) 孿生南向接口由于需要頻繁、高速的數(shù)據(jù)采集,可以考慮使用RDMA 協(xié)議.遠程直接數(shù)據(jù)訪問(Remote direct memory access,RDMA)是一種遠端內(nèi)存直接訪問技術(shù)[65],數(shù)據(jù)收發(fā)時通過網(wǎng)絡把數(shù)據(jù)直接寫入內(nèi)存,可以大大節(jié)約節(jié)點間數(shù)據(jù)搬移時對CPU算力的消耗,并顯著降低業(yè)務的傳輸時延,提高傳輸效率.
3) 網(wǎng)絡應用層和孿生網(wǎng)絡層之間的意圖翻譯接口和能力調(diào)用接口可以考慮使用基于QUIC 的HTTP/3.0 協(xié)議.QUIC (Quick UDP internet connections)協(xié)議[66]是一種新的多路復用和安全傳輸UDP 協(xié)議,具有連接快、延遲低、前向糾錯、自適應擁塞控制等特點.HTTP/3.0[67]是HTTP 協(xié)議的第3 個版本,采用QUIC 作為傳輸層,解決了很多之前采用TCP 作為傳輸層存在的問題.
面向未來網(wǎng)絡持續(xù)增加的多維度、全場景的泛在連接,本文認為數(shù)字孿生網(wǎng)絡將成為未來網(wǎng)絡規(guī)劃、運行、管理和運營的新方向,成為實現(xiàn)網(wǎng)絡智能化、自動化的重要手段.數(shù)字孿生網(wǎng)絡在以下四個方面將體現(xiàn)其在現(xiàn)網(wǎng)應用的核心價值.
1) 拓撲透視和流量全息.基于交互式的網(wǎng)絡可視化技術(shù),數(shù)字孿生網(wǎng)絡可大大提升網(wǎng)絡全息化呈現(xiàn)水平.不僅網(wǎng)絡中各種網(wǎng)元、拓撲信息能夠動態(tài)可視化呈現(xiàn),網(wǎng)絡全生命周期的動態(tài)變化過程、實時狀態(tài)、演化方向等信息也能夠隨數(shù)字孿生網(wǎng)絡的模型以全息化的方式呈現(xiàn)給用戶.全息化呈現(xiàn)網(wǎng)絡虛實交互映射,將幫助用戶更清晰地感知網(wǎng)絡狀態(tài)、更高效地挖掘網(wǎng)絡有價值信息、以更友好的沉浸交互界面探索網(wǎng)絡創(chuàng)新應用,將物理網(wǎng)絡由“黑盒”變成“白盒”.
2) 從設備到組網(wǎng)的全生命周期管理.網(wǎng)絡設備的生命周期包括“設計、開發(fā)、測試、試產(chǎn)及發(fā)布”,主要由設備供應商管理;網(wǎng)絡的生命周期包括“規(guī)劃、建設、維護及優(yōu)化”,主要由網(wǎng)絡運營商管理.網(wǎng)絡和設備的責任主體不同,生命周期管理并沒有很好的融合,不利于網(wǎng)絡故障回溯、故障預測、網(wǎng)絡優(yōu)化設計等.數(shù)字孿生網(wǎng)絡不僅包括網(wǎng)絡功能模型,也包括網(wǎng)元模型,通過對網(wǎng)元模型的特征分析可預測設備在網(wǎng)絡中的運行狀態(tài);當網(wǎng)絡運維中出現(xiàn)故障,不僅能回溯到網(wǎng)絡的“過去”,也能通過網(wǎng)元模型回溯到網(wǎng)絡設備的“過去”,從而實現(xiàn)了網(wǎng)絡和設備的生命周期關聯(lián)分析.通過數(shù)字孿生網(wǎng)絡將網(wǎng)絡和設備的生命周期緊密結(jié)合,可實現(xiàn)網(wǎng)絡和設備的全流程精細化管理.
3) 網(wǎng)絡實時閉環(huán)控制.基于數(shù)字孿生網(wǎng)絡具備的仿真、分析和預測功能,生成相應的網(wǎng)絡配置,實現(xiàn)網(wǎng)絡實時閉環(huán)控制.網(wǎng)絡配置既可在孿生網(wǎng)絡層內(nèi)進行“內(nèi)閉環(huán)”調(diào)整與優(yōu)化,又可實現(xiàn)數(shù)字孿生網(wǎng)絡三層“外閉環(huán)”實時控制、反饋與優(yōu)化.通過“內(nèi)閉環(huán)”與“外閉環(huán)”,最終實現(xiàn)網(wǎng)絡的自學習、自驗證、自演進的實時閉環(huán)控制.
4) 網(wǎng)絡風險和成本降低.基于數(shù)字孿生網(wǎng)絡對網(wǎng)絡優(yōu)化方案高效仿真,充分驗證后部署至實體網(wǎng)絡,可以大大降低現(xiàn)網(wǎng)部署的試錯風險和成本,提高方案部署的效率.同時,借助數(shù)字孿生網(wǎng)絡平臺,可實現(xiàn)低成本、高效率的網(wǎng)絡創(chuàng)新技術(shù)研究.借助數(shù)字孿生網(wǎng)絡平臺,更多錯誤代價較高的網(wǎng)絡智能應用可以在數(shù)字孿生平臺上充分訓練、高效仿真,從而大大降低新技術(shù)在現(xiàn)網(wǎng)中驗證時產(chǎn)生的風險,減小部署到現(xiàn)網(wǎng)中發(fā)生錯誤的可能性.
本文系統(tǒng)化對“數(shù)字孿生網(wǎng)絡(DTN)”的概念進行了定義,對意圖網(wǎng)絡、平行網(wǎng)絡等相關工作進行了探討分析,并給出了DTN 的系統(tǒng)架構(gòu)設計.同時,本文描述了構(gòu)建DTN 系統(tǒng)所面臨的規(guī)模大、兼容難、建模難、實時性高等主要問題和挑戰(zhàn),探討了解決DTN 主要問題和挑戰(zhàn)所需的五大關鍵技術(shù),即目標驅(qū)動的網(wǎng)絡數(shù)據(jù)采集、多元網(wǎng)絡數(shù)據(jù)存儲和服務、多維全生命周期網(wǎng)絡建模、交互式可視化呈現(xiàn)技術(shù)、以及接口協(xié)議體系.
目前業(yè)界數(shù)字孿生網(wǎng)絡相關的研究剛剛起步,產(chǎn)業(yè)界和學術(shù)界需要進一步探討數(shù)字孿生網(wǎng)絡的場景和需求,明確數(shù)字孿生網(wǎng)絡的定義和統(tǒng)一架構(gòu).基于本文參考系統(tǒng)架構(gòu),下一步工作將在關鍵技術(shù)上持續(xù)深入研究,選取典型應用場景(如智能路由、網(wǎng)絡業(yè)務質(zhì)量保障等)開發(fā)數(shù)字孿生網(wǎng)絡驗證系統(tǒng),驗證數(shù)字孿生網(wǎng)絡的架構(gòu)、流程、功能和接口.同時,進一步研究數(shù)字孿生網(wǎng)絡體現(xiàn)物理網(wǎng)絡的信息完備性,保證其仿真驗證的有效性,促進數(shù)字孿生網(wǎng)絡技術(shù)的成熟和應用,推動數(shù)字孿生網(wǎng)絡在國內(nèi)外行業(yè)組織的標準化工作.