張 飛,陳小前,于 帥,季明江,劉 勇,曹 璐
(1.軍事科學院 國防科技創(chuàng)新研究院,北京 100071;2.中山大學 計算機學院,廣東 廣州 510006)
隨著人類在航空航天、深海探測以及無人駕駛等科技領域的快速進步,人類的活動范圍不斷向更加偏遠的地區(qū)延伸(如外太空、沙漠腹地及深海等)[1]。地面移動通信網絡很難覆蓋沙漠、深海以及外太空等偏遠地區(qū),已無法適應新型移動設備泛在連接(Ubiquitous Connectivity)的需求。衛(wèi)星具有廣域覆蓋的特點,是偏遠地區(qū)各類信息技術應用的重要支撐。隨著移動終端技術的發(fā)展,各類新興應用不斷涌現(xiàn),如移動物聯(lián)網、虛擬現(xiàn)實、智能物流、目標識別與跟蹤等。但是受能源、尺寸等因素限制,移動終端通常以無線接入的方式將采集的數(shù)據(jù)傳輸?shù)胶蠖嗽朴嬎闫脚_進行處理。這同時也帶來了巨大的延遲開銷,無法適應一些延遲敏感型應用,例如,虛擬現(xiàn)實為了與現(xiàn)實場景深度融合,從玩家移動頭部到看到新的、正確的場景視圖的延遲應小于15 ms[2]。邊緣計算可以將計算資源部署在移動終端附近來減少數(shù)據(jù)傳輸并降低計算時延。
本文利用低軌衛(wèi)星廣域覆蓋、軌道低、數(shù)據(jù)傳輸延遲小等特點,提出了一種基于空天地海一體化網 絡(Space-Air-Ground-Aqua Integrated Networks)[3-5]的天基邊緣計算框架。該架構包含接入層和處理層2 個層面:在接入層,地面/海面終端(如移動用戶、互聯(lián)網設備等)通過低軌衛(wèi)星(Low Earth Orbit,LEO)星座接入空天地海一體化網絡,并通過計算卸載(Computation Offloading)的方式,將其計算任務卸載到處理層(即星上邊緣計算平臺);在處理層,星上邊緣計算平臺與空中計算平臺、地面云計算中心協(xié)作處理接收到的計算任務(即星地協(xié)同[6])。隨后,本文提出一種基于深度模仿學習(Deep Imitation Learning,DIL)的智能計算卸載模型,通過星地以及星間的計算卸載,以達到提升星上邊緣計算平臺的任務處理速度的目的。最后,針對天基網絡中衛(wèi)星星座的動態(tài)拓撲環(huán)境,為所提出的智能計算卸載模型設計一種分布式聯(lián)邦學習的模型訓練機制,以降低星地通信開銷和保障星上數(shù)據(jù)隱私。
基于空天地海一體化網絡的天基邊緣計算以其獨特的全球覆蓋信息服務能力,已成為下一代移動通信網絡(6G)和國家重大基礎設施建設方向。本文提出的天基邊緣計算架構、智能計算卸載模型及其分布式模型訓練機制,可實現(xiàn)地面終端的泛在連接與在軌數(shù)據(jù)實時采集、處理及存儲功能,可支持如天基物聯(lián)網、目標檢測與跟蹤、氣象觀測、自動駕駛等各類軍民應用。
天基邊緣計算也被稱為在軌邊緣計算(Orbital Edge Computing,OEC)[7-8],指通過將計算、存儲以及傳感器等硬件設備部署在空天地海一體化網絡中的通信衛(wèi)星上,以實現(xiàn)數(shù)據(jù)的在軌采集、接收、處理和分發(fā)。由于其全球覆蓋的優(yōu)勢,在近年來得到了學術界和產業(yè)界的極大關注,被認為是下一代移動通信網絡(6G)的關鍵技術之一。目前,由于對天基邊緣計算的研究尚處在初級階段,相關的研究成果多集中在其體系架構上。例如,文獻[7]提出了OEC 的概念,OEC 支持在每個配備了攝像機的低軌衛(wèi)星上進行邊緣計算,以便在下行鏈路中斷時可以在軌處理感測數(shù)據(jù)。同時,為了解決邊緣處理延遲問題,OEC 系統(tǒng)將衛(wèi)星星座組織成計算管道。這些管道基于地理位置并行數(shù)據(jù)采集和數(shù)據(jù)處理,無需交叉連接協(xié)調。文獻[9]研究了空天地海一體化中與多接入邊緣計算網絡的融合架構,并探討了其在降低時延、緩存與網絡開銷等方面的優(yōu)勢。由于數(shù)據(jù)在軌存儲被認為是一種有前途的安全存儲模式,文獻[10]將低軌衛(wèi)星視為安全的數(shù)據(jù)存儲介質,并研究從低軌衛(wèi)星數(shù)據(jù)存儲系統(tǒng)(也稱為低軌衛(wèi)星數(shù)據(jù)中心)獲取數(shù)據(jù)。在該框架下,一個基本的挑戰(zhàn)是在保持系統(tǒng)穩(wěn)定性的同時處理從空間到地面的節(jié)能下載。因此,作者提出了一種在線調度框架,目標是在最小化能耗的同時最大化數(shù)據(jù)量下載(低軌衛(wèi)星到地面終端)。在低軌衛(wèi)星的部署方式方面,文獻[11]提出一種超密集近地軌道網絡(Ultra-Dense LEO),以實現(xiàn)和地面網絡的高效數(shù)據(jù)卸載。其目標是在同時優(yōu)化每個低軌衛(wèi)星回程容量的前提下,使總速率和接入用戶數(shù)最大化。
天基邊緣計算就是以衛(wèi)星為核心實現(xiàn)空天地海多域平臺高效互聯(lián),并在星上構建邊緣計算平臺,賦予整個網絡數(shù)據(jù)在軌收集、處理與緩存的能力。天基邊緣計算架構主要由地面/海面終端、空天網絡、星上邊緣計算平臺以及云計算中心部分構成,如圖1 所示。
圖1 基于空天地海一體化網絡的天基邊緣計算架構Fig.1 Space edge computing architecture for space-airground-aqua integrated networks
1)地面/海面終端:具有數(shù)據(jù)采集和弱處理能力的各類移動終端設備,包括移動終端、探測器和物聯(lián)網設備等。地面/海面終端通過無線網絡將其采集到的數(shù)據(jù)卸載到處理能力更強的外部處理平臺(如圖1 所示的天基網絡或空基網絡中的邊緣計算平臺)執(zhí)行。
2)空天網絡:由以衛(wèi)星為核心高效互聯(lián)的各類天、空平臺(High and Low Altitude Platforms)[3]組成。天基網絡由若干衛(wèi)星通過星間鏈路構建。由于低軌衛(wèi)星軌道低,星地傳輸延遲小,可作為地面/海面終端的主要接入點。當需要更大數(shù)據(jù)采集和更強計算能力時,可由低軌衛(wèi)星轉發(fā)數(shù)據(jù)至高軌衛(wèi)星或地面云計算中心進行處理。在臨時和局部需要較強計算和通信能力支撐時,通過部署空基平臺作為天基平臺的中轉和補充。
3)星上邊緣計算平臺:利用虛擬化和邊緣計算技術,在每顆衛(wèi)星上部署邊緣計算平臺。各星上邊緣計算平臺間可實現(xiàn)計算資源共享,同時可接收來自地面/海面終端和空中平臺卸載來的計算任務。星上邊緣計算平臺將處理后的結果可快速返回給地面/海面終端。
4)云計算中心:天基和空基邊緣計算平臺的重要支撐,當移動應用需要的算力較大時,各平臺將數(shù)據(jù)傳至云中心進行處理。云計算中心同時也是數(shù)據(jù)匯聚池,所有邊緣計算平臺需要存儲的數(shù)據(jù)都發(fā)回云計算中心進行存儲,進而可利用大數(shù)據(jù)技術深度挖掘數(shù)據(jù)價值。
本章首先對天基邊緣計算系統(tǒng)進行建模,歸納了最小化程序執(zhí)行時延的優(yōu)化目標,以及構建了基于深度模仿學習的智能計算卸載決策模型。
假定當前天基邊緣計算系統(tǒng)中的天基網絡包含N個具有邊緣計算能力的衛(wèi)星(即邊緣節(jié)點),其集合為N={1,2,…,N}。針對天基邊緣計算系統(tǒng)中待執(zhí)行的應用程序,本文考慮細粒度(Fine-Grained)的程序切分方案[12],即一個應用程序O可被切分為若干個可獨立執(zhí)行的子程序。令O={S,D},其中,S為子程序的集合,D為子程序間所需傳遞的數(shù)據(jù)的集合(即子程序的輸入輸出)。
基于所構建的網絡模型,可對計算任務卸載及優(yōu)化目標進行建模。具體而言,假設應用程序O可拆分成|S|個可獨立執(zhí)行的子程序,則該應用程序的計算卸載 決策可由AO={a1,a2,…,as,…,a|S|}表示,其中,as為第s個子程序的卸載決策。as必然為以下3 種決策之一:
1)as=0,表示低軌衛(wèi)星n將其應用程序O的子程序s通過星地無線鏈路卸載到云計算中心執(zhí)行(即地面執(zhí)行),其時延為Tc;
2)as=k,(k=n),表示子程序s在任務發(fā)起的低軌衛(wèi)星n上運行(即在軌本地執(zhí)行),其時延為Tl,k,n∈N={1,2,…,N};
3)as=k,(k≠n),表示將子程序s卸載到除任務發(fā)起衛(wèi)星n以外的其他低軌衛(wèi)星上運行(即在軌遠端執(zhí)行),其時延為Ts,k,n∈N={1,2,…,N}。
計算任務卸載的程序運行時延的優(yōu)化問題可以建模成如下數(shù)學規(guī)劃問題:
注意到,該優(yōu)化問題為整數(shù)規(guī)劃問題,其最優(yōu)化算法的復雜度隨子程序的個數(shù)|S|及低軌衛(wèi)星個數(shù)N呈指數(shù)倍增長,因此,無法在多項式時間內得到最優(yōu)解。為此,本文采用一種基于深度模仿學習的智能計算卸載決策模型,通過星地、星間的計算卸載,達到提升程序運行速度的目的。
為了得到式(1)中細粒度的、實時的計算卸載決策,本文采用一種基于深度模仿學習的智能計算卸載決策模型,如圖2 所示。基于行為克?。˙ehavioral Cloning)[13]、模仿學習(Imitation Learning),通過監(jiān)督式學習的方式,以及離線的模仿范例(本文中為最優(yōu)的計算卸載決策范例),做出實時、在線的處理決策。該模型的運行包含如下3 個階段:
圖2 基于深度模仿學習的智能計算卸載決策模型Fig.2 DIL based intelligent computation offloading model
1)離線范例生成,通過整數(shù)規(guī)劃傳統(tǒng)的解法得到處理決策的最優(yōu)解作為范例;
2)離線模型訓練,使用深度神經網絡(Deep Neural Network,DNN)來提取和訓練上一階段生成的范例數(shù)據(jù),以此訓練決策模型;
3)在線決策生成,DNN 的離線模型訓練階段一旦完成,就可以在線地進行實時的計算卸載決策。通過該輸出評估該深度模擬學習模型的決策 精度和程序執(zhí)行時延。
在星上邊緣計算平臺的智能服務處理中,許多業(yè)務往往涉及數(shù)據(jù)驅動的智能AI 任務[14]。其特點是需要協(xié)同利用地面/海面的海量數(shù)據(jù)進行匯聚式分析處理,生成相應的機器學習模型。傳統(tǒng)的集中式聯(lián)邦學習模型如圖3(a)所示。通常將這些數(shù)據(jù)聚集到一個云端服務器上進行統(tǒng)一處理和訓練,這種中心化的模型訓練方式會帶來隱私泄露的風險,危害數(shù)據(jù)安全。同時,依賴于云端的集中式訓練方式也需要星上邊緣計算的各個低軌衛(wèi)星把自身數(shù)據(jù)傳輸?shù)降孛嬖朴嬎阒行摹S捎谛堑刂g無線鏈路的長時延及不穩(wěn)定性,其帶來的傳輸開銷非常巨大,對網絡帶寬造成很大壓力。為此,本文為上述智能計算卸載模型設計了一種基于分布式聯(lián)邦學習的在軌模型訓練機制,如圖3(b)所示。
圖3 計算卸載決策模型的在軌訓練Fig.3 On-orbit training for the computation offloading model
具體而言,每顆低軌衛(wèi)星首先根據(jù)自身的決策范例獨立訓練本地的決策模型。隨后,低軌衛(wèi)星按順序將訓練好的本地模型傳遞到下一顆臨近的衛(wèi)星。如圖3(b)所示,低軌衛(wèi)星1 將其本地模型發(fā)送到低軌衛(wèi)星2;隨后,低軌衛(wèi)星2 將其收到的模型與本地模型聚合生成新的聚合模型并傳遞到低軌衛(wèi)星3;低軌衛(wèi)星3 繼續(xù)將收到的模型與其本地模型聚合。由于低軌衛(wèi)星3 已收到全網的訓練模型信息,因此,生成的聚合模型為全局模型;最后,低軌衛(wèi)星3 將生成的全局模型發(fā)送給其他低軌衛(wèi)星(可通過廣播的方式)。該模型訓練方式避免眾多低軌衛(wèi)星與地面云計算中心進行通信,大大減少星地間的通信開銷,且能保障星上數(shù)據(jù)隱私。因此,非常適合在天基邊緣計算網絡環(huán)境訓練多種隱私敏感且數(shù)據(jù)量較大的人工智能模型。
本文使用Matlab 仿真軟件對提出的在軌智能技術進行仿真分析及性能評估。仿真環(huán)境見表1,即如圖2 所示的DNN 參數(shù)。同時,為了評估該技術(即智能決策)的性能,本文提出3 種計算卸載參照方案,分別為:
表1 仿真參數(shù)設置Tab.1 Simulation parameters
1)云處理,即所有子任務卸載到地面云計算中心進行處理;
2)星上處理,即所有子任務在衛(wèi)星端處理;
3)貪婪決策,即每個子程序采用貪婪算法搶占網絡資源,最大化自己的短期收益,從而得到計算卸載決策。
對于計算任務模型,我們考慮一個包含6 個子任務的計算任務(即|D|=6),每個子任務的數(shù)據(jù)輸入/輸出數(shù)據(jù)量大小在[100,500]kB 上服從均勻分布,處理其每字節(jié)所消耗的算力(與算法計算復雜度相關)在[0,12 000]CPU(Cycles Per Byte)上服從均勻分布[15],星地鏈路的傳播時延開銷為30 ms。
不同計算卸載決策方案的性能比較如圖4 所示。其中,圖4(a)比較了不同卸載決策方案的卸載決策準確率(相比于通過窮舉法得到的最優(yōu)決策),圖4(b)比較了不同卸載決策方案的程序執(zhí)行時延。從圖4(a)中可見,相比于其他決策方案,本文提出的智能決策模型的決策準確率最高,達到了60.24%。
注意到,更高的決策準確率帶來程序執(zhí)行時延大幅降低。為此,圖4(b)給出了不同決策方案的程序執(zhí)行時延。從圖中可見,本文提出的智能卸載決策模型相比于云處理、星上處理、貪婪決策分別降低了54.96%、42.08%、23.80% 的程序執(zhí)行時延。這是因為智能卸載通過不斷地學習最優(yōu)決策范例,從而不斷提升自身的決策準確率,以此降低了程序執(zhí)行時延。
圖4 計算卸載決策方案的性能分析Fig.4 Performance of different computation offloading schemes
本文提出的分布式聯(lián)邦學習過程中不同衛(wèi)星的數(shù)量對全局模型準確率的影響如圖5 所示。令每個衛(wèi)星當前數(shù)據(jù)樣本(即最優(yōu)決策范例)個數(shù)為1 000。注意到,單星條件下的全局模型為本地模型,其模型決策準確率較低為42.85%。而在多星條件下,通過不斷的本地模型傳遞與聚合,全局模型的準確率不斷攀升,在四星協(xié)作分布式模型訓練的過程中,準確率達到了57.24%。這是因為參與模型訓練的衛(wèi)星越多,提供的數(shù)據(jù)樣本越豐富,因此,全局模型的決策準確率得到了提升。
圖5 不同衛(wèi)星數(shù)量下的全局模型準確率Fig.5 Offloading accuracy of the global model under different numbers of satellites
本文研究了基于天基邊緣計算的在軌智能技術,提出以天基為核心的空天地海一體化邊緣計算架構,對基于深度模仿學習的智能計算卸載進行了建模。該模型可針對多種任務狀態(tài)及網絡狀態(tài)做出實時的、細粒度的計算卸載決策,并降低空間應用程序的程序執(zhí)行時延。為提升上述模型的決策準確率并降低星地通信開銷,提出了該模型的在軌分布式聯(lián)邦學習訓練方案。后續(xù)將繼續(xù)基于星上邊緣計算平臺開展星上分布式聯(lián)邦學習技術研究。