胡田鈺,吳啟暉,黃 洋,2
(1.南京航空航天大學電子信息工程學院,南京 211106;2.東南大學信息科學與工程學院,南京 211189)
近年來,隨著中國空天地信息網絡一體化的不斷發(fā)展,衛(wèi)星網絡與地面移動網絡已作為常態(tài)化基礎網絡存在,而各類基于無人機或其他空中平臺的中繼網絡則將組成天地之間的機動網絡,通信系統(tǒng)正迎來從地面5G到航空6G這一6G基礎形態(tài)的重大演進[1?2]。但隨著空天地信息網絡中無線智能終端和業(yè)務數量的急劇增長,日益稀缺的頻譜資源與已分配頻譜資源利用不足之間的尖銳矛盾也愈發(fā)突出[3?4]。因此,急需研究適用于空天地信息網絡的認知無線電(Cognitive radio,CR)技術,以提高三維電磁頻譜空間的頻譜利用率。
CR將無線通信網絡中的用頻設備分為主要用戶(Primary users,PUs)和次級用戶(Secondary us?ers,SUs)[5?6]。對于地面通信系統(tǒng),常用的一種表征當前區(qū)域內頻譜資源使用情況的CR技術是將SUs所獲取的信號功率譜密度(Power spectrum density,PSD)等無線電參數的分布情況進行可視化,“有的放矢”地實現頻譜預測、頻譜決策和頻譜管控等多種應用,以提高通信系統(tǒng)頻譜資源利用率。該可視化方法通常被稱為頻譜地圖或無線電(環(huán)境)地圖[7?9]。但是,該方法僅考慮PSD在地理位置上的二維分布情況,不能簡單直接地套用于空天地信息網絡。
因此,本文將對PSD在三維空間上的時空頻分布情況的表征進行研究,并以“頻譜態(tài)勢”來指代該分布情況。三維頻譜態(tài)勢使人們可以查看任何時間和三維位置的準確PSD分布,從而提高頻譜資源在時間和空間維度上的利用率[10]。但在三維電磁頻譜空間中,受限于SUs的空間部署、監(jiān)測頻段以及監(jiān)測時間段等因素,所構建的三維頻譜態(tài)勢在時域、空域和頻域等維度上往往是離散且缺損的。如圖1所示,在三維目標區(qū)域中,PUs占用頻譜資源并進行信號發(fā)射,但PUs的位置信息、發(fā)射PSD等未知;而進行信號接收的SUs所在位置和接收PSD則已知。因此,此時通過SUs的實測頻譜數據只能得到缺損三維頻譜態(tài)勢。所以,三維頻譜態(tài)勢構建的基本任務和主要難點便在于利用現有實測數據和PSD時空頻相關性,對三維頻譜態(tài)勢進行精確補全,以形成可供系統(tǒng)使用的補全三維頻譜態(tài)勢,其理想補全示例如圖2所示。對于常用于二維頻譜地圖補全的插值方法,例如反距離加權(Inverse distance weighted,IDW)算法,雖然可以擴展至三維頻譜態(tài)勢補全,但該算法只考慮距離因素,實際中往往因為缺乏模型驗證而導致補全效果不佳[10?11]。本文將專注于三維頻譜態(tài)勢的精確補全,并借助備受關注的生成對抗網絡(Generative adversarial networks,GANs)技術來實現[12]。
圖1 三維目標區(qū)域的主要用戶和次級用戶分布示例以及主要用戶的功率譜密度示例(f 1為中心頻率,f max和f min分別為頻率最大值和最小值)Fig.1 Example of the deployment of PUs and SUs in a three-dimensional target area and an example of power spec?trum density of a PU(where f 1,f max and f mi n are the center frequency,the maximum frequency and the mini?mum frequency,respectively)
圖2 工作頻率為f 1時的目標區(qū)域三維頻譜態(tài)勢的理想補全示例Fig.2 Ideal completion example of the three-dimensional spectrum situation of a target area when the working fre?quency is f 1
GANs旨在生成足以與真實樣本相比擬的模擬樣本,當網絡訓練收斂時,GANs所生成的模擬樣本幾乎可以認為服從于真實數據分布,即能做到“以假亂真”[13?16]。因此,文獻[17]以若干不同頻率下的完整頻譜地圖作為訓練數據,通過轉換頻譜地圖為RGB彩色圖像的數據預處理方法,利用所提出的圖估計GAN(Map estimation GANs,MEGAN)結構學得頻譜地圖補全機制,最終輸出補全后的頻譜地圖。但文獻[17]僅關注二維的底層認知無線電網絡,并未對三維電磁頻譜空間展開進一步研究。文獻[18]雖然提出了一種對三維頻譜態(tài)勢補全性能與無人機部署耗能進行聯(lián)合優(yōu)化的三維頻譜感知框架,但其僅利用傳統(tǒng)圖像恢復方法在不同維度進行切片平均來實現三維補全??偟膩碚f,在三維電磁頻譜空間中,利用GANs實現精確的三維頻譜態(tài)勢補全的相關研究還未見報道。
為了進一步提高三維頻譜態(tài)勢補全的精確性,本文針對三維電磁頻譜空間提出了一種基于生成對抗網絡的三維頻譜態(tài)勢補全算法,具體工作如下:
(1)利用生成對抗網絡在三維電磁頻譜空間展開研究,利用新興的生成對抗網絡實現三維頻譜態(tài)勢補全,為構建高精度數字孿生頻譜空間打下堅實基礎。
(2)提出了一種具備U形結構的三維條件生成對抗網絡(Three?dimensional U?shaped conditional generation adversarial network,3D?UCGAN),該結構能從包含完整三維頻譜態(tài)勢的訓練數據中提取更符合三維電磁頻譜空間環(huán)境特征的有用信息。
(3)提出了一系列改進三維頻譜態(tài)勢補全性能的數據處理方法,主要包括3D?UCGAN的輸入數據預處理以及輸出數據再處理。
通過仿真可以得到如下結論:所提出的基于生成對抗網絡的三維頻譜態(tài)勢補全算法的性能優(yōu)于傳統(tǒng)基于插值的補全算法;所提出的3D?UCGAN結構能有效地降低本文算法的補全誤差和訓練時間;所選擇的數據預處理方法可以進一步加速網絡收斂速度。
現代無線通信的基礎設施由部署在三維空間的異構無線網絡組成,因此目標區(qū)域的三維頻譜態(tài)勢是由該區(qū)域內若干異構網絡同時進行的無線傳輸疊加形成,進而呈現出信號功率譜密度在不同位置、頻率和時間上的不規(guī)則變化情況[10]。因此,將三維頻譜態(tài)勢Ψ(x,f,t)定義為三元組變量(x,f,t)到信號功率的一種映射關系,其中x∈R3表示通信系統(tǒng)在使用三維頻譜態(tài)勢時所查看位置的三維坐標(xl,xw,xh),而f和t則分別表示所查看的特定時間和工作頻率。但為了進一步簡化模型,在后續(xù)的討論中忽略變量t。
對于長寬高為L×W×H的三維目標區(qū)域A,將其進行柵格化,把三維目標區(qū)域A分為NL×NW×NH個柵格。后文中的位置坐標均代表柵格的位置坐標。但當柵格劃分較稀疏時,很可能某柵格內存在多個接收SUs。因此,如果柵格x處存在Nx個接收SUs,則將這Nx個SUs接收功率譜的平均值視為該柵格在頻譜態(tài)勢上展現的接收功率譜。經該數據柵格化處理后,可假設三維目標區(qū)域A中均勻分布著NR個數量已知的接收SUs,且此時每個柵格中至多存在1個接收SU;而同時存在著NT個數量未知的發(fā)射PUs。
本節(jié)將對傳播規(guī)律ΓxT,i→x(f)進行建模,即建立三維目標區(qū)域的信號傳播模型。對于第i個PU所發(fā)出的頻率為f的信號,假設其從位置xT,i傳播到任一其他位置x時的路徑損耗P L(d)為
式中d為位置xT,i與位置x間的距離,d0為計算時的參考距離,n為路徑損耗因子,PL?FREE(d0)為參考距離d0下的自由空間傳播損耗[19?21]。因此,對于第i個PU的發(fā)射信號,位置x處的接收功率為
本節(jié)首先簡要介紹了GANs的基本概念以及學習機制。其次,提出了基于GANs的三維頻譜態(tài)勢補全算法,并對數據處理方法進行了一定的改進。進一步地,為了提高GANs對三維頻譜態(tài)勢的學習能力,提出了一種面向三維頻譜態(tài)勢補全的3D?UCGAN結構,并將該結構應用于所提算法中。
GANs主要由生成器網絡和鑒別器網絡組成[22],其中生成器網絡G(z;θg)在參數(即網絡中各神經元的權重與偏置)θg的作用下,將潛變量z~pz(z)轉換為與真實樣本s~pdata(s)規(guī)格相同的模擬樣本s?,即G(z;θg)=s?;且樣本s?服從生成器網絡對分布pdata(s)隱式建模得到的分布pg(s?)[12]。而鑒別器網絡D(s;θd)或D(s?;θd)則在參數θd的作用下,判斷輸入樣本s或s?服從于分布pdata(s)而不是分布pg(s?)的可能性[12]。
GANs旨在學習數據分布pdata(s),并采用生成器網絡和鑒別器網絡相互對抗的訓練策略來實現。針對鑒別器網絡,該策略最大化其正確鑒別的概率,而針對生成器網絡則最大化鑒別器網絡鑒別出錯的概率。進而在不同鑒別結果的反饋下,不斷提升網絡鑒別/生成能力。假如具備足夠的網絡容量,則鑒別器網絡和生成器網絡可實現動態(tài)平衡。此時生成器網絡隱性建模得到的分布pg(s?)收斂于分布pdata(s),而鑒別器網絡不能正確地區(qū)分樣本s和s?。
所提出的基于GANs的三維頻譜態(tài)勢補全算法共包括離線訓練階段和在線部署階段,其中“在線”和“離線”均針對所使用的GANs而言。進一步地,算法中不僅包括與GANs相關的流程,還包括各階段所必需的數據處理方法,其將更有利于GANs訓練與態(tài)勢補全。需要說明的是,在算法實際運行時,所使用的GANs結構為2.3節(jié)提出的3D?UCGAN結構。在離線訓練階段,借助深度學習(Deep learning,DL)數據驅動的特點[22],以完整頻譜態(tài)勢數據作為訓練數據對GANs進行訓練。而對于算法在線部署階段,借助深度學習低復雜度的特點[22],將已訓練至收斂的生成器網絡部署于實際應用,直接根據SUs的測量結果對實際缺損三維頻譜態(tài)勢進行精確補全。所提出的基于GANs的三維頻譜態(tài)勢補全算法的流程如圖3所示。
圖3 基于3D-UCGAN的三維頻譜態(tài)勢補全算法流程圖Fig.3 Procedure of three-dimensional spectrum situation completion algorithm based on 3D-UCGAN
GANs學習缺損三維頻譜態(tài)勢至補全三維頻譜態(tài)勢的補全機制,也即以缺損三維頻譜態(tài)勢作為條件的完整態(tài)勢數據分布。具體而言,在GANs的對抗訓練過程中,網絡參數θg和θd在目標函數的指導下,經基于梯度的學習算法不斷迭代更新,以至于網絡的鑒別能力或生成能力在不斷提升。因此,生成器網絡在輸入缺損三維頻譜態(tài)勢的情況下,不斷朝著輸出補全三維頻譜態(tài)勢近似于對應完整三維頻譜態(tài)勢的方向進行學習;而鑒別器網絡則在輸入完整/補全三維頻譜態(tài)勢的情況下,朝著正確鑒別此時輸入態(tài)勢真假的方向進行學習。進而GANs逐步達到生成器隱性建模分布接近于態(tài)勢數據分布的預期效果,并最終實現收斂。
(1)離線訓練階段
本文所提出的數據預處理方法基于灰度進行。具體而言,在離線訓練階段,首先將每組完整三維頻譜態(tài)勢切片進行歸一化處理,即得到灰度模式下的一通道完整三維頻譜態(tài)勢“灰度圖”(數據維度:1×NL×NW×NH),如圖4(a)所示。進一步地,將一通道三維頻譜態(tài)勢“灰度圖”擴充為三通道的完整三維頻譜態(tài)勢“灰度圖”(數據維度:3×NL×NW×NH),其中每通道的頻譜數據仍與原一通道時的數據相同。同時還對一通道三維頻譜態(tài)勢“灰度圖”以采樣率α進行采樣,即上文所述的隨機選取SUs位置。隨后,以相同方式對該采樣數據擴充為三通道,并對未采樣點以除黑白灰色以外的顏色進行重新著色,得到三通道的缺損三維頻譜態(tài)勢“彩色圖”。本文選取紅色對未采樣點進行著色,如圖4(b)所示。因此,在經過數據預處理后,可得到三通道的完整三維頻譜態(tài)勢“灰度圖”和缺損三維頻譜態(tài)勢“彩色圖”,其將作為訓練數據用于后續(xù)GANs的訓練中。需要說明的是,文獻[17]提出一種基于RGB的數據預處理方法,其直接將歸一化數據經RGB色譜圖進行顏色映射。但該方法僅針對量化離散的頻譜數據進行,極有可能在顏色(逆)映射時丟失信息,反而增加補全誤差。因此,本文并未采用該方法,并且不同數據預處理方法所帶來的算法補全性能影響將在第3節(jié)給出。
圖4 工作頻率為f 1時的目標區(qū)域完整三維頻譜態(tài)勢的數據預處理示例Fig.4 A data preprocessing example of complete three-dimensional spectrum situation of a target area when the work?ing frequency is f 1
(2)在線部署階段
該階段把已訓練好的生成器網絡部署到實際應用,例如面向航空6G的頻譜認知智能管控體系架構中的頻譜云模塊[1]。設定實際應用時的頻譜數據為SUs實測獲得的缺損三維頻譜態(tài)勢,且同樣需要進行數據預處理。但該階段的數據預處理方法與離線訓練階段所用方法有些許差別。首先,對于數據歸一化,SUs很可能不會剛好放置于三維目標區(qū)域內接收功率最大值/最小值所在柵格處。因此,將以往實測接收功率的最值與此次實際應用時的數據最值進行比較,并取其更大/小值,以盡量避免數據處理誤差。其次,將不再進行離線訓練階段數據預處理方法中的采樣步驟,而是直接對擴充為三通道的缺損三維頻譜態(tài)勢“灰度圖”的未采樣點進行重新著色。
(1)訓練框架
由于基本GANs的代價函數存在一定的缺陷,其訓練過程經常出現不穩(wěn)定的現象[15]。因此,還引入文獻[16]提出的帶有梯度懲罰項的Wasserstein GAN(Wasserstein GAN with gradient penalty,WGAN?GP)框架。不同于文獻[12]所采用的JS(Jensen?Shannon)散度,WGAN?GP中使用Lipschitz約束下的Wasserstein距離作為代價函數,以此減輕網絡訓練時的不穩(wěn)定性。
因此,通過所引入的CGAN和WGAN?GP框架,確定了面向三維頻譜態(tài)勢補全的3D?UCGAN結構的訓練目標
式中:V(D,G)為GANs的代價函數;λ=10為懲罰因子;Ψ'為用于計算式(4)中最后一項(即懲罰項)的樣本,而分布pgp(Ψ')通過對與分布pdata(Ψ)和分布pg(Ψ?)相關的點對均勻采樣而得到[16]。具體而言,樣本Ψ'由兩部分相加組成,其中一部分是真實樣本Ψ乘以一隨機數?~u(0,1),另一部分則是模擬樣本Ψ?乘以(1-?)。面向三維頻譜態(tài)勢補全的3D?UCGAN結構的訓練框架示意圖如圖5(a)所示,圖5(b)則展現了訓練過程中樣本Ψ'的實現方式。
圖5 3D-UCGAN結構的生成對抗機制Fig.5 Generative adversarial mechanism of the proposed 3D-UCGAN structure
(2)網絡搭建
三維頻譜態(tài)勢補全問題的實質在于對每個未布置SU的柵格處頻譜數據進行補全。因此,借用DL領域中像素級語義分割的概念[23],同樣可以將三維頻譜態(tài)勢補全視作“像素級補全”。因此,在面向三維頻譜態(tài)勢補全的生成器網絡中引入一種經典的語義分割網絡,即具備U形結構的網絡(U?shaped net,U?net)的搭建思想[24]。具體而言,先采用三維卷積層進行下采樣,以實現電磁頻譜空間的環(huán)境特征提?。辉俨捎萌S轉置卷積層進行上采樣,以恢復態(tài)勢尺寸,并獲得每個柵格的補全信息;同時將上采樣和下采樣過程中對應層的輸出三維特征圖在通道維度進行拼接,以實現多尺度特征融合。
因此,將所提出的面向三維頻譜態(tài)勢補全的GANs結構稱作3D?UCGAN,其生成器網絡結構如圖6所示,其中每層網絡為三維卷積層或三維轉置卷積層,共6層。圖中hl=(k,s,p)指第l層的卷積核大小k、計算步長s和補零層數p等超參數的設置情況。而當l=0,…,5時,Fl指網絡中第(l+1)層的輸入數據通道數;而當l=6時,Fl則指生成器網絡輸出層(即第6層)的輸出數據通道數。3D?UCGAN的鑒別器網絡如圖7所示,其中每層網絡為三維卷積層或全連接層,共4層。不同于文獻[17],本文不僅通過減少網絡層數的方式來降低訓練復雜度,還以條件信息(即缺損三維頻譜態(tài)勢)作為額外的輸入來提升網絡的鑒別能力。圖中hl=(k,s,p)仍指第l層卷積層的超參數設置情況。當l=0,…,2時,F l指網絡中第(l+1)層卷積層的輸入數據通道數;而當l=3時,Fl則指鑒別器網絡第3層卷積層的輸出數據通道數。
圖6 3D-UCGAN結構的生成器網絡Fig.6 Generator network of 3D-UCGAN structure
圖7 3D-UCGAN結構的鑒別器網絡Fig.7 Discriminator network of 3D-UCGAN structure
本節(jié)通過仿真測試對所提出的基于3D?UCGAN的三維頻譜態(tài)勢補全算法的性能進行評估?;赑ython3.7.0的Pytorch 1.0框架建立了3D?UCGAN模型,并在Nvidia GeForce RTX 2080圖形處理單元上進行該模型的訓練和測試工作,以實現算法的離線訓練和在線部署階段。
基于本文建立的系統(tǒng)模型,設定三維目標區(qū)域A的大小為L×W×H=240 m×240 m×80 m,并將其分為NL×NW×NH=48×48×16個柵格,即每柵格為體積為5 m3的立方體。同時,設定PUs數量NT從1~5中隨機選擇,而次級用戶數量NR默認為5 504個,即采樣率α≈15%。對于信號傳播模型,假設參考距離d0=0.01 km,頻率f∈(25 MHz,125 MHz),即三維頻譜態(tài)勢切片Ψ(x,f),?x∈A的頻率所屬范圍。
對于算法的離線訓練階段,設置30 000組三維頻譜態(tài)勢切片Ψ(x,f),?x∈A作為3D?UCGAN的訓練數據,并使用自適應矩估計(Adaptive moment estimation,Adam)算法作為3D?UCGAN的學習算法。同時,設置3D?UCGAN中生成器網絡和鑒別器網絡的學習率為0.000 1,批訓練大小為4,訓練輪數為20。進一步地,為了提高3D?UCGAN的泛化能力,在訓練數據中,設置每10 000組數據的路徑損耗因子和噪聲功率(單位:mW)是不同的,依次為n=8、σ2=10-5,n=4、σ2=10-5,n=4、σ2=10-3。需要說明的是,為了使SUs在不同頻率下的接收功率更符合實際情況,設定每組頻譜數據的發(fā)射功率(單位:mW)隨機從向量[67,467,867,1 000,1 000,1 000,867,467,67]中進行抽取(即假設SUs工作頻率與PUs中心頻率可能不一致的情況)。而對于算法的在線部署階段,使用10 000組三維頻譜態(tài)勢切片Ψ(x,f),?x∈A作為測試數據,其中路徑損耗因子n=6和噪聲功率σ2=10-5mW,其余設置與訓練數據相同。注意,利用L2損失函數,即均方誤差(Mean squared error,MSE)來評價每組訓練/測試數據的態(tài)勢補全性能,其計算公式為
圖8 隨機選取的某次測試三維頻譜態(tài)勢補全結果Fig.8 Three-dimensional spectrum situation completion results of a randomly selected test
其次,為了驗證本文所提出的3D?UCGAN結構對三維頻譜態(tài)勢補全算法的性能提升,將其與基于文獻[17]經卷積層擴展后的3D?MEGAN結構進行對比。在所提出的基于GANs的三維頻譜態(tài)勢補全算法中,分別基于3D?UCGAN與3D?MEGAN結構執(zhí)行算法的離線訓練和在線部署階段,并在圖10中對兩種結構在不同訓練輪數時的平均MSE進行比較,其中針對訓練數據的MSE被稱作訓練誤差。從圖10中可以看出,無論關注于訓練誤差還是測試誤差,基于3D?UCGAN結構的頻譜態(tài)勢補全算法在訓練輪數為1或2時就已經收斂;但對于3D?MEGAN結構,其在訓練輪數大于12時才趨于收斂。并且,3D?UCGAN結構下的算法補全誤差小于3D?MEGAN結構下的補全誤差。因此,所提出的3D?UCGAN結構能有效降低頻譜態(tài)勢補全算法的補全誤差和訓練時間。
圖9 所提算法與IDW算法于不同采樣率時的三維頻譜態(tài)勢補全性能的對比Fig.9 Comparison of three-dimensional spec?trum situation complement performance between the proposed algorithm and the IDW algorithm at different sampling rates
圖10 基于3D-UCGAN結構與基于3D-MEGAN結構的三維頻譜態(tài)勢補全算法于不同訓練輪數時的性能對比(采樣率α=15%)Fig.10 Performance comparison of three-dimensional spectrum sit?uation complement algorithm based on the 3D-UCGAN structure and the 3D-MEGAN structure at different train?ing epochs(sampling rateα=15%)
最后,通過所提出的基于3D?UCGAN的三維頻譜態(tài)勢補全算法,圖11和圖12分別對所提出的數據預處理和再處理方法下的算法補全性能進行了探討。從圖11可以看出,基于RGB的數據預處理方法大大減慢了3D?UCGAN的訓練收斂速度,以至于當訓練輪數達到20時,其訓練誤差仍大于基于灰度預處理時的最大訓練誤差。因此,本文所提出的基于灰度的數據預處理方法能進一步加快網絡訓練的收斂速度,且無須進一步比較不同數據預處理方法下的測試誤差情況。而由于數據再處理方法運用在算法的離線部署階段,因此本文在圖12中只比較了不同數據再處理方法下的測試誤差情況。從圖12中可以看出,所提出的數據再處理方法確實能較好地對頻譜態(tài)勢的補全精度進行改進。
圖12 基于所提再處理方法與基于文獻[17]再處理方法的三維頻譜態(tài)勢補全算法于不同訓練輪數時的性能對比(采樣率α=15%)Fig.12 Performance comparison of three-dimensional spectrum situation complement algorithm based on the proposed post-processing method and the method in Ref.[17]at different training epochs(sampling rateα=15%)
本文對三維電磁頻譜空間的頻譜態(tài)勢補全問題進行了充分探索,所提出的補全方法可以有效地降低態(tài)勢補全誤差,以輔助通信系統(tǒng)在目標區(qū)域內提升頻譜利用率。仿真結果證明,本文所提出的三維頻譜態(tài)勢補全算法在態(tài)勢補全精度方面優(yōu)于傳統(tǒng)基于插值的方法,并且可以在較短的網絡訓練時間下得到能對缺損頻譜態(tài)勢進行精確補全的生成器網絡。