丁 斌 夏 雪 梁雪峰
①(西安文理學院 西安 710065)
②(西安石油大學 西安 710065)
③(西安電子科技大學 西安 710071)
隨著我國建設海洋強國戰(zhàn)略的全面實施,海洋生態(tài)文明建設作為生態(tài)文明建設的重要組成部分,已成為國家戰(zhàn)略。海洋遙感作為監(jiān)測和感知海洋環(huán)境現(xiàn)狀,保障海洋生態(tài)文明建設和海洋經(jīng)濟綠色發(fā)展的重要技術手段,越來越被研究人員所關注。雷達作為海洋遙感的主動式傳感器之一,發(fā)揮著不可替代的作用。
雷達回波中的海雜波會嚴重影響雷達目標檢測,尤其是在復雜的海洋環(huán)境中,由于海面風力、海面環(huán)境濕度、浪涌等多種自然因素的影響,雷達海面回波在雷達接收機中出現(xiàn)嚴重的多徑效應,導致海雜波信號相比其他信號變化復雜、強度高。因此,海雜波特性及建模研究是一個探索性強且難度很大的瓶頸技術問題,也是當前雷達海洋目標檢測研究的難點和熱點問題。
眾所周知,不論是雷達海洋目標探測還是海雜波特性及建模研究,都離不開海雜波數(shù)據(jù)的支持。目前,海雜波數(shù)據(jù)的獲取方法主要可歸納為兩類,一類是基于雷達-海面目標幾何模型和電磁散射理論,通過仿真建模生成海雜波數(shù)據(jù);另一類是進行試驗,獲取實測海雜波數(shù)據(jù)。
理論建??梢酝ㄟ^數(shù)值計算獲得實際測量難以得到的特性數(shù)據(jù);而實測數(shù)據(jù)又為理論建模提供了有效的驗證依據(jù)。然而,實際海洋環(huán)境復雜,海面目標的散射起伏不定,海雜波呈現(xiàn)非高斯、非線性和非平穩(wěn)特性,很難使用某種確定不變的統(tǒng)計分布模型來對實際場景中的海雜波進行描述和建模。
隨著海洋遙感監(jiān)測的需求越來越多,要求越來越高,同時,雷達的工作模式及其參數(shù)、雷達探測環(huán)境都是復雜多變的,因此需要大量的海雜波數(shù)據(jù)以支撐更加準確的海雜波特性的分析。
由公開文獻可知,世界各國對海雜波數(shù)據(jù)的獲取非常重視,而且進行了大量的海雜波測量試驗[1]。國外方面,主要有美國海軍研究實驗室的4波段(P,L, C, X)機載雷達海雜波測量實驗[2]、美國海軍與美國國防部高級研究計劃署的“山頂計劃[3]”、加拿大麥克馬斯特大學的X頻段海上冰山監(jiān)測雷達(Ice multiParameter Imaging X-band radar,IPIX)海雜波測量試驗[4,5]、西班牙南海岸Ka頻段雷達海雜波測量試驗[6]、澳大利亞國防科技署(Defense Science and Technology Organization,DSTO)的L頻段多通道海雜波實驗[7–9]、南非科學和工業(yè)研究理事會(Council for Scientific and Industrial Research,CSIR)的X頻段Fynmeet雷達海雜波測量試驗[10,11]等。
國內(nèi)方面,中國科學院空天信息創(chuàng)新研究院、中國電科第14所、第38所等研究所,以及西安電子科技大學、電子科技大學、哈爾濱工業(yè)大學、哈爾濱工程大學、南京理工大學、北京理工大學、大連海事大學、國防科技大學、空軍預警學院、海軍航空大學等高校也開展了多種條件下海雜波測量試驗,獲取了不同雷達平臺下大量海雜波數(shù)據(jù),并在海雜波測量、海雜波特性分析建模、多域特征提取等方面開展了大量的研究工作[12]。
盡管如此,當研究人員準備從事海雜波特性研究時,還是不可避免地面臨兩大困境:一方面,海雜波實測數(shù)據(jù)的采集需要耗費較長時間和昂貴的資源。另一方面,雷達對海上目標探測研究,需要雷達實測數(shù)據(jù)支持,由于軍事及技術保密等原因,大多數(shù)雷達實測海雜波實驗獲取的數(shù)據(jù)集均未公開,更加嚴峻的是,前期已公開的雷達對海探測數(shù)據(jù),現(xiàn)在也難以獲取。目前在深度學習領域,生成對抗網(wǎng)絡(Generative Adversarial Networks, GAN)已成功用于訓練數(shù)據(jù)的數(shù)據(jù)增強,本文改進了傳統(tǒng)GAN網(wǎng)絡模型結(jié)構(gòu),通過網(wǎng)絡模型學習真實海雜波數(shù)據(jù)的分布,生成與真實海雜波數(shù)據(jù)分布一致的海雜波數(shù)據(jù)。
Goodfellow等人[13]于2014年首次提出GAN,即一種深度對抗生成網(wǎng)絡,并且從理論上證明了,當GAN在訓練到納什均衡點(Nash Equilibrium,又稱為非合作博弈均衡,是博弈論的一個重要術語,以約翰·納什命名,在一個博弈過程中,博弈雙方的平衡策略都是為了達到自己期望收益的最大值,此時這個平衡策略就定義為納什均衡)時模型收斂,該生成模型的生成數(shù)據(jù)的概率分布與真實數(shù)據(jù)相同。
生成對抗神經(jīng)網(wǎng)絡由兩部分組成:生成器網(wǎng)絡(Generator, G)和判別器網(wǎng)絡(Discriminator, D)。如圖1所示,生成器G的輸入為從某個概率分布(如高斯分布)中采集的隨機變量z,z經(jīng)過G網(wǎng)絡(復雜的非線性變換)后,得到輸出信號G(z),我們將G(z)稱為生成數(shù)據(jù)。
圖1 GAN結(jié)構(gòu)示意圖
將真實數(shù)據(jù)x和生成數(shù)據(jù)G(z)同時輸入判別器網(wǎng)絡D,判別器通過計算輸入數(shù)據(jù)來自真實數(shù)據(jù)x的概率,來判斷輸入數(shù)據(jù)是來自生成數(shù)據(jù)G(z)還是真實數(shù)據(jù)x。當判別器輸入信號為生成信號時,判別器輸出判別概率盡可能接近0(判別為假);而生成器盡可能生成同分布高質(zhì)量的樣本使判別概率接近1(判別為真)。當生成器和判別器通過訓練,性能足夠好時,即生成器生成的數(shù)據(jù)與真實海雜波數(shù)據(jù)有相同的分布時,判別器分不清輸入數(shù)據(jù)是真實海雜波數(shù)據(jù)還是生成數(shù)據(jù),判別器對每個輸入(不論是來源于x,還是G(z)), 判別概率都等于0.5,即認為達到納什均衡點[2]。
建立如式(1)所示的損失函數(shù),對兩個網(wǎng)絡G和D進行對抗訓練,G的訓練目標是使目標函數(shù)最小,即生成數(shù)據(jù)的概率分布逼近真實數(shù)據(jù)x的分布;與之相對地,D的訓練目標是使目標函數(shù)最大,即以最大概率區(qū)分生成數(shù)據(jù)與真實數(shù)據(jù)
經(jīng)過交替、迭代訓練后,判別器網(wǎng)絡D和生成器網(wǎng)絡G的網(wǎng)絡參數(shù)不斷更新,性能得到不斷提高,當達到納什均衡點時,判別器D不能對數(shù)據(jù)源做出正確判斷,此時我們認為G(z)學習了真實數(shù)據(jù)x的分布空間,生成數(shù)據(jù)和真實數(shù)據(jù)的分布無差異。
目前的GAN研究直接將實值神經(jīng)網(wǎng)絡應用于圖像的幅度(通常轉(zhuǎn)換為dB),而忽略了相位信息。相位信息是雷達回波數(shù)據(jù)特有的信息,在許多雷達信號處理中都需要用到回波數(shù)據(jù)的相位,其中最突出的是脈沖壓縮(匹配濾波)。
雷達海雜波數(shù)據(jù)的數(shù)據(jù)格式是復數(shù)形式,目前公開文獻有涉及復數(shù)卷積神經(jīng)網(wǎng)絡應用實例,例如用于極化SAR圖像分類[14]。復數(shù)的確有可能能夠增強每個神經(jīng)元的表達能力,但是神經(jīng)網(wǎng)絡中的每個神經(jīng)元都是由簡單的激活函數(shù)構(gòu)成(都是實數(shù))的,深度神經(jīng)網(wǎng)絡的強大在于它的鏈接。使用復數(shù)神經(jīng)網(wǎng)絡與神經(jīng)網(wǎng)絡的理念相背離。
因此,本文使用兩個相同網(wǎng)絡結(jié)構(gòu)的GAN網(wǎng)絡分別生成海雜波數(shù)據(jù)的實部和虛部,而后將實部與虛部合成海雜波的復數(shù)數(shù)據(jù)。具體的網(wǎng)絡結(jié)構(gòu)如圖2所示。
圖2 海雜波數(shù)據(jù)對抗生成網(wǎng)絡結(jié)構(gòu)
生成器網(wǎng)絡結(jié)構(gòu)包括1個輸入模塊、5個卷積模塊和1個輸出模塊。其中輸入模塊包含1個全連接層和ReLU激活函數(shù);卷積模塊包含1個上采樣層、1個1維卷積層和ReLU激活函數(shù);輸出模塊包含1個1維全連接層和Tanh激活函數(shù)。判別器網(wǎng)絡包括5個卷積模塊和1個輸出模塊。其中卷積模塊包含1個1維卷積層和1個Leaky ReLU激活函數(shù),輸出模塊包含1個全連接層和Sigmoid激活函數(shù)。
當生成器網(wǎng)絡輸入長度為100的隨機序列時,首先經(jīng)過輸入模塊(輸入100、輸出256的全連接層+ ReLU激活函數(shù))后,輸出長度為256的序列,再經(jīng)過第1個卷積模塊,經(jīng)過2倍上采樣后得到長度為512的序列,再經(jīng)過512通道,卷積核大小為1×3,輸入序列左右各補1個0(padding=1),卷積步長為1(stride=1)的1維卷積層,然后通過ReLU激活函數(shù)后,得到輸出512個通道,長度為512的信號;依次經(jīng)過第2個、第3個直到第5個卷積模塊。最終經(jīng)過輸出模塊(全連接層+Tanh激活函數(shù))得到長度為8192的生成信號。
當長度為8192的生成信號輸入判別器網(wǎng)絡,首先經(jīng)過第1個卷積模塊,模塊中的1維卷積層參數(shù)為,卷積核個數(shù)為64,卷積核大小為1×3, stride=4,在序列左右各填充兩個0,即padding=2。經(jīng)過第1個卷積模塊后,輸入信號尺寸變?yōu)?4個通道,長度為2048。分別經(jīng)過第2、第3和第4個卷積模塊,輸出變?yōu)?12通道,長度為32。隨后經(jīng)過最后一個卷積模塊(卷積核個數(shù)為1024,卷積核大小為1×3,stride=2,在序列左右各填充兩個0,即padding=2)后,輸出變?yōu)閱瓮ǖ馈W詈蠼?jīng)過全連接層和Sigmoid激活函數(shù)判別輸入信號為真實信號還是生成信號的概率D(x)。上述網(wǎng)絡模塊具體參數(shù)詳見表1。
表1 生成器、辨別器網(wǎng)絡參數(shù)
本文中用于訓練的實測海雜波數(shù)據(jù)來源于文獻[1]。數(shù)據(jù)采集時,雷達天線凝視海面某一方位,脈沖發(fā)射模式,發(fā)射脈沖為單載頻信號,發(fā)射脈寬40 ns,脈沖重復頻率(Pulse Repetition Frequency,PRF)為3 kHz,距離向采樣率為60 MHz。該組數(shù)據(jù)共包含60000幀樣本數(shù)據(jù),采樣時長約為3.33 s,每幀數(shù)據(jù)包含1320點數(shù)(距離向采樣點),海雜波信號時域波形如圖3所示。
圖3 單載頻發(fā)射信號,海雜波時域波形
網(wǎng)絡訓練過程如下:
(1)判別器的訓練。判別器的訓練目標為,當真實海雜波信號輸入判別器網(wǎng)絡后,網(wǎng)絡輸出的判別概率越大越好;同時生成器生成的海雜波數(shù)據(jù)輸入判別網(wǎng)絡后,網(wǎng)絡輸出的判別概率越小越好。即判別器能夠明確區(qū)分輸入判別器信號是真實海雜波還是假的。
(2)生成器的訓練。生成器的訓練目標是使生成器生成的“假的”海雜波數(shù)據(jù)通過判別器D后的概率越大越好,即式(1)中的第2項越小越好,也就是說生成器生成的數(shù)據(jù)能夠“騙過”判別器。
在整個對抗生成網(wǎng)絡的訓練過程中,判別器D和生成器G交替進行,開始訓練時,先對判別器進行訓練5次。
GAN網(wǎng)絡在實際訓練過程中,尤其是生成網(wǎng)絡在訓練過程中會出現(xiàn)局部模式崩潰、梯度消失等問題,很難使得生成網(wǎng)絡和判別網(wǎng)絡同時收斂。為此,Wasserstein生成性對抗網(wǎng)絡(Wasserstein Generative Adversarial Networks, W-GAN)[15]在GAN損失函數(shù)的基礎上增加了梯度懲罰項,如式(2)所示
在對抗生成網(wǎng)絡的訓練過程中,最重要的影響因素就是學習率參數(shù),學習率直接控制著訓練網(wǎng)絡梯度更新的量級,直接影響網(wǎng)絡模型的有效容限能力。過高的學習率會導致訓練過程(損失函數(shù))的震蕩,進而出現(xiàn)無法收斂到最優(yōu)解的情況;過低的學習率會使網(wǎng)絡收斂速度變慢,容易陷入局部最優(yōu)解等問題。在本文實驗過程中,我們將學習率參數(shù)設置為lr=0.0005。
其次,網(wǎng)絡訓練中批樣本數(shù)量(batch size)的設置,批樣本數(shù)量決定了訓練梯度下降的方向。過小的批數(shù)量,極端情況下,例如批處理大小設置為1,即每個樣本都去修正1次梯度方向,樣本之間的差異越大越難以收斂。若網(wǎng)絡中存在批歸一化(batch normalization),批樣本數(shù)量過小則更難以收斂,甚至垮掉。這是因為數(shù)據(jù)樣本越少,統(tǒng)計量越不具有代表性,噪聲也相應地增加。而過大的批樣本數(shù)量,會使得梯度方向基本穩(wěn)定,容易陷入局部最優(yōu)解,降低精度。在本文實驗過程中,本文將批樣本數(shù)量設置為1024,效果較好。
最后,Adam優(yōu)化器[16]中的β1, β2設為 0.5,0.9。梯度懲罰項權重λ設置為0.6。生成器的潛在變量z從N(0,1)中采樣。
本文用于生成海雜波數(shù)據(jù)的GAN的實驗硬件環(huán)境是:NVIDIA 2080 Ti GPU, CUDA 9.1,Ubuntu 16.04、內(nèi)存32 GB。軟件采用TensorFlow 1.4和Python3.6。
實驗中使用的訓練數(shù)據(jù)集如圖3所示,神經(jīng)網(wǎng)絡訓練中的一些參數(shù)配置如表1所示。當GAN訓練10000 epoch后,生成器網(wǎng)絡生成的海雜波數(shù)據(jù)的實部、虛部分別如圖4、圖5所示,通過對比可見,生成數(shù)據(jù)樣本與真實海雜波數(shù)據(jù)的時域波形相近。
圖4 實測海雜波數(shù)據(jù)實部&生成海雜波數(shù)據(jù)實部
圖5 實測海雜波數(shù)據(jù)虛部&生成海雜波數(shù)據(jù)虛部
與確定性信號和圖像的生成質(zhì)量評估不同,由于海雜波是來自雷達分辨率單元中海面的多個散射體回波的矢量和,而且雷達分辨率單元內(nèi)的散射體是隨機分布的,其介電常數(shù)和幾何特性都是隨機變量。同時,海面散射體或雷達平臺的相對運動也會引起海雜波幅度和相位的變化。因此一直以來,人們將海雜波看作隨機過程。
下面分別從幅度分布特性、時間相關性和空間相關性3個方面對生成的海雜波數(shù)據(jù)進行評估。
(1)幅度分布特性驗證。首先,分別畫出距離向第100采樣點處,沿時間維(10000幀)的實測海雜波數(shù)據(jù)和生成海雜波數(shù)據(jù)的幅度圖,分別如圖6和圖7所示。其次,對同一距離單元的回波幅值進行統(tǒng)計,得出的實測海雜波數(shù)據(jù)和GAN生成海雜波數(shù)據(jù)的幅度統(tǒng)計直方圖,分別如圖8和圖9所示。
圖6 第100采樣點10000幀海雜波幅度
圖7 生成海雜波數(shù)據(jù)(10000幀)雜波幅度圖
圖8 第100采樣點10000幀海雜波幅度直方圖
通過對比雜波幅度統(tǒng)計直方圖和概率分布擬合曲線,生成海雜波數(shù)據(jù)與實測海雜波數(shù)據(jù)的幅度概率分布特性一致,說明利用生成數(shù)據(jù)的分布可以逼真地模擬海雜波的幅度分布。
直接生成回波幅度(模值)形成的幅度分布統(tǒng)計結(jié)果如圖10所示。對比圖9和圖10可知,采用實部虛部分開的方式生成數(shù)據(jù)幅度分布與直接生成回波幅度(模值)的幅度分布是不一致的。
圖9 生成海雜波數(shù)據(jù)(10000幀)幅度直方圖
為了進一步說明本文算法的合理性,將圖8、圖9和圖10的幅度分布擬合曲線示于圖11。可見,本文算法生成的數(shù)據(jù)與實測海雜波數(shù)據(jù)的幅度分布更加一致。
圖10 直接生成回波幅度(模值)(10000幀)直方圖
圖11 幅度分布擬合曲線
(2)時間相關性驗證。下面分別從時間自相關函數(shù)和功率譜曲線兩個角度,對實測海雜波數(shù)據(jù)和生成海雜波數(shù)據(jù)的時間相關特性的一致性進行說明。
圖12為利用Burg法分別對生成的海雜波數(shù)據(jù)和實測海雜波數(shù)據(jù)進行功率譜估計所得曲線,由于實測海雜波數(shù)據(jù)是單載頻模式下采集的,經(jīng)過解調(diào)后,雜波數(shù)據(jù)的頻譜位于零頻附近,由圖12可見,在功率譜密度曲線的低頻范圍,兩條曲線擬合較好。
圖12 實測海雜波數(shù)據(jù)&生成海雜波數(shù)據(jù)功率譜密度
實測海雜波數(shù)據(jù)和生成海雜波數(shù)據(jù)的歸一化時間自相關函數(shù)曲線如圖13所示,可見兩條曲線幾乎重合。綜上分析可知,生成海雜波數(shù)據(jù)可有效地模擬海雜波的時間相關性。
圖13 實測&生成海雜波數(shù)據(jù)時間相關系數(shù)
(3)空間相關性驗證。
通過式(3)分別計算實測海雜波數(shù)據(jù)和生成數(shù)據(jù)的空間相關系數(shù),如圖14所示。
從圖14可知,實測海雜波在距離向空間相關性首先在初始點處會出現(xiàn)一個尖峰,在經(jīng)歷一個快速的下降期以后出現(xiàn)一個緩慢的周期性衰減,隨后距離向的海雜波數(shù)據(jù)不再相關,此時對應的距離間隔稱為海雜波的相關長度。利用GAN生成的海雜波數(shù)據(jù)的距離空間相關系數(shù)同實測海雜波數(shù)據(jù)的空間相關性相似。
圖14 實測海雜波&生成海雜波距離向第100采樣點處距離維空間相關系數(shù)
本文將深度生成性對抗網(wǎng)絡應用于海雜波數(shù)據(jù)生成,通過擴展GAN網(wǎng)絡,將GAN應用于一維海雜波復數(shù)據(jù)的生成,驗證了利用GAN生成海雜波數(shù)據(jù)的可行性,基于實測數(shù)據(jù)集進行一維海雜波數(shù)據(jù)生成模型和鑒別模型的訓練,并從幅度特性、頻譜特性和時空相關特性分析了生成數(shù)據(jù)質(zhì)量。最后,比較了實部虛部分開生成海雜波和直接生成海雜波幅度(模值)兩種方式的海雜波幅度統(tǒng)計結(jié)果。結(jié)果表明本文方法能夠有效地生成更多、更多樣、與真實海雜波數(shù)據(jù)分布相近的海雜波數(shù)據(jù)。