張 暄,高躍清
(中國電子科技集團(tuán)公司 第54研究所,石家莊 050081)
雷達(dá)自從20世紀(jì)30年代誕生以來,以其全天候、全天時(shí)、作用距離遠(yuǎn)、實(shí)時(shí)性強(qiáng)等工作特點(diǎn),已經(jīng)在軍民領(lǐng)域具備難以替代的重要價(jià)值,并且在空間目標(biāo)定位和識(shí)別的各個(gè)環(huán)節(jié)中均發(fā)揮了不可替代的關(guān)鍵作用,對(duì)空間目標(biāo)的有效識(shí)別是空間群目標(biāo)檢測識(shí)別中雷達(dá)的核心任務(wù),是實(shí)現(xiàn)目標(biāo)定位的基礎(chǔ)。
近幾年無人機(jī)技術(shù)不斷成熟,城市中無人機(jī)的數(shù)量大量增加,消費(fèi)級(jí)和工業(yè)級(jí)無人機(jī)具有成本低、目標(biāo)體積小、操作簡便等特點(diǎn),同時(shí)又缺乏針對(duì)無人機(jī)濫飛的有效監(jiān)管措施,使得各類無人機(jī)入侵事件頻發(fā),給國家安全和民眾安全帶來很大隱患。無人機(jī)反制系統(tǒng)是針對(duì)無人機(jī)目標(biāo)的探測的重要手段,無人機(jī)反制系統(tǒng)主要用于要地、重大活動(dòng)、邊境以及機(jī)場等周圍的低空無人機(jī)防御,主要防范對(duì)象為非法入侵或接近的小型商用無人機(jī)。無人機(jī)反制系統(tǒng)對(duì)雷達(dá)的要求非常明確,需要在場景中探測到的動(dòng)目標(biāo)中準(zhǔn)確識(shí)別出無人機(jī)目標(biāo),并屏蔽其他類別動(dòng)目標(biāo)?,F(xiàn)階段,雷達(dá)目標(biāo)檢測識(shí)別算法一般屬于監(jiān)督學(xué)習(xí),算法依賴大量帶標(biāo)簽的數(shù)據(jù)作為訓(xùn)練樣本,這在實(shí)際應(yīng)用中是比較困難的。此外,目標(biāo)的特征需要依賴人工提取,對(duì)專業(yè)知識(shí)的要求較高,且耗時(shí)、耗力,特征提取的好壞一定程度上依靠經(jīng)驗(yàn)和運(yùn)氣,導(dǎo)致特征提取的質(zhì)量也難以保證,很難滿足實(shí)際應(yīng)用中對(duì)雷達(dá)有效性、實(shí)時(shí)性的要求。
深度學(xué)習(xí)算法有著深層特征提取能力和強(qiáng)大的自適應(yīng)學(xué)習(xí)能力,能夠?yàn)閿?shù)據(jù)的可視化或分類問題提供更好的解決途徑,目前的深度學(xué)習(xí)的基本模型有自動(dòng)編碼器[1]、深度置信網(wǎng)絡(luò)[2]、卷積神經(jīng)網(wǎng)絡(luò)等模型[3],其中卷積神經(jīng)網(wǎng)絡(luò)模型已經(jīng)在自然語言處理、語音識(shí)別、圖像識(shí)別等領(lǐng)域發(fā)揮出了重大作用[4-6]。深度學(xué)習(xí)在雷達(dá)技術(shù)領(lǐng)域已有一些應(yīng)用成果,主要集中在對(duì)合成孔徑雷達(dá)(SAR,synthetic aperture radar)目標(biāo)圖像處理和優(yōu)化[7-11],如利用卷積神經(jīng)網(wǎng)絡(luò)對(duì)SAR目標(biāo)圖像進(jìn)行處理[12],利用深層稀疏編碼對(duì)SAR目標(biāo)遮擋圖像進(jìn)行處理等[13],但應(yīng)用于雷達(dá)回波信號(hào)處理的模型很少,選擇以回波信號(hào)經(jīng)過處理之后得到的距離-多普勒?qǐng)D像作為研究對(duì)象,引用深度學(xué)習(xí)算法,完成對(duì)雷達(dá)目標(biāo)的檢測任務(wù)。
雷達(dá)目標(biāo)檢測的目的是在噪聲和雜波干擾下發(fā)現(xiàn)所關(guān)注的目標(biāo)。噪聲和雜波是對(duì)檢測性能干擾最大的外部因素,傳統(tǒng)雷達(dá)目標(biāo)檢測使用恒虛警檢測算法(CFAR,constant false alarmrate),算法對(duì)雷達(dá)雜波進(jìn)行了恒虛警率預(yù)處理,隨著檢測背景的變化而自適應(yīng)地調(diào)整檢測門限,但是這樣也很難將所有雜波去除,目標(biāo)檢測仍是在存在雜波和噪聲的環(huán)境下完成的。恒虛警檢測算法設(shè)計(jì)建立在三個(gè)假設(shè)基礎(chǔ)上:
1)距離-多普勒?qǐng)D像由噪聲、雜波殘留和目標(biāo)三部分組成,其中噪聲的分布穩(wěn)定且具備一定均勻性,雜波殘留是由環(huán)境決定不具備均勻性,目標(biāo)的特征與前兩者有較大差異;
2)可以將目標(biāo)檢測問題轉(zhuǎn)換為距離-多普勒?qǐng)D像濾除噪聲、在雜波殘留和目標(biāo)中分析特征和找出目標(biāo)三步;
3)傳統(tǒng)的門限檢測中門限只是目標(biāo)的一個(gè)特征,選取多個(gè)特征組成特征空間,將檢測問題轉(zhuǎn)換為特征空間線性劃分的問題。
恒虛警檢測算法作為當(dāng)前最常用的目標(biāo)檢測算法,在實(shí)際應(yīng)用中,存在以下問題:
1)恒虛警檢測算法是針對(duì)特定單一的雜波及目標(biāo)背景提出的,特定的檢測算法只適應(yīng)于特定的目標(biāo)背景,當(dāng)背景發(fā)生變化時(shí)原算法檢測效率會(huì)大大降低,很難滿足實(shí)際應(yīng)用中對(duì)檢測率和虛警率的需求。
2)先驗(yàn)知識(shí)要求:需要一定的數(shù)據(jù)統(tǒng)計(jì)或先驗(yàn)的方法確定目標(biāo)大致的位置、大小等信息。
3)當(dāng)背景噪聲和雜波很強(qiáng)的環(huán)境下,背景中的干擾能量超出門限值的數(shù)量很多,檢測率和虛警率間的矛盾變得更明顯,檢測算法失效。
恒虛警檢測算法要求目標(biāo)與背景噪聲有較大的強(qiáng)度差異,而且需要假定背景雜噪聲服從高斯分布[14-18],同時(shí)算法中的具體參數(shù)設(shè)定需要考慮目標(biāo)的尺寸信息,該算法在簡單的場景中有著相對(duì)廣泛的使用。
卷積神經(jīng)網(wǎng)絡(luò)(CNN,convolutional neural networks)是一種帶有卷積結(jié)構(gòu)的深度神經(jīng)網(wǎng)絡(luò),主要由輸入層、卷積層、池化層、全連接層與輸出層5部分組成。輸入層用來接收原始的輸入圖像;卷積層是網(wǎng)絡(luò)中最重要的部分,通過卷積操作能夠?qū)斎雸D像進(jìn)行特征提取得到特征圖;池化層一般設(shè)置在卷積層之后,常用的池化方法有最大池化和均值池化,能夠減少全連接層中的網(wǎng)絡(luò)參數(shù),減少整個(gè)網(wǎng)絡(luò)的參數(shù),達(dá)到減少計(jì)算量的目的;全連接層一般存在于卷積層和池化層之后,用來將卷積層和池化層輸出的信息含量較高的特征圖進(jìn)行分類,以完成網(wǎng)絡(luò)的分類任務(wù)。
何愷明等人在2015年提出Faster R-CNN算法[19],采用Faster R-CNN算法進(jìn)行目標(biāo)檢測所需時(shí)間為數(shù)十毫秒級(jí),精度高、速度快的Faster R-CNN算法被廣泛應(yīng)用于目標(biāo)檢測中。FasterR-CNN分為三個(gè)模塊:第一個(gè)模塊的利用公共網(wǎng)絡(luò)來提取圖像的特征,第二個(gè)模塊是利用深度卷積神經(jīng)網(wǎng)絡(luò)來生成目標(biāo)對(duì)象的候選窗口,第三個(gè)模塊是利用生成的候選窗口做FasterR-CNN目標(biāo)檢測器。相較于R-CNN算法,F(xiàn)asterR-CNN利用卷積網(wǎng)絡(luò)自動(dòng)產(chǎn)生候選框,F(xiàn)asterR-CNN中用來生成候選框結(jié)構(gòu)的CNN和目標(biāo)檢測網(wǎng)絡(luò)的CNN結(jié)構(gòu)共享,在提高候選框質(zhì)量的同時(shí)使得候選框數(shù)目大大減少,縮短了網(wǎng)絡(luò)訓(xùn)練和檢測時(shí)間。
RPN(region proposal network)是FasterR-CNN的核心,其結(jié)構(gòu)見圖1,由一個(gè)中間卷積層和位于卷積層之后的分類層與回歸層組成。RPN的本質(zhì)是基于滑窗的無類別目標(biāo)檢測器,其輸入是卷積層提取的特征圖,特征圖的大小取決于卷積層的結(jié)構(gòu)。RPN以輸入特征圖上的每個(gè)像素點(diǎn)為中心,利用滑動(dòng)窗口提取特征,如圖2所示,在特征圖上的每個(gè)像素點(diǎn)上利用Anchor機(jī)制生成9個(gè)框,框有3種不同尺寸:128*128、256*256和512*512,各個(gè)尺寸都對(duì)應(yīng)了3個(gè)不同的長寬比:1:1、1:2和2:1,每個(gè)框都對(duì)應(yīng)了原始圖像中的一個(gè)區(qū)域,包括區(qū)域的尺寸和坐標(biāo)信息。分類層和回歸層根據(jù)卷積之后得到的特征向量和Anchor機(jī)制提取到的區(qū)域的尺寸和坐標(biāo)信息,計(jì)算分類損失函數(shù)和位置損失函數(shù),得到每個(gè)區(qū)域?qū)?yīng)的分類置信度,用來判斷該區(qū)域是否包含目標(biāo),對(duì)有目標(biāo)的區(qū)域,采用邊框回歸的方法修正候選框使其更接近真實(shí)框。相比于如FastR-CNN中使用的傳統(tǒng)候選區(qū)域算法,RPN耗時(shí)很短,能夠大大提升網(wǎng)絡(luò)訓(xùn)練和檢測的速度。
圖1 RPN結(jié)構(gòu)圖
圖2 RPN中的Anchor機(jī)制
FasterR-CNN流程圖見圖3,具體的工作步驟為:
1)輸入已做標(biāo)注的訓(xùn)練圖像;
2)將圖像輸入到特征提取網(wǎng)絡(luò)進(jìn)行特征提?。?/p>
3)利用RPN結(jié)構(gòu)生成目標(biāo)對(duì)象檢測的候選框;
4)把候選框映射到卷積網(wǎng)絡(luò)的最后一層特征圖上;
5)RoI池化層使得每個(gè)RoI生成固定維度的特征向量;
6)利用探測分類概率和探測分類回歸來修正預(yù)測框的位置使得預(yù)測邊框位置更接近真實(shí)值。
圖3 FasterR-CNN算法流程圖
本次設(shè)計(jì)的檢測模型分類部分分為目標(biāo)與背景兩種類型。目標(biāo)檢測模型基于FasterR-CNN模型的結(jié)構(gòu)進(jìn)行構(gòu)建,對(duì)RPN與FastR-CNN兩大部分分別進(jìn)行設(shè)計(jì)。
RPN的結(jié)構(gòu)設(shè)計(jì)如下:
1)卷積層1:32個(gè)大小為3×3的卷積核;
2)卷積層2:64個(gè)3×3大小卷積核;
3)池化層:采用最大池化的方式,池化半徑為2,池化范圍為2×2,激活函數(shù)為Softmax;
4)卷積層3:128個(gè)3×3大小卷積核,激活函數(shù)為Relu函數(shù)。
5)RPN卷積層:128個(gè)3×3大小卷積核;
6)結(jié)構(gòu)的最后由兩個(gè)卷積層分別實(shí)現(xiàn)分類與回歸功能,結(jié)構(gòu)為8個(gè)1×1卷積核和16個(gè)1×1卷積核。
FastR-CNN的結(jié)構(gòu)設(shè)計(jì)如下:
1)卷積層1:32個(gè)大小為3×3的卷積核;
2)卷積層2:64個(gè)3×3大小卷積核;
3)池化層:采用最大池化的方式,池化半徑為2,池化范圍為2×2,激活函數(shù)為Softmax;
4)卷積層3:128個(gè)3×3大小卷積核,激活函數(shù)為Relu函數(shù)。
5)RoIPooling層:用于將大小不相同的特征圖調(diào)整為同樣的大小
6)并聯(lián)的兩個(gè)全連接層分別實(shí)現(xiàn)尺寸調(diào)整與分類識(shí)別。
特征提取網(wǎng)絡(luò)的結(jié)構(gòu)如圖4所示。
圖4 特征提取網(wǎng)絡(luò)
訓(xùn)練和測試數(shù)據(jù)集為實(shí)測的雷達(dá)回波信號(hào)經(jīng)過處理之后得到的距離-多普勒?qǐng)D像。將數(shù)據(jù)集以8:2的比例隨機(jī)劃分為訓(xùn)練集和測試集,由于來自雷達(dá)回波信號(hào)的數(shù)據(jù)量較少,對(duì)訓(xùn)練集采用旋轉(zhuǎn)、縮放、鏡像、裁剪等操作擴(kuò)充訓(xùn)練樣本,圖5為采用的圖像數(shù)據(jù)樣例。
圖5 距離-多普勒數(shù)據(jù)樣例
對(duì)目標(biāo)檢測模型的訓(xùn)練分為兩個(gè)部分:一是切片選擇部分;二是切片檢測部分。訓(xùn)練RPN的損失函數(shù)是由分類判定損失函數(shù)與尺寸調(diào)整損失函數(shù)兩部分組成,具體表達(dá)式為:
有監(jiān)督地對(duì)RPN進(jìn)行訓(xùn)練,正負(fù)樣本標(biāo)定原則如下:
1)目標(biāo)切片與任意標(biāo)記切片重疊率大于0.7,判定為正樣本;
2)目標(biāo)切片與任意標(biāo)記切片重疊率小于0.3時(shí),判定為負(fù)樣本;
3)重疊率在0.3~0.7之間時(shí),切片不參與訓(xùn)練。
錨點(diǎn)框的設(shè)置會(huì)對(duì)網(wǎng)絡(luò)訓(xùn)練和檢測結(jié)果有很大的影響,隨著訓(xùn)練迭代次數(shù)的增加,錨框的坐標(biāo)值會(huì)近似于真實(shí)目標(biāo)值。利用卷積網(wǎng)絡(luò)的平移不變性,錨框的位置也是被每個(gè)柵格固定的,通過K均值聚類算法可以計(jì)算出錨框的大小。K均值聚類算法距離函數(shù)為:
d(Box,C)=1-RIOU(Box,C)
其中:Box表示錨框大小;C表示錨框中心。(Box,C)表示兩個(gè)錨框的重疊比;IOU表示真實(shí)框與候選框的交集比并集,即重疊度。
網(wǎng)絡(luò)訓(xùn)練的方法和參數(shù)設(shè)置如下:
1)采用隨機(jī)梯度下降法作為優(yōu)化算法;
2)由于網(wǎng)絡(luò)參數(shù)較多,同時(shí)訓(xùn)練集中圖像數(shù)量較少,為防止出現(xiàn)過擬合現(xiàn)象,在訓(xùn)練時(shí)引入Dropout機(jī)制。Dropout機(jī)制能減少訓(xùn)練耗時(shí),降低網(wǎng)絡(luò)過擬合的可能性,設(shè)定神經(jīng)元激活值存在20%的概率停止工作;
3)設(shè)置選擇動(dòng)量值為0.9,動(dòng)量機(jī)制以指數(shù)型衰減的方式累積梯度移動(dòng)平均值,可以加快梯度收斂的速度;
4)對(duì)網(wǎng)絡(luò)參數(shù)進(jìn)行初始化,設(shè)置網(wǎng)絡(luò)權(quán)值參數(shù)服從均值為0,標(biāo)準(zhǔn)差為0.01的高斯分布;
5)使用選擇學(xué)習(xí)率衰減方法,能夠加快網(wǎng)絡(luò)收斂速度并且保證網(wǎng)絡(luò)有最優(yōu)解,網(wǎng)絡(luò)訓(xùn)練初始學(xué)習(xí)率設(shè)定為0.001,每迭代100次衰減0.1,網(wǎng)絡(luò)共設(shè)置迭代1 000次。
FasterR-CNN有交替優(yōu)化訓(xùn)練和近似聯(lián)合訓(xùn)練兩種訓(xùn)練方式[20],這里我們選擇交替優(yōu)化訓(xùn)練方法對(duì)所設(shè)計(jì)的網(wǎng)絡(luò)進(jìn)行訓(xùn)練:
1)隨機(jī)初始化網(wǎng)絡(luò)參數(shù),將帶有目標(biāo)位置信息標(biāo)注的距離-多普勒?qǐng)D像作為輸入,獨(dú)立訓(xùn)練RPN,更新CNN和RPN的參數(shù);
2)使用經(jīng)過訓(xùn)練的RPN生成候選框;
3)初始化特征提取網(wǎng)絡(luò),將RPN生成的候選框作為輸入來訓(xùn)練特征提取網(wǎng)絡(luò)和分類層;
4)再次更新RPN參數(shù):使用3)中訓(xùn)練得到的特征提取網(wǎng)絡(luò)和分類層初始化模型,訓(xùn)練RPN,RPN中的參數(shù)會(huì)被再次更新;
5)再次使用4)中訓(xùn)練后的RPN來生成候選框;
6)使用3)中訓(xùn)練后得到的特征提取網(wǎng)絡(luò)參數(shù)、4)中的RPN和5)中生成的候選框來訓(xùn)練分類層,得到訓(xùn)練好的FasterR-CNN模型。
用上一小節(jié)中設(shè)定的訓(xùn)練規(guī)則訓(xùn)練設(shè)計(jì)好的目標(biāo)檢測網(wǎng)絡(luò),圖6為訓(xùn)練過程中誤差函數(shù)值的變化,隨著網(wǎng)絡(luò)訓(xùn)練迭代次數(shù)增加,網(wǎng)絡(luò)誤差函數(shù)趨于收斂,可見網(wǎng)絡(luò)的訓(xùn)練方法和參數(shù)設(shè)置是較為合理的。
圖6 訓(xùn)練誤差函數(shù)
將測試數(shù)據(jù)集輸入訓(xùn)練后的FasterR-CNN模型,預(yù)測框與真實(shí)框重疊率大于0.7即判定為正樣本,為直觀地評(píng)價(jià)檢測性能,以檢測率和虛警率作為評(píng)估該模型的參數(shù):
檢測率=TP/(TP+FN)
虛警率=FP/(TP+FP)
TP為預(yù)測為正的正樣本數(shù)量,F(xiàn)N表示預(yù)測為負(fù)的正樣本數(shù)量,F(xiàn)P表示預(yù)測為正的負(fù)樣本數(shù)量。
由于來自雷達(dá)回波信號(hào)的數(shù)據(jù)量較小,同訓(xùn)練集相同,采用旋轉(zhuǎn)、縮放、鏡像、裁剪等操作擴(kuò)充測試樣本集,如圖7上圖為原始測試樣本,下面兩圖為經(jīng)過數(shù)據(jù)擴(kuò)充得到的測試樣本。擴(kuò)充后總樣本數(shù)量為500,其中包含360個(gè)待檢測目標(biāo)。
圖7 原始和擴(kuò)充圖像樣例
所設(shè)計(jì)算法與傳統(tǒng)恒虛警檢測算法的檢測結(jié)果對(duì)比見表1所示。
表1 兩種檢測算法結(jié)果對(duì)比
可以發(fā)現(xiàn)FasterR-CNN目標(biāo)檢測算法與傳統(tǒng)恒虛警目標(biāo)檢測算法相比較,在檢測率上有所提升,同時(shí)虛警數(shù)量大大減少。傳統(tǒng)恒虛警算法是根據(jù)背景和目標(biāo)差異設(shè)定閾值進(jìn)行檢測,在檢測率和虛警率上存在矛盾,但基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測算法是對(duì)目標(biāo)特征、背景關(guān)聯(lián)信息等等綜合學(xué)習(xí)分析,進(jìn)而實(shí)現(xiàn)對(duì)目標(biāo)的檢測,不會(huì)局限于檢測率與虛警率的矛盾之中。
傳統(tǒng)的目標(biāo)檢測算法很難滿足現(xiàn)階段監(jiān)測安全領(lǐng)域?qū)z測準(zhǔn)確性、實(shí)時(shí)性的要求,鑒于卷積神經(jīng)網(wǎng)絡(luò)在文本、語音和圖像等領(lǐng)域的廣泛成功應(yīng)用,設(shè)計(jì)基于卷積神經(jīng)網(wǎng)絡(luò)的雷達(dá)目標(biāo)檢測算法,成功地優(yōu)化了檢測率和虛警率,但是進(jìn)行目標(biāo)檢測的虛警問題依舊存在優(yōu)化空間,同時(shí)若要應(yīng)用于實(shí)際問題中,需要依靠更大的數(shù)據(jù)集作為支撐,需要解決網(wǎng)絡(luò)層數(shù)加深帶來的應(yīng)用成本增加等問題,將深度學(xué)習(xí)引入到雷達(dá)回波信號(hào)的研究還值得做進(jìn)一步的深入。