韋順軍,蒲 羚,張曉玲,師 君
復(fù)雜軌跡合成孔徑雷達(dá)后向投影算法圖像流GPU成像*
韋順軍**,蒲 羚,張曉玲,師 君
(電子科技大學(xué)電子工程學(xué)院,成都 611731)
相對(duì)于基于傅里葉變換的頻域成像算法,后向投影(BP)算法因采用時(shí)域逐點(diǎn)相干積累,更適合于復(fù)雜軌跡合成孔徑雷達(dá)(SAR)高精度成像。但BP算法計(jì)算量巨大,限制了其應(yīng)用于SAR大場(chǎng)景大數(shù)據(jù)量快速成像。圖形處理器(GPU)具有強(qiáng)大浮點(diǎn)運(yùn)算和并行處理能力,為大場(chǎng)景BP算法快速成像實(shí)現(xiàn)提供了途徑。結(jié)合GPU并行處理,提出了一種基于圖像流的復(fù)雜運(yùn)動(dòng)SAR大場(chǎng)景BP快速成像處理方法。該方法借助BP算法中圖像像素點(diǎn)相互獨(dú)立處理的特性,采用圖像像素點(diǎn)并行及圖像流程處理,設(shè)計(jì)了孔徑與圖像緩存調(diào)度方案,提高SAR大場(chǎng)景大數(shù)據(jù)BP算法成像效率。仿真和機(jī)載實(shí)測(cè)數(shù)據(jù)結(jié)果驗(yàn)證了方法的有效性,在有限GPU顯存條件下實(shí)現(xiàn)了8 192×8 192大場(chǎng)景快速成像,并且成像加速比相對(duì)于傳統(tǒng)CPU單線程處理可達(dá)300倍以上。
SAR;復(fù)雜軌跡;后向投影算法;GPU加速;大場(chǎng)景成像
合成孔徑雷達(dá)(Synthetic Aperture Radar,SAR)作為一種全天時(shí)、全天候、信息量豐富的遙感成像技術(shù),已成為對(duì)地觀測(cè)的重要手段,在地形圖像生成、目標(biāo)探測(cè)與偵察、軍事打擊、國(guó)土資源勘查和自然災(zāi)害監(jiān)測(cè)等國(guó)民經(jīng)濟(jì)與軍事領(lǐng)域發(fā)揮著重要作用[1-2]。近幾年來(lái),隨著SAR載荷及任務(wù)多樣化,如利用導(dǎo)彈、無(wú)人機(jī)等載荷實(shí)現(xiàn)戰(zhàn)場(chǎng)監(jiān)測(cè)、精確打擊等任務(wù),成像觀測(cè)中已難以滿足傳統(tǒng)SAR線性軌跡要求[3]。另外,隨著雷達(dá)硬件飛速發(fā)展和信息化應(yīng)用不斷深化,獲取大場(chǎng)景豐富信息已成為SAR應(yīng)用的迫切需求。因此,復(fù)雜軌跡下大場(chǎng)景高精度成像技術(shù)成為了當(dāng)前SAR領(lǐng)域的研究熱點(diǎn),其中如何實(shí)現(xiàn)大場(chǎng)景高精度快速或?qū)崟r(shí)成像,更是制約其成功應(yīng)用的關(guān)鍵問(wèn)題。
與光學(xué)遙感相比,SAR成像需對(duì)原始回波數(shù)據(jù)進(jìn)行相干聚焦處理。目前,常用SAR成像算法主要分成兩類:一類是以距離多普勒(Range Doppler,RD)算法、尺度變換(Chirp Scaling,CS)算法、波束域(Wavenumber Domain,W-K)算法等為代表的頻域處理算法[4],該類算法利用快速傅里葉變換(Fast Fourier Transform,F(xiàn)FT)完成數(shù)據(jù)頻域相干聚焦,故運(yùn)算量少,處理效率高,但算法實(shí)現(xiàn)復(fù)雜且要求平臺(tái)軌跡線性變化;另一類是以后向投影(Back Projection,BP)算法等為代表的時(shí)域成像算法[5],該類算法采用時(shí)域逐點(diǎn)相干聚焦,故運(yùn)算量極大,處理效率低,但算法實(shí)現(xiàn)簡(jiǎn)單且適用于任意平臺(tái)運(yùn)軌跡。因此,較頻域成像算法,BP算法更適合于復(fù)雜運(yùn)動(dòng)SAR高精度成像。但BP算法運(yùn)算量巨大,使其在一些實(shí)際應(yīng)用中受限。
近年來(lái),隨著計(jì)算機(jī)硬件的飛速發(fā)展,英偉達(dá)公司開(kāi)發(fā)的適用于通用并行計(jì)算的圖形處理器(Graphics Processing Unit,GPU)在運(yùn)算、傳輸速度和存儲(chǔ)方面也得到迅速提升,其配套的統(tǒng)一計(jì)算設(shè)備架構(gòu)(Compute Unified Device Architecture,CUDA)開(kāi)發(fā)平臺(tái)經(jīng)過(guò)多次升級(jí)和完善,已推出了大量的并行編程模型和指令,為高性能計(jì)算、大數(shù)據(jù)處理技術(shù)帶來(lái)了重要突破[6]。目前,GPU加速已在SAR成像與應(yīng)用領(lǐng)域引起高度關(guān)注。例如:文獻(xiàn)[7]結(jié)合RD算法與GPU并行,提出一種高并行度機(jī)載SAR實(shí)時(shí)并行成像處理方案;文獻(xiàn)[8]提出一種方位時(shí)域分割GPU處理的W-K算法,減少主機(jī)內(nèi)存與GPU顯存間冗余數(shù)據(jù)傳輸,成倍縮減GPU處理時(shí)間;文獻(xiàn)[9]提出BP算法GPU實(shí)現(xiàn),使原本極其耗時(shí)的處理過(guò)程可在較短時(shí)間內(nèi)完成;文獻(xiàn)[10]分析了BP算法并行化,提出了一種GPU加速的BP成像方案,并給出BP成像的GPU優(yōu)化成像方案;文獻(xiàn)[11 -15]介紹了其他SAR數(shù)據(jù)處理在GPU上的并行實(shí)現(xiàn)方法。因此,結(jié)合GPU并行可使得SAR數(shù)據(jù)處理速度大幅度提升,為復(fù)雜運(yùn)動(dòng)SAR大場(chǎng)景BP算法快速成像提供了一種有效途徑。然而,由于目前GPU顯存容量有限,現(xiàn)有BP-GPU方法通常需將SAR全部回波數(shù)據(jù)或整個(gè)成像空間分辨單元讀入GPU顯存,在SAR大場(chǎng)景成像時(shí)可能會(huì)造成GPU顯存不足而難以適用。
為了提高復(fù)雜軌跡SAR大場(chǎng)景BP算法成像效率,本文結(jié)合GPU并行技術(shù),提出了一種基于圖像流的BP算法GPU實(shí)現(xiàn),簡(jiǎn)稱圖像流BP-GPU方法。該方法借助BP算法中成像分辨單元處理的獨(dú)立性,采用圖像流對(duì)平臺(tái)軌跡、回波數(shù)據(jù)、成像空間等實(shí)現(xiàn)GPU并行處理,從而在有限GPU顯存容量下實(shí)現(xiàn)復(fù)雜運(yùn)動(dòng)SAR大場(chǎng)景BP算法快速成像。
2.1算法原理
在SAR成像中,BP算法基本思路是將成像空間分辨單元的回波信號(hào)進(jìn)行距離壓縮并補(bǔ)償多普勒相位,然后將方位向信號(hào)相干疊加得到該散射點(diǎn)幅度信息,從而獲得成像空間SAR成像結(jié)果。以機(jī)載為例,SAR成像典型幾何模型如圖1所示,假設(shè)其采用正側(cè)視成像模式,其中飛機(jī)以速度v沿Y方向運(yùn)動(dòng),虛線為理想線性運(yùn)動(dòng)軌跡,實(shí)線為真實(shí)復(fù)雜運(yùn)動(dòng)軌跡,場(chǎng)景中某散射點(diǎn)位置為Pw,散射系數(shù)為σ(Pw),雷達(dá)在第n個(gè)慢時(shí)刻位置為P(n),此時(shí)Pw到雷達(dá)距離為R(n;Pw)=‖Pw-P(n)‖2。
圖1 機(jī)載SAR成像幾何模型Fig.1 The imaging geometric model of airborne SAR
假設(shè)雷達(dá)發(fā)射線性調(diào)頻(Linear Frequency Modulation,LFM)信號(hào),表達(dá)式為
式中:fc為雷達(dá)載頻;fdr為信號(hào)調(diào)頻斜率;T為脈沖周期。則點(diǎn)目標(biāo)Pw回波信號(hào)可表示為
式中:λ為雷達(dá)載波波長(zhǎng)。若給定一個(gè)離散化觀測(cè)場(chǎng)景Ω,SAR回波數(shù)據(jù)可表示為
式中:第1項(xiàng)相位對(duì)應(yīng)場(chǎng)景方位向信息;第2項(xiàng)對(duì)應(yīng)場(chǎng)景距離向信息。
對(duì)于SAR數(shù)據(jù)距離向成像,BP算法采用脈沖壓縮技術(shù)進(jìn)行聚焦處理。式(3)脈壓后,可表示為
式中:sr(r,n)為第n慢時(shí)刻場(chǎng)景r處的脈壓后回波;γ(r,n)為場(chǎng)景r位置處的距離模糊函數(shù)。
對(duì)于SAR數(shù)據(jù)方位向成像,BP算法采用相干積累進(jìn)行聚焦處理。對(duì)于點(diǎn)Pw,式(4)相干積累后為
式中:I(Pw)為Pw的BP算法成像結(jié)果;sr(rPw,n)為第n慢時(shí)刻Pw對(duì)應(yīng)的脈壓回波。在BP算法中通常需對(duì)sr(r,n)進(jìn)行插值重采樣估計(jì)sr(rPw,n)。
因此,BP算法是脈壓數(shù)據(jù)與成像空間分辨單元點(diǎn)對(duì)點(diǎn)的圖像重建過(guò)程,其主要步驟詳見(jiàn)文獻(xiàn)[16]。BP算法成像是逐個(gè)方位向慢時(shí)刻(對(duì)應(yīng)于脈沖重復(fù)周期PRI)數(shù)據(jù)和逐個(gè)成像分辨單元相干積累的過(guò)程,算法原理簡(jiǎn)單且成像過(guò)程沒(méi)有任何近似誤差,故適用于復(fù)雜運(yùn)動(dòng)SAR高精度成像。
2.2BP算法并行化
由BP算法流程可知,其主要包括距離壓縮和后向投影兩個(gè)部分,其中后向投影包括計(jì)算斜距、插值與重采樣、相干積累等3個(gè)過(guò)程。因BP算法距離壓縮和傳統(tǒng)RD算法相同,相關(guān)GPU并行實(shí)現(xiàn)可參見(jiàn)文獻(xiàn)[7],本文不再贅述?;诜轿幌蛎}壓數(shù)據(jù)處理與成像空間分辨單元處理的獨(dú)立性,目前BP算法GPU并行實(shí)現(xiàn)方法主要有方位向PRI并行和成像分辨單元并行兩種方式。
(1)方法1:方位向PRI并行
在該并行方法中,GPU線程對(duì)應(yīng)于SAR方位向每一個(gè)PRI脈壓數(shù)據(jù),針對(duì)成像空間中一個(gè)分辨單元,GPU中每個(gè)線程計(jì)算該單元到對(duì)應(yīng)PRI距離歷史和延時(shí),然后完成該慢時(shí)刻后向投影處理,并將所有線程處理結(jié)果累加到該單元的存儲(chǔ)位置,然后遍歷成像空間中所有分辨單元,最終實(shí)現(xiàn)BP算法GPU并行成像。對(duì)于一塊大小為Na×Nr的SAR回波數(shù)據(jù),其中Na為數(shù)據(jù)方位向點(diǎn)數(shù),Nr為數(shù)據(jù)距離向點(diǎn)數(shù),該方法可采用Na個(gè)線程并行,故具有O(Na)并行度。該方法并行實(shí)現(xiàn)的基本流程如圖2(a)所示。
(2)方法2:成像分辨單元并行
在該并行方法中,GPU線程對(duì)應(yīng)于成像空間中分辨單元,針對(duì)方位向某PRI,GPU中每個(gè)線程計(jì)算該P(yáng)RI到成像空間所有分辨單元的距離歷史和時(shí)延,然后完成后向投影處理,得到所有網(wǎng)格點(diǎn)在當(dāng)前PRI的后向投影結(jié)果,并將其累加到對(duì)應(yīng)網(wǎng)格點(diǎn)的存儲(chǔ)單元,然后逐次遍歷RPI數(shù)據(jù),最終實(shí)現(xiàn)BP算法GPU并行成像。對(duì)于一塊大小為Ma×Mr的成像圖像,其中Ma為空間方位向點(diǎn)數(shù),Mr為空間距離向點(diǎn)數(shù),該算法可采用Ma×Mr個(gè)線程并行,故具有O(Ma·Mr)并行度。該方法并行實(shí)現(xiàn)基本流程如圖2(b)所示。
圖2 傳統(tǒng)BP算法并行處理框圖Fig.2 The parallel processing block diagram of conventional BP algorithm
以上兩種BP并行方法各有優(yōu)劣,但由于分辨單元數(shù)Ma×Mr通常大于方位向點(diǎn)數(shù)Na,因此方法2并行度往往要優(yōu)于方法1。但是,兩種BP并行方法只是針對(duì)BP算法中滿足并行條件的部分實(shí)現(xiàn)并行化,未考慮實(shí)際成像過(guò)程中SAR系統(tǒng)觀測(cè)、偵查時(shí)可能會(huì)持續(xù)好幾個(gè)小時(shí),覆蓋幾百里區(qū)域,因此所獲回波數(shù)據(jù)量是非常大的(通常有幾十GB以上)。然而,目前GPU顯存容量非常有限(顯存通常為6 GB左右),無(wú)法同時(shí)存儲(chǔ)大回波數(shù)據(jù)和成像結(jié)果。針對(duì)這種情況,傳統(tǒng)方法采用分塊處理辦法,但分塊處理方法會(huì)產(chǎn)生大量冗余操作、數(shù)據(jù)拼接等問(wèn)題,極大地影響成像效率。例如:對(duì)一塊場(chǎng)景進(jìn)行成像時(shí),待成像數(shù)據(jù)在方位向總長(zhǎng)度為合成孔徑長(zhǎng)度與所成像場(chǎng)景的長(zhǎng)度之和,故在兩個(gè)毗鄰子塊間會(huì)存在半個(gè)孔徑長(zhǎng)度的重合區(qū),進(jìn)而產(chǎn)生冗余操作。因此,面對(duì)SAR大場(chǎng)景GPU并行成像,需要在成像過(guò)程中進(jìn)行恰當(dāng)?shù)臄?shù)據(jù)調(diào)度和存儲(chǔ)管理。
3.1并行方法原理
為了實(shí)現(xiàn)復(fù)雜運(yùn)動(dòng)SAR大場(chǎng)景成像快速,本文結(jié)合BP算法成像空間并行處理,提出基于圖像流的BP成像算法GPU并行實(shí)現(xiàn),簡(jiǎn)稱圖像流BPGPU方法。在SAR數(shù)據(jù)采集過(guò)程中,觀測(cè)空間可劃分為已觀測(cè)空間、當(dāng)前觀測(cè)空間和待觀測(cè)空間3部分,如圖3所示。已觀測(cè)空間中目標(biāo)場(chǎng)景回波信號(hào)已被全部接收且可進(jìn)行全空間成像;當(dāng)前照射空間長(zhǎng)度恰好等于SAR合成孔徑長(zhǎng)度,其只接收到部分目標(biāo)場(chǎng)景回波,故無(wú)法實(shí)現(xiàn)全空間成像,但可進(jìn)行部分?jǐn)?shù)據(jù)成像;待觀測(cè)空間是SAR系統(tǒng)尚未照射區(qū)域,沒(méi)有回波數(shù)據(jù),無(wú)法進(jìn)行任何成像操作。因此,BP算法可逐個(gè)對(duì)PRI數(shù)據(jù)與其對(duì)應(yīng)觀測(cè)空間進(jìn)行成像處理,使成像過(guò)程中隨著PRI變化,待觀測(cè)空間逐漸進(jìn)入到當(dāng)前觀測(cè)空間,當(dāng)前觀測(cè)空間則逐漸轉(zhuǎn)換成具有成像條件的已觀測(cè)空間,從而實(shí)現(xiàn)大場(chǎng)景沿PRI序號(hào)逐個(gè)圖像流生成。
圖3 圖像流GPU-BP算法成像示意圖Fig.3 The sketch of the image streams GPU-BP algorithm
圖像流BP-GPU方法基本思路是按PRI序號(hào)讀取一個(gè)或多個(gè)脈壓數(shù)據(jù),將其投影到當(dāng)前觀測(cè)空間進(jìn)行方法2后向投影GPU并行處理,再依據(jù)下一個(gè)PRI平臺(tái)軌跡,滑動(dòng)當(dāng)前觀測(cè)空間并將處理結(jié)果累加,然后將已滑入已觀測(cè)空間的數(shù)據(jù)進(jìn)行成像與存儲(chǔ),直至處理完所有SAR回波數(shù)據(jù)或成像空間。
在數(shù)據(jù)調(diào)度策略上,圖像流BP-GPU方法采用雙緩存結(jié)構(gòu):孔徑緩存和圖像緩存??讖骄彺媸侵肝挥贕PU端的用于存放“當(dāng)前照射區(qū)域”中各像素點(diǎn)數(shù)據(jù)及數(shù)據(jù)傳輸所需的顯存空間。圖像緩存是指位于CPU端的用于存放GPU已處理完成像結(jié)果的內(nèi)存空間。圖像流BP-GPU方法成像中采用主機(jī)硬盤作為輸入和輸出存儲(chǔ)介質(zhì),而CPU內(nèi)存和GPU顯存作為數(shù)據(jù)緩存,大大降低了SAR成像過(guò)程對(duì)內(nèi)存和顯存的需求。此外,若硬件性能足夠好,流圖像處理在天線波束滑出場(chǎng)景區(qū)域時(shí)即可完成該區(qū)域成像,實(shí)現(xiàn)SAR快速或?qū)崟r(shí)成像處理。
在數(shù)據(jù)成像策略上,圖像流BP-GPU算法與方法2中BP-GPU實(shí)現(xiàn)相似,均基于成像空間分辨單元并行,但GPU線程不再對(duì)應(yīng)整個(gè)成像區(qū)域,而是對(duì)應(yīng)于子圖像分辨單元。因此,相對(duì)于傳統(tǒng)GPUBP方法,圖像流BP-GPU方法能有效避免孔徑拼接過(guò)程中冗余操作,減小存儲(chǔ)器要求,較好地解決由有限GPU顯存條件下SAR大場(chǎng)景成像問(wèn)題。
3.2并行算法流程
圖像流BP-GPU方法主要步驟如下:
(1)初始化成像方法和GPU參數(shù),包括BP算法成像空間、子圖像參數(shù)、GPU顯存分配等;
(2)根據(jù)GPU顯存分配,按照PRI序號(hào)將一組SAR平臺(tái)運(yùn)動(dòng)軌跡和對(duì)應(yīng)原始回波數(shù)據(jù)讀入GPU顯存,并完成回波數(shù)據(jù)距離脈沖壓縮和頻域插值GPU并行處理;
(3)編寫一個(gè)GPU內(nèi)核(Kernel)處理函數(shù),根據(jù)步驟2中PRI時(shí)刻雷達(dá)天線位置,計(jì)算此PRI時(shí)刻天線波束照射初始位置相對(duì)于BP算法成像空間初始位置的分辨單元偏差;
(4)在GPU內(nèi)核函數(shù)中利用步驟3得到的分辨單元偏差計(jì)算各GPU線程所對(duì)應(yīng)的孔徑緩存位置;
(5)采用分辨單元并行方法,利用當(dāng)前PRI脈壓數(shù)據(jù)、平臺(tái)運(yùn)動(dòng)軌跡和當(dāng)前觀測(cè)空間,對(duì)孔徑緩存內(nèi)各分辨單元分配GPU線程,完成后向投影處理;
(6)在GPU內(nèi)核函數(shù)中重復(fù)步驟3~5,直到處理完本批次數(shù)據(jù),至此本次GPU內(nèi)核函數(shù)調(diào)用完畢,得到步驟2中本組數(shù)據(jù)觀測(cè)空間子圖像;
(7)將步驟6子圖像結(jié)果從GPU孔徑緩存讀入CPU圖像緩存,若此時(shí)CPU圖像緩存已滿,則將圖像緩存數(shù)據(jù)寫入硬盤,并將CPU圖像緩存置零;
(8)將下一次調(diào)用GPU核函數(shù)所需要用到的新增GPU孔徑緩存置零;
(9)重復(fù)步驟2~8,直至處理完全部成像區(qū)域空間或PRI回波數(shù)據(jù),最后將所得多個(gè)子圖像依次合并,獲得大場(chǎng)景最終成像結(jié)果。
圖像流BP-GPU方法流程框圖如圖4所示,可知其主要包含3個(gè)功能模塊,即程序調(diào)度模塊(包含參數(shù)和GPU初始化、軌跡數(shù)據(jù)和原始數(shù)據(jù)配準(zhǔn)、數(shù)據(jù)傳輸?shù)龋?、脈壓及插值模塊、后向投影內(nèi)核模塊。
圖4 圖像流BP-GPU方法流程圖Fig.4 The flowchart of the image streams GPU-BP algorithm
為了驗(yàn)證本文方法有效性,本文分別利用仿真數(shù)據(jù)和機(jī)載SAR實(shí)測(cè)數(shù)據(jù)進(jìn)行成像處理,并對(duì)比傳統(tǒng)BP-CPU、BP-GPU方法進(jìn)行分析。在成像中,傳統(tǒng)BP-CPU方法采用雙精度運(yùn)算,而B(niǎo)P-GPU和圖像流BP-GPU方法均采用單/雙精度聯(lián)合運(yùn)算。實(shí)驗(yàn)中采用軟硬件環(huán)境如下:系統(tǒng)為Win7-64位;GPU型號(hào)為NVIDIA GTX680,顯存容量為4 GB;CPU型號(hào)Inter(R)-Corei5,CPU主頻為2.80 GHz,內(nèi)存容量為16 GB;CUDA版本為Toolkits 7.0。
4.1仿真數(shù)據(jù)
仿真實(shí)驗(yàn)中SAR系統(tǒng)主要參數(shù)為:雷達(dá)載頻35 GHz,發(fā)射信號(hào)帶寬0.9 GHz,天線方位真實(shí)孔徑長(zhǎng)度0.3 m,平臺(tái)高度6 000 m,信號(hào)脈沖寬度2 ms,脈沖重復(fù)頻率3 000 Hz,雷達(dá)入射角45°。為了獲取非線性復(fù)雜平臺(tái)軌跡,平臺(tái)運(yùn)動(dòng)速度服從均值為[0,100,0]m/s、方差為[1,1,4]m/s的隨機(jī)分布。原始回波中方位向點(diǎn)數(shù)為8 192,距離向點(diǎn)數(shù)為2 048。
首先,利用點(diǎn)目標(biāo)仿真對(duì)比傳統(tǒng)BP-CPU、圖像流BP-GPU方法性能,其中原始場(chǎng)景包含3個(gè)點(diǎn)目標(biāo),其在X軸上間距為1 m且散射系數(shù)相同。圖5為點(diǎn)目標(biāo)成像結(jié)果,圖5(a)為點(diǎn)目標(biāo)成像圖像,圖像大小為2 048×2 048且顯示門限為-35 dB;圖5(b)為3個(gè)點(diǎn)目標(biāo)沿X軸剖面的幅度。從圖5可知,BP-CPU和圖像流BP-GPU方法在點(diǎn)目標(biāo)二維圖像成像質(zhì)量和峰值旁瓣水平基本相同,在復(fù)雜軌跡下點(diǎn)目標(biāo)良好聚焦,說(shuō)明圖像流BP-GPU方法可對(duì)復(fù)雜軌跡SAR進(jìn)行高精度成像。
圖5 點(diǎn)目標(biāo)仿真成像結(jié)果Fig.5 The simulation results of point targets
其次,為了不失一般性,利用面目標(biāo)仿真對(duì)比傳統(tǒng)BP-CPU、BP-GPU、圖像流BP-GPU方法性能,其中原始場(chǎng)景包含一個(gè)圓錐,場(chǎng)景大小為4 096×4 096。圖6(a)~(c)分別為3種方法圓錐目標(biāo)成像結(jié)果,其中圖像大小為4 096×4 096,BPCPU運(yùn)算時(shí)間為44 392.35 s,BP-GPU運(yùn)算時(shí)間為236.73 s,圖像流BP-GPU運(yùn)算時(shí)間為148.22 s。從圖6可知,圖像流BP-GPU方法與BP-CPU、傳統(tǒng)BP-GPU面目標(biāo)成像質(zhì)量差異很小,均實(shí)現(xiàn)了圓錐目標(biāo)良好聚焦成像,但圖像流BP-GPU方法較傳統(tǒng)BP-GPU方法提高了成像處理效率。
圖6 面目標(biāo)仿真成像結(jié)果Fig.6 The simulation results of the plane scene
另外,給定回波方位向點(diǎn)數(shù)為8 192、距離向點(diǎn)數(shù)為2 048時(shí),表1給出了不同成像圖像尺寸條件下傳統(tǒng)BP-CPU、BP-GPU、圖像流BP-GPU方法成像處理運(yùn)行時(shí)間。表1中,傳統(tǒng)BP-GPU和圖像流BP -GPU方法中子圖像均設(shè)置為2 048×2 048。當(dāng)成像圖像大于子圖像時(shí),傳統(tǒng)BP-GPU方法采用圖像分塊處理,為了克服子圖像邊緣精度下降其相鄰子圖像在方位向上存在半個(gè)子圖像重疊。由表1可知,圖像流BP-GPU運(yùn)算時(shí)間相對(duì)于BP-CPU提高了約300倍,如在成像圖像為2 048×2 048時(shí),BP-CPU耗時(shí)約11 655 s,而圖像流BP-GPU僅耗時(shí)36.54 s。相對(duì)于傳統(tǒng)BP-GPU,圖像流BP-GPU在成像圖像不大于子圖像尺寸時(shí)運(yùn)算時(shí)間基本相近,但當(dāng)成像圖像大于子圖像尺寸時(shí)運(yùn)算時(shí)間優(yōu)勢(shì)逐漸增強(qiáng),如成像圖像為8 192×8 192時(shí)圖像流BP-GPU運(yùn)算時(shí)間相對(duì)于傳統(tǒng)BP-GPU提高了約2倍,且加速比隨著成像圖像增大而增大。此時(shí),若分辨單元間隔為0.2 m,圖像流BP-GPU對(duì)1.5 km×1.5 km觀測(cè)場(chǎng)景成像只需幾分鐘,基本實(shí)現(xiàn)了SAR大場(chǎng)景高精度快速成像。該仿真結(jié)果驗(yàn)證了本文圖像流BP-GPU方法的有效性和優(yōu)勢(shì),相對(duì)于傳統(tǒng)BP-CPU及BPGPU成像處理,提高了SAR大場(chǎng)景高精度成像運(yùn)算效率。
表1 3種BP算法成像處理運(yùn)算時(shí)間Tab.1 The imaging operation time of three BP algorithms
4.2機(jī)載實(shí)測(cè)數(shù)據(jù)
本節(jié)利用某機(jī)載SAR實(shí)測(cè)數(shù)據(jù)進(jìn)行成像處理,該雷達(dá)系統(tǒng)工作于Ka頻段,成像分辨率(方位向×距離向)約為0.15 m×0.15 m,回波數(shù)據(jù)方位向點(diǎn)數(shù)為16 384,距離向點(diǎn)數(shù)為4 096,平臺(tái)速度分量如圖7所示,可知機(jī)載SAR平臺(tái)并非理想線性軌跡。
圖7 機(jī)載SAR平臺(tái)運(yùn)動(dòng)速度Fig.7 The speed of the airborne SAR
圖8為傳統(tǒng)BP-CPU、傳統(tǒng)BP-GPU和圖像流BP-GPU方法成像處理結(jié)果,其中圖像大小為4 096 ×16 384,分辨單元間隔為0.1 m×0.1 m,傳統(tǒng)BPGPU方法和圖像流BP-GPU方法子圖像大小設(shè)置為4 096×4 096。
圖8 復(fù)雜軌跡機(jī)載SAR成像結(jié)果Fig.8 The imaging results of the complex trajectory airborne SAR
由圖8可知:在成像質(zhì)量方面,圖像流BP-GPU與BP-CPU和傳統(tǒng)BP-GPU方法成像質(zhì)量相似,對(duì)觀測(cè)場(chǎng)景中農(nóng)田、道路等目標(biāo)均聚焦良好,說(shuō)明圖像流BP-GPU與BP-CPU和傳統(tǒng)BP-GPU方法成像精度相當(dāng),可實(shí)現(xiàn)復(fù)雜軌跡SAR大場(chǎng)景高精度成像;在成像運(yùn)算時(shí)間方面,傳統(tǒng)BP-CPU方法需762 402 s(約8.8 d),傳統(tǒng)BP-CPU方法需6 284 s(約1.7 h),而圖像流BP-GPU方法僅需2 139 s(約35 min),故在圖像大小為4 096×16 384條件下圖像流BP-GPU運(yùn)算時(shí)間比傳統(tǒng)BP-CPU方法提高約350倍,比傳統(tǒng)BP-GPU方法提高約2.9倍。實(shí)測(cè)數(shù)據(jù)結(jié)果進(jìn)一步驗(yàn)證了圖像流BP-GPU方法在復(fù)雜軌跡SAR成像的有效性,可大大提高SAR大場(chǎng)景高精度成像處理運(yùn)算效率。
針對(duì)傳統(tǒng)BP算法在復(fù)雜運(yùn)動(dòng)SAR大場(chǎng)景成像時(shí)運(yùn)算時(shí)間多的問(wèn)題,本文結(jié)合BP算法數(shù)據(jù)處理獨(dú)立特性和GPU并行計(jì)算能力,提出了一種基于圖像流的SAR大場(chǎng)景BP-GPU成像方法。相對(duì)于傳統(tǒng)BP-GPU方法,圖像流處理可以減少數(shù)據(jù)處理冗余,從而提高BP算法并行處理效率。仿真數(shù)據(jù)和機(jī)載實(shí)測(cè)雙基SAR數(shù)據(jù)驗(yàn)證了本文方法的有效性,說(shuō)明本文圖像流BP-GPU方法可以實(shí)現(xiàn)輔助運(yùn)動(dòng)SAR大場(chǎng)景高精度快速成像。本文方法對(duì)實(shí)際中復(fù)雜軌跡大場(chǎng)景SAR快速成像應(yīng)用具有一定意義。下一步研究方向是對(duì)BP算法進(jìn)程及GPU顯存優(yōu)化分配。
[1] JAKOWATZ C V J,WAHL D E,EICHEL P H,et al. Spotlight-mode synthetic aperture radar:a signal processing approach:a signal processing approach[M].Berlin:Springer Science&Business Media,2012.
[2] MOREIRA A,PRATS-IRAOLA P,YOUNIS M,et al.A tutorial on synthetic aperture radar[J].IEEE Geoscience and Remote Sensing Magazine,2013,1(1):6-43.
[3] 張直中.機(jī)載和星載合成孔徑雷達(dá)導(dǎo)論[M].北京:電子工業(yè)出版社,2004.
ZHANG Zhizhong.Introduction to airborne and spaceborne synthetic aperture radar[M].Beijing:Publishing House of Electronics Industry,2004.(in Chinese)
[4] CUMMING I G,WONG F H.Digital processing of synthetic aperture radar data:algorithms and implementation[M].New York:Artech House,2005.
[5] UIANDER L M H,HELLSTEN H,STENSTROM G.Syn-thetic-aperture radar processing using fast factorized back -projection[J].IEEE Transactions on Aerospace and E-lectronic Systems,2003,39(3):760-776.
[6] SANDERS J,KANDROT E.CUDA by example:an introduction to general-purpose GPU programming,portable documents[M].New Jersey:Addison-Wesley Professional,2010.
[7] 趙敬亮,雷萬(wàn)明,黃銀和.基于GPU的SAR實(shí)時(shí)并行成像處理[J].信息化研究,2010,36(2):28-30.
ZHAO Jingliang,LEI Wanming,HUANG Yinhe.Real time parallel imaging processing of SAR based on GPU[J].Informatization Research,2010,36(2):28-30.(in Chinese)
[8] 孟大地,胡玉新,丁赤飚.一種基于GPU的SAR高效成像處理算法[J].雷達(dá)學(xué)報(bào),2013(2):210-217.
MENG Dadi,HU Yuxin,DING Chibiao.An efficient algorithm to processing SAR data on GPU[J].Journal of Radars,2013(2):210-217.(in Chinese)
[9] 姜曉龍,王建,宋千,等.基于GPU的后向投影SAR成像算法[J].雷達(dá)科學(xué)與技術(shù),2014(4):350-357.
JIANG Xiaolong,WANG Jian,SONG Qian,et al.Backprojection algorithm for SAR imaging with GPU[J].Radar Science and Technology,2014(4):350-357.(in Chinese)
[10] 班陽(yáng)陽(yáng),張勁東,陳家瑞,等.后向投影成像算法的GPU優(yōu)化方法研究[J].雷達(dá)科學(xué)與技術(shù),2014(6):659-665.
BAN Yangyang,ZHANG Jindong,CHEN Jiarui,et al. GPU optimization method for back projection imaging algorithm[J].Radar Science and Technology,2014(6):659-665.(in Chinese)
[11] ZHANG F,HU C,LI W,et al.Accelerating time-domain SAR raw data simulation for large areas using multi-GPUs[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2014,7(9):3956-3966.
[12] 吳錚,張磊,李寧.基于GPU的機(jī)載高分SAR運(yùn)動(dòng)補(bǔ)償和自聚焦[J].國(guó)外電子測(cè)量技術(shù),2015(8):94-99.
WU Zheng,ZHANG Lei,LI Ning.Motion compensation and autofocus issues for airborne high resolution SAR based on GPU architecture[J].Foreign Electronic Measurement Technology,2015(8):94-99.(in Chinese)
[13] 田宵駿,梁媚蓉,毛新華.超高分辨率機(jī)載SAR成像算法及其GPU實(shí)現(xiàn)[J].南京航空航天大學(xué)學(xué)報(bào),2015,47(3):384-391.
TIAN Xiaojun,LIANG Meirong,MAO Xinhua.Imaging algorithm and its implementation on GPU for ultra-high resolution airborne SAR[J].Journal of Nanjing University of Aeronautics and Astronautics,2015,47(3):384-391.(in Chinese)
[14] FASIH A,HARTLEY T.GPU-accelerated synthetic aperture radar backprojection in CUDA[C]//Proceedings of 2010 IEEE Radar Conference.Washington DC:IEEE,2010:1408-1413.
[15] WU Z,LIU Y,ZHANG L,et al.Highly efficient synthetic aperture radar processing systemfor airborne sensors using CPU+GPU architecture[J].Journal of Applied Remote Sensing,2015,9(1):293-297.
[16] 韋順軍,張曉玲,師君,等.同空間后向投影InSAR成像及干涉相位提取方法[J].宇航學(xué)報(bào),2015,36(3):336-343.
WEI Shunjun,ZHANG Xiaoling,SHI Jun,et al.InSAR imaging and interferogram extraction-based the same space back-projection[J].Journal of Astronautics,2015,36(3):336-343.(in Chinese)
韋順軍(1983—),男,廣西柳州人,2006年于電子科技大學(xué)獲電子信息科學(xué)與技術(shù)專業(yè)理學(xué)學(xué)士學(xué)位,2009年和2013年分別于電子科技大學(xué)獲信號(hào)與信息處理專業(yè)工學(xué)碩士學(xué)位和博士學(xué)位,現(xiàn)為講師,主要研究方向?yàn)槔走_(dá)成像技術(shù)、雷達(dá)信號(hào)處理等;
WEI Shunjun was born in Liuzhou,Guangxi Zhuangzu Autonomous Region,in 1983.He received the B.S. degree,the M.S.degree and the Ph.D.degree from University of Electronic Science and Technology of China in 2006,2009 and 2013,respectively.He is now a lecturer.His research concerns radar imaging technique and radar signal processing.
Email:weishunjun@uestc.edu.cn
蒲 羚(1991—),男,四川成都人,2014年于電子科技大學(xué)獲工學(xué)學(xué)士學(xué)位,主要研究方向?yàn)槔走_(dá)成像處理;
PU Ling was born in Chengdu,Sichuan Province,in 1991. He received the B.S.degree from University of Electronic Science and Technology of China in 2016.His research concerns radar imaging processing.
張曉玲(1964—),女,四川成都人,分別于1985年、1988年和2000年獲電子科技大學(xué)工學(xué)學(xué)士學(xué)位、碩士學(xué)位和博士學(xué)位,現(xiàn)為教授、博士生導(dǎo)師,主要研究方向?yàn)槔走_(dá)成像技術(shù)、雷達(dá)信號(hào)處理等;
ZHANG Xiaoling was born in Chengdu,Sichuan Province,in 1964.She received the B.S.degree,the M.S.degree and the Ph.D.degree from University of Electronic Science and Technology of China in 1985,1988 and 2000,respectively.She is now a professor and also the Ph.D.supervisor.Her research concerns radar imaging technique and radar signal processing.
師 君(1979—),男,河南南陽(yáng)人,分別于2003年、2006年和2009年獲電子科技大學(xué)工學(xué)學(xué)士學(xué)位、碩士學(xué)位和博士學(xué)位,現(xiàn)為副教授、博士生導(dǎo)師,主要研究方向?yàn)槔走_(dá)成像技術(shù)、雷達(dá)信號(hào)處理等。
SHI Jun was born in Nanyang,Henan Province,in 1979.He received the B.S.degree,the M.S.degree and the Ph.D.degree from University of Electronic Science and Technology of China in 2003,2006 and 2009,respectively.He is now an associate professor and also the Ph.D.supervisor.His research concerns radar imaging technique and radar signal processing.
Image Streams GPU-based Back Projection for Complex Trajectory Synthetic Aperture Radar Imaging
WEI Shunjun,PU Ling,ZHANG Xiaoling,SHI Jun
(School of Electronic Engineering,University of Electronic Science and Technology of China,Chengdu 611731,China)
Compared with the frequency domain algorithms based on Fourier transform,back projection(BP)algorithm is more applicable for high-precision synthetic aperture radar(SAR)imaging with complex trajectory because of its time-domain coherent integration point by point.However,BP algorithm has a problem of huge calculation quantity,which restricts its application to fast SAR imaging with large scene and big data.Graphics processing unit(GPU)has a strong ability in floating-point calculation and parallel processing,and provides an effective approach for large-scene fast imaging with BP algorithm.According to GPU parallel processing,this paper proposes a new processing method of large-scene SAR fast imaging with BP algorithm,based on complex motion of image flow.Depending on the character that the image pixels in BP algorithm are processed independently,this method uses the parallelization of image pixels and image-flow processing to design a scheduling scheme between apertures and image caches to improve the imaging efficiency of SAR with large scene and big data.Simulation and airborne experimental results demonstrate the effectiveness of the method,and fast imaging with the large scene of 8 192×8 192 has been realized in the condition of limited GPU memory,and the speed-up ratio can be improved 300 times compared with the traditional CPU single-thread processing.
SAR;complex trajectory;BP algorithm;GPU acceleration;large scene imaging
The National Natural Science Foundation of China(No.61501098);The China Postdoctoral Science Foundation(2015M570778);The Aeronautical Science Foundation of China(No.20142080007)
TN958.3
A
1001-893X(2016)08-0879-08
10.3969/j.issn.1001-893x.2016.08.009
2016-04-06;
2016-05-31
date:2016-04-06;Revised date:2016-05-31
國(guó)家自然科學(xué)基金資助項(xiàng)目(61501098);中國(guó)博士后科學(xué)基金項(xiàng)目(2015M570778);航空科學(xué)基金與航空電子系統(tǒng)射頻綜合仿真航空科技重點(diǎn)實(shí)驗(yàn)室聯(lián)合資助項(xiàng)目(20142080007)
**通信作者:weishunjun@uestc.edu.cn
weishunjun@uestc.edu.cn
引用格式:韋順軍,蒲羚,張曉玲,等.復(fù)雜軌跡合成孔徑雷達(dá)后向投影算法圖像流GPU成像[J].電訊技術(shù),2016,56(8):879-886.[WEI Shunjun,PU Ling,ZHANG Xiaoling,et al.Image streams GPU-based back projection for complex trajectory synthetic aperture radar imaging[J].Telecommunication Engineering,2016,56(8):879-886.]