蘇 秦,顧宗靜,林中朝,趙勛旺,張 玉
(西安電子科技大學 天線與微波技術重點實驗室,陜西 西安 710071)
雷達散射截面(Radar Cross Section,RCS)的計算是伴隨著雷達目標的檢測和識別技術發(fā)展起來的,它不僅可以應用于現(xiàn)有的各種目標,又可以用來預估和優(yōu)化未來的信息化系統(tǒng),在工程應用領域具有重要作用.尤其是近幾十年來,隱身技術與精確目標識別技術日新月異,這對電大尺寸復雜目標的RCS計算提出了更高的要求.對于電尺寸很大的散射體,通常采用物理光學法(Physical Optics method,PO)等高頻算法求解,然而,高頻算法難以保證足夠的精度.傳統(tǒng)的高精度電磁場數(shù)值算法如矩量法(Method of Moment,MoM)和有限元等算法往往只能解決幾十個波長的電磁問題.多層快速多極子算法(MultiLevel Fast Multipole Algorithm,MLFMA)的求解規(guī)??梢赃_到上百波長[1],但對于上千波長規(guī)模的問題在資源有限的情況下仍然很難求解.這迫使人們必須找到一種高效可實現(xiàn)的數(shù)值仿真方法.
區(qū)域分解方法(Domain Decomposition Methods,DDM)是使用“分而治之”的思想解決問題的方法.它先對整體目標進行分區(qū),依據(jù)其物理或電磁散射特性劃分為多個子區(qū)域獨立求解,然后通過考慮子區(qū)域間的耦合關系,最終得到原問題的解.由于每個子區(qū)域處于獨立求解空間,并且具有相對較少的未知量,這就使得大型電磁仿真分析的快速實現(xiàn)成為可能.在有限元與有限差分領域,DDM已經成功實現(xiàn)[2-3].而在積分方程領域,如MoM,近年來對于DDM的研究也越來越受到學者們的關注.一種廣泛采用的重疊型DDM中[4],相鄰兩個子區(qū)域間存在重疊部分,這種方法可以使得電磁流更加逼近真實電磁流.但是重疊區(qū)的引入給建模帶來了不便,同時區(qū)域延伸也導致了計算量增加.而另一種非重疊型DDM則是在子區(qū)域之間引入人工虛擬面,將原問題分解為很多閉合的子區(qū),每次迭代通過修正虛擬面上電磁流來保證相鄰子區(qū)域場的連續(xù)性[5].這種方法節(jié)省了幾何建模的工作量,具有較高的靈活性.然而對于用區(qū)域分解方法解決千波長規(guī)模電磁問題,鮮有有效工作內容發(fā)表.這主要是因為DDM的并行方案復雜,并且在計算電大尺寸問題時,為了保證足夠的精度,通常需要用MLFMA來降低內存消耗與計算復雜度,而MLFMA的八叉樹結構,使得其在并行化過程中的負載均衡難以實現(xiàn).
針對這一問題,文中給出一種高效的基于積分方程的并行非重疊區(qū)域分解方法(Integral Equation-based Nonoverlapping Domain Decomposition Method,IE-NDDM).與文獻[6]中所有子區(qū)域同時計算的并行方案相比,并行IE-NDDM將所有計算機資源集中對單個子區(qū)域求解,避免了子區(qū)域大小劃分不均等所導致的負載不均衡,同時待求解問題的規(guī)模也大大提升.每個子區(qū)域內部以及子區(qū)域間耦合量的求解均用并行MLFMA進行加速.改進的平面波自適應劃分策略使得并行MLFMA的數(shù)據(jù)劃分更加均衡,進一步提高了并行IE-NDDM的計算能力和效率.子區(qū)域間的耦合量計算采用場迭代的方式,降低了計算過程中的內存消耗.文中最后給出一個實際應用中的千波長艦船的散射特性分析,數(shù)值結果表明,該方法能夠有效應用于電大尺寸散射體的快速精確仿真.
與重疊型DDM相比,IE-NDDM僅在相鄰子區(qū)域切割處增加虛擬面,使各個子區(qū)域封閉.此處以金屬目標劃分為兩個非重疊型子區(qū)域為例進行分析,對于多個子區(qū)域情況可以依此類推.
圖1 模型區(qū)域分解示意圖
以子區(qū)域Ω1為例,在平面波{Einc,Hinc}入射時,根據(jù)等效原理,其表面電場積分方程(Electric Field Integral Equation,EFIE)及磁場積分方程(Magnetic Field Integral Equation,MFIE)可以寫為
(1)
其中,{Es,Hs}代表金屬體表面等效源所產生的散射場.對于金屬體表面而言,只有電流J,因此,散射場用等效源的積分形式可以表示為
(2)
(3)
對式(1)中的EFIE及MFIE線性組合起來得到混合場積分方程(Combined Field Integral Equation,CFIE),并用伽遼金匹配來構建出全局矩陣方程.對于n個子區(qū)域,方程ZI=V可以寫成如下形式:
(4)
其中,當i=j時,Zij為第i個子區(qū)域Ωi的自阻抗矩陣; 當i≠j時,Zij為子區(qū)域Ωj和子區(qū)域Ωi的互阻抗矩陣;Ii為子區(qū)域Ωi的電磁流系數(shù)矩陣,Vi為子區(qū)域Ωi的電壓矩陣.
(5)
(6)
圖2 并行IE-NDDM外迭代流程圖
MLFMA有兩種基本并行策略,分別是組劃分與平面波劃分策略.如果只使用組劃分策略,那么在高層會存在瓶頸,因為高層的非空組較少,無法分配給較多的并行進程.同理,如果只使用平面波劃分策略,那么在低層存在瓶頸.為了提高并行MLFMA的可擴展性,需要混合使用這兩種并行策略.比較簡單的混合策略是在低層采用組劃分,在高層采用平面波劃分,通過設置中間過渡層實現(xiàn)兩種策略的結合.然而在過渡層,非空組數(shù)和每個非空組對應的平面波數(shù)均為O(N0.5).當進程數(shù)超過O(N0.5)時,該混合策略在過渡層出現(xiàn)瓶頸.為了解決過渡層的瓶頸,一種逐層漸變劃分策略(HiP)將組劃分與平面波劃分策略緊密結合,具有較高并行效率[8].在此基礎上,文中對MLFMA采用一種改進的平面波自適應劃分(Adaptive Partition,AdP)并行策略[9],并行編程模型為基于分布式內存的消息傳遞接口(Message Passing Interface,MPI).該策略同樣采用逐層漸變的方式對平面波方向進行劃分.不同的是,在某一層對于不同的非空組,HiP對于平面波劃分的份數(shù)相同,而AdP根據(jù)非空組所在的進程數(shù)進行自適應劃分,非空組所在的進程數(shù)不同則平面波劃分份數(shù)也隨之不同.設并行進程數(shù)為Np,將基函數(shù)(或權函數(shù))等分為Np個部分,每部分基函數(shù)被分配給一個進程.然后,每個進程根據(jù)所分配到的基函數(shù)建立相應的子樹.如圖3(a)所示,第2層至第4層的八叉樹被分配到6個進程中,其中進程編號記為P0~P5,非空組中標注的進程編號就是該非空組所在的進程.對于圖3(a)中的第3層,該層中的3個非空組分別存在于1個、2個、3個進程中.每個非空組對應的外向平面波和內向平面波被均等地分配到其所在的進程中.圖3(b)所示為圖3(a)中第2層非空組的平面波劃分示意圖,每個圓點代表一個平面波方向.
圖3 八叉樹的數(shù)據(jù)劃分
這種準二維劃分的AdP對使用的進程個數(shù)無特殊要求,組劃分與平面波劃分無縫結合.每個進程都參與計算和通信,這使得各個進程中的通信量和計算量更加均衡.在聚合-轉移-配置(MVP)過程中,向上聚合與向下配置時,進程中外向平面波和內向平面波的交換和疊加都在緩沖區(qū)中進行,避免了插值過程中的通信.同時,利用MPI中的非阻塞通信技術,將進程內計算與進程間通信相互重疊,進一步提升了MLFMA的并行效率,這使得并行IE-NDDM在普通工作站上即可快速求解大規(guī)模電磁問題.關于AdP的大規(guī)模并行性能詳見文獻[9].
此處以波音737飛機的散射特性為例來證明并行IE-NDDM算法的正確性與高效性. 入射波面向機頭入射,極化方向為 +z.飛機模型劃分為5個子區(qū)域,如圖4(a)所示,其尺寸為 30.6 m× 29.0 m× 11.7 m.當入射波頻率為 1 GHz 時,表1列出了兩種計算方式消耗的計算資源和計算時間.可以看出,并行IE-NDDM與FEKO整體解相比,內存使用峰值降低86.7%,同樣使用16個CPU核數(shù)時,總計算時間也縮短了36.1%.圖4(c)~圖4(d)中實線為并行IE-NDDM數(shù)值計算結果,虛線為商業(yè)軟件FEKO用MLFMA整體求解的仿真結果,圖4(b)為并行IE-NDDM算法外迭代收斂曲線.可以看出,文中提出的并行IE-NDDM算法4步迭代收斂精度已達到 0.002 63,并且與整體解的結果曲線吻合良好,尤其在前后向幾乎完全重合.從而證明了并行IE-NDDM算法的準確性,為計算更大規(guī)模的散射體提供了理論支持.圖4(c)和圖4(d)中同時給出了并行IE-NDDM計算得到的入射波頻率為 10 GHz 時飛機的RCS,此時飛機的電尺寸達到 1 000 波長.
表1 頻率為1 GHz時的計算資源列表
圖4 飛機模型及其RCS
此處以艦船模型為例,用并行IE-NDDM算法對其散射特性進行計算.該艦船模型如圖5(a)所示,其尺寸為 153.0 m× 16.5 m× 28.0 m,共劃分為7個子區(qū)域.入射方向為面向船頭入射,極化方向為 +z.外迭代收斂殘差設為0.01.當入射波的頻率為 300 MHz 時,艦船的RCS計算結果如圖5(b)~圖5(c)所示.可以看出,對于該模型并行IE-NDDM與整體解的結果曲線依然吻合良好.當入射波的頻率為 2 GHz 時,相應的電尺寸為 1 020λ× 110λ× 186.7λ.對整體模型剖分所產生的未知量個數(shù)為 66 171 474,此時用現(xiàn)有計算機資源已很難得到整體解.采用并行IE-NDDM算法求解,最大的子區(qū)域未知量個數(shù)為 14 813 784,用32個CPU核進行計算,總耗時為 19.2 h.同時,占用的總內存峰值僅為 105.6 GB.這表明在計算資源有限時,該并行IE-NDDM算法在計算時間和資源消耗上都擁有極大優(yōu)勢.此時艦船的RCS計算結果如圖6(a)~圖6(b)所示.
圖5 艦船模型以及在300 MHz時的RCS
圖6 艦船在2 GHz時的RCS
在非重疊型區(qū)域分解法的基礎上,采用并行多層快速多極子對子區(qū)域內部以及子區(qū)域間耦合的計算進行加速.改進的自適應劃分并行策略提高了多層快速多極子的并行效率,子區(qū)域間耦合計算用場迭代的方式降低了內存.這使得電大尺寸電磁問題的精確高效求解成為可能,在資源有限的情況下,千波長目標散射特性計算的工程難題得到了解決.下一步嘗試將天線加載到電大尺寸平臺上,解決更加復雜的電磁仿真問題.