黃 偉, 徐建城, 吳華興, 李俊兵
(1. 空軍工程大學航空航天工程學院, 陜西 西安 710038; 2. 西北工業(yè)大學電子信息學院, 陜西 西安 710072)
導彈協(xié)同編隊是未來局部戰(zhàn)爭的主戰(zhàn)模式,各軍事強國都不遺余力的開展相關技術的研究工作[1-2],導彈編隊控制的主要任務是有效地生成和保持預定的編隊幾何形態(tài),韋常柱[3]等采用小擾動線性化方法設計了導彈編隊保持控制器;穆曉敏[4]等建立了由編隊隊形控制及編隊離入隊管理等模塊組成的編隊控制系統(tǒng);周慧波[5]等將編隊控制問題轉(zhuǎn)化為跟蹤問題,所提出的制導律算法具有一定的魯棒性。以上成果主要基于單枚從彈與領彈的相對位置關系,未將導彈編隊作為整體考慮,各枚從彈控制算法的收斂時間存在較大差異,不適用于大規(guī)模導彈編隊的隊形控制。近些年來,一致性算法[6-7]成為解決大規(guī)模編隊控制問題的有效方法,林志云[8]等基于相對坐標系,應用圖拉普拉斯方法建立了隊形控制一致性算法;文獻[9-10]提出基于二階運動學模型的飛行器編隊一致性算法,并將虛擬結構法、領從法、行為法等標準化在一致性算法框架內(nèi)。然而,以上基于一致性理論的編隊控制算法在設計過程中均假設導彈自動駕駛儀是非慣性系統(tǒng),無遲滯的響應由制導系統(tǒng)生成的制導指令。實際中,外環(huán)制導回路生成的制導指令是通過內(nèi)環(huán)自動駕駛儀實現(xiàn)的,受自動駕駛儀動態(tài)特性的影響[11-12],可能導致控制算法的發(fā)散,影響編隊閉環(huán)系統(tǒng)的穩(wěn)定性;其次,現(xiàn)有一致性算法中的參數(shù)僅限定了其取值范圍,未經(jīng)參數(shù)優(yōu)化過程,不能實現(xiàn)在某種性能指標下的編隊最優(yōu)控制。
鑒于此,針對領從結構導彈編隊隊形控制問題,提出一種基于參數(shù)優(yōu)化并考慮自動駕駛儀動態(tài)特性的一致性編隊控制算法。首先,將導彈自動駕駛儀等效為一階慣性環(huán)節(jié),基于坐標變換得到了制導指令與所需控制力的關系模型;其次,建立了導彈編隊一致性控制算法,構建了編隊閉環(huán)制導控制系統(tǒng)方程,應用代數(shù)圖論證明了閉環(huán)系統(tǒng)的穩(wěn)定性;最后,以編隊各成員位置和速度的累計誤差建立指標泛函,基于最優(yōu)控制提出了算法中待定系數(shù)的優(yōu)化方法,從而進一步提高了導彈編隊系統(tǒng)的性能。
為便于描述導彈編隊相對運動關系,選取地面某點為坐標原點建立地理坐標系(OXYZ)e,如圖1所示。導彈編隊由1枚領彈和2枚從彈組成。編隊過程中,要求各枚從彈在制導控制系統(tǒng)的作用下與領彈生成并保持既定的相對位置關系和速度關系。
圖1 導彈編隊示意Fig.1 Missile formation in 3D space
將導彈簡化為質(zhì)點,并僅考慮導彈的彈道傾角和彈道偏角,導彈所需的控制力矢量F=[FxFyFz]T定義在以導彈質(zhì)心為原點、以速度矢量方向為X軸向的彈道坐標系(OXYZ)m中,其分量分別為導彈軸向、俯仰方向和偏航方向的控制力。由此,導彈在三維空間中的運動可描述為
(1)
圖2 導彈制導控制系統(tǒng)Fig.2 Control system of missile guidance
如圖2所示,根據(jù)編隊指標要求,假設控制器輸出的制導指令為Vd=[VexdVeydVezd]T,即地理坐標系中3個軸向的理想速度,導彈控制系統(tǒng)響應制導指令,計算所需的控制力矢量F,從而控制導彈的飛行狀態(tài)??傮w設計階段,導彈自動駕駛儀可以等效為一階慣性環(huán)節(jié),即
(2)
式中,V=[vxvyvz]T表示導彈在地理坐標系中飛行速度矢量;τ為等效環(huán)節(jié)時間常數(shù);s為拉普拉斯算子。式(2)的微分方程形式為
(3)
式中,各項運動參數(shù)均定義在地理坐標系下,而導彈控制力矢量F定義在彈道坐標系下,為了建立F與Vd之間的關系式,通過坐標變換,可得地理坐標系下控制力矢量Fe與F之間的變換式為
(4)
式中,Tem為彈道坐標系到地理坐標系的轉(zhuǎn)換矩陣,由此可得
(5)
再由式(3)可得導彈控制力F與制導指令Vd之間的關系式為
(6)
由式(6)可知,根據(jù)導彈制導系統(tǒng)計算得到的Vd,控制系統(tǒng)即可得到所需的控制力矢量F,在導彈編隊過程中,設計滿足編隊要求的控制算法,得到制導指令Vd是編隊控制的關鍵。
領從結構導彈編隊過程中,領彈一般配置有高性能通信和探測裝置[13],實現(xiàn)對遠距離目標的探測,其運動狀態(tài)不受從彈的影響。由此,控制算法的設計目標為:得到編隊各從彈的制導指令Vd,使編隊各成員趨于理想位置的同時,速度與領彈趨于一致?;谝恢滦岳碚?所設計的從彈i制導控制算法式為
(7)
結合導彈自動駕駛儀等效式(3),可得從彈i閉環(huán)制導控制系統(tǒng)方程為
(8)
(9)
將導彈編隊作為整體考慮,應用代數(shù)圖論知識,編隊閉環(huán)制導控制系統(tǒng)方程矩陣形式為
(10)
定理1導彈編隊各成員在控制算法式(7)的作用下,若參數(shù)γ的取值滿足下式,即
可保證式(10)所表示的編隊閉環(huán)制導控制系統(tǒng)方程的收斂,即各枚導彈趨于理想位置的同時,速度趨于一致。
證明式(10)是齊次線性方程標準形式,其解
(11)
將矩陣Σ寫為Jordan型Σ=SJS-1,即
exp(Σt)=Sexp(Jt)S-1
(12)
矩陣Σ的特征方程為
det(λI2n-Σ)=det((λ2+τ-1λ+γ)In+(τ-1λ+γ)L)
(13)
負拉普拉斯矩陣-L的特征方程為
(14)
式中,μi是-L的第i個特征值,將式(13)重寫為
det(λI2n-Σ)=
(15)
比較式(14)和式(15),式(13)的根可求解為
λ2+τ-1(1-μi)λ+γ(1-μi)=0
(16)
則矩陣Σ的特征值為
(17)
根據(jù)普拉斯矩陣L的性質(zhì),有Re(μi)≤0,則Re(μi-1)<0。令ηi=μi-1,根據(jù)復數(shù)輻角縮放原理[10],當γ的取值滿足下式時,即
(18)
式(16)的所有根具有負實部,即Re(λ)<0,由式(11)和式(12)可得
(19)
即式(10)收斂,從而保證位置誤差和速度誤差趨于零,即
(20)
證畢
將導彈編隊控制算法的設計過程描述為最優(yōu)控制問題,在假設導彈自動駕駛儀為一階慣性環(huán)節(jié)的前提下,式(3)所描述的系統(tǒng)狀態(tài)方程標準形式為
(21)
式中,X=V;A=-τ-1;U=Vd;B=τ-1。在控制算法式(7)的作用下,閉環(huán)編隊制導控制系統(tǒng)方程形如式(10),其收斂性得到了證明。然而,式(7)僅給出了控制算法的結構,其中還包含待定系數(shù)γ,式(18)給出了保證算法收斂時,γ的取值范圍。本節(jié)對待定系數(shù)γ進一步優(yōu)化,使之在某一指標泛函下達到最優(yōu)。
基于導彈編隊過程中各成員位置和速度的累計誤差,所建立的指標泛函為
(22)
結合式(10)和式(11)可得
(23)
由此,將指標泛函J轉(zhuǎn)換為參數(shù)方程J(γ),在式(18)的約束下,待定系數(shù)γ的最優(yōu)值可由下式得出[14],即
(24)
(25)
在上述假設條件下,式(10)所表示的閉環(huán)系統(tǒng)方程簡化式為
(26)
式(26)為二階微分方程形式,為了保證閉環(huán)系統(tǒng)的穩(wěn)定性,消除非周期性規(guī)律變化的起始誤差,待定系數(shù)γ應滿足
(27)
式(26)的解為
(28)
式中
將式(28)代入式(25),可得參數(shù)化指標函數(shù)為
(29)
由于K1<0和K2<0,僅考慮穩(wěn)態(tài)過程,則
(30)
進而待定系數(shù)γ的最優(yōu)值可由式(24)得出。
結構優(yōu)化和參數(shù)優(yōu)化是解決最優(yōu)控制問題的基本過程,在式(7)給出控制算法結構的基礎上,通過上述方法即可實現(xiàn)對控制算法的參數(shù)優(yōu)化,從而進一步提高了導彈編隊系統(tǒng)的性能。
下面仿真驗證控制算法式(7)的有效性。仿真條件如下:
條件1假設領彈裝備有合成孔徑雷達導引頭(synthetic aperture radar seeker, SARS),受成像分辨率和脫靶量約束,其制導律算法[13]為
(31)
式中,jh和jv分別為領彈水平面控制量和垂直面控制量;V和R分別為彈目相對速度和相對距離;φ和ω分別為導彈前置角和目標線角速度;β為彈目高低角;q11/k1和q22/k1均為權值系數(shù),其他與SARS相關的仿真參數(shù)詳見文獻[13]。領彈的初始位置坐標為(0, 5 km,0),初始速度為(500 m/s, 0, 200 m/s);目標位置坐標為(40 km, 5 km, 40 km)。
條件2從彈1的初始位置坐標為(2 km, 7 km, 0),初始速度為(800 m/s, 0, 300 m/s);從彈2的初始位置坐標為(0, 3 km, 2 km),初始速度為(700 m/s, 0, 200 m/s)。
≤εξ
條件4設導彈自動駕駛儀慣性環(huán)節(jié)時間常數(shù)τ=0.3 s,經(jīng)參數(shù)優(yōu)化取γ=9。
在式(7)作用下,導彈編隊運動軌跡如圖3所示。
圖3 三維空間導彈軌跡Fig.3 Missiles trajectory in 3D space
如圖3可知,由于算法式中一致性項的作用,可實現(xiàn)編隊隊形的快速收斂,仿真t=48 s時收斂至預期的隊形,仿真時間48~97 s,算法實現(xiàn)了對預期隊形的保持。
圖4給出了從彈1和從彈2與預期位置的相對誤差隨制導時間的變化規(guī)律。
圖4 從彈相對位置誤差Fig.4 Followers relative position error
在式(7)的作用下,隨著制導時間的增加,從彈1及從彈2的相對位置誤差趨于零。圖5給出了從彈1與領彈相對速度的變化情況。
圖5 從彈與領彈相對速度Fig.5 Relative velocity between leader and follower
由圖5可知,在控制算法的作用下,導彈編隊可實現(xiàn)位置和速度收斂。圖6給出了地理坐標系下從彈1加速度矢量隨制導時間的變化規(guī)律。
圖6 從彈1加速度Fig.6 Follower1 acceleration
各軸向加速度分量在制導初始階段較大,隨著編隊隊形的逐步收斂而不斷減小。
圖7給出了編隊控制過程中,在以從彈1質(zhì)心為坐標原點建立的彈道坐標系下,從彈1所需的控制力矢量隨制導時間的變化規(guī)律,與空氣阻力X相關的參數(shù)為:空氣密度ρ=1.2 kg/m3導彈的質(zhì)量為m=200 kg;阻力系數(shù)c=0.1;導彈的特征面積為S=0.15 m2。
圖7 從彈1需用控制力Fig.7 Follower1 required control force
由圖7可知,從彈1各軸向控制力分量隨制導時間的增加不斷減小,結合某型導彈裝備實際,令導彈極限過載nmax=38g,所需控制力分量均在限定范圍之內(nèi)。
圖8給出了在未經(jīng)參數(shù)優(yōu)化情況下,從彈位置誤差的變化規(guī)律,令γ=7,仿真t=88 s時生成了既定的編隊隊形,88~97 s為隊形保持階段。
圖8 未參數(shù)優(yōu)化的位置誤差Fig.8 Position errors without parameter optimization
對比參數(shù)優(yōu)化情況(見圖4),隊形收斂時間增加,位置和速度累計誤差增大。
為了進一步說明本文算法的創(chuàng)新性,下面對文獻[9]所提出的編隊控制算法進行仿真,算法[9]式為
ζi
(32)
式中,ξi和ζi分別表示導彈編隊成員i的位置和速度;ξ*和ζ*分別表示理想位置和理想速度;β和γ均為算法系數(shù),設定β=1和γ=1。導彈編隊由3枚導彈組成,編隊拓撲網(wǎng)絡中含有一棵以領彈為根節(jié)點的有向生成樹,其領彈的運動狀態(tài)不受從彈影響,領彈和從彈的初始位置和初始速度如前所述;設定理想位置ξ*=ξl以及理想速度ζ*=ζl,ξl和ζl分別表示領彈位置和領彈速度。各枚導彈在三維空間的運動軌跡如圖9所示。
圖9 應用算法式(32)的編隊軌跡Fig.9 Formation trajectory based on equation (32)
由圖9可知,在式(32)的作用下,3枚導彈的位置收斂且速度趨于一致。然而,由于式(32)中不能設定導彈各成員間的相對位置關系參數(shù),相比本文提出的控制算法,不能實現(xiàn)既定位置關系的生成和保持,僅能使編隊各成員的位置收斂至同一平衡點;再者,式(32)在設計過程中未涉及自動駕駛儀動態(tài)特性和參數(shù)優(yōu)化過程,實際應用過程中,閉環(huán)制導控制系統(tǒng)不能保證漸進穩(wěn)定性和優(yōu)性。綜合上述分析,本文提出的導彈編隊控制算法相比文獻[9],更加適用于導彈編隊隊形控制過程。
基于多智能體一致性理論,設計適用于領從結構導彈編隊控制過程的制導律算法,研究總結如下:①將導彈自動駕駛儀簡化為一階慣性環(huán)節(jié),基于坐標變換,得到了導彈控制力與制導指令之間的關系模型;②建立了基于一致性理論的導彈編隊控制算法,實現(xiàn)編隊成員趨于理想位置的同時,速度趨于一致,適用于編隊隊形的生成與保持;③提出了參數(shù)優(yōu)化方法,實現(xiàn)待定系數(shù)的取值在某一指標泛函下達到最優(yōu)。該算法對于導彈編隊系統(tǒng)的總體設計具有一定的理論參考價值。