張 民,應(yīng)巧萍(南京航空航天大學(xué)自動化學(xué)院,南京 210016)
基于約束粒子群優(yōu)化的導(dǎo)彈H∞-PID控制器設(shè)計*
張民,應(yīng)巧萍
(南京航空航天大學(xué)自動化學(xué)院,南京210016)
傳統(tǒng)導(dǎo)彈的PID控制律設(shè)計僅考慮了幅值裕度、相位裕度等指標(biāo),無法滿足多變量魯棒性指標(biāo)要求。文中提出了一種基于約束粒子群優(yōu)化的導(dǎo)彈控制器設(shè)計方法,該方法以H∞魯棒性指標(biāo)作為目標(biāo)函數(shù),自動優(yōu)化得到控制參數(shù)。同時,對現(xiàn)有的粒子群算法進行了改進,采用映射函數(shù)法將約束優(yōu)化問題轉(zhuǎn)化為非約束優(yōu)化問題。以樣例導(dǎo)彈為對象設(shè)計了H∞-PID控制器并與罰函數(shù)法進行了比較,結(jié)果表明文中算法各項性能優(yōu)于經(jīng)典罰函數(shù)法。
導(dǎo)彈;PID;控制;粒子群;優(yōu)化
隨著對新一代導(dǎo)彈性能要求的提高,如何提高導(dǎo)彈在極限狀態(tài)下的穩(wěn)定性成為突出的問題,因此控制器的魯棒性能正日益受到重視[1]。傳統(tǒng)導(dǎo)彈控制律設(shè)計仍然采用幅值裕度、相位裕度等魯棒性指標(biāo),而這些經(jīng)典指標(biāo)在導(dǎo)彈進入到某些極限狀態(tài)時對高度耦合系統(tǒng)魯棒性的反映是不足的[2]。目前迫切需要建立一種形式化的設(shè)計方法,采用基于現(xiàn)代魯棒控制理論的多變量指標(biāo)對控制器的魯棒性進行評價。導(dǎo)彈PID控制律總的設(shè)計流程是在一定的控制結(jié)構(gòu)上設(shè)計控制參數(shù)使得閉環(huán)系統(tǒng)滿足給定的指標(biāo)。這一設(shè)計流程可以看作一個優(yōu)化過程,通過該方法來設(shè)計導(dǎo)彈控制律是一條可行的思路。在各種優(yōu)化算法中,由James Kennedy和Russell Eberhart在1995年共同提出的粒子群優(yōu)化算法(PSO)[4]具有算法結(jié)構(gòu)簡單、全局優(yōu)化能力強等優(yōu)點,近年來得到越來越多的重視。粒子群優(yōu)化算法最初是作為一種非約束優(yōu)化算法被提出的,在工程實踐中有相當(dāng)多的應(yīng)用屬于要求滿足一定約束條件的優(yōu)化問題,為了使其能夠處理帶約束的優(yōu)化問題,相繼提出了各種改進算法[5-6]。文中采用了一種簡便的映射函數(shù)方法,將約束優(yōu)化問題轉(zhuǎn)化為非約束優(yōu)化問題,并將其應(yīng)用到樣例導(dǎo)彈的H∞-PID控制器的設(shè)計中。
標(biāo)準PID反饋控制系統(tǒng)結(jié)構(gòu)見圖1所示。
圖中:r(t)為參考輸入;u(t)為控制輸入信號;y(t)為模型輸出信號;d(t)為外部干擾信號;w(t)為傳感器噪聲。P(s)=N(s)/D(s)為線性時不變系統(tǒng)模型,N(s)、D(s)為滿足互質(zhì)的多項式,定義為:
且滿足n<m。
圖1 標(biāo)準PID控制結(jié)構(gòu)
K(s)為帶一階低通濾波的標(biāo)準PID控制器,定義為:
式中:kp為比例系數(shù);ti為積分時間;td/N為低通濾波器時間常數(shù),且kp、ti、td與N均為正實數(shù)。對由圖1定義的系統(tǒng),其開環(huán)傳遞函數(shù)為L(s)=P(s)K(s)。依據(jù)混合靈敏度H∞控制的定義[1],靈敏度函數(shù)和補靈敏度函數(shù)分別定義為:
魯棒性指標(biāo)可以表示為:
式中:WS(s)和WT(s)分別為靈敏度權(quán)函數(shù)和補靈敏度權(quán)函數(shù),這兩個函數(shù)由設(shè)計者依據(jù)對閉環(huán)系統(tǒng)魯棒穩(wěn)定性和魯棒性能的要求來分別確定。
1)閉環(huán)控制系統(tǒng)內(nèi)穩(wěn)定;
2)滿足式(3)、式(4)所示的魯棒性指標(biāo)。
由樣例導(dǎo)彈縱向短周期擾動運動方程組出發(fā),得到樣例導(dǎo)彈在5 km高度、50°攻角下的縱向線性狀態(tài)空間模型,其中狀態(tài)方程為:
輸出方程為:
式中:u、w分別為縱向和法向速度;α為攻角;q為俯仰角速率;az為法向加速度;δe為等效升降舵偏角。
以導(dǎo)彈縱向狀態(tài)模型為控制對象,導(dǎo)彈的PID控制器可以有各種形式,如姿態(tài)控制器、迎角控制器和過載控制器等,每種控制器依據(jù)控制對象本身的特性和控制需求還可以細分為更多的回路控制結(jié)構(gòu)。不失一般性,文中以經(jīng)典三回路駕駛儀縱向控制結(jié)構(gòu)為例,如圖2所示。
圖2 俯仰通道控制結(jié)構(gòu)
在圖2中,Az、Azm分別為法向過載輸出信號和法向過載給定信號。在俯仰通道中,3個回路分別為角速率阻尼回路、攻角增穩(wěn)回路和過載控制回路,并在過載回路中采用積分校正以消除靜差??刂坡傻谋磉_式為:
在導(dǎo)彈縱向H∞-PID控制器的設(shè)計過程中,就是要獲得控制參數(shù)ke1、ke2、ke3和ke4,使得導(dǎo)彈在實現(xiàn)控制穩(wěn)定的同時滿足式(3)和式(4)所示的魯棒性指標(biāo)。
3.1標(biāo)準PSO算法
PSO算法是一種基于群體進化的非線性優(yōu)化算法,它依據(jù)鳥群在一定區(qū)域內(nèi)搜索食物的原理,把每一個粒子作為一只鳥,使用多個粒子在搜索空間內(nèi)依據(jù)粒子的個體行為和群體行為自動尋找目標(biāo)函數(shù)f(x):?n→?的最優(yōu)解。粒子變量x∈?n,則搜索目標(biāo)可以表示為[4]:
式中:c1為粒子個體認知加速常數(shù),c2為群體認知加速常數(shù),參數(shù)c1和c2分別代表了個體自身行為和群體行為對個體影響的大小為[0,1]之間的隨機數(shù),代表了粒子的隨機行為代表了第i個粒子個體在當(dāng)前進化代數(shù)下的最優(yōu)值代表了整個粒子群體在當(dāng)前進化代數(shù)下的最優(yōu)值:i
ω為慣性系數(shù),代表了粒子的運動慣性,按照運動慣性隨進化代數(shù)逐漸減小的原則,其表達式為:
式中:wmax和wmin分別為w的最大值與最小值;kmax為最大進化代數(shù)。
標(biāo)準PSO算法包含如下執(zhí)行步驟:
步驟1在搜索空間內(nèi)隨機初始化每個粒子的位置并計算目標(biāo)函數(shù),分別確定
步驟3依據(jù)式(6)和式(7)調(diào)整粒子的位置和速度,確定當(dāng)前進化代數(shù)的,設(shè)置進化代數(shù)k=k+1。
在步驟2中,算法的停止條件可以是目標(biāo)函數(shù)f(x)達到期望的極值,也可以是達到預(yù)先設(shè)定的最大終止進化代數(shù)kmax。
3.2約束PSO算法
標(biāo)準PSO算法是一種非約束優(yōu)化算法,為了使其能解決實際存在的大量帶約束的優(yōu)化問題,近年有很多改進算法相繼被提出,常見的如罰函數(shù)法、增廣拉格朗日法(ALPSO)等[6-7]。文中采取了一種更為簡便的方法將標(biāo)準PSO算法改進為約束PSO算法。
帶多種約束條件的優(yōu)化問題可以表示為[8]:
考慮H∞-PID控制器的設(shè)計,依據(jù)式(3)、式(4)在文中取目標(biāo)函數(shù)為:
約束條件:
為了將上述約束優(yōu)化問題簡便的轉(zhuǎn)化為非約束優(yōu)化問題,在此建立目標(biāo)函數(shù)f(x)的映射函數(shù)fv(x):
由上式可見,fv(x)為負函數(shù)且滿足當(dāng)f(xi)<f(xj)時,總有fv(xi)<fv(xj)。
采用映射函數(shù)的非約束優(yōu)化問題則可以表示為:
在上述定義中,將fm(x)作為新的目標(biāo)函數(shù)。顯然,若約束條件不滿足,則fm(x)的值大于等于0;當(dāng)約束條件滿足時,fm(x)=fv(x)且為負;當(dāng)fm(x)取得最優(yōu)值時,原目標(biāo)函數(shù)f(x)也取得最優(yōu)值且滿足約束條件h(x)。
此種方法區(qū)別于其它方法的最大優(yōu)勢在于它在把非約束優(yōu)化問題轉(zhuǎn)化為約束優(yōu)化問題的過程中并未引入新的變量,簡單實用,也不要求目標(biāo)函數(shù)f(x)、約束條件函數(shù)h(x)滿足連續(xù)、可微、凸集等要求,是一種非常簡便易用的方法。
在本算例中,以前述樣例導(dǎo)彈數(shù)學(xué)模型、控制結(jié)構(gòu)為對象,采用約束粒子群優(yōu)化算法來自動獲得控制器參數(shù)。
為保證控制器各項參數(shù)均為正值,縮小搜索空間的范圍,式(5)所示的控制器可以改寫為如下形式:
因此,待搜尋參數(shù)的范圍Δf可以表示為:
在采用H∞混合靈敏度設(shè)計方法時,權(quán)函數(shù)的選擇也是重要問題之一。靈敏度函數(shù)S(s)的幅值與閉環(huán)系統(tǒng)的指令跟蹤和抗干擾能力直接相關(guān),而補靈敏度函數(shù)T(s)決定了系統(tǒng)的魯棒穩(wěn)定性。相應(yīng)的,權(quán)函數(shù)WS(s)和WT(s)應(yīng)分別反映對這兩個函數(shù)的形狀要求。由于命令信號和干擾信號的頻率較低,因此在低頻段,在保證閉環(huán)系統(tǒng)魯棒穩(wěn)定的前提下,S(s)幅值必須盡量小,即WS(s)的幅值應(yīng)盡量大,以使系統(tǒng)取得良好的命令跟蹤能力和抗干擾能力;而系統(tǒng)的測量噪聲一般隨頻率的增大而增大,因此要求在高頻段T(s)幅值較小,即WT(s)的幅值應(yīng)盡量大,以抑制測量噪聲的不利影響。綜合考慮上述因素,在本算例中靈敏度和補靈敏度權(quán)函數(shù)分別取為:
在樣例導(dǎo)彈的H∞-PID控制器的設(shè)計中,依據(jù)多輪仿真的經(jīng)驗,PSO算法的參數(shù)可以取為:
粒子數(shù)量:80;
粒子維數(shù):4;
粒子最大移動速度:Vmax,d=xmax,d/2;
學(xué)習(xí)因子:c1=2,c2=2;
慣性系數(shù)最大與最小值:Wmax=0.9,Wmin=0.4;
最大搜索代數(shù):400;
終止條件:達到最大代數(shù)。
采用如式(8)和式(9)的性能指標(biāo)函數(shù)和約束條件,最終獲得的控制參數(shù)如表1所示。
表1 控制參數(shù)值
法向過載響應(yīng)見圖5所示。
圖3 靈敏度函數(shù)
圖4 補靈敏度函數(shù)
圖5 法向過載響應(yīng)仿真結(jié)果
由圖5可見,樣例導(dǎo)彈具有良好的法向過載時域響應(yīng)特性。
為了對該約束粒子群算法的收斂特性進行進一步的分析,將該算法以隨機初值設(shè)計H∞-PID控制器的過程重復(fù)100遍,全局最優(yōu)值的收斂過程如圖6所示。
由圖6可見,該約束優(yōu)化算法在設(shè)計導(dǎo)彈H∞-PID控制器中表現(xiàn)出良好的收斂特性,在100次試驗中,絕大多數(shù)試驗全局收斂代數(shù)在250代以內(nèi)。與目前常見的罰函數(shù)法約束PSO算法[9]的比較結(jié)果如表2所示:
圖6 性能指標(biāo)函數(shù)收斂性曲線
表2 試驗結(jié)果統(tǒng)計與比較
由表2可見,文中的約束PSO算法性能各項指標(biāo)均優(yōu)于參考文獻[9]中的罰函數(shù)法約束PSO算法。
文中提出了一種基于約束粒子群優(yōu)化的導(dǎo)彈H∞-PID控制器設(shè)計方法,針對樣例導(dǎo)彈的仿真表明:第一,所設(shè)計的導(dǎo)彈PID控制器在不違反約束的條件下能夠滿足H∞魯棒性指標(biāo);第二,多次仿真的統(tǒng)計結(jié)果表明文中提出的設(shè)計方法優(yōu)于經(jīng)典的罰函數(shù)法約束PSO算法。文中僅針對樣例導(dǎo)彈的俯仰通道設(shè)計了控制器。在建立了H∞-PID控制器設(shè)計方法的基礎(chǔ)上,將其推廣到導(dǎo)彈的三通道聯(lián)合設(shè)計是下一步值得研究的工作。
[1]王嘉鑫,林德福,祁載康.戰(zhàn)術(shù)導(dǎo)彈三回路過載駕駛儀時域特性分析[J].兵工學(xué)報,2013,34(7):828 -834.
[2] 鄭建華,楊滌.魯棒控制理論在傾斜轉(zhuǎn)彎導(dǎo)彈中的應(yīng)用[M].北京:國防工業(yè)出版社,2001:12-14.
[3] 孔英秀,趙丁選,楊彬,等.基于PSO-DE和LMI的魯棒靜態(tài)輸出反饋控制[J].吉林大學(xué)學(xué)報(工學(xué)版),2013,43(5):1375-1380.
[4]KENNEDY J,EBERHART R.Particle swarm optimization [C]∥Proc IEEE International Conf.on Neural Networks. Perth,Australia:IEEE Piscataway,1995:1942-1948.
[5]MARUTA I,SUGIE T,KIM T-H.Identification of piecewise affine systems via distributed particle swarm optimization[C]∥The 18th IFAC World Congress,Milano,Italy,2011:7743-7748.
[6]JANSEN P W,PEREZ R E.Constrained structural design optimization via a parallel augmented Lagrangian particle swarm optimization approach[J].Computers&Structures,2011(89):1352-1366.
[7] SEDLACZEK K,EBERHARD P.Using augmented Lagrangian particle swarm optimization for constrained problems in engineering[J].Structural and Multidisciplinary Optimization,2006,32(4):277-286.
[8]HE Q,WANG L.A hybrid particle swarm optimization with a feasibility-based rule for constrained optimization[J]. Applied Mathematics and Computation,2007,86(1):1407-1422.
[9]PARSOPULOS K,VRAHATIS M.Particle swarm optimization method for constrained optimization problems[C]∥Proceedings of the Euro_International Symposiun on Computational Intelligence.Slovakia:ISO Press.,2002:214 -219.
H∞-PID Controller Design for Missile Autopilot Based on Constrained Particle Swarm Optimization
ZHANG Min,YING Qiaopin
(College of Automatic on Engineering,NUAA,Nanjing 210016,China)
Traditional design of missile’s PID control law only considers robust performances such as amplitude margin,phase margin and so on,which is unable to guarantee multivariate robustness index.In this paper,an easy-to-use method for controller design was presented based on constrained particle swarm optimization(PSO)algorithm.This method takes H∞r(nóng)obustness index as objective function and automatically obtains various parameters.The existing PSO algorithm has been improved by a mapping function,so a constrained optimization problem can be converted into an unconstrained one.Taking the sample missile as the plant,the H∞-PID controller was designed.Compared with penalty function algorithm,simulation results show that this method has better performance.
missile;PID;control;particle swarm;optimization
V448.12
A
10.15892/j.cnki.djzdxb.2016.01.001
2015-04-14
國家自然科學(xué)基金(61174197)資助
張民(1973-),男,江蘇南京人,副研究員,博士,研究方向:導(dǎo)航、制導(dǎo)與控制。