鄧偉偉,段朝陽,閆 亮
(中國空空導彈研究院,洛陽 471009)
隨著武器技術的進步和裝備的發(fā)展,現(xiàn)代戰(zhàn)爭中以第四代戰(zhàn)斗機及高超聲速巡航導彈為代表的高空、高速、高機動目標不斷涌現(xiàn),對導彈的敏捷轉(zhuǎn)彎能力和末端精確打擊能力提出了更高的要求,導彈面臨嚴峻挑戰(zhàn)。為了彌補傳統(tǒng)氣動舵控制的不足,采用直/氣復合控制來提高導彈的響應特性,實現(xiàn)對目標的精確打擊。
針對導彈直/氣復合控制問題,國內(nèi)外學者已經(jīng)開展了大量研究工作[1-4],導彈直/氣復合控制系統(tǒng)是一個非線性、時變、多變量復雜控制系統(tǒng),難以建立精確的數(shù)學模型,基于經(jīng)典與現(xiàn)代控制理論設計的導彈直/氣復合控制系統(tǒng)依賴精確的數(shù)學模型,缺乏自學習和自適應能力。近年來,人工智能成為研究熱點,未來是智能化戰(zhàn)爭時代,各國為占領智能化軍事領域制高點,都在加快研究智能武器裝備[5],導彈直/氣復合控制系統(tǒng)智能控制也得到了相應的研究。神經(jīng)網(wǎng)絡[6]、模糊控制[7-8]和遺傳算法[9]結(jié)合了定性決策和定量控制,將人的經(jīng)驗與思維加入到導彈直/氣復合控制系統(tǒng)中,設計過程不依賴精確的數(shù)學模型,但是各類智能控制存在著不可避免的缺點。模糊控制表達人腦的推理能力,設計相當依賴專家或操作人員的經(jīng)驗與知識,若缺乏這樣的經(jīng)驗,很難獲得滿意的控制效果。神經(jīng)網(wǎng)絡模擬人腦的組織結(jié)構,具有自學習能力,但實際類似于一個黑箱,缺少透明度,可解釋性較差,不能很好地表達人腦的推理功能。自適應神經(jīng)模糊推理系統(tǒng)(Adaptive Neural-based Fuzzy Inference System,ANFIS)將二者有機地結(jié)合起來,通過神經(jīng)網(wǎng)絡建立具有自學習能力的模糊控制系統(tǒng),利用神經(jīng)網(wǎng)絡的學習機制補償模糊控制系統(tǒng)原有的缺點,能夠得出比較科學合理的參數(shù),從而提高整個系統(tǒng)對知識的學習和表達能力。
本文以末制導段空空導彈為研究對象,建立俯仰通道數(shù)學模型,設計2輸入2輸出的模糊控制器。采用自適應神經(jīng)模糊推理系統(tǒng),通過樣本數(shù)據(jù)學習,優(yōu)化常規(guī)模糊控制。直接力裝置數(shù)學模型首先采用線性化模型進行設計,之后通過脈沖調(diào)寬調(diào)頻(Pulse Width Pulse Frequency,PWPF)調(diào)制器對線性化設計得到的直接力控制量進行調(diào)制,得到離散的開關指令。仿真結(jié)果表明,基于ANFIS的導彈直/氣復合控制系統(tǒng)能夠快速精確地跟蹤導彈加速度指令,提高系統(tǒng)的控制品質(zhì)。
空空導彈直/氣復合控制采用姿控式,直接力裝置位于質(zhì)心后,結(jié)構如圖1所示。
導彈俯仰通道上小擾動線性化動力學方程[10]為
(1)
俯仰通道狀態(tài)空間模型為
(2)
其中
氣動舵數(shù)學模型描述為如下二階系統(tǒng)
(3)
直接力裝置數(shù)學模型描述為如下一階系統(tǒng)
(4)
模糊控制是一種簡單地將某一空間的輸入映射到另一空間的輸出的規(guī)則[11]。模糊控制的人機對話能力強,方便將人的思考邏輯加入控制過程。模糊控制分為模糊化、模糊推理和解模糊3個過程,3個過程的完成基于知識庫。
知識庫包含了應用知識以及控制目標,由數(shù)據(jù)庫和規(guī)則庫構成。數(shù)據(jù)庫包括隸屬函數(shù)和尺度變化因子等,規(guī)則庫包括模糊語言構成的一系列控制規(guī)則。模糊化是將輸入指令的清晰量轉(zhuǎn)化為模糊量,以便于模糊推理。模糊推理是模糊控制的核心,基于模糊概念模擬人的推理能力,一般基于控制工程知識、操作人員實際操作過程等來模仿人的決策行為,通過相應的模糊控制規(guī)則,得到控制指令的模糊量。解模糊是將模糊推理得到的控制指令的模糊量轉(zhuǎn)化為實際控制的清晰量。模糊控制器結(jié)構如圖2所示。
圖2 模糊控制器結(jié)構
自適應神經(jīng)模糊推理系統(tǒng)利用神經(jīng)網(wǎng)絡的學習能力,通過對樣本數(shù)據(jù)的學習實現(xiàn)模糊控制的模糊化、模糊推理和解模糊3個過程,優(yōu)化模糊控制的知識庫,建立具有自學習、自適應能力的模糊控制系統(tǒng)[12]。以2輸入(x1,x2)和1輸出(y)的系統(tǒng)為例,模糊if-then規(guī)則如下:
規(guī)則1:ifx1isA1andx2isB1thenf1=p1x1+q1x2+r1
規(guī)則2:ifx1isA2andx2isB2thenf2=p2x1+q2x2+r2
自適應神經(jīng)模糊推理系統(tǒng)可以認為是T-S型模糊控制的神經(jīng)網(wǎng)絡實現(xiàn),該網(wǎng)絡是一個多層前饋網(wǎng)絡,結(jié)構如圖3所示。
圖3 自適應神經(jīng)模糊推理系統(tǒng)結(jié)構
第一層:輸入變量模糊化,該層參數(shù)可變,每個節(jié)點是以節(jié)點函數(shù)表示的方形節(jié)點
O1,i=μAi(x1),i=1,2;O1,i=μB(i-2)(x2),i=3,4
(5)
其中,x1(或x2)為節(jié)點的輸入;O1,i為模糊集Ai(或Bi-2)的隸屬函數(shù),隸屬函數(shù)的參數(shù)集為前提參數(shù)。
第二層:模糊集運算,輸入信號相乘,而將其乘積輸出為
O2,i=ωi=μAi(x1)μBi(x2),i=1,2
(6)
第三層:計算每條規(guī)則ωi與全部規(guī)則ω之和的比值為
(7)
第四層:計算每條規(guī)則輸出為
(8)
其中,{pi,qi,ri},i=1,2為結(jié)論參數(shù)。
第五層:計算所有輸入信號的總輸出為
(9)
自適應神經(jīng)模糊推理系統(tǒng)根據(jù)樣本數(shù)據(jù)學習調(diào)整前提參數(shù)和結(jié)論參數(shù),對于集上任意函數(shù)有無限的逼近能力,為復雜系統(tǒng)的控制提供了有效的工具。
PWPF調(diào)制器由一階慣性環(huán)節(jié)、施密特觸發(fā)器以及反饋回路組成,如圖4所示。
圖4 PWPF調(diào)制器
其中,Km為一階慣性環(huán)節(jié)放大系數(shù),Tm為一階慣性環(huán)節(jié)時間常數(shù);Uon和Uoff為施密特觸發(fā)器的開關閾值,Um為施密特觸發(fā)器的脈沖幅值。脈沖調(diào)制基于沖量等價原理,采用PWPF調(diào)制器可以將連續(xù)推力轉(zhuǎn)化為等效的常值脈沖推力。
結(jié)合純氣動舵控制采用的經(jīng)典Raytheon三回路結(jié)構[13],針對導彈直/氣復合控制數(shù)學模型,直接力控制回路與氣動舵控制回路并行工作,建立導彈直/氣復合模糊控制系統(tǒng),如圖5所示。
圖5 導彈直/氣復合模糊控制系統(tǒng)
加速度誤差信號ea和角速度誤差信號eω為模糊控制器的輸入;氣動舵控制信號δz和直接力控制信號δR為模糊控制器的輸出;彈體加速度ay和俯仰角速度ωz為反饋信號。
自適應神經(jīng)模糊推理系統(tǒng)的輸入為加速度誤差與角速度誤差,輸出為直接力控制與氣動舵控制。采用離線學習模式,通過線性二次型調(diào)節(jié)器(Linear Quadratic Regulator, LQR)采集樣本數(shù)據(jù),分為訓練、測試、檢核3個部分,對于裝入系統(tǒng)的樣本數(shù)據(jù)通過網(wǎng)格分割法,按照設定參數(shù),依據(jù)模糊C-均值聚類方法建立模糊推理系統(tǒng)。依據(jù)模糊控制的設計經(jīng)驗,設置模糊子集個數(shù)為7,選取三角形隸屬函數(shù),輸出為線性函數(shù)。利用混合最小二乘估計的反向傳播算法,確定自適應神經(jīng)模糊推理系統(tǒng)的前提參數(shù)和結(jié)論參數(shù),確定與輸入輸出樣本數(shù)據(jù)相匹配的模糊控制知識庫,建立具有自適應能力的模糊推理系統(tǒng)。
選取導彈在高度12km,馬赫數(shù)3.0的特征點進行設計,其狀態(tài)方程矩陣為
執(zhí)行機構參數(shù)ωδ=120,ξ=0.7,τ=0.02;穩(wěn)態(tài)傳遞增益Kωss=0.00113;PWPF調(diào)制器參數(shù)選取為Km=5,Tm=0.1。
圖6~圖10所示為加速度10m/s2的仿真結(jié)果。可以看出,常規(guī)模糊控制相對于LQR超調(diào)量更小,控制用量更優(yōu),控制品質(zhì)更高。當加速度指令變化時,基于經(jīng)驗設計的常規(guī)模糊控制的知識庫需要更新,經(jīng)驗不足時一般采用試湊法完成知識庫更新,設計過程復雜。圖11~圖14所示為加速度100m/s2的仿真結(jié)果??梢钥闯?,自適應神經(jīng)模糊推理系統(tǒng)控制品質(zhì)優(yōu)于常規(guī)模糊控制,常規(guī)模糊控制設計由于經(jīng)驗不足,加速度指令跟蹤存在一定的穩(wěn)態(tài)誤差與振蕩。圖15~圖17所示為直接力裝置采用PWPF調(diào)制器,驗證導彈直/氣復合控制系統(tǒng)的離散特性。加速度響應曲線上升段的波動是由于直接力裝置點火產(chǎn)生的瞬時推力造成的正常現(xiàn)象。仿真結(jié)果表明,基于ANFIS的導彈直/氣復合控制系統(tǒng)能夠快速精確地跟蹤導彈加速度指令。
圖6 加速度指令10m/s2時加速度響應
圖7 加速度指令10m/s2時俯仰角速度響應
圖8 加速度指令10m/s2時氣動舵偏用量
圖9 加速度指令10m/s2時直接力用量
圖10 直接力用量局部放大
圖11 加速度指令100m/s2時加速度響應
圖12 加速度指令100m/s2時俯仰角速度響應
圖13 加速度指令100m/s2時氣動舵偏用量
圖14 加速度指令100m/s2時直接力用量
圖15 采用PWPF調(diào)制器的加速度響應
圖16 采用PWPF調(diào)制器的直接力裝置開關指令
圖17 直接力裝置開關指令局部放大
本文針對空空導彈直/氣復合控制問題,基于ANFIS設計了導彈直/氣復合控制系統(tǒng)。常規(guī)模糊控制設計基于經(jīng)驗,不依賴精確的數(shù)學模型,但是當系統(tǒng)工作狀態(tài)變化時,知識庫相應地需要更新,設計過程復雜,經(jīng)驗不足時難以保證控制品質(zhì)。本文通過引入神經(jīng)網(wǎng)絡,建立了自適應神經(jīng)模糊推理系統(tǒng),通過樣本數(shù)據(jù)學習建立了模糊控制知識庫,優(yōu)化了常規(guī)模糊控制。采用PWPF調(diào)制器對線性化設計得到的直接力控制量進行調(diào)制,得到離散的開關指令,驗證了導彈直/氣復合控制系統(tǒng)的離散特性。仿真結(jié)果表明,常規(guī)模糊控制的控制品質(zhì)優(yōu)于LQR,系統(tǒng)狀態(tài)發(fā)生變化時,基于ANFIS的導彈直/氣復合控制系統(tǒng)可以實現(xiàn)加速度指令的快速精確跟蹤,改善了空空導彈的響應特性。