吉 蕊, 佃松宜, 蘇 敏
(四川大學(xué)電氣信息學(xué)院,成都 610065)
建立被控系統(tǒng)的模型是現(xiàn)代控制理論的基礎(chǔ),隨著受控對(duì)象越來越復(fù)雜,建立其精確的模型非常困難,即使建立了系統(tǒng)模型,模型往往也經(jīng)過諸多簡化,基于此建立的控制器,在實(shí)際應(yīng)用中常會(huì)出現(xiàn)問題,而且,模型越復(fù)雜,控制器的設(shè)計(jì)就越復(fù)雜,實(shí)現(xiàn)越困難[1-2]。文獻(xiàn)[1-2]提出的無模型自適應(yīng)控制(Model-Free Adaptive Control,MFAC)是一種基于數(shù)據(jù)驅(qū)動(dòng)的先進(jìn)智能控制方法,它在被控系統(tǒng)附近用一系列動(dòng)態(tài)線性時(shí)變模型來代替一般非線性系統(tǒng),不需要被控對(duì)象的任何知識(shí),僅基于被控系統(tǒng)產(chǎn)生的輸入輸出信息設(shè)計(jì)控制器,與模型、結(jié)構(gòu)、系統(tǒng)階數(shù)無關(guān),且能實(shí)現(xiàn)系統(tǒng)的自適應(yīng)控制,并確保其閉環(huán)穩(wěn)定,從本質(zhì)上消除了未建模動(dòng)態(tài)對(duì)系統(tǒng)的影響[3-5]。無模型自適應(yīng)控制算法具有廣泛的適用性,計(jì)算量小,魯棒性強(qiáng),很好地處理了非線性時(shí)變系統(tǒng)在實(shí)際應(yīng)用中的各類控制問題,在工程應(yīng)用中有廣闊的前景,且已經(jīng)在自動(dòng)泊車、電力電網(wǎng)、化工、風(fēng)力發(fā)電等領(lǐng)域取得了良好的控制效果[6-9]。
近年來,國內(nèi)外許多研究學(xué)者對(duì)無模型控制算法進(jìn)行了改進(jìn),文獻(xiàn)[8]提出了一種新的偽偏導(dǎo)數(shù)(Pseudo-Partial Derivative,PPD)參數(shù)估計(jì)方法;文獻(xiàn)[10]考慮到被控系統(tǒng)內(nèi)部的信息未被充分利用的問題,提出一種無模型動(dòng)態(tài)矩陣算法,將動(dòng)態(tài)矩陣控制算法的預(yù)測模型與偽梯度向量結(jié)合,得到系統(tǒng)的動(dòng)態(tài)模型,進(jìn)而推導(dǎo)出控制律;文獻(xiàn)[11]針對(duì)無模型自適應(yīng)算法的干擾作用問題,分析了可測擾動(dòng)對(duì)性能的影響,提出了一種帶有濾波作用的改進(jìn)方法并進(jìn)行了魯棒性證明,有效解決了對(duì)可測擾動(dòng)的抑制問題;文獻(xiàn)[12]考慮執(zhí)行器輸入受限時(shí)的情況,對(duì)系統(tǒng)輸入準(zhǔn)則函數(shù)引入了約束條件,用Hildreth方法求解數(shù)值,解決了執(zhí)行器的執(zhí)行能力存在上限的問題。在以上研究中,在控制律和偽偏導(dǎo)數(shù)估計(jì)算法中都采用了試湊法或固定常數(shù)法選取懲罰因子。在無模型自適應(yīng)算法中,懲罰因子一般選取為大于零的常數(shù),其值對(duì)控制系統(tǒng)收斂速度、超調(diào)量以及整體系統(tǒng)的自適應(yīng)性能等影響都很大。
為使收斂速度更快、超調(diào)量更小、自適應(yīng)控制性能更優(yōu),本文提出了一種可分別對(duì)控制律和偽偏導(dǎo)數(shù)估計(jì)算法中的懲罰因子自適應(yīng)尋優(yōu)的改進(jìn)算法,并對(duì)其穩(wěn)定性進(jìn)行證明,進(jìn)一步地,通過對(duì)非線性系統(tǒng)的仿真驗(yàn)證表明了該算法對(duì)收斂速度的提升作用和對(duì)抗擾性的增強(qiáng)作用。
考慮如下的SISO離散非線性系統(tǒng)
y(k+1)=f(y(k),…,y(k-ny),u(k),…,u(k-nu))
(1)
式中:y(k)∈R,u(k)∈R分別表示系統(tǒng)在k時(shí)刻的輸出和輸入;f()∶Rnu+ny+2∈R為未知的非線性函數(shù);nu,ny為未知的正整數(shù)。
為了得到系統(tǒng)的控制方案,對(duì)系統(tǒng)(1)作如下的假設(shè)。
假設(shè)1函數(shù)f()關(guān)于系統(tǒng)的控制輸入u(k)的偏導(dǎo)數(shù)是連續(xù)的。
假設(shè)2系統(tǒng)式(1)滿足廣義Lipschitz條件,即對(duì)任意的時(shí)刻k1≠k2,k1,k2≥0時(shí),當(dāng)u(k1)≠u(k2)有
|Δy(k+1)|≤b|Δu(k)|
(2)
式中:Δy(k+1)=y(k+1)-y(k);b>0是一個(gè)常數(shù);Δu(k)=u(k)-u(k-1)。
引理1[1-3]若非線性系統(tǒng)式(1)滿足假設(shè)1、假設(shè)2,則當(dāng)Δu(k)≠0時(shí),一定存在一個(gè)稱為PPD(Pseudo-Partial Derivative)的偽偏導(dǎo)數(shù)φ(k),使得非線性系統(tǒng)的泛模型成立,即
y(k+1)=y(k)+φ(k)Δu(k)
(3)
式中,|φ(k)|≤b。
考慮如下的準(zhǔn)則函數(shù)
J(u(k))=(y*(k+1)-y(k+1))2+
λ(u(k)-u(k-1))2
(4)
式中:y*(k+1)為系統(tǒng)期望跟蹤信號(hào);λ為懲罰因子。
將式(3)泛模型代入準(zhǔn)則函數(shù)式(4)中,并對(duì)u(k)求導(dǎo),可得控制律算式為
(5)
式中:ρ為運(yùn)算步長;φ(k)是未知的,需要對(duì)其進(jìn)行在線辨識(shí)。
對(duì)偽偏導(dǎo)數(shù)進(jìn)行估計(jì),采用投影估計(jì)算法,從消除穩(wěn)態(tài)偏差和保證系統(tǒng)穩(wěn)定的角度出發(fā),采用與控制策略成對(duì)稱相似結(jié)構(gòu)的控制輸入目標(biāo)函數(shù)
(6)
(7)
式中,η∈(0,1],為步長序列。
(8)
懲罰因子主要有2個(gè)作用:1) 對(duì)控制輸入量和偽偏導(dǎo)數(shù)輸入量的變化加以限制,影響系統(tǒng)響應(yīng)的速度和超調(diào)量,同時(shí)減少系統(tǒng)穩(wěn)態(tài)誤差,保證控制輸入信號(hào)的平滑性;2) 防止出現(xiàn)式(5)、式(7)中分母為零的奇異狀況。選取合適的λ,μ值可以保證系統(tǒng)的穩(wěn)定性,且在閉環(huán)系統(tǒng)響應(yīng)速度和超調(diào)量之間得到最佳的平衡值,現(xiàn)有的方法對(duì)λ和μ的選取主要依靠經(jīng)驗(yàn),沒有一種自動(dòng)整定到最優(yōu)的方法。本文中,對(duì)懲罰因子提出一種在線迭代自適應(yīng)的改進(jìn)方法,利用最優(yōu)化中的最速下降法的思想,迭代尋找能使控制律和偽偏導(dǎo)數(shù)達(dá)到最優(yōu)的懲罰因子值。
對(duì)式(5)中的懲罰因子作如下離散迭代的改進(jìn)
λ(k+1)=λ(k)-α1▽J(u(k))
(9)
式中,α1為學(xué)習(xí)速率。
為使控制率達(dá)到最優(yōu),其對(duì)控制律的梯度為
(10)
將式(9)改寫為
λ(k+1)=λ(k)-α1A1B1
(11)
式中:
A1=2((φ(k)2+λ(k))Δu(k)-
(y*(k+1)-y(k))φ(k));
(12)
(13)
對(duì)式(7)中的懲罰因子作如下離散迭代的改進(jìn)
μ(k+1)=μ(k)-α2▽J(u(k))
(14)
式中,α2為學(xué)習(xí)速率。
同樣,此改進(jìn)的目的是獲得控制器的最優(yōu)解,其梯度為
(15)
將式(15)改寫為
μ(k+1)=μ(k)-α2A2B2C2
(16)
式中:
A2=2((φ(k)2+λ(k))Δu(k)-
(y*(k+1)-y(k))φ(k));
(17)
(18)
(19)
由此得到偽偏導(dǎo)數(shù)估計(jì)算式為
(20)
進(jìn)而,得到控制律
(21)
為了對(duì)改進(jìn)算法的閉環(huán)穩(wěn)定性進(jìn)行分析,做如下假設(shè)。
假設(shè)3對(duì)某個(gè)給定的有界期望輸出信號(hào)y*(k+1),總存在一個(gè)有界的u*(k),使系統(tǒng)輸入該信號(hào)時(shí),輸出等于y*(k+1)。
假設(shè)4對(duì)任意時(shí)刻k及Δu(k)≠0,系統(tǒng)偽偏導(dǎo)數(shù)的符號(hào)保持不變,即滿足φ(k)>b1>0或φ(k)<-b1,其中,b1是一個(gè)小正數(shù)。
定理1對(duì)于非線性系統(tǒng)式(7),在滿足假設(shè)1~4的情形下,當(dāng)y*(k+1)=const時(shí),使用式(21)、式(22)、式(30),總存在一個(gè)常數(shù)λmin>0,使得當(dāng)λ>λmin時(shí)有:1) 系統(tǒng)輸出跟蹤誤差單調(diào)有界收斂;2) 閉環(huán)系統(tǒng)BIBO (Bounded Input Bounded Output)穩(wěn)定,即輸出序列{y(k)}和輸入序列{u(k)}是有界的。
證明:
(22)
將Δy(k)=φ(k-1)Δu(k-1)代入式(22)中,并在兩邊取絕對(duì)值,則
。
(23)
因?yàn)棣?k)>0且η∈(0,1),所以
ηΔu2(k-1)<Δu2(k-1)<μ(k)+Δu2(k-1)
(24)
(25)
因而
(26)
記 1-δ=d1,2b=c,則
(27)
Step 2 證明e(k)有界。
定義系統(tǒng)跟蹤誤差為
e(k+1)=y*(k+1)-y(k+1)
(28)
將式(3)、式(21)代入式(28)中,兩邊取絕對(duì)值,可得
(29)
同理可知0<λ(k) (30) 又根據(jù)式(30),0<ρ≤1和λ>λmin,則一定存在一個(gè)常數(shù)d2<1,使得 (31) 結(jié)合式(29)、式(31),有 (32) 故e(k)有界收斂。定理1的第1)點(diǎn)得證。 Step 3 證明y(k),u(k)有界。 (33) (34) 證得輸入序列{u(k)}有界。定理1的第2)點(diǎn)得證。 考慮如下非線性系統(tǒng) (35) 期望輸出信號(hào)為 (36) 擾動(dòng)信號(hào)為 a(k)=1+round(k/200) (37) b(k)=1+round(k/500) (38) d(k)=0.2。 (39) 將常規(guī)的無模型自適應(yīng)算法(MFAC)和改進(jìn)的無模型自適應(yīng)算法(IMFAC)分別應(yīng)用其中,利用Matlab進(jìn)行仿真比對(duì)并分析。 圖1 輸出曲線比對(duì)圖Fig.1 Comparison of output curves 為了對(duì)比兩種算法的總體控制性能,分別計(jì)算其性能評(píng)價(jià)指標(biāo)時(shí)間絕對(duì)誤差積分(ITAE),計(jì)算式為 (40) 圖2 輸入曲線比對(duì)圖Fig.2 Comparison of input curves 圖3 誤差曲線比對(duì)圖Fig.3 Comparison of error curves 2種算法性能指標(biāo)比較如表1所示。 表1 2種算法性能指標(biāo)比較 由圖1可以明顯地看出,IMFAC方法在跟蹤參考信號(hào)時(shí)具有更快的收斂速度,但超調(diào)量有所增加,同時(shí),在受到干擾情況下,IMFAC方法能更快地達(dá)到穩(wěn)定。由圖3和表1可見,IMFAC方法相比MFAC方法,誤差明顯減小,性能指標(biāo)明顯增大,綜合而言,IMFAC方法具有更優(yōu)的控制性能。 本文提出了一種改進(jìn)的無模型自適應(yīng)控制算法,通過對(duì)其控制律與偽偏導(dǎo)數(shù)估計(jì)式中的懲罰因子進(jìn)行迭代優(yōu)化控制,簡化了原有方法中對(duì)懲罰因子試湊尋優(yōu)的過程,提高了參數(shù)尋優(yōu)能力,對(duì)其閉環(huán)穩(wěn)定性進(jìn)行了嚴(yán)格的證明,并對(duì)改進(jìn)前后的算法進(jìn)行了比對(duì)。仿真結(jié)果表明,改進(jìn)后的方法收斂速度更快,抗擾性更強(qiáng),控制性能更優(yōu),有效提高了系統(tǒng)的控制效果。另一方面,在線的求解增加運(yùn)算的復(fù)雜度,而如何降低復(fù)雜度,減少運(yùn)算量,改變其為離線求解,或離線和在線共同求解,或加入新的算法進(jìn)行改進(jìn),將是下一步的研究重點(diǎn)。 參 考 文 獻(xiàn) [1] 侯忠生.非線性系統(tǒng)參數(shù)辨識(shí)、自適應(yīng)控制和無模型學(xué)習(xí)自適應(yīng)控制[D].沈陽:東北大學(xué),1994. [2] 侯忠生,金尚泰.無模型自適應(yīng)控制:理論與應(yīng)用 [M].北京:科學(xué)出版社,2013. [3] 侯忠生.無模型自適應(yīng)控制的現(xiàn)狀與展望[J].控制理論與應(yīng)用,2006,23(4):586-592. [4] HOU Z S,JIN S T.Model free adaptive control:theory and applications [J].Brain Research,2013,281(2):202-205. [5] ZHU Y M,HOU Z S.Controller dynamic linearisation-based model-free adaptive control framework for a class of non-linear system[J].IET Control Theory & Applications,2015,9(7):1162-1172. [6] 侯忠生,董航瑞,金尚泰.基于坐標(biāo)補(bǔ)償?shù)淖詣?dòng)泊車系統(tǒng)無模型自適應(yīng)控制[J].自動(dòng)化學(xué)報(bào),2015,41(4):823-831. [7] 趙藝,陸超,韓英鐸.多輸入多輸出無模型自適應(yīng)廣域阻尼控制器設(shè)計(jì)[J].清華大學(xué)學(xué)報(bào):自然科學(xué)版,2013(4):453-458. [8] XU D Z,JIANG B,SHI P.A novel model-free adaptive control design for multivariable industrial processes[J].IEEE Transactions on Industrial Electronics,2014,61(11):6391-6398. [9] 魯效平,李偉,林勇剛.基于無模型自適應(yīng)控制器的風(fēng)力發(fā)電機(jī)載荷控制[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2011,42(2):109-114,262. [10] 侯立剛,徐利軍,蘇成利,等.基于緊格式線性化的無模型動(dòng)態(tài)矩陣控制[J].控制工程,2013,20(2):246-249. [11] 卜旭輝,侯忠生,金尚泰.擾動(dòng)抑制無模型自適應(yīng)控制的魯棒性分析[J].控制理論與應(yīng)用,2011,28(3):358-362. [12] 程志強(qiáng),朱紀(jì)洪,袁夏明.考慮執(zhí)行器飽和的改進(jìn)無模型自適應(yīng)控制[J].自動(dòng)化學(xué)報(bào),2016,42(8):1158-1165. [13] 劉穎超,張紀(jì)元.梯度下降法[J].華東工學(xué)院學(xué)報(bào),1993(2):12-16.4 仿真研究
5 總結(jié)