賴文馨,李元龍*,林宗利
(1.上海交通大學(xué)電子信息與電氣工程學(xué)院,系統(tǒng)控制與信息處理教育部重點實驗室,上海工業(yè)智能管控工程技術(shù)研究中心,上海200240;2.美國弗吉尼亞大學(xué)電機(jī)與計算機(jī)工程系,夏洛茨維爾22904-4743)
在實際工程系統(tǒng)中,由于物理結(jié)構(gòu)的限制以及安全運(yùn)行的要求,執(zhí)行器驅(qū)動輸出信號的幅值和變化速率都有界限,會引發(fā)執(zhí)行器飽和現(xiàn)象.例如,無人機(jī)舵面的偏轉(zhuǎn)角度和偏轉(zhuǎn)速率是有限的,汽車舵機(jī)系統(tǒng)中舵機(jī)的轉(zhuǎn)動功率及轉(zhuǎn)動速度也存在限制等.當(dāng)執(zhí)行器發(fā)生飽和時,被控對象接收到的驅(qū)動信號偏離控制信號,導(dǎo)致閉環(huán)控制系統(tǒng)性能下降,在極端狀況下甚至?xí)?dǎo)致系統(tǒng)不穩(wěn)定,造成嚴(yán)重后果.典型案例有1989年瑞典JAS-39“鷹獅”戰(zhàn)斗機(jī)墜毀,事故原因在于執(zhí)行器飽和引發(fā)的機(jī)體不穩(wěn)定振蕩[1].因此,自20世紀(jì)80年代開始,執(zhí)行器飽和問題得到人們廣泛關(guān)注,并逐漸成為控制系統(tǒng)中的一個熱點研究問題.
一般來講,處理執(zhí)行器飽和的方法可分為直接法和間接法.直接法的思路是,在控制器設(shè)計時考慮執(zhí)行器飽和,直接將飽和非線性的處理融入控制器設(shè)計中[2-12].間接法又可稱為抗飽和控制方法,其基本思想在于分離控制器設(shè)計和飽和處理過程,即先在不考慮執(zhí)行器飽和的情況下設(shè)計滿足性能要求的控制器,再設(shè)計補(bǔ)償器來盡可能消除執(zhí)行器飽和帶來的負(fù)面影響.這種階段式的設(shè)計方法思路清晰.抗飽和補(bǔ)償器一般在執(zhí)行器發(fā)生飽和時被激發(fā),以此來減弱執(zhí)行器飽和導(dǎo)致的系統(tǒng)性能下降,并促使執(zhí)行器退飽和;在不發(fā)生飽和時閉環(huán)系統(tǒng)將保持線性特性,從而達(dá)到確保抗飽和控制系統(tǒng)性能要求的目的.
抗飽和控制起源于工程實踐,相關(guān)研究可追溯至20世紀(jì)30年代[13].早期研究發(fā)現(xiàn),控制器含有的積分項不斷積累期望信號與輸出信號的偏差,導(dǎo)致控制信號超出執(zhí)行器的物理上限,從而引發(fā)積分器溢滿(integrator windup)現(xiàn)象[14].當(dāng)初解決這一問題的方法是構(gòu)造補(bǔ)償器,使其信號饋入到控制器中以達(dá)到退飽和的目的,即前文介紹的間接法,也被稱為抗積分器溢滿(anti-windup)控制方法,可簡稱為抗飽和控制.在抗飽和控制發(fā)展的初始階段,人們做出了許多嘗試,采用了諸如描述函數(shù)法[14]、回饋計算(back-calculation)[15]、條件技術(shù)(conditioning technique)[16-18]等方法對飽和約束系統(tǒng)進(jìn)行研究,提出了基于觀測器[19]、智能積分[20]、高增益反饋[21]等多種補(bǔ)償器設(shè)計方法.20世紀(jì)80—90年代,抗飽和控制的統(tǒng)一框架得到進(jìn)一步確定和發(fā)展[22-27],同時結(jié)合輸入受限控制[2,6-9,28]、H∞控制[29-31]等方法和技術(shù),逐步形成較完整的抗飽和控制研究體系,為穩(wěn)定性及性能等問題的研究提供嚴(yán)謹(jǐn)?shù)睦碚摫U?該階段的抗飽和控制不僅在理論層面上涌現(xiàn)出了相當(dāng)可觀的研究成果[32-40],同時也在諸如飛行器[41-43]、電機(jī)[44-45]、機(jī)器人[46-48]等工業(yè)領(lǐng)域上展現(xiàn)出了強(qiáng)大的應(yīng)用潛力.
考慮具有執(zhí)行器飽和的線性系統(tǒng)如下:
(1)
其中,xp∈Rnp是被控對象的狀態(tài),u∈Rnu是執(zhí)行器輸入信號,ω∈Rnω是外部輸入信號,y∈Rny是系統(tǒng)輸出信號,z∈Rnz是性能輸出信號,Ap、Bpu、Bpω為適維常數(shù)矩陣,飽和函數(shù)sat(·):Rnu→Rnu定義為
其中ulim代表飽和函數(shù)的飽和幅值.
針對被控對象(1),設(shè)計線性控制器如下:
(2)
其中,xc∈Rnc是控制器的狀態(tài),u∈Rnu是控制器輸出信號,同時也是執(zhí)行器輸入信號,Ac、Bcy、Bcw、Cc、Dcy、Dcω為適維常數(shù)矩陣.在無執(zhí)行器飽和的情況下,被控對象(1)與控制器(2)構(gòu)成的閉環(huán)系統(tǒng)漸近穩(wěn)定且具有期望的閉環(huán)系統(tǒng)性能.
為了解決執(zhí)行器飽和引發(fā)的系統(tǒng)性能下降問題,設(shè)計抗飽和補(bǔ)償器如下:
(3)
其中:xaw∈Rnaw是抗飽和補(bǔ)償器的狀態(tài),v1∈Rnc和v2∈Rnu是抗飽和補(bǔ)償器的輸出信號,依賴于信號u和y,且v1輸入到控制器中,v2被直接饋入執(zhí)行器輸入信號中.在該抗飽和補(bǔ)償器的作用下,控制器(2)可重新描述為
(4)
如圖1所示,被控對象(1),控制器(4)以及抗飽和補(bǔ)償器(3)三者共同構(gòu)成抗飽和控制系統(tǒng)的基本框架,其中抗飽和補(bǔ)償器在執(zhí)行器發(fā)生飽和時被激發(fā).
一般來說,抗飽和補(bǔ)償器的設(shè)計應(yīng)達(dá)到以下控制目標(biāo):
1) 當(dāng)未發(fā)生執(zhí)行器飽和時,閉環(huán)系統(tǒng)處于未受限的線性狀態(tài),需要滿足期望的性能要求;
2) 當(dāng)發(fā)生執(zhí)行器飽和時,閉環(huán)系統(tǒng)的響應(yīng)要盡可能地接近未受限系統(tǒng)的響應(yīng).
抗飽和設(shè)計過程中,具體的問題需要考慮不同的優(yōu)化目標(biāo).例如,吸引域大小是衡量閉環(huán)系統(tǒng)穩(wěn)定性能的一個基本指標(biāo),而抗飽和補(bǔ)償器的引入需實現(xiàn)閉環(huán)系統(tǒng)吸引域的最大化;又如,在存在外部輸入的情況下,通過設(shè)計抗飽和補(bǔ)償器,使閉環(huán)系統(tǒng)滿足一定的L2增益[32]性能指標(biāo).
正如圖1所示,抗飽和控制系統(tǒng)的核心在于引入合適的抗飽和補(bǔ)償器,該過程包含兩個重要方面,分別是抗飽和補(bǔ)償器的結(jié)構(gòu)設(shè)計及激發(fā)機(jī)制.圍繞這兩方面,目前已經(jīng)涌現(xiàn)出了相當(dāng)數(shù)量的研究成果.接下來,將分別從這兩個方面對已有研究成果進(jìn)行梳理與總結(jié).
現(xiàn)有抗飽和補(bǔ)償器有兩類,一類是直接型結(jié)構(gòu),另一類是基于模型恢復(fù),其中后者須包含被控對象的結(jié)構(gòu)信息.
1) 直接型抗飽和補(bǔ)償器
直接型抗飽和補(bǔ)償器不顯含被控對象的模型結(jié)構(gòu)和參數(shù),在設(shè)計上具有較高的自由度.近幾十年來,已經(jīng)涌現(xiàn)了豐富的線性及非線性的補(bǔ)償器結(jié)構(gòu)設(shè)計成果.得益于成熟的線性系統(tǒng)理論體系,線性結(jié)構(gòu)的抗飽和補(bǔ)償器設(shè)計得到了充分的發(fā)展.Grimm等[33]分別提出了靜態(tài)以及動態(tài)抗飽和補(bǔ)償器的綜合方法,并給出了一個有趣的結(jié)論,即對于開環(huán)穩(wěn)定的系統(tǒng),必然存在一個與被控對象階數(shù)相同的動態(tài)抗飽和補(bǔ)償器,其L2增益為開環(huán)系統(tǒng)L2增益與線性閉環(huán)系統(tǒng)L2增益中的較大值.隨后,Hu等[49]在上述工作的基礎(chǔ)上,針對開環(huán)不穩(wěn)定的系統(tǒng),給出了能確保局部L2增益性能的抗飽和補(bǔ)償器的存在條件和構(gòu)造方式.Cao等[34]和Gomas等[50]為了實現(xiàn)閉環(huán)系統(tǒng)吸引域的最大化,分別基于凸包表示法和局部扇區(qū)條件給出了靜態(tài)抗飽和補(bǔ)償器的設(shè)計方法.Wu等[51]分別針對幅值和速率同時飽和的線性系統(tǒng)以及僅幅值受限的線性分式變換(linear fractional transformation)系統(tǒng),確立了抗飽和補(bǔ)償器存在的線性矩陣不等式條件,并給出了詳細(xì)的補(bǔ)償器構(gòu)造步驟,改善了閉環(huán)系統(tǒng)的性能.劉晨等[52]考慮具有外部擾動輸入的不確定系統(tǒng),以擴(kuò)大其收斂域為目標(biāo),構(gòu)建了以不確定項和擾動輸入為增廣狀態(tài)的增廣系統(tǒng),給出了基于擴(kuò)張狀態(tài)觀測器的動態(tài)抗飽和補(bǔ)償器設(shè)計方法.除此之外,與抗飽和控制的階段式設(shè)計方法不同,Mulder等[53]保留了抗飽和控制的基本框架,提出線性控制器與抗飽和補(bǔ)償器同時設(shè)計的方案,在一定程度上融合了直接法和間接法的優(yōu)勢.Cao等[54]則采用含有抗飽和補(bǔ)償器結(jié)構(gòu)的智能積分控制器,提出一種基于線性矩陣不等式的求解算法,以確定控制器的反饋增益和抗飽和補(bǔ)償器增益,擴(kuò)大了閉環(huán)系統(tǒng)吸引域.
與線性結(jié)構(gòu)的抗飽和補(bǔ)償器不同,非線性抗飽和補(bǔ)償器的結(jié)構(gòu)復(fù)雜,設(shè)計上更具難度.但通常來說,非線性抗飽和補(bǔ)償器能夠提供更好的控制性能,尤其當(dāng)線性補(bǔ)償器不足以應(yīng)對執(zhí)行器飽和造成的穩(wěn)定性及性能問題時,非線性抗飽和補(bǔ)償器將是一個選擇.對于直接型抗飽和控制而言,較為普遍的是采用非線性策略來調(diào)度一組線性抗飽和補(bǔ)償器.例如,Lu等[55]利用復(fù)合二次型Lyapunov函數(shù),給出了一組靜態(tài)補(bǔ)償器增益的求解算法,并通過復(fù)合Lyapunov函數(shù)中的復(fù)合函數(shù)融合這些靜態(tài)補(bǔ)償器,構(gòu)建了非線性抗飽和補(bǔ)償器.除此之外,切換策略也在非線性補(bǔ)償器設(shè)計中得到應(yīng)用.比如,針對擴(kuò)大吸引域問題,Lu等[56]基于最小二次Lyapunov函數(shù)蘊(yùn)含的最小值函數(shù),設(shè)計了一組線性抗飽和補(bǔ)償器增益進(jìn)行切換控制;Li等[57]對表示飽和函數(shù)的凸包進(jìn)行分區(qū),并為每個凸包分區(qū)分配相應(yīng)的靜態(tài)補(bǔ)償器,再根據(jù)飽和信號所處的凸包分區(qū)來激發(fā)對應(yīng)的補(bǔ)償器,形成了切換抗飽和補(bǔ)償器,從而實現(xiàn)了閉環(huán)系統(tǒng)吸引域的擴(kuò)大.
2) 基于模型恢復(fù)的抗飽和控制
與直接型抗飽和補(bǔ)償器靈活的設(shè)計方式不同,基于模型恢復(fù)的抗飽和控制必須根據(jù)被控對象的模型信息G(s)來構(gòu)建補(bǔ)償器(補(bǔ)償器由M(s)-I和G(s)M(s)構(gòu)成),其核心在于從含有執(zhí)行器飽和的閉環(huán)系統(tǒng)中析出未受限的線性系統(tǒng),并最小化剩余部分的系統(tǒng)增益,達(dá)到使閉環(huán)系統(tǒng)動態(tài)性能盡可能地逼近未受限系統(tǒng)的目的,其控制框圖如圖2所示.
圖2 基于模型恢復(fù)的抗飽和控制的基本控制框圖Fig.2The basic control framework of the model recovery anti-windup control
為了更好地解釋基于模型恢復(fù)的抗飽和控制的基本原理,可將圖2所示的基本框圖等價轉(zhuǎn)化為圖3中的控制框圖[36].
圖3 基于模型恢復(fù)的抗飽和控制的等效表達(dá)Fig.3An equivalent representation of the model recovery anti-windup control
圖3中的等效表達(dá)解除了系統(tǒng)線性部分與非線性部分的耦合,清晰地劃分出基于模型恢復(fù)的抗飽和控制的3個重要構(gòu)成部分,分別是提前設(shè)計的具有期望性能的未受限系統(tǒng)、包含死區(qū)函數(shù)的非線性環(huán)及含有被控對象模型信息的擾動濾波器.其中,擾動濾波器產(chǎn)生的信號yd表達(dá)了實際飽和約束控制系統(tǒng)與理想未受限系統(tǒng)之間的差異.在該控制框架下,系統(tǒng)的響應(yīng)行為分為3個階段[36].第一階段,執(zhí)行器未發(fā)生飽和,系統(tǒng)處于線性工作狀態(tài);第二階段,控制輸出ulin超出了飽和限制,執(zhí)行器發(fā)生飽和,擾動濾波器產(chǎn)生信號yd,影響未受限系統(tǒng)的輸出ylin;第三階段,執(zhí)行器退出飽和狀態(tài),但由于擾動濾波器的動態(tài)結(jié)構(gòu),信號yd依舊存在,持續(xù)影響信號ylin.作為唯一的可設(shè)計參數(shù),傳遞函數(shù)M(s)的恰當(dāng)選擇可使系統(tǒng)處于第二階段和第三階段的總時長最短,從而使實際飽和約束控制系統(tǒng)的響應(yīng)盡可能恢復(fù)至未受限時的狀態(tài).基于模型恢復(fù)的抗飽和控制具有清晰直觀的物理含義,其補(bǔ)償器的構(gòu)造僅需考慮對系統(tǒng)非線性部分的分析.然而,正如圖3所示,基于模型恢復(fù)的抗飽和控制必須根據(jù)被控對象的動態(tài)機(jī)理構(gòu)建抗飽和補(bǔ)償器,導(dǎo)致該類抗飽和補(bǔ)償器的基本結(jié)構(gòu)固定,缺乏靈活設(shè)計的自由度.
根據(jù)基于模型恢復(fù)抗飽和控制的思想,Galeani等[58]針對開環(huán)穩(wěn)定的系統(tǒng),設(shè)計了一種非線性調(diào)度技術(shù)來實現(xiàn)一組線性抗飽和補(bǔ)償器的切換.Zaccarian等[59]則考慮指數(shù)不穩(wěn)定的被控對象,提出了一種構(gòu)造性的非線性抗飽和補(bǔ)償器設(shè)計,獲得了預(yù)期的跟蹤性能.Grimm等[60]將預(yù)測控制與基于模型恢復(fù)的抗飽和相結(jié)合,把抗飽和設(shè)計問題轉(zhuǎn)化成了具有約束限制的滾動時域優(yōu)化問題.Turner等[37]和Li等[61]則致力于將魯棒性指標(biāo)融入到基于模型恢復(fù)的抗飽和補(bǔ)償器設(shè)計中,有效地改善了系統(tǒng)性能.Turner等[38]則在直接型抗飽和控制框架下,提出了基于模型恢復(fù)的靜態(tài)及低階抗飽和補(bǔ)償器構(gòu)造方案.此外,針對特定結(jié)構(gòu)系統(tǒng)的抗飽和控制研究也不少.比如,Ofodile等[62]提供了針對輸入耦合雙積分系統(tǒng)的抗飽和補(bǔ)償器構(gòu)造方式,并基于無人機(jī)實驗平臺驗證了該補(bǔ)償器在改善閉環(huán)系統(tǒng)跟蹤性能方面的有效性;Lv等[63]針對具有輸入飽和的線性多智能體系統(tǒng),設(shè)計了基于模型恢復(fù)的分布式抗飽和補(bǔ)償器,解決了其一致性問題.
抗飽和控制的基本思想是設(shè)計并激發(fā)補(bǔ)償器,將其信號饋入到控制器中,從而抑制執(zhí)行器飽和帶來的系統(tǒng)性能下降.激發(fā)機(jī)制的設(shè)計,也就是何時啟動抗飽和補(bǔ)償器,是影響閉環(huán)系統(tǒng)性能的重要因素.因此圍繞如何設(shè)計補(bǔ)償器的激發(fā)機(jī)制問題,學(xué)者們給出了一系列研究成果.
傳統(tǒng)抗飽和補(bǔ)償器激發(fā)機(jī)制可稱為立即激發(fā),即在執(zhí)行器發(fā)生飽和時立即啟動抗飽和補(bǔ)償器,這種依賴于執(zhí)行器飽和狀況的設(shè)計是自然而然的,也是研究和應(yīng)用最多的一種激發(fā)機(jī)制.立即激發(fā)機(jī)制一般擁有兩種表現(xiàn)形式.第一種見于直接型抗飽和控制,可參見文獻(xiàn)[49-53],這種驅(qū)動形式利用執(zhí)行器輸入與輸出的信號差值啟動抗飽和補(bǔ)償器,其結(jié)構(gòu)形式簡單直觀,如圖 4(a)所示.而另一種驅(qū)動形式用于基于模型恢復(fù)的抗飽和控制,如文獻(xiàn)[58-65]所述,其具體結(jié)構(gòu)請見圖4(b).盡管這一結(jié)構(gòu)會產(chǎn)生代數(shù)環(huán),使得抗飽和系統(tǒng)更復(fù)雜、補(bǔ)償器設(shè)計更具難度,但文獻(xiàn)[27,65]表明,該代數(shù)環(huán)能夠有效改善閉環(huán)系統(tǒng)的暫態(tài)性能.此外,針對特殊的飽和約束控制系統(tǒng),立即激發(fā)機(jī)制可根據(jù)系統(tǒng)的結(jié)構(gòu)特點進(jìn)行相應(yīng)的調(diào)整.例如,在線性反饋嵌套飽和系統(tǒng)中,嵌套飽和結(jié)構(gòu)不可拆解,是一個整體非線性環(huán)節(jié)[66].對此,抗飽和補(bǔ)償器不再由單一的飽和非線性驅(qū)動,而是由控制器輸出和被控對象輸入之間的差信號驅(qū)動,包含著多重嵌套飽和信息.
圖4 立即激發(fā)機(jī)制的基本結(jié)構(gòu)Fig.4The basic structures of the immediate activation mechanism
值得注意的是,盡管一般而言,飽和的存在會對系統(tǒng)性能產(chǎn)生負(fù)面影響,但若執(zhí)行器過早地退飽和,被控對象的驅(qū)動信號隨之減弱,會造成閉環(huán)系統(tǒng)暫態(tài)性能的降低;因此適當(dāng)?shù)鼐S持執(zhí)行器飽和,在合適的時間段內(nèi)提供較大的驅(qū)動信號,有助于改善系統(tǒng)暫態(tài)性能.考慮到這一點,Sajjadi-Kia等[67]提出了一種延遲激發(fā)機(jī)制,即在控制信號幅值超過執(zhí)行器飽和值一定程度后才啟動抗飽和補(bǔ)償器.該激發(fā)機(jī)制需要引入一個虛擬飽和環(huán)節(jié),其飽和值略高于實際執(zhí)行器的飽和值.如圖5所示,延遲激發(fā)的抗飽和補(bǔ)償器由該虛擬飽和環(huán)節(jié)輸入輸出的差信號驅(qū)動.
圖5 延遲激發(fā)機(jī)制的基本結(jié)構(gòu)Fig.5The basic structure of the delayed activation mechanism
延遲激發(fā)機(jī)制在一定程度上改善了閉環(huán)系統(tǒng)的暫態(tài)性能,并在幅值與速率同時飽和的系統(tǒng)中得到了擴(kuò)展應(yīng)用[68].與延遲激發(fā)機(jī)制不同,Wu等[69]提出了提前激發(fā)策略,即在控制信號幅值尚未達(dá)到執(zhí)行器飽和值時,提前啟動抗飽和補(bǔ)償器,可以起到未雨綢繆的作用.與延遲激發(fā)相似,提前激發(fā)機(jī)制同樣需要引入虛擬飽和環(huán)節(jié),區(qū)別在于其飽和值需要略低于實際執(zhí)行器的飽和值,以達(dá)到提前激發(fā)的目的,具體結(jié)構(gòu)可見圖6.相較于立即激發(fā)和延遲激發(fā),提前激發(fā)不僅可以改善閉環(huán)系統(tǒng)的信號跟蹤性能,還能有效擴(kuò)大閉環(huán)系統(tǒng)的吸引域.隨后,Turner等[70]給出一種包含兩種死區(qū)非線性的類扇區(qū)條件,并為提前激發(fā)抗飽和補(bǔ)償器提供了具有更優(yōu)數(shù)值特性的構(gòu)造方式.在文獻(xiàn)[70]的基礎(chǔ)上,Turner等[71]進(jìn)一步完善了類扇區(qū)條件,提出一種兩階段并聯(lián)型抗飽和控制框架,如圖7所示,并指出現(xiàn)有的激發(fā)機(jī)制皆可解釋為該控制框架下的特殊情況.
圖6 提前激發(fā)機(jī)制的基本結(jié)構(gòu)Fig.6The basic structure of the anticipatory activation mechanism
圖7 兩階段抗飽和控制框架Fig.7The two-stage anti-windup control framework
事實上,單一激發(fā)機(jī)制的缺點較為明顯,即對不同飽和程度的控制信號采取相同的激發(fā)策略,那么更優(yōu)的做法應(yīng)該是針對不同幅值的控制信號設(shè)置相應(yīng)的激發(fā)機(jī)制.基于這種考慮,混合激發(fā)機(jī)制的方法應(yīng)運(yùn)而生.例如,Sajjadi-Kia等[72]針對開環(huán)穩(wěn)定的系統(tǒng)設(shè)計了延遲激發(fā)和立即激發(fā)相結(jié)合的多階段抗飽和控制框架,并分別給出了靜態(tài)和動態(tài)抗飽和補(bǔ)償器的設(shè)計方案,保證了閉環(huán)系統(tǒng)L2增益性能;彭秀艷等[73]采用了和文獻(xiàn)[72]相同的混合激發(fā)機(jī)制,通過衡量飽和約束系統(tǒng)的控制器狀態(tài)與未受限系統(tǒng)的控制器狀態(tài)的差異來對抗飽和補(bǔ)償器進(jìn)行優(yōu)化設(shè)計,當(dāng)控制信號的飽和程度較高時,兩種激發(fā)機(jī)制驅(qū)動的補(bǔ)償器同時工作以改善閉環(huán)系統(tǒng)性能,當(dāng)執(zhí)行器處于微飽和狀態(tài)時,單一補(bǔ)償器啟動,以降低閉環(huán)系統(tǒng)工作負(fù)擔(dān).Wu等[74]則通過融合立即激發(fā)、延遲激發(fā)以及提前激發(fā)的各自優(yōu)勢,提出了一種兼具3種激發(fā)機(jī)制的多環(huán)抗飽和控制框架,比起僅結(jié)合兩種激發(fā)機(jī)制的方法,該方法更能提高閉環(huán)系統(tǒng)的跟蹤性能.
實際控制系統(tǒng)中的執(zhí)行器飽和大部分不是簡單的對稱飽和,會呈現(xiàn)出如嵌套飽和、非對稱飽和等形態(tài),另外系統(tǒng)輸出端的傳感器也會出現(xiàn)飽和現(xiàn)象,即輸出飽和.針對不同形態(tài)的飽和非線性,其抗飽和補(bǔ)償器的設(shè)計各有特色.由于實際的被控對象也多是非線性的,面向非線性控制系統(tǒng)的抗飽和設(shè)計得到了重視.目前,多智能體系統(tǒng)已成為控制領(lǐng)域的研究熱點,其抗飽和控制的研究也得到了大量關(guān)注.
1) 嵌套飽和
嵌套飽和是一種更復(fù)雜的飽和約束,在實際控制系統(tǒng)中也較為常見.例如,幅值與速率同時飽和可建模為嵌套飽和[68].又如,執(zhí)行器飽和與傳感器飽和同時存在時可用嵌套飽和表征[75].在嵌套飽和系統(tǒng)的抗飽和控制問題上,相關(guān)研究工作已經(jīng)開展.Wu等[51]針對幅值與速率嵌套飽和系統(tǒng),提出基于擴(kuò)展圓判據(jù)的抗飽和補(bǔ)償器綜合條件,并建立優(yōu)化問題以設(shè)計補(bǔ)償器,最后通過飛行控制仿真實驗驗證了補(bǔ)償器的有效性.Galeani等[76]將嵌套飽和等價地表示為單層飽和,簡化了嵌套飽和系統(tǒng)抗飽和補(bǔ)償器的設(shè)計復(fù)雜度.Reineh等[77]采用文獻(xiàn)[78]中提出的軟件模擬法進(jìn)行速率飽和建模,并將補(bǔ)償器饋入控制器的部分補(bǔ)償信號再饋入到執(zhí)行器輸入中,打破了傳統(tǒng)設(shè)計中兩個補(bǔ)償信號互不干涉的設(shè)計模式,從而改善了閉環(huán)系統(tǒng)的暫態(tài)性能.Gomes等[79]則把基于單層飽和系統(tǒng)的線性控制器和抗飽和補(bǔ)償器同時設(shè)計方法[53],拓展到嵌套飽和系統(tǒng)中,擴(kuò)大了閉環(huán)系統(tǒng)的吸引域.此外,Glovanini[80]融合了預(yù)測控制與抗飽和控制的思想,提出了基于滾動時域優(yōu)化策略的抗飽和補(bǔ)償器設(shè)計方案,并將其應(yīng)用到幅值與速率嵌套飽和系統(tǒng)中.
2) 非對稱飽和
在實際系統(tǒng)中飽和非線性有時以非對稱的形式出現(xiàn).飽和的非對稱性為抗飽和設(shè)計帶來了困難.目前對于非對稱飽和的抗飽和研究不多,其研究依賴于非對稱飽和函數(shù)的處理.處理非對稱飽和的常見方法是將其轉(zhuǎn)換為對稱飽和,而后依此設(shè)計抗飽和補(bǔ)償器.例如,Yuan等[81]將非對稱飽和系統(tǒng)等價成切換系統(tǒng),每個子系統(tǒng)含有不同飽和值的對稱飽和函數(shù),并分別針對每個子系統(tǒng)進(jìn)行獨(dú)立的補(bǔ)償器設(shè)計,最終形成切換抗飽和補(bǔ)償器;Li等[82]將非對稱飽和函數(shù)分解為常數(shù)項和對稱飽和函數(shù),并將常數(shù)項視為已知幅值上限的擾動輸入,從而將非對稱飽和系統(tǒng)的抗飽和問題轉(zhuǎn)化為具有擾動輸入的對稱飽和系統(tǒng)的抗飽和問題;Geng等[83]采用與文獻(xiàn)[82]相同的非對稱飽和處理方法,將析出的常數(shù)項和模型誤差作為系統(tǒng)增廣狀態(tài),提出一種基于擴(kuò)張狀態(tài)觀測器的靜態(tài)抗飽和補(bǔ)償器設(shè)計方法,改善了非對稱飽和系統(tǒng)的抗干擾能力和跟蹤性能.
3) 輸出飽和
由于物理結(jié)構(gòu)的限制及外部環(huán)境的干擾,傳感器也會發(fā)生飽和現(xiàn)象.當(dāng)傳感器飽和時,控制器被饋入不準(zhǔn)確的測量信號,會導(dǎo)致閉環(huán)系統(tǒng)性能下降.與執(zhí)行器飽和本質(zhì)不同的是,傳感器飽和與否是無法測量的,因此其抗飽和方法無法依賴傳感器的飽和狀況,需要設(shè)計輔助環(huán)節(jié)來估計傳感器輸出端是否發(fā)生了飽和,故加大了傳感器飽和系統(tǒng)抗飽和設(shè)計的難度.Tarbouriech等[84]和Turner等[85]通過設(shè)計狀態(tài)觀測器及引入新的飽和環(huán)節(jié)來模擬傳感器,將該虛擬傳感器輸入輸出信號的差值用以驅(qū)動抗飽和補(bǔ)償器,并給出了補(bǔ)償器的存在條件和構(gòu)造方式;但因其引入了非線性環(huán)節(jié),導(dǎo)致閉環(huán)系統(tǒng)結(jié)構(gòu)更加復(fù)雜,增加了分析系統(tǒng)穩(wěn)定性和性能的難度.Turner等[86]將狀態(tài)觀測器輸出與實際傳感器輸出的差值作為修正狀態(tài)觀測器的反饋信號,并利用其直接驅(qū)動補(bǔ)償器,無需引入新的非線性環(huán)節(jié),明顯改善了閉環(huán)系統(tǒng)的信號跟蹤能力.除此之外,Sofrony等[87]借鑒故障診斷所使用的基于互質(zhì)分解法的殘差生成技術(shù)[88],利用該殘差信號驅(qū)動抗飽和補(bǔ)償器,從而將輸出飽和系統(tǒng)的補(bǔ)償器設(shè)計問題簡化為求解合適的被控對象互質(zhì)分解結(jié)果和其對應(yīng)的Bezout補(bǔ)償.Sassano等[89]則針對單輸入單輸出的離散輸出飽和系統(tǒng)提出一種邏輯切換策略,以實現(xiàn)輸出反饋信號在傳感器輸出和狀態(tài)觀測器輸出之間的切換,并在此基礎(chǔ)上設(shè)計了基于模型恢復(fù)的抗飽和補(bǔ)償器,實現(xiàn)了有限時間內(nèi)閉環(huán)系統(tǒng)響應(yīng)恢復(fù)到未受限狀態(tài)的目的.
4) 非線性被控對象
非線性被控對象的抗飽和控制基本上也采用了和線性被控對象相似的結(jié)構(gòu)框架.例如,Herrmann等[90]針對含有非線性動態(tài)逆控制器的閉環(huán)系統(tǒng),設(shè)計了一種通用的基于模型恢復(fù)的抗飽和補(bǔ)償器結(jié)構(gòu)框架.劉勝等[91]采用線性微分包含方法處理系統(tǒng)非線性項,利用一組線性模型的凸組合表達(dá)不確定非線性系統(tǒng),基于此提出了一種靜態(tài)抗飽和補(bǔ)償器增益求解方法.此外,自適應(yīng)控制以及神經(jīng)網(wǎng)絡(luò)也在非線性被控系統(tǒng)的抗飽和控制中得到應(yīng)用.例如,Kahveci等[92]提出一種魯棒自適應(yīng)方法用以在線估計滑翔機(jī)系統(tǒng)的模型參數(shù),根據(jù)所得參數(shù),利用互質(zhì)分解法在線優(yōu)化并更新抗飽和補(bǔ)償器增益,使滑翔機(jī)擁有良好的軌跡自主跟蹤性能;Ji等[93]則針對固體氧化物燃料電池系統(tǒng),采用神經(jīng)網(wǎng)絡(luò)方法對其動態(tài)機(jī)理進(jìn)行建模,基于此求得被控對象輸出到控制輸入的Jacobian信息作為抗飽和補(bǔ)償器增益,最終實現(xiàn)了維持合理的燃料使用率的目標(biāo).
5) 多智能體系統(tǒng)
輸入飽和作為控制系統(tǒng)的一種常見約束,對多智能體系統(tǒng)的一致性問題及相關(guān)問題的研究增加了難度;抗飽和控制則為這些問題的解決提供了行之有效的方法.Lim等[94]為飽和異構(gòu)多智能體系統(tǒng)引入靜態(tài)抗飽和補(bǔ)償器,促使飽和的參考信號回到線性工作區(qū)域,從而形成有界參考軌跡,并最終實現(xiàn)了狀態(tài)的局部一致性.Li等[95]考慮飽和多智能體系統(tǒng)的領(lǐng)導(dǎo)-跟隨狀態(tài)一致性問題,為每個跟隨者設(shè)計相應(yīng)的靜態(tài)抗飽和補(bǔ)償器,確保了飽和情況下多智能體系統(tǒng)的穩(wěn)定性與性能要求.Fu等[96]針對有向通信情況下的二階多智能體系統(tǒng),提出一種分布式抗飽和控制策略,該策略能夠靈活適應(yīng)不同局部性能的線性控制器,實現(xiàn)了對飽和非線性的有效處理以及保持全局狀態(tài)一致性的目的.Lv等[63]與Richards等[97]提出基于模型恢復(fù)的動態(tài)抗飽和補(bǔ)償器設(shè)計方法,分別實現(xiàn)了輸入飽和多智能體系統(tǒng)的全局及局部狀態(tài)一致性.抗飽和控制不僅解決了飽和多智能體系統(tǒng)的狀態(tài)一致性問題,也被用來實現(xiàn)其輸出一致性.Lv等[98]研究了輸入飽和異構(gòu)多智能體系統(tǒng)的領(lǐng)導(dǎo)-跟隨輸出一致性問題,通過引入跟蹤誤差觀測器來生成抗飽和補(bǔ)償器,實現(xiàn)了輸入約束下的全局輸出一致性.Wang等[99]將馬爾可夫隨機(jī)切換拓?fù)浣Y(jié)構(gòu)下的飽和異構(gòu)多智能體系統(tǒng)作為研究對象,提出一種基于雙觀測器的分布式動態(tài)抗飽和控制方案,解決了由異構(gòu)智能體交互、輸入約束以及非固定拓?fù)浣Y(jié)構(gòu)等形成的輸出一致性難題.
本文簡述了抗飽和控制的發(fā)展歷史和基本框架,著重從補(bǔ)償器結(jié)構(gòu)和激發(fā)機(jī)制兩個方面梳理并總結(jié)了抗飽和控制的研究成果.盡管抗飽和控制已經(jīng)取得一系列重要成果,但其發(fā)展也面臨著瓶頸;隨著控制領(lǐng)域新理念新技術(shù)的發(fā)展,抗飽和控制也會迎來新的發(fā)展機(jī)遇.下面我們簡述未來抗飽和控制待解決的幾個問題.
1) 抗飽和控制的基本框架固定,尤其是基于模型恢復(fù)的抗飽和補(bǔ)償器結(jié)構(gòu)單一,設(shè)計自由度較低,如何改進(jìn)基本框架獲取更優(yōu)的閉環(huán)性能是值得關(guān)注的;
2) 現(xiàn)有激發(fā)機(jī)制幾乎完全依賴于(虛擬)執(zhí)行器的飽和狀況.實際上,執(zhí)行器的飽和狀況和閉環(huán)系統(tǒng)性能之間的聯(lián)系尚不明朗,也就是說目前抗飽和控制的激發(fā)機(jī)制與系統(tǒng)性能間的匹配度不高,因此需要開發(fā)能夠真實反映系統(tǒng)性能的激發(fā)機(jī)制;
3) 目前抗飽和補(bǔ)償器設(shè)計嚴(yán)重依賴于系統(tǒng)模型參數(shù),針對模型信息未知條件下的研究寥寥無幾.因此,利用輸入輸出數(shù)據(jù)和學(xué)習(xí)的方法來設(shè)計抗飽和補(bǔ)償器也是一個可以考慮的途徑;
4) 對于飽和多智能體系統(tǒng),輸入飽和約束在不同拓?fù)浣Y(jié)構(gòu)下對系統(tǒng)性能的關(guān)聯(lián)關(guān)系尚未明確,因此拓?fù)浣Y(jié)構(gòu)對抗飽和補(bǔ)償器設(shè)計及性能的影響有待進(jìn)一步研究.
廈門大學(xué)學(xué)報(自然科學(xué)版)2022年6期