朱盼盼,卜旭輝,梁嘉琪,閆帥明
(河南理工大學(xué)電氣工程與自動化學(xué)院,河南焦作 454000)
迭代學(xué)習(xí)控制(iterative learning control,ILC)[1–3]是一種針對有限時間區(qū)間執(zhí)行重復(fù)控制任務(wù)系統(tǒng)的有效控制手段.該方法利用上一次循環(huán)的系統(tǒng)輸出誤差和控制輸入信號構(gòu)建當(dāng)前循環(huán)的控制輸入信號,以獲得比上一次循環(huán)更好的控制效果.經(jīng)過了30多年的發(fā)展,迭代學(xué)習(xí)控制已經(jīng)取得了豐富的理論結(jié)果,并在很多實際系統(tǒng)中得到了應(yīng)用.值得說明的是,無模型自適應(yīng)迭代學(xué)習(xí)控制是一種針對未知非線性系統(tǒng)的有效方法,它可以不需要系統(tǒng)模型的任何信息,就能實現(xiàn)迭代學(xué)習(xí)控制算法的設(shè)計和收斂性分析.目前,無模型自適應(yīng)迭代學(xué)習(xí)控制已經(jīng)取得了一些研究結(jié)果[4–6].
另一方面,實際中,控制系統(tǒng)已逐步由點對點方式的結(jié)構(gòu)轉(zhuǎn)換為網(wǎng)絡(luò)控制系統(tǒng)(network control system,NCS)的結(jié)構(gòu).NCS具有減少系統(tǒng)布線、便于系統(tǒng)診斷和維護、增加系統(tǒng)的靈活性和穩(wěn)定性等優(yōu)點.然而,NCS也伴隨著許多待解決的問題[7–8],例如數(shù)據(jù)量化[9]、網(wǎng)絡(luò)引起的延遲[10]、數(shù)據(jù)丟失[11]等.其中,由于網(wǎng)絡(luò)和閉環(huán)系統(tǒng)中一些設(shè)備(如A/D和D/A轉(zhuǎn)換器)的傳輸容量有限,實際的NCS中傳輸?shù)臄?shù)據(jù)需要在發(fā)送到下一個網(wǎng)絡(luò)節(jié)點之前進行量化.為了減少NCS中的傳輸負擔(dān),就必須要考慮數(shù)據(jù)量化的問題.
迭代學(xué)習(xí)控制的量化問題已有一些研究結(jié)果[12–16].文獻[13–14]通過系統(tǒng)輸出信號量化的研究,提出了一種基于對數(shù)量化器的迭代學(xué)習(xí)控制方法,并用扇形界的方法證明所提方法的跟蹤誤差收斂性.文獻[15]設(shè)計了一種狀態(tài)重置動態(tài)量化反饋控制器,用以抑制量化跳變對系統(tǒng)的影響,并驗證了狀態(tài)重置反饋控制系統(tǒng)是漸近穩(wěn)定的.文獻[16–18]研究了一類具有數(shù)據(jù)量化問題的迭代學(xué)習(xí)控制系統(tǒng),針對均勻量化器進行了適當(dāng)?shù)膬?yōu)化,提出一種編碼和解碼機制.該機制與迭代學(xué)習(xí)控制相結(jié)合,結(jié)果證明其可以在線性和非線性系統(tǒng)中解決數(shù)據(jù)量化問題.但是目前針對模型未知系統(tǒng)的量化尚無研究.因此,本文針對存在數(shù)據(jù)量化的模型未知非線性系統(tǒng),研究基于編碼解碼量化機制的無模型自適應(yīng)迭代學(xué)習(xí)控制方法.
考慮如下有限時間區(qū)間上重復(fù)運行的非線性離散時間單輸入單輸出(single input single output,SISO)系統(tǒng):
其中:y(k,i)和u(k,i)分別表示第i次迭代和第k個采樣時刻的系統(tǒng)輸入和輸出信號;k∈[0,1,…,T],i=1,2,…;ny和nu是兩個未知的正整數(shù);f(·)是一個未知非線性標量函數(shù).
系統(tǒng)(1)滿足以下兩個假設(shè):
假設(shè)1除了有限時刻點外,f(·)關(guān)于第(nu+2)個變量的偏導(dǎo)存在且連續(xù).
假設(shè)2系統(tǒng)(1)沿迭代軸方向滿足Lipschitz條 件,即?k∈[0,1,…,T]和?i=1,2,…,若|?u(k,i)|0,則下式成立:
其 中:?y(k+1,i)=y(k+1,i)?y(k+1,i ?1),?u(k,i)=u(k,i)?u(k,i ?1),c>0是一個常數(shù).
注1假設(shè)1和2對于許多實際控制系統(tǒng)是合理且容易滿足的.對一般非線性系統(tǒng),假設(shè)1是控制系統(tǒng)中的一種典型約束條件.對由于控制輸入沿迭代軸方向變化引起的系統(tǒng)輸出變化,假設(shè)2是對這種變化率上界的一種限制.很多實際系統(tǒng)都能滿足這種假設(shè),例如溫度控制系統(tǒng),壓力控制系統(tǒng)和液位控制系統(tǒng)等.
引 理1[4]對于滿足假設(shè)1和2的系統(tǒng)(1),當(dāng)|?u(k,i)|0時,一定存在PPD的迭代相關(guān)的時變參數(shù)?(k,i),使得系統(tǒng)(1)可以轉(zhuǎn)化為如下形式的迭代軸上的緊格式動態(tài)線性化(CFDL)數(shù)據(jù)模型:
其中?(k,i)是有界的.
注2數(shù)據(jù)模型(2)是非線性系統(tǒng)(1)的等效動態(tài)線性表示.它是一個線性時變數(shù)據(jù)模型,?(k,i)本質(zhì)上是個迭代相關(guān)的時變參數(shù),且對任意迭代過程i的任意時刻k均有界.
由于網(wǎng)絡(luò)帶寬限制,系統(tǒng)(1)在實際執(zhí)行時數(shù)據(jù)需要經(jīng)過量化處理.本文考慮實際中使用較多的均勻量化器[18],其函數(shù)表達式表示如下:
注3為了更直觀的研究量化器的結(jié)構(gòu),這里繪制了函數(shù)(3)的圖像如圖1 所示.定義量化誤差信號為θ(k,i)=Q(y(k,i))?y(k,i),由標準均勻量化器(3)的性質(zhì)可以明顯看出,θ(k,i)是有界的.這種有界性與輸出的具體值無關(guān).本文用到的均勻量化器(3)滿足不等式
圖1 均勻量化器Q(v)的函數(shù)曲線圖Fig.1 The function graph of uniform quantizer Q(v)
本文的目標是針對非線性系統(tǒng)(1),使用均勻量化器(3)處理量化過程,并通過對算法的設(shè)計實現(xiàn)對期望軌跡的零誤差跟蹤.若用yd(k)表示時刻k的系統(tǒng)期望值,即實現(xiàn)
研究表明,只依靠均勻量化器完成數(shù)據(jù)量化的過程,難以實現(xiàn)系統(tǒng)對期望軌跡完全跟蹤的效果.為了實現(xiàn)零誤差的跟蹤目標,本小節(jié)為均勻量化器(3)增加編碼解碼機制.編碼器和解碼器的設(shè)計可參考文獻[10],相關(guān)編碼設(shè)計為
解碼設(shè)計為
其中:y(k+1,i+1)和s(k,i+1)分別是編碼器的輸入信號和輸出信號;s(k,i+1)是解碼器的輸入信號;(k+1,i)和?(k,i)是解碼器的輸出信號.這里,b(i)起調(diào)整系統(tǒng)輸出和編碼器估計之間差異大小的作用.
考慮帶有編碼解碼機制(4)–(5)的均勻量化器(3),本小節(jié)對無模型自適應(yīng)迭代控制算法的設(shè)計如下:
注4注意算法是基于可以重寫為引理1的數(shù)據(jù)模型的系統(tǒng),使用的均勻量化器的編碼和解碼機制由式(3)–(5)設(shè)置,另外,在式(6)–(8)中設(shè)計了控制器的算法.
為了更直觀地表達控制器設(shè)計,圖2中繪制了系統(tǒng)結(jié)構(gòu)圖.很明顯,整個控制系統(tǒng)由受控系統(tǒng),控制器,存儲器和帶有編碼解碼算法的均勻量化器組成.在控制器設(shè)計的中,控制器的算法由參數(shù)估計算法(6)、重置算法(7)和控制輸入算法(8)組成.這里需要被量化的信號有系統(tǒng)輸出信號與兩時刻間輸出信號差.
圖2 帶有編碼解碼的MFAILC系統(tǒng)結(jié)構(gòu)圖Fig.2 Structure diagram of MFAILC system with encoding and decoding mechaism
針對非線性系統(tǒng)(1)設(shè)計的無模型自適應(yīng)迭代學(xué)習(xí)控制算法,可得如下定理:
定理1對于滿足假設(shè)1–3的系統(tǒng)(1),應(yīng)用帶有編碼解碼量化機制(3)–(5)的無模型自適應(yīng)迭代學(xué)習(xí)控制算法(6)–(8),考慮一個滿足yd(k)=yd=constant 的期望軌跡,存在0<η1,μ>μmin,是一個滿足條件0
證本節(jié)分為a)b)c)3個部分去證明所提方法的收斂性.
a)帶有編碼解碼機制量化器的性質(zhì).
在分析所提出的算法(6)–(8)的收斂性之前,有必要先研究編碼和解碼機制的重要特性.將編碼器算法(4)的s(k,i+1)代入式(5)中系統(tǒng)輸出的估計(k+1),可以得到
τ(k,i+1)代表量化器的輸入輸出信號誤差,顯然,?k∈[0,1,…,T],?i=1,2,…,有0|τ(k,i+1)|此外,由編碼算法(4)和解碼算法(5),容易推出
同樣地,當(dāng)輸出誤差信號?y(k+1,i)被作為量化信號時,有
其中γ(k,i+1)表示信號?(k+1,i+1)的量化誤差,并且有
其中由量化器的性質(zhì)易知,?i=1,2,…,?k∈[0,1,…,T],有
其中??(k,i)=?(k,i)??(k,i ?1),由假設(shè)2 知|?(k,i)|c,因此,|??(k,i)|2c.
對式(13)兩端取絕對值,有
通過之前的分析,得到γ(k,i+1)有界于1/2的結(jié)論.給定|b(i)|有界于1.由于函數(shù)
對于變量|?u(k,i ?1)|是先增后減的,所以存在一個最大值.當(dāng)系統(tǒng)滿足0<η1,μ>μmin,μmin=和0 值得指出的是,這里只需要證明d1,d2的存在,而不需要它們的確切值. 把式(15)–(16)代入到式(14)中,易得 c)跟蹤誤差的收斂性. 接下來,討論跟蹤誤差e(k+1,i)的收斂性,定義 將式(18)代入到式(2)中,根據(jù)式(11)的結(jié)論,可以得出 對式(19)兩端取絕對值,有 由于b(i)是有界的,且因此函數(shù)(20)可以被重寫為 由式(23),當(dāng)選擇0<ρ1和λ>λmin時,一定存在一個常數(shù)滿足0 結(jié)合式(22)和式(24),可以得出 同理遞推,可以得到 因為調(diào)節(jié)函數(shù)b(i)滿足所以可以得出δ(i)同時也滿足條件如果i是一個奇數(shù),則 證畢. 本節(jié)通過一個離散時間系統(tǒng)的仿真數(shù)例來驗證所提方案的有效性.值得指出的是,控制方案中沒有用到系統(tǒng)的任何模型信息,包括系統(tǒng)結(jié)構(gòu)的線性或非線性特征、系統(tǒng)階數(shù)以及相對度等.仿真中給出的系統(tǒng)模型僅是為了產(chǎn)生系統(tǒng)的I/O數(shù)據(jù),并不參與控制器的設(shè)計. 考慮非線性系統(tǒng)結(jié)構(gòu)如下: 期望輸出信號為 受控系統(tǒng)的初始條件設(shè)置為u(0,1)=0,y(0,1)=3.偽偏導(dǎo)數(shù)初值設(shè)置為??(1:2,i)=0.5.算法中的步長因子選取為μ=1,η=1,ρ=0.2,λ=0.15,參數(shù)ε設(shè)為10?5,量化器編碼解碼機制中的調(diào)節(jié)參數(shù)b(i) 仿真結(jié)果如圖3–6所示,由圖3仿真結(jié)果可以看出,當(dāng)?shù)螖?shù)為60次時,系統(tǒng)量化輸出(k+1,i)、實際輸出y(k+1,i)與期望軌跡3條曲線基本重復(fù),這表明系統(tǒng)的跟蹤性能在第60次迭代時就達到跟蹤誤差為零的目標.圖4與圖5挑出第8,15,60次迭代時的系統(tǒng)輸出、實際輸出與期望軌跡,更直觀的表示出系統(tǒng)隨迭代軸的跟蹤性能變化.最后,取出每次迭代過程中的最大跟蹤誤差做出圖6,從迭代域顯示了所提方法的有效性. 圖3 第8,15,60次迭代時的系統(tǒng)實際輸出y(k+1,i)曲線與期望軌跡Fig.3 Actual output y(k+1,i)of the system at the 8th,15th,and 60th iterations and desired trajectory curve 圖4 第8,15,60次迭代時的系統(tǒng)量化輸出(k+1,i)曲線與期望軌跡Fig.4 System quantized output (k+1,i)of the system at the 8th,15th,and 60th iterations and desired trajectory curve 圖5 第60次迭代時系統(tǒng)量化輸出(k+1,i)、實際輸出y(k+1,i)與期望軌跡Fig.5 System quantized output (k+1,i),actual output y(k+1,i)and expected trajectory at the 60th iteration 圖6 系統(tǒng)沿迭代軸最大跟蹤誤差Fig.6 Maximum tracking error of the system along the iterative axis 通過仿真實驗結(jié)果,可以看出系統(tǒng)在考慮數(shù)據(jù)量化過程后,僅需要很少次數(shù)的重復(fù)迭代過程就可以實現(xiàn)較好的數(shù)據(jù)傳輸,仍能實現(xiàn)系統(tǒng)對期望軌跡的完全跟蹤. 本文針對一類非線性離散時間SISO系統(tǒng),提出了一種基于編碼解碼量化機制的無模型自適應(yīng)迭代學(xué)習(xí)控制方案.并通過壓縮映射的方法給出了系統(tǒng)收斂結(jié)果的充分條件.結(jié)果表明,所提算法對于存在數(shù)據(jù)量化的非線性系統(tǒng),仍能保證系統(tǒng)的收斂性.該控制方案僅利用較少被控系統(tǒng)的I/O數(shù)據(jù),就使得被控非線性系統(tǒng)在傳輸帶寬有限的情況下,仍能完成對期望軌跡的完全跟蹤.在未來的研究中,將考慮把所得結(jié)果擴展到非線性多輸入多輸出(MIMO)系統(tǒng)中.5 仿真示例
6 結(jié)論