張克軍, 彭國華, 杜永軍
(1.徐州工程學(xué)院 數(shù)學(xué)與統(tǒng)計學(xué)院, 江蘇 徐州 221018; 2.西北工業(yè)大學(xué) 數(shù)學(xué)與統(tǒng)計學(xué)院, 陜西 西安 710129; 3.蘭州理工大學(xué) 經(jīng)濟管理學(xué)院, 甘肅 蘭州 730050)
隨著分?jǐn)?shù)階微積分理論和其他智能優(yōu)化算法的發(fā)展,對于復(fù)雜度不斷提高的控制系統(tǒng),為了實現(xiàn)對其輸出軌跡的精確跟蹤,一些學(xué)者提出了分?jǐn)?shù)階迭代學(xué)習(xí)控制算法.2001年,陳陽泉等[1]首次提出了Dα型分?jǐn)?shù)階迭代學(xué)習(xí)控制算法,將迭代學(xué)習(xí)控制的應(yīng)用從整數(shù)階系統(tǒng)擴展到了分?jǐn)?shù)階系統(tǒng).經(jīng)過二十年的發(fā)展,針對不同類型的分?jǐn)?shù)階系統(tǒng),Lazarevi、李巖、蘭永紅等[2-12]對分?jǐn)?shù)階迭代學(xué)習(xí)控制算法的收斂性和魯棒性等學(xué)習(xí)性態(tài)進行了深入研究,并取得了一系列的成果.
與線性系統(tǒng)相比,分?jǐn)?shù)階非線性系統(tǒng)在自然界和工程技術(shù)領(lǐng)域里更具有普遍性,對其研究也更加復(fù)雜,相應(yīng)的成果也不多.對于分?jǐn)?shù)階非線性系統(tǒng),李巖等[13]利用上確界范數(shù)討論了開環(huán)P型迭代學(xué)習(xí)算法的學(xué)習(xí)性態(tài).針對一類單輸入單輸出的分?jǐn)?shù)階非線性系統(tǒng),蘭永紅等[14]對高階開環(huán)P型迭代學(xué)習(xí)算法的收斂性進行了探索性研究.進一步,針對單輸入單輸出的分?jǐn)?shù)階非線性時滯系統(tǒng),蘭永紅等[15-16]分別分析了一階、二階P型迭代學(xué)習(xí)算法的收斂性問題.類似的研究還有文獻[17,18].此外,對于任意初態(tài)的分?jǐn)?shù)階非線性系統(tǒng),Lan[19]提出了基于初值學(xué)習(xí)的開環(huán)和閉環(huán)P 型迭代學(xué)習(xí)算法,獲得了系統(tǒng)跟蹤誤差收斂的充分條件.
在上述研究分?jǐn)?shù)階非線性系統(tǒng)的迭代學(xué)習(xí)算法收斂性的文獻中,主要研究了P型迭代學(xué)習(xí)算法的收斂性,而關(guān)于PDα型分?jǐn)?shù)階迭代學(xué)習(xí)算法收斂性的研究還很少.李蕾等[20]對一類單輸入單輸出(SISO)的分?jǐn)?shù)階非線性連續(xù)系統(tǒng)的PDα型分?jǐn)?shù)階迭代學(xué)習(xí)算法的收斂性進行了討論.然而,上述研究只是針對分?jǐn)?shù)階仿射非線性連續(xù)系統(tǒng)的,限制了其應(yīng)用的范圍.
在現(xiàn)有的研究迭代學(xué)習(xí)控制的文獻中,一般采用λ范數(shù)進行范數(shù)理論分析,然而,這種方法是有缺陷的.比如,當(dāng)λ取值很大時,雖然可以在理論上保證控制算法是收斂的,但是在系統(tǒng)重復(fù)運行時,其瞬時跟蹤誤差的上確界值超出了工程實際應(yīng)用的容許范圍,由于誤差的累積導(dǎo)致整個系統(tǒng)不能正常運行[21-22].與λ范數(shù)相比,Lebesgue-p(Lp)范數(shù)不僅考慮了函數(shù)f在每個運行時刻函數(shù)值p次方的積分,而且考慮了函數(shù)f在整個運行區(qū)間上的上確界值.因此,在量化和反映函數(shù)f的性態(tài)方面,Lp范數(shù)更有優(yōu)勢[23].
受上述問題的啟發(fā),對于一類更一般的SISO分?jǐn)?shù)階非線性連續(xù)系統(tǒng),本文利用卷積的推廣Young不等式和Lp范數(shù),對開環(huán)、閉環(huán)以及開閉環(huán)PDα型分?jǐn)?shù)階迭代學(xué)習(xí)算法收斂的充分條件進行了討論,并利用仿真實驗驗證了理論的正確性和可行性.
定義1設(shè)f:[0,T]→Rn為一連續(xù)向量函數(shù)(f(t)=[f1(t),f2(t),…,fn(t)]T),其上確界范數(shù)與Lp范數(shù)分別為
定義2[24]函數(shù)f(t)在[t0,t]上的α階分?jǐn)?shù)階積分與Caputo型α階導(dǎo)數(shù)分別為
其中:α∈R+;[α]為α的整數(shù)部分;Γ(·)為Gamma函數(shù).
引理2[25]設(shè)f(x(t),t)是一連續(xù)函數(shù),則初值問題
的解等價的Volterra型非線性積分方程為
針對一類SISO的分?jǐn)?shù)階仿射非線性連續(xù)系統(tǒng):
(1)
李蕾[20]討論了PDα型分?jǐn)?shù)階迭代學(xué)習(xí)控制算法的收斂性問題.下面,本文考慮一類更一般的SISO分?jǐn)?shù)階非線性連續(xù)系統(tǒng),具體描述如下:
(2)
其中:t∈[0,T],α∈(0,1);f(·)是結(jié)構(gòu)和參數(shù)未知的非線性向量函數(shù);xk(0)∈Rn為系統(tǒng)的初態(tài);xk(t)∈Rn、uk(t)∈R、yk(t)∈R分別為系統(tǒng)的狀態(tài)向量、控制輸入和系統(tǒng)輸出;C∈R1×n為常數(shù)矩陣.
為了證明方便,給出文中算法的合理假設(shè):
假設(shè)1分?jǐn)?shù)階非線性系統(tǒng)(2)在固定區(qū)間[0,T]上重復(fù)運行時,系統(tǒng)的初態(tài)等于期望初態(tài),即對于?k∈N+,有xk(0)=xd(0).
假設(shè)2分?jǐn)?shù)階非線性系統(tǒng)(2)的期望輸出yd(t)在[0,T]上α階微分存在;對于給定的yd(t),存在唯一期望控制輸入ud(t)和理想狀態(tài)xd(t),使得
(3)
其中:kf為大于零的常數(shù).
假設(shè)4函數(shù)f關(guān)于uk(t)的導(dǎo)數(shù)存在,關(guān)于xk(t)的每個分量的偏導(dǎo)數(shù)都存在,且滿足下列條件:
其中:γ1、γ2和M2均為大于零的常數(shù).
(4)
其中:u1(t)為首次控制輸入,可取任意值;ΓP1、ΓD1分別為比例和微分學(xué)習(xí)增益;ΓP2、ΓD2分別為比例和微分反饋增益.
定理1設(shè)分?jǐn)?shù)階非線性系統(tǒng)(2)滿足假設(shè)1~4,當(dāng)開閉環(huán)PDα型控制算法(4)被應(yīng)用于系統(tǒng)(2)時,若滿足條件:
2)ρ2ρ1<1,其中:
證明設(shè)
由系統(tǒng)(2)可知:
ek(t)=yd(t)-yk(t)=CΔxk(t)
(7)
(8)
由式(4),可得
(9)
將式(7,8)代入式(9),得
Δuk+1(t)=Δuk(t)-
ΓP1CΔxk(t)-ΓP2CΔxk+1(t)-
ΓD1(Cfu(xd(t),ξu,k(t),t)Δuk(t)+
Cfx(ζx,k(t),uk(t),t)Δxk(t))-
ΓD2(Cfu(xd(t),ξu,k+1(t),t)Δuk+1(t)+
Cfx(ζx,k+1(t),uk+1(t),t)Δxk+1(t))=
(1-ΓD1Cfu(xd(t),ξu,k(t),t))Δuk(t)-
ΓP1CΔxk(t)-ΓP2CΔxk+1(t)-
ΓD2Cfu(xd(t),ξu,k+1(t),t)Δuk+1(t)-
ΓD1Cfx(ζx,k(t),uk(t),t)Δxk(t)-
ΓD2Cfx(ζx,k+1(t),uk+1(t),t)Δxk+1(t)
(10)
所以
(1+ΓD2Cfu(xd(t),ξu,k+1(t),t))Δuk+1(t)=
(1-ΓD1Cfu(xd(t),ξu,k(t),t))Δuk(t)-
ΓP1CΔxk(t)-ΓP2CΔxk+1(t)-
ΓD1Cfx(ζx,k(t),uk(t),t)Δxk(t)-
ΓD2Cfx(ζx,k+1(t),uk+1(t),t)Δxk+1(t)
(11)
式(11)兩邊同時取范數(shù),可得
(12)
因此
t|Δuk+1(t)|≤s|Δuk(t)|+
(13)
其中:
式(13)兩邊同時取Lp范數(shù),可得
(14)
根據(jù)引理2和系統(tǒng)(2),可得
(15)
所以
Δxk(t)=
(16)
式(16)兩邊同時取范數(shù),可得
(17)
進一步,式(17)兩邊同時取Lp范數(shù),可得
(18)
(19)
將式(19)代入式(14),得
(20)
因此
即
(21)
根據(jù)條件2),可得
(22)
由式(19,22),可得
(23)
對式(7)兩邊同時取Lp范數(shù),可得
(24)
進一步,由式(23,24),可得
所以
定理證畢.
當(dāng)ΓP2=ΓD2=0時,開閉環(huán)PDα型算法(4)退化為典型的一階開環(huán)PDα型算法:
(25)
當(dāng)開環(huán)PDα型算法(25)被應(yīng)用于系統(tǒng)(2)時,有如下結(jié)論:
定理2當(dāng)一階開環(huán)PDα型算法(25)被應(yīng)用于滿足假設(shè)1~4的分?jǐn)?shù)階非線性系統(tǒng)(2)時,若滿足條件:
2)0<ρ1<1,其中:
當(dāng)ΓP1=ΓD1=0時,開閉環(huán)PDα型算法(4)退化為一階閉環(huán)PDα型算法:
(26)
當(dāng)閉環(huán)PDα型算法(26)被應(yīng)用于系統(tǒng)(2)時,獲得以下結(jié)論:
定理3當(dāng)一階閉環(huán)PDα型控制算法(26)被應(yīng)用于滿足假設(shè)1~4的分?jǐn)?shù)階非線性系統(tǒng)(2)時,若滿足條件:
2)0<ρ2<1,其中:
注1與λ范數(shù)意義下的收斂條件ρ*=s·t-1<1(s=max{|1-ΓD1γ1|,|1-ΓD1γ2|},t=min{|1+ΓD2γ1|,|1+ΓD2γ2|})相比,對于SISO的分?jǐn)?shù)階非線性連續(xù)系統(tǒng),在Lp范數(shù)意義下,開閉環(huán)PDα型控制算法的收斂條件比較保守,但控制算法的收斂性分析和跟蹤誤差的度量不依賴參數(shù)λ的取值,只要滿足算法收斂的充分條件,隨著迭代次數(shù)的增加,就可保證系統(tǒng)輸出對期望輸出的精確跟蹤,無需調(diào)整系統(tǒng)運行區(qū)間或修改控制算法.
注2由定理1和定理2的收斂條件可知,當(dāng)ρ2ρ1<ρ1<1時,開閉環(huán)PDα型控制算法(4)的收斂速度比一階開環(huán)PDα型控制算法(25)的收斂速度快.
注3定理1的收斂條件ρ2ρ1<1不要求必須滿足ρ1<1或ρ2<1.因此,對于控制算法(4)中的增益,這里有更多的選擇.
為驗證理論分析的結(jié)果,考慮如下一類SISO的分?jǐn)?shù)階非線性系統(tǒng):
(27)
其中,系統(tǒng)的運行區(qū)間為[0,1].
由于
因此,kf=0.3,M2=0.3,γ1=γ2=0.42.
在一階開環(huán)PDα型控制算法(25)中,設(shè)置相關(guān)參數(shù)為:α=0.9,ΓP1=0.2,ΓD1=0.65,計算可得ρ1=0.977 3<1,滿足定理2的收斂條件.
當(dāng)開環(huán)PDα型算法(25)被應(yīng)用于分?jǐn)?shù)階非線性系統(tǒng)(27)時,圖1表示系統(tǒng)第6次、第15次運行時的系統(tǒng)輸出曲線,圖2為系統(tǒng)跟蹤誤差曲線在上確界范數(shù)和L2范數(shù)意義下的變化趨勢圖.
圖1 一階PDα型算法在第6和第15次迭代的輸出
圖2 一階PDα型算法的跟蹤誤差變化趨勢
由圖1和圖2可知,系統(tǒng)的實際輸出隨著迭代次數(shù)的遞增,實現(xiàn)了對期望輸出的完全跟蹤,且跟蹤誤差在兩種范數(shù)意義下均收斂到零.上述結(jié)果表明,對于分?jǐn)?shù)階非線性系統(tǒng)(27),PDα型算法(25)是可行的和有效的.
在開閉環(huán)PDα型控制算法(4)中,設(shè)置相關(guān)參數(shù)為:α=0.9,ΓP1=0.2,ΓD1=0.65,ΓP2=0.1,ΓD2=0.8.可以算出ρ1=0.977 3<1,ρ2=0.892 4<1,且ρ2ρ1<ρ1<1,滿足定理1和定理2的收斂條件.
在上述條件下,圖3給出了一階開環(huán)PDα型控制算法(25)、開閉環(huán)PDα型控制算法(4)分別被應(yīng)用于分?jǐn)?shù)階非線性系統(tǒng)(27)時,系統(tǒng)的跟蹤誤差變化曲線.
圖3 一階開環(huán)、開閉環(huán)PDα型算法的跟蹤誤差對比
由圖3可知,在L2范數(shù)意義下,隨著迭代次數(shù)的遞增,上述兩種情況下的跟蹤誤差均是收斂到零的.當(dāng)ρ2ρ1<ρ1<1時,系統(tǒng)在算法(4)作用下,只需要迭代9次,跟蹤誤差就能夠達到誤差范圍(0.001),而在傳統(tǒng)的一階開環(huán)PDα型算法(25)作用下,系統(tǒng)需要13次迭代,跟蹤誤差才能達到上述效果.可見,如果選取適當(dāng)?shù)脑鲆?,開閉環(huán)PDα型控制算法(4)擁有比開環(huán)PDα型控制算法(25)更快的收斂速度.這一結(jié)果與注2的結(jié)論是相符的.
針對一類SISO分?jǐn)?shù)階非線性系統(tǒng),本文以PDα型分?jǐn)?shù)階迭代學(xué)習(xí)算法為例,利用卷積的推廣Young不等式,研究了開環(huán)、閉環(huán)以及開閉環(huán)PDα型算法在Lp范數(shù)意義下收斂的充分條件,發(fā)現(xiàn):PDα型算法的收斂條件主要取決于算法的增益以及系統(tǒng)的自身屬性,且在選取適當(dāng)增益的情況下,開閉環(huán)PDα型算法擁有比開環(huán)算法更快的收斂速度.這些結(jié)論與分?jǐn)?shù)階線性系統(tǒng)的相關(guān)結(jié)論是一樣的.
本文只分析了SISO的分?jǐn)?shù)階非線性連續(xù)系統(tǒng)一階PDα型控制算法的收斂條件,類似地,可以繼續(xù)討論高階PDα型控制算法的收斂性和魯棒性問題.