張克軍, 劉 芳, 劉萬(wàn)利
(徐州工程學(xué)院數(shù)理學(xué)院,徐州 221018)
廣義系統(tǒng)[1]又稱為奇異系統(tǒng),是客觀系統(tǒng)自然表示的一種,可以更好地刻畫描述客觀系統(tǒng)的性能特征,與正常系統(tǒng)相比,其形式更具廣泛性。自20世紀(jì)70年代廣義系統(tǒng)被提出以來,其理論不斷完善、發(fā)展,在航空航天、能源、石油、化工和通信等諸多領(lǐng)域被廣泛應(yīng)用,這使得廣義系統(tǒng)及其理論的研究深受許多學(xué)者的青睞。
迭代學(xué)習(xí)控制[2]是智能控制的重要分支之一,適用于具有重復(fù)運(yùn)行性質(zhì)的動(dòng)力學(xué)系統(tǒng),在不依賴系統(tǒng)精確模型的情況下,就可實(shí)現(xiàn)對(duì)期望輸出的精確跟蹤。然而,現(xiàn)有的關(guān)于迭代學(xué)習(xí)控制的理論和應(yīng)用研究主要是針對(duì)常義系統(tǒng)的。與之相比,由于廣義系統(tǒng)存在脈沖項(xiàng),對(duì)廣義系統(tǒng)的迭代學(xué)習(xí)控制進(jìn)行研究要困難得多,相關(guān)研究成果也遜色不少。采用分塊矩陣的思想,在對(duì)線性廣義系統(tǒng)進(jìn)行奇異值分解后,文獻(xiàn)[3]提出了一種新的控制算法,并對(duì)算法的收斂性進(jìn)行了理論分析。借助矩陣?yán)碚摵筒坏仁郊记桑墨I(xiàn)[4-5]分別討論了線性廣義系統(tǒng)在四種類型迭代學(xué)習(xí)控制算法下的收斂性問題。針對(duì)帶控制時(shí)滯廣義系統(tǒng)和單個(gè)狀態(tài)時(shí)滯的廣義系統(tǒng),結(jié)合矩陣廣義逆理論,文獻(xiàn)[6-7]分別討論了PID型、閉環(huán)PD型迭代學(xué)習(xí)算法收斂條件。文獻(xiàn)[8]提出了一類廣義系統(tǒng)的二階迭代學(xué)習(xí)控制算法,并借助Qp因子討論了算法的收斂速度問題。文獻(xiàn)[9]研究了一類線性廣義系統(tǒng)在固定初值下的閉環(huán)PD型和D型迭代學(xué)習(xí)控制算法的收斂條件,并對(duì)算法的收斂性進(jìn)行了證明。針對(duì)一類線性廣義系統(tǒng),文獻(xiàn)[10]研究了一種帶指數(shù)變?cè)鲆娴拈]環(huán)D型學(xué)習(xí)算法的收斂性。一些學(xué)者對(duì)離散廣義系統(tǒng)也有研究,例如:文獻(xiàn)[11]對(duì)一類離散廣義系統(tǒng)的PD型迭代學(xué)習(xí)控制算法的跟蹤問題進(jìn)行了討論,此類研究還有文獻(xiàn)[12];此外,在離散頻域中,針對(duì)一類連續(xù)線性廣義系統(tǒng),文獻(xiàn)[13]討論了P型迭代學(xué)習(xí)控制算法的收斂性態(tài)問題。
在理論分析過程中,在度量跟蹤誤差時(shí),上述文獻(xiàn)主要采用λ范數(shù)。但是,當(dāng)參數(shù)λ取值比較大時(shí),雖然能夠滿足控制算法的收斂條件,但在系統(tǒng)重復(fù)運(yùn)行時(shí),暫態(tài)跟蹤誤差的最大值落在實(shí)際工程應(yīng)用的容許范圍之外,導(dǎo)致系統(tǒng)崩潰[14-15]。在文獻(xiàn)[16-17]中,阮小娥等利用Lebesgue-p(Lp)范數(shù)研究了線性時(shí)不變系統(tǒng)P型和PD型迭代學(xué)習(xí)控制算法的收斂性,發(fā)現(xiàn)系統(tǒng)的收斂條件不依賴參數(shù)λ的取值,主要取決于系統(tǒng)本身屬性和學(xué)習(xí)增益矩陣。進(jìn)一步,在Lp范數(shù)意義下,文獻(xiàn)[18-20]討論了分?jǐn)?shù)階線性系統(tǒng)的分?jǐn)?shù)階迭代學(xué)習(xí)控制算法的收斂性問題。受此啟發(fā),在對(duì)線性廣義系統(tǒng)進(jìn)行非奇異變換的基礎(chǔ)上,利用Lp范數(shù)對(duì)一、二階P型迭代學(xué)習(xí)控制算法的收斂條件進(jìn)行分析;然后,利用Qp因子方法對(duì)兩種控制算法的收斂速度進(jìn)行對(duì)比,并通過仿真實(shí)驗(yàn)驗(yàn)證理論的正確性。
下面列出理論分析需要的一些相關(guān)數(shù)學(xué)知識(shí)。
考慮如下連續(xù)線性廣義系統(tǒng):
(1)
式(1)中,x(t)∈Rn、u(t)∈Rm、y(t)∈Rq分別為系統(tǒng)狀態(tài)量、控制輸入量和系統(tǒng)輸出量;A∈Rn×n、B∈Rn×m、C∈Rq×n為定常矩陣;E∈Rn×n是一奇異矩陣,即rank(E)=r (2) 其中,A11∈Rr×r,A12∈Rr×(n-r),A21∈R(n-r)×r,A22∈R(n-r)×(n-r),B1∈Rr×m,B2∈R(n-r)×m。 則式(2)變?yōu)?/p> (3) 為了證明方便,下面給出算法的合理假設(shè)。 假設(shè)1對(duì)于在[0,T]上可微的期望輸出yd(t),有唯一的理想控制輸入ud(t),使得系統(tǒng)的狀態(tài)和輸出為xd(t)和yd(t)。 假設(shè)2A22可逆。 設(shè)初次的控制輸入u1(t)(t∈[0,T])為一任意值。二階P型迭代學(xué)習(xí)控制算法LP(γ1,γ2)的表達(dá)式如下: (4) 式(4)中,Γ1和Γ2表示比例學(xué)習(xí)增益矩陣,加權(quán)系數(shù)γ1和γ2滿足:0≤γ1≤1、0≤γ2≤1且γ1+γ2=1;ek(t)=yd(t)-yk(t),表示第k次迭代時(shí)系統(tǒng)的跟蹤誤差。 當(dāng)γ1→1-時(shí),LP(γ1,γ2)趨于一階P型控制算法LP(1),其表達(dá)式如下: uk+1(t)=uk(t)+Γ1ek(t),k=1,2,3,… (5) 證明:由式(3)和假設(shè)2,可得: (6) (7) 所以: (8) 記: Δxk(t)=xd(t)-xk(t) (9) Δuk(t)=ud(t)-uk(t) (10) 由于: (11) 根據(jù)假設(shè)3,可得: (12) (13) 因此: ek(t)=yd(t)-yk(t)=CΔxk(t)= (14) 由式(4),可得: (15) 式(15)兩端取Lp范數(shù),并應(yīng)用卷積的推廣Young不等式,得: (16) 由定理?xiàng)l件,可知: γ1ρ1+γ2ρ2<1 (17) 根據(jù)引理2,可得: (18) 由式(14),可得: (19) 式(19)兩端取Lp范數(shù),并應(yīng)用卷積的推廣Young不等式,得: (20) 當(dāng)γ1→1-時(shí),二階P型控制算法LP(γ1,γ2)趨于一階算法LP(1),當(dāng)LP(1)施加于線性廣義系統(tǒng)[式(1)]時(shí),有如下結(jié)論。 根據(jù)Qp因子的大小,可判斷控制算法收斂速度[16]。利用Qp因子方法,比較了兩種P型控制算法[式(4)、式(5)]的收斂速度,獲得以下結(jié)論: 注:從定理證明過程可知,在Lp范數(shù)意義下,跟蹤誤差的度量和控制算法的收斂性分析不受λ取值的影響。 考慮如下線性廣義系統(tǒng): (21) 在二階P型控制算法(4)中,取Γ1=0.25,Γ2=0.6,γ1=0.5,γ2=0.5,計(jì)算可得ρ1=0.589 8<1,ρ2=0.175 6<1,滿足定理的條件。在控制算法[式(4)]作用于下,廣義系統(tǒng)[式(21)]的第4次、第6次的實(shí)際輸出與期望輸出yd(t)如圖1所示。發(fā)現(xiàn),當(dāng)?shù)螖?shù)逐漸增大時(shí),可以實(shí)現(xiàn)系統(tǒng)實(shí)際輸出對(duì)期望輸出的完全跟蹤。 當(dāng)二階P型控制算法[式(4)]作用于廣義系統(tǒng)[式(21)]時(shí),圖2給出了在上確界范數(shù)和L2范數(shù)的意義下,系統(tǒng)跟蹤誤差曲線的變化趨勢(shì)。從圖2中可以發(fā)現(xiàn),當(dāng)?shù)螖?shù)逐漸增加時(shí),在兩種范數(shù)意義下,跟蹤誤差都單調(diào)趨于0。 圖1 系統(tǒng)輸出的跟蹤效果Fig.1 Tracking effect of system output 圖2 兩種范數(shù)意義下的跟蹤誤差Fig.2 Tracking errors in the sense of two norms 圖3 跟蹤誤差對(duì)比Fig.3 Comparison of tracking errors 在對(duì)線性廣義系統(tǒng)進(jìn)行非奇異變換的基礎(chǔ)上,在Lp范數(shù)意義下,本文利用卷積的推廣Young不等式,研究了一、二階P型迭代學(xué)習(xí)控制算法的收斂性,獲得其收斂的條件,并利用Qp因子方法比較了兩種控制算法的收斂速度。結(jié)果表明,控制算法的收斂條件、收斂速度與學(xué)習(xí)增益矩陣以及系統(tǒng)本身屬性有關(guān);如果選取合適的學(xué)習(xí)增益矩陣,則二階P型控制算法的收斂速度要比一階的快。這種研究方法,可用于繼續(xù)分析非線性廣義系統(tǒng)的收斂性態(tài)。3 數(shù)值仿真
4 結(jié)論