武俊峰,郭旭飛
(1.黑龍江科技大學(xué) 電氣與控制工程學(xué)院, 哈爾濱 150022; 2.哈爾濱理工大學(xué) 自動(dòng)化學(xué)院, 哈爾濱 150080)
倒立擺控制系統(tǒng)具有典型的快速性、不穩(wěn)定性、多變性、強(qiáng)耦合性以及高階次等特性[1]。通過倒立擺系統(tǒng)的控制研究可以有效解決譬如非線性、魯棒性、隨動(dòng)性等問題,探究新型控制理論與智能算法的準(zhǔn)確度及其在實(shí)踐過程中的可行性,其中穩(wěn)定性與抗干擾性是評估控制理論與控制方式是否有效的重要指標(biāo)。作為經(jīng)典的非線性控制系統(tǒng),擺桿個(gè)數(shù)的增加致使倒立擺控制系統(tǒng)相對能控度的降低,直線二級倒立擺系統(tǒng)的相對能控度為0.008 2,而直線三級倒立擺系統(tǒng)的相對能控度則降低至0.004 6,相對能控度系數(shù)越小表明倒立擺系統(tǒng)各個(gè)變量之間的復(fù)雜程度越高,進(jìn)而導(dǎo)致倒立擺系統(tǒng)越難控制[2]。近年來,眾多學(xué)者對直線三級倒立擺控制系統(tǒng)進(jìn)行了研究,提出了H_∞魯棒控制、遺傳神經(jīng)網(wǎng)絡(luò)控制、CGA優(yōu)化改進(jìn)型T-S模糊神經(jīng)網(wǎng)絡(luò)控制、RBF-ARX建模與云推理控制、模糊控制、參數(shù)自適應(yīng)模糊PI控制等控制方法。LQR控制器作為現(xiàn)代控制理論中發(fā)展最早且相對更為成熟的狀態(tài)空間設(shè)計(jì)方法,面對不同的控制系統(tǒng)都具備較強(qiáng)的魯棒性以及較好的動(dòng)態(tài)性能[3]。因此,筆者利用LQR控制算法原理對直線三級倒立擺控制系統(tǒng)設(shè)計(jì)LQR控制器,采用PSO-AFSA算法優(yōu)化加權(quán)系數(shù),通過系統(tǒng)模型仿真驗(yàn)證PSO-AFSA算法優(yōu)化參數(shù)對于直線三級倒立擺系統(tǒng)動(dòng)態(tài)穩(wěn)定性以及抗干擾性的提升效果。
為了簡化直線三級倒立擺控制系統(tǒng),忽略空氣阻力與各種摩擦力的影響,將擺桿認(rèn)定為剛體。直線三級倒立擺的結(jié)構(gòu)模型如圖1所示。小車質(zhì)量mc為1.096 kg,擺桿m1質(zhì)量為0.05 kg,擺桿2質(zhì)量m2為0.06 kg,擺桿3質(zhì)量m3為0.13 kg,擺桿1中心到轉(zhuǎn)動(dòng)中心的距離L1為0.077 5 m,擺桿2中心到轉(zhuǎn)動(dòng)中心的距離L2為0.10 m,擺桿3中心到轉(zhuǎn)動(dòng)中心的距離L3為0.25 m,擺桿1與豎直方向的夾角為θ1,擺桿2與豎直方向的夾角為θ2,擺桿3與豎直方向的夾角為θ3。
利用拉格朗日推導(dǎo)運(yùn)動(dòng)學(xué)方程,拉格朗日方程為
式中:L——拉格朗日算子;
Q——系統(tǒng)的廣義坐標(biāo);
T——系統(tǒng)的動(dòng)能;
V——系統(tǒng)的勢能。
圖1 直線三級倒立擺物理模型 Fig. 1 Physical model of Three-stage inverted pendulum
式中:Fi——系統(tǒng)在第i個(gè)廣義坐標(biāo)上的外力,i=1,2,3,…,n;
x、θ1、θ2、θ3——系統(tǒng)的廣義坐標(biāo)。
(1)
將式(1)在平衡位置附近進(jìn)行泰勒級數(shù)展開,線性化得
式中,kij——Fi對其第j個(gè)變量的偏微分系數(shù)。
通過Mathematics程序運(yùn)算可得系統(tǒng)的狀態(tài)方程:
(2)
A=
B=[0 0 0 0 1 6.649 04
-0.158 31 0.003 182 11]T;
分析式(2)可以發(fā)現(xiàn),作為自然不穩(wěn)定系統(tǒng)的直線三級倒立擺,其狀態(tài)與輸出均是可控的,同時(shí)系統(tǒng)具有可觀測性。但是直線三級倒立擺控制系統(tǒng)不具收斂性,需要設(shè)計(jì)控制器對系統(tǒng)進(jìn)行穩(wěn)定控制[3]。
系統(tǒng)的性能指標(biāo)J的表達(dá)式為
(3)
式中:Q——狀態(tài)變量的加權(quán)矩陣;
R——輸入變量的加權(quán)矩陣;
tf——終止時(shí)間;
t0——初始時(shí)間;
S——約束條件。
由式(3)可知,直線三級倒立擺控制系統(tǒng)有8個(gè)狀態(tài)變量、1個(gè)輸入變量。由于直線三級倒立擺控制系統(tǒng)是單輸入系統(tǒng),因此,R矩陣可以設(shè)定為1。LQR控制器中的Q矩陣對角線上各個(gè)權(quán)重系數(shù)分別表示控制系統(tǒng)中各項(xiàng)指標(biāo)誤差的相對重要性;R表示能量損耗的相對重要性,主要用于限制控制器的輸出量,以防輸出量過大造成系統(tǒng)無法得到有效控制。LQR控制器中Q矩陣的參數(shù)選取對于控制系統(tǒng)而言至為關(guān)鍵,對其控制性能影響最大。然而由于直線三級倒立擺控制系統(tǒng)的高階次特性,導(dǎo)致無法通過對直線三級倒立擺控制系統(tǒng)的分析實(shí)現(xiàn)Q和R矩陣各個(gè)權(quán)重系數(shù)范圍的初步確定。因此,需要根據(jù)仿真模型輸出的動(dòng)態(tài)響應(yīng)曲線判斷Q矩陣中各個(gè)權(quán)重系數(shù)大小對直線三級倒立擺控制系統(tǒng)的影響。
根據(jù)LQR控制器加權(quán)系數(shù)選取經(jīng)驗(yàn)可知,通常情況下Q矩陣中各個(gè)主要控制變量對應(yīng)的加權(quán)參數(shù)偏大,同時(shí)在一定限度內(nèi),Q矩陣中的權(quán)值越大,控制系統(tǒng)到達(dá)平衡狀態(tài)所需時(shí)間越短。在直線三級倒立擺控制系統(tǒng)中,小車位移、擺桿1角度、擺桿2角度以及擺桿3角度為主控變量,因此,忽略Q矩陣中q5、q6、q7、q8等4個(gè)權(quán)重變量對直線三級倒立擺控制系統(tǒng)造成的影響,設(shè)置為0。選取不同的Q矩陣參數(shù),經(jīng)過多次仿真實(shí)驗(yàn),通過直線三級倒立擺控制系統(tǒng)輸出的動(dòng)態(tài)響應(yīng)曲線變化情況可以發(fā)現(xiàn),q1和q2對直線三級倒立擺控制系統(tǒng)x、θ1、θ2、θ34個(gè)變量響應(yīng)狀態(tài)的影響遠(yuǎn)大于q3和q4對控制系統(tǒng)變量造成的影響,并且q3對于直線三級倒立擺控制系統(tǒng)的影響程度高于q4,其規(guī)律可以描述為q1,q2>q3>q4。按照上述規(guī)律,利用仿真試湊法,綜合考慮多種影響因素,選取LQR控制器的Q為
運(yùn)行程序得到直線三級倒立擺狀態(tài)方程的狀態(tài)反饋增益矩陣為
K=[-22.360 7 254.349 9 -363.089 3871.216 8 -31.477 0 12.990 4-21.923 6 137.756 1]。
人工魚群算法(AFSA)與粒子群算法(PSO)均屬于群體智能算法。人工魚群算法(AFSA)模擬魚群的覓食、聚群、追尾、隨機(jī)等主要行為,跳出局部極值的尋優(yōu)能力強(qiáng),但是迭代速度慢[5]。粒子群算法(PSO)模仿鳥群的覓食行為,快速收斂能力強(qiáng)且簡單可行,但是算法后期跳出局部最優(yōu)值的能力弱[6]。PSO-AFSA融合PSO與AFSA雙方的優(yōu)勢,PSO粒子的飛行速度屬性可以加快人工魚群的收斂速度,PSO粒子的慣性權(quán)重屬性能夠增強(qiáng)人工魚群承載速度的能力[7]。精英魚群的設(shè)立能夠有效融合PSO與AFSA算法的特性進(jìn)而提升綜合算法的收斂性。PSO-AFSA算法優(yōu)化流程如圖2所示。
圖2 PSO-AFSA算法優(yōu)化流程Fig. 2 PSO-AFSA algorithm optimization flow
(1)隨機(jī)初始化N條人工魚,設(shè)置人工魚群的視野V、步長S、擁擠度因子δ、最大嘗試次數(shù)Nt、外部最大迭代次數(shù)Nmax等參數(shù)。
(2)通過運(yùn)算得出每條人工魚的適應(yīng)度數(shù)值J,挑選出Ne個(gè)滿足條件的人工魚組成精英魚群,其余人工魚定義為普通魚群Xn,篩選出適應(yīng)度數(shù)值最大的J計(jì)入公告牌Jb。
(3)利用PSO算法更新Xe,在PSO內(nèi)部進(jìn)行nmax次循環(huán)尋優(yōu)。
(4)利用AFSA中的聚群及追尾行為更新Xn,選取適應(yīng)度數(shù)值較大的作為更新結(jié)果進(jìn)行下一步操作。
(5)比較J以及Jb的數(shù)值大小,判定適應(yīng)度數(shù)值J是否變化,若數(shù)值增大則更新Jb;若數(shù)值減小則利用覓食算子Fp更新Xn。
(6)計(jì)算更新后的Xe及Xn的所對應(yīng)的適應(yīng)度,并與公告牌Jb進(jìn)行大小對比,如果數(shù)值增大,則將其數(shù)值賦給公告牌Jb。
(7)當(dāng)所有的人工魚更新完成,判定是否達(dá)到終止條件,若達(dá)到終止條件則輸出最后確定的最優(yōu)化適應(yīng)度數(shù)值Jb,算法流程結(jié)束[8]。
適應(yīng)度函數(shù)LQR的性能指標(biāo)為
(4)
PSO-AFSA仿真過程中各個(gè)參數(shù)設(shè)置為:人工魚數(shù)量100、最大迭代次數(shù)500、覓食最大嘗試次數(shù)50、精英魚群數(shù)量50、PSO內(nèi)部循環(huán)次數(shù)10、慣性權(quán)重1.5、擁擠度因子0.618、移動(dòng)步長0.2、飛行速度[-1,1]、視野1。通過PSO-AFSA算法優(yōu)化后的加權(quán)矩陣Q為對角矩陣其值分別為1 792.56、1 153.55、976.95、695.16、13.53、7.27、35.84、22.37,加權(quán)矩陣R為1。
設(shè)置直線三級倒立擺控制系統(tǒng)各個(gè)狀態(tài)量的初始值為
擺桿1的初始角度設(shè)置為0.05 rad,擺桿2的初始角度設(shè)置為-0.05 rad,擺桿3的初始角度設(shè)置為0.05 rad,仿真時(shí)間設(shè)置為10 s,仿真步長設(shè)置為0.02,運(yùn)行直線三級倒立擺仿真模型獲取小車位移仿真響應(yīng)曲線如圖3所示。
圖3 PSO-AFSA優(yōu)化前后小車位移仿真對比曲線Fig. 3 Comparison curve of carriage shift simulation before and after PSO-AFSA optimization
通過圖3可以看出,PSO-AFSA算法優(yōu)化后的直線三級倒立擺小車位移的超調(diào)量明顯減少,表明系統(tǒng)平衡性增強(qiáng)。
擺桿1、2、3角度的仿真響應(yīng)曲線如圖4所示。
圖4 PSO-AFSA優(yōu)化前后擺桿1、2、3角度仿真對比曲線Fig. 4 Comparison curve of 1、2、3 angle simulation of PSO-AFSA optimized pendulum bar
由圖4可以看出,PSO-AFSA算法優(yōu)化后的直線三級倒立擺擺桿1、2、3角度的超調(diào)量明顯減少,曲線更加平滑,系統(tǒng)穩(wěn)定性增強(qiáng)。
綜上所述,PSO-AFSA優(yōu)化后的直線三級倒立擺控制系統(tǒng)中擺桿1、擺桿2和擺桿3的超調(diào)量明顯減少,同時(shí)具有較好的穩(wěn)定性;PSO-AFSA優(yōu)化前系統(tǒng)到達(dá)平衡位置需要大約4.0 s的時(shí)間,PSO-AFSA優(yōu)化后系統(tǒng)到達(dá)動(dòng)態(tài)平衡位置約3.2 s,表明PSO-AFSA算法優(yōu)化后的直線三級倒立擺控制系統(tǒng)受到干擾后,經(jīng)過一定時(shí)間可以更快地達(dá)到動(dòng)態(tài)平衡,抗干擾能力更強(qiáng)。
針對直線三級倒立擺系統(tǒng)設(shè)計(jì)的LQR控制器基本實(shí)現(xiàn)了對系統(tǒng)的有效控制。直線三級倒立擺控制系統(tǒng)中的小車位移、擺桿1、2、3角度等狀態(tài)變量從不同的初始位置開始,經(jīng)過約4.0 s時(shí)間的調(diào)節(jié)后趨向于動(dòng)態(tài)穩(wěn)定平衡,同時(shí)具有較強(qiáng)的抗干擾能力。而PSO-AFSA算法優(yōu)化后的直線三級倒立擺控制系統(tǒng)的各個(gè)變量超調(diào)量明顯減少,系統(tǒng)更加穩(wěn)定,同時(shí)達(dá)到動(dòng)態(tài)平衡的時(shí)間大約縮減為3.2 s,表明系統(tǒng)的穩(wěn)定性以及抗干擾性更強(qiáng)。通過仿真驗(yàn)證了PSO-AFSA融合算法在優(yōu)化直線三級倒立擺控制系統(tǒng)性能方面的可行性以及有效性。因此,可以在文中的基礎(chǔ)上對直線三級倒立擺實(shí)物進(jìn)行實(shí)時(shí)控制,檢驗(yàn)智能算法優(yōu)化高維度控制系統(tǒng)在實(shí)踐方面的可行性以及有效性。