李聯(lián)飛,李 文,史 偉,蘇振華,賈海亮
(1.中國重型機(jī)械研究院股份公司,陜西 西安 710032;2.日照鋼鐵控股集團(tuán)公司,山東 日照 276806)
針對眾多的被控對象,有很多被控對象難以建?;蛘吣P蛥?shù)存在著不確定性。盡管線性系統(tǒng)理論取得了極大的成功,然而解決諸如此類的問題遇到了很大的困難。幸運(yùn)的是被控對象很多具有自身穩(wěn)定的特性或者可以通過簡單的反饋實(shí)現(xiàn)自身的穩(wěn)定,這些可穩(wěn)定的被控對象可以運(yùn)用U模型進(jìn)行控制。
文獻(xiàn)1中作者提出了U模型控制方案,指出U模型同其他建模方法相比具有更好的線性非線性估計(jì)特性。論文2對U模型進(jìn)行了詳細(xì)的論述,并通過幾種典型模型的仿真驗(yàn)證了U模型控制方案的有效性。
本文針對被控對象設(shè)計(jì)了兩種不同結(jié)構(gòu)的辨識網(wǎng)絡(luò),對同一系統(tǒng)采用兩種不同的辨識策略,而這兩種辨識策略結(jié)構(gòu)較為簡單,能夠方便的進(jìn)行實(shí)時(shí)操作。一種采用U模型網(wǎng)絡(luò)結(jié)構(gòu)利用NLMS算法進(jìn)行網(wǎng)絡(luò)參數(shù)的調(diào)整,另外一種采用U模型同神經(jīng)網(wǎng)絡(luò)相結(jié)合的網(wǎng)絡(luò)結(jié)構(gòu),利用BP學(xué)習(xí)算法進(jìn)行網(wǎng)絡(luò)參數(shù)的調(diào)整。通過對當(dāng)前輸入的網(wǎng)絡(luò)參數(shù)多項(xiàng)式函數(shù)求根,獲得相應(yīng)的控制輸入量;進(jìn)而通過求得關(guān)于兩個(gè)網(wǎng)絡(luò)辨識誤差的偏差函數(shù),獲得控制量的加權(quán)系數(shù);最終通過控制量加權(quán)得到實(shí)際的控制輸入。由于采用了多辨識器結(jié)構(gòu),進(jìn)而提高了系統(tǒng)運(yùn)行的可靠性。仿真研究表明加權(quán)后的控制量能夠更好的結(jié)合兩個(gè)網(wǎng)絡(luò)的長處,提高跟蹤的快速性及跟蹤精度。
U模型是一種面向控制的非線性建模方法,根據(jù)辨識器參數(shù)采用求根的方式得到實(shí)際的控制量,簡化了控制器的設(shè)計(jì),一旦辨識網(wǎng)絡(luò)跟蹤誤差達(dá)到設(shè)定的跟蹤精度,控制器將投入使用,完成對實(shí)際系統(tǒng)的控制。
U模型內(nèi)部網(wǎng)絡(luò)由基于當(dāng)前控制輸入的多項(xiàng)式網(wǎng)絡(luò)以及基于歷史輸入的非線性網(wǎng)絡(luò)組成,網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示:
圖1 U模型結(jié)構(gòu)圖
圖中,u為辨識器輸入,φ1,φ2,φ3…為關(guān)于當(dāng)前輸入的多項(xiàng)式函數(shù),b1,b2,b3…為關(guān)于當(dāng)前輸入函數(shù)的加權(quán)系數(shù),φ1,φ2,φ3…為關(guān)于歷史輸入的非線性函數(shù),ω1,ω2,ω3…為關(guān)于歷史輸入函數(shù)的加權(quán)系數(shù)。
ym(k)=b1φ1(u(k))+b2φ2(u(k))+
…+bmφm(u(k))+ω1φ1(u(k-1))+
ω2φ2(u(k-2))+…ωnφn(u(k-n))
(1)
式中,m,n分別表示關(guān)于當(dāng)前輸入以及歷史輸入函數(shù)的數(shù)目。
其中關(guān)于當(dāng)前輸入的多項(xiàng)式函數(shù)φl(u(k))=ul(k)l=1,2,…,m
關(guān)于歷史輸入的非線性函數(shù)可以選取為典型的網(wǎng)絡(luò)函數(shù),例如高斯函數(shù)
(2)
一旦網(wǎng)絡(luò)的結(jié)構(gòu)確定完成后,網(wǎng)絡(luò)的權(quán)值包括圖1所示的加權(quán)系數(shù),而不把非線性函數(shù)的內(nèi)部參數(shù)作為加權(quán)系數(shù),在這種條件下可以采用典型的NLMS算法進(jìn)行網(wǎng)絡(luò)權(quán)值的實(shí)時(shí)更新,進(jìn)而使得網(wǎng)絡(luò)權(quán)值趨向于實(shí)時(shí)的最優(yōu)權(quán)值。
Wk,e(k),x(k)表示第k次迭代時(shí)的權(quán)向量,誤差以及輸入向量(多項(xiàng)式函數(shù),非線性函數(shù)函數(shù)值)。
(3)
ε為很小的正數(shù)保證有界,μ為學(xué)習(xí)因子,用以確保算法收斂。
通過預(yù)先的開環(huán)控制,在辨識網(wǎng)絡(luò)辨識誤差小于設(shè)定值并持續(xù)設(shè)定的運(yùn)行次數(shù)后進(jìn)行控制器的控制輸入的計(jì)算。
y(k+1)=f(u(k+1))
=b1φ1(u(k+1))+b2φ2(u(k+1))+…
+bmφm(u(k+1))+ω1φ1(u(k))+ω2φ2(u(k-1))+…+ωnφn(u(k-n+1))
(4)
u(k+1)=root(f(x)-y(k+1))
(5)
root表示對多項(xiàng)式函數(shù)進(jìn)行求根,根據(jù)所獲取的參數(shù)通過選用牛頓法,進(jìn)行控制量的迭代操作。
(6)
下標(biāo)表示迭代次數(shù),其迭代初值選取為上一次控制量給定u(k)。
神經(jīng)網(wǎng)絡(luò)具有良好的逼近能力,U模型具有控制上簡單的特點(diǎn),將兩者進(jìn)行結(jié)合有助于發(fā)揮兩者的優(yōu)勢。文獻(xiàn)3提出的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)簡單,對其同U模型做了結(jié)合改進(jìn),改進(jìn)后的辨識器結(jié)構(gòu)如圖2所示。
圖2 結(jié)合后的神經(jīng)網(wǎng)絡(luò)模型
網(wǎng)絡(luò)輸出為
(7)
(8)
yM=yuk+yuk-1
(9)
其中,yuk為關(guān)于當(dāng)前控制輸入的多項(xiàng)式網(wǎng)絡(luò)的輸出;yuk-1為關(guān)于上一時(shí)刻輸入的神經(jīng)網(wǎng)絡(luò)的輸出;yM為辨識器輸出,bi(i=1…m)為多項(xiàng)式權(quán)值;ωi1、ωi2、vi分別表示網(wǎng)絡(luò)中上一時(shí)刻的輸入層權(quán)系數(shù)及常量相關(guān)的輸入層權(quán)系數(shù)、輸出層權(quán)系數(shù),nh表示隱層結(jié)點(diǎn)個(gè)數(shù)。
網(wǎng)絡(luò)權(quán)值的動態(tài)調(diào)整:對結(jié)合形成的網(wǎng)絡(luò)關(guān)于歷史輸入部分采用BP算法進(jìn)行神經(jīng)網(wǎng)絡(luò)權(quán)值的調(diào)整,同時(shí)對關(guān)于當(dāng)前輸入的多項(xiàng)式權(quán)系數(shù)也由BP算法進(jìn)行調(diào)整。調(diào)整算法如下:
(10)
(11)
(12)
(13)
其中權(quán)值的次下標(biāo)表示迭代的次數(shù)
控制輸入的確定:采用U模型的控制量計(jì)算思路,實(shí)際的控制輸入同樣采用多項(xiàng)式求根進(jìn)行求解,求解算法如下:
y(n+1)=f(un+1)=yuk(un+1)+yuk-1(un)
(14)
u(n+1)=f-1(y(n+1))
(15)
yuk(un+1)和yuk-1(un)分別表示關(guān)于當(dāng)前輸入以及上一時(shí)刻輸入的對應(yīng)網(wǎng)絡(luò)輸出函數(shù)。
對控制輸入進(jìn)行加權(quán),需要對控制量對輸出的影響進(jìn)行評估?;诒孀R器的控制輸入加權(quán),要求控制器與辨識器之間存在很大的依存關(guān)系。采用辨識網(wǎng)絡(luò)的U模型為這種控制策略的實(shí)施提供了解決方案。面向控制的U模型,根據(jù)辨識器的實(shí)際結(jié)構(gòu)參數(shù),通過多項(xiàng)式求根的方法獲得控制量,辨識器同控制器之間有著很大的耦合。通過辨識偏差的大小,可以相應(yīng)的得到對應(yīng)控制量接近最優(yōu)控制量的水平,進(jìn)而可以以其為依據(jù)進(jìn)行控制量的動態(tài)加權(quán)調(diào)整。
不同網(wǎng)絡(luò)結(jié)構(gòu)的辨識器同時(shí)運(yùn)行,可以減少模型辨識的失效率。依照概率,當(dāng)由相應(yīng)的辨識器得到的控制輸入量相互獨(dú)立時(shí),假定兩個(gè)辨識器的失效率分別為P1、P2,則理論上講總體辨識失效率為P1×P2。辨識器結(jié)構(gòu)如圖3所示。
圖3 加權(quán)控制網(wǎng)絡(luò)
圖中,u1、u2為U模型辨識器與結(jié)合后網(wǎng)絡(luò)計(jì)算得到的控制輸入;1-α,α為對u1、u2的加權(quán)值;u為最終得到的控制量;y為被控對象輸出;網(wǎng)絡(luò)輸出分別為yM1、yM2;期望軌跡為yp;網(wǎng)絡(luò)辨識誤差分別為e1、e2。
輸入調(diào)整策略:對兩種模型實(shí)行不同的學(xué)習(xí)率,高的學(xué)習(xí)率用于獲得精確的控制量,低學(xué)習(xí)率用于抵制系統(tǒng)誤差的影響。根據(jù)兩種網(wǎng)絡(luò)辨識誤差的實(shí)際大小,對根據(jù)相應(yīng)模型參數(shù)計(jì)算得到的控制量進(jìn)行動態(tài)的加權(quán)。
u=(1-α)u1+αu2
(16)
If abs(e2)
其他情況下:
f(e1,e2)=g(e1,e2)
(17)
本文選取為
(18)
其中ε為很小的正數(shù)避免被0除。
選取測試被控對象如下:
x(k)=1+u(k)-u2(k)+0.2u3(k)
(19)
y(k)=0.5y(k-1)+x(k-1)+0.1x(k-2)
(20)
跟蹤的目標(biāo)軌跡:
yd(k)=0.5sin(kπ/30)+0.5sin(kπ/75)
(21)
對被控對象在理想狀況下及擾動作用下進(jìn)行了仿真研究,網(wǎng)絡(luò)的學(xué)習(xí)率設(shè)定為0.2,U模型網(wǎng)絡(luò)的學(xué)習(xí)因子設(shè)定為0.4,穩(wěn)態(tài)控制次數(shù)Cset為20,誤差允許界eset為0.05。仿真曲線在系統(tǒng)開環(huán)運(yùn)行100次后進(jìn)行。
對該被控對象無擾動狀態(tài)下對系統(tǒng)分別采用結(jié)合的U模型網(wǎng)絡(luò),U模型網(wǎng)絡(luò)單獨(dú)控制以及對兩者控制輸入的加權(quán)進(jìn)行分別的仿真,仿真結(jié)果如圖4~6所示。在600次仿真數(shù)據(jù)采集時(shí)對被控對象輸出端加入幅值為0.2的加性噪聲。對U模型網(wǎng)絡(luò)單獨(dú)控制,結(jié)合的U模型網(wǎng)絡(luò)控制,以及對兩者控制輸入的加權(quán)進(jìn)行分別的仿真,仿真結(jié)果如圖7~9所示。可以看出加權(quán)后的網(wǎng)絡(luò)克服了原先網(wǎng)絡(luò)的弱點(diǎn)具有更好的控制效果。
圖4 理想條件下加權(quán)網(wǎng)絡(luò)控制
圖5 理想條件下結(jié)合網(wǎng)絡(luò)控制
圖6 理想條件下U模型網(wǎng)絡(luò)控制
圖7 擾動作用下加權(quán)網(wǎng)絡(luò)控制
圖8 擾動作用下結(jié)合網(wǎng)絡(luò)控制
圖9 擾動作用下U模型網(wǎng)絡(luò)控制
本文對U模型同神經(jīng)網(wǎng)絡(luò)進(jìn)行了結(jié)合,采用BP算法進(jìn)行結(jié)合網(wǎng)絡(luò)權(quán)值的動態(tài)調(diào)整,參考U模型控制量的求根解法,進(jìn)行控制量的求取。通過并行運(yùn)行U模型網(wǎng)絡(luò)以及結(jié)合網(wǎng)絡(luò),獲得各自的辨識誤差,進(jìn)而通過辨識誤差對兩者求得控制量進(jìn)行加權(quán),獲得最終的控制輸入。采用辨識誤差驅(qū)動的控制輸入加權(quán)有助于將不同的網(wǎng)絡(luò)進(jìn)行整合獲得更優(yōu)的控制量,對解決復(fù)雜問題具有一定的現(xiàn)實(shí)意義。
參考文獻(xiàn):
[1] Q. M. Zhu , L. Z. Guo. A pole placement controller for nonlinear dynamic plants [J]. Journal of Systems and Control Engineering, 2002,216(01): 467-476.
[2] NR. Butt, M. Shafiq , T. Khan. An adaptive root-solving controller for tracking of nonlinear dynamic plants [A]. Proceeding of the IEEE In-ternational Conference on Industrial Electronics and Control Applications[C]. Swiss: 2005(29-30): 144-149.
[3] Raied Salman. Neural networks of adaptive inverse control systems[J]. Applied Mathematics and Computation, 2005,163:931-939.
[4] Gregory L. Plett. Adaptive inverse control of unmodeled stable SISO and MIMO linear systems[J]. International Journal of Adaptive Control Signal Process. 2002; (16):243-272.
[5] Tahir Khan, Muhammad Shafiq. Adaptive feed-forward control of thermal heating process[J]. IEICE Electronics Express,2006, 3(9):184-190.
[6] Azhar S S, Shafiq M, Bakhashwain J M, et al. .U-model based adaptive internal model control of unknown MIMO Nonlinear Systems: A Case study on 2-Link Robotic Arm[J]. Wseas Transactions on Circuits and Systems, 2013.
[7] Shafiq, M. Khan, Newton-raphson based adaptive inverse control scheme for tracking of nonlinear dynamic plants[A]. International Symposium on Systems and Control in Aerospace and Astronautics[C]. IEEE, 2006(05):1343.