葛鎖良, 楊旭瑋, 張亞東
(合肥工業(yè)大學(xué) 電氣與自動化工程學(xué)院,安徽 合肥 230009)
隨著計算機網(wǎng)絡(luò)的廣泛應(yīng)用和網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,控制系統(tǒng)的結(jié)構(gòu)正在發(fā)生變化。與傳統(tǒng)的點對點控制系統(tǒng)相比,網(wǎng)絡(luò)化控制系統(tǒng)具有共享信息資源、減少系統(tǒng)布線、易于擴展和維護等優(yōu)點。目前網(wǎng)絡(luò)控制已經(jīng)成功地應(yīng)用于國民經(jīng)濟和國防建設(shè)的各個領(lǐng)域,如車輛控制[1-2]、電力生產(chǎn)、遠程醫(yī)療[3]和遠程教學(xué)。
由于網(wǎng)絡(luò)的介入,不可避免地使信息存在時延、丟包等問題,從而造成系統(tǒng)性能惡化,甚至導(dǎo)致系統(tǒng)的不穩(wěn)定[4]。其中網(wǎng)絡(luò)誘導(dǎo)時延是影響系統(tǒng)性能的最重要的因素。傳統(tǒng)PID控制器的參數(shù)需要根據(jù)被控對象的數(shù)學(xué)模型來調(diào)整,而控制過程中的滯后性、控制參數(shù)的高階性增加了對控制參數(shù)的調(diào)整難度[5]。
本文將RBF神經(jīng)網(wǎng)絡(luò)和傳統(tǒng)PID控制器有機結(jié)合起來,利用RBF神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí)、自適應(yīng)能力對PID控制器參數(shù)進行在線整定,實現(xiàn)網(wǎng)絡(luò)化控制系統(tǒng)的優(yōu)化控制,其效果優(yōu)于傳統(tǒng)PID控制器。
網(wǎng)絡(luò)化控制系統(tǒng)(Network Control Systems,簡稱NCS)是指某區(qū)域內(nèi)傳感器、控制器、執(zhí)行器和通信網(wǎng)絡(luò)的集合,使該區(qū)域內(nèi)不同地點的用戶實現(xiàn)資源共享和協(xié)調(diào)操作,是一種全分布式、網(wǎng)絡(luò)化的閉環(huán)實時反饋系統(tǒng)[6-7]。網(wǎng)絡(luò)化控制系統(tǒng)由被控對象、傳感器、執(zhí)行器、控制器和計算機網(wǎng)絡(luò)5部分組成,其結(jié)構(gòu)簡圖如圖1所示。由于網(wǎng)絡(luò)帶寬有限且網(wǎng)絡(luò)中的數(shù)據(jù)流量變化不規(guī)則,當(dāng)多個節(jié)點通過網(wǎng)絡(luò)交換數(shù)據(jù)時,常常出現(xiàn)數(shù)據(jù)碰撞、網(wǎng)絡(luò)擁塞等現(xiàn)象,因而不可避免地出現(xiàn)信息交換時間延遲,這種由網(wǎng)絡(luò)引起的時間延遲稱為網(wǎng)絡(luò)誘導(dǎo)時延(Network-induced Delay)。
圖1 網(wǎng)絡(luò)化控制系統(tǒng)結(jié)構(gòu)
網(wǎng)絡(luò)誘導(dǎo)時延主要包括:
(1)傳感器到控制器之間的時延,從傳感器采樣得到某個數(shù)據(jù)的時刻起至該數(shù)據(jù)開始被控制器處理的這段時間。
(2)控制器的計算時延,從控制器開始計算到計算完成產(chǎn)生控制信號的這段時間。
(3)控制器到執(zhí)行器之間的時延,控制器產(chǎn)生某控制信號的時刻起至該信號被執(zhí)行器接收的這段時間。
這樣,網(wǎng)絡(luò)化控制系統(tǒng)的時延為:控制器的計算時延τck與τsck、τcak相比,它的數(shù)值和變化都很小,??珊雎?,即
由于時延出現(xiàn)在控制回路中,并且隨負載變化呈現(xiàn)不確定性,使原本等間隔的數(shù)字采樣變得不再等間隔,造成反饋和控制信號產(chǎn)生隨機的滯后,使系統(tǒng)的超調(diào)增大、調(diào)節(jié)時間變長,且當(dāng)時延增大到一定程度時,可能導(dǎo)致系統(tǒng)不穩(wěn)定。
徑向基函數(shù)(Radial Basis Function,簡稱RBF)神經(jīng)網(wǎng)絡(luò)是由Moody和Darken于20世紀(jì)80年代末提出的一種神經(jīng)網(wǎng)絡(luò)。它是一種3層單向傳播的前饋網(wǎng)絡(luò),能以任意精度逼近任意連續(xù)函數(shù),且運算量?。?-10],收斂速度快。
RBF神經(jīng)網(wǎng)絡(luò)自整定PID控制器由PID控制器和RBF神經(jīng)網(wǎng)絡(luò)2部分組成。該控制器主要通過RBF神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí)能力在線辨識得到系統(tǒng)近似模型,進而獲得被控對象的Jacobian信息,實現(xiàn)對PID參數(shù)的在線調(diào)整。其原理框圖如圖2所示。
圖2 RBF網(wǎng)絡(luò)自整定PID控制器的原理框圖
RBF網(wǎng)絡(luò)是由輸入層、隱含層和輸出層組成。從輸入層到隱含層的變換函數(shù)的映射是非線性的,從隱含層到輸出層的映射是線性的,可通過調(diào)整權(quán)系數(shù)來改變網(wǎng)絡(luò)的輸出,從而加快學(xué)習(xí)速度,避免局部極小值的問題[11-12]。其拓撲結(jié)構(gòu)如圖3所示。
圖3 RBF神經(jīng)網(wǎng)絡(luò)拓撲結(jié)構(gòu)
其中,X=[u(k-1),y(k),y(k-1)]T是網(wǎng)絡(luò)的輸入向量。RBF網(wǎng)絡(luò)的徑向基向量H=[h1,h2,…,h6]T,其中hj為高斯基函數(shù),即
其中,網(wǎng)絡(luò)的第j個節(jié)點的中心向量為Cj=[cj1,cj2,cj3]T,j=1,2,…,6;bj為隱層節(jié)點j的基寬參數(shù),且為大于零的數(shù)。RBF網(wǎng)絡(luò)輸入層到隱含層的權(quán)值為1,網(wǎng)絡(luò)隱含層到輸出層的權(quán)向量為W=[w1,w2,…,w6]T。RBF網(wǎng)絡(luò)的輸出為:
RBF網(wǎng)絡(luò)學(xué)習(xí)的性能指標(biāo)為:
根據(jù)梯度下降法,輸出權(quán)、節(jié)點基寬參數(shù)及節(jié)點中心矢量的迭代算法如下:
其中,i=1,2,3;η為學(xué)習(xí)速率;α和β為慣性系數(shù)。
采用增量式PID控制器,控制誤差為:
其中,r(k)和y(k)分別為系統(tǒng)的輸入和輸出。
整定指標(biāo)為:
PID 3項的輸入為:
其中,xc(1)、xc(2)、xc(3)分別為比例項、積分項、微分項。
PID控制器輸出為:
由梯度下降法得到kP、kI、kD3個參數(shù)的調(diào)整量為:
其中,?y/?Δu為被控對象的Jacobian信息,即對象的輸出對輸入的敏感度,其值可通過RBF神經(jīng)網(wǎng)絡(luò)辨識而得。
為了驗證RBF神經(jīng)網(wǎng)絡(luò)自整定PID控制在網(wǎng)絡(luò)化控制系統(tǒng)中的有效性,利用Matlab軟件中的Simulink和TrueTime仿真工具箱搭建了基于載波監(jiān)聽多路訪問/沖突檢測(Carrier Sense Multiple Access/Collision Detect,簡稱CSMA/CD)的介質(zhì)訪問控制機制的仿真平臺,如圖4所示。
圖4 NCS仿真平臺
該模型由4個TrueTime Kernel模塊和1個TrueTime Network模塊構(gòu)成。4個內(nèi)核模塊分別代表傳感器節(jié)點、干擾節(jié)點、控制器節(jié)點和執(zhí)行器節(jié)點。其中,傳感器節(jié)點設(shè)置為時間驅(qū)動型,控制節(jié)點和傳感器節(jié)點設(shè)置為事件驅(qū)動類型,被控對象的傳遞函數(shù)為G(s)=400/(s2+50s)。在基于圖4所示仿真平臺上,分別采用常規(guī)PID控制和RBF神經(jīng)網(wǎng)絡(luò)自整定PID控制,在無時延和短隨機時延 (τk∈ (0s,0.01s))情況下進行了仿真,仿真結(jié)果如圖5、圖6所示。
從圖5、圖6可以看出,在一個穩(wěn)定運行的NCS中,當(dāng)存在網(wǎng)絡(luò)時延時,系統(tǒng)的性能惡化,超調(diào)變大,響應(yīng)時間變慢。比較圖5、圖6發(fā)現(xiàn),RBF神經(jīng)網(wǎng)絡(luò)自整定PID控制器控制下的NCS系統(tǒng)的性能優(yōu)于傳統(tǒng)PID控制下的性能。與常規(guī)PID控制器相比,RBF神經(jīng)網(wǎng)絡(luò)自整定PID控制器具有自適應(yīng)能力強、控制精度高、魯棒性好等優(yōu)點,能有效地滿足網(wǎng)絡(luò)化控制系統(tǒng)的要求。
圖5 無時延情況下仿真圖形
圖6 短隨機時延情況下仿真圖形
本文利用TrueTime工具箱建立了網(wǎng)絡(luò)化控制系統(tǒng)的仿真模型,并對RBF神經(jīng)網(wǎng)絡(luò)自整定PID控制算法在網(wǎng)絡(luò)控制系統(tǒng)中的應(yīng)用進行了仿真研究。仿真結(jié)果表明:該控制器具有響應(yīng)速度快、控制輸出穩(wěn)定、抗干擾能力強以及魯棒性好等特點,能有效滿足網(wǎng)絡(luò)控制系統(tǒng)的要求,在解決時延對網(wǎng)絡(luò)控制系統(tǒng)控制性能的影響方面有一定的實用價值。
[1]Seiler P,Sengupta R.Analysis of communication losses in
vehicle control problems[C]//Proceedings of the American Control Conference,Vol 2.Arlington,USA:IEEE,2001:1491-1496.
[2]宋 頌,韓 東,馬學(xué)森,等.基于無線傳感器網(wǎng)絡(luò)的智能公交系統(tǒng)[J].合肥工業(yè)大學(xué)學(xué)報:自然科學(xué)版,2008,31(1):21-24.
[3]Overstreet J W,Tzes A.An Internet-based real-time control engineering laboratory[J].IEEE Control Systems Magazine,1999,19(5):19-34.
[4]王平福,邱占芝,戴恒山.七種因素對NCS性能的影響[J].大連交通大學(xué)學(xué)報,2009,30(3):91-95.
[5]陳 瑞,周 征.在線自校正模糊PID控制器的研究[J].自動化技術(shù)與應(yīng)用,2008,27(12):49-52.
[6]朱其新,胡壽松.網(wǎng)絡(luò)控制系統(tǒng)的分析與建模[J].信息與控制,2003,32(1):5-8.
[7]趙 季,吳懷寧,吳小平.基于GPC算法的網(wǎng)絡(luò)控制系統(tǒng)研究[J].工礦自動化,2008(4):40-43.
[8]吳洪巖,劉淑華,張 崳.基于RBFNN的強化學(xué)習(xí)在機器人導(dǎo)航中的應(yīng)用[J].吉林大學(xué)學(xué)報:信息科學(xué)版,2009,27(2):185-190.
[9]董偉杰,劉長華,宋 華.RBF和PIDNN在伺服電機模型中的應(yīng)用比較[J].控制工程,2008(Z1):113-118.
[10]王上飛,湯匯道.自適應(yīng)徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)[J].合肥工業(yè)大學(xué)學(xué)報:自然科學(xué)版,2001,24(2):244-247.
[11]李楊帆,蔣品群,羅曉曙,等.RBF神經(jīng)網(wǎng)絡(luò)在薄膜厚度控制系統(tǒng)中的應(yīng)用[J].現(xiàn)代電子技術(shù),2010(5):147-150.
[12]趙江東,李 娟,馬小陸.基于RBF神經(jīng)網(wǎng)絡(luò)動態(tài)辨識的自整定PID控制策略[J].工業(yè)儀表與自動化裝置,2009(6):12-15.