宋怡霖,陳新楚,2,鄭松,2
(1.福州大學(xué)電氣工程與自動(dòng)化學(xué)院,福建福州350116; 2.福建省工業(yè)控制信息安全技術(shù)企業(yè)重點(diǎn)實(shí)驗(yàn)室,福建福州350008)
基于對(duì)角遞歸神經(jīng)網(wǎng)絡(luò)的控制系統(tǒng)
宋怡霖1,陳新楚1,2,鄭松1,2
(1.福州大學(xué)電氣工程與自動(dòng)化學(xué)院,福建福州350116; 2.福建省工業(yè)控制信息安全技術(shù)企業(yè)重點(diǎn)實(shí)驗(yàn)室,福建福州350008)
針對(duì)角遞歸神經(jīng)網(wǎng)絡(luò)具有結(jié)構(gòu)簡(jiǎn)單、收斂速度快,可廣泛用于非線性系統(tǒng)的辨識(shí)與控制的特點(diǎn).基于工業(yè)自動(dòng)化通用技術(shù)平臺(tái)(IAP),采用圖形化控制策略組態(tài)技術(shù)開(kāi)發(fā)了一套基于對(duì)角遞歸神經(jīng)網(wǎng)絡(luò)的控制系統(tǒng),該系統(tǒng)具有基于參考模型跟蹤的控制結(jié)構(gòu),可快速自適應(yīng)地調(diào)整控制器參數(shù).仿真實(shí)驗(yàn)結(jié)果表明,基于對(duì)角遞歸神經(jīng)網(wǎng)絡(luò)的控制系統(tǒng)控制精度高、穩(wěn)定性好,可成為處理復(fù)雜工業(yè)過(guò)程,尤其是解決不確定和非線性領(lǐng)域問(wèn)題的有效工具.
對(duì)角遞歸神經(jīng)網(wǎng)絡(luò);控制策略;組態(tài);控制器;辨識(shí)器
人工神經(jīng)網(wǎng)絡(luò)是模擬人類(lèi)大腦中神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)與行為的一種模型,具有很強(qiáng)的自學(xué)習(xí)和自適應(yīng)能力.神經(jīng)網(wǎng)絡(luò)按結(jié)構(gòu)可分為前饋神經(jīng)網(wǎng)絡(luò)與遞歸(反饋)神經(jīng)網(wǎng)絡(luò).遞歸神經(jīng)網(wǎng)絡(luò)[1]利用網(wǎng)絡(luò)內(nèi)部的狀態(tài)反饋描述系統(tǒng)的非線性特性,更適用于處理非線性和具有時(shí)延特性的模型.對(duì)角遞歸神經(jīng)網(wǎng)絡(luò)(diagonal recurrent neural network,DRNN)是一種簡(jiǎn)化的遞歸神經(jīng)網(wǎng)絡(luò),其結(jié)構(gòu)簡(jiǎn)單、收斂速度快,更適用于工業(yè)過(guò)程的建模、仿真與控制[2].
本研究的控制系統(tǒng)采用對(duì)角遞歸神經(jīng)網(wǎng)絡(luò)作為辨識(shí)器,辨識(shí)未知設(shè)備的信息,并采用同結(jié)構(gòu)的對(duì)角遞歸神經(jīng)網(wǎng)絡(luò)作為控制器,以非線性系統(tǒng)與二階純滯后系統(tǒng)作為實(shí)驗(yàn)對(duì)象,控制結(jié)果表明對(duì)角遞歸神經(jīng)網(wǎng)絡(luò)系統(tǒng)的控制精度高,自適應(yīng)性能好.
對(duì)角遞歸神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖1所示.對(duì)于任意的離散時(shí)刻k,Ii(k)是網(wǎng)絡(luò)的第i個(gè)輸入;Sj(k)與Xj(k)分別是隱含層第j個(gè)遞歸神經(jīng)元的輸入總和與輸出;O(k)是對(duì)角遞歸神經(jīng)網(wǎng)絡(luò)的輸出.WIij、WDj和WO分別表示輸入層、隱含層和輸出層的權(quán)值.
j
對(duì)角遞歸神經(jīng)網(wǎng)絡(luò)的動(dòng)態(tài)方程[3]為:
其中f(·)為隱含層遞歸神經(jīng)元的激勵(lì)函數(shù),且
對(duì)角遞歸神經(jīng)網(wǎng)絡(luò)的輸出O(k)對(duì)權(quán)值WIij、WDj和WOj的梯度分別為
其中:變量Pj(k)≡Xj(k)/WD
j,Qij≡Xj(k)/WIij且滿(mǎn)足
對(duì)角遞歸神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)結(jié)構(gòu)如圖2所示,控制器DRNC與辨識(shí)器DRNI均由DRNN網(wǎng)絡(luò)組成.由DRNI的輸出ym(k)辨識(shí)未知的被控設(shè)備實(shí)際輸出y(k),并提供設(shè)備的Jacobian信息給DRNC.由DRNC的輸出u(k)驅(qū)動(dòng)未知的動(dòng)態(tài)系統(tǒng)使設(shè)備的輸出y(k)無(wú)限逼近期望輸出yr(k).
2.1 辨識(shí)器DRNI的學(xué)習(xí)算法
由DRNC產(chǎn)生的當(dāng)前控制信號(hào)u(k)和前一時(shí)刻設(shè)備輸出y(k-1)作為DRNI的輸入.將DRNI的輸出ym(k)和y(k)之間的辨識(shí)誤差帶入權(quán)值更新公式調(diào)節(jié)DRNI的權(quán)值.
定義DRNI的性能指標(biāo)函數(shù)為
其中:ηI是DRNI的學(xué)習(xí)率;ym(k)/WI=O(k)/W按公式(3)、(4)計(jì)算.
2.2 控制器DRNC的學(xué)習(xí)算法
DRNC的輸入分別為參考輸入r(k)、y(k-1)和前一時(shí)刻控制信號(hào)u(k-1),輸出是u(k).幾個(gè)周期訓(xùn)練DRNC的權(quán)值后可以使y(k)與yr(k)之間的誤差達(dá)到一個(gè)很小的值.但訓(xùn)練DRNC時(shí)需要被控設(shè)備的
DRNI與DRNC均采用動(dòng)態(tài)反向傳播算法(DBP)訓(xùn)練,DRNI中權(quán)值的更新公式為Jacobian信息,需要DRNI估計(jì)被控設(shè)備的敏感度函數(shù)yu(k).
定義DRNC網(wǎng)絡(luò)的性能指標(biāo)函數(shù)為
DRNC中權(quán)值的更新公式為
其中:ηC是DRNC網(wǎng)絡(luò)的學(xué)習(xí)率.因子yu(k)≡y(k)/u(k)代表被控設(shè)備的敏感度,一般很難通過(guò)直接計(jì)算獲得,但若DRNI網(wǎng)絡(luò)已得到較好的訓(xùn)練,可近似認(rèn)為
所以通過(guò)輪流訓(xùn)練DRNI和DRNC,可以調(diào)節(jié)得到更有效的DRNC網(wǎng)絡(luò)權(quán)值[4].
本研究采用工業(yè)自動(dòng)化通用技術(shù)平臺(tái)(簡(jiǎn)稱(chēng)IAP)實(shí)現(xiàn)DRNN系統(tǒng)的控制邏輯組態(tài).IAP是由福建中海創(chuàng)集團(tuán)研究院研發(fā)的一種基于圖形化、模塊化控制策略組態(tài)技術(shù)的分布式控制系統(tǒng),它第一次實(shí)現(xiàn)了工業(yè)自動(dòng)化控制系統(tǒng)的跨平臺(tái)應(yīng)用與控制系統(tǒng)的軟硬件分離[5].
3.1 參考模型組態(tài)
例1實(shí)驗(yàn)中的參考模型可用差分方程表示為
其中:r(k)=sin(2πk/25)+sin(2πk/10)+2.r(k)與參考模型的控制策略組態(tài)設(shè)計(jì)如圖3所示.圖3中元件旁的數(shù)字表示該元件在完整控制系統(tǒng)中的計(jì)算順序,稱(chēng)作“時(shí)序”.1~3行邏輯(虛線框內(nèi))表示參考輸入的控制策略組態(tài)設(shè)計(jì).
3.2DRNC網(wǎng)絡(luò)結(jié)構(gòu)組態(tài)
DRNC的輸入分別為PC=[r(k),u(k-1),y(k-1)],DRNC中隱含層第j個(gè)遞歸神經(jīng)元的輸入Sj(k)與輸出Xj( k)(j=1,2,3,…,7)分別為:
控制器DRNC網(wǎng)絡(luò)的輸出O(k)=u(k),且
3.3 敏感度函數(shù)組態(tài)
習(xí)近平總書(shū)記強(qiáng)調(diào)要把解決突出生態(tài)環(huán)境問(wèn)題作為民生優(yōu)先領(lǐng)域,還老百姓藍(lán)天白云、繁星閃爍。數(shù)據(jù)顯示:2017年,受理群眾環(huán)境舉報(bào)13.5萬(wàn)件,直接推動(dòng)解決群眾身邊的環(huán)境問(wèn)題8萬(wàn)多個(gè)[4];2013年至2017年,全國(guó)空氣質(zhì)量達(dá)標(biāo)的城市從3個(gè)增加到了99個(gè)??梢?jiàn),無(wú)論是解決經(jīng)濟(jì)的長(zhǎng)期可持續(xù)發(fā)展,還是當(dāng)前老百姓關(guān)注的焦點(diǎn)問(wèn)題,習(xí)近平生態(tài)文明思想強(qiáng)調(diào)“以人為本”,以老百姓日益增長(zhǎng)的對(duì)美好生活的向往和需求為價(jià)值取向。
當(dāng)辨識(shí)器DRNI網(wǎng)絡(luò)得到較好的訓(xùn)練時(shí),設(shè)備的敏感度yu(k)可表示為:
敏感度函數(shù)yu(k)的控制策略組態(tài)設(shè)計(jì)如圖4所示,第3~5行邏輯(虛框內(nèi))表示求f'(S1(k)).
3.4DRNC網(wǎng)絡(luò)權(quán)值更新組態(tài)
采用DBP算法訓(xùn)練DRNC與DRNI,輸出層權(quán)值的更新公式為
且推導(dǎo)可得激勵(lì)函數(shù)f(·)的導(dǎo)函數(shù)為:
本研究?jī)H以DRNC中輸出層第一個(gè)權(quán)值WO(k)的更新過(guò)程為例,其控制策略組態(tài)設(shè)計(jì)如圖5所示.圖5中
13~5行邏輯(虛框內(nèi))表示權(quán)值WO1(k)的初始值賦值過(guò)程,比例調(diào)節(jié)器P354表示DRNC網(wǎng)絡(luò)的學(xué)習(xí)率ηC.至此即完成了DRNN系統(tǒng)的控制策略組態(tài)設(shè)計(jì).
參考模型的差分方程如公式(10)所示.其中,參考輸入r(k)可表示為:
本實(shí)驗(yàn)中DRNI輸入為PI=[u(k),y(k-1)],DRNC的輸入為PC=[r(k),u(k-1),y(k-1)].權(quán)值的初始值為[-1,1]范圍內(nèi)的隨機(jī)數(shù).學(xué)習(xí)率ηC=ηI=0.02,虛擬控制站的計(jì)算周期設(shè)為T(mén)S=100 ms,上位機(jī)中數(shù)據(jù)的監(jiān)控周期為T(mén)=500 ms.實(shí)驗(yàn)的仿真結(jié)果如圖6所示.
例1:假設(shè)某單輸入單輸出的非線性系統(tǒng),其差分方程為:
上圖中的3條曲線分別表示yr(k)、y(k)與eC(k)= yr(k)-y(k).圖6(a)是DRNN控制系統(tǒng)初始運(yùn)行結(jié)果,此時(shí)y(k)在上升和下降階段擬合yr(k)的情況較好,但在yr(k)的波峰及波谷處仍有較大誤差,eC(k)的最大值為0.7.圖6(b)是系統(tǒng)穩(wěn)定運(yùn)行2 h后的仿真結(jié)果,在yr(k)的波峰及波谷處的誤差明顯減小,此時(shí)eC(k)的最大值已從初始運(yùn)算時(shí)的0.7下降到0.2.
在上述系統(tǒng)穩(wěn)定的情況下,加入幅值為1、持續(xù)時(shí)間為5 s的擾動(dòng)信號(hào),擾動(dòng)實(shí)驗(yàn)曲線如圖7所示.雖然控制系統(tǒng)受到較大干擾,但系統(tǒng)有較好的自調(diào)節(jié)、自適應(yīng)能力,能迅速恢復(fù)到穩(wěn)定狀態(tài),具有較強(qiáng)的抗干擾能力.
例2:鍋爐汽包給水控制的主要任務(wù)是調(diào)節(jié)給水量與鍋爐蒸發(fā)量的平衡以保證汽包水位處于設(shè)定的安全范圍內(nèi).在蒸汽負(fù)荷不變及水流量有擾動(dòng)的情況下,汽包水位的傳遞函數(shù)表示為
該模型是帶有純滯后環(huán)節(jié)的二階模型,采樣時(shí)間ts=1 s,進(jìn)行z變換,得其差分方程為
分別采用傳統(tǒng)PID與對(duì)角遞歸神經(jīng)網(wǎng)絡(luò)對(duì)鍋爐汽包水位進(jìn)行控制,階躍響應(yīng)曲線如圖8所示.
從圖8中可以看出,由對(duì)角遞歸神經(jīng)網(wǎng)絡(luò)控制的汽包水位階躍響應(yīng)曲線(圖8(a))上升時(shí)間較短,約為3 s,且無(wú)超調(diào)量,而PID控制的響應(yīng)曲線(圖8(b))的上升時(shí)間約為6 s.對(duì)角遞歸神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)的響應(yīng)曲線,上升過(guò)程更穩(wěn)定、波動(dòng)更小、速度更快,且系統(tǒng)實(shí)際輸出可實(shí)現(xiàn)自適應(yīng)控制達(dá)到目標(biāo)水位,其控制效果優(yōu)于常規(guī)的PID控制.
仿真實(shí)驗(yàn)結(jié)果表明,對(duì)角遞歸神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)采用了基于參考模型跟蹤的控制結(jié)構(gòu),能夠在模型狀態(tài)變化時(shí),快速、自適應(yīng)地調(diào)節(jié)控制系統(tǒng)的參數(shù)(權(quán)值),系統(tǒng)的運(yùn)行操作簡(jiǎn)單、維護(hù)工作量小,可減輕工程技術(shù)人員的勞動(dòng)強(qiáng)度.
針對(duì)控制回路中時(shí)滯、外部擾動(dòng)等非線性特性的影響,對(duì)角遞歸神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)能通過(guò)權(quán)值的自動(dòng)學(xué)習(xí)和實(shí)時(shí)校正,自動(dòng)擬合參考模型.同時(shí)具有控制精度高、抗干擾能力極強(qiáng),明顯優(yōu)于采用傳統(tǒng)PID控制算法的控制效果.
[1]KU C C,LEE K Y.Diagonal recurrent neural networks for dynamic systems control[J].IEEE Transaction on Neural Networks,1995,6(1):144-156.
[2]張欣.對(duì)角遞歸神經(jīng)網(wǎng)絡(luò)的LM算法及建模應(yīng)用[J].機(jī)械工程與自動(dòng)化,2008(6):68-70.
[3]鄧冉.基于改進(jìn)BBO算法的DRNN網(wǎng)絡(luò)非線性系統(tǒng)辨識(shí)[D].成都:西南交通大學(xué),2013.
[4]段慧達(dá),鄭德玲,劉聰.基于對(duì)角遞歸神經(jīng)網(wǎng)絡(luò)的建模及應(yīng)用[J].北京科技大學(xué)學(xué)報(bào),2004,26(1):103-105.
[5]陳智呈,鄭松.工業(yè)4.0與智能聯(lián)動(dòng)戰(zhàn)略[J].信息技術(shù)與信息化,2014(6):76-78.
(責(zé)任編輯:林曉)
Research and development of control system based on diagonal recurrent neural network
SONG Yilin1,CHEN Xinchu1,2,ZHENG Song1,2
(1.College of Electrical Engineering and Automation,F(xiàn)uzhou University,F(xiàn)uzhou,F(xiàn)ujian 350116,China; 2.Fujian Provincial Enterprise Key Laboratory of Industrial Control Information Security,F(xiàn)uzhou,F(xiàn)ujian 350008,China)
The diagonal recurrent neural network has the advantage of simple structure and fast convergence speed.It can be widely used in the identification and control of nonlinear systems.A set of control systems based on diagonal recurrent neural network is developed using graphical control strategy configuration technology based on IAP in this paper.The system has a control structure based on the reference model and can adjust the controller parameters quickly.Simulation experiment results shows that the control system based on diagonal recurrent neural network has high control accuracy and good stability,which can be an effective tool to deal with complex industrial processes,especially to solve the problems in the field of uncertainty and nonlinearity.
diagonal recurrent neural network;control strategy;configuration;controller;identifier
TP273
A
10.7631/issn.1000-2243.2016.06.0774
1000-2243(2016)06-0774-05
2015-09-10
宋怡霖(1989-),助理工程師,主要從事智能制造、多機(jī)器人編隊(duì)控制方面研究,songyilin@histron.cn
福建省科技廳高校產(chǎn)學(xué)合作科技重大資助項(xiàng)目(2013H6009)