胡小兵,劉成忠,趙曉軍
(甘肅農(nóng)業(yè)大學(xué)工學(xué)院,甘肅 蘭州 730070)
?
環(huán)形一級(jí)倒立擺系統(tǒng)單神經(jīng)元PID控制仿真
胡小兵,劉成忠,趙曉軍
(甘肅農(nóng)業(yè)大學(xué)工學(xué)院,甘肅 蘭州 730070)
【目的】 針對(duì)環(huán)形一級(jí)倒立擺的穩(wěn)定控制問(wèn)題,提出一種基于單神經(jīng)元PID的控制算法.【方法】 通過(guò)拉格朗日方法推導(dǎo)出環(huán)形一級(jí)倒立擺系統(tǒng)的數(shù)學(xué)模型,設(shè)計(jì)了單神經(jīng)元PID控制器,該控制器不但結(jié)構(gòu)簡(jiǎn)單,而且具有良好的自適應(yīng)性和魯棒性,并采用有監(jiān)督Hebb學(xué)習(xí)規(guī)則對(duì)加權(quán)系數(shù)進(jìn)行修正.在Matlab中的Simulink仿真平臺(tái)下,分別使用單神經(jīng)元PID控制、常規(guī)PID控制和LQR控制,對(duì)環(huán)形一級(jí)倒立擺進(jìn)行控制仿真.【結(jié)果】 單神經(jīng)元PID控制較常規(guī)PID控制與LQR控制獲得更好的控制效果,能夠有效地解決環(huán)形一級(jí)倒立擺的控制問(wèn)題.
環(huán)形倒立擺;單神經(jīng)元PID;PID控制器;LQR控制器
倒立擺系統(tǒng)是一個(gè)非線性、多變量、強(qiáng)耦合的自然不穩(wěn)定系統(tǒng),它是機(jī)器人、火箭和飛行器控制等許多控制對(duì)象的理想模型,從而成為控制理論界關(guān)注的焦點(diǎn)[1].目前,對(duì)于倒立擺系統(tǒng)的研究而言,國(guó)內(nèi)外更多地探索了直線倒立擺系統(tǒng)的控制問(wèn)題.相對(duì)于直線倒立擺,環(huán)形倒立擺系統(tǒng)是一種典型的非線性系統(tǒng),具有3個(gè)自由度,克服了行程限制,可作為檢驗(yàn)各種控制理論更加理想的控制模型[2].
目前,對(duì)于環(huán)形一級(jí)倒立擺的穩(wěn)定控制有常規(guī)PID控制[3]、LQR控制[4]、滑模變結(jié)構(gòu)控制[5]、模糊控制[6]等.而單神經(jīng)元PID控制結(jié)合神經(jīng)網(wǎng)絡(luò)和PID控制的優(yōu)點(diǎn),具有結(jié)構(gòu)簡(jiǎn)單、自學(xué)習(xí)和自適應(yīng)能力好、魯棒性強(qiáng)等特點(diǎn).為此,本研究將單神經(jīng)元PID控制應(yīng)用到環(huán)形一級(jí)倒立擺系統(tǒng)的穩(wěn)定控制中,通過(guò)仿真結(jié)果表明了本方案的有效性,并將其與常規(guī)PID控制、LQR控制進(jìn)行比較.
在忽略空氣阻力、模塊之間的摩擦力及擺桿連接處質(zhì)量分布不均勻等因素后,環(huán)形一級(jí)倒立擺系統(tǒng)可理想地簡(jiǎn)化為一個(gè)連桿、一個(gè)擺桿和一個(gè)質(zhì)量塊,坐標(biāo)系見(jiàn)圖1.其中,連桿的長(zhǎng)度為l1;擺桿轉(zhuǎn)動(dòng)中心到桿質(zhì)心的距離為l2;連桿與y軸的夾角為θ1;擺桿與垂直向上方向的夾角為θ2(順時(shí)針為正).
圖1 環(huán)形一級(jí)倒立擺系統(tǒng)坐標(biāo)系Fig.1 Coordinate system of rotary inverted pendulum
對(duì)于倒立擺的運(yùn)動(dòng)方程,主要通過(guò)兩種方法進(jìn)行建立與分析,分別是牛頓歐拉方法和拉格朗日方法.本研究采用拉格朗日方法得到環(huán)形一級(jí)倒立擺系統(tǒng)的運(yùn)動(dòng)方程.在圖1中的擺桿上取一小段dl,該段的坐標(biāo)[7]:
(1)
則該小段dl的動(dòng)能:
(2)
連桿的動(dòng)能:
(3)
擺桿的動(dòng)能:
(4)
質(zhì)量塊的動(dòng)能:
(5)
由以上可知系統(tǒng)的總動(dòng)能為T(mén)=Tm1+Tm2+Tm3.
以連桿水平位置為0勢(shì)能位置,則系統(tǒng)勢(shì)能為:
V=Vm1+Vm2+Vm3=m1gl2+m2gl2(1+cosθ2)+m3gl2
(6)
(7)
(8)
上式可表示為:
(9)
(10)
式中,A、B、C分別為系統(tǒng)的狀態(tài)矩陣、控制矩陣、輸出矩陣,y為系統(tǒng)的輸出,即:
(11)
(12)
式中,連桿長(zhǎng)度l1=0.221m,擺桿質(zhì)心到轉(zhuǎn)軸的距離l2=0.197 5m,重力加速度g=9.8m/s2.
2.1 單神經(jīng)元簡(jiǎn)介
單神經(jīng)元的基本結(jié)構(gòu)見(jiàn)圖2.
圖2 單神經(jīng)元基本結(jié)構(gòu)Fig.2 The basic structure of single neuron
圖2中,x1,x1,…,xn為神經(jīng)元輸入信號(hào),對(duì)它們加以權(quán)值系數(shù)ωi后求和,然后再加上閥值b,得到u1的值,最后通過(guò)傳輸函數(shù)f(.)得出單神經(jīng)元的輸出信號(hào)y.
2.2 基于單神經(jīng)元的PID控制器設(shè)計(jì)
2.2.1 單神經(jīng)元PID控制系統(tǒng)結(jié)構(gòu) PID控制器是根據(jù)期望輸出r(t)與實(shí)際輸出y(t)形成偏差e(t),將偏差信號(hào)通過(guò)比例、積分及微分的線性組合形成控制量,對(duì)被控對(duì)象進(jìn)行控制[8].PID控制對(duì)線性、單變量被控對(duì)象能夠取得很好的控制效果,而對(duì)于非線性、多變量的環(huán)形一級(jí)倒立擺系統(tǒng),表現(xiàn)出較差的控制性能,并且,PID控制器參數(shù)是固定不變的,無(wú)法實(shí)現(xiàn)自適應(yīng).
單神經(jīng)元PID控制器具有自學(xué)習(xí)和自適應(yīng)的能力,而且調(diào)整參數(shù)少、便于計(jì)算,能夠較大地改善典型非線性時(shí)變對(duì)象的動(dòng)態(tài)品質(zhì),確保控制系統(tǒng)運(yùn)行在最佳狀態(tài),在一定程度上解決傳統(tǒng)PID控制器參數(shù)不易在線調(diào)整的問(wèn)題,有利于滿足系統(tǒng)的實(shí)時(shí)性要求[9](圖3).
圖3中轉(zhuǎn)換器的輸入e(k)為r(k)與輸出y(k)
圖3 單神經(jīng)元PID控制結(jié)構(gòu)圖Fig.3 Structure of single neuron PID controller
的偏差值,經(jīng)轉(zhuǎn)換器轉(zhuǎn)換后得到神經(jīng)元的輸入量x1(k)、x2(k)、x3(k),則有:
(13)
控制器的輸出:
(14)
式中,wi(k)為對(duì)應(yīng)于xi(k)的加權(quán)系數(shù);K為神經(jīng)元的比例系數(shù),且大于0.K值的選取至關(guān)重要,K值和系統(tǒng)的快速性有關(guān),K越大,則快速性越好,否則,快速性會(huì)變差;同時(shí),K大會(huì)導(dǎo)致超調(diào)量過(guò)大,造成系統(tǒng)的不穩(wěn)定,當(dāng)受控對(duì)象時(shí)延增大時(shí),K值應(yīng)減少,以確保系統(tǒng)的穩(wěn)定性[10].
2.2.2 Hebb學(xué)習(xí)規(guī)則 單神經(jīng)元PID控制器通過(guò)對(duì)加權(quán)系數(shù)的修正來(lái)實(shí)現(xiàn)自適應(yīng)功能,考慮到加權(quán)系數(shù)與單神經(jīng)元的輸入、輸出和輸出偏差三者的相關(guān)函數(shù)有關(guān),因此采用有監(jiān)督的Hebb學(xué)習(xí)規(guī)則,則有:
ΔWij=η(dj(k)-oj(k))oi(k)oj(k)
(15)
式中,oi、oj分別為神經(jīng)元i、j的激活值,ΔWij為神經(jīng)元i和神經(jīng)元j的連接權(quán)值的增量,dj為網(wǎng)絡(luò)目標(biāo)的期望輸出值,η為學(xué)習(xí)效率.
為保證單神經(jīng)元PID控制算法學(xué)習(xí)策略的收斂性和控制的魯棒性,對(duì)有監(jiān)督的Hebb學(xué)習(xí)規(guī)則進(jìn)行規(guī)范化整理后[11],則有:
(16)
式中,ηI、ηP、ηD分別為積分、比例、微分的學(xué)習(xí)速率.對(duì)積分I、比例P和微分D分別選取不同的學(xué)習(xí)速率ηI、ηP、ηD以便對(duì)不同的權(quán)系數(shù)分別進(jìn)行調(diào)整.
環(huán)形一級(jí)倒立擺系統(tǒng)的控制目標(biāo)為產(chǎn)生合適的控制量u,使擺桿盡快地達(dá)到一個(gè)平衡位置,并且使之沒(méi)有大的振蕩和過(guò)大的角度、速度.另外,當(dāng)擺桿到達(dá)預(yù)期的位置后,系統(tǒng)能夠克服隨機(jī)干擾而保持穩(wěn)定狀態(tài).為了實(shí)現(xiàn)控制目標(biāo),采用兩個(gè)單神經(jīng)元PID控制器,分別對(duì)連桿轉(zhuǎn)角θ1和擺桿轉(zhuǎn)角θ2進(jìn)行控制.環(huán)形一級(jí)倒立擺的單神經(jīng)元PID控制系統(tǒng)結(jié)構(gòu)(圖4).
圖4 環(huán)形一級(jí)倒立擺控制系統(tǒng)結(jié)構(gòu)圖Fig.4 Inverted pendulum control system structure diagram
圖4中,系統(tǒng)輸入r為0輸入響應(yīng)信號(hào);環(huán)形一級(jí)倒立擺系統(tǒng)采用狀態(tài)空間方程,見(jiàn)式(11)、式(12),并設(shè)初始狀態(tài):x0=[0.1,0,0.1,0],即θ1=θ2=0.1 rad;SNPID Controller為單神經(jīng)元PID控制器,具體結(jié)構(gòu)見(jiàn)圖5.
圖5 SNPID模塊框圖Fig.5 SNPID module diagram
圖5中,S-Function模塊采用S函數(shù)實(shí)現(xiàn)了有監(jiān)督Hebb學(xué)習(xí)算法,該模塊的輸入信號(hào)為e(k)、e(k-1)、e(k-2)、u(k-1),輸入信號(hào)為u(k).為使單神經(jīng)元PID控制器更接近實(shí)際使用,在控制量u(k)后連接飽和非線性模塊Saturation,它的取值區(qū)間為[-10,10].
根據(jù)上述3種控制方法,在Matlab軟件的Simulink平臺(tái)下,對(duì)環(huán)形一級(jí)倒立擺系統(tǒng)進(jìn)行仿真,其結(jié)果見(jiàn)圖6-7.
圖6 3種控制方法的連桿角度仿真圖Fig.6 The simulation graph of the single neuron PID control
圖7 3種控制方法的擺桿角度仿真圖Fig.7 The simulation diagram of LQR control
由圖6可知,對(duì)于連桿角度的控制,在響應(yīng)速度、調(diào)節(jié)時(shí)間兩方面,單神經(jīng)元PID控制均表現(xiàn)為最優(yōu).PID控制與LQR控制相比,PID控制具有較快的響應(yīng)速度,兩者的超調(diào)量與調(diào)節(jié)時(shí)間相近.
由圖7可知,在擺桿角度的控制問(wèn)題上,除了超調(diào)量之外,單神經(jīng)元PID控制具有良好的控制效果.而LQR控制具有最小的超調(diào)量,但在響應(yīng)速度和調(diào)節(jié)時(shí)間這兩方面均表現(xiàn)的較差,同樣,PID控制在這兩方面與之接近,且具有過(guò)大的超調(diào)量.
本研究通過(guò)分析環(huán)形一級(jí)倒立擺系統(tǒng),進(jìn)行了數(shù)學(xué)建模.由于單神經(jīng)元PID控制器是在常規(guī)PID控制的基礎(chǔ)上,結(jié)合了神經(jīng)元的自學(xué)習(xí)、自適應(yīng)的功能,具有結(jié)構(gòu)簡(jiǎn)單、實(shí)時(shí)性能好,魯棒性強(qiáng)等優(yōu)點(diǎn),因此,將其引入到對(duì)環(huán)形一級(jí)倒立擺的穩(wěn)定控制中.仿真結(jié)果表明,單神經(jīng)元PID控制對(duì)倒立擺系統(tǒng)的連桿角度和擺桿角度獲得良好的控制效果,且均優(yōu)于PID控制、LQR控制.
[1] 桑英軍,范媛媛,徐才千.單級(jí)倒立擺控制方法研究[J].控制工程,2010,17(6):743-745
[2] 王東亮,劉斌,張?jiān)?環(huán)形一級(jí)倒立擺擺起及穩(wěn)定控制研究[J].微計(jì)算機(jī)信息,2007,23(4):1-2
[3] 汪雨寒,夏洪浩,楊思亞.簡(jiǎn)易旋轉(zhuǎn)倒立擺及控制裝置的系統(tǒng)設(shè)計(jì)[J].大學(xué)物理實(shí)驗(yàn),2014,27(1):37-39
[4] 徐澤遠(yuǎn).簡(jiǎn)易旋轉(zhuǎn)倒立擺及控制裝置的設(shè)計(jì)[J].安徽農(nóng)業(yè)科學(xué),2014,42(26):9216-9217
[5] 王招治.基于MATLAB的旋轉(zhuǎn)倒立擺的控制與仿真分析[J].機(jī)電技術(shù),2012,35(4):36-39
[6] 李保林,呂躍,袁浩.一級(jí)旋轉(zhuǎn)倒立擺的模糊控制[J].實(shí)驗(yàn)室科學(xué),2008(5):77-79
[7] 劉浩梅,張昌凡.基于LQR的環(huán)形單級(jí)倒立擺穩(wěn)定控制及實(shí)現(xiàn)[J].中南大學(xué)學(xué)報(bào):自然科學(xué)版,2012,43(9):3496-3500
[8] 魏凱,安進(jìn)強(qiáng),賈曄,等.基于ZigBee技術(shù)的恒壓灌溉系統(tǒng)研究[J].甘肅農(nóng)業(yè)大學(xué)學(xué)報(bào),2013,48(5):146-150
[9] 陳斌,楊宏禎,王立文.飛機(jī)除冰液加熱系統(tǒng)單神經(jīng)元PID控制仿真[J].計(jì)算機(jī)工程,2012,38(6):241-243
[10] 徐國(guó)華,李祖佳,賀磊,等.單神經(jīng)元PID在絞車控制系統(tǒng)中的應(yīng)用[J].控制工程,2013,20(1):42-45
[11] 李俊麗,何勇,王生澤.單神經(jīng)元PID在多電機(jī)同步控制中的應(yīng)用[J].機(jī)電工程,2010,27(8):14-18
(責(zé)任編輯 趙曉倩)
Neuron PID control simulation of rotary single inverted pendulum system
HU Xiao-bing,LIU Cheng-zhong,ZHAO Xiao-jun
(College of Engineering,Gansu Agricultural University,Lanzhou 730070,China)
【Objective】 Aimed at the stable control problem of single link rotary inverted pendulum,a control algorithm was put forward based on single neuron PID.【Method】 The mathematical model derived by the Lagrange method of system for single link rotary inverted pendulum,designing the single neuron PID controller,the controller not only had simple structure,but also had good adaptability and robustness,and the weighted coefficients was carried out by the supervised Hebb learning rule.In the Simulink simulation platform in Matlab,the single neuron PID control and conventional PID control and LQR control was used respectively to simulate the single link rotary inverted pendulum.【Result】 The results showed that the single neuron PID control had better control effect compared with the conventional PID control and LQR control,can effectively solve the control problem of single link rotary inverted pendulum.
rotary inverted pendulum;single neuron PID;PID controller;LQR controller
胡小兵(1989-),男,碩士研究生,研究方向?yàn)檗r(nóng)業(yè)物聯(lián)網(wǎng)、智能控制理論與應(yīng)用.E-mail:mikehubing@163.com
劉成忠,男,副教授,研究生導(dǎo)師,研究方向?yàn)橹悄軟Q策支持系統(tǒng).E-mail:liucz@gsau.edu.cn
甘肅省自然科學(xué)基金資助項(xiàng)目(1208RJZA133);甘肅省干旱生境作物學(xué)重點(diǎn)實(shí)驗(yàn)室開(kāi)放基金資助項(xiàng)目(GSCS-2012-15);甘肅農(nóng)業(yè)大學(xué)青年導(dǎo)師基金資助項(xiàng)目(GAU-QNDS-201309).
2015-01-07;
2015-04-28
TP 391
A
1003-4315(2016)05-0132-05