豆 勤 勤
(馬鞍山學(xué)院 人工智能學(xué)院,安徽 馬鞍山 243100)
RBF神經(jīng)網(wǎng)絡(luò)是由Moody J和Darken C在20世紀(jì)80年代末提出的,也稱(chēng)為徑向基函數(shù)(Radial Basis Function,RBF)神經(jīng)網(wǎng)絡(luò),它是一種具有單隱層的三層前饋網(wǎng)絡(luò)[1]。它的基本思想是在由RBF為隱單元的“基”構(gòu)成的隱含層空間,不通過(guò)權(quán)連接,而把輸入矢量直接映射到隱空間。只要確定RBF的中心點(diǎn)后,映射關(guān)系也隨之確定了。其隱含層空間線(xiàn)性映射到輸出空間,而隱單元輸出的線(xiàn)性加權(quán)和就是網(wǎng)絡(luò)的輸出,其中的權(quán)就是網(wǎng)絡(luò)可調(diào)參數(shù)。這里隱含層的作用就是把向量從低維度的線(xiàn)性不可分的P映射到高維度的線(xiàn)性可分的H,這個(gè)就是核函數(shù)的思想。RBF神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)可以模擬人腦里的局部調(diào)整,以及相互覆蓋接收域,并且經(jīng)過(guò)證明RBF網(wǎng)絡(luò)可以對(duì)任意的連續(xù)函數(shù)進(jìn)行任意精度的逼近[2,6]。盡管和BP網(wǎng)絡(luò)學(xué)習(xí)過(guò)程類(lèi)似,但是BP網(wǎng)絡(luò)采用的是輸入模式和權(quán)向量作內(nèi)積為激活函數(shù)的自變量,其選用的激活函數(shù)即隱函數(shù)是Sigmoid函數(shù),其中的各個(gè)調(diào)參數(shù)在對(duì)BP網(wǎng)絡(luò)的輸出中具有同等地位的影響,因此采用的是全局進(jìn)行逼近的一種神經(jīng)網(wǎng)路,在輸入空間中它是在無(wú)限大的范圍內(nèi)不為零值;然而RBF網(wǎng)絡(luò)采用高斯基函數(shù)作為作用函數(shù),它在輸入空間的有限范圍內(nèi)不為零,輸入的神經(jīng)元距離徑向基函數(shù)即高斯函數(shù)的中心越遠(yuǎn),其激活程度就越低,輸出與部分調(diào)參數(shù)有關(guān),是一種采用局部逼近型的神經(jīng)網(wǎng)絡(luò)模型,它的網(wǎng)絡(luò)的權(quán)值可通過(guò)線(xiàn)性方程組直接解出,學(xué)習(xí)速度很快,也能避免局部極小,可以滿(mǎn)足控制的實(shí)時(shí)性要求[3-4]。
假定有一個(gè)機(jī)械手,用式(1)來(lái)描述它的數(shù)學(xué)模型:
(1)
帶入式(1),可得
式中參數(shù):
ΔD=D0-D,ΔC=C0-C,ΔG=G0-G
假設(shè)
則把控制律
帶入式(1)得到
此是一個(gè)穩(wěn)定的閉環(huán)系統(tǒng)[3]。
在實(shí)際的系統(tǒng)中,由于數(shù)學(xué)模型中不確定的部分f(x)是未知的,因此可以采用RBF網(wǎng)絡(luò)的方法來(lái)進(jìn)行逼近,從而實(shí)現(xiàn)對(duì)f(x)的精度補(bǔ)償[5,7-8]。
RBF網(wǎng)絡(luò)算法假定是
y=θTφ(x)
其中,x是輸入信號(hào),y是輸出信號(hào),φ=[φ1,φ2,…φn]是神經(jīng)網(wǎng)絡(luò)隱含層函數(shù)高斯基函數(shù)的輸出,θ是神經(jīng)網(wǎng)絡(luò)的權(quán)值。
其中,
θ*是一個(gè)n×n階的矩陣,它表示對(duì)不確定的部分f(x)函數(shù)最佳逼近的神經(jīng)網(wǎng)絡(luò)權(quán)值。
對(duì)于連續(xù)的函數(shù),在這兩個(gè)條件限定下,RBF神經(jīng)網(wǎng)絡(luò)可以在有限的范圍內(nèi)實(shí)現(xiàn)任意精度的逼近,假定數(shù)學(xué)模型的誤差η是一個(gè)有界函數(shù),其界限用η0表示,則有
其中
假設(shè)控制器的τ=τ1+τ2
令
其中A,B矩陣分別為
定義Lyapunov函數(shù)
其中,參數(shù)γ>0。
假設(shè)式中的P矩陣是一個(gè)對(duì)稱(chēng)的正定矩陣,且滿(mǎn)足式子PA+ATP=-QQ≥0。
其中tr(.)表示的是矩陣的跡,則
其中
由于
所以
(2)
由范數(shù)的性質(zhì)
得出
又因?yàn)?/p>
可得
假如滿(mǎn)足
即
只有在特征值Q的取值越大,P的特征值取值越小,有界函數(shù)數(shù)學(xué)模型的誤差上界值η0越小,θmax取值越小的時(shí)候,x收斂的半徑就會(huì)越小,那么系統(tǒng)的精確度就越高。
以單力臂機(jī)械手的控制為例進(jìn)行仿真計(jì)算。假定單力臂機(jī)械手其數(shù)學(xué)模型為
其中D0=0.047,G0=2.45cosθ,d=1.3sin(0.5πt),系統(tǒng)的初始狀態(tài)為x=[0.15,0]。
圖1 Simulink控制程序
點(diǎn)擊仿真按鈕進(jìn)行仿真,可得仿真結(jié)果分別如圖2—圖5所示。
圖2 位置跟蹤
圖3 基于神經(jīng)網(wǎng)絡(luò)的控制補(bǔ)償
圖4 總的控制輸入
圖5 模型不確定項(xiàng)f(x)及其估計(jì)
由仿真結(jié)果可以得出,采用RBF神經(jīng)網(wǎng)路算法,可以保證權(quán)值的有界性,很好地解決神經(jīng)網(wǎng)絡(luò)的權(quán)值的收斂問(wèn)題。
RBF神經(jīng)網(wǎng)絡(luò)即徑向基函數(shù),它本身是具有單隱層的三層前饋網(wǎng)絡(luò),從輸入空間到輸出空間的映射呈現(xiàn)非線(xiàn)性,但是從隱含層空間到輸出空間的映射卻呈現(xiàn)線(xiàn)性[10,12],又由于RBF網(wǎng)絡(luò)它采用的是局部逼近的神經(jīng)網(wǎng)絡(luò)方法,所以采用RBF網(wǎng)絡(luò)能夠很快地進(jìn)行學(xué)習(xí)并且避免出現(xiàn)局部極小問(wèn)題[14-15],能夠滿(mǎn)足控制的實(shí)時(shí)性要求。因此采用RBF神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行單力臂機(jī)械手的控制,其控制的精確度和實(shí)時(shí)性很高,控制效果很好。
參考文獻(xiàn)(References):
[1] FENG G.A Compensating Scheme for Robot Tracking Based on Neural Networks[J].Robotics and Autonomous Systems,1995(15):100—206
[2] 劉金琨.智能控制[M].北京:電子工業(yè)出版社,2005
LIU J K.Intelligent Control[M].Beijing:Electronic Industry Press,2005(in Chinese)
[3] 斯洛廷.應(yīng)用非線(xiàn)性控制[M].程代展譯.北京:機(jī)械工業(yè)出版社,2006
SI L T.Application of Nonlinear Control[M].CHENG D Z Translation.Beijing:Mechanical Industry Press,2006(in Chinese)
[4] 丁學(xué)恭.機(jī)器人控制研究[M].杭州:浙江大學(xué)出版社,2006
DING X G.Robot Control Research[M].Hangzhou:Zhejiang University Press,2006(in Chinese)
[5] CHUANG H Y,CHIEN K H.A Real-Time NURBS Motion Interpolator for Position Control of A Slide Equilateral Triangle Parallel Manipulator[J].The International Journal of Advanced Manufacturing Technology,2007,34(7):724—735
[6] 張亞平,張立偉.基于徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的投資預(yù)測(cè)模型[J].吉林師范大學(xué)學(xué)報(bào)自然科學(xué)版2011(2):75—78
ZHANG Y P,ZHANG L W.Investment Prediction Model Based on Radial Basis Function Neural Network[J].Journal of Jilin Normal University(Natural Science Edition),2011(2):75—78(in Chinese)
[7] 陳龍憲.基于模型不確定逼近的RBF網(wǎng)絡(luò)機(jī)器人自適應(yīng)控制[J].電子設(shè)計(jì)工程,2012,10(20):80—83
CHEN L X.Adaptive Control of RBF Network Robot Based on Model Uncertainty Approximation[J].Electronic Design Engineering,2012,10(20):80—83(in Chinese)
[8] 謝廣明.機(jī)器人控制與應(yīng)用[M].哈爾濱:哈爾濱工程大學(xué)出版社,2013
XIE G M.Robot Control and Application[M].Harbin:Harbin Engineering University Press,2013(in Chinese)
[9] 張采芳.MATLAB 編程及仿真應(yīng)用[M].武漢:華中科技大學(xué)出版社,2014
ZHANG C F.MATLAB Programming and Simulation Application[M].Wuhan:Huazhong University of Science and Technology Press,2014(in Chinese)
[10] 胥良,郭林,梁亞.基于模糊RBF神經(jīng)網(wǎng)路的智能PID控制[J].工業(yè)儀表與自動(dòng)化裝置,2015(5):67—69
XU L,GUO L,LIANG Y.Intelligent PID Control Based on Fuzzy RBF Neural Network[J].Industrial Instrumentation and Automation,2015(5):67—69(in Chinese)
[11] 周志華.深度學(xué)習(xí)[M].北京:清華大學(xué)出版社,2016
ZHOU Z H.Deep Learning[M].Beijing:Tsinghua University Press,2016(in Chinese)
[12] HE K,ZHANG X,REN S,et al.Deep Residual Learning for Image Recognition[J].Proceedings of the IEEE Conference on Computer vision and Pattern Recognition,2016(6):27—30
[13] 劉金琨.機(jī)器人控制系統(tǒng)的設(shè)計(jì)與MATLAB仿真:先進(jìn)設(shè)計(jì)方法[M].北京:清華大學(xué)出版社,2017
LIU J K.Robot Control System Design and MATLAB Simulation:Advanced Design Method[M].Beijing:Tsinghua University Press,2017(in Chinese)
[14] 王超.基于神經(jīng)網(wǎng)絡(luò)的BCH-RS碼譯碼方法研究[D].西安:西安電子科技大學(xué)碩士論文,2019
WANG C.Research on BCH-RS Decoding Method Based on Neural Network[D].Xi’an:Master Thesis of Xidian University,2019(in Chinese)
[15] 黃春福,李安.基于PSO-SVR的光纖陀螺溫度誤差建模與實(shí)時(shí)補(bǔ)償[J].光子學(xué)報(bào),2019,48(12):1206002:1—7
HUANG C F,LI A.Temperature Error Modeling and Real-time Compensation of Fog Based on Pso-svr[J].Journal of Photons,2019,48(12):1206002:1—7(in Chinese)
重慶工商大學(xué)學(xué)報(bào)(自然科學(xué)版)2021年2期