鄭泛舟
(湄洲灣職業(yè)技術(shù)學(xué)院 信息工程系,福建 莆田 351119)
神經(jīng)網(wǎng)絡(luò)控制器在一些特定條件下,例如在有界的跟蹤誤差和補(bǔ)償控制器的存在下,能夠保證閉環(huán)性能[1]。此外,通過建立連續(xù)時間和離散時間的神經(jīng)網(wǎng)絡(luò)校正算法使得神經(jīng)網(wǎng)絡(luò)權(quán)值易于初始化,神經(jīng)網(wǎng)絡(luò)能夠?qū)崟r在線學(xué)習(xí),避免了需要預(yù)先離線學(xué)習(xí);與傳統(tǒng)的自適應(yīng)控制相比,神經(jīng)網(wǎng)絡(luò)控制器不需要建立回歸矩陣;并且,將Lyapunov穩(wěn)定性判據(jù)引入,保證了跟蹤誤差和權(quán)值估計誤差都是有界的,這大大保證了神經(jīng)網(wǎng)絡(luò)控制器的穩(wěn)定性。因此,神經(jīng)網(wǎng)絡(luò)控制器一直是智能控制領(lǐng)域中的研究熱點(diǎn),不但在人工智能領(lǐng)域,也在自動控制領(lǐng)域都受到了極大的關(guān)注。
當(dāng)今智能控制領(lǐng)域?qū)W者的很多工作受到了人腦結(jié)構(gòu)的啟發(fā),嘗試建立不同的神經(jīng)網(wǎng)絡(luò)模型來提高神經(jīng)網(wǎng)絡(luò)控制器的效率,例如,Moren和Balkenius[2]的大腦情感學(xué)習(xí)模型網(wǎng)絡(luò)(Brain Emo?tional Learning,BEL)就是此類的一項開創(chuàng)性的工作。該網(wǎng)絡(luò)在數(shù)學(xué)上模擬了杏仁核和大腦中相關(guān)部分的情緒活動。BEL網(wǎng)絡(luò)由四個子系統(tǒng)組成:丘腦、感覺皮層、杏仁核和眶額皮質(zhì)。輸入信號從丘腦進(jìn)入,通過應(yīng)用非線性映射后,被映射到感覺皮層。杏仁核通過感覺皮層接收精確和間接的信號,并且杏仁核直接從丘腦接收不精確的信號,從而產(chǎn)生興奮信號。除了丘腦輸入外,眶額皮質(zhì)的連接也是一樣的。它抑制杏仁核不匹配的部分激發(fā)信號產(chǎn)生網(wǎng)絡(luò)輸出。杏仁核和眶額皮質(zhì)也會接收到一個外部增強(qiáng)信號,以調(diào)整它們的權(quán)重,從而適當(dāng)?shù)貓?zhí)行信號傳遞任務(wù)[3]。
大腦情感學(xué)習(xí)網(wǎng)絡(luò)模型作為一種先進(jìn)學(xué)習(xí)型結(jié)構(gòu)迅速進(jìn)入控制和決策領(lǐng)域,對實際的控制過程進(jìn)行系統(tǒng)建模,參數(shù)估計,甚至用作控制器。不少研究者將大腦情感學(xué)習(xí)網(wǎng)絡(luò)用于自適應(yīng)控制系統(tǒng)中,驗證這種網(wǎng)絡(luò)在線性和非線性系統(tǒng)的控制系統(tǒng)中的表現(xiàn)[3-4]。此外,比較典型的研究還有Debnath等人利用大腦情感學(xué)習(xí)網(wǎng)絡(luò)優(yōu)秀的非線性特點(diǎn),在模擬環(huán)境中對四罐系統(tǒng)進(jìn)行了模擬,收到了較好的效果[5]。Deshti等人還提出了將大腦情感學(xué)習(xí)網(wǎng)絡(luò)用在流動非線性、內(nèi)部摩擦和噪聲情況下對電動液壓伺服系統(tǒng)進(jìn)行速度控制[6]。還有不少研究工作嘗試使用大腦情感學(xué)習(xí)網(wǎng)絡(luò)控制不同類型的機(jī)械臂和移動型機(jī)器人[7-9]。
從現(xiàn)有的研究中發(fā)現(xiàn)大腦情感學(xué)習(xí)在非線性函數(shù)擬合的能力可以引入模糊推理系統(tǒng)。但現(xiàn)有的研究中對于模糊推理機(jī)制在大腦情感學(xué)習(xí)的改進(jìn)和應(yīng)用還比較有限。因此,本文對一種模糊大腦情感學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)模型進(jìn)行了研究與實現(xiàn),為了提高模糊大腦情感學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)的控制表現(xiàn),將其嵌入到帶有滑模面的前饋型自適應(yīng)控制器中,并分別在混動模型和六足機(jī)器人的模擬環(huán)境中進(jìn)行驗證。實驗結(jié)果表明,引入模糊推理機(jī)制的大腦情感學(xué)習(xí)網(wǎng)絡(luò)具有較好的非線性擬合能力和應(yīng)對控制中的擾動抑制能力。
模糊大腦情感學(xué)習(xí)網(wǎng)絡(luò)的結(jié)構(gòu)如圖1所示,模糊大腦情感學(xué)習(xí)網(wǎng)絡(luò)由眶額皮層通道和杏仁核通道組成??纛~皮層通道是一個情感網(wǎng)絡(luò),杏仁核通道是一個感官網(wǎng)絡(luò)。一種單輸出的模糊大腦情感學(xué)習(xí)網(wǎng)絡(luò)可以由如下表示:
圖1 大腦情感學(xué)習(xí)控制器網(wǎng)絡(luò)結(jié)構(gòu)圖
其中i=1,2,…,m;并且,j=1,2,…,n.i是系統(tǒng)輸入的個數(shù);j是隱含神經(jīng)元的個數(shù),a是杏仁核的輸出量,o是眶額皮層輸出量。每個隱含神經(jīng)元的傳遞函數(shù)如下:
其中sij是高斯函數(shù)的輸出,Ii是系統(tǒng)輸入,ζij是均值,是方差。此外,基于兩個模糊規(guī)則庫的大腦情感模型網(wǎng)絡(luò)推理系統(tǒng)被用于感覺神經(jīng)網(wǎng)絡(luò)的模糊杏仁核系統(tǒng),模糊規(guī)則庫則表示為:
如果Ii是λ1j并且Ii是λ2j,…,那么a=vij,
如果Ii是λ1j并且Ii是λ2j,…,那么o=wij,
其中vij和wij分別為兩個通道的權(quán)重。權(quán)重的更新由下式給出:
其中α和β是學(xué)習(xí)率,uBELC是網(wǎng)絡(luò)輸出,dj的參數(shù)調(diào)整如下:
其中bi和c是增益參數(shù),通常在實際控制中根據(jù)經(jīng)驗確定。
圖2給出了基于神經(jīng)網(wǎng)絡(luò)的控制器結(jié)構(gòu)圖,它包括了被控對象基于神經(jīng)網(wǎng)絡(luò)的控制器模塊。誤差與其一階導(dǎo)數(shù)的組合誤差被輸入基于神經(jīng)網(wǎng)絡(luò)的控制器中??刂破饔梢粋€模糊大腦情感學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)uFBEL和一個魯棒控制器組成ur;其中模糊大腦情感學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)作為主控制器,接收組合誤差輸入,輸出為控制量;而魯棒控制器作為一個輔助控制器,為彌補(bǔ)模糊大腦情感學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)逼近理想的系統(tǒng)動力學(xué)過程中的近似誤差而設(shè)計;模糊大腦情感學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的輸出和魯棒控制器的輸出組合到一起作為整體控制器的輸出u,其定義為u=uFBELC+ur。這里,魯棒控制器ur的定義如下:
圖2 模糊大腦情感學(xué)習(xí)網(wǎng)絡(luò)控制器結(jié)構(gòu)圖
其中,R=diag(r1,r2,…,rm)和I是一個統(tǒng)一矩陣;s(,t)是一個滑膜平面。
為了驗證模糊大腦情感學(xué)習(xí)網(wǎng)絡(luò)控制系統(tǒng)的有效性,在實驗中使用該控制器對Duffing-Hol?mes混沌系統(tǒng)和六足機(jī)器人系統(tǒng)進(jìn)行控制。為了比較所提出的控制系統(tǒng)的性能,我們與其它兩種控制模型做了比較。兩種比較模型是:傳統(tǒng)的PID控制模型和模糊小腦控制器網(wǎng)絡(luò)建立的控制器。
Duffing-Holmes混沌系統(tǒng)是典型的復(fù)雜不確定非線性系統(tǒng),該混沌系統(tǒng)由兩個子系統(tǒng)組成:(1)驅(qū)動子系統(tǒng)和(2)響應(yīng)子系統(tǒng)。這兩個子系統(tǒng)的定義如下:
(1)驅(qū)動子系統(tǒng)表示為:
其中xd和x分別代表驅(qū)動系統(tǒng)和響應(yīng)系統(tǒng)的系統(tǒng)狀態(tài),u表示輸入,Δf(x)表示未知不確定項,d(t)是外部擾動。本次實驗中,系統(tǒng)的初值為:;滑動表面設(shè)計為:
三個控制系統(tǒng)的仿真結(jié)果如圖3所示,紅色實線表示驅(qū)動系統(tǒng)的參考軌跡;黑色實線、綠色實線、藍(lán)色實線分別表示PID,F(xiàn)CMAC(模糊小腦控制器網(wǎng)絡(luò))和FBEL(模糊大腦情感學(xué)習(xí)網(wǎng)絡(luò))控制系統(tǒng)生成的跟蹤軌跡。在圖3中,由三個控制系統(tǒng)生成的所有軌跡都可以成功地跟蹤混沌軌跡。但模糊大腦情感學(xué)習(xí)網(wǎng)絡(luò)控制系統(tǒng)的軌跡比其他的控制系統(tǒng)更早的到達(dá)參考點(diǎn)。
圖3 混動系統(tǒng)軌跡跟蹤圖
完整的跟蹤響應(yīng)如圖4(a)所示,在該圖中,所有三個控制系統(tǒng)都可以很好地跟上追蹤目標(biāo),性能差異僅在跟蹤開始時存在。因此,圖4(b)中展示了前兩秒的跟蹤性能。從圖中可以看出,模糊大腦情感學(xué)習(xí)網(wǎng)絡(luò)實現(xiàn)了良好的追蹤性能,而且在進(jìn)行了一段調(diào)整后,模糊大腦情感學(xué)習(xí)網(wǎng)絡(luò)可以快速捕捉參考軌跡,并緊跟目標(biāo)。相反,PID和模糊小腦控制器網(wǎng)絡(luò)的軌跡需要更長的時間才能逼近目標(biāo)軌跡。
圖4(c)顯示了三個控制系統(tǒng)從0秒到50秒的跟蹤誤差,圖4(d)顯示了在前5秒期間的跟蹤誤差。在這兩個子圖可以看出,所有控制系統(tǒng)都具有穩(wěn)定的性能,但是模糊大腦情感學(xué)習(xí)網(wǎng)絡(luò)控制系收斂更快。
圖4 xd與x的軌跡圖
表1給出了所有控制器的跟蹤誤差的累積RMSE值,從表中可見,PID和模糊小腦控制器網(wǎng)絡(luò)的性能非常接近,而模糊大腦情感學(xué)習(xí)網(wǎng)絡(luò)明顯優(yōu)于上述的兩個控制器。因此由該實驗可以得出結(jié)論,基于模糊大腦情感學(xué)習(xí)網(wǎng)絡(luò)的控制系統(tǒng)優(yōu)于其他的控制系統(tǒng)。
表1 三種控制器在混動系統(tǒng)中累積RMSE表現(xiàn)
圖5給出了一個六關(guān)節(jié)的雙足行走機(jī)器人示意圖。該機(jī)器人的數(shù)學(xué)模型表示如下:
圖5 六關(guān)節(jié)的雙足行走機(jī)器人示意圖
在上述表達(dá)式中,其中b=0.145m,其余各個參數(shù)的具體值如表2所示,其中n的取值范圍為1到6。
表2 六關(guān)節(jié)的雙足行走機(jī)器人的參數(shù)設(shè)置
在六關(guān)節(jié)雙足機(jī)器人的仿真實驗中,我們計算了三種控制器在各個關(guān)節(jié)的累積誤差,并匯總在表3中??梢钥吹絇ID控制器在關(guān)節(jié)4中的表現(xiàn)最好,其次是FCMAC控制器,而FBEL控制器在關(guān)節(jié)四種的精度沒有超過前兩種。FCMAC控制器在關(guān)節(jié)6中表現(xiàn)的最好,而PID與FBEL的精度稍差,但是差別不會太大。相比之下,F(xiàn)BEL控制器在剩下的4個關(guān)節(jié)中達(dá)到了最好的控制效果,且明顯超出另外兩種控制器的幅度。實驗結(jié)果表明:FBEL在更復(fù)雜的非線性系統(tǒng)的控制中,能夠達(dá)到總體比較優(yōu)勢的效果。
表3 三種控制器在六足機(jī)器人中各關(guān)節(jié)累積RMSE表現(xiàn)
本研究實現(xiàn)了一種引入模糊推理機(jī)制的大腦情感學(xué)習(xí)神經(jīng)網(wǎng)絡(luò),并在一種混沌系統(tǒng)中驗證了它的有效性。實驗過程與實驗結(jié)果表明,這種新型的網(wǎng)絡(luò)不需要通過反向傳播方法,僅僅依靠大腦情感學(xué)習(xí)就可以很好的實現(xiàn)系統(tǒng)的穩(wěn)定。因此,這種網(wǎng)絡(luò)對實現(xiàn)輕量化的網(wǎng)絡(luò)控制器具有很好的應(yīng)用意義。在未來的工作中,可以將這種網(wǎng)絡(luò)控制器推廣到不同的機(jī)器人實際控制器中,實現(xiàn)對機(jī)器人系統(tǒng)的實時與高精度控制。