張 超,姜天華,孫啟鳴
(1.河南工學(xué)院電氣工程與自動化學(xué)院,河南新鄉(xiāng) 453003;2.魯東大學(xué)交通學(xué)院,山東煙臺 264025;3.南京林業(yè)大學(xué)信息科學(xué)技術(shù)學(xué)院,江蘇南京 210037)
在工業(yè)領(lǐng)域,被控對象通常具有不確定性、強(qiáng)耦合、大非線性、時變特性和測量噪聲,如機(jī)器人系統(tǒng)、電力系統(tǒng)、航天器系統(tǒng)和車輛系統(tǒng)等.即使采用智能控制方法,如自適應(yīng)控制[1]、模糊控制[2]、神經(jīng)網(wǎng)絡(luò)控制[3]和解耦控制[4],也很難確保良好的控制性能.因此,東南大學(xué)嚴(yán)洪森教授團(tuán)隊提出了多維泰勒網(wǎng)(multi-dimensional Taylor network,MTN)綜合控制方案.由于其具有自學(xué)習(xí)、自組織和自適應(yīng)的特點(diǎn),MTN可自動辨識被控系統(tǒng)參數(shù)并根據(jù)系統(tǒng)變化進(jìn)行自身調(diào)節(jié).本文基于自適應(yīng)MTN模型設(shè)計多輸入多輸出(multiple-input multiple-output,MIMO)多維泰勒網(wǎng)控制器(multi-dimensional Taylor network controller,MTNC)和多維泰勒網(wǎng)濾波器(multi-dimensional Taylor network filter,MTNF).
在實(shí)際應(yīng)用中,由于易于調(diào)整和結(jié)構(gòu)簡單,無論是工業(yè)界還是學(xué)術(shù)界,PID調(diào)節(jié)都是一個活躍的研究領(lǐng)域.獲取PID和類PID控制器參數(shù)的方法有:增益相位裕度法[5]、優(yōu)化方法[6]、Ziegler-Nichol方法[7]和基于內(nèi)??刂频姆椒╗8].對于單輸入單輸出(single-input single-output,SISO)系統(tǒng),使用既有調(diào)節(jié)技術(shù)就可得到滿意的控制效果.然而,由于輸入和輸出變量之間存在耦合關(guān)系,由SISO系統(tǒng)推導(dǎo)的控制律不能直接擴(kuò)展到MIMO系統(tǒng).此外,在MIMO系統(tǒng)中,PID參數(shù)的數(shù)量將變得非常多.試湊法不足以在控制器性能和魯棒性之間獲得最佳折衷.隨著解決控制對象不確定性和復(fù)雜性的智能控制技術(shù)的迅速發(fā)展,神經(jīng)網(wǎng)絡(luò)已成為實(shí)現(xiàn)自適應(yīng)控制器的選擇之一.一些神經(jīng)網(wǎng)絡(luò)模型和神經(jīng)網(wǎng)絡(luò)訓(xùn)練方案被應(yīng)用于系統(tǒng)控制器的設(shè)計[9–10].例如,作為前饋控制器,Plett[9]深入討論了神經(jīng)網(wǎng)絡(luò)如何學(xué)習(xí)模仿被控對象的逆.然而,神經(jīng)網(wǎng)絡(luò)參數(shù)訓(xùn)練耗時且易陷入局部最小;無系統(tǒng)化的方法確定網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu).
針對這些問題,設(shè)計規(guī)范的確定就顯得尤為重要,即所采用的控制算法[11]和結(jié)構(gòu)應(yīng)足夠簡單且易于實(shí)現(xiàn).設(shè)計的控制方案應(yīng)包含非線性、魯棒性、靈活性和學(xué)習(xí)能力等特征.目前一些學(xué)者正對MTN模型在模型預(yù)測[12]、系統(tǒng)辨識[13]、災(zāi)害預(yù)測[14]、電機(jī)控制[15]以及非線性控制[16?20]等領(lǐng)域的應(yīng)用進(jìn)行研究,但該模型僅應(yīng)用于SISO系統(tǒng)且未綜合考慮系統(tǒng)耦合、不確定性、時變特性及測量噪聲等因素.同時研究發(fā)現(xiàn),PID控制器是MTN控制器的特殊形式.此外,當(dāng)采用固定步長的傳統(tǒng)梯度下降法進(jìn)行權(quán)值訓(xùn)練時,會存在收斂速度慢和局部最小值的問題[21].為此,在MTNC權(quán)值自適應(yīng)調(diào)節(jié)過程中,針對被控對象的時變特性,設(shè)計線性再勵的自適應(yīng)變步長算法及自適應(yīng)動量因子算法來解決.合適的參數(shù)不僅有利于平滑權(quán)值學(xué)習(xí)軌跡、加速算法收斂,而且有助于跳出誤差曲面的局部最小值.
測量數(shù)據(jù)的消噪處理是分析和控制工業(yè)過程時不可或缺的處理手段.由于Lyapunov穩(wěn)定性理論(Lyapunov stability theory,LST)能夠保證穩(wěn)定性,并且具有全局最小值的能量空間結(jié)構(gòu),因此在自適應(yīng)濾波技術(shù)中得到了有效的應(yīng)用.Man等[22]提出了基于LST的徑向基神經(jīng)網(wǎng)絡(luò)(radial basis function neural network,RBFNN)的優(yōu)化設(shè)計,實(shí)現(xiàn)有限脈沖響應(yīng)(finiteimpulse response,FIR)自適應(yīng)濾波器.但尋求最優(yōu)RBFNN節(jié)點(diǎn)中心和高斯寬度的方法還未分析,其對于獲得高濾波性能非常關(guān)鍵.同時,該結(jié)果只提供了Lyapunov濾波的基本思想,一些問題,如采用修正增益后的非線性濾波器的收斂速度和收斂區(qū)域尚待研究.因MTN具有任意逼近性和單中間層節(jié)點(diǎn)線性加權(quán)組合的簡單計算,使得其成為構(gòu)建非線性濾波器的選擇之一.
本文利用MTN實(shí)現(xiàn)基于Lyapunov理論的自適應(yīng)濾波(Lyapunov stability theory-based adaptive filtering,LAF)的無限脈沖響應(yīng)(infinite-impulse response,IIR)自適應(yīng)濾波器,設(shè)計了基于LST 的權(quán)值自適應(yīng)算法以獲得最優(yōu)解.1)通過構(gòu)建訓(xùn)練誤差的Lyapunov函數(shù)V(能量函數(shù)),將LST應(yīng)用到MTN權(quán)值訓(xùn)練算法;2)對權(quán)值進(jìn)行重復(fù)更新以滿足:?V <0.根據(jù)LST,訓(xùn)練誤差可指數(shù)收斂到零;3)分析LAF的誤差收斂速度和改進(jìn)LAF的誤差收斂區(qū)域,避免“奇點(diǎn)”問題.
本文主要貢獻(xiàn)為:1)進(jìn)行MIMO MTN性能分析;2)推導(dǎo)MTNC權(quán)值的快速學(xué)習(xí)算法,給出MTNC權(quán)值的初始值選擇方案;3)證明閉環(huán)系統(tǒng)的穩(wěn)定性,并利用Lyapunov穩(wěn)定性理論獲得MTNC的穩(wěn)定學(xué)習(xí)率;4)設(shè)計用于濾波的MTNF以消除測量噪聲,并分析了濾波誤差的收斂性速度和收斂區(qū)域.綜上所述,MTNC和MTNF能夠在不借助人工干預(yù)的情況下完成控制/濾波參數(shù)的調(diào)節(jié),實(shí)現(xiàn)復(fù)雜被控對象優(yōu)化跟蹤控制.
考慮MIMO非線性時變離散系統(tǒng),可用輸入輸出差分方程表示為
其中:
f(·)為非線性向量函數(shù);
Rs為系統(tǒng)輸出向量;
s表示輸出的數(shù)量,j=1,2,···,s;
Rt為系統(tǒng)輸入向量;
t表示輸入的數(shù)量,i=1,2,···,t;k=1,2,···;
dut]T為相應(yīng)的最大延遲.
如果被控對象所處的環(huán)境存在量測噪聲(隨機(jī)干擾),也就是被控對象受到噪聲的作用,或者說被控對象受到噪聲的污染,那么在式(1)中應(yīng)加入相應(yīng)的項,可得到
其中v(k)=[v1(k)v2(k)··· vj(k)··· vs(k)]T∈Rs為噪聲向量,可以是模型噪聲或測量噪聲.含噪聲非線性時變系統(tǒng)就是其擾動可以用隨機(jī)過程表示的受控動力學(xué)時變系統(tǒng).
MIMO MTN模型具有結(jié)構(gòu)簡單、計算速度快的優(yōu)點(diǎn),其本質(zhì)上是一個多項式類型的非線性自回歸滑動平均模型.根據(jù)多元泰勒公式的原理,如果某函數(shù)在某點(diǎn)鄰域處處m+1階可導(dǎo),則該函數(shù)在該點(diǎn)展開式為變量冪級數(shù)不大于m次的形式.因此,基于MIMO MTN模型,可以將n維系統(tǒng)的一般動力學(xué)方程表示為
其中:fi(·)表示用MTN模型描述的非線性函數(shù),其基本思想是用簡單函數(shù)逼近復(fù)雜函數(shù);wip是第p個變量乘積項之前的權(quán)值;N(n,m)是該展開式的總項數(shù);λp,q是第p個變量乘積項中變量xq的冪次.
如圖1所示,多維泰勒網(wǎng)采用前向單中間層結(jié)構(gòu),包括輸入層、中間層和輸出層.只要N(n,m)足夠大,MTN就能夠以足夠精度逼近任意模型[14].盡管式(3)是系統(tǒng)輸入輸出的非線性函數(shù),但模型參數(shù)是線性關(guān)系的.同時,通過抽頭延遲將系統(tǒng)的動力學(xué)特性引入到網(wǎng)絡(luò)輸入端,從而形成動態(tài)的網(wǎng)絡(luò)化控制器.
典型的離散PID控制器可以表示為
其中:u(k)為第k時刻的控制律;和kD分別為比例、積分和微分增益;TI和TD分別表示積分和微分常數(shù);T表示采樣時間.
圖1 多輸入多輸出多維泰勒網(wǎng)模型Fig.1 MIMO multi-dimensional Taylor network model
由式(3)可知,當(dāng)n=3 且m=1 時,MTN控制器可以由向量形式表示:
其中:xP(k)=[e1(k)e2(k)··· en(k)]T∈Rn,
若KP,KI和KD選取為對角矩陣,結(jié)合式(4),PID控制器恰為冪次為1的MTN控制器的特殊形式;若KP,KI和KD選取為非對角矩陣,通過引入各通道之間的耦合實(shí)現(xiàn)了各子系統(tǒng)控制器參數(shù)的時變特性[16].
在工業(yè)應(yīng)用中,如果選擇的參數(shù)(kP,kI和kD)是最優(yōu)的,就可得到滿意的跟蹤性能.然而,當(dāng)系統(tǒng)具有強(qiáng)非線性、隨機(jī)因素和時變特性時,選擇這些參數(shù)是困難的.本文通過在線學(xué)習(xí)MTN 控制器參數(shù),使得MTN控制器既具有經(jīng)典PID控制簡單的特點(diǎn),又具有神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)能力強(qiáng)的優(yōu)勢.此外,根據(jù)理論分析[19]和仿真驗(yàn)證,MTN控制器高次項對動態(tài)性能改善效果顯著.
控制系統(tǒng)采用閉環(huán)控制,主要由控制器、被控對象和濾波器3部分組成,其中控制器和濾波器都是基于自適應(yīng)多維泰勒網(wǎng)模型構(gòu)建的,如圖2所示.
在整個控制系統(tǒng)中,yd為目標(biāo)矢量,eC為誤差矢量,u為控制器輸出的控制律,y為被控對象的輸出,yv為受噪聲污染的輸出信號,ye為濾波后的輸出信號.
圖2 基于MTN的控制系統(tǒng)結(jié)構(gòu)圖Fig.2 Structure of the control system with MTN proposed
為了獲得更好的控制效果并快速接近被控對象目標(biāo)值,MTNC權(quán)值需根據(jù)誤差進(jìn)行調(diào)節(jié),梯度下降法用于調(diào)整更新速度.對于函數(shù)f(u),u=(u1,u2,···,ut)T,梯度表示為
其中負(fù)梯度方向?yàn)樽疃赶陆捣较?動量項以一定概率加入到個體速度中,這有助于個體更有效地搜索解[23].權(quán)值更新方向是當(dāng)前誤差梯度和上一步權(quán)值更新增量的線性組合.合適的參數(shù)不僅有利于平滑權(quán)值學(xué)習(xí)軌跡、加快算法收斂,而且有助于跳出誤差曲面的局部極小值.引入動量項的優(yōu)點(diǎn)還有:1)當(dāng)MTNC的誤差曲面出現(xiàn)在平坦區(qū)域,動量項的引入將增加權(quán)值變化率并大大提高M(jìn)TNC的收斂速度;2)當(dāng)測量數(shù)據(jù)含有噪聲等不確定因素,帶動量項的權(quán)值更新算法通過限制權(quán)值更新方向的變化可提供低通濾波功能;3)對學(xué)習(xí)過程中的離群值和錯誤數(shù)據(jù)樣本有一定的免疫力.
由此,MTNC權(quán)值由式(7)進(jìn)行更新:
其中:η和σ為網(wǎng)絡(luò)學(xué)習(xí)率;eC(k)為跟蹤誤差,計算如下:
注1本節(jié)只關(guān)注自適應(yīng)MIMO MTN控制器的設(shè)計,暫不考慮測量噪聲的消除.同時,令參考模型M=I,其中I為單位矩陣,故yd(k)=r(k).
通過最小化跟蹤誤差eC(k)來自動調(diào)整權(quán)值,MTNC參數(shù)在每個采樣周期內(nèi)完成計算,實(shí)現(xiàn)被控對象的非線性、自適應(yīng)實(shí)時控制.MTNC的權(quán)值更新規(guī)則為
為了避免計算實(shí)際的結(jié)果,采用將梯度替換成符號的彈性BP算法來計算?yj(k)/?ui(k).這樣既簡化了計算,又滿足了在線控制的要求,而且還大大避免了由于梯度太小而導(dǎo)致權(quán)值更新停止的問題.
此外,針對被控對象的時變特性,充分考慮MTN的特殊性,需對快速學(xué)習(xí)算法進(jìn)行深入的研究和討論.本節(jié)在MTNC學(xué)習(xí)過程中設(shè)計線性再勵的自適應(yīng)變步長算法和自適應(yīng)動量因子.
1)線性再勵的自適應(yīng)變步長算法.
利用強(qiáng)化學(xué)習(xí)的理論[24],尋求自適應(yīng)變步長算法,實(shí)現(xiàn)步長的自動選擇,加快算法的收斂速度,減少迭代次數(shù).強(qiáng)化學(xué)習(xí)是把學(xué)習(xí)看作試探評價過程,系統(tǒng)選擇一個動作作用于環(huán)境,環(huán)境接受動作后狀態(tài)發(fā)生變化,同時產(chǎn)生一個再勵信號(獎或罰)反饋給系統(tǒng),系統(tǒng)根據(jù)再勵信號和環(huán)境當(dāng)前狀態(tài)再選擇下一工作信號.
基于強(qiáng)化學(xué)習(xí)的自適應(yīng)變步長算法表示為
其中ξ為常數(shù),其范圍是0.001~0.003.本質(zhì)上講,該算法是利用并記憶梯度方向?eC的符號變化信息,方向相反時對其罰,方向相同時對其獎.
2)自適應(yīng)動量因子.
為了尋求加速收斂的方法,需在權(quán)值空間中考察梯度學(xué)習(xí)算法的誤差曲面.在誤差曲面的平坦區(qū)域,增大動量因子,可使權(quán)值更新向量wip(k+1)?wip(k)獲得較大的沖量,有助于權(quán)值逃離誤差曲面的平坦區(qū)域,從而加速算法收斂;在誤差曲面的陡峭區(qū)域,減小動量因子可避免算法出現(xiàn)不穩(wěn)定.因此,動量因子不能簡單地取作常數(shù),而應(yīng)是自適應(yīng)變化的.
誤差曲面的陡緩程度可以用誤差關(guān)于權(quán)值向量的梯度的范數(shù)來衡量:1)當(dāng)梯度范數(shù)較大時,誤差變化較快,誤差曲面較陡;2)當(dāng)梯度范數(shù)較小時,誤差變化較慢,誤差曲面平坦.
由此,動量因子可以根據(jù)誤差關(guān)于權(quán)值向量的梯度大小自適應(yīng)調(diào)節(jié).其權(quán)值通過式(11)進(jìn)行更新:
其中υ為正常數(shù),用于控制動量因子的大小.顯見,動量因子的取值范圍是0~1,且隨著誤差關(guān)于權(quán)值向量的梯度范數(shù)的變化而變化.
在MTNC的學(xué)習(xí)過程中,由式(7)(10)和(11)組成的權(quán)值更新規(guī)則都需要選擇合適的學(xué)習(xí)率η和σ.當(dāng)η為較小的值時,盡管可保證收斂,但學(xué)習(xí)速度非常慢;當(dāng)η取很大的值時,學(xué)習(xí)算法會變得不穩(wěn)定.同時,在誤差曲面的平坦區(qū)域,σ需足夠大以加速算法收斂;在誤差曲面的陡峭區(qū)域,σ又需恰當(dāng)小以提高算法穩(wěn)定性.為此,本節(jié)提出了穩(wěn)定自適應(yīng)學(xué)習(xí)率的選擇方法.
定理1如果在采樣時刻k,學(xué)習(xí)率ηip(k)存在η(k),動量因子σip(k)存在σ(k),且η(k)和σ(k)滿足式(12)和(13),那么由圖2表示的基于MTNC的閉環(huán)控制系統(tǒng)是穩(wěn)定的.
證定義Lyapunov函數(shù)為
Lyapunov函數(shù)的變化為
根據(jù)Lyapunov定理,如果在任何采樣周期內(nèi)都有?VC(k)≤0則閉環(huán)系統(tǒng)是穩(wěn)定的,則
由式(7),可得
由式(8)–(11),可得
則式(19)可改寫為
將式(21)代入式(17),可得
為確保?VC(k)≤0,需分兩種情況討論:
由式(22),可以得出?VC(k)≤0 的充分條件是η(k)和σ(k)滿足式(23)和(24).同時,由式(23)和(24)可知,盡管需要計算wip(k)的倒數(shù)和h(k)的值,但其計算量很小.
本節(jié)實(shí)現(xiàn)了基于MTN的自適應(yīng)MIMO IIR濾波器,其優(yōu)點(diǎn)是MTN具有線性特性,通過LAF算法可以容易地調(diào)整網(wǎng)絡(luò)參數(shù).此外,MTN的并行結(jié)構(gòu)也特別適用于快速信號處理.
濾波算法設(shè)計為自適應(yīng)地更新濾波器參數(shù),以使誤差的目標(biāo)函數(shù)在參數(shù)空間中最小化.由式(25)表示的eF(k)=[eF1(k)··· eFs(k)]T為期望響應(yīng)和濾波器輸出的誤差;yv(k)=[yv1(k)··· yvs(k)]T為期望響應(yīng);ye(k)=[ye1(k)··· yes(k)]T為濾波器輸出.
由于受到被控對象非線性和測量噪聲的影響,MTN濾波器輸入信號表示為
其中:L表示延遲數(shù),nF1表示yv的輸入個數(shù),nF2表示ye的輸入個數(shù).
MIMO MTN IIR濾波器的輸出可表示為
φ(k)是泰勒類型的函數(shù),定義為
考慮量測過程輸入輸出關(guān)系為
其中:WFs×NF為待估計的MTNF參數(shù)矩陣;φ=[φ1··· φNF]T為量測向量;v=[v1··· vs]T為未知的系統(tǒng)量測噪聲.
第k時刻,定義量測值和自適應(yīng)MIMO MTN濾波輸出之間的濾波誤差為
預(yù)測誤差為
則以式(28)為量測方程的基于MIMO系統(tǒng)的LAF算法可定義為
為了防止當(dāng)∥φ(k)∥和∥eP(k)∥趨近于零時增益K(k)出現(xiàn)奇點(diǎn)問題,式(32)被改寫為
其中:K(k)為自適應(yīng)增益;∥·∥為向量的歐氏范數(shù);κ1和κ2為小的正整數(shù);e?γ為自然指數(shù)函數(shù),γ(γ≥1)為正常數(shù),影響著算法的收斂速度,γ越大其收斂速度越快.
定理2當(dāng)e?γ滿足不等式(34),自適應(yīng)MIMO LAF MTN濾波算法是穩(wěn)定的.當(dāng)MTN IIR濾波器權(quán)值由式(31)和(33)自適應(yīng)更新,濾波誤差將以指數(shù)收斂到以誤差空間原點(diǎn)為中心、半徑由式(35)定義的球體內(nèi).
證定義濾波誤差的Lyapunov函數(shù):
其中(∥φ(k)∥2/κ1)<1以及(∥eP(k)∥/κ2)<1.
泰勒級數(shù)展開應(yīng)用于:
根據(jù)式(38)和(39),式(37)可改寫為
分兩種情況討論:
考慮拋物線函數(shù)
如果γ足夠大(e?γ足夠小),那么9e?2γ/16<1或3κ2e?γ/4<1.進(jìn) 而,e?γ <4/3κ2且是向下凹的拋物線函數(shù).此外,對于給定的κ1和κ2,參數(shù)e?γ滿足下列不等式:
由于∥eF(k ?1)∥≥0,只需考慮根ρ2,即
因此,∥eF(k ?1)∥應(yīng)滿足以下不等式:
式(41)可以改寫為
考慮拋物線函數(shù):
由 于e?γ >0,即(?(9e?2γ/16)?1)<0,那 么是向下凹的拋物線函數(shù).此外,對于給定的κ1和κ2,因?yàn)?/p>
因此,在這種情況下無解(e?γ <((2κ2/3)·∥eF(k?1)∥)).
通過Lyapunov穩(wěn)定性理論,定理2證明了自適應(yīng)MIMO LAF MTN濾波系統(tǒng)的穩(wěn)定性.隨著迭代次數(shù)的增加,濾波收斂速度更快且濾波誤差收斂到零.
被控對象為由式(51)表示的含測量噪聲和強(qiáng)耦合變量的非線性時變系統(tǒng):
其中:u1和u2為控制律,
v(k)為均值為0、標(biāo)準(zhǔn)差為0.05的高斯白噪聲.
為了表明MTN控制器和濾波器的有效性和優(yōu)越性,分別將基于MTN和RBFNN[25]的控制方案作用于相同的被控對象,對控制性能進(jìn)行分析和比較.兩種方案實(shí)現(xiàn)時,只是用于構(gòu)造控制器和濾波器的模型不同,自適應(yīng)算法完全一致.系統(tǒng)參數(shù)設(shè)置如下:迭代次數(shù)50次;采樣時間0.01 s;自適應(yīng)MTNC參數(shù):6–20–2結(jié)構(gòu),即6個輸入節(jié)點(diǎn)、20個中間層節(jié)點(diǎn)和2個輸出節(jié)點(diǎn),其中nC=6,mC=2,初始學(xué)習(xí)率為0.01;自適應(yīng)MTNF參數(shù):6–20–2結(jié)構(gòu),即6個輸入節(jié)點(diǎn)、20個中間層節(jié)點(diǎn)和2個輸出節(jié)點(diǎn),其中nF=6,mF=2.利用RBFNN建立控制器,6–27–2結(jié)構(gòu),即6個輸入層神經(jīng)元、27個隱層神經(jīng)元和2個輸出層神經(jīng)元,采用線性再勵的自適應(yīng)變步長算法訓(xùn)練;利用RBFNN建立濾波器,6–27–2結(jié)構(gòu),采用改進(jìn)的LAF算法訓(xùn)練.
圖3給出了兩種控制方案中實(shí)際輸出值與目標(biāo)輸出值之間的對比.圖4給出了隨時間變化的控制律.
圖3 兩種控制方案的響應(yīng)比較Fig.3 Comparison of response under different control methods
圖5顯示了隨時間變化的跟蹤誤差比較.通過比較兩種控制方案的上升時間,峰值時間和調(diào)節(jié)時間,相比于神經(jīng)網(wǎng)絡(luò),MTN在解決時變自適應(yīng)控制的問題上具有顯著優(yōu)勢.
圖5 跟蹤誤差比較Fig.5 Tracking error comparison
為了進(jìn)一步比較兩種控制方案的控制性能,從0.15 s內(nèi)選擇14組數(shù)據(jù),表1列出了跟蹤誤差的具體值.結(jié)果說明實(shí)際輸出值可通過基于MTN的方案更快速地逼近目標(biāo)值.跟蹤誤差在0.02 s內(nèi)下降得更快,并逐漸趨于0.控制律也迅速在短時間內(nèi)變?yōu)槌A?因此,對于復(fù)雜非線性系統(tǒng),自適應(yīng)MTN控制器和濾波器收斂速度快、精度高且穩(wěn)定性好.
表1 兩種控制方法的對比結(jié)果Table 1 Tracking error using above two control methods
本文提出了基于自適應(yīng)MTN的控制器和濾波器.一方面,在每個采樣周期,設(shè)計基于強(qiáng)化學(xué)習(xí)和自適應(yīng)動量因子的改進(jìn)梯度法來更新MTNC權(quán)值;自適應(yīng)參數(shù)調(diào)整具有自校正、在線和實(shí)時的特點(diǎn);根據(jù)Lyapunov方法證明MTNC穩(wěn)定性.另一方面,設(shè)計基于Lyapunov穩(wěn)定性理論的MTNF權(quán)值改進(jìn)更新算法,使動態(tài)誤差指數(shù)收斂到零;基于改進(jìn)LAF算法,證明MTNF誤差的收斂速度和收斂區(qū)域,避免奇點(diǎn)問題.仿真結(jié)果表明自適應(yīng)MTN控制器和濾波器可以在較少的采樣周期內(nèi)取得更佳的控制效果,誤差穩(wěn)定地趨于零.