趙世超,趙東標(biāo),支程昊
(南京航空航天大學(xué) 機(jī)電學(xué)院,南京 210016)
機(jī)電作動器(以下簡稱EMA)由于其質(zhì)量輕、靈活性高、控制精度高、維護(hù)方便且在運行過程中噪聲小等優(yōu)點,近年來在各類航空航天飛行器中得到越來越廣泛的應(yīng)用[1]。EMA的工作環(huán)境往往比較復(fù)雜,給系統(tǒng)的穩(wěn)定運行帶來了很大的挑戰(zhàn),因而對EMA伺服系統(tǒng)高性能控制策略的研究就顯得尤為關(guān)鍵[2]。
EMA作為一個非線性、多變量、強(qiáng)耦合的伺服系統(tǒng),采用傳統(tǒng)的控制方法難以滿足其復(fù)雜工況下的性能要求。近年來,各種先進(jìn)的非線性控制方法得到迅速發(fā)展,神經(jīng)網(wǎng)絡(luò)控制由于其強(qiáng)非線性擬合能力,已然成為該領(lǐng)域的研究熱點。文獻(xiàn)[3]設(shè)計了一種神經(jīng)網(wǎng)絡(luò)與滑模控制相結(jié)合的方法,利用神經(jīng)網(wǎng)絡(luò)觀測系統(tǒng)集總不確定性,提高了航空作動器控制器的參數(shù)適應(yīng)性和抗干擾能力。文獻(xiàn)[4]將BP神經(jīng)網(wǎng)絡(luò)與PI控制方法結(jié)合,用于電梯用永磁同步電機(jī)的調(diào)速控制,改善了電梯的快速性和舒適性。文獻(xiàn)[5]提出一種基于單神經(jīng)元的永磁同步電機(jī)解耦控制策略,實現(xiàn)了d-q軸電流解耦,使系統(tǒng)具有快速的響應(yīng)能力和良好的靜態(tài)性能。
由于對角遞歸神經(jīng)網(wǎng)絡(luò)(以下簡稱DRNN)動態(tài)特性可以很好地對非線性時變系統(tǒng)進(jìn)行控制[6],本文為改善EMA系統(tǒng)控制性能,將DRNN與PI控制相結(jié)合,使得DRNN在系統(tǒng)運行過程中可以實時調(diào)整PI的最佳參數(shù);同時,設(shè)計了一種自適應(yīng)學(xué)習(xí)率方法,使控制器的學(xué)習(xí)能力和在線修正能力得到了提高。仿真實驗表明,改進(jìn)后的DRNN-PI控制方法增強(qiáng)了EMA速度環(huán)的響應(yīng)能力和抗干擾能力,并改善了EMA整體系統(tǒng)的靜、動態(tài)性能。
EMA根據(jù)其作動形式可分為旋轉(zhuǎn)式和直線式,本文的EMA采用直線式作動形式,其結(jié)構(gòu)簡圖如圖1所示,以永磁同步電機(jī)(以下簡稱PMSM)作為驅(qū)動電機(jī),通過離合器、滾珠絲杠將旋轉(zhuǎn)運動轉(zhuǎn)變?yōu)橥茥U的直線運動,進(jìn)而帶動舵面、起落架等實現(xiàn)期望運動[7]。
圖1 EMA機(jī)械傳動結(jié)構(gòu)
采用彈簧-阻尼-質(zhì)量模型對EMA結(jié)構(gòu)等效簡化,由歐拉定律,建立EMA的數(shù)學(xué)模型如下:
(1)
式中:J為負(fù)載折算到電機(jī)的轉(zhuǎn)動慣量;θ為電機(jī)位置輸出量;Te為電機(jī)的電磁轉(zhuǎn)矩;B為作動器系統(tǒng)折算到電機(jī)的粘性阻尼系數(shù);TL為負(fù)載轉(zhuǎn)矩。
本文EMA驅(qū)動電機(jī)選用表貼式PMSM,假設(shè)磁路不飽和,忽略磁滯和渦流損耗,磁場空間呈正弦分布,在d-q軸系有如下數(shù)學(xué)表達(dá)式:
(2)
式中:id,iq為定子繞組在同步旋轉(zhuǎn)坐標(biāo)系下的電流分量;ud,uq為定子繞組在同步旋轉(zhuǎn)坐標(biāo)系下的電壓分量;Rs,L=Lq=Ld分別為定子的電阻和電感;ωr為轉(zhuǎn)子的電角速度;ψr為轉(zhuǎn)子永磁磁鏈;p為極對數(shù)。
DRNN與BP神經(jīng)網(wǎng)絡(luò)相近,由輸入層、隱含層和輸出層組成,不同點在于前者在隱含層增加了自反饋環(huán)[8],其網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
圖2 DRNN結(jié)構(gòu)
DRNN輸入層單元接收輸入信號,隱含層接收輸入層信號及其自反饋信號,經(jīng)激勵函數(shù)傳遞給輸出層計算完成前向傳播;然后根據(jù)輸出層輸出結(jié)果與期望值誤差進(jìn)行反向傳播,動態(tài)調(diào)整網(wǎng)絡(luò)連接權(quán)值,從而使得輸出層結(jié)果不斷趨近于期望值。
增量式PI控制算法輸出表達(dá)式:
u(k)=u(k-1)+Kp[e(k)-e(k-1)]+Kie(k)
(3)
式中:e(k)和e(k-1)分別為控制器最近2次所采集的系統(tǒng)誤差;u(k)為控制器k時刻輸出;Kp和Ki為控制器增益參數(shù)。
(4)
式中:ωih為輸入層連接隱含層各神經(jīng)元間的權(quán)重;ωhh為隱含層自反饋連接的神經(jīng)元權(quán)重。σ(·)為隱含層激勵函數(shù),在此選取雙曲正切函數(shù),其表達(dá)式如下:
(5)
(6)
式中:ωho為隱含層連接輸出層各神經(jīng)元間的權(quán)重;輸出層輸出為控制器增益參數(shù)Kp和Ki,分別對應(yīng):
(7)
由于增益參數(shù)均為非負(fù)值,故選取輸出層激勵函數(shù)為非負(fù)Sigmoid函數(shù),其表達(dá)式如下:
(8)
經(jīng)上述前向傳播可得到控制器所需的增益參數(shù),進(jìn)而根據(jù)式(3)得到控制器輸出量作用于PMSM,使得EMA產(chǎn)生相應(yīng)動作。DRNN的學(xué)習(xí)基于反向傳播算法,將誤差信號沿前向傳播路徑反傳,從而調(diào)整各神經(jīng)元間的權(quán)重值,使得系統(tǒng)誤差不斷減小。定義系統(tǒng)的性能指標(biāo)函數(shù)如下:
(9)
式中:r(k)為系統(tǒng)期望值;y(k)為實際值。對于本文的EMA伺服控制系統(tǒng)而言,r(k)即為速度環(huán)控制器期望值,y(k)為實際的PMSM轉(zhuǎn)速。
采用最速梯度下降法對網(wǎng)絡(luò)權(quán)重值進(jìn)行調(diào)整,其調(diào)整公式如下:
(10)
式中:η為學(xué)習(xí)率;α為使得搜索快速收斂的慣量因子。
據(jù)上式,可得輸出層到隱含層各神經(jīng)元間的權(quán)重調(diào)整公式如下:
(11)
式中:?Δu(k)/?y(k)未知,本文在此采用近似計算方法,利用符號函數(shù)sgn(·)對其近似替代,由此帶來的計算不精確影響可以通過調(diào)整學(xué)習(xí)率進(jìn)行補(bǔ)償[9-10]。則該項可表示如下:
(12)
(13)
(14)
式中:
(15)
由DRNN學(xué)習(xí)算法可知,學(xué)習(xí)率η的選取直接決定了DRNN的收斂速度和學(xué)習(xí)效果。當(dāng)學(xué)習(xí)率η的選取較大時,理論上可以提高神經(jīng)網(wǎng)絡(luò)的收斂速度,但是可能會引起權(quán)值在最優(yōu)點附近振蕩,從而影響控制器的控制效果[11],導(dǎo)致電機(jī)轉(zhuǎn)速在一定范圍內(nèi)振蕩,不利于EMA伺服系統(tǒng)的穩(wěn)定運行。學(xué)習(xí)率選取較小,雖然可以避免上述情況的發(fā)生,但同時也會影響DRNN的收斂速度,在應(yīng)對復(fù)雜環(huán)境時可能無法及時對控制器參數(shù)進(jìn)行調(diào)節(jié),從而也會一定程度上影響控制器的性能。因此,提出一種自適應(yīng)學(xué)習(xí)率的方法來替代固定學(xué)習(xí)率,以期兼顧系統(tǒng)的穩(wěn)定性和快速響應(yīng)能力。調(diào)節(jié)公式如下:
(16)
同時,注意到采取上述自適應(yīng)學(xué)習(xí)率調(diào)整公式時,不可避免地導(dǎo)致學(xué)習(xí)率最終仍處于一個相對較小的值,在面對轉(zhuǎn)速突變時,無法保證權(quán)值的及時調(diào)整。因此,采取下式對學(xué)習(xí)率進(jìn)行修正:
(17)
式中:η0為修正學(xué)習(xí)率,當(dāng)k時刻的轉(zhuǎn)速誤差值減k-1時刻的誤差值大于閾值Δω時,便激活式(17)對學(xué)習(xí)率進(jìn)行修正。
結(jié)合自適應(yīng)學(xué)習(xí)率優(yōu)化的DRNN與PI控制器對EMA速度環(huán)進(jìn)行控制,其控制框圖如圖3所示。
圖3 DRNN-PI自適應(yīng)控制框圖
算法流程如下:
(1)確定DRNN神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),初始化權(quán)重值,選取合適的學(xué)習(xí)率和動量因子,令k=1;
(2)采樣得到k時刻輸入量r(k)和輸出量y(k),并計算得到偏差量e(k);
(3)輸入e(k)、e(k)-e(k-1)和u(k-1)到DRNN中,計算得到輸出量,即Kp和Ki;
(4)根據(jù)式(3)計算得到該時刻控制輸出u(k);
(5)計算當(dāng)前時刻學(xué)習(xí)率,根據(jù)反向傳播公式調(diào)整網(wǎng)絡(luò)權(quán)值系數(shù),實現(xiàn)自適應(yīng)控制;
(6)令k=k+1,返回步驟(2)。
為了驗證上述系統(tǒng)的控制性能,在Simulink中搭建了改進(jìn)前后DRNN-PI控制、模糊-PI控制以及傳統(tǒng)PI控制的EMA伺服控制系統(tǒng),進(jìn)行仿真對比研究。EMA主要參數(shù)如表1所示。
表1 EMA主要參數(shù)
對于傳統(tǒng)的PI控制方法,轉(zhuǎn)速環(huán)和電流環(huán)均采用PI控制器,速度環(huán)的PI參數(shù)為kpv=10,kiv=200;d、q軸電流PI控制參數(shù)均為kpd=5,kid=300。DRNN的初始權(quán)值為[-0.5,0.5]的隨機(jī)數(shù),學(xué)習(xí)率η=0.002 ,縮放因子β=1×106,γ=0.9,修正學(xué)習(xí)率η0=0.001;電流內(nèi)環(huán)控制器的參數(shù)與PI控制下的參數(shù)一致。
(1)轉(zhuǎn)速跟蹤:初始給定電機(jī)轉(zhuǎn)速為2 500 r/min;在0.15 s時轉(zhuǎn)速設(shè)定為3 000 r/min;在0.3 s時設(shè)定轉(zhuǎn)速為1 500 r/min。仿真結(jié)果如圖4所示。
從圖4可以看出,采用傳統(tǒng)PI控制算法跟蹤轉(zhuǎn)速變化會出現(xiàn)較大的超調(diào)量,超調(diào)量近100 r/min,采用DRNN-PI控制方法時超調(diào)量較小,模糊-PI沒有明顯的超調(diào),但其穩(wěn)定時間較長,達(dá)到0.1 s,而采用改進(jìn)DRNN-PI控制時可以達(dá)到幾乎無超調(diào)并且可以更快地達(dá)到穩(wěn)定轉(zhuǎn)速。
(2)額定轉(zhuǎn)速下突加突卸負(fù)載:給定電機(jī)額定速度3 000 r/min,在0.2 s時,加10 N·m的負(fù)載,在0.4 s時卸掉負(fù)載。仿真結(jié)果如圖5所示。
圖5 額定轉(zhuǎn)速下各控制算法突加突卸載荷曲線圖
從圖5的仿真曲線可以看出,采用傳統(tǒng)PI控制算法,轉(zhuǎn)速出現(xiàn)3.3%的超調(diào),在負(fù)載突變時,轉(zhuǎn)速出現(xiàn)35 r/min的變化,且需約0.05 s的時間恢復(fù)轉(zhuǎn)速;對于改進(jìn)前后的DRNN-PI控制算法而言,可以看出轉(zhuǎn)速的超調(diào)量、負(fù)載突變時的轉(zhuǎn)速變化和恢復(fù)時間均有所減少;其中改進(jìn)后DRNN-PI控制算法可以實現(xiàn)轉(zhuǎn)速幾乎無超調(diào),達(dá)到額定轉(zhuǎn)速,負(fù)載突變時轉(zhuǎn)速變化量較改進(jìn)前減少約5 r/min,恢復(fù)時間縮短0.01 s;模糊-PI在負(fù)載突變時轉(zhuǎn)速變化量與改進(jìn)DRNN-PI相近,但其恢復(fù)時間更長,約0.04 s。由此可見,改進(jìn)DRNN-PI具有更快的響應(yīng)能力和更強(qiáng)的抗干擾能力。
(3)為驗證控制算法在EMA伺服系統(tǒng)中的整體性能,給定EMA位置階躍信號為20 mm,并引入如圖6所示的隨機(jī)變負(fù)載干擾(0~3 N·m)。其中,EMA位置環(huán)采用比例控制,為方便對比,比例參數(shù)均取相同的值,仿真結(jié)果如圖7所示。
圖6 負(fù)載轉(zhuǎn)矩隨機(jī)變化曲線
圖7 給定20 mm位置階躍下各控制算法響應(yīng)曲線
從圖7(a)可以看到,內(nèi)環(huán)采用傳統(tǒng)PI和DRNN-PI控制時,其位置響應(yīng)均產(chǎn)生超調(diào),采用模糊-PI和改進(jìn)DRNN-PI控制算法均未出現(xiàn)明顯位置超調(diào),系統(tǒng)可以平滑地達(dá)到指定位置,但模糊-PI的響應(yīng)速度較慢;且EMA到達(dá)指定位置時,在隨機(jī)負(fù)載干擾下,內(nèi)環(huán)采用改進(jìn)DRNN-PI可以使得EMA位置波動更小。圖7(b)是對應(yīng)EMA位置階躍20 mm下電機(jī)轉(zhuǎn)速響應(yīng)變化,可以看到,內(nèi)環(huán)采用模糊-PI和改進(jìn)DRNN-PI算法使得電機(jī)轉(zhuǎn)速變化具有更小的超調(diào)量,但模糊-PI達(dá)到穩(wěn)定轉(zhuǎn)速所需時間較改進(jìn)DRNN-PI約長0.02 s,且在轉(zhuǎn)速平穩(wěn)時,改進(jìn)DRNN-PI受隨機(jī)負(fù)載影響轉(zhuǎn)速波動更小,具有更強(qiáng)的抗干擾能力。由上述可知,內(nèi)環(huán)采用改進(jìn)DRNN-PI控制算法能夠改善EMA伺服控制效果,使EMA伺服控制系統(tǒng)整體性能表現(xiàn)更好,魯棒性更強(qiáng)。
本文針對EMA速度環(huán)設(shè)計了一種DRNN與PI相結(jié)合的控制方法,考慮學(xué)習(xí)率對控制性能的重要影響,引入自適應(yīng)學(xué)習(xí)率來動態(tài)調(diào)整DRNN的權(quán)值,提高了控制器學(xué)習(xí)能力和在線修正能力。仿真結(jié)果驗證了改進(jìn)DRNN-PI控制方法在響應(yīng)能力和抗干擾能力方面均優(yōu)于傳統(tǒng)PI控制、模糊-PI以及固定學(xué)習(xí)率的DRNN-PI控制方法,增強(qiáng)了EMA整體系統(tǒng)的穩(wěn)定性和魯棒性。