徐通福,李秀英
(上海應(yīng)用技術(shù)大學(xué)電氣與電子工程學(xué)院,上海 201418)
隨著計算機在工業(yè)控制領(lǐng)域的廣泛應(yīng)用,數(shù)據(jù)驅(qū)動控制方法特別是離散時間非仿射非線性系統(tǒng)的數(shù)據(jù)驅(qū)動自適應(yīng)控制具有重要意義。該方法僅利用被控裝置的實測閉環(huán)輸入輸出數(shù)據(jù)進(jìn)行設(shè)計,可以避免傳統(tǒng)基于模型的自適應(yīng)控制系統(tǒng)中無法解決的精確建模和模型約簡、未建模的動力學(xué)、魯棒性、持續(xù)激勵條件和閉環(huán)控制等問題[1]。由于輸入輸出測量數(shù)據(jù)包含了所有的被控對象動力學(xué)信息,從而導(dǎo)致傳統(tǒng)基于模型意義上的系統(tǒng)建模、未建模動力學(xué)、模型約簡和魯棒性等概念消失。
無模型自適應(yīng)控制(Model Free Adaptive Control,MFAC)作為一種典型的數(shù)據(jù)驅(qū)動控制方法,利用偽偏導(dǎo)數(shù)(Pseudo Partial Derivative,PPD)或偽梯度(Pseudo Gradient,PG)矢量的新概念在每個工作點通過所謂的動態(tài)線性化數(shù)據(jù)模型設(shè)計控制器,控制器參數(shù)的整定方法基于使用閉環(huán)測量數(shù)據(jù)的確定性估計算法[2]。MFAC 由于具有計算簡單、無需建模等優(yōu)點,已被應(yīng)用于車輛、儲能電池、磁懸浮和數(shù)控機床等許多領(lǐng)域[3-6]。到目前為止,MFAC 的魯棒性仍然是一個懸而未決的問題。在基于模型的控制理論中,魯棒性是指處理未知的不確定性或未建模動態(tài)的能力。然而,無模型控制方案只利用被控裝置的輸入輸出數(shù)據(jù)進(jìn)行控制器設(shè)計,不涉及系統(tǒng)的任何模型信息,因此不存在未建模的動力學(xué)。從這個角度來看,傳統(tǒng)的控制系統(tǒng)的魯棒性已經(jīng)不存在了。對于任何實際控制問題,輸入輸出數(shù)據(jù)都可能受到外部干擾,或由于傳感器、執(zhí)行器或網(wǎng)絡(luò)故障而導(dǎo)致數(shù)據(jù)丟失。因此,研究未知干擾或數(shù)據(jù)丟失對無模型自適應(yīng)控制算法性能的影響很有必要[7]。在工業(yè)環(huán)境中,測量從來不是完美的。它們可能會被各種噪聲所扭曲。因此,對有測量干擾的MFAC 算法進(jìn)行研究,無論在理論方面還是在實際應(yīng)用中都具有重要意義。
近年來,許多學(xué)者對具有測量干擾的MFAC 算法進(jìn)行了研究。一種改進(jìn)的帶濾波器的MFAC 算法有效抑制了測量擾動的影響[8],該方法通過設(shè)計低通去除高頻噪聲信號,但實際中噪聲信號頻率多樣。針對測量擾動信號,提出了一種跟蹤微分器對擾動進(jìn)行抑制,但該方法會使系統(tǒng)相位發(fā)生改變[9-10]。一種小波閾值去噪的方法被提出,該方法能夠?qū)υ肼曔M(jìn)行實時自適應(yīng)過濾,但存在閾值難以設(shè)定的問題[11]。針對電液伺服系統(tǒng)存在不確定性干擾和不確定性因素的情況,徑向基神經(jīng)網(wǎng)絡(luò)干擾觀測器被提出去估計擾動,并將其補償?shù)娇刂破鞯脑O(shè)計中,從而有效減小了擾動對系統(tǒng)的影響,但這種方法增加了系統(tǒng)的復(fù)雜性[12]。一種改進(jìn)的卡爾曼濾波MFAC 算法被用來抑制測量擾動,該方法假設(shè)系統(tǒng)噪聲和測量噪聲相互獨立,但是大多數(shù)情況下系統(tǒng)噪聲和測量噪聲之間是相關(guān)的,而且該方法只考慮了單個傳感器的測量結(jié)果[13]。基于此,本文作者提出一種基于集中式卡爾曼濾波干擾觀測器的MFAC 方法,該方法將多個傳感器的測量結(jié)果進(jìn)行最優(yōu)集中式卡爾曼濾波融合,并且考慮系統(tǒng)噪聲和測量噪聲以及各個傳感器之間的測量噪聲都是相關(guān)的情況。相比只使用單個傳感器的卡爾曼濾波MFAC 算法來說,基于多傳感器的集中式卡爾曼濾波干擾觀測器MFAC 算法具有更好的跟蹤性能和更大的信噪比。
考慮一類SISO 離散時間非線性系統(tǒng):
其中:u(k)和y(k)分別表示k時刻系統(tǒng)的輸入和輸出;ny、nu是兩個未知的正整數(shù);f(…)代表未知的非線性函數(shù)。
假設(shè)1:除有限時刻點外,f(…)對u(k)的偏導(dǎo)數(shù)連續(xù)。
假設(shè)2:除有限時刻點外,系統(tǒng)公式(1)滿足廣義的利普席茲條件。
定理1:對滿足假設(shè)1 和假設(shè)2 的非線性系統(tǒng)公式(1),當(dāng)時,一定存在一個被稱為PPD 的時變參數(shù)φc(k),使得系統(tǒng)公式(1)轉(zhuǎn)化為如下線性模型[14]:
若系統(tǒng)存在測量擾動,則系統(tǒng)的輸出測量值為
其中:d(k)代表測量擾動,且,d是正常數(shù)。
系統(tǒng)存在測量擾動時,MFAC 控制方案為
其中:λ>0,μ>0,ρ∈(0,1],η∈(0,1];ε是一個充分小的正數(shù);(1)是(k)的初值;y*(k+1)代表系統(tǒng)的期望輸出。
由式(6)可知,控制器的設(shè)計依賴于系統(tǒng)期望輸出與測量輸出的誤差值。當(dāng)系統(tǒng)不存在測量擾動時,在MFAC 控制方法的作用下,系統(tǒng)的輸出誤差可以收斂至0[14]。而當(dāng)系統(tǒng)受到測量擾動的影響時,在MFAC 控制方法的作用下,系統(tǒng)的輸出誤差收斂到一個大于0 的常數(shù)[8]??梢?,當(dāng)系統(tǒng)存在測量擾動時,MFAC 控制方法的控制性能會顯著降低。
考慮如下方程所描述的非線性離散系統(tǒng):
其中:狀態(tài)y(k)代表系統(tǒng)在時刻k時的系統(tǒng)輸出;ω(k-1)表示系統(tǒng)噪聲,假設(shè)其為零均值的高斯白噪聲,方差為,且系統(tǒng)噪聲誤差協(xié)方差矩陣為Q(k-1);ymi(k)代表傳感器i在時刻k時的測量輸出;Ci(k)代表系統(tǒng)的觀測陣;vi(k)表示傳感器i的測量噪聲,與系統(tǒng)噪聲ω(k-1)相關(guān),其相關(guān)的強度與βi的取值有關(guān);N代表傳感器的個數(shù);γi(k)是零均值高斯白噪聲,方差為,并且與系統(tǒng)噪聲ω(k-1)相互獨立。當(dāng)i≠j時,對k,l=1,2,…,有:
其中:δkl表示克羅尼克δ函數(shù)。從上面的描述可以看出,在同一時刻不同傳感器的測量噪聲是相關(guān)的,并且每個時刻的測量噪聲都和上一時刻的系統(tǒng)噪聲相關(guān)。式(7)將非線性系統(tǒng)等價轉(zhuǎn)換為線性系統(tǒng),并且上述對于實際環(huán)境噪聲的假設(shè)是合理的,這與相關(guān)噪聲環(huán)境下多傳感器數(shù)據(jù)融合的假設(shè)一致。
集中式卡爾曼濾波干擾觀測器是通過將所有的觀測方程集中為一個觀測方程,然后在每一時刻利用該時刻的集中觀測方程與上一時刻最優(yōu)輸出的估計值得到當(dāng)前時刻的輸出預(yù)測值,并且利用傳感器當(dāng)前時刻的輸出測量值對卡爾曼增益進(jìn)行校正。集中式卡爾曼濾波干擾觀測器的結(jié)構(gòu)如圖1 所示。
圖1 集中式卡爾曼濾波干擾觀測器的結(jié)構(gòu)Fig.1 Structure of centralized Kalman filter disturbanceobserver
假設(shè)k-1 時刻y(k-1)的一個最優(yōu)狀態(tài)估計為,則k時刻y(k)的最優(yōu)集中式估計算法[15]為
其中:當(dāng)噪聲不相關(guān)時,R(k)是對角矩陣,即非對角線部分的值全為0 且S(k)=0,此時,所提出的最優(yōu)集中式估計算法退化為噪聲無關(guān)情況下的算法。因此,文中討論的噪聲相關(guān)下的最優(yōu)集中式估計算法更具一般性。
從上式中可以看出,集中式卡爾曼濾波增益與Q(k-1)和R(k)的值息息相關(guān),而當(dāng)前時刻集中式卡爾曼濾波干擾觀測器的估計值等于上一時刻卡爾曼濾波干擾觀測器的估計值和傳感器測量值ym(k)的加權(quán)和,因此與Q(k-1)和R(k)的值也息息相關(guān)。
將傳感器的測量值和數(shù)據(jù)模型的預(yù)測值經(jīng)過集中式卡爾曼濾波干擾觀測器濾波輸出,然后將該輸出與系統(tǒng)的期望輸出值的偏差信號送入MFAC 控制器的設(shè)計中,從而得到基于集中式卡爾曼濾波干擾觀測器的MFAC 控制方案。算法結(jié)構(gòu)如圖2 所示。
圖2 基于集中式卡爾曼濾波干擾觀測器的MFAC 算法結(jié)構(gòu)Fig.2 MFAC algorithm structure based on centralized Kalman filter disturbance observer
結(jié)合圖 2,公式(10)—(14)和公式(19)—(21)構(gòu)成了完整的基于集中式卡爾曼濾波干擾觀測器的MFAC 控制方案:
其中:式(10)—(14)是集中式卡爾曼濾波干擾觀測器算法,該算法的目的是為了得到濾波后的預(yù)測輸出;式(19)—(21)是基于集中式卡爾曼濾波干擾觀測器MFAC 算法,與常規(guī)MFAC 算法的不同之處在于,該算法利用干擾觀測器的輸出去設(shè)計控制器,而不是直接利用傳感器的測量值去設(shè)計,這樣有效規(guī)避了測量擾動對常規(guī)MFAC 算法控制性能的影響。
為驗證基于集中式卡爾曼濾波干擾觀測器的MFAC 算法的有效性,給出由3 個傳感器組成的集中式卡爾曼濾波干擾觀測器(集中式觀測器)的MFAC算法,基于傳感器1 的卡爾曼濾波干擾觀測器(局部觀測器1)的MFAC 算法,基于傳感器2 的卡爾曼濾波干擾觀測器(局部觀測器2)的MFAC 算法和基于傳感器3 的卡爾曼濾波干擾觀測器(局部觀測器3)的MFAC 算法的仿真對比試驗。并且利用均方根誤差(Root Mean Square Error,RMSE)和 信噪比(Signal Noise Ratio,SNR)兩個指標(biāo)對5 種控制算法的控制性能進(jìn)行比較:
其中:δRMSE代表各個時刻的實際值與期望值誤差平方和,其值越小,系統(tǒng)控制性能越好;δSNR代表信號與噪聲的方差比,其值越大,系統(tǒng)的去噪能力與控制性能越好。
例1 考慮如下非線性系統(tǒng)[13]:
期望輸出信號為
由圖3—4 可知:當(dāng)系統(tǒng)存在測量擾動時,MFAC控制算法的跟蹤誤差會顯著增加;采用基于單個傳感器卡爾曼濾波干擾觀測器的MFAC 算法后,系統(tǒng)的控制性能優(yōu)于MFAC 算法;而對于各個局部干擾觀測器來說,在系統(tǒng)噪聲方差和噪聲相關(guān)系數(shù)相同的情況下,局部干擾觀測器的γi(k)的噪聲方差越小,基于該局部卡爾曼濾波干擾器的MFAC 算法的控制性能越好。當(dāng)采用基于集中式卡爾曼濾波干擾觀測器的MFAC 算法后,系統(tǒng)的控制性能又優(yōu)于只使用單個傳感器卡爾曼濾波干擾觀測器的MFAC 算法。除此之外,基于集中式卡爾曼濾波干擾觀測器的MFAC 算法的響應(yīng)速度比MFAC 算法和基于單個傳感器卡爾曼濾波干擾觀測器的MFAC 算法的響應(yīng)速度快??梢?,集中式卡爾曼濾波干擾觀測器的MFAC 算法能有效提高存在測量擾動的時不變參考信號的跟蹤能力。
圖3 時不變參考信號跟蹤性能比較Fig.3 Comparison of tracking performance of time-invariant reference signal
圖4 時不變參考信號跟蹤誤差絕對值比較Fig.4 Comparison of the absolute value of tracking error of time-invariant reference signal
例2 考慮如下非線性系統(tǒng)[14]:
期望輸出信號:
設(shè)置此例中的系統(tǒng)噪聲和測量噪聲的相關(guān)參數(shù)值、系統(tǒng)的初始參數(shù)值、系統(tǒng)的控制器參數(shù)值均和例1 中的參數(shù)值一致。5 種控制算法的跟蹤性能如圖5和圖6 所示。
圖5 時變參考信號跟蹤性能比較Fig.5 Comparison of tracking performance of time-varying reference signal
圖6 時變參考信號跟蹤誤差絕對值比較Fig.6 Comparison of the absolute value of tracking errors of time-varying reference signal
由圖5—6 可知:MFAC 算法的控制性能最差,基于集中式卡爾曼濾波干擾觀測器的MFAC 算法的控制性能最好,因此,基于集中式卡爾曼濾波干擾觀測器的MFAC 算法對時變的參考信號依然可以很好地抑制測量擾動對MFAC 算法的影響,大大提升系統(tǒng)的跟蹤性能。
綜合上述的兩個例子,使用RMSE 和SNR 指標(biāo)對5 種控制算法的控制性能進(jìn)行比較,結(jié)果如表1所示。
表1 5 種控制算法的控制性能比較Tab.1 Comparison of control performance of five control algorithms
根據(jù)圖3—6 和表1 的數(shù)據(jù)可知:本文作者提出的基于集中式卡爾曼濾波干擾觀測器的算法相比MFAC 算法和基于局部卡爾曼濾波干擾觀測器的MFAC 算法,在時不變參考信號和時變參考信號并且在噪聲相關(guān)的情況下具有更好的抑制測量擾動的效果,在算法具有適用性的同時具有更小的均方根誤差和更大的數(shù)據(jù)信噪比,可以顯著提升在測量擾動作用下系統(tǒng)的控制性能。
本文作者針對具有測量擾動的非線性系統(tǒng),提出一種基于集中式卡爾曼濾波干擾觀測器的MFAC 算法。將所提出的算法與MFAC 算法和基于局部卡爾曼濾波干擾觀測器的MFAC 算法分別在時不變參考信號和時變參考信號下進(jìn)行對比,仿真結(jié)果表明:在具有適用性的同時,集中式卡爾曼濾波干擾觀測器的MFAC 算法具有更強的抗干擾能力、更小的均方根誤差和更大的數(shù)據(jù)信噪比等優(yōu)點,可以顯著提升MFAC算法在測量擾動下的控制性能。