韓 笑,亓慶源,紀志堅
(青島大學自動化學院,山東 青島 266071)
網(wǎng)絡控制系統(tǒng)(NCSs)是空間分布式系統(tǒng),其中傳感器、控制器和執(zhí)行器通過共享的網(wǎng)絡實現(xiàn)通信[1-2]。因為NCSs具有成本低、重量輕、結(jié)構(gòu)簡單和提高系統(tǒng)可靠性的優(yōu)點,所以被廣泛應用于遠程手術(shù),無人機,人工智能等領域[3-5]。然而,在網(wǎng)絡控制系統(tǒng)信息傳遞過程中,網(wǎng)絡通信帶寬有限、網(wǎng)絡擁塞和網(wǎng)絡連接中斷等現(xiàn)象都會導致系統(tǒng)產(chǎn)生數(shù)據(jù)包丟失的問題[6]。由于丟包的存在,系統(tǒng)的狀態(tài)信息不能精確得到,只能依賴接收到的量測信息來對系統(tǒng)進行分析,使得系統(tǒng)的估計狀態(tài)有效的跟蹤實際狀態(tài),具有重要的實際意義[7]。對于具有數(shù)據(jù)包丟失的NCSs,經(jīng)典的卡爾曼濾波失去了有效性,不能直接用來設計估計器[8-9]。因此,估計器可以通過量測過程zk推導出來。
近幾十年來,對具有數(shù)據(jù)包丟失的網(wǎng)絡控制系統(tǒng)進行研究已經(jīng)成為一個熱門的話題。Nahi考慮了具有數(shù)據(jù)包丟失的網(wǎng)絡控制系統(tǒng)的估計器,并得到了線性最小均方差估計器(LMMSE)[10]。然而,在文獻[11]中LMMSE是次優(yōu)的。文獻[12]利用時間戳技術(shù),在隨機過程γk的條件下推導出了間歇卡爾曼濾波器。Imer提出了具有不可靠通信信道的線性時不變系統(tǒng)的最優(yōu)控制[13]。對于UDP網(wǎng)絡的最優(yōu)控制,雖然控制具有雙重效應,但它們給出了一個最優(yōu)估計器。然而,估計器是否是最優(yōu)的并沒有得到證明。Qi考慮了具有數(shù)據(jù)包丟失的網(wǎng)絡控制系統(tǒng)的最優(yōu)測量反饋控制和鎮(zhèn)定性[14]。Zhang等提出了一種次優(yōu)估計量[15],它可以看作是LMMSE與間歇卡爾曼估計器的折中。
本文在之前工作的基礎上擴展了有關(guān)的內(nèi)容,給出了UDP情況下的最優(yōu)估計器,得到的結(jié)果可以在將來解決相關(guān)的最優(yōu)輸出反饋控制問題。本文通過嚴格的計算,運用遞推的方法得到兩種不同情形下系統(tǒng)的最優(yōu)估計(基于條件期望)和協(xié)方差矩陣。但是,在大的有限域下,這種方法變得困難。所以為了簡單的使用,本文開發(fā)了一個次優(yōu)估計器,這對研究在大的有限域下含有丟包的網(wǎng)絡控制系統(tǒng)有所幫助。
主要符號說明:Rn表示n維Euclidean空間;AT意味著矩陣A的轉(zhuǎn)置;E[·]是數(shù)學期望;E[·|Zk]是對Zk的條件期望;δkl表示Kronecker Delta函數(shù),當k=l時,δkl=1;否則δkl=0;P(A)是事件A發(fā)生的概率,P(A|B)描述條件概率;I{A}是指示函數(shù),表示當元素ω∈A時,I{A}=1,否則I{A}=0;N(μ,Σ)表示具有均值為μ,協(xié)方差為Σ的正態(tài)分布。
卡爾曼濾波(Kalman filtering)是一種利用線性系統(tǒng)狀態(tài)方程,通過系統(tǒng)輸入輸出觀測數(shù)據(jù),對系統(tǒng)狀態(tài)進行最優(yōu)估計的算法。由于觀測數(shù)據(jù)中包括系統(tǒng)中的噪聲和干擾的影響,所以最優(yōu)估計也可看作是濾波過程。
考慮以下經(jīng)典的動態(tài)系統(tǒng):
(1)
假設1在整個論文中,做出如下假設:
1)假設ek和vk是獨立的,均值為0的高斯白過程。
(2)
2)進一步假設初始狀態(tài)x0是一個具有均值為μ和協(xié)方差為E[(x0-μ)(x0-μ)T]=P0的高斯隨機變量,它與{ek}和{vk}相互獨立。
確定估計器和相關(guān)的誤差協(xié)方差矩陣:
(3)
(4)
(5)
引理1[23]考慮經(jīng)典的動態(tài)系統(tǒng):
(6)
(7)
(8)
(9)
(10)
網(wǎng)絡控制系統(tǒng)的通信通道通常使用以下兩種協(xié)議之一:傳輸控制協(xié)議(TCP)或用戶數(shù)據(jù)報協(xié)議(UDP)。兩者的區(qū)別之一是數(shù)據(jù)在網(wǎng)絡控制系統(tǒng)中傳輸時,是否發(fā)生丟包的行為是可知還是未知的。若是可知的,稱之為TCP情形下的網(wǎng)絡控制系統(tǒng),反之,則稱之為UDP情形下的網(wǎng)絡控制系統(tǒng)。
為了基于量測過程{z0,z1,…,zk}來估計系統(tǒng)狀態(tài)xk,在給出最優(yōu)估計器之前,首先介紹如下的引理。
引理2[24]假設X,Y為任意聯(lián)合分布的隨機變量,則當隨機變量Y取值為y時,對隨機變量X的最小均方差估計可以如式(11)計算:
(11)
假設γk在每一個k時刻都能夠直接觀測到,隨機過程γk與量測數(shù)據(jù)zk在估計器設計中都是可知的??紤]動態(tài)系統(tǒng):
(12)
其中,xk∈Rn是狀態(tài)過程,zk∈Rn是量測信息,A∈Rn×n,H∈Rn×n是給定的確定性矩陣,γk∈{0,1}描述了數(shù)據(jù)從執(zhí)行器傳輸?shù)娇刂破鞯膩G包過程。
假設2γk是獨立同分布(i.i.d)的Bernoulli隨機變量,其中P(γk=1)=p,P(γk=0)=q=1-p。
確定估計器和相關(guān)的誤差協(xié)方差矩陣:
(13)
(14)
(15)
其中,Zk表示集合{z0,z1,…,zk}。
定理1在假設1與假設2的條件下,對于給定的動態(tài)系統(tǒng)(12),最優(yōu)估計可計算為:
(16)
(17)
Σk/k=I{zk=0}Σk/k-1+I{zk≠0}[Σk/k-1-KkHΣk/k-1]
(18)
Σk+1/k=AΣk/kAT+R
(19)
最優(yōu)估計器與文獻[12]中所得的結(jié)果一致。
其中,γk是獨立同分布的伯努利隨機變量,概率為P(γk=1)=p。
證明:
(20)
fx0|z0(x|z)是條件概率密度函數(shù)。
(21)
其中,fx0,z0是(x0,z0)的聯(lián)合密度函數(shù),fz0(z)是z0的概率密度函數(shù)。
1)當z0=0時,x0,z0相互獨立,f(x0,z0)=f(x0)f(z0)。
(22)
(23)
2)當z0≠0時,
x0/0=E[x0|z0=Hx0+υ0]
(24)
(25)
因此,在這種情況下,x0是條件為z0的高斯隨機向量,可以得到以下式子
(26)
Σ0/0=P0-P0HT(HP0HT+Q)-1HP0
(27)
定義K0=P0HT(HP0HT+Q)-1,因此,
(28)
(29)
由于系統(tǒng)噪聲{ek}和{γk}是相互獨立的,由公式(12)可得
(30)
(31)
由于z1是以z0為條件的,所以
(32)
(33)
應用于基本的結(jié)果,可以得到在z0和z1條件下x1的均值為
(34)
協(xié)方差為
Σ1/1=Σ1/0-Σ1/0HT(HΣ1/0HT+Q)-1HΣ1/0
(35)
因此,
(36)
(37)
(38)
(39)
(40)
Σk/k=I{zk=0}Σk/k-1+I{zk≠0}[Σk/k-1-KkHΣk/k-1]
(41)
(42)
證畢。
本節(jié)中考慮隨機過程γk不能直接被觀測到的情形,其中僅知道γk的概率分布。
系統(tǒng)的動態(tài)方程為
(43)
其中,xk∈Rn是狀態(tài)過程,zk∈Rn是量測信息,A∈Rn×n,H∈Rn×n是給定的確定性矩陣。
假設3{γk}是獨立同分布(i.i.d)的Bernoulli隨機變量,其中,P(γk=1)=p,P(γk=0)=q=1-p。另外,γk不能在系統(tǒng)中觀測到。
定理2在假設1和假設3的情況下,系統(tǒng)(43)的最優(yōu)濾波可以通過迭代的方法推得
(44)
(45)
(46)
(47)
(48)
Σk+1/k=AΣk/kAT+R
(49)
證明:
(50)
其中,fx0|z0(x|z)是條件概率密度函數(shù),
(51)
fx0,z0是(x0,z0)的聯(lián)合密度函數(shù),fz0(z)是z0的概率密度函數(shù)。
1)當γ0=0時,
fz0(y)=fυ0(y),fx0,z0(x,y)=fx0(x)fυ0(y)
2)當γ0≠0時,
其中,
(52)
(53)
Fx0,Hx0+υ0(x,y)=P(x0≤x,Hx0+υ0≤y)
Fx0,υ0(x,y)=P(x0≤x,υ0≤y)
(54)
(55)
進而得到,
(56)
(57)
由于x1=Ax0+e0,所以
(58)
(59)
則最優(yōu)估計
(60)
定義fx1,z0,z1(x,y,z)=Δ1,fz0,z1(y,z)=Δ2,
(61)
Δ2=p2fHx0+υ0,Hx1+υ1(y,z)+p(1-p)fυ0,Hx1+υ1(y,z)+p(1-p)fHx0+υ0,υ1(y,z)+(1-p)2fυ0,υ1(y,z)
(62)
(63)
(64)
(65)
以此類推,可以得到:
(66)
(67)
(68)
(69)
Σk+1/k=AΣk/kAT+R
(70)
證畢。
由于求得的最優(yōu)濾波太復雜,難以實際應用,因此,為了更簡單的使用,需要給出一個次優(yōu)近似估計器。這種情況考慮的基本模型中沒有量測噪聲,不包括任何量測噪聲的理由是假設傳感器和控制器之間的通信發(fā)生在網(wǎng)絡層,其中發(fā)送的數(shù)據(jù)包是接收或丟失的?;蛘撸部梢哉J為傳感器和控制器通過具有無限容量的二進制擦除信道連接,即沒有狀態(tài)的量化或編碼。
(71)
定理3對于系統(tǒng)(70),基于量測過程{z0,…,zk}的次優(yōu)估計器可以表示為
(72)
(73)
證明:具體證明過程參考文獻[14]。
在本節(jié)中,將進行數(shù)值仿真模擬來進一步說明理論結(jié)果。一方面,通過圖1展示在網(wǎng)絡控制系統(tǒng)中經(jīng)典卡爾曼濾波的最優(yōu)性。另一方面,對于具有數(shù)據(jù)包丟失的網(wǎng)絡控制系統(tǒng),本文給出定理1最優(yōu)估計與定理3次優(yōu)估計的仿真實例,并且分別與線性最小均方差誤差估計(LMMSE)進行比較。
假設經(jīng)典動態(tài)系統(tǒng)(1)的參數(shù):A=1,H=0.2,ek~N(0,1),vk~N(0,1),時域N=200。由圖1可以看出,對于經(jīng)典的動態(tài)系統(tǒng),系統(tǒng)觀測值與真實值的誤差比較大,而卡爾曼濾波的結(jié)果與系統(tǒng)真實值的誤差較小,能有效跟蹤系統(tǒng)的狀態(tài)。
由于在具有數(shù)據(jù)包丟失的NCSs當中,經(jīng)典的卡爾曼濾波失去有效性,因此,本文通過量測過程推導出系統(tǒng)的最優(yōu)估計器。首先對于隨機過程γk能直接被觀測到的情形,針對定理1,假設線性離散隨機系統(tǒng)(12)的參數(shù):A=1.01,H=1,ek~N(0,1),vk~N(0,1),μ=0,P0=1,p=0.4,時域N=100。
從圖2可以明顯看出本文得出的最優(yōu)估計器與系統(tǒng)真實值之間誤差較小,而LMMSE與系統(tǒng)的真實狀態(tài)誤差較大,因此驗證了本文定理1的有效性。
圖1 系統(tǒng)的真實狀態(tài),觀測值與卡爾曼濾波之間的比較
圖2 系統(tǒng)的真實狀態(tài),最優(yōu)估計與LMMSE之間的比較
圖3 系統(tǒng)的真實狀態(tài),次優(yōu)估計與LMMSE之間的比較
對于隨機過程γk不能直接被觀測到的情形,由于求得的最優(yōu)濾波太復雜,不能實際應用,所以本文只考慮次優(yōu)估計器的數(shù)值算例。因此,針對定理3,假設系統(tǒng)(71)的參數(shù)為:A=1.02,H=0.8,ek~N(0,1),μ=0,P0=1,p=0.4,時域N=100。
從圖3中可以明顯看出本文給出的次優(yōu)估計器與系統(tǒng)的真實值的誤差比較小,而LMMSE與系統(tǒng)的真實值誤差比較大,由此證明本文提出的方法是可靠的。
本文對具有丟包的網(wǎng)絡控制系統(tǒng)的估計問題進行了研究,當量測方程帶有噪聲時,由于經(jīng)典的卡爾曼濾波失效,針對不同的情形采用遞推的方法求出了系統(tǒng)的最優(yōu)估計(條件期望)和協(xié)方差矩陣。同時,為進一步研究大的有限域下的網(wǎng)絡控系統(tǒng)的問題,開發(fā)了一個次優(yōu)估計器,具有實際應用價值。最后,通過數(shù)值模擬驗證了文中提出的估計器能有效跟蹤系統(tǒng)的狀態(tài),并且比LMMSE的性能更好,本文提出的方法是可行的。因此,研究具有數(shù)據(jù)包丟失的網(wǎng)絡控制系統(tǒng)的估計問題具有重要的理論和現(xiàn)實意義。