馬 超 , 吳 偉
1(北京科技大學(xué) 自動化學(xué)院,北京 100083)2(復(fù)雜系統(tǒng)管理與控制國家重點(diǎn)實(shí)驗(yàn)室(中國科學(xué)院 自動化研究所),北京 100190)
近年來,伴隨著信息與網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,信息物理系統(tǒng)成為了一個(gè)熱門的研究領(lǐng)域[1,2].信息物理系統(tǒng)在實(shí)際應(yīng)用中的例子包括智能電網(wǎng)[3]、智能運(yùn)輸系統(tǒng)[4]、智能工廠[5]等.特別是由于信息物理系統(tǒng)中通信網(wǎng)絡(luò)組件的使用,信息物理系統(tǒng)的安全控制問題受到了研究學(xué)者的廣泛關(guān)注.一般而言,當(dāng)信息物理系統(tǒng)中的傳感器或者通信網(wǎng)絡(luò)受到惡意攻擊后,信息物理系統(tǒng)將無法按照正常系統(tǒng)狀態(tài)進(jìn)行控制,從而導(dǎo)致控制系統(tǒng)的性能下降甚至不穩(wěn)定[6-8].常見的網(wǎng)絡(luò)攻擊類型主要有拒絕服務(wù)攻擊[9]、重放攻擊[10]以及欺騙攻擊[11].近年來,拒絕服務(wù)攻擊作為一種典型的惡意攻擊手段被大量應(yīng)用于網(wǎng)絡(luò)系統(tǒng),其主要方式為阻塞信息的正常通信.因此,針對拒絕服務(wù)攻擊的特點(diǎn),一些有效的安全控制及調(diào)度策略被提出,并且取得了良好的控制效果[12-14].此外,考慮到信息物理系統(tǒng)中存在的通信資源約束,基于事件觸發(fā)的通信與控制策略被大量采用.與傳統(tǒng)的基于時(shí)間觸發(fā)策略不同,基于事件觸發(fā)的策略可以按照給定的事件觸發(fā)機(jī)制大量地減少信息傳遞的次數(shù),從而提高通信資源的利用率[15-17].
另一方面,作為一類特殊的切換系統(tǒng),馬爾可夫跳變系統(tǒng)通常用來描述具有不同模態(tài)切換特性的實(shí)際物理系統(tǒng)[18].許多針對馬爾可夫跳變系統(tǒng)的分析與綜合方法被提出,用來解決穩(wěn)定性問題[19]、狀態(tài)估計(jì)問題[20]、同步問題[21]等.需要指出的是:大多數(shù)針對信息物理系統(tǒng)的建模通?;谙到y(tǒng)參數(shù)及狀態(tài)非跳變假設(shè),相應(yīng)的結(jié)果仍然具有一定的保守性.目前,對于馬爾可夫跳變類型信息物理系統(tǒng)的研究尚處于起步階段,例如文獻(xiàn)[22]通過利用自適應(yīng)滑模控制方法成功解決了馬爾可夫跳變類型信息物理系統(tǒng)在對抗攻擊下的安全控制問題等,然而在其他類型網(wǎng)絡(luò)攻擊下的安全控制問題仍然具有相當(dāng)?shù)奶魬?zhàn)性[23,24].
針對以上不足,本文主要研究了一類馬爾可夫跳變信息物理系統(tǒng)在拒絕服務(wù)攻擊下的安全控制問題.與已有的文獻(xiàn)相比較,本文的貢獻(xiàn)主要包括以下3 個(gè)方面.
(1) 考慮到馬爾可夫跳變信息物理系統(tǒng)的跳變特性,建立了一種新的模態(tài)依賴安全控制模型,從而更好地模擬實(shí)際網(wǎng)絡(luò)攻擊的模式;
(2) 提出了一種新穎的模態(tài)依賴事件觸發(fā)控制策略,用來解決網(wǎng)絡(luò)攻擊下的安全控制問題;
(3) 利用凸優(yōu)化的方法建立了實(shí)現(xiàn)安全控制所需要的充分性條件,并且給出了相應(yīng)的事件觸發(fā)函數(shù)與安全控制器的設(shè)計(jì)過程.
本文第1 節(jié)首先給出馬爾可夫跳變信息物理系統(tǒng)的模型與安全控制問題的數(shù)學(xué)描述,并且設(shè)計(jì)了模態(tài)依賴的事件觸發(fā)函數(shù)與控制器.第2 節(jié)給出相應(yīng)的充分性條件以及數(shù)學(xué)推導(dǎo)過程.第3 節(jié)通過一個(gè)數(shù)值仿真的例子說明本文所提出設(shè)計(jì)方法的有效性與適用性.第4 節(jié)對本文研究工作進(jìn)行總結(jié)并給出未來研究工作的一些展望.
本文采用下列統(tǒng)一的數(shù)學(xué)符號:Rn表示實(shí)數(shù)域n維向量空間,Rm×n表示實(shí)數(shù)域m×n矩陣空間,P>0 表示矩陣P是正定的,E{·}表示隨機(jī)過程的數(shù)學(xué)期望,*表示對稱矩陣中的對稱部分.
固定概率空間為(Ω,F,P),考慮下列連續(xù)時(shí)間馬爾可夫跳變信息物理系統(tǒng),其動力學(xué)模型為
其中,x(t)∈Rn為系統(tǒng)的狀態(tài)向量,u(t)∈Rm為系統(tǒng)的控制輸入,A(σ(t))與B(σ(t))均為模態(tài)σ(t)下的已知常量矩陣.不失一般性,假設(shè)系統(tǒng)的任意模態(tài)均為可檢測的,并且系統(tǒng)的初始狀態(tài)假定為:x(0)=x0.
σ(t)表示連續(xù)時(shí)間離散狀態(tài)的馬爾可夫過程,其取值在一個(gè)有限的集合I={1,2,…,N}內(nèi).相應(yīng)的,其狀態(tài)轉(zhuǎn)移概率矩陣Π={πij},?i,j∈I被描述為
其中,πij≥0 表示從t時(shí)刻模態(tài)i跳變到從t+Δt時(shí)刻模態(tài)j的轉(zhuǎn)移概率,,Δt>0,o(Δt)表示Δt的高階無窮小,
在實(shí)際應(yīng)用中,拒絕服務(wù)攻擊通常難以預(yù)測.當(dāng)攻擊發(fā)生以后,安全控制器可以確保系統(tǒng)在一定的安全性能下穩(wěn)定的運(yùn)行.在事件觸發(fā)策略下,假定系統(tǒng)的傳感器按照時(shí)間序列采樣傳輸?shù)?其采樣周期為h,其采樣序列為S1={0,h,2h,3h,…,kh,(k+1)h,…}.不失一般性,當(dāng)前控制信息成功更新時(shí)刻(事件觸發(fā)時(shí)刻)定義為tkh,且下一個(gè)成功更新時(shí)刻定義為tk+1h,其更新序列為S2={0,t1h,t2h,t3h,…,tkh,tk+1h,…}.
此外,定義ε(ikh)為拒絕服務(wù)攻擊的發(fā)生:
其中,ikh為第k個(gè)控制信息成功更新間隔內(nèi)的傳感器采樣時(shí)刻,即tkh=ikh 更進(jìn)一步,定義拒絕服務(wù)攻擊的持續(xù)時(shí)間為 其中,表示能量有限的拒絕服務(wù)攻擊發(fā)生情況下的控制信息成功更新時(shí)刻. 此外,定義ikh時(shí)刻拒絕服務(wù)攻擊發(fā)生情況下的馬爾可夫跳變信息物理系統(tǒng)狀態(tài)誤差為e(ikh)=x(ikh)-x(tkh),從而可以設(shè)計(jì)下列模態(tài)依賴的事件觸發(fā)策略: 其中, ·δ為模態(tài)依賴的閾值參數(shù); ·Φ1(σ(t))與Φ2(σ(t))為模態(tài)依賴的常量矩陣; 在此基礎(chǔ)上,可以設(shè)計(jì)下面的模態(tài)依賴狀態(tài)反饋控制器: 其中,K(σ(t))∈Rm×n為待求的模態(tài)依賴狀態(tài)反饋增益矩陣. 將上述設(shè)計(jì)的狀態(tài)反饋控制器帶入信息物理系統(tǒng),可以進(jìn)一步得到閉環(huán)系統(tǒng)的狀態(tài)方程為 為了方便描述上述方程,采用下標(biāo)i來描述σ(t).因此,系統(tǒng)(5)可以進(jìn)一步寫成下面的形式: 值得注意的是,本文中的事件觸發(fā)控制機(jī)制考慮了模態(tài)變化對于事件觸發(fā)函數(shù)以及控制器的影響,因此具有更加廣泛的適用性.此外,考慮到拒絕服務(wù)攻擊具有針對性地對于信息物理系統(tǒng)的不同模態(tài)進(jìn)行不同的攻擊方式,本文所提出的模態(tài)依賴拒絕服務(wù)攻擊也具有更加實(shí)際的背景. 根據(jù)上述結(jié)果,本文的控制目標(biāo)是:當(dāng)拒絕服務(wù)攻擊發(fā)生時(shí),馬爾可夫跳變信息物理系統(tǒng)(1)可以確保具有均方意義下漸近一致有界,即確保零初始系統(tǒng)的控制性能損失在安全控制器的作用下滿足一定的指標(biāo)JDoS,即||x(t)||≤JDoS,其中,||x(t)||表示x的歐幾里德范數(shù). 在本節(jié)中,首先通過建立合適的Lyapunov-Krasovskii 泛函給出了實(shí)現(xiàn)安全控制性能的充分性條件,進(jìn)而通過矩陣變換的方法求解模態(tài)依賴安全控制器的有效增益. 定理1.給定信息物理系統(tǒng)(1)與相應(yīng)的事件觸發(fā)安全控制器增益(4),如果存在模態(tài)依賴矩陣Pi>0,矩陣R>0,當(dāng)滿足下列線性矩陣不等式條件Ξi<0 時(shí),系統(tǒng)可以在拒絕服務(wù)攻擊發(fā)生時(shí)控制性能損失滿足指標(biāo): 由上式可知存在一個(gè)參數(shù)κ>0,從而可以得到: 本節(jié)通過一個(gè)仿真例子來驗(yàn)證所設(shè)計(jì)控制算法的有效性,需要指出的是,本文提出的算法對于線性馬爾可夫信息物理系統(tǒng)具有一定的通用性與適用性. 考慮下列負(fù)載根據(jù)馬爾可夫鏈變化的RLC 電路模型,如圖1 所示. Fig.1 RLC circuit圖1 RLC 電路 在仿真實(shí)驗(yàn)中,假設(shè)上述RLC 電路具有兩個(gè)不同模態(tài),即兩種不同的負(fù)載滿足馬爾可夫鏈變化,這里使用下列參數(shù): 系統(tǒng)的采樣周期設(shè)定為h=0.05s,事件觸發(fā)參數(shù)設(shè)置為δ=0.1.根據(jù)上述參數(shù)設(shè)置,根據(jù)定理2 的算法可以得到相應(yīng)的模態(tài)依賴安全控制器增益為 Fig.2 Release intervals of the event-triggered control圖2 事件觸發(fā)釋放間隔 Fig.3 State response of the closed-loop Markov jump cyber-pysical system圖3 馬爾可夫跳變信息物理系統(tǒng)閉環(huán)狀態(tài)軌跡 Fig.4 Performance response of the closed-loop Markov jump cyber-pysical system圖4 馬爾可夫跳變信息物理系統(tǒng)性能軌跡 從圖2 可以看出,采用事件觸發(fā)策略可以降低控制器的更新間隔從而減輕網(wǎng)絡(luò)負(fù)載.同時(shí),從圖3、圖4 可以看到:馬爾可夫跳變RLC 電路在閉環(huán)控制作用下最終的系統(tǒng)狀態(tài)可以收斂在一定范圍區(qū)間內(nèi),即滿足第1.3節(jié)中的控制目標(biāo)||x(t)||≤JDoS.綜上所述,不難發(fā)現(xiàn):系統(tǒng)可以在安全控制器的作用下有效的滿足性能指標(biāo),仿真結(jié)果支持了理論計(jì)算的有效性. 本文研究了一類馬爾可夫跳變信息物理系統(tǒng)在拒絕服務(wù)攻擊下的安全控制問題.特別地,提出了一種新穎的模態(tài)依賴安全控制器設(shè)計(jì)方法用來應(yīng)對模態(tài)依賴拒絕服務(wù)攻擊的影響.通過使用凸優(yōu)化的方法,給出了確保系統(tǒng)的控制性能損失指標(biāo)的充分性條件.在此基礎(chǔ)上,利用矩陣方法設(shè)計(jì)了模態(tài)依賴安全控制器.最后,通過一個(gè)RLC 電路的例子驗(yàn)證了本文所得到理論結(jié)果的有效性.未來研究工作將進(jìn)一步研究通信帶寬約束對于信息物理系統(tǒng)安全控制的影響.1.3 控制目標(biāo)
2 控制算法設(shè)計(jì)
3 仿真驗(yàn)證
4 結(jié) 論