曲 燊,車偉偉
(1. 青島大學(xué) 自動化學(xué)院,山東 青島 266071;2. 青島大學(xué) 山東省工業(yè)控制技術(shù)重點實驗室,山東 青島 266071)
近年來,多智能體系統(tǒng)(Multi-agent Systems,MASs)的協(xié)同控制問題在無人機[1]、多機器人系統(tǒng)[2]等領(lǐng)域的廣泛應(yīng)用引起了學(xué)界極大的研究興趣。與傳統(tǒng)的控制系統(tǒng)相比,MASs具有分布式、協(xié)作、自治、容錯、高效、低成本等優(yōu)點。一般來說,協(xié)同控制主要有3個目標,即趨同控制、跟蹤控制和包容控制。趨同控制的目標是使所有智能體的輸出最終達成一致。跟蹤控制的目標是在趨同控制目標的基礎(chǔ)上跟蹤期望的輸出。包容控制的目標是使一群追隨者能夠到達并停留在由多個領(lǐng)導(dǎo)者形成的凸包上。目前,已經(jīng)有許多基于模型的MASs趨同控制方法[3-8]、跟蹤控制方法[9-12]和包容控制方法[13-19]。
值得說明的是上述研究都是基于系統(tǒng)模型的。然而,在實際系統(tǒng)中,經(jīng)常無法得到系統(tǒng)的準確模型。因此,學(xué)界已經(jīng)有幾種數(shù)據(jù)驅(qū)動的控制方法來完成MASs的各種控制任務(wù)[20-22]。作為一種新穎的數(shù)據(jù)驅(qū)動方法,文獻[23-27]提出的無模型自適應(yīng)控制(Model-free Adaptive Control, MFAC)不需要任何系統(tǒng)模型,只需要利用系統(tǒng)的輸入輸出信號。在MFAC框架中,可以利用動態(tài)線性化技術(shù)將非線性系統(tǒng)變換為線性數(shù)據(jù)模型,可分為緊格式動態(tài)線性化(Compact Form Dynamic Linearization, CFDL)、偏格式動態(tài)線性化(Partial Form Dynamic Linearization,PFDL)和全格式動態(tài)線性化(Full Form Dynamic Linearization,F(xiàn)FDL)。需要指出的是,CFDL只使用一個參數(shù)來捕捉非線性系統(tǒng)的復(fù)雜行為,如非線性和時延等。PFDL和FFDL通過使用多個參數(shù)來更好地捕捉復(fù)雜非線性系統(tǒng)的復(fù)雜行為。文獻[25]和文獻[26]分別研究了單輸入單輸出(Single-input Singleoutput,SISO)和多輸入多輸出(Multiple-input Multiple-output,MIMO)非線性系統(tǒng)的CFDLMFAC和PFDL-MFAC問題。此外,文獻[27]研究了FFDL-MFAC問題。
最近,MFAC方法已被引入MASs以實現(xiàn)協(xié)同控制目標。文獻[28]使用MFAC算法研究了一致性跟蹤控制問題,其中提出了分布式無模型自適應(yīng)控制(Distributed Model-free Adaptive Control,DMFAC)算法來保證所有智能體都可以跟蹤參考信號。文獻[29]研究了在切換拓撲下使用MFAC算法應(yīng)對非線性MASs的輸出編隊問題。分布式無模型自適應(yīng)迭代學(xué)習(xí)控制的問題在文獻[30]中得到解決。進一步擴展應(yīng)用該結(jié)果使所有智能體在有限時間內(nèi)實現(xiàn)趨同跟蹤目標[31]。文獻[32]研究了非線性MASs的編隊控制問題,其中設(shè)計了無模型自適應(yīng)迭代學(xué)習(xí)控制算法來實現(xiàn)編隊控制目標。此外,文獻[33]研究了具有有界擾動的非線性MASs的魯棒無模型自適應(yīng)迭代學(xué)習(xí)編隊控制問題。文獻[34]研究了使用MFAC算法的MASs的中繼協(xié)同跟蹤控制問題。文獻[35]使用無模型自適應(yīng)迭代學(xué)習(xí)控制方法解決了具有未知干擾的MASs的一致性跟蹤控制問題。文獻[36]研究了多輸入多輸出MASs的魯棒迭代學(xué)習(xí)一致性跟蹤控制問題。
需要指出的是,上述無模型自適應(yīng)控制器設(shè)計中采用了網(wǎng)絡(luò)拓撲,即無模型自適應(yīng)控制器參數(shù)依賴于拉普拉斯矩陣的特征值。為了更好地展示MFAC算法在MASs框架中的優(yōu)越性,有必要僅使用MASs的輸入/輸出(input/output,I/O)數(shù)據(jù)來研究新的DMFAC算法。主要困難是如何建立一個新的MASs的DMFAC框架。因此,需要在現(xiàn)有的單智能體數(shù)據(jù)模型的基礎(chǔ)上,探索一個合理的MASs數(shù)據(jù)模型。
隨著網(wǎng)絡(luò)通信技術(shù)的發(fā)展,MASs遭受網(wǎng)絡(luò)攻擊時的安全性問題受到廣泛關(guān)注。眾所周知,惡意網(wǎng)絡(luò)攻擊是不可避免的,而且會對MASs造成嚴重影響。有兩種常見的網(wǎng)絡(luò)攻擊,即拒絕服務(wù)(Denial-of-Service,DoS)和虛假數(shù)據(jù)注入(False Data Injection,F(xiàn)DI)攻擊。目前,有分別考慮DoS攻擊[37-38]和FDI攻擊[39-40]的基于模型的分布式MASs控制器。此外,文獻[41]研究了受到DoS攻擊的MASs協(xié)同控制問題,并開發(fā)了一種基于學(xué)習(xí)的DMFAC來抵抗DoS攻擊。然而,考慮FDI網(wǎng)絡(luò)攻擊的DMFAC問題并沒有得到很好的解決,還缺乏相關(guān)的研究。
為了解決上述問題,本文首先建立了一種新的分布式緊格式動態(tài)線性化(Distributed CFDL,DCFDL)MASs數(shù)據(jù)模型。然后,基于DCFDL數(shù)據(jù)模型,研究了分布式無模型自適應(yīng)控制器,以實現(xiàn)遭受FDI攻擊的MASs分布式協(xié)同控制目標。
本節(jié)旨在DCFDL數(shù)據(jù)模型的基礎(chǔ)上建立非線性MASs的DMFAC框架。
注釋1 假設(shè)1是非線性系統(tǒng)的一般約束條件。假設(shè)2意味著有界輸入產(chǎn)生有界輸出,這在實際系統(tǒng)中是滿足的。假設(shè)3是達成趨同控制目標的充分必要條件。假設(shè)4意味著當輸入增加時,系統(tǒng)的輸出不會減少,這被認為是一種“類線性”特性。在基于模型的控制方法中的控制方向可以找到類似的假設(shè)。
注釋2 引理1提出了一種新的線性化方法,其廣泛應(yīng)用于無模型自適應(yīng)控制方法中[23-27]。與現(xiàn)有的線性化方法不同,這種線性化方法僅使用系統(tǒng)的I/O數(shù)據(jù)。此外,可以通過設(shè)計估計器來估計PPD參數(shù)。
為了將MFAC框架引入MASs,定義分布式量測輸出為
FDI攻擊旨在通過將虛假數(shù)據(jù)注入傳輸網(wǎng)絡(luò)來破壞系統(tǒng)性能。假設(shè)攻擊者會隨機對從傳感器到控制器的傳輸網(wǎng)絡(luò)發(fā)起FDI攻擊,如圖1所示。因此,當傳輸網(wǎng)絡(luò)中發(fā)生FDI攻擊時,觀測器和控制器接收到的數(shù)據(jù)包為
圖1 具有FDI攻擊的MASs的DMFAC系統(tǒng)框圖Fig.1 System block diagram of the DMFAC for MASs with FDI attacks
本節(jié)討論了MASs的穩(wěn)定性分析,并得到了DMFAC算法的參數(shù)。以下定理是保證趨同控制目標能夠?qū)崿F(xiàn)的主要結(jié)果。
定理1 對于受到FDI攻擊的非線性MASs式(1),如果滿足假設(shè)1~4,而且存在λi>λmin和 λmin>0被合理選擇, μi≥1 ,ρi∈(0,1] ,ηi∈(0,1],Ki∈(0,2),初始值 φ ?i(1)>0 和 存在任意小的正常數(shù)σi(i=1,···,N),則可以使用以下DMFAC算法實現(xiàn)趨同控制目標。
另外結(jié)合假設(shè)3中的有向生成樹的條件,可以解決問題1,即趨同誤差在均方意義上是有界的。
注釋5 所設(shè)計的DMFAC算法式(14)~(16)僅使用系統(tǒng)的I/O數(shù)據(jù),沒有使用模型參數(shù)。另外,所設(shè)計的控制算法并不需要知道MASs拓撲結(jié)構(gòu)的全局信息。
在本節(jié)中,提供了仿真示例,以驗證所提出的DMFAC算法的有效性。
考慮以下異構(gòu)非線性MASs。
圖2 趨同控制的拓撲圖Fig.2 The topology graph for the consensus control
仿真結(jié)果如圖3所示??梢杂^察到,當通信網(wǎng)絡(luò)受到FDI攻擊時,所有智能體的輸出都是有界趨同的。
圖3 有和無FDI攻擊的趨同控制算法的性能Fig.3 The performance of the consensus control algorithm with(left)and without(right) FDI attacks
圖4展示了在保持其他初始值不變,ωi(k)=0.05×(1+0.1sin(2πk/150))時,不同F(xiàn)DI攻擊成功概率下趨同控制算法的性能。圖5展示了在保持FDI攻擊的成功概率 βi=0.7(i=1,···,4)和其他初始值不變的情況下,不同虛假數(shù)據(jù)ω1i(k)=0.01×cos(2πk/150)),ω2i(k)=0.05×cos(2πk/150)),ω3i(k)=0.1×cos(2πk/150))的趨同控制算法的性能??梢杂^察到,對于所有不同的時變有界虛假數(shù)據(jù),算法都可以實現(xiàn)趨同控制目標。
圖4 不同攻擊成功概率下趨同控制算法的性能Fig.4 The performance of the consensus control algorithm with different attacks possibility
圖5 不同虛假數(shù)據(jù)下趨同控制算法的性能Fig.5 The performance of the consensus control algorithm with different false data
本文研究了受FDI攻擊的非線性異構(gòu)MASs的分布式趨同MFAC問題,在文獻[25]中設(shè)計的單智能體CFDL數(shù)據(jù)模型的基礎(chǔ)上,提出了一種新穎的DCFDL數(shù)據(jù)模型設(shè)計方法,通過改進的動態(tài)線性化方法,使用非線性MASs的I/O數(shù)據(jù)獲得等效線性數(shù)據(jù)模型?;贒CFDL數(shù)據(jù)模型,設(shè)計了一種新的DMFAC算法來實現(xiàn)受FDI攻擊的MASs分布式趨同控制。所提出的DMFAC算法既不需要系統(tǒng)模型,也不需要網(wǎng)絡(luò)拓撲結(jié)構(gòu)。仿真結(jié)果表明,所設(shè)計的ET-MFAC算法可以很好地實現(xiàn)分布式趨同控制目標。