王 建,盧一相,高清維,余 益
(安徽大學(xué) 電氣與自動化學(xué)院,安徽 合肥 230601)
隨著物聯(lián)網(wǎng)范式的廣泛應(yīng)用,網(wǎng)絡(luò)化多智能體控制技術(shù)在許多實際系統(tǒng)中都扮演著關(guān)鍵的角色,例如智能電網(wǎng)[1]、衛(wèi)星編隊、自動駕駛系統(tǒng)[2]、飛行編隊[3]、機(jī)械臂[4]和移動機(jī)器人[5]等。因此,通過通信網(wǎng)絡(luò)連接所有個體或者子系統(tǒng)形成的分布式控制系統(tǒng)(網(wǎng)絡(luò)化多智能體系統(tǒng))成為近年來的熱門研究領(lǐng)域[6-7]。對網(wǎng)絡(luò)化多智能體系統(tǒng)的分析,主要是研究網(wǎng)絡(luò)結(jié)構(gòu)和個體之間的交互對系統(tǒng)全局目標(biāo)的影響。一般而言,分布式控制器在使用共享局部信息的情況下,將擁有和使用與全局信息同樣的性能,這也是分布式控制廣受關(guān)注的一大原因。文獻(xiàn)[8]針對具有不確定性和定向通信拓?fù)涞木W(wǎng)絡(luò)拉格朗日系統(tǒng)的協(xié)調(diào)跟蹤控制,提出了一種自適應(yīng)容錯協(xié)同控制方案。文獻(xiàn)[9]研究了具有通信延遲的網(wǎng)絡(luò)化多主體系統(tǒng)的平均一致性,并獲得了用于平均一致性的充分條件,得出在有界通信延遲下系統(tǒng)仍存在平均共識的結(jié)論。文獻(xiàn)[10]提出了設(shè)計分布控制律的統(tǒng)一框架,而且證明了后向水平動態(tài)優(yōu)化方法可以用來實現(xiàn)非線性多主體系統(tǒng)的預(yù)測次優(yōu)共識。
在分布式系統(tǒng)中,聯(lián)網(wǎng)的多主體之間不可避免地存在通信約束,例如網(wǎng)絡(luò)延遲、數(shù)據(jù)包丟失和數(shù)據(jù)攻擊。顯然,這些通信約束會降低所設(shè)計控制器的性能。為了克服這些不利因素,基于網(wǎng)絡(luò)傳輸矢量數(shù)據(jù)流的特性和模型預(yù)測控制策略,文獻(xiàn)[11]提出了一種網(wǎng)絡(luò)預(yù)測控制方案。文獻(xiàn)[12-14]將這些網(wǎng)絡(luò)化的多主體預(yù)測控制方法應(yīng)用于不同類型的多主體系統(tǒng)。對于具有不變網(wǎng)絡(luò)時延的同構(gòu)網(wǎng)絡(luò)多主體系統(tǒng),文獻(xiàn)[12]設(shè)計了一種基于網(wǎng)絡(luò)預(yù)測控制的分布式協(xié)議。對于具有網(wǎng)絡(luò)延遲和狀態(tài)不可測的異構(gòu)網(wǎng)絡(luò)多主體系統(tǒng),文獻(xiàn)[13]提出了使用網(wǎng)絡(luò)預(yù)測控制方案的分布式控制協(xié)議,這使得共識的充分必要條件與網(wǎng)絡(luò)延遲無關(guān)。文獻(xiàn)[14]通過引入同時穩(wěn)定性和共識性的概念,建立了一種主動補(bǔ)償網(wǎng)絡(luò)延遲和分組數(shù)據(jù)丟失的預(yù)測性控制器設(shè)計方法,實現(xiàn)了網(wǎng)絡(luò)化多主體控制系統(tǒng)的穩(wěn)定性和共識性。文獻(xiàn)[15]研究了具有可變網(wǎng)絡(luò)拓?fù)涞耐ㄐ叛舆t多智能體系統(tǒng),并提供了共識機(jī)制。
文獻(xiàn)[16-17]將智能電網(wǎng)系統(tǒng)建模為網(wǎng)絡(luò)化多智能體系統(tǒng),然后借助一致性理論設(shè)計分布式控制器,以解決其電壓、頻率同步及功率分配等問題。文獻(xiàn)[18]將物聯(lián)網(wǎng)技術(shù)和混成控制理論引入微電網(wǎng)中, 形成了多目標(biāo)控制問題,改進(jìn)了混成控制原有的系統(tǒng)層級模型,并基于電壓控制約束條件實現(xiàn)了微電網(wǎng)電能質(zhì)量的實時控制。不同于主從和對等控制[19],文獻(xiàn)[20]基于多智能體一致性理論提出了一種分布式無功功率控制策略,應(yīng)用動態(tài)一致性算法對無功功率的差值進(jìn)行迭代求和,借助積分控制器對下垂特性曲線的參考電壓幅值進(jìn)行自適應(yīng)地補(bǔ)償,從而實現(xiàn)無功功率的合理分配。
現(xiàn)有的關(guān)于分布式預(yù)測控制解決通信約束下系統(tǒng)輸出一致性問題的文獻(xiàn)中,基本上都是假設(shè)其系統(tǒng)模型為線性的。而在實際應(yīng)用中,如智能電網(wǎng),由于濾波電路和耦合連接器的存在,系統(tǒng)往往是非線性的。這使得已有的分布式預(yù)測控制算法并不能很好地適應(yīng)于這些場景,因此,如何設(shè)計協(xié)調(diào)控制協(xié)議,實現(xiàn)多智能體之間的協(xié)調(diào),并主動補(bǔ)償通信約束,是一個重要問題。本文將針對具有異質(zhì)通信約束的非線性網(wǎng)絡(luò)化多智能體系統(tǒng),提出一種分布式協(xié)調(diào)預(yù)測控制算法,實現(xiàn)多智能體的輸出一致性。在四節(jié)點(diǎn)微電網(wǎng)系統(tǒng)上執(zhí)行了一系列的仿真,用來驗證所提出的控制策略的有效性和魯棒性。
將一個具有N個智能體的多智能體系統(tǒng)描述為一個具有N個頂點(diǎn)的無向圖G={V,E,A}。V是圖G的頂點(diǎn)集,滿足V={1,…,N},1,…,N是頂點(diǎn)的序號。E是圖G的邊集,滿足E?V×V。圖G的一條邊(i,j)∈E表示一對頂點(diǎn)i和j互為鄰居,鄰居之間可以彼此接收到對方發(fā)送的信息。頂點(diǎn)i的鄰居集可表示為Ni={j∈V|(i,j)∈E}。圖G的鄰接矩陣表示為A=(aij)N×N,當(dāng)頂點(diǎn)i與頂點(diǎn)j之間存在連接時,aij=1,否則,aij=0。假設(shè)圖G沒有自環(huán),即(i,i)?E,且令鄰接矩陣A的主對角元素為aii=0。如果圖G中任意兩個頂點(diǎn)都互為鄰居,則圖G為完全圖。如果從頂點(diǎn)i到另一個頂點(diǎn)j有一條路徑,那么頂點(diǎn)i和j是連通的。若圖G中任意一對頂點(diǎn)都是連通的,則圖G稱為連通圖。對于非平衡圖,可以定義出度為dout(i)=∑j∈Niaij,入度為din(i)=∑j∈Niaji,當(dāng)出度等于入度時,稱G為平衡圖,否則,為非平衡圖。d=diag{d(i)}定義為平衡圖G的度矩陣,其中d(i)=∑j∈Niaij。相應(yīng)地,圖G的拉普拉斯矩陣L定義為L=D-A。
考慮以下具有N個智能體的非線性網(wǎng)絡(luò)化系統(tǒng)[11]:
(1)
其中:xi為系統(tǒng)的狀態(tài)變量;u′i為控制輸入;f′i和g′i為已知的非線性函數(shù);Di為外部干擾。
在非線性多智能體系統(tǒng)中,存在多個控制器,并且各個代理控制器之間必須考慮多智能體之間的交互。在單個智能體系統(tǒng)中,代理控制器單獨(dú)采用控制策略,例如,網(wǎng)絡(luò)預(yù)測控制[14]。現(xiàn)在,不僅要考慮動態(tài)性能和控制目標(biāo),而且還需考慮智能體通信過程中的限制。在這種情況下,由于網(wǎng)絡(luò)化多智能體系統(tǒng)中的所有代理都通過網(wǎng)絡(luò)與多智能體系統(tǒng)進(jìn)行通信,每個代理控制器基于自身的信息以及與其他代理控制器共享的信息來解決控制問題,以提高整體性能。隨著系統(tǒng)規(guī)模的增加,非線性多智能體系統(tǒng)所捕獲的實時數(shù)據(jù)和實時計算的密度和大小都將急劇增加。因此,引出了許多挑戰(zhàn),包括數(shù)據(jù)的捕獲、存儲、可視化、共享、傳輸、搜索和分析,以及計算任務(wù)的分配和協(xié)調(diào)等。
關(guān)鍵的通信約束是網(wǎng)絡(luò)延遲和數(shù)據(jù)丟失。這些通信約束會嚴(yán)重影響網(wǎng)絡(luò)化多智能體系統(tǒng)的性能。因此,接下來將在控制器的設(shè)計中考慮如何消除這些通信約束對系統(tǒng)帶來的不利影響。假設(shè)第i個代理的網(wǎng)絡(luò)延遲為ρi,數(shù)據(jù)丟包為si,令通信約束τi=ρi+si,i∈{1,2,…,N}。為了解決這些約束,需要開發(fā)一種新的網(wǎng)絡(luò)化控制結(jié)構(gòu)。通信網(wǎng)絡(luò)的關(guān)鍵特性之一是每次可以傳輸一個數(shù)據(jù)包,而不是單個數(shù)據(jù),這在非網(wǎng)絡(luò)控制系統(tǒng)中是無法做到的。充分利用這一網(wǎng)絡(luò)特性,為網(wǎng)絡(luò)化多智能體系統(tǒng)引入網(wǎng)絡(luò)化預(yù)測控制策略,克服網(wǎng)絡(luò)隨機(jī)時延和數(shù)據(jù)丟失的影響。該策略由控制預(yù)測發(fā)生器和網(wǎng)絡(luò)約束補(bǔ)償器組成。基于動力學(xué)模型和待優(yōu)化的性能函數(shù),預(yù)測控制器將利用直到時間t的所有可用信息生成控制預(yù)測序列,該信息包含從時間t開始向前幾步的控制預(yù)測。所生成的預(yù)測控制序列將被打包并通過網(wǎng)絡(luò)傳輸?shù)奖豢卮矶恕1豢卮矶说木W(wǎng)絡(luò)約束補(bǔ)償器根據(jù)通信約束的類型,從所有可用的控制預(yù)測序列中選擇時間t的最新預(yù)測控制,并將其應(yīng)用于被控智能體的執(zhí)行器。這樣,通信約束,尤其是網(wǎng)絡(luò)延遲和數(shù)據(jù)丟失將被預(yù)測項主動補(bǔ)償,同時預(yù)測控制器將提供與沒有通信約束的網(wǎng)絡(luò)化多智能體系統(tǒng)相同或漸近的控制性能。對網(wǎng)絡(luò)化多智能體進(jìn)行以下假設(shè)和約定:
(Ⅰ)控制器與第i個智能體傳感器之間存在通信約束τi。
(Ⅱ)控制器與第i個智能體執(zhí)行器之間存在的延遲遠(yuǎn)小于網(wǎng)絡(luò)延遲,此通道延時將被忽略。
(Ⅲ)通信約束τi是系統(tǒng)采樣周期的整數(shù)倍,為已知整數(shù)。
對于式(1)中表示的非線性多智能體系統(tǒng)的動力學(xué),假設(shè)其輸出和輸入之間的直接關(guān)系可以由輸出的二階導(dǎo)數(shù)生成,則非線性系統(tǒng)(1)可以寫成如下二階系統(tǒng)[21]:
(2)
?(?hi/?xi·f′i)/?xi≠0的假設(shè)成立。
(3)
其中:
為得到離散化系統(tǒng),對系統(tǒng)(3)施加歐拉離散化,有:
(4)
為了設(shè)計分布式控制器的預(yù)測項,對于第i個代理考慮如下成本函數(shù)Ji(t):
(5)
其中:Ny,Nu分別為輸出預(yù)測窗口和輸入預(yù)測窗口的大小;bi和ci分別為協(xié)同和控制成本增益;gi為牽制增益;
系統(tǒng)的狀態(tài)量可測,但是在實際系統(tǒng)中,高頻振蕩及測量誤差噪聲的存在,往往使得傳感器的測量值并不準(zhǔn)確。因此,對于分布式發(fā)電單元i的各狀態(tài)變量值,將采用如下狀態(tài)觀測器的估計值:
(6)
接下來,將第i個分布式單元的狀態(tài)預(yù)測分為以下3個階段:
(Ⅰ)狀態(tài)預(yù)測,從t-τi+2到t:
循環(huán)代入式(6),有:
其中:k=2,…,τi。
(Ⅱ)狀態(tài)預(yù)測,從t+1到t+Nu:
(7)
其中:k=1,…,Nu。
(Ⅲ)狀態(tài)預(yù)測,從t+Nu+1到t+Ny:
其中:k=1,…,Nu+2,…,Ny,…,Ny+τj。
因此,根據(jù)式(6)和式(7)可以得到如下預(yù)測輸出方程:
(8)
即
將輸出方程(8)代入上式,有:
整理有:
因此,網(wǎng)絡(luò)預(yù)測發(fā)生器的輸出為:
(9)
其中:
以上完成了網(wǎng)絡(luò)預(yù)測發(fā)生器部分的設(shè)計,接下來網(wǎng)絡(luò)約束補(bǔ)償器將發(fā)揮作用,將在預(yù)測序列中選擇合適的預(yù)測量用于實際系統(tǒng)中。在分布式單元i的控制側(cè),執(zhí)行器中的網(wǎng)絡(luò)約束補(bǔ)償器會根據(jù)當(dāng)前的時延情況選擇需要的控制輸入?;谑?9),t時刻網(wǎng)絡(luò)約束補(bǔ)償器輸出的最優(yōu)預(yù)測控制計算如下:
其中:Hv,i是第i個元素為1,其余均為0的N維數(shù)列向量。
為驗證網(wǎng)絡(luò)化分布式預(yù)測控制算法的有效性,將其應(yīng)用于一個具有4個分布式發(fā)電單元的交流微電網(wǎng)系統(tǒng)的電壓恢復(fù)問題。其大信號模型如下:
其中:xi(t)=[PiQiiLdiiLqivodivoqiiodiioqi]T;Di=[vbdivbqi]T;fi,ki,gi的具體形式見文獻(xiàn)[22]。
通過MATLAB/Simulink仿真軟件搭建微電網(wǎng)仿真模型,其中,濾波電路參數(shù)、下垂系數(shù)和耦合連接器的參數(shù)均參見文獻(xiàn)[21]。考慮有向拓?fù)?,其中拓?fù)渚仃嚍閍12=1,a23=1,a34=1,a41=1,其余元素為0,且分布式發(fā)電單元之間的時延為τ1=2,τ2=3,τ3=2,τ4=4??刂破鞲飨禂?shù)為Ny=14,Nu=12,對于i=1,…,4,選擇觀測器參數(shù)為Li=[0.3,-2.5], 選擇bi=5,ci=0.2,且g1=0.3,其他元素的牽制增益為g=0。接下來所有仿真中出現(xiàn)的變量值都采用標(biāo)幺值。特別值得注意的是,仿真圖中的DG表示分布式發(fā)電單元,給定值表示設(shè)定的參考輸入。為驗證本文所提出的控制策略在微電網(wǎng)電壓恢復(fù)方面的有效性,設(shè)計了不同工況,對所提出的控制策略的性能進(jìn)行分析。一種是使用含有和不含協(xié)調(diào)項的分布式預(yù)測控制器進(jìn)行電壓控調(diào)節(jié)。不具有協(xié)調(diào)項控制器作用下的微電網(wǎng)電壓輸出幅值如圖1所示,含有協(xié)調(diào)項的電壓輸出幅值如圖2所示。另一種是使用含有協(xié)調(diào)項的分布式預(yù)測控制器在不同權(quán)重因子下進(jìn)行電壓調(diào)節(jié),其不同的電壓輸出幅值見圖3。
圖1 控制器中無協(xié)同控制項的電壓輸出幅值
圖2 控制器中含協(xié)同控制項的電壓輸出幅值
圖3 不同協(xié)調(diào)增益和跟蹤增益的電壓輸出幅值
由圖1可知:由于控制器中沒有引入?yún)f(xié)調(diào)項,只有牽制節(jié)點(diǎn),第1個發(fā)電單元可以完成給定電壓值的跟蹤,而其他發(fā)電單元則不能完成跟蹤任務(wù)。圖2則顯示了施加協(xié)調(diào)項結(jié)果,從圖2中可以看出:分布式預(yù)測控制器可以很好地實現(xiàn)微電網(wǎng)輸出電壓幅值的跟蹤,而且系統(tǒng)能夠很快地恢復(fù)到期望值。綜合比較圖1和圖2可以得出結(jié)論:在牽制控制的框架下,網(wǎng)絡(luò)中的發(fā)電單元必須直接或間接地獲得參考值,否則將無法完成跟蹤;對于并非所有發(fā)電單元均可獲得參考值的情況,預(yù)測控制器中的協(xié)調(diào)項是不可或缺的。圖3為不同協(xié)調(diào)增益和跟蹤增益的輸出電壓幅值圖,其中增益取bi=9,ci=0.2,且g1=0.2。從圖3中可以看出:控制器可以很好地實現(xiàn)微電網(wǎng)輸出電壓的跟蹤,從而恢復(fù)到期望值。為進(jìn)一步說明協(xié)調(diào)增益、跟蹤增益和控制增益對控制性能的影響,給出了4組不同控制增益下的控制成本、跟蹤成本和總成本,如表1所示。從表1中可以看出:控制器增益的選取會影響閉環(huán)系統(tǒng)的性能,具體而言,隨著協(xié)調(diào)增益與控制增益比值的增大,跟蹤效果會更好。
表1 不同控制增益下的控制成本、跟蹤成本及總成本
本文提出了一種針對網(wǎng)絡(luò)化非線性多智能體系統(tǒng)的分布式預(yù)測控制方法,利用分布式預(yù)測控制策略解決了一類可輸入、輸出線性化的非線性多智能體系統(tǒng)在遭受通信約束時的輸出一致性問題。該方法能夠同時實現(xiàn)一致性和穩(wěn)定性,并能主動補(bǔ)償系統(tǒng)所遇到的異質(zhì)通信約束,如時延和數(shù)據(jù)丟包。介紹了分布式預(yù)測控制的體系結(jié)構(gòu),給出了非線性系統(tǒng)的分布式預(yù)測控制器的設(shè)計過程,并在微電網(wǎng)系統(tǒng)的電壓恢復(fù)問題上對所提出的控制器進(jìn)行了仿真驗證。微電網(wǎng)系統(tǒng)上的仿真驗證了所提出的針對非線性多智能體系統(tǒng)的分布式預(yù)測控制策略的有效性、實用性及穩(wěn)定性。值得一提的是,在現(xiàn)實生產(chǎn)過程中,部分高維的非線性系統(tǒng)并不滿足輸入輸出線性化所需的對合條件。因此,對于這樣的高維非線性多智能體系統(tǒng),如何設(shè)計網(wǎng)絡(luò)化預(yù)測控制器以解決其狀態(tài)、輸出一致性等問題將是未來值得研究的方向。