胡凱 陳旭 楊平化 楊立帆 胡永贊
隨著社會和科技的進(jìn)步,多機器人系統(tǒng)在眾多領(lǐng)域獲得到了廣泛應(yīng)用.與單個機器人相比,編隊協(xié)作的多機器人系統(tǒng)具有更好的穩(wěn)定性,各單體機器人攜帶的傳感器將采集到的信息進(jìn)行共享互補,加強了機器人的環(huán)境識別能力.另外,多機器人系統(tǒng)能夠針對不同任務(wù)需求組成特定的隊形,充分發(fā)揮出每個機器人的潛能[1].
對于多機器人的編隊控制結(jié)構(gòu),一般是基于分布式控制設(shè)計的[2],包括領(lǐng)航-跟隨法[3]、虛擬結(jié)構(gòu)法[4]、基于行為法[5]、圖論法[6]、人工勢場法[7]等,其中,領(lǐng)導(dǎo)者-跟隨法由于簡單性和可擴展性成為了工程中最理想、最受歡迎的編隊控制策略.在領(lǐng)航-跟隨策略下,目前,常用的機器人控制算法有PID[8]、反饋線性化[9]、模型預(yù)測控制[10]等,但這些方法都難以調(diào)整系統(tǒng)參數(shù),也無法處理系統(tǒng)中存在的非線性約束問題.相對于以上方法而言,滑模變結(jié)構(gòu)控制(Sliding Mode Variable Structure Control,SMC)具備較快的響應(yīng)速度,對參數(shù)不確定性和對外界擾動也具有良好自適應(yīng)性、魯棒性,并且更易于理解和實現(xiàn),因此,在解決典型非線性、強耦合、時變性的多機器人協(xié)同控制問題中,SMC具有巨大的潛力和應(yīng)用價值.
20世紀(jì)50年代,Utkin和Emelyanov首次提出了滑模變結(jié)構(gòu)控制的概念.1983年,Slotine等[11]首次采用滑模控制原理設(shè)計出機器人的滑模變結(jié)構(gòu)控制器,隨后國內(nèi)外出現(xiàn)大量關(guān)于機器人滑模變結(jié)構(gòu)控制的研究.1991年,Utkin等[12]利用SMC原理提出了經(jīng)典的機器人路徑避障策略,這為以后SMC在多機器人協(xié)同控制中的應(yīng)用打下了基礎(chǔ).SMC在多機器人協(xié)同編隊中的研究可以分為兩方面:一是基于常規(guī)SMC的編隊控制研究;二是基于SMC和其他控制方法結(jié)合的編隊控制研究.在SMC發(fā)展初期,大多數(shù)的SMC控制器是基于線性滑模面設(shè)計的,但線性滑模面一般只適用于對速度和精度要求不高的非線性系統(tǒng),而對于多機器人這類復(fù)雜的非線性系統(tǒng),線性滑模面存在明顯的缺陷.后來,很多學(xué)者提出了以終端滑模、積分滑模等非線性滑模替代傳統(tǒng)線性滑模的方案,保證了系統(tǒng)狀態(tài)在有限時間收斂至平衡點.2018年,Wu等[13]針對具有不確定性的多移動輪式機器人系統(tǒng),提出一種基于積分終端滑模的編隊控制方法,實現(xiàn)了有限時間內(nèi)多機器人的編隊控制和軌跡跟蹤.
以往的研究大多是基于運動學(xué)或動力學(xué)模型實施一般的滑模變結(jié)構(gòu)控制,而在實際編隊控制過程中,由于多機器人系統(tǒng)參數(shù)的不確定以及外界環(huán)境的影響,很難建立精準(zhǔn)的運動學(xué)或動力學(xué)模型,并且SMC本身控制律的不連續(xù)性容易引起抖振現(xiàn)象,從而降低了控制性能.針對上述問題,Lian等[14]提出了一種基于徑向基函數(shù)(Radial Basis Function,RBF)神經(jīng)網(wǎng)絡(luò)的滑模控制方法,削弱了滑??刂乒逃械亩墩瘢岣吡硕鄼C器人軌跡跟蹤的精度.2018年,Huang等[15]針對神經(jīng)網(wǎng)絡(luò)不能很好地利用已有經(jīng)驗知識的缺點,提出了一種基于模糊神經(jīng)網(wǎng)絡(luò)的自適應(yīng)滑??刂品椒?模糊神經(jīng)網(wǎng)絡(luò)(Fuzzy Neural Network,F(xiàn)NN)結(jié)合了模糊控制與神經(jīng)網(wǎng)絡(luò)控制兩者的優(yōu)勢,不僅具有神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)和快速并行處理的能力,還具備了模糊控制系統(tǒng)充分利用先驗知識、以較少規(guī)則數(shù)來表達(dá)知識的優(yōu)勢,這種基于FNN的滑??刂破髂軌?qū)Χ鄼C器人模型的不確定性部分、時變外部擾動以及建模誤差進(jìn)行在線估計.此外,隨著神經(jīng)網(wǎng)絡(luò)層數(shù)的加深,優(yōu)化函數(shù)容易陷入局部最優(yōu)解,并且“梯度消失”現(xiàn)象更加嚴(yán)重,基于RBF等傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的滑??刂品椒ㄔ絹碓讲荒軇偃斡诟叨确蔷€性的多機器人系統(tǒng).
近年來,深度學(xué)習(xí)和強化學(xué)習(xí)得到了深入發(fā)展,不少學(xué)者嘗試將深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)與SMC相結(jié)合并應(yīng)用于多機器人的協(xié)同控制.2018年,Cui等[16]設(shè)計了一種基于DNN的滑模跟蹤控制器,通過深度確定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法對抖振抑制控制器中的神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,在無需動力學(xué)模型的情況下保證了機器人的軌跡跟蹤.在此基礎(chǔ)上,Wang等[17]于2019年又提出一種基于DDPG的滑模編隊控制策略,實現(xiàn)了在不同速度下多自主水下機器人(Autonomous Underwater Vehicles,AUVs)的協(xié)同控制.總之,伴隨控制學(xué)科、人工智能等技術(shù)的快速發(fā)展,基于神經(jīng)網(wǎng)絡(luò)、模糊邏輯、魯棒自適應(yīng)等智能控制與SMC結(jié)合的控制器應(yīng)運而生,利用智能控制的自學(xué)習(xí)、自適應(yīng)、自組織等特性可使得SMC根據(jù)系統(tǒng)狀態(tài)自動調(diào)節(jié)其控制輸出,從而有效削弱抖振的影響,并且這些方法之間本身就具有較強的互補性,利用彼此的優(yōu)勢來改善各自缺點,這對提高多機器人協(xié)同編隊控制的質(zhì)量具有重要意義.本文按照結(jié)構(gòu)框架在第3章詳細(xì)介紹基于智能SMC的編隊控制方法,特別是DNN與SMC的結(jié)合,這是當(dāng)下和今后的研究熱點.
滑模控制是變結(jié)構(gòu)控制的一個分支,變結(jié)構(gòu)控制也稱為滑模變結(jié)構(gòu)控制.需要指出的是,并不是所有的變結(jié)構(gòu)控制都是滑模控制,而滑模控制是變結(jié)構(gòu)控制中主流的設(shè)計方法.
滑模變結(jié)構(gòu)控制是一類特殊的非線性控制,其非線性表現(xiàn)為控制作用的不連續(xù)性.這種控制策略與其他控制策略的區(qū)別在于系統(tǒng)的結(jié)構(gòu)并不固定.該控制特性可以迫使系統(tǒng)的狀態(tài)被限制在某一子流形上運動,即所謂的“滑動模態(tài)”運動(滑模運動).這種滑動模態(tài)可以根據(jù)實際情況的不同而自行設(shè)計,且其與控制對象的參數(shù)及擾動無關(guān),也使得處于滑模運動的系統(tǒng)具有很好的魯棒性.此外,SMC還具有良好的暫態(tài)性能、快速響應(yīng)、對參數(shù)變化和外部干擾(噪聲等)不敏感等特點,適用于典型的非線性系統(tǒng)、多輸入多輸出系統(tǒng),因此,SMC被廣泛應(yīng)用到各種工業(yè)控制對象之中.
20世紀(jì)50年代,針對二階線性系統(tǒng)的研究對象,蘇聯(lián)學(xué)者Utkin和Emelyanov首次提出了變結(jié)構(gòu)控制的概念.20世紀(jì)60年代,關(guān)于SMC的研究主要集中在高階線性系統(tǒng)在線性切換函數(shù)下控制受限與不受限及二次型切換函數(shù)的情況,雖然研究對象擴大到了高階線性系統(tǒng),但其仍然局限于單輸入單輸出的系統(tǒng).20世紀(jì)70年代,Utkin又系統(tǒng)地提出變結(jié)構(gòu)控制和滑??刂频姆椒?此后,對于SMC的研究興趣急劇上升,并在70年代之后,伴隨大規(guī)模集成電路、計算機信息技術(shù)的飛速發(fā)展,SMC相關(guān)理論也取得了長足的進(jìn)步,所涉及的研究對象從簡單的線性系統(tǒng)進(jìn)入到連續(xù)與離散系統(tǒng)、確定性與不確定性系統(tǒng)、集中參數(shù)與分布參數(shù)系統(tǒng)等各種復(fù)雜的系統(tǒng).20世紀(jì)80年代后期,SMC理論引起了國內(nèi)學(xué)者的重視.我國高為炳院士首次提出了滑模趨近律和自由遞階的概念,而SMC存在一個顯著的問題——抖振問題,趨近律則是一種有效抑制抖振問題的方法.90年代末,高為炳[18]還提出了通過調(diào)整趨近律的參數(shù)k和e,來保證滑動模態(tài)到達(dá)過程中的動態(tài)品質(zhì),并能夠減弱控制信號的高頻抖動.另外,姚瓊薈等[19]、胡躍明[20]、劉金琨等[21]同樣為我國SMC理論的研究和推廣做出了不可或缺的貢獻(xiàn).
1.2.1 滑動模態(tài)
1)當(dāng)系統(tǒng)運動點運動到切換面s=0附近時,穿越此點而過,該點稱為“通常點”,圖中點A就是一個通常點;
2)當(dāng)系統(tǒng)運動點到達(dá)切換面s=0附近時,向切換面的該點的兩邊離開,此點稱為“起始點”,圖中點B就是一個起始點;
3)系統(tǒng)運動點到達(dá)切換面s=0附近時,從切換面的兩邊趨向于該點,該點稱為“終止點”,圖中點C就是一個終止點.
圖1 切換面上的3種特性Fig.1 Three characteristics of the switching surface
其中,只有終止點具有特殊的意義.當(dāng)在切換面上某一區(qū)域內(nèi)所有點都是終止點,則一旦狀態(tài)點趨近于該區(qū)域,就會被“吸引”進(jìn)該區(qū)域內(nèi)運動.此時,在切換面s=0上所有的運動點都是終止點的區(qū)域被稱作為“滑動模態(tài)”區(qū)域,系統(tǒng)在滑模區(qū)中的運動叫做“滑模運動”.按照滑動模態(tài)區(qū)域上的運動點都必須是終止點這一要求,當(dāng)狀態(tài)點到達(dá)切換面附近時,必然存在以下條件:
(1)
(2)
滿足上述到達(dá)條件,狀態(tài)點將向切換面趨近,切換面為終止點區(qū).
1.2.2 SMC的數(shù)學(xué)定義
設(shè)控制系統(tǒng)狀態(tài)方程為
(3)
需要確定切換函數(shù)s(x)求解控制函數(shù)u:
(4)
當(dāng)s(x)=0時,其就是所謂的滑模面.u+(x),u-(x)分別為滑模面左、右兩側(cè)的控制器,由控制函數(shù)可以看出變結(jié)構(gòu)控制主要體現(xiàn)為u+(x)≠u-(x).因此,滑模變結(jié)構(gòu)控制的本質(zhì)是通過切換開關(guān)使得閉環(huán)控制系統(tǒng)具有不同的結(jié)構(gòu),并且具備漸近穩(wěn)定等良好的動態(tài)品質(zhì).
滑模變結(jié)構(gòu)控制系統(tǒng)的響應(yīng)由趨近階段、滑動階段和穩(wěn)態(tài)階段組成.因此,滿足以下3個條件的控制才稱之為滑模變結(jié)構(gòu)控制:
1)滿足可達(dá)條件,即系統(tǒng)狀態(tài)在有限時間內(nèi)被驅(qū)使到滑模面上;
3)滑動模態(tài)具有漸近穩(wěn)定等良好的動態(tài)品質(zhì).
滑模變結(jié)構(gòu)控制通常要求具有理想的滑動模態(tài)、良好的動態(tài)品質(zhì)和較高的魯棒性,在理論上這些性能可以通過選擇適當(dāng)?shù)幕C鎭韺崿F(xiàn).在滑模變結(jié)構(gòu)控制發(fā)展初期,其研究大部分基于線性滑模面設(shè)計[22].典型線性滑模面的設(shè)計如下:
(5)
其中,x表示系統(tǒng)的狀態(tài)向量,C是一個常數(shù)矩陣.線性滑模面的滑模變結(jié)構(gòu)控制將系統(tǒng)的整個滑模運動分成了2個階段:趨近和滑模.趨近階段是系統(tǒng)從任意初始狀態(tài)趨向切換面直至到達(dá)切換面的過程;滑模階段是系統(tǒng)在滑模面上的運動過程.當(dāng)系統(tǒng)到達(dá)滑模段后,跟蹤誤差會漸近地收斂至零,其收斂速度可通過選擇常數(shù)矩陣C來改變.但不管怎樣變化,系統(tǒng)的狀態(tài)跟蹤誤差都不能在有限時間內(nèi)收斂至零.
抖振現(xiàn)象(圖2)是SMC存在的最顯著問題,其主要是由時間滯后開關(guān)、系統(tǒng)慣性及測量誤差等因素引起的,使得系統(tǒng)在滑動模態(tài)下產(chǎn)生小幅度、高頻率的振動.抖振問題不僅會影響到控制的精度,而且可能激勵起系統(tǒng)中高頻未建模動態(tài),破壞系統(tǒng)的穩(wěn)定性.
圖2 抖振現(xiàn)象(紅色曲線部分)Fig.2 Chattering phenomenon (red curves)
對于抖振問題,傳統(tǒng)的解決手段主要包括連續(xù)函數(shù)近似法[23]、邊界層設(shè)計法[24]、趨近律法[25]、濾波法[26]、動態(tài)滑模法[27]等.這些方法雖然對削弱抖振問題具有積極的作用,但每種方法也都有自身的缺點.一方面,它們在運用時具有一定的局限性,比如最常見的趨近律方法,在面對不確定性及干擾較大的情況下,其抑制抖振效果較差;另一方面,以上方法在抑制抖振的同時,也會讓控制系統(tǒng)失去部分魯棒性能.因此,如何既保證非線性控制系統(tǒng)的良好魯棒性,又能夠抑制抖振的影響,是對基于SMC多機器人編隊研究的一個主要挑戰(zhàn)[28].
多機器人編隊控制是指由多個機器人組成的團隊在向特定目標(biāo)或方向運動的過程中,能夠保持預(yù)定的隊形,同時適應(yīng)環(huán)境約束的控制問題.編隊控制問題最初的靈感來源于動物中的魚群、鳥群等自然現(xiàn)象,其在工程中應(yīng)用很廣泛,諸如無人機的編隊飛行(圖3)、無人車隊的協(xié)調(diào)控制、無人艇的編隊等.
圖3 數(shù)百架無人機組成的編隊表演Fig.3 Formation performance of hundreds of drones
近20年來,自主水下機器人(AUV)的運動控制問題在海洋工程和多機器人協(xié)同控制領(lǐng)域引起了廣泛的關(guān)注.AUV不僅能夠克服惡劣的水下環(huán)境,而且具有體積小、質(zhì)量輕、成本低等諸多優(yōu)點,在資源勘探、海洋監(jiān)測、救援行動、反潛作戰(zhàn)等多方面都有應(yīng)用.在這些應(yīng)用中,由于編隊控制可以極大地提高多AUV的工作效率,降低實際成本,增強控制系統(tǒng)的魯棒性,因此通過多AUV的協(xié)作來執(zhí)行任務(wù)是具有重要實際效益的.
研究多AUV編隊控制,首要需要對AUV的運動學(xué)和動力學(xué)模型進(jìn)行分析.機器人的運動學(xué)分析主要研究機器人在運動過程中空間幾何位置隨運動的關(guān)系,動力學(xué)分析主要分析機器人的運動與受力之間的關(guān)系(圖4).運動學(xué)分析和動力學(xué)分析是研究機器人運動的基礎(chǔ),也是控制機器人運動的基礎(chǔ).AUV一般的運動學(xué)和動力學(xué)模型,如下所示:
(6)
(7)
圖4 AUV的坐標(biāo)定義和運動變量Fig.4 AUV coordinates and motion variables
由于多水下航行器是三維空間中高度非線性、耦合和時變的動態(tài)系統(tǒng),并且水動力系數(shù)和外部擾動總是不確定的,這給多AUV編隊控制帶來了挑戰(zhàn).而SMC對模型不確定性和環(huán)境擾動具有較好的魯棒性,近年來在多AUV編隊控制中得到了廣泛的應(yīng)用[29-31].當(dāng)多個AUV以編隊的方式進(jìn)行水中勘察等任務(wù)時,需保持期望的姿態(tài),并遵循一定的軌跡,以便后續(xù)任務(wù)能夠順利進(jìn)行.
姿態(tài)同步是指每個AUV根據(jù)控制協(xié)議,利用自身和其他AUV在交互過程中獲得的信息來調(diào)整自己的姿態(tài),使系統(tǒng)中所有AUV的姿態(tài)都達(dá)到期望的狀態(tài).在采用領(lǐng)航-跟隨編隊結(jié)構(gòu)時,可將AUV的定點定位問題描述為利用控制律使AUV穩(wěn)定到目標(biāo)位置和目標(biāo)姿態(tài).2017年,Zhang等[32]基于SMC原理提出了一種分布式姿態(tài)同步控制協(xié)議的李雅普諾夫方法,其不僅慮到AUV動力學(xué)模型的不確定性以及未知的外界干擾等因素,并且能夠使得所有AUV能夠協(xié)調(diào)地跟蹤所需的姿態(tài)信息,而所需的姿態(tài)信息只需由一個或一個子集的AUV即可實現(xiàn).但以往的研究未考慮到水下存在的通信時延這一因素.針對這一問題,2018年,Liu等[33]設(shè)計了一種分布式積分滑??刂破?,不僅能夠?qū)崿F(xiàn)通信時延下的AUV姿態(tài)跟蹤,并且相對于一般滑模控制器,該自適應(yīng)積分滑??刂坡刹恍枰劳獠扛蓴_的上界,符合實踐中干擾往往是未知的情況.文獻(xiàn)[33]所設(shè)計的積分滑模曲面如下所示:
(8)
同樣,軌跡跟蹤問題也是AUV編隊控制中的一個研究熱點.SMC對建模不確定性和外部干擾具有較強的魯棒性,因而在水下航行器的軌跡跟蹤中具有良好的控制效果.但由于滑模流形的漸近收斂性,一般的滑模控制不能保證跟蹤誤差在有限時間內(nèi)收斂至零.此外,在水下進(jìn)行軌跡跟蹤控制時,SMC控制器的收斂速度是一個重要指標(biāo),然而一般的滑??刂品椒ㄖ荒芡ㄟ^以大量控制輸入為代價來實現(xiàn),這可能會導(dǎo)致推進(jìn)器的飽和,在實際應(yīng)用中是非常不可取的.針對上述問題,2019年,Qiao等[35]提出一種快速非奇異終端滑模控制(SOFNTSMC)方案,與一般SMC方法相比,這種基于SOFNTSMC的軌跡跟蹤方法具有更快的收斂速度.所謂終端滑模是指在線性滑模面的基礎(chǔ)上引入非線性函數(shù),當(dāng)系統(tǒng)在控制作用下運行至滑模面上,它能夠讓被控系統(tǒng)狀態(tài)在有限的時間內(nèi)到達(dá)平衡點,實現(xiàn)系統(tǒng)狀態(tài)的有限時間收斂.Qiao等[35]所提出的新型終端滑模面設(shè)計方案,不僅能夠提升滑模面的性能,同時也避免了奇異問題.終端滑模面的一般設(shè)計和SOFNTSMC方案中滑動流形(滑模面)的設(shè)計如下所示:
s(x)=x+βxq/p,
(9)
(10)
其中,x是狀態(tài)向量,β是一個大于0的常數(shù),q,p是滿足q
此外,對于三維空間中高度非線性、強耦合和時變的AUV系統(tǒng),單靠系統(tǒng)本身難以處理未知參數(shù)和不確定擾動,而后退法是一種簡便有效的控制器設(shè)計方法,也是根據(jù)李雅普諾夫穩(wěn)定性設(shè)計控制器的有力工具.因此,近年來,不少學(xué)者嘗試將后退技術(shù)與SMC相結(jié)合,并應(yīng)用于水下機器人的三維運動控制與協(xié)同[36-37].2019年,Bian等[38]給出了一種結(jié)合SMC、后退技術(shù)、領(lǐng)航-跟隨策略的三維協(xié)調(diào)控制方案,所設(shè)計的新型控制律能夠有效保證AUV在三維水下空間中軌跡跟蹤的穩(wěn)定性.
表1 典型滑模面設(shè)計的總結(jié)
雖然上述基于SMC的編隊控制策略具有不錯的控制效果,但以下幾個方面值得注意:一方面,無論是線性滑模還是終端滑模、積分滑模等非線性滑模,它們還是存在一定的抖振效應(yīng),這無疑降低了多機器人系統(tǒng)的魯棒性;另一方面,諸如AUV水下機器人通常在非常復(fù)雜的環(huán)境中工作,很容易受到未知的力量影響,包括海浪、潮汐、洋流以及向上或向下的水流等,這些不確定因素會造成高度耦合性、時變性、參數(shù)不確定性,極大地限制了多機器人編隊控制在實際中的應(yīng)用.因此,在上述研究的基礎(chǔ)上有必要開發(fā)出一種適用于復(fù)雜實際環(huán)境下的多機器人編隊控制器,并對模型動力學(xué)和可能存在的不確定性進(jìn)行研究.
雖然SMC具有響應(yīng)快、自適應(yīng)和魯棒性較強的優(yōu)點,也能夠滿足機器人的非線性魯棒控制,但多機器人系統(tǒng)是一類高度非線性、強耦合、時變性的復(fù)雜系統(tǒng),在基于運動學(xué)或動力學(xué)模型實施一般的滑模變結(jié)構(gòu)控制時,還存在以下缺陷:
1)SMC本身控制律的不連續(xù)性容易引起抖振現(xiàn)象,從而造成系統(tǒng)的不穩(wěn)定;
2)SMC在實際應(yīng)用中容易受到測量噪聲等干擾;
3)對于非線性多機器人系統(tǒng)的滑??刂疲刃Э刂频挠嬎阈枰_的數(shù)學(xué)模型,這就增加了SMC對系統(tǒng)模型的依賴性.
以上問題都降低了SMC的控制性能,因此,SMC存在的不足促使其與其他控制方法相結(jié)合.相對于一般滑模而言,這樣的結(jié)合以及改進(jìn)使得系統(tǒng)在保持對攝動和外部干擾具備更強魯棒性的同時,盡量消除抖振現(xiàn)象的發(fā)生.
目前,智能控制與SMC的交叉研究已取得了一定的實際成果和應(yīng)用,這對于解決復(fù)雜非線性、不確定性的多機器人編隊控制問題具有十分重要的意義.當(dāng)然,各類智能控制方法也都存在各自的長短處,需要針對具體控制問題進(jìn)行具體研究分析.比如,模糊控制不僅不需要建立精確的數(shù)學(xué)模型,還能將不連續(xù)的控制信號進(jìn)行平滑處理,從而抑制滑模變結(jié)構(gòu)控制中所固有的抖振現(xiàn)象,但是模糊控制本身的設(shè)計缺乏系統(tǒng)性,其模糊規(guī)則的選擇多采用試湊法,這對復(fù)雜控制難以奏效;同樣,神經(jīng)網(wǎng)絡(luò)控制一方面具有較強的自學(xué)習(xí)能力,可以充分逼近任意復(fù)雜的非線性,但另一方面,其學(xué)習(xí)速度較慢,不易判別穩(wěn)定性.因此,在面對復(fù)雜的多機器人編隊控制問題時,需要以上各種控制方法的結(jié)合與補充,這樣才能達(dá)到理想的無抖振滑??刂菩Ч?表2對比了3種常見的智能控制方法.
神經(jīng)網(wǎng)絡(luò)具有較強的學(xué)習(xí)能力和較高的并行計算能力,且能夠逼近任意復(fù)雜的非線性關(guān)系.雖然SMC具有簡單、快速和魯棒性等優(yōu)點,但在非線性系統(tǒng)中仍存在一些重要的局限性,比如抖振現(xiàn)象、對不匹配不確定性的敏感性和選擇最優(yōu)不連續(xù)增益等[39-40].其中,抖振現(xiàn)象被認(rèn)為是最顯著的問題,利用神經(jīng)網(wǎng)絡(luò)能夠有效抑制SMC固有的抖振問題.從20世紀(jì)末開始,許多專家將目光投向于SMC與神經(jīng)網(wǎng)絡(luò)結(jié)合的研究工作.
表2 3種常見的智能控制方法
3.1.1 常規(guī)神經(jīng)網(wǎng)絡(luò)滑模編隊控制
神經(jīng)網(wǎng)絡(luò)在SMC中的應(yīng)用主要分為兩大類:一類是利用神經(jīng)網(wǎng)絡(luò)調(diào)整SMC的系統(tǒng)參數(shù),實現(xiàn)SMC參數(shù)的自適應(yīng);另一類是將神經(jīng)網(wǎng)絡(luò)運用到SMC中,用來處理系統(tǒng)中的不確定性因素,計算等效控制.
第1類.SMC的抖振大小是由其控制器切換項的增益決定的,采用神經(jīng)網(wǎng)絡(luò)可對切換項的增益進(jìn)行優(yōu)化調(diào)節(jié),能夠在保持SMC強魯棒性的前提下降低SMC的抖振.2012年,Gao等[41]就通過梯度下降法調(diào)整神經(jīng)網(wǎng)絡(luò)的權(quán)值,以此實現(xiàn)RBF神經(jīng)網(wǎng)絡(luò)優(yōu)化滑??刂破鞯那袚Q增益,從而有效抑制了抖振現(xiàn)象.但由于目前大多數(shù)神經(jīng)網(wǎng)絡(luò)都是基于梯度下降法的,因而對于非凸的優(yōu)問題,它往往容易陷入局部最小點.為進(jìn)一步提高神經(jīng)網(wǎng)絡(luò)的全局優(yōu)化效率,2016年,Zhao等[42]提出了一種基于遺傳算法優(yōu)化的神經(jīng)網(wǎng)絡(luò)自適應(yīng)滑??刂撇呗?,通過遺傳優(yōu)化算法解決了隱藏層神經(jīng)元節(jié)點數(shù)和各參數(shù)取值的問題,提升了滑??刂破鞯男阅?
第2類.目前用于函數(shù)逼近的神經(jīng)網(wǎng)絡(luò)主要包括RBF和BP(Back Propagation)網(wǎng)絡(luò),其中RBF網(wǎng)絡(luò)的學(xué)習(xí)速度和逼近精度都比BP網(wǎng)絡(luò)強大,能夠估計不確定性的上界,并對未知參數(shù)和非參數(shù)擾動進(jìn)行補償,因此RBF網(wǎng)絡(luò)在處理多機器人編隊參數(shù)不確定問題中的應(yīng)用更為廣泛.文獻(xiàn)[43-45]涉及了多種不確定性環(huán)境下AUV編隊控制的策略,但從收斂時間來看,這些控制策略并不理想.2019年,Cui等[46]提出一種基于非奇異快速末端滑模和RBF網(wǎng)絡(luò)的新型控制器,它利用RBF神經(jīng)網(wǎng)絡(luò)技術(shù)對海洋惡劣環(huán)境引起的不確定性動力學(xué)和力進(jìn)行近似分析,與傳統(tǒng)控制策略相比,該控制方案具有更強的魯棒性,并已成功應(yīng)用于多AUV編隊的軌跡跟蹤.
3.1.2 深度神經(jīng)網(wǎng)絡(luò)滑模編隊控制
到目前為止,人們提出了RBF、BP等多種神經(jīng)網(wǎng)絡(luò)模型,雖然這些神經(jīng)網(wǎng)絡(luò)能夠提升SMC的控制性能,但其本身也存在一定的缺陷,特別是隨著神經(jīng)網(wǎng)絡(luò)層數(shù)的加深,優(yōu)化函數(shù)越來越容易陷入局部最優(yōu)解;同時,隨著網(wǎng)絡(luò)層數(shù)增加,“梯度消失”現(xiàn)象更加嚴(yán)重.基于此,Hinton等[47]在2006年提出利用預(yù)訓(xùn)練方法緩解局部最優(yōu)解的問題,將隱含層推動到了7層,神經(jīng)網(wǎng)絡(luò)真正意義上才有了“深度”,由此也揭開了深度學(xué)習(xí)、強化學(xué)習(xí)等先進(jìn)學(xué)習(xí)算法的熱潮.
深度學(xué)習(xí)(Deep Learning)和強化學(xué)習(xí)(Reinforcement Learning)雖是兩種學(xué)習(xí)算法,但深度學(xué)習(xí)可以用到強化學(xué)習(xí)上,并稱為深度強化學(xué)習(xí)(DRL).DRL將深度學(xué)習(xí)的感知能力和強化學(xué)習(xí)的決策能力相結(jié)合,可以直接根據(jù)輸入的信息進(jìn)行控制,是一種更接近人類思維方式的人工智能方法.目前,DRL算法已被應(yīng)用于多個領(lǐng)域,例如多機器人控制技術(shù):創(chuàng)建能夠進(jìn)行“學(xué)會學(xué)習(xí)”的智能體(agent),這種agent能夠泛化處理以前從未面臨過的復(fù)雜控制環(huán)境.同時,引入DRL算法能夠為解決SMC固有的抖振問題提供新思路.文獻(xiàn)[48]提出了一種基于強化學(xué)習(xí)策略的自適應(yīng)積分滑模控制器,該控制器在較低抖振時能夠獲得獎勵,在較高抖振時得到懲罰,以此減小了滑模切換引起的抖振效應(yīng).
需要指出的是,雖然DRL與SMC在編隊控制領(lǐng)域的結(jié)合研究還處于起步和理論階段,但近年來取得了一些突破,可以預(yù)見的是未來其發(fā)展具有很大的潛力.2018年,Sangiovanni等[49]提出了一種DRL算法與SMC結(jié)合的新型機器人運動控制方案,該方案結(jié)合經(jīng)典的SMC概念和AI元素,為解決復(fù)雜的多機器人協(xié)同控制提供了一個新穎思路.上述文獻(xiàn)所提方案具有集中式和分散式兩種控制結(jié)構(gòu),其一方面利用積分滑模(Integral Sliding Mode,ISM)控制器對由于未建模的動力學(xué)或耦合效應(yīng)而產(chǎn)生的匹配擾動和不確定項進(jìn)行補償.基于ISM控制的滑模面和控制律方程如下所示:
(11)
uISMj(t)=-Kjsgn(Σj(t)),
(12)
其中,σj代表實際滑動變量,uj代表控制器的輸入量,m是一個正常數(shù),e2j代表誤差參數(shù),sgn()是符號函數(shù),Σj(t)代表輔助滑動變量.另一方面,他們設(shè)計了一個基于DRL的決策機制,其工作原理是利用DRL算法訓(xùn)練神經(jīng)網(wǎng)絡(luò),根據(jù)機器人性能的要求,選擇適當(dāng)?shù)莫剟詈瘮?shù),以選擇兩種控制結(jié)構(gòu)中一個最優(yōu)的解決方案.其中,獎勵函數(shù)(切換規(guī)則)如下所示:
(13)
DRL和SMC在機器人碰撞避免策略方面具有很大的潛力,但在以往的研究中,往往只考慮了碰撞因素,而未將其進(jìn)一步拓展到編隊控制領(lǐng)域.基于這一問題,2019年,Sui等[50]提出了一個學(xué)習(xí)行為策略的兩階段訓(xùn)練方案,并設(shè)計了一個評估狀態(tài)值的價值網(wǎng)絡(luò).其學(xué)習(xí)任務(wù)主要分為兩個階段,具體來說,第一階段采用模仿學(xué)習(xí)方法,提出基于共識和最優(yōu)交互避碰的引導(dǎo)方法,生成初始化行為策略的演示軌跡;第二階段采用強化學(xué)習(xí)方法,細(xì)化策略,在設(shè)計RL中的獎勵函數(shù)時,綜合考慮到了編隊因素和碰撞因素.此外,該方法還采用LSTM神經(jīng)網(wǎng)絡(luò)去感知環(huán)境中任意數(shù)量障礙物的信息,網(wǎng)絡(luò)框架如圖5所示.
圖5 LSTM神經(jīng)網(wǎng)絡(luò)的模型[50]Fig.5 Model of LSTM neural network[50]
如圖6所示,綠色的方塊代表follower的狀態(tài),藍(lán)色的方塊代表leader的狀態(tài),紅色長方體表示處理障礙物狀態(tài)的LSTM模塊.而紅色的立方體是LSTM的最后一個隱藏狀態(tài),它表示障礙物的編碼信息,并將跟隨者、領(lǐng)導(dǎo)者和障礙物的狀態(tài)合并起來,然后送入3個全連接(FC)層.最后,網(wǎng)絡(luò)輸出當(dāng)前狀態(tài)的估計值.
圖6 系統(tǒng)網(wǎng)絡(luò)的結(jié)構(gòu)[50]Fig.6 Network architecture to deal with formation control[50]
在對多機器人進(jìn)行編隊控制時,還應(yīng)考慮到自然物力的影響,例如AUV的運動速度對水中阻力和升力系數(shù)的變化十分敏感,在不同速度下固定SMC參數(shù)又很難實現(xiàn)對AUV的精確運動控制,如果參數(shù)完全依賴于手動調(diào)整,那么工作將是繁瑣的,也不能保證良好的魯棒性.目前,主流的參數(shù)整定方法有模糊邏輯法[51]、基于神經(jīng)網(wǎng)絡(luò)法[52]、進(jìn)化算法[53],其中模糊邏輯對先驗知識要求較多,存在參數(shù)優(yōu)化問題;基于神經(jīng)網(wǎng)絡(luò)的方法,一般采用監(jiān)督學(xué)習(xí)來優(yōu)化參數(shù),而在監(jiān)督學(xué)習(xí)中指導(dǎo)信號難以獲??;進(jìn)化算法對先驗知識的計算要求較少,但計算時間較長,難以實時控制.而強化學(xué)習(xí)在自適應(yīng)控制領(lǐng)域中發(fā)揮著重要作用,它能夠在外部環(huán)境沒有提供清晰訓(xùn)練信號的情況下,通過系統(tǒng)與環(huán)境的相互作用有效地學(xué)習(xí)控制策略.
針對上述問題,2019年,Wang等[17]采用一種基于深度確定性策略梯度(DDPG)的滑模控制算法,實現(xiàn)了不同速度下AUV的協(xié)同編隊控制.深度確定性策略梯度算法是由Lillicrap等[54]利用深度Q網(wǎng)絡(luò)(DQN)擴展Q學(xué)習(xí)算法的思路對確定性策略梯度(DPG)方法進(jìn)行改造,所提出的一種基于Actor-Critic框架的算法,可適用于傳統(tǒng)DQN算法解決不了的連續(xù)動作空間上的DRL問題.該方案中DDPG包含兩個神經(jīng)網(wǎng)絡(luò),一個是在當(dāng)前時間步長的情況下,引入一個批評家神經(jīng)網(wǎng)絡(luò)來評估所設(shè)計控制的長時間性能,另一個是在相應(yīng)狀態(tài)下輸出連續(xù)動作的動作神經(jīng)網(wǎng)絡(luò).同時,為提高學(xué)習(xí)效率、防止局部最優(yōu),創(chuàng)建了一個樣本庫存儲歷史樣本,每次隨機選擇一定數(shù)量的樣本進(jìn)行再訓(xùn)練.這種基于無模型強化學(xué)習(xí)算法的控制策略,不僅保證了AUV編隊在不同速度下的協(xié)同控制,并且其穩(wěn)定性、收斂性和精確度都得到了提升.DDPG滑??刂撇呗缘慕Y(jié)構(gòu)如圖7所示.
圖7 基于DDPG滑??刂品ǖ慕Y(jié)構(gòu)[17]Fig.7 Structure based on DDPG sliding mode control method[17]
文獻(xiàn)[17]所提出基于DDPG的滑模控制方法,雖然在仿真結(jié)果中驗證了該方法在水下航行器航向控制中的抗干擾性和跟蹤能力,然而,該方法的收斂速度受到諸多因素的影響,其實際應(yīng)用還沒有得到充分的驗證.在今后的工作中,需要進(jìn)一步提高該方法的收斂速度和穩(wěn)定性,使其能夠應(yīng)用于水下航行器的實際航行實驗控制中.
(14)
其中,s,a分別代表智能體的狀態(tài)和動作,μ是貪婪策略函數(shù),P(s|θp)是一個與狀態(tài)相關(guān)的正定方陣.與以往的避障算法相比,該方案是一種無模型方法,因此可大大減少建模和實現(xiàn)階段的時間.表3為幾種典型深度強化學(xué)習(xí)算法的總結(jié).
模糊邏輯控制(Fuzzy Logic Control,F(xiàn)LC)的基本思想是把專家對特定控制對象過程的控制策略總結(jié)為“IF,THEN”式表達(dá)的控制規(guī)則,通過模糊推理得到的控制作用集,作用于被控對象或過程.
傳統(tǒng)控制方法一般是基于模型的控制,而多機器人系統(tǒng)相對于其他被控系統(tǒng)難以用精確數(shù)學(xué)模型來描述.與其他基于模型的方法不同,F(xiàn)LC的設(shè)計主要依賴于專家的知識和經(jīng)驗,對系統(tǒng)模型沒有依賴性,因此,對于具有不確定性的非線性系統(tǒng),F(xiàn)LC是一種有效的控制策略.此外,F(xiàn)LC能夠保持SMC在滑動模態(tài)階段對參數(shù)不確定以及信號擾動的魯棒性,利用FLC的輸出代替SMC中的符號項,能夠?qū)刂菩盘栠M(jìn)行平滑處理,從而有效削弱抖振.
FLC與SMC結(jié)合的原理主要分為兩方面:一方面是滑模控制器為主控制器,模糊系統(tǒng)起輔助作用[57-58];另一方面就是模糊系統(tǒng)直接用于設(shè)計滑模[59-60].同時,F(xiàn)LC與SMC結(jié)合的應(yīng)用方式通常有:常規(guī)模糊滑??刂?、自適應(yīng)模糊滑模控制、基于模糊神經(jīng)網(wǎng)絡(luò)的滑模控制、基于優(yōu)化算法的模糊滑??刂频?
無人機(Unmanned Aerial Vehicle,UAV)因具有能夠在各個方向移動、低速盤旋、垂直起飛和降落等特點,已廣泛應(yīng)用于目標(biāo)偵察、支援救災(zāi)、機動巡邏、農(nóng)業(yè)植保等領(lǐng)域.對于無人機的編隊控制,通常還需要考慮實際環(huán)境中負(fù)載變化、參數(shù)攝動、測量噪聲、傳動系統(tǒng)的非線性及外部擾動等不確定性因素的影響.許多研究結(jié)果表明,將SMC和FLC技術(shù)相結(jié)合應(yīng)用于UAV等多機器人編隊控制中,不僅可以減輕SMC本身抖振效應(yīng)、減少模糊規(guī)則數(shù)量,還能保證UAV編隊系統(tǒng)對外界不確定因素的抗干擾能力.
在FSMC(模糊滑??刂?控制器設(shè)計時,趨近律設(shè)計是一個重要的組成部分.其中,冪趨近律是應(yīng)用最多的趨近律之一,與其他趨近律相比,其優(yōu)點是當(dāng)系統(tǒng)處于接近滑動面的狀態(tài)時,趨近速度會逐漸減小,這就使得冪趨近律具有較好的消弱抖振的性能,但缺點是當(dāng)系統(tǒng)狀態(tài)遠(yuǎn)離滑動面時,到達(dá)速度較慢.針對這一問題,Xi等[61]提出了一種基于模糊趨近律的滑??刂撇呗裕O(shè)計了兼顧抖振抑制和位置跟蹤的模糊趨近律,該控制律對外部擾動不敏感,既能有效地控制抖振,又能實現(xiàn)UAV的快速跟蹤.如圖8所示,F(xiàn)SMC的設(shè)計步驟一般可分為模糊化、建立知識庫、去模糊化三步(在模糊滑模控制中輸入不再是跟蹤誤差e,而是滑模函數(shù)s).
此外,Xi等[61]還給出了模糊規(guī)則和模糊關(guān)系,如表4所示.
表3 DRL經(jīng)典算法的總結(jié)
圖8 FSMC的結(jié)構(gòu)[61]Fig.8 Architecture of FSMC controller[61]
表4 模糊關(guān)系表[61]
表4中,PS、ZR、PM、PB分別是對模糊控制輸入|s|和輸出k的語言值定義即負(fù)小(positive small)、零(zero)、正中(positive medium)、正大(positive big).相應(yīng)的模糊關(guān)系(A,B分別是|s|和k的模糊子集):
Ri:if|s|isAi,thenkisBi,并進(jìn)一步得到模糊控制的趨近律:
(15)
(16)
從式(16)可看出趨近律滿足滑模趨近條件,說明該模糊滑??刂茲M足穩(wěn)定性要求.
目前,常規(guī)FSMC的設(shè)計仍然是基于經(jīng)驗的,系統(tǒng)參數(shù)在控制過程中沒有自適應(yīng)和自學(xué)習(xí)能力,而且在很多情況下有效經(jīng)驗的獲取并不容易.基于此,2019年,Eltayeb等[62]提出了一種自適應(yīng)模糊增益調(diào)度的滑??刂破?Adaptive Fuzzy Sliding Mode Control,AFSMC),除了能夠和常規(guī)FSMC一樣對跟蹤誤差和不確定性部分進(jìn)行補償,其特色還在于切換增益比常規(guī)FSMC要小很多,有效地減少傳統(tǒng)SMC的抖振,并可用于四旋翼無人機的軌跡跟蹤.
FNN(模糊神經(jīng)網(wǎng)絡(luò))由于結(jié)合了模糊控制與神經(jīng)網(wǎng)絡(luò)控制兩者的優(yōu)勢,不僅具有神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)和快速并行處理的能力,而且具有模糊控制系統(tǒng)能夠充分利用先驗知識、以較少的規(guī)則數(shù)來表達(dá)知識的優(yōu)勢.近些年,很多學(xué)者將FNN-SMC研究工作的重心放在了控制器的簡化上.2017年,Zeghlache等[63]提出了一種基于區(qū)間型模糊神經(jīng)網(wǎng)絡(luò)控制器的滑??刂品椒?,該控制方案避免了建模困難,不僅減小了SMC的抖振效應(yīng)和FLC控制器的規(guī)則數(shù),還有效保證了UAV編隊的穩(wěn)定性.2019年,F(xiàn)erdaus等[64]在文獻(xiàn)[63]的基礎(chǔ)上,利用FNN系統(tǒng)以較少的學(xué)習(xí)參數(shù)來發(fā)展一個精簡控制器(Reduced Parsimonious Controller,RedPAC),這種RedPAC智能控制器與傳統(tǒng)FLC或基于FNN的智能控制器不同,它沒有前提參數(shù),因此大大減少了參數(shù)的數(shù)量,從而消除了控制器設(shè)計過程中的繁瑣問題,并利用SMC技術(shù)來適應(yīng)RedPAC的后向參數(shù),基于SMC的輔助補償控制項能夠保證四旋翼UAV跟蹤誤差的一致漸近收斂為零.
對于典型非線性的多機器人控制系統(tǒng),模糊滑模控制器的設(shè)計在本質(zhì)上可視為一個多參數(shù)的優(yōu)化問題,同時,很多研究證明了遺傳算法(Genetic Algorithm,GA)是自動化模糊控制規(guī)則庫和成員函數(shù)定義的強大工具,可以利用GA來尋找控制器的最優(yōu)規(guī)則和隸屬函數(shù).在過去的數(shù)年里,GA的優(yōu)點也擴展到了設(shè)計模糊滑模控制器的各種方法.Babaei等[65]提出了基于遺傳算法的模糊滑??刂品椒?,采用GA算法以優(yōu)化輸入輸出比例因子等參數(shù)以獲取更好的控制效果,提升了常規(guī)模糊滑??刂破鲗Σ淮_定性和外部干擾的魯棒性,并應(yīng)用于不確定、非線性的UAV系統(tǒng).利用遺傳算法還能夠有效抑制SMC固有的抖振現(xiàn)象,2019年,Vahidi-Moghaddam等[66]針對多輸入多輸出、不確定非線性的UAV系統(tǒng),在文獻(xiàn)[65]的基礎(chǔ)上設(shè)計了基于干擾觀測器的模糊終端滑模控制器,利用GA優(yōu)化的觀測器保證了干擾估計誤差在有限時間內(nèi)收斂指至零,并有效抑制了抖振效應(yīng).
多機器人系統(tǒng)是一個存在不確定性的復(fù)雜系統(tǒng),針對不確定性問題常有兩種控制策略.一是自適應(yīng)控制,通過對控制規(guī)律的及時識別、學(xué)習(xí)和調(diào)整,可以達(dá)到一定理想的控制性能指標(biāo).然而,在20世紀(jì)80年代,研究人員發(fā)現(xiàn),當(dāng)控制系統(tǒng)的參數(shù)發(fā)生變化或存在外部干擾時,傳統(tǒng)的自適應(yīng)控制難以保證系統(tǒng)的穩(wěn)定性.二是魯棒控制,它可以在不確定因素的一定變化范圍內(nèi),保證系統(tǒng)穩(wěn)定和維持一定的性能指標(biāo),是一種固定控制,易于實現(xiàn).因此,魯棒控制與自適應(yīng)控制的結(jié)合可以取長補短.
魯棒自適應(yīng)控制即魯棒控制與自適應(yīng)控制的結(jié)合,是一種具有很好控制系統(tǒng)性能的智能控制方法,其中魯棒項可對系統(tǒng)外部干擾進(jìn)行抑制,自適應(yīng)律可保證滑模切換增益實時調(diào)節(jié).因此,將魯棒自適應(yīng)控制與滑模變結(jié)構(gòu)控制相結(jié)合也就成為了一個研究熱點[67].
與固定翼飛機相比,四旋翼飛機由于體積較小,可垂直起飛、著陸、懸停,并能夠在室內(nèi)、室外等多種環(huán)境下飛行,因此,在軍事、民用領(lǐng)域如多無人機作戰(zhàn)、環(huán)境監(jiān)測等方面具有巨大的潛力.
近年來,各種四旋翼飛行器姿態(tài)穩(wěn)定控制研究得到了飛快發(fā)展.但四旋翼無人機在室外環(huán)境下進(jìn)行編隊飛行時,很容易遭受不可控的外部環(huán)境擾亂,會導(dǎo)致執(zhí)行器發(fā)生故障,從而對UAV編隊的穩(wěn)定性造成挑戰(zhàn),而PID等控制策略并不能保證四旋翼無人機在飛行任務(wù)中遭受嚴(yán)重外部環(huán)境和執(zhí)行器故障時的優(yōu)良性能.因此,容錯控制(FTC)成為了UAV姿態(tài)控制器設(shè)計的一個重要因素.
一般來說,容錯控制分為被動容錯控制(Passive Fault Tolerant Control,PFTC)和主動容錯控制(Active Fault Tolerant Control,AFTC).以往的研究主要集中在PFTC,比如基于反饋線性化[68]、H∞的自適應(yīng)控制方法[69]等,雖然這些方法對故障補償有一定的效果,但在系統(tǒng)矩陣不準(zhǔn)確的情況下,對擾動和不確定性的魯棒性較差.為了克服這個問題,Gong等[70]提出一種基于積分滑模和魯棒自適應(yīng)技術(shù)的固定時間容錯控制器,該控制器的切換控制結(jié)構(gòu)限制了系統(tǒng)的抖振現(xiàn)象,并通過ISM解決了四旋翼無人機容錯姿態(tài)的穩(wěn)定控制問題.2019年,Nguyen等[71]提出了一種改進(jìn)的自適應(yīng)滑模反步控制方案(MASBC).如圖9所示,首先通過一個故障診斷單元來估計執(zhí)行器故障的大小,并在此基礎(chǔ)上將故障估計與自適應(yīng)滑模反步控制相結(jié)合,設(shè)計了MASBC控制器來適應(yīng)執(zhí)行器故障,克服了執(zhí)行器的飽和限制和干擾.與以往方法相比,該方案還具有更好的跟蹤性能和更快的補償速度.
圖9 基于MASBC的控制結(jié)構(gòu)[71]Fig.9 Control structure based on MASBC [71]
文獻(xiàn)[71]還給出了四旋翼無人機的動力學(xué)方程,如圖10所示,它建立在慣性坐標(biāo)系B和地球坐標(biāo)系E中.
圖10 四旋翼無人機的受力矩[71]Fig.10 Torque of quadrotor [71]
此外,四旋翼無人機的控制器參數(shù)是根據(jù)恒載和外部干擾因素進(jìn)行調(diào)整的.然而,無論是在軍事領(lǐng)域還是民用領(lǐng)域,四旋翼都會遇到各種負(fù)載情況,如投擲武器、快遞等,變負(fù)載作為一個大的內(nèi)部擾動因素,導(dǎo)致控制不穩(wěn)定.為此,Liu等[72]于2019年提出了一種新型的魯棒滑??刂破髟O(shè)計方法,在控制抖振的同時,在變負(fù)載條件下對期望軌跡進(jìn)行實時跟蹤.該控制器由基于學(xué)習(xí)率的滑模曲面和基于滑模反雙曲函數(shù)的滑模趨近律組成,將z軸方向方程作為動力學(xué)方程,代入滑模面得到控制輸入,所提出基于學(xué)習(xí)速率的滑模曲面設(shè)計如下:
(17)
(18)
還有一點需要注意的是,多機器人編隊中各個機器人的通信依賴于網(wǎng)絡(luò),所以在實際控制中還需要考慮到網(wǎng)絡(luò)引起的時延、數(shù)據(jù)包丟失和數(shù)據(jù)包無序等通信約束.針對這一問題,Li等[73]提出了一種基于觀測器和二階離散自適應(yīng)滑模函數(shù)的魯棒自適應(yīng)滑??刂品椒ǎ粌H實現(xiàn)了滑動運動的可達(dá)性,還結(jié)合網(wǎng)絡(luò)預(yù)測控制法實現(xiàn)了對通信約束的補償.
總之,雖然魯棒自適應(yīng)滑??刂瓶蓪ο到y(tǒng)外部干擾進(jìn)行抑制并消除抖振問題,但實際上想要同時兼顧自適應(yīng)和魯棒性的最優(yōu)控制比較困難,這些問題還有待解決.
本文闡述了滑模變結(jié)構(gòu)控制的原理、發(fā)展起源以及存在的問題,然后將滑模變結(jié)構(gòu)控制與神經(jīng)網(wǎng)絡(luò)控制、魯棒自適應(yīng)控制、模糊控制等先進(jìn)智能控制方法相結(jié)合,分析了這些常規(guī)滑模控制與智能滑??刂撇呗栽诙鄼C器人協(xié)同控制中的應(yīng)用現(xiàn)狀,并對以上各種方法進(jìn)行了總結(jié).
根據(jù)對已有研究成果的論述分析,下面對該研究領(lǐng)域的未來進(jìn)行展望.多機器人協(xié)同控制系統(tǒng)是一門集計算機信息、通信技術(shù)、自動控制以及人工智能的復(fù)雜學(xué)科,代表了當(dāng)今科技領(lǐng)域的前沿,對多機器人協(xié)同控制的研究是潮流所趨,其價值已得到學(xué)界的廣泛認(rèn)同.同時,基于SMC的多機器人協(xié)同編隊控制研究,雖然已取得不少成果,但在復(fù)雜的實際工程應(yīng)用中,仍存在以下幾方面的問題有待探索:
首先,在網(wǎng)絡(luò)化多機器人集群編隊控制中,其后期的主要問題是網(wǎng)絡(luò)問題,攜帶多種傳感器、控制器、執(zhí)行器的agent之間的信息交互主要依賴于良好的通信網(wǎng)絡(luò),以此構(gòu)成一個反饋控制系統(tǒng).然而,在實際中網(wǎng)絡(luò)由于自身原因以及受到外界環(huán)境的干擾,存在通信延遲、數(shù)據(jù)丟包、數(shù)據(jù)包混亂等問題,因此,采用連續(xù)時間滑??刂频姆椒ú磺袑嶋H,而離散時間滑??刂?Discrete Time Sliding Mode Control,DSMC)控制與連續(xù)時間滑??刂葡到y(tǒng)不同,DSMC具有不變性,能夠?qū)Σ环€(wěn)定的通信信號進(jìn)行優(yōu)化.目前,關(guān)于SMC在離散時間系統(tǒng)的研究相對較少,所以基于DSM的多機器人協(xié)同編隊研究仍有很大潛力待挖掘.
其次,人工智能與控制學(xué)科的交叉本就是一個艱巨的任務(wù),人工智能相關(guān)算法的更新迭代速度很快,基于神經(jīng)網(wǎng)絡(luò)滑??刂频戎悄芑>庩牽刂频乃惴ㄔ谑諗啃院头€(wěn)定性方面仍有提高空間,特別是DRL與SMC的結(jié)合在解決典型非線性多機器人協(xié)同控制問題上具有良好的效果,但相關(guān)研究仍處于起步階段.因此,如何更合適地利用深度神經(jīng)網(wǎng)絡(luò)與滑模變結(jié)構(gòu)控制,也是多機器人協(xié)同編隊控制領(lǐng)域未來的研究熱點和重點突破方向.
此外,伴隨社會和科技的發(fā)展,將來必然會出現(xiàn)集群規(guī)模更龐大,人機共融的異構(gòu)多機器人協(xié)同進(jìn)行作業(yè),來完成更加復(fù)雜的任務(wù).其中,共融機器人是未來機器人發(fā)展的必然趨勢,也是“中國制造2025”計劃的核心.共融機器人是指能與作業(yè)環(huán)境、人和其他機器人自然交互、自主適應(yīng)復(fù)雜動態(tài)環(huán)境并協(xié)同作業(yè)的機器人.要實現(xiàn)大規(guī)模、異構(gòu)多機器人的共融,這對于控制系統(tǒng)的性能要求更高,對于從事SMC和多機器人控制等相關(guān)研究的學(xué)者來說,也是一個巨大的挑戰(zhàn).正因如此,我們才需要進(jìn)一步探索能夠滿足大規(guī)模、智能化、多類型異構(gòu)的機器人群體協(xié)同控制策略.