焦金彥+薛建平+董新民+劉嬌龍
摘 要: 針對(duì)反推控制方法在四旋翼飛行器軌跡跟蹤中存在動(dòng)態(tài)誤差的問題,提出改善軌跡跟蹤性能的間接迭代學(xué)習(xí)控制算法。首先將飛行器分為姿態(tài)和高度全驅(qū)動(dòng)控制通道和水平軌跡欠驅(qū)動(dòng)控制通道;然后基于反推控制方法分別設(shè)計(jì)了全驅(qū)動(dòng)和欠驅(qū)動(dòng)通道的穩(wěn)定控制器,進(jìn)而采用PID型迭代學(xué)習(xí)算法對(duì)反推控制器參考輸入信號(hào)進(jìn)行更新優(yōu)化;最后,采用壓縮映射原理和[λ]范數(shù)理論證明了算法的收斂性。仿真實(shí)驗(yàn)結(jié)果表明,PID型迭代學(xué)習(xí)律能夠有效改善反推控制器的控制效果,實(shí)現(xiàn)對(duì)期望軌跡的完全跟蹤。
關(guān)鍵詞: 四旋翼飛行器; 反推控制; 迭代學(xué)習(xí)控制; 姿態(tài)控制; 軌跡跟蹤
中圖分類號(hào): TN876?34; TP273 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2017)23?0113?06
Abstract: The backstepping control method has dynamic error in the trajectory tracking of the quadrotors, so an indirect iterative learning control (ILC) algorithm is proposed to improve the performance of trajectory tracking. The control of the aircraft involves the attitude and height full?drive control channel, and horizontal trajectory underdrive control channel. A stable controller of the full?drive and underdrive control channels was designed on the basis of backstepping control method. The PID iterative learning algorithm is used to perform the update optimization for the reference input signal of the backstepping controller. The contracting mapping principle and λ?norm theory are adopted to verify the convergence of the algorithm. The simulation results show that the PID iterative learning law can improve the control effect of the backstepping controller effectively, and realize the full tracking for the expected trajectory.
Keywords: quadrotor; backstepping control; iterative learning control; attitude control; trajectory tracking
0 引 言
四旋翼飛行器具有簡易靈活、體積小、穩(wěn)定性高等特點(diǎn),廣泛應(yīng)用于航拍、救援、貨物投送等領(lǐng)域,適合于室內(nèi)和城市飛行,同時(shí)也是開展科學(xué)實(shí)驗(yàn)的良好平臺(tái)。因此,得到了廣泛關(guān)注和研究。
目前關(guān)于四旋翼飛行器的控制方法主要有反推控制[1]、PID控制[2]、LQR控制[3]、滑模控制[4]等,這些方法都可以實(shí)現(xiàn)四旋翼無人飛行器的姿態(tài)控制與軌跡跟蹤控制。當(dāng)飛行器進(jìn)行固定軌跡或周期運(yùn)動(dòng)時(shí),比如,在執(zhí)行輸電線路巡檢[5]、公路巡查、快遞投送的任務(wù)時(shí),雖然上述控制律均可實(shí)現(xiàn)飛行器的穩(wěn)定與控制,但也存在瞬態(tài)響應(yīng)過程跟蹤誤差較大的問題。因此,如何使得四旋翼飛行器能夠精確跟蹤預(yù)定軌跡是本文研究的主要內(nèi)容。
迭代學(xué)習(xí)控制(ILC)思想最早是由日本學(xué)者Uchiyama提出[6],但直到1984年Arimoto等人提出D型學(xué)習(xí)算法并證明其收斂性[7],才開啟了迭代學(xué)習(xí)控制的研究熱潮。迭代學(xué)習(xí)控制主要針對(duì)具有固定運(yùn)動(dòng)軌跡特點(diǎn)的對(duì)象,通過不斷地重復(fù)同一動(dòng)作或過程,不斷修正控制輸入,最終實(shí)現(xiàn)期望的控制目標(biāo)。隨著研究的深入,迭代學(xué)習(xí)控制應(yīng)用領(lǐng)域越來越廣泛,如拋射體控制[8]、列車控制[9]、機(jī)器人控制[10]、間歇式過程控制[11]等。
目前,基于迭代學(xué)習(xí)控制方法的四旋翼飛行器軌跡跟蹤控制已引起了學(xué)者的關(guān)注和研究。ETH Zurich團(tuán)隊(duì)利用高精度的實(shí)驗(yàn)平臺(tái)開展了一系列四旋翼飛行器自主飛行研究,提出了采用歷史數(shù)據(jù)優(yōu)化四旋翼飛行器軌跡控制精度的方法,通過設(shè)計(jì)干擾信號(hào)估計(jì)器估計(jì)系統(tǒng)干擾,并采用優(yōu)化性能函數(shù)的方法設(shè)計(jì)控制律[12];文獻(xiàn)[13]提出了四旋翼飛行器的在線迭代學(xué)習(xí)控制,基于直接型PD學(xué)習(xí)算法設(shè)計(jì)更新律,有效提高了學(xué)習(xí)速度,并通過仿真實(shí)驗(yàn)探討了參數(shù)選擇對(duì)收斂速度的影響規(guī)律;文獻(xiàn)[14]提出了PID控制與迭代學(xué)習(xí)控制相結(jié)合的四旋翼飛行器控制方法,并基于線性離散模型和堆積方法(lifted technique)分析設(shè)計(jì)控制律,取得了較高的控制精度。
以上研究表明,迭代學(xué)習(xí)控制方法對(duì)于提高四旋翼飛行器軌跡跟蹤精度效果明顯,然而上述算法基本都是基于線性模型展開研究,算法僅在工作點(diǎn)附近有效;另外,文獻(xiàn)[13]研究的是直接型學(xué)習(xí)控制律,在學(xué)習(xí)初始時(shí)刻,軌跡跟蹤誤差比較大:一方面是由于選取的初始控制輸入不合適;另一方面是因?yàn)橹苯有虸LC算法沒有鎮(zhèn)定回路。
為解決上述問題,本文研究如何基于間接型ILC算法設(shè)計(jì)四旋翼的姿態(tài)與軌跡跟蹤控制器,實(shí)現(xiàn)對(duì)期望軌跡的高精度控制?;舅悸肥窃诜赐瓶刂破鞯耐獠吭黾右粋€(gè)ILC迭代修正回路,用于修正內(nèi)部反推控制器的參考輸入指令,從而提高反推控制方法的控制精度。該方法不會(huì)改變現(xiàn)有的控制器結(jié)構(gòu),僅僅增加了一個(gè)前饋修正回路,既不影響飛行器的穩(wěn)定性,又能提高軌跡跟蹤的精度。endprint
1 四旋翼飛行器模型
四旋翼飛行器依靠四個(gè)旋翼產(chǎn)生升力和力矩,從而實(shí)現(xiàn)升降、偏航、滾轉(zhuǎn)、俯仰、側(cè)向和橫向的運(yùn)動(dòng),按照其運(yùn)動(dòng)的方式可以分為“+”型和“×”型,本文基于“+”型結(jié)構(gòu)的四旋翼飛行器進(jìn)行研究。
2 控制器設(shè)計(jì)
傳統(tǒng)的反推控制器基本能夠?qū)崿F(xiàn)四旋翼飛行器的軌跡跟蹤任務(wù),但存在相角滯后、時(shí)間延遲等因素制約控制精度,因此,本文主要研究如何基于ILC方法改善四旋翼飛行器反推控制器的軌跡跟蹤精度?;舅悸窞椋阂苑赐瓶刂品椒ㄔO(shè)計(jì)四旋翼飛行器的姿態(tài)與軌跡跟蹤控制律,實(shí)現(xiàn)基本的穩(wěn)定控制;其次,設(shè)計(jì)外環(huán)迭代更新回路以修正反推控制器的輸入?yún)⒖贾礫Us,k,]經(jīng)過多次迭代學(xué)習(xí)更新,尋找到合適的反推控制器輸入指令,從而實(shí)現(xiàn)對(duì)期望軌跡的完全跟蹤??刂破骰窘Y(jié)構(gòu)如圖1所示。
2.1 內(nèi)環(huán)反推控制器設(shè)計(jì)
四旋翼飛行器具有欠驅(qū)動(dòng)性,主要表現(xiàn)在水平位移無法通過輸入直接進(jìn)行控制,必須通過控制滾轉(zhuǎn)和俯仰運(yùn)動(dòng)間接實(shí)現(xiàn),而飛行器的偏航、升降、滾轉(zhuǎn)、俯仰運(yùn)動(dòng)可以通過輸入直接進(jìn)行控制,因此可以將反推控制器分為欠驅(qū)動(dòng)通道和全驅(qū)動(dòng)通道進(jìn)行設(shè)計(jì)。
式(18)即為水平軌跡跟蹤時(shí),所對(duì)應(yīng)的內(nèi)環(huán)反推控制器的期望滾轉(zhuǎn)角[φ]和期望俯仰角[θ]。通過以上設(shè)計(jì)即可由水平軌跡的期望值得到與之對(duì)應(yīng)的期望姿態(tài)角信號(hào),結(jié)合全驅(qū)動(dòng)通道的姿態(tài)穩(wěn)定與跟蹤控制器,即可完成對(duì)期望水平軌跡的跟蹤控制任務(wù)。
2.2 外環(huán)ILC控制器設(shè)計(jì)
在2.1節(jié)中設(shè)計(jì)了基于反推控制方法的四旋翼飛行器姿態(tài)與軌跡控制器,并基于Lyapunov穩(wěn)定性理論分析了算法的穩(wěn)定性。前人研究表明,反推控制在四旋翼飛行器軌跡跟蹤控制中雖然可以完成對(duì)目標(biāo)軌跡的跟蹤任務(wù),但同時(shí)也存在輸出位置響應(yīng)相角滯后、超調(diào)等現(xiàn)象。接下來將研究設(shè)計(jì)基于ILC方法的更新律,對(duì)反推控制精度進(jìn)行改善,首先建立反推控制下的四旋翼飛行器閉環(huán)數(shù)學(xué)模型,而后采用ILC方法設(shè)計(jì)外部迭代修正回路,通過采用歷史數(shù)據(jù)修正內(nèi)部反饋控制的偏航角和三軸位置的參考信號(hào),提高飛行器軌跡跟蹤精度,改善控制效果,最終實(shí)現(xiàn)運(yùn)動(dòng)周期上軌跡的完全跟蹤。
2.2.1 閉環(huán)系統(tǒng)建模
將反推控制律式(9)~式(12)以及水平軌跡控制律式(15)~式(18)代入到四旋翼飛行器數(shù)學(xué)模型式(3)和式(4)中,可以得到在反推控制作用下,系統(tǒng)閉環(huán)數(shù)學(xué)模型為式(19)所示的線性系統(tǒng)。
2.2.2 ILC控制器設(shè)計(jì)
對(duì)模型式(19)而言,輸出量即為四旋翼飛行器的偏航角和三軸位置,輸入量為期望的偏航角和三軸位置,在反推控制器作用下,該輸入指令會(huì)造成跟蹤誤差,因此需要對(duì)該輸入指令進(jìn)行修正,以實(shí)現(xiàn)對(duì)期望姿態(tài)角和三軸位置的完全跟蹤。本文采用PID型迭代學(xué)習(xí)更新律修正內(nèi)部反推控制器的輸入指令。
3 仿真與分析
為了驗(yàn)證上述算法的可行性和有效性,本節(jié)設(shè)計(jì)了數(shù)值仿真實(shí)驗(yàn),對(duì)算法的收斂性進(jìn)行驗(yàn)證。在仿真中,四旋翼飛行器在反推控制器和間接型ILC控制器控制時(shí)的偏航角及三軸位置期望值均相同,其中期望軌跡水平橫向位移為[y=cos t],水平縱向位移為[x=sin t,]豎向位移為[z=1-e-10t,]單位為m;期望的偏航角為[ψ=t,]單位為rad,仿真時(shí)間為0~6.28 s。沿三坐標(biāo)軸、三維空間軌跡跟蹤誤差分別定義為式(33)和式(34),式(33)中,“[?]”表示四個(gè)跟蹤量[x,][y,][z,][ψ]沿迭代軸誤差變化采用誤差函數(shù)的[L1]范數(shù)度量。
3.1 反推控制仿真與分析
四旋翼無人飛行器軌跡跟蹤的反推控制仿真結(jié)果如圖2所示。從圖中可以看出,反推控制器基本實(shí)現(xiàn)了對(duì)期望軌跡和偏航角的跟蹤控制,但也存在明顯的跟蹤誤差:對(duì)偏航角的控制存在0.6 rad左右的穩(wěn)態(tài)誤差;對(duì)高度[z]的跟蹤有較大的時(shí)間延遲,并且存在超調(diào)現(xiàn)象;水平軌跡的跟蹤也存在明顯的穩(wěn)態(tài)誤差,接近0.2 m。
3.2 間接型ILC仿真與分析
圖3是在反推控制器基礎(chǔ)上引入外環(huán)間接型ILC的仿真圖。圖3(a)中[k=d]藍(lán)色曲線為期望軌跡,其余3條曲線分別為迭代第1次、第5次、第10次的仿真結(jié)果。從仿真圖可以看到,隨著ILC外環(huán)修正回路對(duì)參考值的不斷修正,飛行器逐漸跟蹤上了期望的偏航角與軌跡,三軸位置誤差也隨之減小。圖3(b)是偏航角控制的穩(wěn)態(tài)誤差在10次迭代過程中的變化情況,在經(jīng)過1次學(xué)習(xí)后,即[k=2]時(shí),誤差明顯減小,而后逐漸減小至0 rad。圖3(c)是三軸位置跟蹤誤差隨迭代次數(shù)的變化規(guī)律,可以看到三軸位置跟蹤誤差在ILC學(xué)習(xí)律作用下迅速減小,在經(jīng)過6次學(xué)習(xí)后跟蹤誤差已經(jīng)趨于0。
4 結(jié) 語
本文主要完成了四旋翼無人飛行器的間接型迭代學(xué)習(xí)軌跡跟蹤控制器設(shè)計(jì),控制器由內(nèi)部反推控制器和外部迭代修正控制器兩部分構(gòu)成。首先設(shè)計(jì)了四旋翼欠驅(qū)動(dòng)通道和全驅(qū)動(dòng)通道的反推控制器,并基于Lyapunov穩(wěn)定性理論分析算法穩(wěn)定性;其次設(shè)計(jì)了外部迭代更新算法,更新內(nèi)部反推控制器的參考輸入,并基于壓縮映射原理和[λ]范數(shù)理論證明了算法的收斂性。為驗(yàn)證算法的有效性,設(shè)計(jì)了數(shù)值仿真實(shí)驗(yàn),仿真結(jié)果表明,迭代算法對(duì)反推控制器的控制效果具有顯著改善作用,可以有效解決反推控制律在四旋翼飛行器軌跡控制中存在相位滯后和瞬態(tài)響應(yīng)誤差較大的問題。本文是基于零初始狀態(tài)誤差設(shè)計(jì)的迭代更新律,由于實(shí)際環(huán)境下會(huì)存在初始位置誤差、系統(tǒng)建模誤差、外界擾動(dòng)等因素,這些都有可能造成算法失效,因此下一步需要對(duì)算法的魯棒性做進(jìn)一步深入研究。
參考文獻(xiàn)
[1] 田聰玲.基于反步法的四旋翼飛行器非線性控制[D].哈爾濱:哈爾濱工業(yè)大學(xué),2014.
[2] DONG W, GU G Y, ZHU X Y, et al. Development of a quadrotor test bed?modelling, parameter identification, controller design and trajectory generation [J]. International journal of advanced robotic systems, 2015, 12: 1?14.endprint
[3] HOW J P, BETHKE B, FRANK A, et al. Real?time indoor autonomous vehicle test environment [J]. IEEE control systems magazine, 2008, 28(2): 51?64.
[4] DERAFA L, BENALLEGUE A, FRIDMAN L. Super twisting control algorithm for the attitude tracking of a four rotors UAV [J]. Journal of the Franklin institute?engineering and applied mathematics, 2012, 349(2): 685?699.
[5] 趙晨,杜勇.四旋翼無人機(jī)在輸電線路巡視中的應(yīng)用[J].湖北電力,2012,36(6):35?36.
[6] UCHIYAMA M. Formation of high?speed motion pattern of mechanical arm by trial [J]. Transactions of the society of instrumentation and control engineers, 1978, 19(5): 706?712.
[7] ARIMOTO S, KAWAMURA S, MIYAZAKI F. Bettering operation of robots by learning [J]. Journal of robotic systems, 1984, 1(2): 123?140.
[8] LIU Jiaolong, DONG Xinmin, XUE Jianping, et al. Initial states iterative learning for three?dimensional ballistic endpoint control [J]. Memetic computing, 2017, 9(1): 1?11.
[9] LIU Jiaolong, DONG Xinmin, XUE Jianping, et al. Spatial iterative learning control for motion systems with state?dependent parametric uncertainties [C]// Proceedings of the 35th Chinese Control Conference. Chengdu, China: IEEE, 2016: 3157?3161.
[10] BONDI P, CASALINO G, GAMBARDELLA L. On the iterative earning control theory for robotic manipulators [J]. Journal of robotics and automation, 1988, 4(1): 14?22.
[11] 賈立,施繼平,邱銘森.一種間歇過程產(chǎn)品質(zhì)量迭代學(xué)習(xí)控制策略[J].化工學(xué)報(bào),2009,60(8):35?40.
[12] SCHOELLIG A P. Improving tracking performance by lear?ning from past data [D]. Zurich, Switzerland: ETH Zurich, 2012.
[13] PIPATPAIBUL P, OUYANG P R. Application of online iterative learning tracking control for quadrotor UAVs [J]. ISRN robotics, 2013(4): 1?20.
[14] MA Zhaowei, HU Tianjiang, SHEN Lincheng, et al. An iterative learning controller for quadrotor UAV path following at a constant altitude [C]// Proceedings of the 34th Chinese Control Conference. Hangzhou, China: IEEE, 2015: 4406?4411.
[15] 楊立本,章衛(wèi)國,黃得剛.基于ADRC姿態(tài)解耦的四旋翼飛行器魯棒軌跡跟蹤[J].北京航空航天大學(xué)學(xué)報(bào),2015,41(6):1026?1033.endprint