葛丹桐,朱圣英
(1.北京理工大學 深空探測技術(shù)研究所,北京 100081;2.深空自主導航與控制工信部重點實驗室,北京 100081;3.飛行器動力學與控制教育部重點實驗室,北京 100081)
小行星具有極高的科學探索價值,通過研究與探索小行星,人類可進一步開發(fā)與利用太空資源,發(fā)展并驗證小行星防御技術(shù)。近兩年,日本“隼鳥2號”(Hayabusa 2)與美國“奧西里斯–雷克斯”(Origins Spectral Interpretation Resource Identification Security Regolith Explorer,OSIRIS-REx)任務分別對一顆C類小行星與一顆B類小行星開展了采樣返回探測[1-2]。其中Hayabusa 2已完成對小行星“龍宮”(Ryugu)的采樣任務,并于2020年底將樣品送回地球;OSIRIS-REx于2020年10月在小行星“貝努”( Bennu)表面實現(xiàn)首次附著采樣,目前正在返回地球途中。
在小行星探測任務中,目標形貌復雜多樣,表面碎石、陡坡、凸包、隕石坑等障礙對探測器附著安全帶來挑戰(zhàn)[3-5]。同時,受動力學建模誤差、星上導航控制誤差以及太陽輻射、第三天體引力等環(huán)境擾動影響,探測器狀態(tài)存在不確定性[6-7]。在日本的“隼鳥號”(Hayabusa)任務中,當探測器第一次嘗試在目標小行星表面附著時,在其附近檢測到未知障礙并發(fā)出緊急上升指令,而由于存在較大姿態(tài)測量誤差,該指令并未執(zhí)行,導致探測器在目標表面發(fā)生了多次彈跳[8],對任務安全構(gòu)成了威脅。因此,為了實現(xiàn)探測器在復雜形貌環(huán)境中的安全附著,有必要針對附著環(huán)境與探測器狀態(tài)不確定下的軌跡規(guī)劃方法展開研究,通過動態(tài)評估碰撞威脅并實時調(diào)整下降軌跡,提高小行星附著任務安全性。
現(xiàn)有研究中,常將軌跡規(guī)劃問題轉(zhuǎn)化為最優(yōu)控制問題求解[9-10]。然而受星上計算能力制約,最優(yōu)軌跡一般需提前在地面計算與存儲,并在實際下降過程中采用比例積分微分(Proportional Integral Derivative,PID)控制、滑??刂?、自適應控制等方法[11-12]對標稱軌跡進行跟蹤,驅(qū)動探測器到達目標著陸點附近。此類方法缺乏一定靈活性,難以根據(jù)環(huán)境實時檢測結(jié)果對下降軌跡進行調(diào)整,且一旦實際動力學建模誤差與環(huán)境干擾超出預期,系統(tǒng)狀態(tài)有違背約束的風險[13],從而可能導致任務失敗。
針對動態(tài)環(huán)境中的路徑規(guī)劃問題,文獻[14]在經(jīng)典A*算法基礎上提出D*算法,即動態(tài)A*算法。在已有路徑點序列上,結(jié)合環(huán)境地圖變化更新局部代價函數(shù),并對局部路徑點進行重規(guī)劃,避免重新規(guī)劃整條路徑占用過多星上資源,提高規(guī)劃效率。隨后,進一步發(fā)展出LPA*、D* Lite、D*PO等算法[15-16],其中D*PO算法引入多目標優(yōu)化理論,通過求解帕累托最優(yōu)路徑點,可實現(xiàn)多優(yōu)化目標下的路徑動態(tài)規(guī)劃。然而,與地面機器人路徑規(guī)劃相比,小行星附著任務中探測器運動受動力學、推力幅值、下降速度、末端狀態(tài)等約束[17-19],且在環(huán)境擾動與狀態(tài)不確定性的共同影響下,探測器實際下降過程難以嚴格按照預設軌跡運動[20]。為了避免跟蹤過程中探測器違背工程約束,需要在規(guī)劃軌跡時考慮狀態(tài)與環(huán)境的不確定性影響,設計可安全跟蹤的路徑點序列。
基于以上問題,本文針對小行星復雜形貌附著軌跡動態(tài)規(guī)劃方法展開研究,旨在構(gòu)建小行星附著多目標最優(yōu)路徑點序列,基于標稱軌跡與實時檢測環(huán)境障礙的沖突預判,形成形貌自適應的附著軌跡動態(tài)規(guī)劃方法,提高探測器在小行星復雜形貌環(huán)境附著的安全性。
在小行星質(zhì)心固連系下建立探測器動力學方程
其中:r為探測器位置;v為探測器速度;ω為小行星自旋角速度;g(r)為探測器在r處所受的引力加速度,其值由多面體引力場模型給出[21];u為控制量;ap為探測器所受的太陽光壓、第三體引力等環(huán)境擾動。
基于狀態(tài)反饋,以上方程可在當前狀態(tài)附近線性化為
本文所提出的形貌自適應附著軌跡動態(tài)規(guī)劃方法由3部分構(gòu)成——初始最優(yōu)路徑點規(guī)劃、碰撞威脅評估與局部路徑點重規(guī)劃,算法結(jié)構(gòu)如圖1所示。
圖1 算法結(jié)構(gòu)Fig.1 Structure of the algorithm
算法包含以下步驟:
1)將位置空間離散成網(wǎng)格。結(jié)合實時導航獲取的探測器狀態(tài)估計結(jié)果,計算位置誤差橢球為[22]
其中:μr為位置估計均值;Dr為位置估計協(xié)方差矩陣;Cr為特征根構(gòu)成的對角矩陣;UE為著陸點固連坐標系到誤差橢球坐標系的轉(zhuǎn)換矩陣。記位置誤差橢球半長軸長度為aE,則網(wǎng)格邊長應滿足l≥aE。
2)附著過程初始時刻t0,基于初始時刻環(huán)境地圖障礙集合O0,規(guī)劃探測器從初始位置rO到著陸點rf的帕累托最優(yōu)路徑點序列W?。
3)附著過程中更新障礙集合Ok,基于探測器當前狀態(tài)x(k)、初始最優(yōu)路徑點序列W?,評估是否存在碰撞威脅。若無碰撞威脅,繼續(xù)步驟4);若存在碰撞威脅,跳到步驟6)。
4)結(jié)合探測器當前狀態(tài)x(k),跟蹤初始最優(yōu)路徑點序列W?的下一路徑點。
小行星附著過程初始時刻,假設所有未知區(qū)域為無障礙空間,將與障礙重合的網(wǎng)格標記為禁飛區(qū),剩余網(wǎng)格視為安全區(qū),網(wǎng)格的中心點集合構(gòu)成路徑點解空間。在搜索路徑點時,從初始位置rO開始,依次考慮當前節(jié)點相鄰3n?1節(jié)點,其中n為維數(shù),將位于安全區(qū)的節(jié)點放入OPEN表中。結(jié)合小行星附著任務能耗、著陸精度、障礙規(guī)避3個方面的任務需求,設計以下目標函數(shù)。
代價目標函數(shù)c1(wi)用于估計探測器從初始位置w0轉(zhuǎn)移到節(jié)點wi的代價,其值等于從初始位置w0到達上一節(jié)點wi?1的轉(zhuǎn)移代價與從節(jié)點wi?1到達節(jié)點wi的轉(zhuǎn)移代價之和
在初始位置時c1(w0)=0。從安全節(jié)點wi?1到達安全節(jié)點wi的轉(zhuǎn)移代價?c1(wi?1,wi)由兩節(jié)點之間距離矢量的?!琩(wi?1,wi)‖與探測器運動方向共同決定
對于禁飛區(qū)節(jié)點,進入或從禁飛區(qū)網(wǎng)格出來的轉(zhuǎn)移代價記為+∞。著陸點目標函數(shù)c2(wi)作為啟發(fā)式函數(shù),通過計算節(jié)點與著陸點間的直線距離
確定不同節(jié)點在搜索過程中的優(yōu)先級,提高路徑規(guī)劃效率。風險評估目標函數(shù)c3(wi)用于評估探測器轉(zhuǎn)移至節(jié)點wi的過程中,在狀態(tài)不確定性影響下與最近障礙發(fā)生碰撞的概率。受下降過程中動力學建模誤差、導航誤差、執(zhí)行誤差等因素影響,探測器的實際運動軌跡可能偏離路徑點連線,使得路徑規(guī)劃階段滿足要求的軌跡在附著跟蹤過程中超出任務約束。假設軌跡跟蹤最大偏移量為δ,定義風險評估目標函數(shù)c3(wi)為
其中:wh為障礙集合O0中的節(jié)點。
節(jié)點wi距離wh越近,探測器與障礙碰撞概率越高,風險評估目標函數(shù)c3(wi)取值越大。通過在風險評估目標函數(shù)中引入冗余量δ,可在搜索路徑點時避免選取禁飛區(qū)相鄰節(jié)點,使得探測器即使在最大跟蹤誤差下,仍能與障礙保持安全距離。
附著過程中,探測器通過星上敏感器如相機、激光雷達等對測量范圍內(nèi)的碎石、陡坡、凸包、隕石坑等障礙進行檢測[13]。為了提高附著安全性,除了考慮探測器在狀態(tài)不確定條件下的障礙碰撞概率,還需對星上新檢測到的環(huán)境障礙與初始最優(yōu)路徑點序列W?間是否存在沖突進行實時評估。
第2節(jié)給出標稱情況下探測器附著的多目標最優(yōu)路徑點序列,并在環(huán)境與軌跡存在沖突時,局部調(diào)整路徑點實現(xiàn)障礙規(guī)避。而在實際附著過程中,探測器還需要對規(guī)劃得到的路徑點序列進行實時跟蹤,生成滿足系統(tǒng)動力學的安全附著軌跡。
在現(xiàn)有跟蹤控制方法中,模型預測控制[23-24]根據(jù)系統(tǒng)最新狀態(tài),通過在有限時域上反復求解最優(yōu)控制問題,在降低優(yōu)化問題求解難度的同時,提高了多約束下系統(tǒng)跟蹤性能。本節(jié)基于模型預測控制方法構(gòu)造路徑點跟蹤控制律,通過考慮動力學方程環(huán)境擾動與模型線性化導致的有界建模誤差,實現(xiàn)對所規(guī)劃路徑點序列的實時魯棒跟蹤。
具體來說,在探測器跟蹤路徑點序列向著陸點運動過程中,結(jié)合探測器動力學方程與實時狀態(tài)更新,采用模型預測控制方法構(gòu)造路徑點跟蹤優(yōu)化性能指標,通過對探測器控制量進行優(yōu)化,生成動力學建模誤差下的路徑點序列跟蹤軌跡。
其中:Nf為有限時域長度;k為當前有限時域的第k步;Q,R為地面提前選定的正定矩陣,為保證優(yōu)化結(jié)果收斂性,矩陣 P通過求解里卡蒂方程得到
圖2 仿真地形與初始最優(yōu)路徑點序列Fig.2 Simulated terrain model and the initial optimal waypoint sequence
圖3 X-Z平面內(nèi)的初始最優(yōu)路徑點序列Fig.3 The Pareto optimal waypoint sequence on the X-Z plane
圖4 實際跟蹤軌跡在X-Z平面投影Fig.4 The projection of the landing trajectory on the X-Z plane
圖5 探測器位置與速度在X軸和Z軸的變化Fig.5 Positions and velocities of the spacecraft on X and Z axes
圖6 X-Z平面內(nèi)的重規(guī)劃路徑點序列Fig.6 The re-planning waypoint sequence on the X-Z plane
本文結(jié)合小行星探測器狀態(tài)不確定性與實時障礙檢測結(jié)果,對復雜形貌小行星附著軌跡動態(tài)規(guī)劃方法展開研究。在多目標優(yōu)化理論基礎上,考慮附著過程工程約束,通過魯棒跟蹤最優(yōu)路徑點序列并局部重規(guī)劃沖突路徑點,得到對小行星復雜形貌環(huán)境具有自適應能力的軌跡動態(tài)規(guī)劃方法。仿真結(jié)果表明該算法可生成與環(huán)境相匹配的安全附著軌跡,并在新障礙出現(xiàn)時,通過調(diào)整最少路徑點對障礙進行有效規(guī)避。