劉付成,韓 飛,孫 玥,武海雷,曹姝清
(1.上海航天技術(shù)研究院,上海 201109;2.上海航天控制技術(shù)研究所,上海 201109;3.上海市空間智能控制技術(shù)重點(diǎn)實(shí)驗(yàn)室,上海 201109)
高價(jià)值航天器對(duì)國(guó)民經(jīng)濟(jì)和國(guó)家安全發(fā)揮日益重大的戰(zhàn)略作用,一旦發(fā)生不可在軌自主恢復(fù)的故障,如:燃料耗盡,電源、控制等分系統(tǒng)故障,會(huì)對(duì)國(guó)家安全帶來戰(zhàn)略風(fēng)險(xiǎn),且經(jīng)濟(jì)損失巨大,嚴(yán)重限制空間資產(chǎn)的利用效率。對(duì)故障航天器實(shí)施在軌維修、延壽等任務(wù),可以使其長(zhǎng)期發(fā)揮業(yè)務(wù)功能。
由于空間活動(dòng)日益頻繁,空間碎片數(shù)量急劇增加,在軌衛(wèi)星的碰撞風(fēng)險(xiǎn)日益加劇,已發(fā)生了多起碎片碰撞導(dǎo)致衛(wèi)星損毀的事件。2009 年,美國(guó)銥星33 與俄羅斯宇宙2251 衛(wèi)星在軌碰撞,前者被摧毀,產(chǎn)生數(shù)千塊碎片。2022 年,美國(guó)Galaxy 11 同步軌道衛(wèi)星在軌發(fā)生部分解體,產(chǎn)生的碎片對(duì)其他衛(wèi)星構(gòu)成威脅。同時(shí)隨著星鏈等巨型星座的建設(shè),空間碎片環(huán)境更加惡化,2019 年,歐航局風(fēng)神衛(wèi)星與星鏈44 險(xiǎn)些發(fā)生碰撞,2021 年,一網(wǎng)0178 衛(wèi)星被迫實(shí)施了軌道機(jī)動(dòng)以避免與星鏈1546 碰撞。空間碎片嚴(yán)重威脅我國(guó)太空資產(chǎn)安全,對(duì)空間碎片實(shí)施在軌捕獲、清除等任務(wù),可以清理軌道資源、避免碰撞毀傷。
對(duì)故障航天器的在軌維修以及對(duì)空間碎片的在軌捕獲清除,都屬于在軌服務(wù)范疇。在軌服務(wù)是指,在地球軌道上對(duì)目標(biāo)航天器實(shí)施提供服務(wù),通過加注燃料、故障檢測(cè)維修、功能拓展等方式,延長(zhǎng)在軌航天器使用壽命,提升其執(zhí)行任務(wù)的能力;或通過剛性或柔性捕獲的手段對(duì)空間碎片進(jìn)行清除,維護(hù)空間資產(chǎn)安全。
本文首先對(duì)在軌服務(wù)航天器的發(fā)展現(xiàn)狀與趨勢(shì)進(jìn)行了分析,總結(jié)當(dāng)前研究熱點(diǎn)及未來的發(fā)展趨勢(shì),提出在軌服務(wù)的典型核心任務(wù)流程及能力需求。其次提出制導(dǎo)、導(dǎo)航與控制方向上的翻滾目標(biāo)超近立體視覺測(cè)量、翻滾目標(biāo)姿軌耦合逼近路徑規(guī)劃與控制、非合作目標(biāo)柔順捕獲控制、組合體穩(wěn)定控制四項(xiàng)關(guān)鍵技術(shù)難題,對(duì)關(guān)鍵技術(shù)的需求及具體內(nèi)涵進(jìn)行了闡述,并梳理總結(jié)四項(xiàng)關(guān)鍵技術(shù)的發(fā)展現(xiàn)狀及后續(xù)發(fā)展需求。最后對(duì)在軌服務(wù)航天器未來發(fā)展趨勢(shì)進(jìn)行了展望,以期為在軌服務(wù)航天器的后續(xù)研究提供參考。
國(guó)外航天大國(guó)早在上個(gè)世紀(jì)就已經(jīng)開展了多項(xiàng)在軌服務(wù)項(xiàng)目的驗(yàn)證。在軌服務(wù)任務(wù)的發(fā)展歷程如圖1所示。隨著在軌服務(wù)技術(shù)的不斷進(jìn)步,適用目標(biāo)逐步普適泛化,由合作穩(wěn)定目標(biāo)擴(kuò)展到非合作翻滾目標(biāo);操控任務(wù)逐漸復(fù)雜精細(xì),由最初的遠(yuǎn)距離接近到近距離伴飛、交會(huì),再到與目標(biāo)接觸的捕獲、延壽,后續(xù)將逐步開展維修、爬行、組裝等任務(wù)。此類非合作翻滾目標(biāo)的在軌服務(wù)仍面臨眾多技術(shù)挑戰(zhàn),是未來發(fā)展的重點(diǎn)。
圖1 在軌服務(wù)的發(fā)展歷程Fig.1 Development of on orbit service
2018 年9 月,英國(guó)薩里航天中心聯(lián)合歐洲多家研究機(jī)構(gòu)進(jìn)行了空間碎片捕獲實(shí)驗(yàn)“Remove Debris”,在軌釋放一顆人造目標(biāo)衛(wèi)星Cubesat,依次驗(yàn)證了飛網(wǎng)捕獲Cubesat 衛(wèi)星、魚叉捕獲、阻力帆離軌等空間碎片捕獲清除任務(wù),完成了針對(duì)合作目標(biāo)的測(cè)量與導(dǎo)航(圖像下傳地面處理)、飛網(wǎng)釋放捕獲(僅驗(yàn)證了飛網(wǎng)發(fā)射展開與目標(biāo)纏繞捕獲,無系繩拖曳機(jī)動(dòng))技術(shù)初步驗(yàn)證,如圖2 所示。
圖2 Remove Debris 碎片捕獲Fig.2 Debris capture of Remove Debris
2020 年2 月,美國(guó)諾斯羅普·格魯曼公司的任務(wù)擴(kuò)展衛(wèi)星(Mission Extension Satellite,MEV)MEV-1通過噴管對(duì)接捕獲了國(guó)際通訊衛(wèi)星Intelsat-901,并接管和控制了其姿態(tài)和軌道運(yùn)動(dòng),將其從墳?zāi)管壍缼Щ刂恋厍蜢o止軌道,如圖3 所示。2022 年4 月,MEV-2再次成功捕獲Intelsat-1002 衛(wèi)星。MEV 項(xiàng)目完成了針對(duì)非合作穩(wěn)定目標(biāo)的姿軌耦合逼近跟蹤、組合體接管控制等多項(xiàng)在軌服務(wù)GNC 技術(shù)的在軌驗(yàn)證。
圖3 MEV-1 任務(wù)過程Fig.3 MEV-1 task process
基于MEV 平臺(tái),結(jié)合FREND 計(jì)劃中研制的靈巧機(jī)械臂,美國(guó)正在研制任務(wù)機(jī)器人飛行器(Mission Robotic Vehicle,MRV),如圖4 所示,主要任務(wù)包括故障部位高分辨率檢視、帆板輔助解鎖展開、安裝附加有效載荷等,計(jì)劃2024 年開展在軌驗(yàn)證,預(yù)期驗(yàn)證非合作翻滾目標(biāo)姿軌耦合逼近跟蹤、組合體接管控制以及在軌精細(xì)操作控制等技術(shù)。
圖4 MRV 維修操作Fig.4 MRV maintenance operation
2016 年,美國(guó)DARPA 啟動(dòng)了“地球同步軌道衛(wèi)星機(jī)器人服務(wù)”(Robotic Servicing of Geosynchronous Satellites,RSGS)項(xiàng)目。服務(wù)航天器(Robotic Servicing Vehicle,RSV)主要任務(wù)包括對(duì)目標(biāo)故障部位的檢測(cè),太陽帆板、天線展開故障的維修,捕獲后的組合體拖曳離軌,為目標(biāo)安裝有效載荷,如圖5 所示。該任務(wù)計(jì)劃2024 年開展在軌驗(yàn)證,預(yù)期驗(yàn)證非合作旋轉(zhuǎn)目標(biāo)的精細(xì)操作及組合體拖曳等技術(shù)。
圖5 RSGS 操控任務(wù)過程Fig.5 RSGS task process
當(dāng)前在軌服務(wù)航天器的任務(wù)樣式多種多樣,但歸納總結(jié),其典型核心任務(wù)流程可以概括為:“追”、“看”、“跟””、“抓”、“維”五個(gè)基本步驟。
1、追,即為軌道間機(jī)動(dòng)與交會(huì),機(jī)動(dòng)到目標(biāo)同軌道前方/后方一定距離,形成穩(wěn)定伴飛。
2、看,包括伴飛、懸停、繞飛觀測(cè),全方位觀測(cè)目標(biāo),確定目標(biāo)運(yùn)動(dòng)狀態(tài)、可捕獲部位等。
3、跟,是指姿軌同步逼近與跟蹤,機(jī)動(dòng)到預(yù)定捕獲位置,維持捕獲所需相對(duì)姿態(tài)、位置狀態(tài)。
4、抓,是指目標(biāo)捕獲與穩(wěn)定,通過飛網(wǎng)、機(jī)械臂、仿生黏附各種捕獲裝置,建立服務(wù)航天器與目標(biāo)的穩(wěn)定連接關(guān)系。
5、維,是指目標(biāo)操作與維護(hù),通過各種操作與處置裝置,完成大型碎片的輔助離軌、故障衛(wèi)星的在軌維修、附著延壽,大型結(jié)構(gòu)的在軌組裝等既定任務(wù)。
在軌服務(wù)的五步核心任務(wù)流程對(duì)傳統(tǒng)航天器提出了五項(xiàng)能力要求?!白贰?,要求航天器具備軌道機(jī)動(dòng)與交會(huì)能力,經(jīng)過國(guó)內(nèi)相關(guān)型號(hào)的在軌驗(yàn)證,相關(guān)技術(shù)已經(jīng)相對(duì)成熟;“看”,要求航天器具備目標(biāo)觀測(cè)與導(dǎo)航能力,從距離目標(biāo)數(shù)十公里到厘米級(jí),測(cè)量翻滾目標(biāo)外形與運(yùn)動(dòng)狀態(tài)、相對(duì)運(yùn)動(dòng)狀態(tài)等信息;“跟”,要求航天器具備姿軌耦合逼近跟蹤能力,從距離目標(biāo)數(shù)十公里逐步逼近到數(shù)米處的預(yù)定位置并跟蹤;“抓”,要求航天器具備目標(biāo)捕獲能力,數(shù)十米外發(fā)射飛網(wǎng)/飛矛遠(yuǎn)距捕獲目標(biāo),或者利用機(jī)械臂/黏附捕獲裝置,完成預(yù)定部位抵近與剛性捕獲;“維”,要求航天器具備組合體接管與精細(xì)操作能力,對(duì)于柔性連接組合體,由服務(wù)星通過柔性系繩拖曳離軌,對(duì)于剛性連接組合體,由服務(wù)星接管姿態(tài)和軌道控制,利用末端操作裝置完成故障部位詳查檢測(cè)、桿件切割、螺釘旋擰與模塊更換等具體操作。典型核心任務(wù)流程與能力需求之間的關(guān)系如圖6 所示。
為支撐航天器具備上述五項(xiàng)能力,需突破翻滾目標(biāo)超近立體視覺測(cè)量、翻滾目標(biāo)姿軌耦合逼近路徑規(guī)劃與控制、非合作目標(biāo)柔順捕獲控制、組合體穩(wěn)定控制四項(xiàng)關(guān)鍵技術(shù)。
為實(shí)現(xiàn)非合作目標(biāo)的應(yīng)急救援和在軌清除,服務(wù)航天器要具備對(duì)復(fù)雜場(chǎng)下非合作目標(biāo)相對(duì)位姿測(cè)量能力,非合作目標(biāo)觀測(cè)與導(dǎo)航技術(shù)貫穿空間操控的整個(gè)任務(wù)過程。如圖7 所示,經(jīng)過多年發(fā)展,遠(yuǎn)距離乃至較近距離(數(shù)十公里到數(shù)十米)的相對(duì)測(cè)量與導(dǎo)航技術(shù)已經(jīng)發(fā)展較為成熟,可以采用光電跟瞄、微波雷達(dá)等相對(duì)測(cè)量手段,通過測(cè)量目標(biāo)的視線方向和視線距來確定點(diǎn)目標(biāo)的相對(duì)位置和速度信息。超近距離(數(shù)十米到米級(jí))時(shí),目標(biāo)從點(diǎn)目標(biāo)轉(zhuǎn)變?yōu)槊婺繕?biāo),不僅需要目標(biāo)的位置信息,還需要測(cè)量翻滾目標(biāo)外形與運(yùn)動(dòng)狀態(tài)等信息,通??梢圆捎昧Ⅲw視覺相機(jī)實(shí)現(xiàn)相對(duì)姿態(tài)角和角速度的測(cè)量。建立同步跟蹤狀態(tài)后,服務(wù)航天器開始實(shí)施抓捕時(shí),機(jī)械臂末端距離捕獲/操作部位從米級(jí)到厘米級(jí)過程中,需要利用手眼相機(jī)完成目標(biāo)捕獲/操作部位特征位置的狀態(tài)測(cè)量,引導(dǎo)捕獲/操作任務(wù)的實(shí)施。
圖7 目標(biāo)觀測(cè)與導(dǎo)航Fig.7 Observe and navigation
在上述任務(wù)過程中,翻滾目標(biāo)的超近距離立體視覺測(cè)量面臨大量難題,是當(dāng)前國(guó)內(nèi)外研究的熱點(diǎn)。失效衛(wèi)星在空間通常處于高動(dòng)態(tài)翻滾狀態(tài),存在較大的章動(dòng)和進(jìn)動(dòng)。由于高動(dòng)態(tài)翻滾會(huì)導(dǎo)致觀測(cè)面周期性進(jìn)出視場(chǎng)引起特征點(diǎn)丟失、尺度變化和旋轉(zhuǎn)變化,傳統(tǒng)相對(duì)測(cè)量與導(dǎo)航方法計(jì)算復(fù)雜,數(shù)據(jù)更新率低,無法滿足高動(dòng)態(tài)翻滾目標(biāo)的實(shí)時(shí)觀測(cè)與導(dǎo)航要求。因此亟需開展復(fù)雜光場(chǎng)高機(jī)動(dòng)非合作目標(biāo)的立體視覺測(cè)量技術(shù)研究,通過測(cè)量翻滾目標(biāo)運(yùn)動(dòng)狀態(tài)、相對(duì)運(yùn)動(dòng)姿態(tài)、整體外形及局部操作部位特征等信息,為后續(xù)逼近路徑規(guī)劃與抓捕控制律設(shè)計(jì)提供輸入。
在超近距離視覺導(dǎo)航過程中,空間非合作目標(biāo)的高動(dòng)態(tài)翻滾、高反射率表面材料、強(qiáng)太陽光照等因素,導(dǎo)致目標(biāo)特征觀測(cè)與跟蹤面臨強(qiáng)時(shí)變、強(qiáng)干擾下的特征易丟失問題,為此需要重點(diǎn)解決非合作翻滾目標(biāo)相對(duì)測(cè)量與狀態(tài)估計(jì)技術(shù)、非合作翻滾目標(biāo)形態(tài)重構(gòu)與局部精細(xì)感知兩方面問題,具備復(fù)雜光照條件下高動(dòng)態(tài)翻滾目標(biāo)特定部位的相對(duì)位姿測(cè)量能力。
(1)非合作翻滾目標(biāo)相對(duì)測(cè)量與狀態(tài)估計(jì)技術(shù)
非合作翻滾目標(biāo)相對(duì)測(cè)量與狀態(tài)估計(jì)包括基于特征、模型及深度學(xué)習(xí)的方法。
基于特征的相對(duì)測(cè)量包括基于二維圖像特征和三維點(diǎn)云特征的方法。二維圖像特征相對(duì)測(cè)量一般經(jīng)過特征提取、特征匹配、運(yùn)動(dòng)估計(jì)等過程,實(shí)現(xiàn)目標(biāo)的位姿解算。圖像特征可以是點(diǎn)和線/面兩類。第一類基于點(diǎn)特征的方法通常采用PnP 解算相對(duì)位姿。第二類是基于線/面的相對(duì)測(cè)量,該類方法需要利用目標(biāo)航天器的結(jié)構(gòu)信息?;谌S點(diǎn)云特征的相對(duì)位姿測(cè)量方法,采用三維點(diǎn)云分割方法對(duì)觀測(cè)到的點(diǎn)云進(jìn)行分割,基于點(diǎn)云的特征計(jì)算和匹配(如ICP 等),然后采用SVD 等實(shí)現(xiàn)目標(biāo)的位姿估計(jì),這類方法要求對(duì)點(diǎn)云數(shù)據(jù)的精確分割,這要求觀測(cè)的點(diǎn)云數(shù)據(jù)具有一定的采樣密度。
基于模型的相對(duì)測(cè)量需借助目標(biāo)結(jié)構(gòu)形狀或CAD 模型,依賴于目標(biāo)整體。結(jié)合目標(biāo)已知的三維模型信息,通過三維到二維投影映射配準(zhǔn)的方式,求解目標(biāo)的位姿。該方法需事先已知目標(biāo)的結(jié)構(gòu)形狀或CAD 模型,依賴于目標(biāo)整體,模型未知的情況下該方法失效。
基于深度學(xué)習(xí)的相對(duì)位姿測(cè)量方法,利用神經(jīng)網(wǎng)絡(luò)輔助實(shí)現(xiàn)對(duì)非合作航天器間的相對(duì)位姿的求解。楊興昊[1]采用ALexNet與ResNet相結(jié)合的端到端智能網(wǎng)絡(luò)架構(gòu),基于分類與回歸同步優(yōu)化策略動(dòng)態(tài)獲取非合作目標(biāo)的位姿信息,具有姿態(tài)估計(jì)誤差小的優(yōu)點(diǎn)。王立[2]基于神經(jīng)網(wǎng)絡(luò)完成對(duì)點(diǎn)云姿態(tài)特征的訓(xùn)練學(xué)習(xí),并估計(jì)目標(biāo)的相對(duì)位姿。
本研究團(tuán)隊(duì)采用基于模型的翻滾目標(biāo)特征閉環(huán)檢測(cè)與位姿圖優(yōu)化方法,解決空間復(fù)雜場(chǎng)下累積誤差大、位姿解算不收斂的難題,完成了基于多源信息融合與測(cè)量估計(jì)的地面集成實(shí)驗(yàn)驗(yàn)證,如圖8-9 所示。
圖8 基于帆板特征的位姿估計(jì)Fig.8 Pose estimation based on canvas features
(2)非合作目標(biāo)形態(tài)重構(gòu)與局部精細(xì)感知技術(shù)
非合作目標(biāo)形態(tài)重構(gòu)與局部精細(xì)感知技術(shù)主要包括傳統(tǒng)的SLAM 方法[3]和深度學(xué)習(xí)方法兩大類。
傳統(tǒng)的SLAM 方法采用先視覺重建后估計(jì)的方式。主要集中濾波設(shè)計(jì),模型和噪聲影響會(huì)加大測(cè)量誤差,甚至發(fā)散,存在計(jì)算速度較慢的問題。Schnitzer等[4]采用濾波與重建相結(jié)合的方法,提出改進(jìn)的SLAM 完成對(duì)非合作目標(biāo)狀態(tài)估計(jì),基于RANSAC重建目標(biāo)的三維模型,然后融合EKF 濾波動(dòng)態(tài)估計(jì)目標(biāo)位姿。該算法表面重建效果較佳,但實(shí)時(shí)性差。
深度學(xué)習(xí)方法[5]通過構(gòu)建衛(wèi)星模型樣本數(shù)據(jù)庫,結(jié)合目標(biāo)檢測(cè)與識(shí)別網(wǎng)絡(luò)完成目標(biāo)局部智能精細(xì)感知。李林澤等[6]在仿真環(huán)境中完成了基于改進(jìn)Mask RCNN 的空間衛(wèi)星智能識(shí)別。該方法基于目標(biāo)狀態(tài)感知數(shù)據(jù)庫訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,存在效率低、適應(yīng)性差的問題。
本研究團(tuán)隊(duì)采用基于深度學(xué)習(xí)的目標(biāo)典型部位精細(xì)感知方法,解決復(fù)雜光場(chǎng)下高機(jī)動(dòng)目標(biāo)感知精度差、泛化性弱的難題,完成了基于相對(duì)位姿測(cè)量系統(tǒng)的目標(biāo)在線智能識(shí)別試驗(yàn)驗(yàn)證,如圖10-11 所示。
圖10 非合作目標(biāo)形態(tài)重構(gòu)Fig.10 Reconstruction of non-cooperative target conformation
圖11 基于相對(duì)位姿測(cè)量系統(tǒng)的目標(biāo)在線智能識(shí)別Fig.11 Online intelligent recognition of target based on relative position and attitude measurement system
在航天器在軌維護(hù)、交會(huì)對(duì)接、在軌補(bǔ)加等任務(wù)中,為滿足精度、實(shí)時(shí)性、可靠性、自適應(yīng)性和安全性等要求,確保飛行器能夠精確地定位、交會(huì)和跟蹤目標(biāo),需開展自主交會(huì)與逼近跟蹤技術(shù)研究。及時(shí)響應(yīng)目標(biāo)的變化,并快速做出調(diào)整;在各種復(fù)雜環(huán)境下正常運(yùn)行,避免技術(shù)故障;應(yīng)對(duì)不同目標(biāo)、不同環(huán)境、不同任務(wù)等因素的影響,并能夠自主調(diào)整控制策略;確??罩酗w行器的自主控制不會(huì)對(duì)自身或其他目標(biāo)造成影響。
如圖12 所示,從數(shù)十公里到數(shù)十米,目標(biāo)可視為點(diǎn)目標(biāo),航天器可以采用多脈沖制導(dǎo)、視線制導(dǎo)等制導(dǎo)方法,視線跟蹤姿態(tài)控制、開環(huán)脈沖軌道控制等控制方法,完成對(duì)目標(biāo)的自主接近,工程上已經(jīng)實(shí)現(xiàn)應(yīng)用。數(shù)十米到數(shù)米近距離接近過程中,失效衛(wèi)星將不能再被當(dāng)作點(diǎn)質(zhì)量模型,失效目標(biāo)自身構(gòu)型復(fù)雜,而且在空間自由翻滾,追蹤航天器在接近對(duì)接口的過程中安全路徑是與結(jié)構(gòu)布局和接近時(shí)間多重因素相關(guān)的,安全逼近路徑是動(dòng)態(tài)時(shí)變軌跡,同時(shí)又要達(dá)到姿軌同步跟蹤的目的,因此翻滾目標(biāo)姿軌耦合逼近路徑規(guī)劃與控制是核心挑戰(zhàn)。
圖12 姿軌耦合逼近跟蹤Fig.12 Attitude and orbit coupling approach
近距自主逼近與跟蹤需要重點(diǎn)解決時(shí)變安全逼近路徑規(guī)劃、姿軌耦合逼近的路徑跟蹤控制兩方面問題。
(1)時(shí)變安全逼近路徑規(guī)劃技術(shù)
時(shí)變安全逼近軌跡規(guī)劃包括基于最優(yōu)控制、搜索、插值、采樣、學(xué)習(xí)等規(guī)劃方法。
最優(yōu)控制方法是將自主逼近問題視為求解最優(yōu)控制問題,將軌跡規(guī)劃轉(zhuǎn)化為求解控制參數(shù)的最優(yōu)值。Zhang[7]等人提出了一種基于連續(xù)凸化的引導(dǎo)算法,用于在多個(gè)路徑約束下生成燃料最優(yōu)的六自由度近距離航天器軌跡,路徑約束包括傳感器視野、避免碰撞和噴口撞擊,通過復(fù)合狀態(tài)觸發(fā)約束的方案嵌入到連續(xù)優(yōu)化框架中,通過對(duì)參考軌跡附近的非線性系統(tǒng)動(dòng)力學(xué)和約束函數(shù)進(jìn)行線性化和離散化,將原始的最優(yōu)引導(dǎo)問題轉(zhuǎn)化為一系列凸子問題,并通過凸規(guī)劃迭代求解。
搜索算法是將自主逼近問題轉(zhuǎn)化為狀態(tài)空間最優(yōu)軌跡的搜索問題,典型算法包括遺傳搜索算法、粒子群搜索算法、模擬退火搜索算法等。遺傳搜索算法通過模擬自然界中的生物進(jìn)化過程,使用交叉、變異等遺傳算子對(duì)自主逼近解空間進(jìn)行搜索,其適應(yīng)度函數(shù)選擇靈活,且能夠全局搜索,但缺點(diǎn)是計(jì)算復(fù)雜度較高。粒子群搜索算法是模仿鳥群覓食原理,通過在狀態(tài)解空間中進(jìn)行搜索獲得最優(yōu)解,該方法計(jì)算效率高,但易陷入局部最優(yōu)且難以得到精確最優(yōu)解。模擬退火搜索算法是基于金屬冶煉退火過程原理,通過在狀態(tài)解空間中進(jìn)行搜索獲得優(yōu)化解,該方法對(duì)初始值不敏感,能夠跳出局部最優(yōu)解,但算法收斂速度較慢?;谒阉鞯囊?guī)劃方法適用性廣、可擴(kuò)展性強(qiáng),但難以保證全局最優(yōu)解,需要合適的啟發(fā)函數(shù)和搜索策略。
插值方法是將自主逼近問題轉(zhuǎn)化為插值問題,通過插值方法構(gòu)造航跡,該方法簡(jiǎn)單易實(shí)現(xiàn)、計(jì)算量小,但需要事先預(yù)估目標(biāo)位置和速度信息,且精度較低。
采樣方法是利用隨機(jī)采樣生成大量軌跡候選集合,從中選擇最優(yōu)軌跡,如RRT、RRT*算法等。這類方法能夠處理復(fù)雜問題,可根據(jù)實(shí)際運(yùn)動(dòng)環(huán)境調(diào)整采樣點(diǎn)的密度,提高規(guī)劃方法的適用性;具備較快的計(jì)算速度,可應(yīng)用于多目標(biāo)問題,能夠通過權(quán)衡不同目標(biāo)來得到更優(yōu)的規(guī)劃結(jié)果?;诓蓸拥囊?guī)劃方法會(huì)增加運(yùn)動(dòng)噪聲導(dǎo)致軌跡規(guī)劃結(jié)果的不穩(wěn)定和不確定,易陷入局部最優(yōu),且由于采樣點(diǎn)密度和閾值等參數(shù)設(shè)定會(huì)影響規(guī)劃結(jié)果,對(duì)參數(shù)的選擇和調(diào)整非常敏感。
基于學(xué)習(xí)的規(guī)劃方法[8]是利用監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)或強(qiáng)化學(xué)習(xí)等機(jī)器學(xué)習(xí)技術(shù),通過對(duì)大量數(shù)據(jù)進(jìn)行學(xué)習(xí)和分析,生成適應(yīng)性強(qiáng)、高效穩(wěn)定的軌跡。典型算法包括決策樹、支持向量機(jī)(SVM)、神經(jīng)網(wǎng)絡(luò)、強(qiáng)化學(xué)習(xí)等。人工神經(jīng)網(wǎng)絡(luò)[9]是模擬人類大腦的學(xué)習(xí)和記憶機(jī)制,使用神經(jīng)元、權(quán)重等概念對(duì)解空間進(jìn)行搜索,能夠?qū)W習(xí)和自適應(yīng),對(duì)噪聲和非線性問題有較好的處理能力,缺點(diǎn)是訓(xùn)練時(shí)間較長(zhǎng),難以進(jìn)行解釋。強(qiáng)化學(xué)習(xí)可以自適應(yīng)地學(xué)習(xí)和優(yōu)化行為策略,適用于復(fù)雜決策任務(wù),通過與環(huán)境交互實(shí)時(shí)調(diào)整策略,具有較強(qiáng)的泛化能力。但缺點(diǎn)是訓(xùn)練需要大量實(shí)驗(yàn)和調(diào)參,且收斂速度較慢、訓(xùn)練時(shí)間較長(zhǎng)、對(duì)計(jì)算資源需求較高。
除了上述優(yōu)化方法外,還有線性規(guī)劃、非線性規(guī)劃、混合整數(shù)規(guī)劃、模型預(yù)測(cè)控制規(guī)劃等優(yōu)化方法。這些方法具有不同的優(yōu)缺點(diǎn),需要根據(jù)不同約束條件進(jìn)行選擇。例如,線性規(guī)劃適用于線性約束條件下的問題,具有較好的求解效率,但需要將問題轉(zhuǎn)化為標(biāo)準(zhǔn)線性規(guī)劃形式。
本研究團(tuán)隊(duì)針對(duì)慢旋目標(biāo)自主接近過程中多約束的最優(yōu)路徑規(guī)劃問題,采用基于虛擬域的逆動(dòng)力學(xué)方法,將慢旋目標(biāo)自主逼近和跟蹤的規(guī)劃問題轉(zhuǎn)化為求解滿足性能指標(biāo)和約束條件的最優(yōu)控制問題,其中性能指標(biāo)主要包括燃料最優(yōu)和時(shí)間最優(yōu),約束條件包括安全防撞約束、敏感器約束等方面,如圖13 所示。
圖13 基于虛擬域逆動(dòng)力學(xué)的優(yōu)化軌跡Fig.13 Optimization trajectory based on virtual domain inverse dynamics
該方法允許匹配任意組合的終端條件,產(chǎn)生指定的路徑點(diǎn)間隔,可以有效地得到所需的結(jié)果。通過數(shù)學(xué)仿真,分別驗(yàn)證了該方法在時(shí)間最優(yōu)和能量最優(yōu)下的有效性,可有效保證翻滾目標(biāo)安全有效地逼近與跟蹤慢旋目標(biāo)。
本研究團(tuán)隊(duì)針對(duì)超近距離自主逼近規(guī)劃問題,研究了基于高斯偽譜法的軌跡優(yōu)化方法,考慮到目標(biāo)旋轉(zhuǎn)、安全、燃料消耗和機(jī)動(dòng)因素,構(gòu)建了一個(gè)包含安全區(qū)域和禁止區(qū)域的模型,基于高斯偽譜法求解最優(yōu)軌跡,通過仿真驗(yàn)證了方案的有效性,規(guī)劃軌跡能夠避開禁區(qū),分別在相對(duì)距離、燃料消耗和機(jī)動(dòng)時(shí)間方面獲得最優(yōu)軌跡,如圖14 所示。
圖14 基于高斯偽譜法的燃料最優(yōu)安全軌跡Fig.14 Fuel optimal safety trajectory based on Gaussian pseudospectral method
(2)姿軌耦合逼近的路徑跟蹤控制技術(shù)
姿軌耦合逼近控制主要包括閉環(huán)反饋控制方法、最優(yōu)控制方法和強(qiáng)化學(xué)習(xí)方法。
閉環(huán)反饋控制是基于李雅普諾夫穩(wěn)定性定理,對(duì)輸入信號(hào)和輸出信號(hào)的誤差進(jìn)行調(diào)節(jié),包括不依賴于被控對(duì)象精確模型的誤差反饋控制方法和基于現(xiàn)代控制理論的模型反饋控制方法。誤差反饋控制方法包括位置式PID 和增量式PID,其具有方法簡(jiǎn)單、易于實(shí)現(xiàn)的特點(diǎn)。模型反饋控制方法是根據(jù)被控對(duì)象所建立的動(dòng)力學(xué)或運(yùn)動(dòng)學(xué)模型,實(shí)現(xiàn)對(duì)模型狀態(tài)微分變化過程的快速精確控制,包括動(dòng)態(tài)逆、滑??刂?、自適應(yīng)控制、魯棒控制[10]、模型預(yù)測(cè)控制[11][12]以及相應(yīng)組合控制方法,其具有實(shí)時(shí)性好、穩(wěn)定可靠、具有一定的抗干擾能力,魯棒性較高,但難以評(píng)價(jià)過程和終端約束,無法對(duì)整個(gè)任務(wù)過程的優(yōu)化指標(biāo)進(jìn)行考核,且當(dāng)存在較大不確定環(huán)境和外界干擾時(shí)的魯棒性較差。
為了指導(dǎo)地勘單位踐行綠色理念,全面推進(jìn)我國(guó)綠色勘查工作,不久前中國(guó)礦業(yè)聯(lián)合會(huì)正式發(fā)布了我國(guó)綠色勘查第一個(gè)團(tuán)體標(biāo)準(zhǔn)——《綠色勘查指南》(T/CMAS 00012018)。
基于最優(yōu)控制的跟蹤控制方法通常包括間接法和直接法。間接法是基于極小值原理,將最優(yōu)控制問題轉(zhuǎn)化為求解微分方程的兩邊邊值問題,與同倫技術(shù)[13]、初始值搜索等策略相結(jié)合以提高優(yōu)化性能,其控制精度高且解滿足一階最優(yōu)性,但兩點(diǎn)邊值求解難度大、對(duì)初始值比較敏感。直接法不需要求解最優(yōu)性條件,通過對(duì)狀態(tài)量和控制量進(jìn)行離散,將動(dòng)態(tài)優(yōu)化問題轉(zhuǎn)化為非線性規(guī)劃問題,典型方法包括偽譜法和凸優(yōu)化等。最優(yōu)控制方法由于計(jì)算復(fù)雜度高、實(shí)時(shí)性較差,通常用于離線控制任務(wù)。
強(qiáng)化學(xué)習(xí)[14]是基于動(dòng)態(tài)規(guī)劃的貝爾曼最優(yōu)性原理,讓智能體從與環(huán)境的交互中學(xué)習(xí)最優(yōu)行動(dòng)策略,可實(shí)現(xiàn)從傳感器數(shù)據(jù)到行動(dòng)策略的端到端映射,具有實(shí)時(shí)性強(qiáng)的優(yōu)點(diǎn),典型方法包括DPG、TRPO、PPO[15]等。Qu[16]等人提出了一種探索自適應(yīng)深度確定性策略梯度(DDPG)算法,實(shí)現(xiàn)空間飛行器自主交會(huì)對(duì)接的相對(duì)位置跟蹤控制,并滿足安全避撞要求。Cheng[17]等人提出了一種利用多尺度深度神經(jīng)網(wǎng)絡(luò)的航天器軌道轉(zhuǎn)移實(shí)時(shí)優(yōu)化控制方法,實(shí)現(xiàn)大規(guī)模復(fù)雜系統(tǒng)的高精度控制。
本研究團(tuán)隊(duì)針對(duì)空間翻滾目標(biāo)最終逼近與跟蹤控制問題,在直接相對(duì)姿軌測(cè)量失效條件下,基于圖像視覺伺服思想,建立了超近距離姿軌跟蹤的成像運(yùn)動(dòng)模型;直接利用目標(biāo)圖像特征點(diǎn)坐標(biāo),推導(dǎo)得到指數(shù)收斂的圖像視覺伺服期望廣義速度、相對(duì)位置估計(jì)修正量;引入基于雙滑模面控制律的相對(duì)姿軌耦合控制閉環(huán),提出了間接估計(jì)輔助的圖像視覺伺服控制方法;與基于間接估計(jì)信息的位置視覺伺服控制方法相比,其相對(duì)位置和姿態(tài)控制精度提高了2 到10 倍,具體數(shù)據(jù)如表1 所示??蔀榭臻g翻滾目標(biāo)最終逼近與跟蹤任務(wù)提供安全、準(zhǔn)確、穩(wěn)定的相對(duì)姿態(tài)和軌道條件。
表1 控制性能匯總對(duì)比表Tab.1 Control performance comparison
本項(xiàng)目團(tuán)隊(duì)基于雙滑??刂坡砷_展了半物理仿真實(shí)驗(yàn)。驗(yàn)證過程中目標(biāo)星和追蹤星運(yùn)動(dòng)模擬器的運(yùn)動(dòng)狀態(tài)如圖15 所示。目標(biāo)星模擬器按照0.41°/s 的角速度繞本體系Y 軸旋轉(zhuǎn),位置保持控制在某一定點(diǎn)。在控制律作用下,追蹤星模擬器最終實(shí)現(xiàn)了對(duì)目標(biāo)星模擬器的姿態(tài)和位置同步跟蹤,如圖16 所示。保證噴管捕獲機(jī)構(gòu)始終指向目標(biāo)模擬器的發(fā)動(dòng)機(jī)噴管,并逐漸縮短距離,最終為捕獲鎖死提供精確位姿條件。
圖15 逼近與跟蹤地面實(shí)驗(yàn)Fig.15 Approaching and tracking ground experiment
圖16 運(yùn)動(dòng)模擬器的期望軌跡與實(shí)際軌跡Fig.16 Expected trajectory and actual trajectory of motion simulator
要實(shí)現(xiàn)對(duì)目標(biāo)的接管或精細(xì)操作,需要對(duì)非合作目標(biāo)進(jìn)行捕獲,按照捕獲后形成連接是柔性還是剛性,非合作目標(biāo)捕獲手段包括柔性捕獲與剛性捕獲。其中柔性捕獲主要運(yùn)用飛網(wǎng)捕獲、魚叉捕獲等技術(shù)手段,剛性捕獲主要運(yùn)用噴管對(duì)接捕獲、仿生黏附捕獲、機(jī)械臂捕獲等技術(shù)手段。
柔性捕獲的優(yōu)點(diǎn)在于對(duì)控制精度要求較低,但缺點(diǎn)是不便于后續(xù)提供維修或燃料加注等精細(xì)服務(wù)。飛網(wǎng)捕獲和魚叉捕獲可用于將失效衛(wèi)星或空間碎片拖曳離軌,具有成本低、適應(yīng)性高的特點(diǎn),工程上較為容易實(shí)現(xiàn)。但魚叉捕獲容易產(chǎn)生空間碎片,飛網(wǎng)和魚叉捕獲都已經(jīng)過在軌驗(yàn)證。
剛性捕獲的優(yōu)點(diǎn)在于目標(biāo)衛(wèi)星與服務(wù)星之間為剛性連接,對(duì)接比較穩(wěn)固,但該方式技術(shù)難度較大,對(duì)控制性能要求比較高。噴管對(duì)接捕獲是指,通過圓錐形抓捕工具直接插入目標(biāo)遠(yuǎn)地點(diǎn)發(fā)動(dòng)機(jī)噴管并鎖緊,實(shí)現(xiàn)與目標(biāo)的穩(wěn)定固連,是早期在軌服務(wù)采用的捕獲方式,技術(shù)相對(duì)較為成熟。仿生黏附捕獲是基于仿生壁虎干黏附材料的在軌捕獲方式,該方式可重復(fù)使用降低成本、對(duì)目標(biāo)具有寬適應(yīng)性,是后續(xù)發(fā)展的重要方向。機(jī)械臂捕獲是指,采用一個(gè)或多個(gè)機(jī)械臂結(jié)合末端抓捕工具的結(jié)構(gòu)形式,對(duì)目標(biāo)的星箭對(duì)接環(huán)或發(fā)動(dòng)機(jī)噴管等結(jié)構(gòu)實(shí)施對(duì)接捕獲,是目前研究較多的捕獲方式,由于末端工具與目標(biāo)接觸時(shí)會(huì)產(chǎn)生碰撞力,可能帶來目標(biāo)損壞或翻滾,捕獲對(duì)操控力的柔順性、安全性和平滑性提出了要求,因此翻滾目標(biāo)特定部位的柔順捕獲控制是核心挑戰(zhàn),如圖17 所示。
圖17 目標(biāo)捕獲Fig.17 Target capture
基于空間機(jī)械臂的特定部位柔順捕獲控制主要是指末端執(zhí)行器對(duì)目標(biāo)抓取時(shí),依靠控制方法使系統(tǒng)適應(yīng)各種不同外界環(huán)境,對(duì)環(huán)境作用力、擾動(dòng)等變化做出及時(shí)響應(yīng)。主動(dòng)柔順控制方法包括基于阻抗和力/位混合的經(jīng)典柔順抓捕控制、基于現(xiàn)代控制理論的柔順抓捕控制和智能柔順抓捕控制等。
阻抗控制是將機(jī)械臂視為一個(gè)“力敏感的彈簧-阻尼器-質(zhì)量系統(tǒng)”,通過調(diào)節(jié)機(jī)械臂的阻抗參數(shù)(包括質(zhì)量、彈簧系數(shù)、阻尼系數(shù)等)來實(shí)現(xiàn)對(duì)機(jī)械臂運(yùn)動(dòng)的精細(xì)控制,柔順抓捕控制需要考慮目標(biāo)形狀、質(zhì)量、摩擦力等因素,而阻抗控制[18]可以通過調(diào)節(jié)機(jī)器人的阻抗參數(shù)來適應(yīng)不同的物體特性,提高機(jī)械臂對(duì)目標(biāo)抓捕的控制精度和穩(wěn)定性。力/位混合控制是一種用于機(jī)械臂柔順抓捕的高級(jí)控制策略,結(jié)合位置控制和力控制,通過傳感器獲取物體的質(zhì)量、位置和速度等信息,實(shí)時(shí)調(diào)整機(jī)械臂的動(dòng)作,實(shí)現(xiàn)對(duì)目標(biāo)的精確抓捕。Erfan[19]等人針對(duì)機(jī)械臂對(duì)目標(biāo)抓捕任務(wù)需求,提出了一種模塊化的單臂控制法用于多臂抓捕操作,遵循力和阻抗控制的概念,引入了一種自適應(yīng)策略,增加了一個(gè)虛擬能量池到多臂系統(tǒng)中,實(shí)現(xiàn)了目標(biāo)的抓捕操作,確保所提出控制算法的穩(wěn)定性。力/位置混合控制方法在受到外界干擾時(shí)系統(tǒng)魯棒性較差,且控制精度難以同時(shí)滿足高精度要求。
空間機(jī)械臂執(zhí)行抓捕任務(wù)時(shí),存在模型參數(shù)不確定和外界干擾等問題,以阻抗和力/位混合為代表的經(jīng)典柔順抓捕控制方法精度難以保證。以模型預(yù)測(cè)控制、魯棒控制、自適應(yīng)控制為代表的現(xiàn)代柔順控制方法,基于獲取的機(jī)械臂位姿和力學(xué)信息,可實(shí)現(xiàn)機(jī)械臂抓捕過程中的精確魯棒控制。Yang[20]等人針對(duì)空間操作機(jī)械臂諧波驅(qū)動(dòng)帶來的擾動(dòng)對(duì)機(jī)械臂高精度運(yùn)動(dòng)和柔順性的影響問題,提出了一種基于魯棒扭矩跟蹤的控制方法,以消除由彈性引起的意外振動(dòng),并抵消電機(jī)非線性摩擦所引起的擾動(dòng),并結(jié)合改進(jìn)自適應(yīng)方法,基于位置阻抗控制實(shí)現(xiàn)了翻滾衛(wèi)星的軟捕獲。She[21]提出了一種用于空間非合作目標(biāo)捕獲后的無模型控制方法,基于系統(tǒng)參數(shù)線性化開發(fā)了一種激勵(lì)響應(yīng)映射搜索策略,建立線性校正器以減少控制誤差,實(shí)現(xiàn)組合航天器捕獲后的高精度控制。
智能柔順抓捕控制是將模糊控制、神經(jīng)網(wǎng)絡(luò)控制和強(qiáng)化學(xué)習(xí)等智能控制方法應(yīng)用于機(jī)械臂柔順抓捕控制中,基于機(jī)械臂末端視覺和力傳感器,實(shí)時(shí)監(jiān)測(cè)機(jī)械臂的位置、姿態(tài)和力學(xué)狀態(tài),提高機(jī)械臂抓捕穩(wěn)定性和適用范圍。Yan[22]等人提出了一種新的自由漂浮空間機(jī)器人捕獲非合作目標(biāo)的控制方法,基于最大熵目標(biāo)構(gòu)建了軟Q 網(wǎng)絡(luò)和狀態(tài)條件的隨機(jī)策略網(wǎng)絡(luò),建立經(jīng)驗(yàn)回放池來存儲(chǔ)訓(xùn)練樣本,采用軟Q 學(xué)習(xí)訓(xùn)練策略,以最大化累積獎(jiǎng)勵(lì)和策略熵,使機(jī)器人能夠?qū)崿F(xiàn)不同方式的目標(biāo)抓捕。Du[23]等人針對(duì)自由漂浮空間機(jī)器人的動(dòng)態(tài)模型復(fù)雜導(dǎo)致難以捕獲目標(biāo)的問題,提出了一種針對(duì)基于學(xué)習(xí)的無模型控制方法,將任務(wù)的過程描述為強(qiáng)化學(xué)習(xí)過程,采用深度確定性策略算法(DDPG)來訓(xùn)練空間機(jī)械臂運(yùn)動(dòng)規(guī)劃策略,實(shí)現(xiàn)空間機(jī)器人對(duì)目標(biāo)的抓捕控制。
本研究團(tuán)隊(duì)采用基于位置控制內(nèi)環(huán)的阻抗控制方法,解決了機(jī)械臂末端對(duì)目標(biāo)接觸過程中的力和位姿復(fù)合控制問題,完成了基于機(jī)械臂將圓柱形工件插入一個(gè)圓形孔洞的試驗(yàn),如圖18 所示,機(jī)械臂末端的接觸力可以在較短的時(shí)間內(nèi)實(shí)現(xiàn)對(duì)期望力(10N)的追蹤和保持,且沒有出現(xiàn)接觸力峰值過大的情況,如圖19所示,說明機(jī)械臂末端的接觸力得到了良好的控制,且當(dāng)平頭圓柱形工件換成尖頭圓柱形工件時(shí),同樣能夠得到很好的控制效果。
圖18 工件插入試驗(yàn)Fig.18 Workpiece insertion test
圖19 Z 軸方向力曲線Fig.19 Z-axis force curve
對(duì)于剛性連接組合體,可由服務(wù)星接管姿態(tài)和軌道控制。組合體的結(jié)構(gòu)與個(gè)體航天器相比,存在質(zhì)量和轉(zhuǎn)動(dòng)慣量增加、質(zhì)心偏移以及撓性模態(tài)改變等變化,且由于是非合作目標(biāo),目標(biāo)的質(zhì)量特性參數(shù)無法獲得,系統(tǒng)存在不確定性。組合體航天器的質(zhì)量參數(shù)未知且突變、控制能力受限、外界干擾影響等問題給穩(wěn)定控制帶來困難。因此,組合體姿軌復(fù)合接管控制技術(shù)是核心挑戰(zhàn)。
對(duì)于柔性連接組合體,可由服務(wù)星通過柔性系繩拖曳離軌。服務(wù)星、系繩、目標(biāo)星組成復(fù)雜的剛?cè)狁詈舷到y(tǒng),系統(tǒng)存在縱向振動(dòng)、橫向擺動(dòng)、目標(biāo)航天器翻滾等問題,縱向振動(dòng)會(huì)給服務(wù)航天器帶來沖擊,橫向擺動(dòng)會(huì)對(duì)航天器姿態(tài)產(chǎn)生干擾,目標(biāo)翻滾可能會(huì)產(chǎn)生系繩纏繞。解決這一問題的有效方法是將系繩張力控制與系統(tǒng)的運(yùn)動(dòng)規(guī)劃和控制策略相結(jié)合,因此,柔性系繩拖曳控制技術(shù)是核心挑戰(zhàn)。
剛性連接組合體和柔性連接組合體的接管穩(wěn)定控制需解決的難題如圖20 所示。
圖20 組合體穩(wěn)定控制Fig.20 Stability control of the combination
因此,組合體接管主要涉及兩部分內(nèi)容:機(jī)械臂捕獲和仿生黏附捕獲并鎖緊形成穩(wěn)固連接后的組合體姿軌復(fù)合接管控制技術(shù),通過繩系形成松弛連接后的目標(biāo)拖曳控制技術(shù)。
(1)組合體姿軌復(fù)合接管控制技術(shù)
要實(shí)現(xiàn)對(duì)組合體高精度的姿態(tài)和軌道控制,首先需要準(zhǔn)確求出航天器動(dòng)慣量、質(zhì)量和質(zhì)心位置等質(zhì)量特性參數(shù),對(duì)目標(biāo)航天器認(rèn)識(shí)的不確定,以及航天器在軌運(yùn)行帶來的一些載荷或構(gòu)型的變化等造成這些質(zhì)量特性參數(shù)不能通過地面實(shí)驗(yàn)手段計(jì)算得到,需要在線對(duì)組合體的質(zhì)量特性參數(shù)進(jìn)行辨識(shí)。其次,目標(biāo)航天器往往具有一定的運(yùn)動(dòng)速度,對(duì)接或捕獲后組合體的動(dòng)量會(huì)發(fā)生突變,可能造成組合體失穩(wěn),因此,對(duì)接完成后需要對(duì)組合體進(jìn)行姿態(tài)穩(wěn)定。
1)組合體質(zhì)量特性參數(shù)辨識(shí)
組合體航天器質(zhì)量特性參數(shù)辨識(shí)與單體航天器不同,捕獲非合作目標(biāo),尤其是非合作翻滾目標(biāo)后,組合體會(huì)存在較大姿態(tài)角速度,要求合理設(shè)計(jì)辨識(shí)模型和辨識(shí)方法確保組合體不能失穩(wěn),同時(shí)要兼顧組合體撓性模態(tài)增強(qiáng)的變化,避免激勵(lì)過程引起撓性附件振動(dòng)。航天器的質(zhì)量特性參數(shù)在軌辨識(shí)方法有濾波類方法和最小二乘類方法[24]。
濾波類方法具有良好的平滑性,但算法相對(duì)復(fù)雜、計(jì)算量較大。為減少計(jì)算量,可以對(duì)運(yùn)動(dòng)方程中的耦合項(xiàng)做近似簡(jiǎn)化,但會(huì)對(duì)航天器的運(yùn)行速度產(chǎn)生限制。此外,一些無需參數(shù)解耦的基于粒子群等算法的質(zhì)量特性參數(shù)辨識(shí)方法也被提出,可將所有參數(shù)同時(shí)辨識(shí)得出,航天器運(yùn)行速度不受限。最小二乘類方法在辨識(shí)過程中誤差會(huì)不斷累加,結(jié)果受測(cè)量誤差影響較大。國(guó)外學(xué)者利用加速度計(jì)和陀螺,采用最小二乘辨識(shí)算法完成了飛行器轉(zhuǎn)動(dòng)慣量、質(zhì)心、推力器大小和總質(zhì)量的在線辨識(shí),系統(tǒng)辨識(shí)時(shí)間在48 s 內(nèi),算法已在麻省理工學(xué)院的SPHERES 實(shí)驗(yàn)飛船項(xiàng)目中進(jìn)行驗(yàn)證,證明了工程應(yīng)用的可行性。
2)組合體穩(wěn)定控制
服務(wù)航天器抓捕非合作目標(biāo)形成組合體后,非合作目標(biāo)組合體控制完全交由服務(wù)航天器來完成。雖然經(jīng)過參數(shù)辨識(shí),但結(jié)果并非完全準(zhǔn)確,系統(tǒng)存在不確定性,組合體航天器的質(zhì)量參數(shù)發(fā)生突變、控制能力受限、外界干擾影響等問題給組合體控制帶來巨大挑戰(zhàn)。組合體姿軌復(fù)合接管控制的典型控制策略包括變結(jié)構(gòu)控制、自適應(yīng)控制、神經(jīng)網(wǎng)絡(luò)控制等。
針對(duì)強(qiáng)耦合非線性系統(tǒng),且某些系統(tǒng)參數(shù)具有較大的不確定性,可以采用變結(jié)構(gòu)控制方法解決非線性控制問題,該方法對(duì)參數(shù)的不確定和外界未知干擾具有較強(qiáng)的魯棒性、且系統(tǒng)響應(yīng)速度快。自適應(yīng)控制可用于解決被控對(duì)象特性未知或擾動(dòng)變化較大的情況,控制系統(tǒng)能夠根據(jù)外界的變化自動(dòng)調(diào)整參數(shù),使系統(tǒng)按照設(shè)定的性能指標(biāo)保持運(yùn)行在最優(yōu)狀態(tài)。神經(jīng)網(wǎng)絡(luò)控制優(yōu)點(diǎn)是能夠?qū)W習(xí)和自適應(yīng),適用于難以精確建模的復(fù)雜模型控制。Thakur[25]提出利用神經(jīng)網(wǎng)絡(luò)的方法解決時(shí)變不確定慣量參數(shù)情況下的航天器自適應(yīng)姿態(tài)控制。
由于系統(tǒng)存在強(qiáng)不確定性,組合體航天器難以采用精確的數(shù)學(xué)模型對(duì)控制對(duì)象進(jìn)行描述,可以采用基于數(shù)據(jù)驅(qū)動(dòng)的控制方法,不依賴于系統(tǒng)精確的數(shù)學(xué)模型,利用充分的系統(tǒng)輸入輸出數(shù)據(jù)即可得到滿足要求的控制器。1994 年侯忠生提出了新的無模型控制方法——無模型自適應(yīng)控制,該方法已應(yīng)用在電氣、化工等領(lǐng)域。本研究團(tuán)隊(duì)創(chuàng)新地將該方法應(yīng)用在組合體航天器控制中,解決了捕獲后組合體航天器無模型自適應(yīng)姿態(tài)控制問題。圖21-22 為姿態(tài)初始值[5°;-5°; 0°],組合體姿態(tài)控制仿真結(jié)果曲線。
圖21 組合體姿態(tài)Fig.21 Attitude of combination
圖22 組合體姿態(tài)角速度Fig.22 Attitude angular velocity of combination
由仿真結(jié)果可知,組合體航天器姿態(tài)控制精度為0.005°。
在此基礎(chǔ)上,研究團(tuán)隊(duì)利用氣浮平臺(tái)、六自由度運(yùn)動(dòng)模擬器,完成了組合體航天器姿態(tài)的無模型數(shù)據(jù)驅(qū)動(dòng)控制的地面實(shí)驗(yàn)驗(yàn)證,如圖23 所示。設(shè)定三軸姿態(tài)角的初值為(3.23°,0.12°,-0.09°),期望值設(shè)定為(2°,-0.5°,0°),實(shí)驗(yàn)結(jié)果如圖24 所示。
圖23 地面實(shí)驗(yàn)系統(tǒng)Fig.23 Ground examination system
圖24 組合體姿態(tài)控制Fig.24 Attitude control of combination
由地面實(shí)驗(yàn)控制結(jié)果可知,基于數(shù)據(jù)驅(qū)動(dòng)控制方法可實(shí)現(xiàn)組合體的三軸控制,控制精度為0.2°。
(2)柔性系繩拖曳控制技術(shù)
除了建立剛性連接形成組合體外,柔性系繩也是非合作目標(biāo)捕獲的一種技術(shù)手段。針對(duì)空間系繩捕獲非合作目標(biāo)后可能帶來的沖擊、擺動(dòng)、纏繞等問題,國(guó)內(nèi)外專家學(xué)者就航天器柔性系繩拖曳過程中的張力控制技術(shù)進(jìn)行了大量的研究。
在橫向、切向和徑向方向上,通過給出繩系衛(wèi)星擺角在作用力下的一階解析解,可以基于張力控制器實(shí)現(xiàn)擺角振動(dòng)抑制,從而實(shí)現(xiàn)姿態(tài)穩(wěn)定控制。在沿系繩方向上,封鐵凝[26]完成了一種時(shí)間最短能耗最小的組合體沿系繩方向振動(dòng)抑制的最優(yōu)控制策略設(shè)計(jì),避免了系繩縱向振動(dòng)可能導(dǎo)致系繩松弛及纏繞的問題。Jia C[27]在考慮了動(dòng)力學(xué)的不確定性、推力器幅值約束和配置不確定性情況下,采用自適應(yīng)反步控制方法實(shí)現(xiàn)碎片拖曳過程中的姿態(tài)穩(wěn)控控制。
時(shí)變張力控制律對(duì)航天器姿態(tài)敏感器的測(cè)量精度和執(zhí)行機(jī)構(gòu)的響應(yīng)速度要求很高,限制了其在工程中的應(yīng)用。針對(duì)這一問題,本研究團(tuán)隊(duì)[28]提出一種基于相平面控制原理的恒定張力拖曳控制方法,實(shí)現(xiàn)繩網(wǎng)捕獲碎片目標(biāo)后繩系組合體面內(nèi)外擺動(dòng)的抑制,并證明了該方法的穩(wěn)定性。進(jìn)一步,建立了考慮失效航天器帶有柔性附件情況的動(dòng)力學(xué)模型[29],在此基礎(chǔ)上設(shè)計(jì)了常值張力切換控制律。
目前在軌服務(wù)任務(wù)都是針對(duì)特定目標(biāo)、特定場(chǎng)景、特定環(huán)境,按照設(shè)計(jì)好的固定范式進(jìn)行操作,屬于程式化操控,無法適應(yīng)非結(jié)構(gòu)化環(huán)境、目標(biāo)和任務(wù),無法真正在軌應(yīng)用。針對(duì)未知失效翻滾目標(biāo)、低軌光照變化劇烈、視線遮擋,且抓捕部位和操作部位的外形尺寸未知等問題,引入基于深度學(xué)習(xí)的目標(biāo)識(shí)別和場(chǎng)景理解方法,提升空間非結(jié)構(gòu)環(huán)境下目標(biāo)識(shí)別的泛化性和魯棒性,識(shí)別失效目標(biāo)的抓捕部位和操作部位,并通過場(chǎng)景理解確定目標(biāo)狀態(tài)和操作策略;由于目標(biāo)的非結(jié)構(gòu)特征,操作沒有標(biāo)準(zhǔn)范式,傳統(tǒng)的目標(biāo)抓捕和精細(xì)操作方法需要已知任務(wù)場(chǎng)景操作部位的目標(biāo)形狀特征,設(shè)計(jì)期望的操作動(dòng)作,通過引入基于自學(xué)習(xí)的精細(xì)操作方法,掌握目標(biāo)抓捕和精細(xì)操作技巧,應(yīng)對(duì)操作部位尺寸、形狀等場(chǎng)景變化的操作任務(wù)。
為此,開展目標(biāo)捕獲與維修的智能感知與精細(xì)操作技術(shù)研究,可提升操控感知、規(guī)劃與控制對(duì)非結(jié)構(gòu)化任務(wù)、對(duì)象、環(huán)境的泛化自適應(yīng)、自學(xué)習(xí)能力。重點(diǎn)開展非結(jié)構(gòu)復(fù)雜環(huán)境目標(biāo)感知、柔性機(jī)器人[30]的力觸視形位智能融合感知與控制、多智能體協(xié)同融合感知規(guī)劃與控制等技術(shù)研究。
面向空間站等大型航天器艙外巡視、檢修等在軌維護(hù)任務(wù),在通用化柔性捕獲基礎(chǔ)上發(fā)展星表仿生附著巡游,實(shí)現(xiàn)自由粘附和脫附,可為在軌操作提供可逆穩(wěn)固黏附連接力、增強(qiáng)抓取和移動(dòng)能力,適應(yīng)星表爬行移動(dòng)需求。由于空間爬行機(jī)器人面對(duì)的航天器表面形貌、材質(zhì)、結(jié)構(gòu)種類眾多,特性差異大,同時(shí),執(zhí)行拔插電纜、更換太陽能帆板等靈巧操作面對(duì)的組件形狀與硬度差異大,要求操作力幅度與操作運(yùn)動(dòng)軌跡多樣化,并需應(yīng)對(duì)操作中的異常狀況,這就使得空間爬行機(jī)器人需具備非結(jié)構(gòu)化環(huán)境爬行的強(qiáng)適應(yīng)性與操作的強(qiáng)泛化性。
為此,開展在軌服務(wù)爬行機(jī)器人的智能觸覺測(cè)量、運(yùn)動(dòng)規(guī)劃與控制技術(shù)研究,將人工智能技術(shù)與航天技術(shù)交叉融合,模仿人類記憶與推理機(jī)制,研究包含空間操作環(huán)境、對(duì)象與技能的動(dòng)態(tài)知識(shí)庫構(gòu)建方法和操作技能推理方法,可以使空間機(jī)器人獲得強(qiáng)適應(yīng)附著爬行和強(qiáng)泛化靈巧操作能力。重點(diǎn)開展表面未知接觸狀態(tài)的精準(zhǔn)感知、空間微重力條件下黏附爬行的自適應(yīng)步態(tài)規(guī)劃、空間環(huán)境高功率密度仿生肌肉驅(qū)動(dòng)與控制、多模態(tài)柔性觸覺傳感等技術(shù)研究。
高分辨率成像、高靈敏偵察、高功率發(fā)電等大型空間系統(tǒng)是未來裝備的重要發(fā)展方向,其性能取決于孔徑和支撐結(jié)構(gòu)尺寸。受運(yùn)載能力及展收機(jī)構(gòu)技術(shù)限制,無法單次發(fā)射入軌,在軌組裝是有效解決途徑。大尺度撓性結(jié)構(gòu)阻尼小,易發(fā)生持續(xù)的隨機(jī)振動(dòng),且頻率特性隨著結(jié)構(gòu)尺寸增長(zhǎng)、拓?fù)渥兓蜋C(jī)器人所在位置而變化,依附于結(jié)構(gòu)的組裝機(jī)器人要搬運(yùn)大質(zhì)量/慣量可展模塊,因其機(jī)械臂和關(guān)節(jié)的不可忽視柔性特性,在基座干擾位移下會(huì)產(chǎn)生振蕩,導(dǎo)致無法精確抓取、對(duì)準(zhǔn)接口,甚至導(dǎo)致模塊的碰撞。
為此,需開展適用于大尺度撓性結(jié)構(gòu)上組裝機(jī)器人爬行、操作的抑振運(yùn)動(dòng)規(guī)劃和控制方法研究,實(shí)現(xiàn)百米級(jí)超大尺度空間桁架結(jié)構(gòu)在軌建造。重點(diǎn)開展柔性變構(gòu)型組裝動(dòng)力學(xué)、組裝過程的精密測(cè)量與標(biāo)定、撓性組裝體的自適應(yīng)精細(xì)運(yùn)動(dòng)規(guī)劃、復(fù)雜多體系統(tǒng)的精細(xì)操作控制等技術(shù)研究。
在軌服務(wù)已成為國(guó)內(nèi)外研究的熱點(diǎn)領(lǐng)域,本文通過總結(jié)典型在軌服務(wù)任務(wù)的發(fā)展現(xiàn)狀,可以看出,服務(wù)對(duì)象已由最初的合作穩(wěn)定目標(biāo)擴(kuò)展到非合作翻滾目標(biāo),操控任務(wù)由簡(jiǎn)單的交會(huì)、對(duì)接發(fā)展到更為復(fù)雜的延壽、維修、爬行、組裝等。為使航天器具備相應(yīng)的能力,對(duì)在軌服務(wù)航天器控制系統(tǒng)提出翻滾目標(biāo)超近立體視覺測(cè)量、翻滾目標(biāo)姿軌耦合逼近路徑規(guī)劃與控制、非合作目標(biāo)柔順捕獲控制、組合體穩(wěn)定控制四方面關(guān)鍵技術(shù)挑戰(zhàn)。后續(xù)在軌服務(wù)將朝著非結(jié)構(gòu)化環(huán)境/目標(biāo)操控、星表仿生附著巡游、大型空間結(jié)構(gòu)在軌組裝等方向發(fā)展,存在目標(biāo)捕獲與維修的智能感知與精細(xì)操作、在軌服務(wù)爬行機(jī)器人的智能觸覺測(cè)量/運(yùn)動(dòng)規(guī)劃與控制、大尺度撓性結(jié)構(gòu)上組裝機(jī)器人爬行/操作的抑振運(yùn)動(dòng)規(guī)劃和控制等難題需要攻關(guān)。