徐 杭,梁維奎,,劉魯江,馬廣富,宋 斌
(1.哈爾濱工業(yè)大學航天學院控制科學與工程系,哈爾濱 150001;2.上海宇航系統(tǒng)工程研究所,上海 201109)
空間設備在軌運行時環(huán)境復雜多變,不可避免出現(xiàn)各種損耗,因此往往具有高風險、長期使用、高投入等特征。根據(jù)UCS衛(wèi)星數(shù)據(jù)庫統(tǒng)計[1],截至2021年12月31日,在地球同步軌道(GEO)上已有574顆衛(wèi)星,包括通信衛(wèi)星等高價值空間設備。除此以外,還有大量無法觀測到的空間碎片也分布在該區(qū)域。與近地軌道(LEO)不同,GEO報廢衛(wèi)星不會飛回大氣層銷毀,根據(jù)歐洲航天局的年度調(diào)查報告,2017年19顆大型靜止軌道衛(wèi)星在服役期滿后被送入更高的墳墓軌道,這些報廢衛(wèi)星與空間碎片一旦發(fā)生碰撞將嚴重威脅GEO衛(wèi)星的正常運行,帶來災難性影響[2]。因此為了延長空間設備的使用壽命、保障空間設備的穩(wěn)定運行、提升工作性能,需要使用空間在軌服務(On-orbit servicing,OOS),為各類航天器提供燃料加注、功能維護、模塊升級等輔助保障服務,同時及時紓解太空垃圾,減少空間碎片對在軌衛(wèi)星的碰撞風險。隨著技術(shù)水平的不斷進步,中國在該方向已經(jīng)積累了不少經(jīng)驗。2016年中國成功發(fā)射天源一號衛(wèi)星實現(xiàn)首次衛(wèi)星“空中加油”,相繼又實現(xiàn)了天舟一號對天宮二號的推進劑補加、實踐二十一號對太空垃圾的抓捕。隨著人類發(fā)射衛(wèi)星數(shù)量的增多和在軌服務技術(shù)的日漸成熟,在可預見的未來在軌服務技術(shù)將得到大規(guī)模的應用。而在實現(xiàn)在軌服務的過程中,多個航天器對多個目標進行任務規(guī)劃是任務實施的重要一環(huán),本文針對GEO多對多在軌服務任務規(guī)劃進行分析。
目前國內(nèi)外對于航天器多對多的在軌服務任務規(guī)劃已經(jīng)開展了大量的研究。吳鈺飛等[3]建立了面向地球靜止軌道航天器的合同網(wǎng)協(xié)議多agent模型,任務緊急程度近似為目標函數(shù)時間燃料權(quán)重比,但其任務分配過程中只是確定哪個航天器去服務哪個單目標。張進等[4]提出了一種混合編碼遺傳算法來求解近地軌道的多航天器加油模型,模型中考慮了J2攝動影響和時間窗約束,并使用相對動力學方程來求解轉(zhuǎn)移過程。趙凡宇等[5]提出了基于規(guī)劃活動相關(guān)度的領域無關(guān)啟發(fā)式規(guī)劃方法,明顯減少了規(guī)劃步數(shù)與回溯步數(shù)。歐陽琦等[6]以地球同步軌道衛(wèi)星群為對象,基于遺傳算法求解多對多在軌加注任務規(guī)劃問題。陳小前等[7]比較了一對一策略、一對多策略、多對多策略、P2P策略的經(jīng)濟效率,提出了一種混合策略框架以實現(xiàn)更好的收益。余婧等[8]基于混雜優(yōu)化控制理論對GEO在軌燃油加注過程提出了數(shù)學表征,其中變軌過程考慮霍曼變軌和調(diào)相機動的組合,優(yōu)化模型考慮多目標粒子群算法進行求解。文獻[9]中優(yōu)化目標考慮任務的燃油與時間消耗,以Lambert變軌過程建立優(yōu)化模型,并用多目標粒子群算法求解。Bang等[10]基于車輛路徑規(guī)劃模型對主動式碎片清除任務規(guī)劃問題建模,考慮短時任務(一星期以下)采用Lambert變軌方式,利用升交點赤經(jīng)漂移的三步變軌方式用于長時任務。鄭紅星等[11]針對一對多的在軌服務規(guī)劃問題設計了基于霍曼轉(zhuǎn)移、異面機動、Lambert轉(zhuǎn)移的空間任意目標變軌流程,并使用遺傳算法進行求解,計算出服務時序。
在上述的研究中,由于航天器的多對多在軌服務任務規(guī)劃為一個典型的混合整數(shù)規(guī)劃問題,通常為了尋找“最優(yōu)”方案,使用優(yōu)化算法進行多輪次的迭代求解,在求解過程存在算法復雜性高、效率低、運行時間長、收斂性差等問題。且由于星上資源有限,往往需要在地面站形成方案后進行上注,存在時延、反應不及時(存在測控時間窗口)的問題。針對于突發(fā)事件(大量碎片產(chǎn)生),多個航天器平臺進行自主探測、分布式規(guī)劃相較于傳統(tǒng)方案有顯著優(yōu)勢,并可以結(jié)合啟發(fā)式策略應對任務過載問題[12]。由于航天領域的特殊性,航天器自主任務規(guī)劃面對計算資源有限、及時性、環(huán)境不確定性、目標動態(tài)性、系統(tǒng)耦合性、資源約束的動態(tài)復雜性、動作時間連續(xù)性等難點[13-15]。綜上所述,對于星上規(guī)劃平臺而言,除了支持分布式框架,快速性規(guī)劃方案生成是一個重要指標。
與優(yōu)化算法的多輪次迭代求解不同,拍賣算法作為一種快速的分配算法,可以在計算速度上體現(xiàn)出很大優(yōu)勢,目前在機器人、無人機、軍事等多個領域上得到了廣泛關(guān)注[16-19]。結(jié)合啟發(fā)式策略和一對一變軌策略取優(yōu),可以實現(xiàn)短時快速的規(guī)劃問題“次優(yōu)”解獲取,比傳統(tǒng)的優(yōu)化求解方式具有更好的時間效率和更靈活的架構(gòu)。
綜上,為增強航天器自身自主化、智能化程度,實現(xiàn)快速任務規(guī)劃,得到多個航天器對多個任務的分配關(guān)系、執(zhí)行順序、機動窗口、脈沖速度指令,本文基于拍賣算法,并根據(jù)飛行器在軌服務任務規(guī)劃問題求解的需求特點,提出了一套融入啟發(fā)式目標優(yōu)先級排序策略的任務規(guī)劃求解算法,并與傳統(tǒng)的遺傳算法、模擬退火算法求解效果進行對比,驗證了所提算法的有效性和快速性。
針對GEO待服務衛(wèi)星目標,相對于LEO部署方案(服務航天器初始在LEO上運行)、應急發(fā)射方案(有服務任務時,航天器從地面發(fā)射),將服務航天器部署在相同GEO時更加經(jīng)濟,響應速度更快[20]。本文基于上述在軌服務模式建立數(shù)學模型,并考慮到如下假設:
1)在軌服務過程簡化
考慮到問題研究的通用性,本文并未限制在軌服務的具體樣式,服務過程近似處理為接觸式,且不考慮服務時太陽光照角的影響。變軌過程空間位置變化相對于航天器尺寸也極大,航天器執(zhí)行服務任務時,與目標在空間中同位置、同速度。
2)多航天器與多任務目標軌道高度相近
本文分析對象為GEO航天器與目標,考慮到實際偏差,假設存在高度差但較小。
3)多航天器與多任務目標軌道面相近
GEO上1°的軌道面傾角調(diào)整約需速度增量54 m/s,考慮到不同軌道面間的變軌調(diào)整燃料消耗極大,實際任務中考慮不會頻繁得修正軌道面與軌道面之間的夾角。本文考慮所有航天器與目標軌道面夾角很小。超出范圍的其余軌道面的服務航天器、任務目標可視為另一組獨立規(guī)劃。
4)圓軌道近似
多數(shù)GEO衛(wèi)星偏心率都極小,本文考慮所有服務航天器與任務目標軌道為圓軌道。
5)地球碰撞不考慮
受航天器燃料約束,從GEO軌道上撞擊地球需要耗費大量速度增量,分析時不必判斷碰撞概率。
在航天器進行在軌服務時,需要與目標進行交會。作為多對多任務規(guī)劃問題的重要子問題,一對一的單次軌道交會問題求解尤為重要。在通常任務規(guī)劃問題求解中[20],往往采用異面交點變軌、霍曼變軌與調(diào)相機動完成與目標的相對軌道面調(diào)整、軌高調(diào)整、相位角調(diào)整,這些變軌方式在節(jié)約燃料消耗的同時放棄了變軌過程的快速性、靈活性。由于本文只對近軌高、近共面問題進行分析,選取變軌方式更為靈活的Lambert變軌,可以實現(xiàn)軌高、軌道面調(diào)整,且相比霍曼變軌、異面交點變軌不會有很大燃料消耗差距,調(diào)相機動視為一種特例考慮。構(gòu)建變軌過程的二體運動模型如圖1所示(近共面情況下的二維截面)。過程①中,針對相近軌高、近共面的服務目標,其初始位于C1處;服務航天器初始位于A處,采用多圈Lambert變軌方式進行軌道轉(zhuǎn)移,在C2處與目標交會并進行在軌服務。
在轉(zhuǎn)移軌道運行時,初末兩點位置矢量為r1與r2,對應轉(zhuǎn)移軌道速度為v1與v2,軌道轉(zhuǎn)移過程運動時長為t,圈數(shù)為nr,Lambert變軌過程可表述為:
(v1,v2)=f(r1,r2,t,nr)
(1)
v1與v2的求解過程中[21],r1與r2矢量方向一致或相反時會導致無解,考慮當r1與r2相同時,可以采用調(diào)相軌道(視為Lambert變軌的一種特殊情況)進行補充,如圖1中過程②所示,目標初始位于B處,當運動到A處時,航天器恰好通過調(diào)相軌道運動回A處。轉(zhuǎn)移軌道初末速度可表述為:
(2)
式中:G表示萬有引力常量;Me表示地球質(zhì)量;r1表示轉(zhuǎn)移軌道初末位置矢量模;aL表示橢圓轉(zhuǎn)移軌道半長軸;h1表示轉(zhuǎn)移前軌道面法向(和轉(zhuǎn)移軌道、轉(zhuǎn)移后軌道一致)。變軌前后位置矢量r1與r2、軌道速度v10,v20與變軌前后軌道的六要素φ1,φ2相關(guān),可通過相關(guān)公式求解:
(v10,r1)=f(φ1)
(3)
(v20,r2)=f(φ2)
(4)
航天器在變軌后與目標交會視為相對靜止,速度增量Δv為:
Δv=|v1-v10|+|v2-v20|
(5)
圖1 Lambert變軌與調(diào)相機動Fig.1 Lambert transfer and phasing maneuver
為了確定一對一模式下的Lambert變軌策略,在六種不同工況下繪制變軌過程速度增量消耗與變軌時長關(guān)系曲線,工況參數(shù)如表1所示:
表1 六種不同工況Table 1 Six different conditions
服務航天器與目標偏心率均為零,對比結(jié)果如圖2所示:
圖2 速度增量與時長消耗圖Fig.2 Relation between Δv and the consumption of time
可以從圖2中得到幾個結(jié)論:
1) Lambert變軌過程中存在周期性,整體變軌圈數(shù)越多、時間越長,速度增量消耗越小。
2) 當航天器與目標軌高相同時,每一個波谷對應調(diào)相軌道情況,速度增量消耗最小。
3) 當航天器與目標軌高不同時,會在近似相同軌高處理的對應調(diào)相軌道變軌時長處,速度增量消耗迅速增大,形成一前一后兩個子波谷段。
4) 當航天器與目標存在軌道面夾角很小時,如圖中工況A相對于B,工況C相對于D,產(chǎn)生的影響很小,不影響整體變化趨勢。
5) 每一個波谷段前,近似變軌時間越長,速度增量消耗越小,大致呈遞減趨勢。
6) 當目標滯后相位角減小至60°時,第一個波谷段近似消失,此時單圈Lambert變軌近似至少消耗速度增量300 m/s??紤]受航天器燃料與任務時長約束,通常大相位角差時變軌超出了其自身能力,因此忽略目標相位角較大滯后情況下的第一個波谷,將第二個波谷視為第一個。
進一步分析,設置第一個波谷對應時長為T1:
(6)
TL 0=Tt 0-Ts
(7)
涉及到一個航天器對mi個目標服務時,一對一任務約束時長Tt 0由總時長約束T0平均分配:
(8)
當航天器與目標近軌高、近共面時,近似考慮在GEO上相對空間關(guān)系不會隨著時間發(fā)生變化,不考慮光照情況下不存在時間窗口,因此本文中航天器在任務開始時立刻進行變軌,且在涉及對多個目標服務時不設置等待時間,前一個服務完立刻服務下一個。
同時考慮在給定的變軌時長約束下,盡可能得追求燃料最省。如果航天器與目標軌高相同,則可以直接取各波谷對應調(diào)相機動的變軌時長,然而實際中很難完全保持一致,因此需要變軌時長減去時間修正量Δt以對應到各波谷段的第一個子波谷(后一個子波谷段對應耗時更久不考慮)。
綜上所述Lambert變軌過程時長t選取規(guī)則為:
(9)
式中:Δt表示時間修正量(和雙方高度差及變軌時長有關(guān));Tkmax表示可取的各波谷段第一個子波谷中時間最長的值(若共軌高沒有子波谷則為波谷)。從上述也可以看出,針對每次一對一服務計算過程,本文策略僅需要數(shù)值求解一次Lambert變軌方程。
設定在空間軌道部署有n個服務航天器,某時刻有m個目標衛(wèi)星需要被執(zhí)行相應的在軌服務,定義m個多維變量x:
x(i)=[ns,vL1,vL2,TL1,TL2,TL3],i=1,2,…,m
(10)
式中:x(i)表示每個目標對應的服務變量;ns表示服務航天器編號;vL1表示Lambert變軌第一次速度脈沖;vL2表示Lambert變軌第二次速度脈沖;TL1表示第一次變軌時刻;TL2表示第二次變軌時刻;TL3表示任務完成時刻。
1)軌道動力學約束
考慮質(zhì)點模型,受地球引力約束,航天器與目標的軌道動力學約束為:
(11)
式中:r表示空間位置矢量,r對應其模,軌道動力學約束主要用于求解在非機動情況下航天器與目標的任意時刻空間位置。若考慮攝動影響,對于非近地軌道的衛(wèi)星,其在軌運動過程中主要受地球非球形攝動的影響,在文獻[22]中給出了考慮J2攝動影響時,簡化的引力勢函數(shù):
(12)
式中:Re表示地球半徑;φ表示航天器在球坐標系上的緯度。本文中采用文獻[23]中的方法對Lambert結(jié)果進行修正:將Lambert求解速度增量附加給原軌道速度,從初始位置開始進行軌道遞推,遞推加速度由引力勢函數(shù)的梯度獲得。遞推航天器運行時間長度后,根據(jù)實際求得的軌道位置與設定的目標軌道位置進行偏差計算,并用于更新下次迭代計算初始速度。最終在多次迭代后遞推位置結(jié)果與設定位置結(jié)果趨于一致,獲得了真實的變軌參數(shù)。
本文任務規(guī)劃中考慮兩種軌道動力學約束分析方式:先考慮式(11)中二體動力學約束對式(10) 中變量進行求解,再考慮式(12)中攝動約束對va和vb進行修正;第二種為直接考慮式(12)中攝動約束對式(10)中變量進行求解。
2) 服務時長約束
由于服務時長差異對于本文中算法求解效果影響不大,故此處考慮每個目標的服務時長為一固定值簡化問題。
Ts=const
(13)
3) 目標服務次數(shù)約束
考慮每個目標被服務次數(shù)ns滿足:
ns=1
(14)
4) 單航天器總時長約束
任一服務航天器任務總時長Ti約束:
max(Ti)≤T0,i=1,2,…,n
(15)
5) 單航天器燃料約束
以速度增量近似表示:
Δvi≤ΔVi,i=1,2,…,n
(16)
式中:Δvi表示任一服務航天器i任務中總速度增量消耗;ΔVi表示服務航天器i任務開始前攜帶燃料對應的可產(chǎn)生速度增量。
在軌服務任務中,燃料消耗是重要的指標,通常要求在規(guī)定時間約束范圍內(nèi)盡可能地節(jié)省燃料。本文考慮時間緊迫性已由時間約束量表現(xiàn),因此在規(guī)劃中要求在給定的任務時長下盡可能地節(jié)省燃料消耗。針對于整體的數(shù)學求解模型,為了使的燃料總消耗代價最小,目標函數(shù)考慮采用如下形式:
(17)
傳統(tǒng)的優(yōu)化算法往往會從全局角度出發(fā)將目標適應度表述為優(yōu)化變量的函數(shù)形式,并進行迭代求解獲得最優(yōu)的決策變量。拍賣算法則通過模擬拍賣活動,每個競拍者根據(jù)“自利”原則依次對各個商品進行報價。多輪次的拍賣活動后,最終每個拍賣商品都盡可能在滿足買家預期利潤最大的前提下,找到對應的買家。在本論文中將服務航天器視為買家,目標任務視為拍賣品。
在本文中,考慮航天器數(shù)量n可能比目標數(shù)量m少,也可能比目標數(shù)量多。當n≥m時,將所有任務均進行分配即可,只有當重拍情況出現(xiàn)時會進行多輪拍賣;當n 在多輪拍賣的過程中需要確定每輪拍賣的目標集合,結(jié)果方案中每個服務航天器的服務序列取為拍得任務的順序。在以往的拍賣算法實現(xiàn)案例中,由于對拍賣品的收入、價格計算一般都只需要考慮各拍賣品和各買家關(guān)系,通常進行隨機分配。然而在軌服務領域的任務規(guī)劃有一個顯著特征:相同航天器分配得到的多個目標前后價格關(guān)聯(lián)。服務航天器分配了一個任務后再去服務下一個目標,和直接服務下一個目標相比變軌代價不同。任意航天器對任意目標的服務代價不固定導致需要全局考慮,也是以往用優(yōu)化算法進行求解運算量大的原因之一。 在本論文中,為了加快運算,引入啟發(fā)式規(guī)則,在目標的服務時序確定上引入了先驗知識,綜合考慮變軌服務代價和目標重要度評分: Gj=Vj-Cj,j=1,2,…,m (18) 式中:Gj可以視為對于目標j的優(yōu)先級評分;Vj表示對于目標j的重要度評分;Cj表示對于目標j的變軌代價評分。重要度評分需要綜合變軌相關(guān)的信息給出,這里將變軌相關(guān)先驗知識融入Cj進行表述,可以概括為如圖3所示三項原則: a) 服務先近后遠原則 對每一個服務航天器,先服務近的再服務遠的變軌燃料消耗更小,如圖3(a)中先服務1再服務2。 b) 就近服務原則 對每一個目標,盡可能要求接近的服務航天器去進行服務,如圖3(b)中目標1優(yōu)先B提供服務: c) 有限燃料聚集任務優(yōu)先原則 當服務航天器數(shù)量或燃料資源有限時,注定部分目標無法被服務,這時優(yōu)先考慮服務更聚集的目標,以在有限資源下盡量滿足更多的服務需求。如圖3(c)中A號服務航天器優(yōu)先考慮服務1而不是4: 圖3 先驗知識Fig.3 Prior knowledge 然而當燃料充足時,過早地服務聚集目標將導致本可以服務的離群目標很難被覆蓋,因此需要對航天器服務能力進行粗略的衡量。考慮兩種工況: 1) 航天器與目標半長軸為42064169 m和42264169 m,偏心率均為零,軌道面夾角為1°; 2)航天器與目標半長軸均為42164169 m,偏心率均為零,其余參數(shù)相同; (19) 式中:ΔV0為速度增量修正量(共面共高下為零),可近似取為變軌時長t下的計算結(jié)果統(tǒng)計平均值。 圖4 速度增量消耗與相位角差關(guān)系圖Fig.4 Relation between Δv and phase difference 進一步可估算當前任務場景下服務能力系數(shù)η: (20) 式中:min(Δφj)表示目標j相對航天器集的最小相位角差,考慮到當η<1時,航天器集的整體服務能力較強,因此可以優(yōu)先選取較近的目標服務;當η≥1,航天器集的整體服務能力較弱,可以優(yōu)先選取更聚集的目標。為了盡可能得覆蓋多數(shù)目標,考慮η≥1時快速趨向于第二種優(yōu)先選取方式。設計系數(shù)α: (21) 融合上述先驗知識,進行近似的變軌代價表述: (22) 對于每一個本輪次的拍賣任務j,需要計算每一個服務航天器i服務其的變軌代價(拍賣價格),即速度增量消耗,同時也用于后續(xù)的服務能力判斷。當服務航天器無分配任務時,考慮在總時長約束范圍內(nèi)進行變軌速度增量求解,由式(5)給出,變軌代價和速度增量消耗Pij為: Pij=Δvij (23) (24) 對于每一個買家(服務航天器)i0,在輪次k的拍賣活動中,需要追求其自身的最大利潤,選中的目標任務j0應滿足: (25) i=1,2,…,n (26) (27) 式中:ε為設置正值參數(shù),目的是使任務在被選中時必定提高價格,確保在多個買家相互競爭中任務成本不斷上升,避免算法陷入死循環(huán)。ε值如果選大了會使得最終方案總利潤降低,結(jié)果不理想;選小了則算法計算效率下降。后續(xù)若仍有買家i′依據(jù)式(25)原則選取目標任務j0,則認為發(fā)生了競標沖突。 競標沖突發(fā)生后,任務j0重新被分配給買家i′,同時任務j0的價格重新由式(26)和式(27)進行更新;買家i0重新在拍賣任務中選擇利潤最高的任務,并再次進行燃料約束判斷及價格更新。若競拍沖突再次發(fā)生,迭代重復上述過程,直到無競拍沖突事件發(fā)生或航天器無法在滿足燃料約束前提下分得任務。 以往的拍賣算法設計過程中,如果對于某一買家,本輪任務中沒有一個任務滿足約束條件,則認為該買家沒有拍得任務。在航天器任務規(guī)劃計算過程中,Lambert變軌過程的變軌時長是通過提前設置確定的,因此時間消耗必定不會超過閾值,考慮通過任務價格是否超過剩余速度增量來進行判斷。 在拍賣結(jié)束后剩余未分配的任務認為流拍,但考慮到航天器任務分配中可能出現(xiàn)目標扎堆而服務航天器分散的可能:多個目標可以被同一個航天器進行服務,而不能被其他航天器服務。因此設計流拍的任務自動進入下一輪拍賣任務候選集進行重拍。 當所有買家均已競價完畢,則認為本輪拍賣結(jié)束,拍賣成功的任務歸屬相應的買家并進入下一輪拍賣。在每一輪次的拍賣過程結(jié)束后,需要根據(jù)式(18)對所有剩余任務進行優(yōu)先級更新,并選出下一輪拍賣任務,同時根據(jù)式(5),(24),(26)和(27)確定拍賣任務的速度消耗、價格。該過程為增量式分配,對于執(zhí)行任務過程中新添加的任務或者未完成任務狀態(tài)發(fā)生改變,可以更新剩余任務集實現(xiàn)快速規(guī)劃。 拍賣算法整體的流程如框圖5所示。當所有的任務均已分配完畢,或者在本輪次拍賣中所有拍賣品均流拍,則認為拍賣結(jié)束。若式(5)計算過程中未考慮攝動力影響,則對方案中速度脈沖進行修正,最終輸出規(guī)劃方案。 圖5 改進啟發(fā)式拍賣算法流程框圖Fig.5 Schematic diagram of the improved heuristic auction algorithm 若將本文算法應用于航天器星上在線規(guī)劃,需要設計計算體系。當任何一個航天器探測到需要清除的碎片目標,或者需要被保障時,將被服務目標的軌道六根數(shù)信息、時刻信息發(fā)布給其余服務航天器,所有服務航天器隨機依次進行競拍。算法實現(xiàn)過程中價格計算考慮二體動力學約束。 考慮實際在軌應用中服務航天器的運算能力存在差異,設計如圖6集中式與分布式兩種計算體系: 圖6 計算體系Fig.6 Computing architecture (1)集中式體系主要考慮到服務航天器運算能力較低,要求計算中心航天器具備較強的運算能力,并對其依賴度高。計算中心航天器收集各服務航天器信息及發(fā)布的任務信息,進行集中式運算,各服務航天器按照隨機順序依次競拍,最后將考慮攝動力約束修正后的規(guī)劃指令下發(fā)各服務航天器執(zhí)行。計算中心航天器也可以具備任務信息發(fā)布的能力。 (2)分布式體系要求服務航天器具備一定的運算能力進行分布式信息交互與運算。該模式下任意服務航天器出現(xiàn)故障對其他服務航天器影響較小。可以用圖G(V,E)表示服務航天器通信網(wǎng)絡的拓撲結(jié)構(gòu),圖中點的集合V表示服務航天器集合U,E表示連接各節(jié)點的邊。如果兩個服務航天器可以通信,則存在連接這兩個節(jié)點的邊;若任意兩個節(jié)點間至少存在一條鏈路,則稱通信網(wǎng)絡是聯(lián)通的。本文中假設滿足聯(lián)通要求,由于分布式體系中沒有計算中心收集并發(fā)布每輪次任務信息、價格信息,因此需通過信息交互過程計算得出。具體步驟為: a)各任務發(fā)布航天器發(fā)布任務,所有服務航天器通過信息交互獲得任務集; b)通過信息交互各服務航天器獲得該輪次任務優(yōu)先級排序結(jié)果,判定該輪次分配任務集; c)通過信息交互各服務航天器獲得所有任務價格信息、收入信息,按照隨機順序進行競拍。競拍過程中也依賴于信息交互進行價格更新、沖突解決; d)該輪次任務分配后進入下一輪次,直到滿足結(jié)束條件。各服務航天器分別考慮攝動力約束對自身分得任務進行速度脈沖修正、執(zhí)行。 本節(jié)將設置算例對本文所提出的算法進行仿真驗證。仿真過程采用個人計算機完成,CPU型號為Intel Core i5-10210U@1.6G Hz,內(nèi)存為16 GB。設計在某次在軌服務任務中,有5個服務航天器和20個待服務目標,每個服務航天器攜帶燃料可以滿足200 m/s的速度增量產(chǎn)生,要求在10天內(nèi)完成多對多在軌服務任務,目標的重要度評分相同,各服務航天器對所有目標的收入相同。設置雙方軌道偏心率和近地點幅角均為零,其余六根數(shù)信息服務航天器見表2,目標任務見表3。服務航天器和目標的軌道傾角、升交點赤經(jīng)在正負0.05°之間隨機選取,平近點角在50°至60°之間隨機選取。 表2 各服務航天器軌道參數(shù)Table 2 Orbital parameters of each servicing spacecraft 表3 目標軌道參數(shù)Table 3 Orbital parameters of each target 續(xù)表3 將本文設計算法與常用的遺傳算法(GA)與模擬退火算法(SA)進行比較。其中模擬退火算法與遺傳算法為了保證對比的有效性和快速性,針對一對多部分時序取優(yōu)過程統(tǒng)一采用模擬退火算法實現(xiàn),多對多規(guī)劃部分迭代初值采用隨機選取。考慮加速運算,均加入了一對多規(guī)劃結(jié)果歷史存儲與查詢部分,以減少重復運算,仿真時間均設定為2022年5月10日04∶00∶00~2022年5月20日04∶00∶00。算法參數(shù)設定變軌時間修正量1800 s,代價更新ε取為0.05,GA種群規(guī)模和SA馬爾科夫鏈長度取為10,GA最大遺傳代數(shù)取為50,SA初始溫度數(shù)值取為100,SA衰減參數(shù)取為0.8,服務時長取為1800 s。 改進啟發(fā)式拍賣算法(Improved heuristic auction algorithm,IHAA)任務規(guī)劃結(jié)果見表4和表5,考慮二體動力學約束、J2攝動計算價格規(guī)劃結(jié)果相同,速度增量消耗總量均為250.0093 m/s。 表4 任務規(guī)劃結(jié)果(部分)Table 4 Part of the task planning results 表5 任務分配結(jié)果Table 5 Task assignment results 為了驗證本文算法的快速性和有效性,以IHAA算法結(jié)果目標函數(shù)值作為遺傳算法與模擬退火算法的迭代結(jié)束條件,以對比達到同樣性能時,三種算法的求解效率差異,仿真對比結(jié)果見表6。 表6 三種算法求解效率對比Table 6 Comparison of the efficiency of three algorithms 表6中第二列表示僅考慮二體動力學計算算法中每一步目標函數(shù)(拍賣價格);第三列表示對第二列結(jié)果(兩次脈沖速度矢量)考慮J2攝動影響進行修正后的總耗時;第四列表示每一步目標函數(shù)(拍賣價格)計算時便考慮J2攝動影響。三類算法速度增量消耗與迭代次數(shù)變化關(guān)系對比如圖7所示。 圖7 三種算法迭代計算對比圖Fig.7 Comparison of iterative calculation of three algorithms IHAA算法不存在迭代次數(shù)的概念,考慮對比效果在圖7中畫為一條直線。觀察結(jié)果可以看出拍賣算法在短時間內(nèi)能快速給出一個相對較優(yōu)的方案,在時間上相對于傳統(tǒng)優(yōu)化算法有極大優(yōu)勢,能大幅度提高求解效率,尤其是僅考慮二體動力學約束計算拍賣價格時,具備星上自主在線規(guī)劃潛力(考慮J2攝動修正機動指令可由各執(zhí)行航天器分別計算)。 當考慮燃料不充足時,設置所有服務航天器攜帶燃料可以滿足10 m/s的速度增量產(chǎn)生,仍然要求十天內(nèi)完成任務,此時GA算法和SA算法均無法得到有效解,IHAA算法實現(xiàn)分配結(jié)果如表7所示。可以看出當燃料資源緊張時,相比于優(yōu)化算法無法給出規(guī)劃,IHAA仍然可以實現(xiàn)部分結(jié)果輸出。 表7 燃料不充足時任務分配結(jié)果Table 7 Task assignment results when fuel is insufficient 無論是集中式計算體系還是分布式計算體系,都需要確定各服務航天器的競拍順序。設計中各服務航天器可按照隨機順序依次競拍,需要分析該策略對于分配方案結(jié)果的影響。實驗中改變5個服務航天器的競拍順序,每次規(guī)劃方案在形成規(guī)劃方案后對兩次脈沖速度矢量考慮J2攝動影響修正,共120種時序下計算速度增量總消耗值的變化情況。 圖8 速度增量消耗與競拍時序關(guān)系圖Fig.8 Relation between Δv and auction order 圖8中更新工況1航天器速度增量改為1000 m/s,雙方平近點角在50°至100°間隨機選取更新,更新工況2將ε值調(diào)整為0.5??梢钥闯?不同的航天器競拍順序?qū)τ谧罱K規(guī)劃方案影響相對較小,且速度增量消耗量優(yōu)于優(yōu)化算法初始多輪次的計算結(jié)果,具體與雙方軌道根數(shù)、代價更新ε值等有關(guān)。在本文算例中,120種競拍順序最終燃料消耗相同,規(guī)劃結(jié)果也相同??梢钥闯鲭S機順序策略具備可行性。 本文針對GEO航天器多對多在軌服務任務規(guī)劃問題建立了數(shù)學模型,探索運用拍賣算法實現(xiàn)快速的規(guī)劃方案制定,設計了改進啟發(fā)式拍賣算法,解決了傳統(tǒng)優(yōu)化算法制定規(guī)劃方案耗時久、計算資源消耗大的問題,最后通過仿真實驗驗證了所提算法的有效性和可行性。研究成果及總結(jié)如下: 1) 建立了基于Lambert變軌的規(guī)劃問題數(shù)學表征,并在給定變軌時長約束前提下快速確定變軌時長與速度增量消耗,可用于拍賣算法的價格計算和優(yōu)化算法的代價函數(shù)計算。 2) 提出了基于拍賣算法的快速規(guī)劃,針對拍賣品的時序確定問題提出了一種基于先驗知識的確定策略,并設計了重拍機制以增加目標的被選中概率,在考慮J2攝動影響下給出最終任務規(guī)劃方案。仿真測試結(jié)果表明,與遺傳算法、模擬退火優(yōu)化算法相比,具有更高效的“次優(yōu)”方案確定能力,在動態(tài)環(huán)境下(突發(fā)事件發(fā)生或新任務添加)相比傳統(tǒng)優(yōu)化算法更快速,具備快速形成有效規(guī)劃方案的能力。 3) 在燃料、時間約束限制強時,優(yōu)化算法往往難以找到可行的迭代初值導致無解,而此時本文所提算法可以給出部分可行方案。但同時也可能會出現(xiàn)實際可以覆蓋所有任務,但方案未實現(xiàn)全分配的現(xiàn)象,這是由算法結(jié)果并不是全局最優(yōu)解導致的。 4) 鑒于本文算法的快速性,后續(xù)可考慮用于效能評估指導服務航天器空間部署。同時本文設計了集中式與分布式兩種計算體系,后續(xù)可考慮應用于星上規(guī)劃平臺。若運算時間充裕,允許多次迭代優(yōu)化,本文算法亦適用于優(yōu)化算法的初值尋找。2.2 拍賣任務價格計算
2.3 出價策略設計
2.4 競標沖突過程設計
2.5 重拍機制設計
2.6 中標機制
2.7 方案確定
2.8 星上在線規(guī)劃
3 仿真校驗
3.1 仿真工況
3.2 算法效率對比
3.3 買家競拍順序影響分析
4 結(jié) 論