徐 旭,張桀睿,王 冠,馬廣程,夏紅偉
(哈爾濱工業(yè)大學(xué)空間控制與慣性技術(shù)研究中心,哈爾濱150001)
隨著航天科技的發(fā)展,航天器結(jié)構(gòu)變得愈加復(fù)雜,新型航天器上往往搭載多種活動載荷,例如機械臂、繩網(wǎng)捕獲機構(gòu)以及視覺敏感裝置等。在活動載荷工作時,航天器質(zhì)心以及轉(zhuǎn)動慣量等質(zhì)量特性參數(shù)會產(chǎn)生一定的改變,給航天器的姿態(tài)控制帶來一定影響。為保證航天器姿態(tài)控制的精度、快速性和穩(wěn)定性,實時獲得航天器的質(zhì)量特性參數(shù)是十分必要的。
在工程實際中,航天器的質(zhì)量特性往往僅能夠通過理論分析或者間接測量獲得,例如通過質(zhì)量特性測量裝置測量、質(zhì)量分解計算以及有限元分析等方法。但這些方法測量精度不高且對參數(shù)時變系統(tǒng)無能為力,這就導(dǎo)致了在航天器執(zhí)行空間任務(wù)時,實時變化的質(zhì)量特性參數(shù)會對航天器產(chǎn)生未知擾動,嚴重影響航天器的性能[1-3]。
對于質(zhì)量特性變化產(chǎn)生的擾動,可以使用魯棒性強的控制律來抑制,如滑模控制、模糊控制以及自適應(yīng)控制。但此類控制律均是被動抑制方法,而質(zhì)量特性辨識方法則是從根源上補償了該類擾動,利用慣組等測量元件和飛輪、噴氣發(fā)動機等執(zhí)行元件,在線動態(tài)辨識出航天器質(zhì)量特性參數(shù)及其改變情況,對控制器參數(shù)設(shè)計提供依據(jù)[4-6]。
Bergman、Williams以及Wilson等人相繼提出了高斯二階濾波辨識方法、基于指數(shù)加權(quán)遞歸最小二乘法等算法[7],Wilson提出了基于指數(shù)加權(quán)遞歸最小二乘辨識衛(wèi)星的質(zhì)量特性參數(shù)的方法[8]?;谝陨涎芯浚谧钚《朔ǖ谋孀R手段在各類工程應(yīng)用中愈加廣泛[9-11]。此外,王書廷、侯振東等人提出了采用推力器組合為激勵的衛(wèi)星質(zhì)量特性辨識方法,該方法將質(zhì)心和慣量矩陣進行解耦辨識,減小了耦合帶來的辨識誤差[12];何驍?shù)柔槍教炱鞔蠼嵌葯C動問題,基于卡爾曼濾波的撓性附件振動模態(tài)狀態(tài)估計,提出了一種帶撓性航天器轉(zhuǎn)動慣量的辨識方法[13];倪智宇等提出了改進的基于遞歸預(yù)測器的子空間識別(Recursive Predictor-based Subspace Identification,RPBSID)方法并應(yīng)用于衛(wèi)星時變模態(tài)參數(shù)辨識,減小了辨識過程中的數(shù)據(jù)量,顯著節(jié)約了在軌辨識過程的計算時間[14]。但以上方法均為離線或半在線辨識,無法滿足實時、在線辨識任務(wù)的需求,在質(zhì)量特性動態(tài)改變上缺少或具有較差的跟蹤性。除此之外,以上方法大都是基于理論和數(shù)字仿真層面,缺少全物理試驗環(huán)節(jié)和對實際應(yīng)用的指導(dǎo)性。
由于航天器工作環(huán)境的特殊性,空間任務(wù)需要在地面上進行仿真試驗驗證。目前,國內(nèi)外許多科研單位已對航天器地面仿真技術(shù)進行了相應(yīng)的研究,且大多數(shù)基于數(shù)字仿真,而為了充分進行空間任務(wù)的地面驗證,有必要開展地面半物理仿真以及全物理仿真試驗[15]。常用的方法有懸掛法,落體法,液浮法和氣浮法,其中氣浮法的應(yīng)用最為廣泛[16,17]。我國對基于氣浮仿真的航天器全物理仿真系統(tǒng)研究起步較晚,北京控制工程研究所開啟了國內(nèi)三軸氣浮臺技術(shù)應(yīng)用的先河。隨后哈爾濱工業(yè)大學(xué)和上海衛(wèi)星工程研究所等單位開展了一系列有關(guān)三軸氣浮臺的研究[18]。
在這種背景下,針對上述航天器質(zhì)量特性的可辨識性及辨識問題,本文分析了影響辨識模型可辨識性的因素,根據(jù)此類辨識模型并基于漸消記憶遞推最小二乘辨識理論,提出了一種改進遞推最小二乘法的高效率在線辨識方法,與傳統(tǒng)方法相比,該方法可解決航天器質(zhì)量特性在軌實時、在線辨識的任務(wù)需求,為高精度姿態(tài)控制提供充分的先驗信息,解決了以往傳統(tǒng)離線或半在線辨識方法實時跟蹤性能差,實用性不高的缺點,且具有收斂速度快,跟蹤效率高以及辨識誤差小的優(yōu)點;同時為了驗證該算法在實際工程任務(wù)中的可行性,本文提出了一種基于三軸氣浮臺的航天器地面全物理仿真系統(tǒng),通過數(shù)字仿真和全物理仿真試驗的方式驗證了上述算法的可行性,解決了質(zhì)量特性辨識方法常常停留在理論分析及數(shù)學(xué)仿真層面上的問題,彌補了質(zhì)量特性辨識在全物理仿真試驗上的空缺。
本文首先針對航天器質(zhì)量特性辨識問題給出了一類航天器質(zhì)量特性辨識模型以及其在線辨識算法;然后,針對該類模型分析了其可辨識性的影響因素,提出了一種基于三軸氣浮臺的地面全物理仿真系統(tǒng);最后,基于該全物理仿真系統(tǒng),通過數(shù)字仿真與全物理試驗兩種方法分析了在線辨識算法的收斂速度與辨識誤差,驗證了該算法的正確性及可行性。
在研究航天器軌道動力學(xué)模型中,需對不同的坐標系進行定義,以便于航天器姿態(tài)描述。本文中所需要的坐標系定義如下:
(1)地心慣性坐標系
地心慣性坐標系Ox y z原點為地球質(zhì)心,x軸與地球赤道平面交于春分點,z軸垂直于赤道平面指向地球自轉(zhuǎn)角速度方向。
(2)軌道坐標系
軌道坐標系Ox0y0z0原點為航天器質(zhì)心,z0軸從原點指向地心,x0軸在軌道面內(nèi)與z0軸垂直,并指向航天器速度方向。y0軸在軌道平面負法線方向,形成右手正交坐標系。
(3)本體坐標系
本體坐標系Oxbybzb原點為航天器質(zhì)心。初始狀態(tài)下,航天器的本體坐標系與軌道坐標系重合,當(dāng)航天器發(fā)生姿態(tài)運動時,本體坐標系開始旋轉(zhuǎn),不再與軌道坐標系重合。
僅有飛輪作為航天器的執(zhí)行機構(gòu)時,航天器的動力學(xué)方程為:
其中,J為航天器的轉(zhuǎn)動慣量矩陣;Jf為飛輪的轉(zhuǎn)動慣量;ω為航天器本體轉(zhuǎn)動在慣性坐標系下投影的角速度;ωf為飛輪角速度。
整理式(1)可得動力學(xué)差分方程如下:
其中
其中ωx、ωy和ωz分別為航天器各個軸的角速度;Tx、Ty和Tz分別為航天器各個軸的輸入力矩,該力矩由飛輪提供;dt為系統(tǒng)的采樣時間;ax、ay和az分別為航天器三個軸上飛輪的加速度。
上一小節(jié)給出了航天器的動力學(xué)模型,本小節(jié)根據(jù)該模型給出一種改進遞推最小二乘法的質(zhì)量特性在線辨識算法。
定義:
對于實對稱陣P,定義:
根據(jù)系統(tǒng)辨識理論,該航天器質(zhì)量特性辨識模型的最優(yōu)解為:
其中
由于基本最小二乘法不適用于具有參數(shù)時變特性的動態(tài)系統(tǒng),為了在線辨識出航天器質(zhì)量特性參數(shù)及其實時變化情況,采用改進遞推最小二乘法具有更好的效果。
依據(jù)式(2)和式(3),可建立以ε1、ε2和ε3為待辨識參數(shù)的遞推最小二乘公式:
其中,E為單位矩陣;ξ∈(0,1)為收斂因子,用于調(diào)節(jié)辨識收斂速度。需指出,當(dāng)選取較大的收斂因子時,迭代運算前期辨識結(jié)果振蕩幅度越小,迭代過程辨識結(jié)果收斂速度越慢;當(dāng)選取較小的收斂因子時,迭代過程辨識結(jié)果收斂速度較快,但前期振蕩明顯,很容易導(dǎo)致辨識結(jié)果發(fā)散。因此,在該因子的選取上,需兼顧考慮上述因素,以獲得迭代辨識過程的最佳收斂效果。λ∈(0,1)為遺忘因子,通過對舊數(shù)據(jù)按指數(shù)加權(quán),一定程度上衰減舊數(shù)據(jù)的作用,進而達到辨識數(shù)據(jù)更新的效果。通常該因子越小,舊數(shù)據(jù)的衰減效果越明顯。
分別對x、y和z軸進行遞推運算,可得:
該算法流程如表1所示。
表1 改進遞推最小二乘法的在線辨識算法Tab.1 Online identification method based on the improved asymptotic least squares
在工程應(yīng)用中,必須要考慮參數(shù)的可辨識性,其代表著模型中的每一個參數(shù)是否能夠通過輸入輸出的觀測數(shù)據(jù)來確定。如果上述說法對于某一模型成立,則代表著模型是參數(shù)可辨識的。
模型的參數(shù)可辨識性是模型本身的固有屬性,依賴于模型的觀測數(shù)據(jù),不依賴于模型參數(shù)的辨識算法。一種方法是分析辨識模型來得到模型的參數(shù)可辨識性。該方法適用于理論證明,但在工程應(yīng)用中缺少應(yīng)用性。而工程實際中常用的方法是設(shè)計一些激勵信號來保證系統(tǒng)是可辨識的。
由式(10)知,系數(shù)矩陣A由系統(tǒng)的姿態(tài)數(shù)據(jù)構(gòu)成,故只需姿態(tài)數(shù)據(jù)保證T0>A A成立,即可滿足參數(shù)可辨識條件2。
同時滿足條件1和條件2,該模型參數(shù)可辨識。
系數(shù)矩陣A由航天器輸出的姿態(tài)數(shù)據(jù)組成,所以在實際應(yīng)用中,分析系數(shù)矩陣A確定系統(tǒng)參數(shù)可辨識性的方法比較被動,我們難以主動地保證系統(tǒng)是可辨識的。為了解決上述問題,我們要主動選擇并設(shè)計一些激勵信號,將模型的參數(shù)可辨識性從被動證明轉(zhuǎn)為主動滿足。
從系統(tǒng)辨識理論來看,可辨識性與模型的輸入密切相關(guān),其依賴于模型的輸入輸出觀測數(shù)據(jù)。為了保證模型是可辨識的,激勵信號要在整個觀測周期上持續(xù)激勵出系統(tǒng)的所有模態(tài)。
當(dāng)系統(tǒng)參數(shù)無法通過觀測數(shù)據(jù)辨識出來時,一個原因可能是輸入輸出的觀測數(shù)據(jù)不合格。換言之很有可能是激勵信號無法有效激勵出系統(tǒng)的各個模態(tài),不能滿足參數(shù)辨識的要求,導(dǎo)致系統(tǒng)參數(shù)不能正確地辨識出來。
引理2[19]:滿足需求的激勵信號能夠激勵出系統(tǒng)的全部模態(tài),使得系統(tǒng)的輸出數(shù)據(jù)包含系統(tǒng)的全部信息,此種信號就被定義為是持續(xù)激勵信號。
其數(shù)學(xué)表述為:
對于激勵信號r(t)∈R,定義一個n維激勵信號列向量:
下式中I為單位陣,若存在整數(shù)N≥n和常數(shù)α> 0使得以下公式成立:
其中
t≥N+n-2
則稱激勵信號r(t)是n階持續(xù)激勵信號。該條件被稱為是持續(xù)激勵條件。
其中正常數(shù)α在不同的激勵信號背景下是有不同取值的。若存在某一待辨識系統(tǒng)有n個參數(shù),則要求其激勵信號至少要滿足n階條件。除此之外,對于確定性系統(tǒng)或模型,其激勵信號不需要對每一個持續(xù)激勵條件中的t都成立,只需存在一個t≥N+n-2使得該條件成立即可。
為了提高算法的部署效率,本文研究了基于三軸氣浮臺的航天器地面全物理仿真系統(tǒng)的設(shè)計與實現(xiàn),并將本文所提算法在該系統(tǒng)中進行試驗、分析與驗證。
基于三軸氣浮臺的航天器地面全物理仿真系統(tǒng)分為臺上綜合試驗系統(tǒng)和臺下監(jiān)控系統(tǒng)。
臺上試驗系統(tǒng)由三軸氣浮臺及儀表平臺、臺上管理控制單元、電源模塊、調(diào)平衡模塊、數(shù)據(jù)傳輸功能模塊、轉(zhuǎn)動慣量測量模塊等組成,如圖2-3所示。儀表平臺主要為臺上試驗系統(tǒng)各組成部分提供硬件安裝接口;臺上管理控制單元主要完成以下功能:
圖2 三軸氣浮臺實物圖Fig.2 Physical drawing of the three-axis air bearing testbed
(1)對臺上的調(diào)平衡模塊的控制;
(2)對姿態(tài)測量信息的采集和管理;
(3)對臺上的電源模塊進行綜合管理和控制;
(4)對臺上仿真試驗參試設(shè)備的控制和管理;
(5)對臺上工作狀態(tài)的記錄系統(tǒng)控制和管理。
電源模塊用來給臺上試驗系統(tǒng)所有電氣設(shè)備供電;調(diào)平衡模塊用于三軸氣浮臺于試驗前的質(zhì)心調(diào)節(jié)工作;數(shù)據(jù)傳輸功能模塊用于收集臺上所有實驗數(shù)據(jù)以及各設(shè)備的工作狀態(tài)并發(fā)送給臺下監(jiān)控系統(tǒng);轉(zhuǎn)動慣量測量模塊負責(zé)辨識分析三軸氣浮臺的轉(zhuǎn)動慣量參數(shù)。
臺下監(jiān)控系統(tǒng)由數(shù)據(jù)傳輸功能模塊、安全輔助功能模塊以及臺下監(jiān)控軟件組成。數(shù)據(jù)傳輸功能模塊負責(zé)接收由臺上數(shù)據(jù)傳輸功能模塊發(fā)送來的實驗數(shù)據(jù);安全輔助功能模塊包括傘狀支撐和千斤頂,分別用于三軸氣浮臺運動限位以及支撐;臺下監(jiān)控軟件用于顯示、分析、存儲和回放該實驗數(shù)據(jù),并向臺上綜合試驗系統(tǒng)下達控制指令。
圖3 地面全物理仿真系統(tǒng)組成示意圖Fig.3 Ground full physicssimulation system compositi on diagram
三軸氣浮臺通過供氣系統(tǒng)向氣浮球和球軸承中提供壓縮空氣形成氣膜來使其儀表平臺浮起,來模擬衛(wèi)星在軌時微干擾力微干擾力矩的動力學(xué)環(huán)境。
通過在三軸氣浮臺上安裝星上載荷、星載計算機、慣性測量單元以及角動量交換裝置等設(shè)備來搭建三軸氣浮臺的測控系統(tǒng)。再配置好其微干擾力矩的工作環(huán)境,包括降低環(huán)境風(fēng)干擾,調(diào)節(jié)三軸氣浮臺質(zhì)心至其旋轉(zhuǎn)中心位置,減小重力偏心矩的影響,來使其承載的試驗系統(tǒng)滿足試驗要求,以完成衛(wèi)星在軌動力學(xué)的各項地面試驗工作。
第一節(jié)給出了航天器在軌動力學(xué)模型以及質(zhì)量特性在線辨識算法,第二節(jié)給出了模型的參數(shù)可辨識性,本節(jié)通過數(shù)學(xué)仿真以及地面試驗驗證該辨識算法的正確性與可行性。
設(shè)該仿真模型中,航天器的轉(zhuǎn)動慣量矩陣J(單位為kg·m2)為:
設(shè)該模型中三個軸上的飛輪輸出幅值為±100mNm的力矩方波信號,信號周期分別為14s,16 s和18s,采樣時間為0.02s;初始化辨識信息θ(0)=0,P(0)=αI,α=106~1010;設(shè)置遺忘因子λ=0.99,收斂因子ξ=0.15。得到的辨識結(jié)果如圖4-6所示。
圖4 Jx辨識仿真結(jié)果對比圖Fig.4 Jxidentification simulation result comparisonchart
圖5 Jy辨識仿真結(jié)果對比圖Fig.5 Jyidentification simulat ion result comparisonchart
圖6 Jz 辨識仿真結(jié)果對比圖Fig.6 Jzidentification simulation result comparisonchart
改進遞推最小二乘法和傳統(tǒng)方法仿真結(jié)果精度一致,分別為Jx= 386.4 kg·m2,Jy=401.7kg·m2以及Jz= 385.6kg·m2,誤差率分別為1.2%,0.7%和1.6%。如圖7所示,以每5s數(shù)據(jù)變化率小于0.5%作為收斂指標,改進遞推最小二乘法較傳統(tǒng)方法具有更快的收斂速度,在實際應(yīng)用中更具優(yōu)勢。
圖7 辨識仿真結(jié)果對比圖Fig.7 Identification simulation resultscomparison chart
下面通過地面全物理仿真試驗來驗證本文算法的正確性與可行性。在試驗過程中,三個軸上的飛輪力矩為該系統(tǒng)的力矩輸入,通過該力矩信息以及慣性部件采集到的姿態(tài)數(shù)據(jù)即可辨識出轉(zhuǎn)動慣量矩陣。用于該項地面試驗的三軸氣浮臺的真實轉(zhuǎn)動慣量矩陣(單位為kg·m2)為:
令三軸氣浮臺x,y和z軸上飛輪輸出與仿真分析中相同的力矩方波信號,即信號幅值為±100mNm,信號周期分別為14s,16s和18s。采樣時間為0.02s,辨識得到三軸氣浮臺各個軸轉(zhuǎn)動慣量如圖8-10所示。
圖8 Jx辨識結(jié)果圖Fig.8 Jxidentification result c hart
圖9 Jy辨識結(jié)果圖Fig.9 Jyidentification result chart
辨識得到的三軸氣浮臺各個軸的轉(zhuǎn)動慣量分別為Jx= 402.4 kg·m2,Jy=408.1kg·m2以及Jz= 406.7kg·m2。誤差率分別為2.8%,2.4%以及3.8%。
試驗時還分析了數(shù)據(jù)采樣時間對辨識精度的影響。分別選取數(shù)據(jù)采樣時間為0.01s,0.02s,0.04s,0.05s和0.1s,得到了不同收斂速度下的辨識結(jié)果如圖11-13所示。
圖1 坐標系定義圖Fig.1 Coordinate system definition diagram
圖10 Jz辨識結(jié)果圖Fig.10 Jzidentificati on result chart
圖11 Jx在不同數(shù)據(jù)采樣時間下的辨識結(jié)果Fig.11 Identification resultsof Jxat different sampling times
圖12 Jy在不同數(shù)據(jù)采樣時間下的辨識結(jié)果Fig.12 Identification resultsof Jyat different sam pling times
圖13 Jz在不同數(shù)據(jù)采樣時間下的辨識結(jié)果Fig.13 Identification results of Jzat different sampling times
地面全物理仿真試驗結(jié)果討論:
(1)由于地面試驗中慣性測量單元采集到的姿態(tài)信息會不可避免地存在環(huán)境干擾及噪聲,所以在不同的數(shù)據(jù)采樣時間下,會得到不同的轉(zhuǎn)動慣量辨識收斂速度和結(jié)果。
(2)在該次地面試驗的平臺及環(huán)境條件下,采樣時間為0.02 s下的辨識收斂速度最快,辨識誤差最小,為2.8%。除采樣時間0.01 s以外,采樣時間越長,辨識收斂速度越慢,辨識誤差越大。
(3)采樣時間為0.01 s時放大了測量噪聲對辨識的影響,導(dǎo)致其辨識誤差及收斂速度不如采樣時間為0.02 s的。
(4)五種數(shù)據(jù)采樣時間下的辨識誤差率均在4.5%以內(nèi),滿足工程應(yīng)用需求。
通過本次仿真分析以及地面試驗,充分驗證了本文給出的轉(zhuǎn)動慣量在線辨識算法的可行性與有效性。
本文針對航天器質(zhì)量特性在線辨識問題,提出一種高效率在線辨識方法和地面全物理仿真試驗系統(tǒng)。通過建立適用于航天器轉(zhuǎn)動慣量辨識的數(shù)學(xué)模型,分析了其可辨識性和數(shù)據(jù)采樣時間的影響機理,基于漸消記憶遞推最小二乘辨識理論,提出了一種改進遞推最小二乘法的在線辨識方法。為了驗證在線辨識方法的正確性與可行性,本文設(shè)計了一種基于三軸氣浮臺的地面全物理仿真試驗系統(tǒng)。數(shù)學(xué)分析表明,改進遞推最小二乘法的在線辨識方法收斂速度優(yōu)于傳統(tǒng)辨識方法;全物理試驗表明,該算法的辨識精度優(yōu)于96.2%,驗證了本文提出的航天器質(zhì)量特性在線辨識方法的可行性與高效性,突出了該方法具有實用性強、精度高、收斂速度快的優(yōu)點,對航天器質(zhì)量特性在線辨識的算法設(shè)計和地面驗證具有一定的參考應(yīng)用價值。