孫俊,張世杰*,馬也,楚中毅
1.哈爾濱工業(yè)大學(xué) 航天學(xué)院,哈爾濱 150001
2.上海航天控制技術(shù)研究所 上海市空間智能控制技術(shù)重點實驗室,上海 201109 3.北京航空航天大學(xué) 儀器科學(xué)與光電工程學(xué)院,北京 100083
空間非合作目標(biāo)慣性參數(shù)的Adaline網(wǎng)絡(luò)辨識方法
孫俊1,2,張世杰1,*,馬也3,楚中毅3
1.哈爾濱工業(yè)大學(xué) 航天學(xué)院,哈爾濱 150001
2.上海航天控制技術(shù)研究所 上海市空間智能控制技術(shù)重點實驗室,上海 201109 3.北京航空航天大學(xué) 儀器科學(xué)與光電工程學(xué)院,北京 100083
空間在軌操作中,航天器在對空間非合作目標(biāo)的抓捕行動常常導(dǎo)致航天器本體的姿態(tài)和空間軌跡發(fā)生變化。為克服空間非合作目標(biāo)對航天器本體動力學(xué)、運(yùn)動學(xué)的影響,使控制系統(tǒng)做出精準(zhǔn)及時的姿控策略調(diào)整,確保航天器正常在軌工作和軌跡姿態(tài)的高精度,需對抓捕的非合作目標(biāo)的慣性參數(shù)進(jìn)行辨識。針對傳統(tǒng)辨識方法依賴廣義逆求解導(dǎo)致的辨識過程運(yùn)算量大,且數(shù)值容易產(chǎn)生劇烈振蕩,造成辨識結(jié)果不穩(wěn)定等不足,采用基于歸一化最小均方(NLMS)準(zhǔn)則的Adaline神經(jīng)網(wǎng)絡(luò)方法進(jìn)行空間非合作目標(biāo)慣性參數(shù)的辨識。首先,基于動量守恒理論建立抓捕后的航天器—機(jī)械臂—空間非合作目標(biāo)系統(tǒng)模型;然后將辨識方程的系數(shù)矩陣作為網(wǎng)絡(luò)的輸入和輸出,空間非合作目標(biāo)的慣性參數(shù)作為神經(jīng)網(wǎng)絡(luò)的訓(xùn)練權(quán)重,基于迭代步長可變的NLMS準(zhǔn)則實現(xiàn)對目標(biāo)慣量參數(shù)的快速、準(zhǔn)確辨識;最后,在構(gòu)造的ADAMS/MATLAB聯(lián)合仿真平臺上進(jìn)行了驗證。仿真結(jié)果表明,基于NLMS準(zhǔn)則的Adaline神經(jīng)網(wǎng)絡(luò)是一種快速、準(zhǔn)確辨識目標(biāo)慣量參數(shù)的有效方法。
航天器;非合作目標(biāo);慣性參數(shù);神經(jīng)網(wǎng)絡(luò);辨識
在軌服務(wù)技術(shù)一直是空間技術(shù)中十分重要且競爭激烈的領(lǐng)域。在軌服務(wù)關(guān)鍵技術(shù)中[1],無人參與的空間作業(yè)不但能夠保障宇航員空間作業(yè)的安全,且大大降低了操作成本,因而成為了在軌服務(wù)技術(shù)的發(fā)展潮流。無人參與的空間作業(yè)主要是通過空間機(jī)器人智能操作(捕獲,對接,移動,控制)代替人工作業(yè),來保證航天器的正常工作??臻g機(jī)器人(機(jī)械臂)對空間非合作目標(biāo)的在軌操作中,由抓捕任務(wù)中機(jī)械臂運(yùn)動導(dǎo)致的航天器本體的動力學(xué)、運(yùn)動學(xué)等特性的改變,致使航天器本體的在軌姿態(tài)和空間軌跡發(fā)生變化。這對軌道和姿態(tài)精度要求極高的在軌航天器控制系統(tǒng)提出了嚴(yán)峻的挑戰(zhàn)。為了使姿態(tài)軌道控制系統(tǒng)做出精準(zhǔn)的控制策略,保證航天器正常在軌運(yùn)行,需要首先對所抓捕的空間非合作目標(biāo)的慣性參數(shù)進(jìn)行快速準(zhǔn)確辨識。
對空間目標(biāo)物慣性參數(shù)的辨識一直是空間非合作目標(biāo)抓捕系統(tǒng)的關(guān)鍵技術(shù)之一[2]。由于在太空環(huán)境下,機(jī)器人常常處于自由飛行或自由漂浮[3]狀態(tài),航天器基座不固定,航天器本體和非合作目標(biāo)產(chǎn)生強(qiáng)烈的耦合關(guān)系[4],無法測量非合作目標(biāo)獨立的動力學(xué)、運(yùn)動學(xué)信息;在抓捕空間非合作目標(biāo)的過程中,由于其質(zhì)心未知,無法對未知物本身進(jìn)行受力分析,也即無法通過對目標(biāo)物單獨施加外力的辦法來實現(xiàn)對目標(biāo)質(zhì)量和質(zhì)心的測量,地面上對物體慣性參數(shù)的測量辦法到了空間就會變得失效。因此,針對空間參數(shù)辨識的強(qiáng)耦合、非線性等特點,需要采用系統(tǒng)的辨識方法,即將空間非合作目標(biāo)看作航天器本體—機(jī)械臂—空間非合作目標(biāo)這三者組成系統(tǒng)的一部分,通過分析系統(tǒng)的整體特性和可量測(航天器本體、機(jī)械臂)信息來求解未知部分即空間非合作目標(biāo)的特性。
航天器本體—機(jī)械臂—空間非合作目標(biāo)組成的系統(tǒng)在自由漂浮狀態(tài)下所受外力遠(yuǎn)遠(yuǎn)小于系統(tǒng)相互作用的內(nèi)力,滿足系統(tǒng)動量守恒和系統(tǒng)內(nèi)力和、內(nèi)力矩和始終恒定等條件。由于系統(tǒng)的動量守恒,可通過列寫系統(tǒng)線角動量守恒方程來求解非合作目標(biāo)的慣性參數(shù);由于系統(tǒng)的內(nèi)力和、內(nèi)力矩和始終恒定,也可通過列寫系統(tǒng)的牛頓—歐拉方程來求解非合作目標(biāo)的慣性參數(shù)。在太空微重力的環(huán)境下,力和力矩傳感器的信噪比相對較低,對于測量物體的力學(xué)信息常常無法滿足精度要求。而基于動量守恒原理的參數(shù)辨識只需測量系統(tǒng)速度信息而無需知道系統(tǒng)的加速度和力等信息,因而逐漸成為空間參數(shù)辨識的基本原理。
在國內(nèi)外對空間目標(biāo)物慣性參數(shù)的研究中[5-13],Yoshisada等 詳 細(xì) 闡 述 了 基 于 兩 大 原 理(動量守恒方程、牛頓—歐拉方程)的空間非合作目標(biāo)慣性參數(shù)辨識方案[5],并通過構(gòu)造線性辨識方程求其廣義逆解來辨識目標(biāo)物的慣性參數(shù)。Roberto和Gerhard利用牛頓—歐拉方程并通過使用加速度計測量來辨識空間非合作目標(biāo)的慣性參數(shù)[6],由于加速度計的使用,限制了其辨識精度。Thai等采用線動量守恒和改進(jìn)的(增量式)角動量守恒方程來辨識空間非合作目標(biāo)的慣性參數(shù)[7],但依然采取偽逆運(yùn)算的方法求解。郭琦和洪炳镕基于動量守恒原理提出了雙臂四自由度空間機(jī)器人捕捉非合作目標(biāo)的參數(shù)辨識[8]。田富洋等利用動量守恒原理辨識空間非合作目標(biāo)的慣性參數(shù)[9],且通過初步理論分析得出參數(shù)可辨識的條件:空間機(jī)器人至少包含3個自由度(3個機(jī)械臂)依次獲得初始速度。金磊和徐世杰基于動量守恒原理提出了全增量式(線動量和角動量)的辨識方程[10],但辨識過程只選取3個時間點的測量信息,對量測數(shù)據(jù)的準(zhǔn)確性要求較高。張鵬基于觸覺信息對空間非合作目標(biāo)進(jìn)行參數(shù)辨識[11],然而觸碰激勵的控制范圍是一個亟待解決的難題。以上對非合作目標(biāo)慣性參數(shù)的辨識[5-13],大多通過構(gòu)造辨識方程并求其廣義逆解(偽逆解)或通過遞推式最小二乘(Recursive Least Square,RLS)準(zhǔn)則求解非合作目標(biāo)的慣性參數(shù)。求解過程所涉及到的求逆運(yùn)算不但增大了辨識過程的計算量,且當(dāng)輸入信號的自適應(yīng)相關(guān)矩陣失去正定特性,還將引起算法的發(fā)散[14],使辨識過程的數(shù)值產(chǎn)生劇烈振蕩,造成辨識結(jié)果的不穩(wěn)定,這對于要求實時精確的姿態(tài)軌道控制而言是無法接受甚至是必須避免的。這方面,陳恩偉等[15]曾利用牛頓—歐拉方程并構(gòu)造神經(jīng)網(wǎng)絡(luò)進(jìn)行了地面固定基座機(jī)械臂末端操作物慣性參數(shù)的辨識,并為解決實際應(yīng)用中獲取樣本難和實時性差等問題提供了一種有效的參考途徑,但為確保網(wǎng)絡(luò)訓(xùn)練法則的收斂,需要同時使兩個關(guān)節(jié)做加速運(yùn)動并保證末端操作物獨立的力和力矩信息可測。
神經(jīng)網(wǎng)絡(luò)由于其并行處理、自學(xué)習(xí)及自適應(yīng)能力等特點,在模式識別、系統(tǒng)辨識等領(lǐng)域有著廣泛應(yīng)用。包括自適應(yīng)線性元件(Adaline)、反向傳播(BP)、徑向基函數(shù)(RBF)、霍普菲爾(Hopfield)等在內(nèi)的神經(jīng)網(wǎng)絡(luò)參數(shù)辨識,不但能夠有效處理線性時不變系統(tǒng)問題,對于非線性時變過程也有著良好的逼近性能。其中,BP、RBF等網(wǎng)絡(luò)主要適用多隱層多輸入、多輸出網(wǎng)絡(luò)的學(xué)習(xí)?;谧钚【剑↙east Mean Square,LMS)算法的Adaline網(wǎng)絡(luò)(多輸入、單輸出)是一種單隱層前饋神經(jīng)網(wǎng)絡(luò),具有網(wǎng)絡(luò)結(jié)構(gòu)簡單,計算量小,可通過更換自適應(yīng)算法方便地改善其性能[16-18]等優(yōu)點因而得到大量應(yīng)用。
為實現(xiàn)對目標(biāo)物慣量參數(shù)的快速、準(zhǔn)確辨識,本文首先基于動量守恒理論建立抓捕后的航天器—機(jī)械臂—空間非合作目標(biāo)系統(tǒng)模型,然后構(gòu)造Adaline網(wǎng)絡(luò)[19],將辨識方程的系數(shù)矩陣作為網(wǎng)絡(luò)的輸入和輸出,非合作目標(biāo)的慣性參數(shù)作為神經(jīng)網(wǎng)絡(luò)的訓(xùn)練權(quán)重,基于迭代步長可變的歸一化最小均方(Normalized Least Mean Square,NLMS)準(zhǔn)則實現(xiàn)對目標(biāo)慣量參數(shù)的快速、準(zhǔn)確辨識。最后,在構(gòu)造的ADAMS/MATLAB聯(lián)合仿真平臺上進(jìn)行了驗證,仿真結(jié)果表明,基于NLMS準(zhǔn)則的Adaline網(wǎng)絡(luò)是一種快速、準(zhǔn)確辨識目標(biāo)慣量參數(shù)的有效方法。
圖1所示為機(jī)械臂對空間非合作目標(biāo)捕獲后形成的航天器本體—n自由度(DOF)機(jī)械臂—非合作目標(biāo)系統(tǒng)。不失一般性,假設(shè)航天器本體處于空間自由漂浮狀態(tài),忽略微重力等外力作用。其中,非合作目標(biāo)被捕獲后與機(jī)械臂末端操作器固連成一體,即末端固連物,其慣性參數(shù)未知。
圖1 航天器—機(jī)械臂—非合作目標(biāo)系統(tǒng)Fig.1 System composed of spacecraft,manipulator and uncooperative target
圖1中:ΣI為慣性坐標(biāo)系,ΣB為航天器本體坐標(biāo)系,Σi為連桿i(i=1,2,…,n)的本體坐標(biāo)系(設(shè)置在關(guān)節(jié)i上,建系方式遵循 D-H 規(guī)則[20]),ΣU為末端操作器本體坐標(biāo)系(設(shè)置在關(guān)節(jié)n上);pB為航天器本體系原點在慣性系中的空間矢量;rB為航天器本體質(zhì)心在慣性系中的空間矢量;aB為航天器固連本體系原點到航天器本體質(zhì)心的位置矢量,bB為航天器本體質(zhì)心到關(guān)節(jié)1的位置矢量;pi為連桿i本體系原點在慣性系中的空間矢量;ri為連桿i質(zhì)心在慣性系中的空間矢量;ai為連桿i本體坐標(biāo)原點到連桿i質(zhì)心的位置矢量;bi為連桿i質(zhì)心到關(guān)節(jié)i+1的位置矢量;aU為末端操作器本體系原點到末端固連物質(zhì)心(末端操作器與空間非合作目標(biāo)固連后的質(zhì)心)的位置矢量;pU為末端操作器本體系原點在慣性系中的空間矢量;rU為末端固連物質(zhì)心在慣性系中的空間矢量; θi為在辨識過程中關(guān)節(jié)i的電機(jī)驅(qū)動角速度信號;ωB為航天器本體角速度;ωi為連桿i的角速度;ωU為末端固連物的角速度。
根據(jù)運(yùn)動學(xué)關(guān)系可得以下數(shù)學(xué)關(guān)系:
以上各物理量符號均為空間三維矢量,且每一個公式中的各物理量需轉(zhuǎn)換到同一坐標(biāo)系下(慣性或本體坐標(biāo)系)運(yùn)算。
對于所要辨識的非合作目標(biāo)慣性參數(shù)具體包括非合作目標(biāo)(末端固連物)的質(zhì)量mU,質(zhì)心矢量aU= [aUxaUyaUz]T,慣量參數(shù)矢量I=[IxxIxyIxzIyyIyzIzz]T。
航天器在捕獲空間非合作目標(biāo)過程中(捕獲前的接近;捕獲中的碰撞、抓取等動作;捕獲后形成末端固連物)始終保持航天器—機(jī)械臂—非合作目標(biāo)這個系統(tǒng)的線動量、角動量恒定。因而針對抓捕任務(wù)完成后系統(tǒng)的線動量、角動量進(jìn)行分析。
如圖1所示,系統(tǒng)的線動量為
式中:P為系統(tǒng)總線動量矢量;mB為航天器本體質(zhì)量;mi為連桿i的質(zhì)量;mU為末端固連物質(zhì)量。
現(xiàn)假設(shè)系統(tǒng)中mB、mi(i=1,2,…,n-1)已知或可量測,且機(jī)械臂在捕獲行動前的系統(tǒng)線動量為零,即P=0,則有PK為系統(tǒng)線動量可量測(已知)部分;由式(8)和式(9)可知,ωU、 pU可量測。同時,式(13)可寫成矩陣形式為
式中
式(14)實現(xiàn)了非合作目標(biāo)慣性參數(shù)與系統(tǒng)可量測信息的線性化分離,并可寫成辨識方程式(15):
式中:
其中:A1(3×4)、b1(3×1)為可量測信息組成的矩陣和矢量;x1為空間非合作目標(biāo)的待辨識參數(shù)mU和aU= [aUxaUyaUz]T組 成 的 矢 量。式(15)為非合作目標(biāo)質(zhì)量和質(zhì)心的辨識方程。
同理,系統(tǒng)角動量定義為L,且L=0,則
式中:IB為航天器本體相對于其質(zhì)心的慣性張量;Ii為連桿i相對于其質(zhì)心的慣性張量,可量測;IU為末端固連物相對于其質(zhì)心的慣性張量。
由式(12)與式(16)以及L=0,可得
令
式中:LK為系統(tǒng)角動量可量測(已知)部分。則
式(16)轉(zhuǎn)化為慣性參數(shù)與系統(tǒng)可量測信息的線性公式為
式中:
aU由式(15)可得。
即通過系統(tǒng)線角動量守恒及數(shù)學(xué)公式變換,式(18)可寫成辨識方程式為
其中:A2(3×6)、b2(3×1)為可量測信息組成的矩陣和矢量;x2為空間非合作目標(biāo)的待辨識參數(shù)I=[IxxIxyIxzIyyIyzIzz]T組成的矢量。式(20)為非合作目標(biāo)慣量參數(shù)的辨識方程。
通過依次求解式(15)、式(20),非合作目標(biāo)的10個慣性參數(shù)得到了完整辨識。
式(15)、式(20)可劃歸為線性方程Ax=b。由于式(15)、式(20)為不定方程,無法直接求得方程的解析值。為避免廣義逆求解計算復(fù)雜度高等不足,本文通過系統(tǒng)不同運(yùn)動狀態(tài)下的有限組(A,b)時間序列來訓(xùn)練所構(gòu)造的Adaline神經(jīng)網(wǎng)絡(luò),使網(wǎng)絡(luò)權(quán)重逐漸收斂到非合作目標(biāo)慣性參數(shù)的真值。
不失一般性,系數(shù)矩陣A為M×N矩陣,b為M×1列向量,x為待辨識慣性參數(shù)向量。由方程
可得
式中:A(k)為矩陣A 的第k 行行向量;b(k)為向量b的第k個元素。
構(gòu)造如圖2所示的Adaline神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)輸入為A(k),輸入節(jié)點個數(shù)為系數(shù)矩陣A的列數(shù);網(wǎng)絡(luò)期望輸出為b(k),實際輸出為y,輸出偏差為e;隱層節(jié)點輸出為t,節(jié)點偏置為d。根據(jù)Adaline網(wǎng)絡(luò)的特性[14],隱層節(jié)點的激活函數(shù)f(t)=t。
圖2 Adaline構(gòu)造示意圖Fig.2 Structure of Adaline network
為計算方便,節(jié)點偏置d設(shè)置為0。即
式中:w= [w1w2… wN]T。
對比式(22)、式(24),非合作目標(biāo)的慣性參數(shù)向量x成為了網(wǎng)絡(luò)訓(xùn)練中所要訓(xùn)練的權(quán)重矢量w,對網(wǎng)絡(luò)權(quán)值的訓(xùn)練即是對慣性參數(shù)的辨識。將可量測的l組(A,b)逐一拆解成M 組(A(k),b(k)),并將此l×M 組(A(k),b(k))作為訓(xùn)練集來訓(xùn)練Adaline網(wǎng)絡(luò),使網(wǎng)絡(luò)的權(quán)值矢量w=[w1
w2… wN]T隨著訓(xùn)練次數(shù)的增加最終收斂到慣性參數(shù)的真值。
系統(tǒng)運(yùn)動過程產(chǎn)生的多組(A,b)會存在不同程度的相關(guān)性,而一般意義的LMS準(zhǔn)則極易導(dǎo)致辨識結(jié)果無法收斂到最優(yōu)值、極易陷入局部最小、甚至辨識結(jié)果發(fā)散等問題。因此為增大訓(xùn)練集(A,b)的無關(guān)性,提高網(wǎng)絡(luò)權(quán)值的收斂速度和準(zhǔn)確性,保證權(quán)值收斂到慣性參數(shù)的理論值,本文的網(wǎng)絡(luò)訓(xùn)練采用基于NLMS準(zhǔn)則[21]的自適應(yīng)算法。具體步驟如下:
1)將已采集到并連續(xù)生成的有限時間序列(A,b)元素在訓(xùn)練集中隨機(jī)編號,并按編號順序訓(xùn)練Adaline網(wǎng)絡(luò)。即通過隨機(jī)選取順序生成的訓(xùn)練元素(A,b)來訓(xùn)練神經(jīng)網(wǎng)絡(luò)。
2)根據(jù)LMS算法[21]可得
式中:w(p)為網(wǎng)絡(luò)第p次訓(xùn)練權(quán)值向量;μ為權(quán)值迭代步長;e(p)為網(wǎng)絡(luò)期望輸出與實際輸出的
通過以上神經(jīng)網(wǎng)絡(luò)的構(gòu)造,可得
式中:tr(R)為R 的跡。
而迭代步長可變的NLMS準(zhǔn)則中[21],有偏差;u(p)為網(wǎng)絡(luò)第p次輸入向量。本文中,u=A(k)。
一般意義的LMS算法穩(wěn)定性取決于迭代步長μ(常值)和輸入向量的自相關(guān)矩陣R[21]。
且算法穩(wěn)定的充要條件為
且算法收斂條件為α∈(0,2),β∈(0,1)。
即NLMS與一般意義的LMS相比,其收斂條件只與算法的步長調(diào)整因子α、β的取值范圍有關(guān),與輸入信號u(n)的自相關(guān)程度無關(guān),且迭代步長根據(jù)輸入信號的取值不同而變化,使得NLMS有著更快的收斂速度,從而在處理存在不同程度相關(guān)性的(A,b)過程中能夠得到更準(zhǔn)確的收斂結(jié)果。
仿真過程采取ADAMS/MATLAB聯(lián)合仿真來實現(xiàn)。首先,利用ADAMS軟件平臺建立后抓捕的航天器本體—3DOF機(jī)械臂—空間非合作目標(biāo)的動力學(xué)模型,其中關(guān)節(jié)1、關(guān)節(jié)2、關(guān)節(jié)3的電機(jī)驅(qū)動方向在空間慣性系下正交,如圖3所示。系統(tǒng)模型的實際動力學(xué)信息見表1,表1中:Link 0為航天器本體,Link 3+為末端固連物(Link 3與非合作目標(biāo)固連在一起),表1中未列出的數(shù)據(jù)分量在實際模型中為零。
圖3 ADAMS構(gòu)建的系統(tǒng)動力學(xué)模型Fig.3 System dynamic model established by ADAMS
表1 系統(tǒng)模型慣性和尺寸參數(shù)(3DOF機(jī)械臂)Table 1 Geometric and inertial parameters of space robot model with 3-DOF manipulator
辨識過程中需要測知航天器本體相對于慣性系的線速度、角速度和轉(zhuǎn)角(計算不同坐標(biāo)轉(zhuǎn)換的旋轉(zhuǎn)矩陣)。通過ADAMS軟件中仿真?zhèn)鞲衅鳎ú蓸宇l率為100Hz)的使用,將所需運(yùn)動學(xué)信息逐一導(dǎo)出至 MATLAB/SIMULINK 平臺中。MATLAB/SIMULINK通過式(2)~式(10)以及表1的數(shù)據(jù)來解算各連桿和各關(guān)節(jié)的運(yùn)動學(xué)信息,并以此構(gòu)造辨識矩陣(A,b)。最后通過MATLAB/SIMULINK建立Adaline神經(jīng)網(wǎng)絡(luò)并進(jìn)行網(wǎng)絡(luò)的訓(xùn)練,實現(xiàn)對非合作目標(biāo)慣性參數(shù)的辨識。ADAMS軟件建立的動力學(xué)模型中各關(guān)節(jié)的動摩擦系數(shù)υd為0.3,靜摩擦系數(shù)υs為0.5,靜摩擦轉(zhuǎn)換速度Vs為0.1rad·s-1。即[22]
式中:nf為驅(qū)動關(guān)節(jié)運(yùn)動過程受到的摩擦力矩;fN為關(guān)節(jié)所受正壓力;槇θi為關(guān)節(jié)i驅(qū)動后相對于Σi的實際角速度。此外,為確保算法的收斂性以及辨識精度,本文通過仿真對比得到收斂條件下的參數(shù)設(shè)置(式(27)和式(28)):NLMS算法中,α設(shè)置為1.8,β設(shè)置為0.9;而對一般意義的LMS算法,μ設(shè)置為0.001。網(wǎng)絡(luò)初始權(quán)重可隨機(jī)選取,在仿真中初始權(quán)重均設(shè)置為w0=[1(1)1(2)… 1(N)]T。
值得指出的是,仿真中為獲得系統(tǒng)不同運(yùn)動狀態(tài)下產(chǎn)生的矩陣(A,b),需要對機(jī)械臂上的各個關(guān)節(jié)施加驅(qū)動信號,從而使捕獲后的固連系統(tǒng)產(chǎn)生不同的運(yùn)動狀態(tài)。為保證關(guān)節(jié)運(yùn)動前后對航天器本體的位姿擾動最小,驅(qū)動過程采用周期信號,驅(qū)動時間為信號的整周期倍數(shù)。即分別對關(guān)節(jié)1、2、3依次驅(qū)動100s,總共驅(qū)動300s,驅(qū)動信號均為頻率0.2Hz,幅值為1的余弦波角加速度信號。
各關(guān)節(jié)驅(qū)動信號如表2所示,t代表各關(guān)節(jié)施加驅(qū)動的時間。
表2 各關(guān)節(jié)驅(qū)動信號Table 2 Actuating signals of joints
NLMS與LMS兩種算法的辨識誤差對比如表3所示,辨識結(jié)果如圖4所示。從表3和圖4中可以看出,基于NLMS的辨識誤差均在±0.25%之內(nèi),且辨識結(jié)果較穩(wěn)定;而基于迭代步長固定的LMS辨識誤差相對較大且穩(wěn)定性不如NLMS算法。通過圖4還可以看出,兩種算法下的辨識結(jié)果均收斂至某一固定值,其中LMS隨著網(wǎng)絡(luò)迭代過程逐漸陷入了局部最小值,并沒有收斂到慣性參數(shù)的理論值,而NLMS在相同的網(wǎng)絡(luò)輸入輸出下收斂至理論值,這說明NLMS對于相關(guān)程度較大的網(wǎng)絡(luò)輸入輸出數(shù)據(jù)仍能保持很好的收斂效果。在上述仿真研究的基礎(chǔ)上,根據(jù)式(1)、式(2),進(jìn)一步研究測量誤差等干擾對辨識的影響,即對慣性系下的量測量 pB、ωB與航天器本體相對于慣性系的轉(zhuǎn)角添加均值為0,標(biāo)準(zhǔn)差為σ的高斯白噪聲,其中,σ取為信號幅值的1%。
表3 兩種算法的辨識結(jié)果Table 3 Simulation results of two algorithms
圖4 辨識結(jié)果(290-300s)Fig.4 Identification results(290-300s)
通過Adaline網(wǎng)絡(luò)對含有噪聲信息的矩陣(A,b)進(jìn)行參數(shù)辨識,由于噪聲的干擾,為確保算法的收斂性,迭代步長參數(shù)調(diào)整如下:
NLMS:α設(shè)置為0.45,β設(shè)置為1(質(zhì)量、質(zhì)心辨識,式(15));α設(shè)置為0.01,β設(shè)置為1(慣性張量辨識,式(20))。
LMS:μ設(shè)置為0.000 8(質(zhì)量、質(zhì)心辨識,式(15));μ設(shè)置為0.001(慣性張量辨識,式(20))。
辨識結(jié)果對比如表4,NLMS與LMS兩種算法的辨識誤差對比如圖5所示,辨識結(jié)果對比見表4。從圖5和表4可以看出,各項參數(shù)受到測量噪聲的影響,辨識精度均有不同程度的下降,且噪聲對慣性參數(shù)的影響較大。無論怎樣,基于NLMS算法的參數(shù)辨識隨著對網(wǎng)絡(luò)訓(xùn)練的結(jié)束而完成,其結(jié)果仍大大優(yōu)于迭代步長固定的LMS算法,除個別參數(shù)外,基于NLMS算法的辨識誤差均小于5%。
圖5 包含量測噪聲的辨識結(jié)果(290-300s)Fig.5 Identification results with noise(290-300s)
表4 包含噪聲信息的辨識結(jié)果Table 4 Simulation results with noise
值得特別指出的是,通過對比式(15)、式(20)可以看出,由于式(20)需同時辨識6個參數(shù),而式(15)只需同時辨識4個參數(shù),且待辨識參數(shù)的增多使辨識方程各參數(shù)間的耦合性增大,因而辨識結(jié)果受噪聲干擾的程度更大,有待于在后續(xù)的研究工作中進(jìn)一步深入分析和探討。
本文基于航天器—機(jī)械臂—空間非合作目標(biāo)組合系統(tǒng)的動力學(xué)模型和動量守恒原理,通過構(gòu)建基于NLMS準(zhǔn)則的Adaline網(wǎng)絡(luò),實現(xiàn)對空間非合作目標(biāo)慣性參數(shù)的快速準(zhǔn)確辨識,且呈現(xiàn)以下特點。
1)Adaline網(wǎng)絡(luò)通過自適應(yīng)算法具有自適應(yīng)能力,因此不需要獲取空間非合作目標(biāo)慣性參數(shù)的先驗信息。仿真中只需要將辨識方程的系數(shù)矩陣分別作為網(wǎng)絡(luò)的輸入、輸出,待辨識慣性參數(shù)作為網(wǎng)絡(luò)的權(quán)值,并通過對權(quán)值的訓(xùn)練,即可實現(xiàn)對慣性參數(shù)的辨識。
2)在網(wǎng)絡(luò)的自適應(yīng)算法中,通過仿真對比LMS與NLMS對空間非合作目標(biāo)慣性參數(shù)的辨識,理想情況下本文方法的辨識誤差在±0.25%之內(nèi)。進(jìn)一步考慮量測噪聲的影響,除個別參數(shù)外,本文方法的辨識誤差均小于5%,結(jié)果驗證了迭代步長可變的NLMS準(zhǔn)則不僅降低了對輸入數(shù)據(jù)相關(guān)性的要求,更在辨識精度等方面相對LMS有較大幅度提高。
后續(xù)工作將著眼于NLMS準(zhǔn)則中α、β參數(shù)的最優(yōu)選取問題;其次還應(yīng)對航天器本體的擾動控制做深入的研究,即在對空間非合作目標(biāo)參數(shù)辨識的同時,通過對機(jī)械臂各關(guān)節(jié)施加最優(yōu)驅(qū)動信號來消除辨識過程對航天器本體的擾動。
[1] 崔乃剛,王平,郭繼峰,等.空間在軌服務(wù)技術(shù)發(fā)展綜述[J].宇航學(xué)報,2007,28(4):805-811.CUI N G,WANG P,GUO J F,et al.A review of on-orbit servicing[J].Journal of Astronautics,2007,28(4):805-811(in Chinese).
[2] 蔡洪亮,高永明,邴啟軍,等.國外空間非合作目標(biāo)抓捕系統(tǒng)研究現(xiàn)狀與關(guān)鍵技術(shù)分析[J].裝備指揮技術(shù)學(xué)院學(xué)報,2010,21(6):71-77.CAI H L,GAO Y M,BING Q J,et al.The research status and key technology analysis of foreign non-cooperative target in space capture system[J].Journal of the Academy of Equipment Command &Technology,2010,21(6):71-77(in Chinese).
[3] STEVEN D,EVANGELOS P.The kinematics dynamics,and control of free-flying and free-floating space robotic systems[J].IEEE Transactions on Robotics and Automation,1993,9(5):531-543.
[4] 盧偉,耿云海,陳雪芹,等.在軌服務(wù)航天器對目標(biāo)的相對位置和姿態(tài)耦合控制[J].航空學(xué)報,2011,32(5):857-865.LU W,GENG Y H,CHEN X Q,et al.Coupled control of relative position and attitude for on-orbit servicing spacecraft with respect to target[J].Acta Aeronautica et Astronautica Sinica,2011,32(5):857-865(in Chinese).
[5] YOSHISADA M,KEI S,MITSUHIRO O.Parameter identification of unknown object handled by free-flying space robot[J].Journal of Guidance,Control,and Dynamics,1994,17(3):488-494.
[6] ROBERTO L,GERHARD H.Modeling and experimental design for the on-orbit inertial parameter identification of free-flying space robots[C]/International Design Engineering Technical Conferences and Computersand Information in Engineering Conference,2005:1-10.
[7] THAI CHAU N H,INNA S.Adaptive reactionless motion and parameter identification[J].Journal of Guidance,Control,and Dynamics,2013,36(2):404-414.
[8] 郭琦,洪炳镕.雙臂四自由度空間機(jī)器人捕捉未知目標(biāo)的參數(shù)辨識[J].機(jī)器人,2005,27(6):512-516.GUO Q,HONG B R.Parameter identification of unknown object handled by a dual-arm four-degree-of-free-dom space robot[J].Robot,2005,27(6):512-516 (in Chinese).
[9] 田富洋,吳洪濤,趙大旭,等.在軌空間機(jī)器人參數(shù)辨識研究[J].中國空間科學(xué)技術(shù),2010(1):10-17.TIAN F Y,WU H T,ZHAO D X,et al.Parameter identification of orbital free-floating space robot[J].Chinese Space Science and Technology,2010(1):10-17(in Chinese).
[10] 金磊,徐世杰.空間機(jī)器人抓取未知目標(biāo)的質(zhì)量特性參數(shù)辨識[J].宇航學(xué)報,2012,33(11):1570-1576.JIN L,XU S J.Inertial parameter identification of unknown object captured by a space robot[J].Journal of Astronautics,2012,33(11):1570-1576(in Chinese).
[11] 張鵬.基于觸覺的空間非合作目標(biāo)慣性參數(shù)辨識研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2013.ZHANG P.Research on identification of inertial parameters of non-cooperative target with touch[D].Harbin:Harbin Institute of Technology,2013(in Chinese).
[12] 王明,黃攀峰,常海濤.非合作目標(biāo)航天器質(zhì)量特性參數(shù)辨識[J].飛行力學(xué),2014,32(6):536-540.WANG M,HUANG P F,CHANG H T.Identification of mass characteristic parameters for non-cooperative target spacecraft[J].Flight Dynamics,2014,32(6):536-540(in Chinese).
[13] 吳倩.空間非合作目標(biāo)慣性參數(shù)辨識研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2014:1-21.WU Q.Research on identification of inertial parameters of non-cooperative target[D].Harbin:Harbin Institute of Technology,2014:1-21(in Chinese).
[14] 耿妍,張端金.自適應(yīng)濾波算法綜述[J].信息與電子工程,2008,6(4):315-320.GENG Y,ZHANG D J.Survey of adaptive filtering algorithms[J].Information and Electronic Engineering,2008,6(4):315-320(in Chinese).
[15] 陳恩偉,劉正士,干方建.機(jī)器人末端臂慣性參數(shù)辨識的人工神經(jīng)網(wǎng)絡(luò)方法[J].中國機(jī)械工程,2006,17(3):268-271.CHEN E W,LIU Z S,GAN F J.Application of ANN method in inertial parameter identification of the end effector of robot[J].Chinese Journal of Mechanical Engineering,2006,17(3):268-271(in Chinese).
[16] SARITA N,MILAN B,DASH P K.Estimation of time varying signal parameters using an improved Adaline learning algorithm[J].International Journal of Electronics and Communications,2014,68(2):115-129.
[17] MOHAMMED Q,PARAG K,VINOD K.Artificial-neural-network-based phase-locking scheme for active power filters[J].IEEE Transactions on Industrial Electronics,2014,61(8):3857-3866.
[18] HAMID S,ALI B,DJAFFAR O A,et al.ADALINE approach for induction motor mechanical parameters identification[J].Mathematics and Computers in Simulation,2013,90:86-97.
[19] WIDROW B,LEHR M A.30years of adaptive neural networks perception,madaline,and back propagation[J].Proceedings of the IEEE,1990,78(9):1415-1442.
[20] 金萬敏,萬坤華.機(jī)器人動力學(xué)建模[J].東南大學(xué)學(xué)報,1993,23(A06):19-26.JIN W M,WAN K H.The dynamic modeling in robots[J].Journal of Southeast University,1993,23(A06):19-26(in Chinese).
[21] 李寧.LMS自適應(yīng)濾波算法的收斂性能研究與應(yīng)用 [D].哈爾濱:哈爾濱工程大學(xué),2009.LI N.Convergence performance analysis and applications of the adaptive least mean square(LMS)algorithm[D].Harbin:Harbin Engineering University,2009 (in Chinese).
[22] Basic ADAMS full simulation training guide.Version12.0[EB/OL].[2015-09-01].http/www.a(chǎn)dams.com.
Adaline network-based identification method of inertial parameters for space uncooperative targets
SUN Jun1,2,ZHANG Shijie1,* ,MA Ye3,CHU Zhongyi3
1.School of Astronautics,Harbin Institute of Technology,Harbin 150001,China 2.Shanghai Key Laboratory of Space Intelligent Control Technology,Shanghai Institude of Spaceflight Control Technology,Shanghai 201109,China 3.School of Instrument Science and Opto-electronics Engineering,Beihang University,Beijing 100083,China
During the operation in space,the spacecraft's attitude and trajectory are often affected by capturing the uncooperative target.In order to overcome the influence of uncooperative target on the dynamics and kinematics of spacecraft and ensure the high-precision attitude control strategy to be made and normal in-orbit condition,aprocess of identifying the inertial parameters of uncooperative targets should be accommodated.In order to avoid a large amount of computation induced by generalized inverse operation of traditional method in the identification process,which also causes severe vibration and unstability to numerical results,an Adaline neural network identification method based on normalized least mean square(NLMS)criterion is adopted.First of all,a system model composed of spacecraft,manipulator and uncooperative target is established based on the theory of momentum conservation.Then the weight parameters of the neural network representing the inertial parameters of uncooperative target are trained by the coefficient matrix of the identification equation as the input and output of the neural network via algorithm of NLMS with variable iterative step,and a fast and accurate process of identification is achieved.Finally,an ADAMS/MATLAB co-simulation platform is established,on which the proposed identification method is verified.The simulation results show that the Adaline neural network based on NLMS criterion is a fast and accurate method for identifying the target's inertia parameters.
spacecraft;uncooperative target;inertial parameter;neural network;identification
2015-09-07;Revised:2015-09-30;Accepted:2015-12-22;Published online:2016-01-06 15:41
URL:www.cnki.net/kcms/detail/11.1929.V.20160106.1541.004.html
s:National Natural Science Foundation of China(51375034,61327809);Shanghai Aerospace Science and Technology Innovation Fundation(SAST2015-075)
V441
A
1000-6893(2016)09-2799-10
10.7527/S1000-6893.2015.0349
2015-09-07;退修日期:2015-09-30;錄用日期:2015-12-22;網(wǎng)絡(luò)出版時間:2016-01-06 15:41
www.cnki.net/kcms/detail/11.1929.V.20160106.1541.004.html
國家自然科學(xué)基金 (51375034,61327809);上海航天科技創(chuàng)新基金 (SAST2015-075)
*通訊作者.Tel.:0451-86414117-8409 E-mail:sjzhang@hit.edu.cn
孫俊,張世杰,馬也,等.空間非合作目標(biāo)慣性參數(shù)的Adaline網(wǎng)絡(luò)辨識方法[J].航空學(xué)報,2016,37(9):27992-808.SUN J,ZHANG S J,MA Y,et al.Adaline networkb-ased identification method of inertial parameters for space uncooperative targets[J].Acta Aeronautica et Astronautica Sinica,2016,37(9):27992-808.
孫俊 男,博士研究生,高級工程師。主要研究方向:航天器導(dǎo)航與控制。
Tel:021-24183325
E-mail:sjlovedh@hotmail.com
張世杰 男,博士,教授,博士生導(dǎo)師。主要研究方向:小衛(wèi)星技術(shù)。
Tel:0451-86414117-8409
E-mail:sjzhang@hit.edu.cn
馬也 男,碩士研究生。主要研究方向:空間機(jī)器人及航天器控制技術(shù)。
Tel:010-82339013
E-mail:2763251585@qq.com
楚中毅 男,博士,副教授。主要研究方向:空間機(jī)器人及航天器控制技術(shù)。
Tel:010-82339013
E-mail:chuzy@buaa.edu.cn
*Corresponding author.Tel.:0451-86414117-8409 E-mail:sjzhang@hit.edu.cn