徐安林, 郭紹剛, 賀盈波, 季月明
1. 北京跟蹤與通信技術(shù)研究所,北京 10094 2. 北京控制工程研究所,北京 100190 3. 深圳航天東方紅衛(wèi)星有限公司,深圳 528000
隨著空間技術(shù)的發(fā)展,各種類型的衛(wèi)星如通信衛(wèi)星、導(dǎo)航衛(wèi)星、遙感衛(wèi)星等,極大的改變了人類的生存方式.然而,隨著空間的進(jìn)一步利用,空間變的越來越擁擠,空間衛(wèi)星面臨著來自空間碎片、失效航天器、敵國航天器惡意襲擊等潛在威脅[1-4].目前,已編目的直徑大于10 cm的空間碎片約20 000個,大部分集中在低地球軌道,而尺寸小于10 cm的空間碎片數(shù)量更大.這些碎片與正常在軌服役衛(wèi)星發(fā)生碰撞,將引起嚴(yán)重的后果.對于失效航天器引起的衛(wèi)星事故,例如:2009年2月9日,美國“銥-33”通信衛(wèi)星和俄羅斯的報廢衛(wèi)星“宇宙2251”在780 km高度相撞,兩星瞬間產(chǎn)生大量的垃圾碎片,“銥-33”隨之報廢.此外的,空間飛行器還面臨著來自敵國航天器的惡意接近、襲擊等威脅.例如,SPACE X星鏈,星鏈-1095和星鏈-2305兩次接近我國空間站,為此我國空間站在2021年7月1日和2021年10月21日兩度進(jìn)行主動變軌躲避.如果不是我們及時躲避,極有可能發(fā)生碰撞事故,給空間站和航天員帶來極大危險.
針對在軌衛(wèi)星面臨著來自非合作目標(biāo)(空間碎片、失效航天器、敵國航天器均屬于非合作目標(biāo))的潛在威脅,需研究基于星載的目標(biāo)預(yù)警感知系統(tǒng)[5-9],在發(fā)現(xiàn)有威脅時,能夠及時報告給控制系統(tǒng)和地面測控中心,并進(jìn)行規(guī)避避險.然而空間目標(biāo)的識別存在以下幾方面的難點(diǎn):第一,目標(biāo)相對運(yùn)動速度快,可達(dá)幾馬赫,甚至幾十馬赫.因此,對探測系統(tǒng)的高速檢測能力提出了苛刻的要求.第二,目標(biāo)背景復(fù)雜,如面臨著地球背景、月球背景、及地球臨邊環(huán)境影響.對探測系統(tǒng),一方面要求具備在地氣光和月球反照光下的探測能力;另一方面需具備在復(fù)雜背景下目標(biāo)的提取和識別能力.第三,目標(biāo)動態(tài)范圍大,主要體現(xiàn)在兩個方面,一方面目標(biāo)自身由于和太陽夾角的不同,導(dǎo)致目標(biāo)在被觀測方向能量變化大于100 dB以上,另一方面,目標(biāo)在強(qiáng)光背景下,如太陽背景下,背景動態(tài)變化范圍更是遠(yuǎn)大于100 dB以上.因此,要求探測系統(tǒng)具有大的動態(tài)響應(yīng)范圍.第四,星載數(shù)據(jù)傳輸帶寬受限,平臺運(yùn)算能力有限,要求探測系統(tǒng)數(shù)據(jù)量能夠盡量壓縮,提高數(shù)據(jù)利用率,減少數(shù)據(jù)量.
對于星載預(yù)警感知系統(tǒng)面臨的四大難題:高速探測、復(fù)雜背景、高動態(tài)、高數(shù)據(jù)利用率等的需求,現(xiàn)有基于幀處理的傳統(tǒng)探測技術(shù)面臨不足,亟需新探測方案、新探測機(jī)制.本文提出的基于星載觸發(fā)式瞬態(tài)目標(biāo)智能系統(tǒng),其本質(zhì)是突破傳統(tǒng)的“幀處理”圖像探測技術(shù),采用一種新型神經(jīng)形態(tài)學(xué)“硅視網(wǎng)膜(silicon retina)”探測機(jī)制,對目標(biāo)光強(qiáng)的變化進(jìn)行感知,輸出采用地址-事件異步傳輸模式,與傳統(tǒng)探測器明顯不同,具有時間響應(yīng)靈敏度高,光強(qiáng)動態(tài)范圍大,數(shù)據(jù)利用率高等特點(diǎn),為上述相關(guān)問題提供了解決思路.本文首先對星載觸發(fā)式瞬態(tài)目標(biāo)智能感知系統(tǒng)進(jìn)行介紹,然后介紹目標(biāo)智能感知算法.相關(guān)的試驗(yàn)結(jié)果表明,該算法對目標(biāo)的實(shí)時檢測和追蹤能力強(qiáng),具備在軌對目標(biāo)預(yù)警和感知的能力.
星載觸發(fā)式瞬態(tài)智能感知系統(tǒng)采用仿生神經(jīng)形態(tài)學(xué)探測方案,基于動態(tài)有源像素視覺探測器(dynamic and active pixel vision sensor, DAVIS)的探測機(jī)制,實(shí)現(xiàn)單一探測器動態(tài)有效像素+傳統(tǒng)積分型幀處理機(jī)制的有效融合,解決對空間目標(biāo)的檢測和識別問題.整個系統(tǒng)包括光學(xué)系統(tǒng)、DAVIS探測器、智能處理模塊,以及整機(jī)機(jī)械結(jié)構(gòu).通過伺服機(jī)構(gòu),實(shí)現(xiàn)對大于2π空間目標(biāo)的檢測預(yù)警.系統(tǒng)的組成如圖1所示.
圖1 智能感知系統(tǒng)組成Fig.1 The composition of the intelligence perception system
主要包含光學(xué)系統(tǒng)設(shè)計和遮光罩設(shè)計.光學(xué)系統(tǒng)的成像光路如圖2所示.光學(xué)元件的入瞳為20 mm,系統(tǒng)的焦距為60 mm,光學(xué)系統(tǒng)的視場為10°×10°.優(yōu)化設(shè)計時設(shè)定光學(xué)系統(tǒng)的物距為無窮遠(yuǎn),光譜范圍為470~750 nm,中心波長為620 nm.如圖2所示,為對應(yīng)光學(xué)系統(tǒng)光路和光學(xué)傳遞函數(shù)MTF.
圖2 光學(xué)系統(tǒng)及傳遞函數(shù)圖Fig.2 The composition of optics system and MTF
遮光罩結(jié)構(gòu)形式的確定與雜散光的衰減需求、視場角、遮光罩口徑和長度、內(nèi)表面涂層吸收特性、雜散光光源的種類和分布、雜散光強(qiáng)度等因素有關(guān).
遮光罩按照遮光結(jié)構(gòu)可以分為擋光環(huán)式遮光罩、無擋光環(huán)式遮光罩;按照消光原理可以分為吸收型遮光罩和反射型遮光罩.由于反射型遮光罩要求遮光罩內(nèi)表面對雜光高反射,這對表面涂層特性或表面工藝要求較高,并且目前還沒有合適的涂料,所以一般不選用反射型遮光罩.
擋光環(huán)式遮光罩是指在遮光罩內(nèi)部設(shè)計各種擋光環(huán),以有效抑制進(jìn)入遮光罩的雜散光.擋光環(huán)式遮光罩可含一級遮光罩和二級遮光罩.二級遮光罩安裝在一級遮光罩前端.通過二級遮光罩,雜光至少會經(jīng)過3次散射到達(dá)光學(xué)系統(tǒng)表面,使遮光罩的雜光抑制能力較強(qiáng),但由于二級遮光罩的存在,整個遮光罩的尺寸和口徑將增大.根據(jù)對遮光罩雜光抑制能力的分析,及設(shè)計指標(biāo)中對遮光罩外形尺寸、各光學(xué)系統(tǒng)之間視場遮擋的限制,本文采用了吸收型一級擋光環(huán)式遮光罩,消光漆吸收效率>99.9%,最終PST<1×10-7.
傳統(tǒng)視覺敏感器,無論是CCD 還是CMOS 圖像傳感器,都是采用基于“幀掃描”的采樣方式,高分辨率和高幀頻會產(chǎn)生巨大的數(shù)據(jù)量并且需要更高的傳輸功耗,同時也會增加對信道帶寬和存儲器的要求.此類基于“幀掃描”的圖像傳感器,圖像信息的采集和處理是相互獨(dú)立的過程,只有上一級的處理全部完成才會進(jìn)行下一級的處理.
本文采用新型的神經(jīng)形態(tài)學(xué)芯片,其基于地址-事件表示異步感知傳輸模式(address event representation, AER),探測器時間響應(yīng)靈敏度達(dá)到us量級,動態(tài)范圍達(dá)到140 dB.傳感器對于同一像素點(diǎn)上的光強(qiáng)信息進(jìn)行連續(xù)檢測,當(dāng)相對變化超過設(shè)定的閾值范圍時,異步獨(dú)立地輸出該像素點(diǎn)的位置信息和事件屬性.該傳感器具有生物視覺傳感器的特性:稀疏表示、事件形式輸出、僅輸出光強(qiáng)變化的位置、正負(fù)極性信號有各自的輸出通道.相比于同步輸出模式,異步感知架構(gòu)采樣輸出點(diǎn)較少,從源頭上減小了數(shù)據(jù)冗余,同時也降低了后端圖像數(shù)據(jù)處理的壓力,提高了視覺系統(tǒng)的實(shí)時性.
神經(jīng)形態(tài)學(xué)探測器根據(jù)是否輸出絕對強(qiáng)度,可分為三種,動態(tài)視覺探測器(dynamic vision sensor, DVS),基于時間的異步圖像探測器(asynchronous time-based image sensor,ATIS),動態(tài)有源像素視覺探測器(dynamic and active pixel vision sensor, DAVIS)[10-16].本文采用DAVIS芯片,其結(jié)構(gòu)簡圖如圖3所示,包括兩大部分:APS和DVS,APS采用傳統(tǒng)的幀曝光模式,用于獲得亮度圖,用于對背景場景或者近距離成像分析;而DVS則是AER機(jī)制,包括光感知器、差分器、比較器.選用DAVIS的優(yōu)勢在于,既能保證遠(yuǎn)距離的高速成像,同時又可以根據(jù)需要采集相應(yīng)的灰度信息.
圖3 DAVIS結(jié)構(gòu)示意圖Fig.3 The sketch of DAVIS composition structure
星載觸發(fā)式瞬態(tài)目標(biāo)智能感知算法,主要是實(shí)現(xiàn)對高速目標(biāo)的瞬態(tài)捕獲、追蹤、預(yù)警和感知等.感知系統(tǒng)采用仿生神經(jīng)形態(tài)學(xué)探測器,基于觸發(fā)機(jī)制,該探測器輸出數(shù)據(jù)格式為異步二進(jìn)制,即采用AER表示,數(shù)據(jù)輸出速率在us量級.探測器自身由于高速響應(yīng)的特點(diǎn),自身具有極大的虛警和噪聲,如圖4所示.因此算法上需要經(jīng)過特殊的處理[17-20].
AER表征的視覺芯片具有數(shù)據(jù)稀疏表示的特性,理論上芯片輸出的數(shù)據(jù)流中只包含運(yùn)動目標(biāo)的信息,數(shù)據(jù)量大大減少.但在實(shí)際使用中,AER芯片的輸出包含一定的噪聲,需要將實(shí)際目標(biāo)與噪聲加以區(qū)分.基于AER表征的事件流,結(jié)合目標(biāo)具有一定的軌跡、非孤立像素特性,本文采用基于脈沖神經(jīng)網(wǎng)絡(luò)的去噪算法,實(shí)現(xiàn)對非目標(biāo)信號的有效剔除.
圖4 DAVIS探測器固定模式噪聲Fig.4 The FPN of the DAVIS sensor
對原始數(shù)據(jù)進(jìn)行去噪后,需繼續(xù)完成對目標(biāo)的識別,其關(guān)鍵在于虛警的剔除和目標(biāo)的追蹤.在追求極致對暗弱信號的高靈敏度和高速探測,必然伴隨著大的噪聲,因此需要采用合適的濾波算法和追蹤算法,實(shí)現(xiàn)對目標(biāo)的高速準(zhǔn)確檢測.目前,常見的檢測追蹤算法分為兩大類:跟蹤前檢測(detection before tracking,DBT)和檢測前跟蹤(tracking before detection,TBD).DBT類檢測算法是一類經(jīng)典的弱小目標(biāo)檢測算法,它的基本思想是在背景抑制的基礎(chǔ)上,先進(jìn)行單幀檢測獲得候選目標(biāo),再根據(jù)目標(biāo)運(yùn)動的連續(xù)性進(jìn)行多幀確認(rèn).TBD算法主要應(yīng)用于信噪比較低的圖像序列中,此時圖像中目標(biāo)受到噪聲及背景干擾的影響,基于單幀檢測的常規(guī)DBT算法已無法檢測出真實(shí)目標(biāo).TBD算法的核心思想是先跟蹤所有可能的運(yùn)動目標(biāo)觀測量(如灰度值、坐標(biāo)變化),依據(jù)目標(biāo)的觀測量計算各條運(yùn)動軌跡的概率值,如果某條軌跡所計算出來的概率值大于設(shè)定好的閾值,則認(rèn)為該軌跡為一條真實(shí)的目標(biāo)運(yùn)動軌跡.TBD目標(biāo)檢測算法目前主要有:基于動態(tài)規(guī)劃的目標(biāo)檢測算法、基于聯(lián)合概率濾波的目標(biāo)檢測算法等.此外還有高階相關(guān)、粒子濾波等檢測方法.本文采用TBD技術(shù),具體方案為基于聯(lián)合概率濾波的目標(biāo)檢測算法.
考慮到探測器對光強(qiáng)變化的高速異步響應(yīng)特性,采用脈沖神經(jīng)網(wǎng)絡(luò)算法去噪,能夠有效的提出非相關(guān)信號,并保證一定的時效性.為了對弱目標(biāo)能夠進(jìn)行更好的探測,結(jié)合輸出數(shù)據(jù)的高頻響應(yīng)特征,采用TBD技術(shù)中聯(lián)合概率濾波的目標(biāo)檢測算法對目標(biāo)進(jìn)行追蹤檢測.因此,星載觸發(fā)式智能感知系統(tǒng)的算法方案為:脈沖神經(jīng)網(wǎng)絡(luò)去噪+聯(lián)合概率濾波算法方案.
目標(biāo)智能感知算法通過對輸入的事件流信號進(jìn)行處理,通過扣除本底(FPN)、去噪、目標(biāo)追蹤等流程,實(shí)現(xiàn)對目標(biāo)軌跡和運(yùn)動狀態(tài)參數(shù)的輸出,算法流程如圖5所示。
圖5 算出流程圖Fig.5 The algorithm procedure flowchart
神經(jīng)網(wǎng)絡(luò)采用逐層連接的方式,實(shí)現(xiàn)對輸入原始數(shù)據(jù)特征的深度提取,最終輸出期望的高階語義信息.如經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò),目前在圖像識別領(lǐng)域得到了廣泛的應(yīng)用.
脈沖神經(jīng)網(wǎng)絡(luò)稱為第三代神經(jīng)網(wǎng)絡(luò),通過對離散的含時脈沖信號進(jìn)行計算,模擬生物神經(jīng)元的感應(yīng)過程,只有當(dāng)輸入的脈沖信號以一定的表征方式超過類似生物細(xì)胞“膜電勢”閾值時,才認(rèn)為是有效的神經(jīng)元響應(yīng),以此來實(shí)現(xiàn)對噪聲濾除.根據(jù)多層神經(jīng)元的序列連接響應(yīng),進(jìn)而提取出興趣信號.
神經(jīng)形態(tài)學(xué)探測器獲取的AER事件信號,其在物理上表現(xiàn)為孤立高速的脈沖信號,而脈沖神經(jīng)網(wǎng)絡(luò)算法恰好與之相匹配,具有低功耗和超快的運(yùn)行速度.當(dāng)追蹤器檢測出符合識別要求的目標(biāo)時,首先進(jìn)行的操作是對目標(biāo)所屬的事件流進(jìn)行特征提取,接著才能送入分類器中做最后的判決.根據(jù)目標(biāo)在空間上軌跡的連續(xù)性,以及目標(biāo)經(jīng)光學(xué)系統(tǒng)后的非孤立性(即目標(biāo)所占像素至少大于2×2以上),通過在不同背景和光照環(huán)境下,進(jìn)行大量的背景數(shù)據(jù)采集,可以獲取噪聲數(shù)據(jù)集,通過一定的訓(xùn)練方式,可現(xiàn)實(shí)對噪聲的有效濾除.
經(jīng)典的脈沖神經(jīng)網(wǎng)絡(luò)模型如Hodgkin-Huxley(HH)模型,HH模型描繪出膜電壓的生物特性,關(guān)注細(xì)胞內(nèi)外離子遷移和變化過程,與生物細(xì)胞吻合度較高,但運(yùn)算量,難以實(shí)現(xiàn)大規(guī)模運(yùn)算.為了解決HH模型運(yùn)算量的問題,Leaky Integrate and Fire(LIF)模型應(yīng)運(yùn)而生,其關(guān)注事件產(chǎn)生的結(jié)果,對其機(jī)制進(jìn)行簡化,如將諸多細(xì)胞膜的電特性看成電阻和電容的有效組合.LIF模型顧名思義,脈沖響應(yīng)過程可認(rèn)為包括三種過程:①Leaky(泄露):表示輸入信號不足以超過膜電勢閾值,膜電勢會在后續(xù)不斷泄露,即類似細(xì)胞內(nèi)外的離子交換,膜電勢會隨著時間推移,逐漸泄露,直到零位.②Integrate(積分/求和),表示神經(jīng)元會將對應(yīng)位置接收到的信號不斷累積求和,直到滿足一定的條件才釋放,回零.③Fire(激活):即當(dāng)②累積的信號超過膜電勢閾值時,神經(jīng)元會向后端發(fā)射脈沖,同時將膜電壓回落至零位.在激活和回零之間的存在的時間間隙,稱之為不應(yīng)期,此時神經(jīng)元不對輸入的信號進(jìn)行響應(yīng).
LIF模型單元逐層連接,形成深度網(wǎng)絡(luò),基于LIF模型的脈沖神經(jīng)網(wǎng)絡(luò).卷積神經(jīng)網(wǎng)絡(luò)主要依靠誤差反向傳播原理進(jìn)行有監(jiān)督的訓(xùn)練,在學(xué)術(shù)和工業(yè)實(shí)踐中均取得了較好的成果.而脈沖神經(jīng)網(wǎng)絡(luò)模型,神經(jīng)信息以序列脈沖的方式存儲和發(fā)送,各個神經(jīng)單元內(nèi)部變量和誤差函數(shù)不具有可微性質(zhì),因此傳統(tǒng)的反向傳播訓(xùn)練算法不能直接適用于脈沖神經(jīng)網(wǎng)絡(luò)的訓(xùn)練.脈沖神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,主要是實(shí)現(xiàn)脈沖序列相關(guān)的可塑性(spike timing dependent plasticity, STDP),通過對不同層神經(jīng)元權(quán)重的調(diào)整,使得發(fā)放的峰值信號,能夠?qū)τ行盘栱憫?yīng).常見的如無監(jiān)督學(xué)習(xí)算法:基于赫布法則(Hebbian Rule),對相鄰?fù)挥|的放電時間進(jìn)行選擇;而有監(jiān)督學(xué)習(xí)算法,如Hebbian學(xué)習(xí)算法,通過“教師”信號,使得突觸在目標(biāo)時間內(nèi)對發(fā)放的脈沖信號權(quán)值系數(shù)進(jìn)行有效學(xué)習(xí),最后使用正則化技術(shù)對各層權(quán)重進(jìn)行規(guī)范化,最終實(shí)現(xiàn)對有效目標(biāo)的檢測和分類.
如圖6所示,是采用脈沖神經(jīng)網(wǎng)絡(luò)去噪,并進(jìn)行時間累積后的目標(biāo)軌跡圖像,從結(jié)果可以看出,絕大多數(shù)噪聲已被濾除.圖6采用LIF模型,用積分仿真神經(jīng)元,當(dāng)神經(jīng)元的膜電位達(dá)到設(shè)定的閾值時進(jìn)行脈沖發(fā)放,只有經(jīng)過一段時間當(dāng)突觸后神經(jīng)元的膜電位達(dá)到閾值才會產(chǎn)生脈沖發(fā)放.其表達(dá)式如(1)所示,主要由電阻R和電容C組成,突觸前神經(jīng)元i發(fā)放脈沖會產(chǎn)生外部電流I(t),RC電路由于外部電流的作用會一直積累,當(dāng)神經(jīng)元膜電位達(dá)到神經(jīng)元脈沖發(fā)放閾值時,電路會產(chǎn)生脈沖發(fā)放.
(1)
圖6 脈沖神經(jīng)網(wǎng)絡(luò)去噪結(jié)果Fig.6 The result of SNN denoising algorithm
聯(lián)合概率濾波是聯(lián)合概率數(shù)據(jù)關(guān)聯(lián)濾波的簡稱(joint probabilistic data association filter, JPDAF),是貝葉斯框架下的一種目標(biāo)檢測追蹤方法.其能夠在目標(biāo)密度較大(多目標(biāo))的情況下,實(shí)現(xiàn)比較精確的目標(biāo)檢測和追蹤.其核心思想是利用跟蹤軌跡周圍一定范圍內(nèi)的聯(lián)合測量值作為新軌跡的狀態(tài)進(jìn)行更新,以減少測量值周圍的雜波引起的較大誤差.該方法屬于比較傳統(tǒng)的、經(jīng)典的多目標(biāo)追蹤檢測算法,限于篇幅限制,本文不進(jìn)行諸多論述.
為了對智能感知算法的能力進(jìn)行驗(yàn)證,在地面開展了相關(guān)的試驗(yàn)驗(yàn)證.在敏感器前端20 m處放置拋射器,通過拋射器拋射拋射5 mm的小球,調(diào)整初始拋射方向,敏感器對小球的運(yùn)動軌跡進(jìn)行監(jiān)視,試驗(yàn)結(jié)果如圖7所示,圖中3種不同顏色的曲線表示對3個不同目標(biāo)的檢測和追蹤,而背景孤立的信號為經(jīng)過脈沖神經(jīng)網(wǎng)絡(luò)去噪后的殘余信號.試驗(yàn)結(jié)果表明,本文所采用的基于脈沖神經(jīng)網(wǎng)絡(luò)去噪+聯(lián)合概率濾波算法,對基于AER表征的二值編碼高速信號具有很好的檢測效果,未來可在軌應(yīng)用于星載觸發(fā)式智能感知系統(tǒng).
圖7 智能感知算法識別結(jié)果Fig.7 The recognition result of intelligence algorithm perception
本文對星載觸發(fā)式瞬態(tài)目標(biāo)智能感知系統(tǒng)進(jìn)行了介紹,并詳細(xì)介紹了目標(biāo)智能感知算法.通過設(shè)計了脈沖神經(jīng)網(wǎng)絡(luò)去噪+聯(lián)合概率濾波檢測追蹤的算法方案,該智能算法具備對多目標(biāo)較好的檢測和追蹤能力,未來可應(yīng)用于在軌實(shí)時處理系統(tǒng).