張海龍,張亞州,王 杰,冶鑫晨,王萬瓊,李 嘉,張 萌,杜 旭
(1. 中國科學(xué)院新疆天文臺,新疆 烏魯木齊 830011;2. 中國科學(xué)院大學(xué),北京 100049;3. 中國科學(xué)院射電天文重點實驗室,江蘇 南京 210033;4. 國家天文科學(xué)數(shù)據(jù)中心,北京 100101)
射電天文學(xué)中,射頻干擾定義為任何可能影響天文觀測的有害信號。射電天文學(xué)發(fā)展過程中,抑制射頻干擾一直是天文學(xué)家研究的熱點。隨著信息技術(shù)飛速發(fā)展,人為造成的干擾信號導(dǎo)致天文臺站周圍電磁環(huán)境惡化,影響射電望遠鏡正常觀測。
射頻干擾的來源多種多樣,包括外部來源和內(nèi)部來源。外部來源主要由天文臺址外的設(shè)備產(chǎn)生,如人造衛(wèi)星[1](北斗和全球定位系統(tǒng)導(dǎo)航衛(wèi)星等)、飛機、臺址附近的基站信號以及電視廣播信號等;內(nèi)部來源主要是天文臺址內(nèi)的電子設(shè)備,如計算機、視頻監(jiān)控、網(wǎng)絡(luò)交換設(shè)備、無線輸入設(shè)備等[2]。天文信號通常為寬頻帶且在時間尺度上平滑變化,而射頻干擾在時域和頻域的幅值強度高,絕大部分射頻干擾與天文信號相比有明顯差異[3]。射頻干擾與熱噪聲不同,它通常由通信系統(tǒng)、人造雷達或電子設(shè)備產(chǎn)生的干擾構(gòu)成,且具有復(fù)雜的時間和頻率結(jié)構(gòu),常見通信信號的功率比天文信號高多個數(shù)量級并且隨時間變化,因此無法通過長時間積分來降低強度,嚴(yán)重影響天文數(shù)據(jù)質(zhì)量。天文學(xué)家針對上述問題已提出了多種射頻干擾抑制方法,但仍受到以下因素制約:
(1)隨著無線技術(shù)的飛速發(fā)展及人類活動范圍的擴大,地面及空間產(chǎn)生的人為干擾逐年遞增。
(2)隨著制造技術(shù)和信息技術(shù)的飛速發(fā)展,射電望遠鏡向大口徑或大規(guī)模陣列方向發(fā)展,隨著多波束或相控陣饋源接收系統(tǒng)的投入使用,觀測設(shè)備的靈敏度及數(shù)據(jù)收集能力顯著提升,同時射頻干擾抑制問題更加復(fù)雜。
在射電天文觀測以及數(shù)據(jù)處理過程中需要針對不同階段采取不同的射頻干擾應(yīng)對策略,本文將射頻干擾抑制策略分為主動預(yù)防階段、預(yù)相關(guān)階段及后相關(guān)階段,不同階段的射頻干擾問題可以采取不同的抑制方法。主動預(yù)防階段若能采取有效防護手段,能夠杜絕通信基站、電視廣播等大部分射頻干擾進入系統(tǒng);預(yù)相關(guān)階段采取參考天線及空間濾波等方法可以應(yīng)對特定射頻干擾源;后相關(guān)階段可以采取閾值法處理幅值強度遠大于天文信號的射頻干擾,或利用機器學(xué)習(xí)相關(guān)技術(shù)實現(xiàn)射頻干擾數(shù)據(jù)標(biāo)記。下面針對不同階段可采取的射頻干擾抑制策略進行詳細分析。
射電望遠鏡觀測來自宇宙遙遠天體的微弱信號,對臺址周邊電磁干擾有較高要求,選擇地理環(huán)境較好的臺址及建立無線電寧靜保護區(qū)是抑制射頻干擾的重要一步,可以從根源上去除大部分干擾。 500 m口徑球面射電望遠鏡(Five-hundred-meter Aperture Spherical radio Telescope, FAST)是世界最大單口徑、最靈敏的射電望遠鏡,位于貴州省黔南布依族苗族自治州平塘縣克度鎮(zhèn)大窩凼,以臺址為中心,建立半徑為30 km的電磁波寧靜區(qū),分為不同要求的 3 個區(qū)域。其中以臺址為圓心,半徑5 km范圍為核心保護區(qū),5~10 km的環(huán)帶為中間區(qū),10~30 km的環(huán)帶為邊遠區(qū)[4],如圖1。電磁波寧靜區(qū)能夠屏蔽絕大部分外來干擾源。
圖1 500 m口徑球面射電望遠鏡無線電寧靜保護區(qū) [5]Fig.1 FAST radio quiet zone[5]
新疆奇臺110 m全向可動射電望遠鏡(Qi Tai Radio Telescope, QTT)[6]位于新疆昌吉州奇臺縣,以臺址為中心,依據(jù)地形特征及當(dāng)?shù)貙嶋H情況, 規(guī)劃了30 km的無線電寧靜區(qū)。該寧靜區(qū)共分為3個區(qū)域,分別為核心區(qū)、限制區(qū)和協(xié)調(diào)區(qū),其中核心區(qū)為2.5 km × 4 km的矩形區(qū)域;限制區(qū)為10 km × 15 km的矩形區(qū)域[7-8],如圖2。
圖2 新疆奇臺110 m全向可動射電望遠鏡
國際電信聯(lián)盟(International Telecommunication Union, ITU)通過劃分頻譜來協(xié)調(diào)8.3 MHz~300 GHz之間的無線電頻譜,將其分為幾個頻帶,僅允許指定服務(wù)運行[9]。在分配的所有頻段中,約有70到80個頻段對應(yīng)于射電天文學(xué)(確切的數(shù)量取決于地區(qū)和當(dāng)?shù)胤?。針對射電天文頻段,一種是射電天文專用頻段(或與無源服務(wù)共享),嚴(yán)格禁止無線電發(fā)射;另一種是與有源業(yè)務(wù)共享的頻段,只能部分施加保護。射電天文的波段選擇通常與科學(xué)目標(biāo)有關(guān)。例如,氫線位于1 420 MHz附近,因此1 400~1 427 MHz頻帶給射電天文學(xué)保留[10]。
即使是射電天文專用頻段,由于有源元件的無線電寧靜保護區(qū)[7]
Fig.2 QTT radio quiet zone[7]
諧波和功率泄漏,仍然可能存在干擾。對于這些情況,國際電信聯(lián)盟在其 ITU-R RA.769建議報告中將最大可接受的干擾定義為在測量功率中引入不超過10%的誤差,這是天文學(xué)家普遍接受的閾值,該報告還為一些典型的天文波段提供了一份使用普通望遠鏡和觀測參數(shù)的建議閾值清單[11]。
射頻干擾主動預(yù)防策略中最直接的方法是為天文臺選擇遠離干擾源的偏遠位置。自然形態(tài)(例如山脈)可以有效阻止外部干擾,但干擾源會因為多徑傳播產(chǎn)生反射和衍射,從而增加干擾抑制的難度。研究發(fā)現(xiàn),在望遠鏡臺址周圍種植松樹等針葉樹可以有效抑制射頻干擾,針葉中的水分可以吸收1 GHz以上的信號[12]。部分天文臺站建在高海拔地區(qū)以減少大氣對觀測的影響,遠離人類活動范圍,同時盡可能避免干擾源多徑傳播。面對內(nèi)部干擾,通常的辦法是在產(chǎn)生干擾的電子設(shè)備(計算機、微波和射頻元件)上覆蓋電磁屏蔽材料如導(dǎo)電箔,也可以將電子設(shè)備集中放入屏蔽室,將干擾控制在密閉空間,并不影響設(shè)備性能。
通常,主動預(yù)防是處理干擾的最有效方法,可以作為射頻干擾的第1層防護。但仍然存在不足:
(1)只能為電磁頻譜的小部分提供保護;
(2)對于高靈敏度的設(shè)備,電磁屏蔽材料不能完全屏蔽干擾;
(3)衛(wèi)星通信以及飛機等產(chǎn)生的干擾,由于相對位置限制,無法通過主動預(yù)防避免。
本文將觀測獲取的原始數(shù)據(jù)在未寫入磁盤形成可供科學(xué)研究處理之前的射頻干擾處理階段定義為預(yù)相關(guān)階段。對于單天線觀測可利用參考天線通過自適應(yīng)濾波方式去除特定干擾,對于陣列天線可采用空間濾波方法抑制射頻干擾。
自適應(yīng)濾波算法是由Barnbaum和Bradley在1998年首次引入射電天文領(lǐng)域,用來解決射頻干擾問題[13],在2005年,文[14]的現(xiàn)場試驗證明,在射頻干擾存在的情況下,自適應(yīng)濾波方式能夠極大提高脈沖星觀測數(shù)據(jù)的質(zhì)量。
參考天線接收的信號可以表示為
R=Rnoise+Rrfi+Rastr,
(1)
其中,R為參考天線接收的信號;Rnoise為參考天線的系統(tǒng)噪聲;Rrfi為參考天線接收的射頻干擾;Rastr為參考天線接收的天文信號,天文信號通過參考天線的旁瓣接收,其強度微弱可忽略不計。同理,主望遠鏡接收的信號可以表示為
M=Mnoise+Mrfi+Mastr,
(2)
主望遠鏡和參考天線接收的系統(tǒng)噪聲不相關(guān),而接收的射頻干擾具有相關(guān)性。為了消除主天線中的射頻干擾,使其對準(zhǔn)射頻干擾源,并通過不斷優(yōu)化參考天線的指向和極化方向提高參考天線中射頻干擾的信噪比。
自適應(yīng)濾波具體實現(xiàn)步驟:
(1)在自適應(yīng)相關(guān)環(huán)路中確定復(fù)增益系數(shù)g(該系數(shù)是不斷迭代優(yōu)化的)與參考天線接收的信號R相乘,逐步迭代gRrfi,使其大小接近主天線的射頻干擾信號,能最大程度地消除主天線某一特定方向的射頻干擾。
(2)當(dāng)g達到最優(yōu)值時,gRrfi基本接近Mrfi,天文信號與參考信號的差值即去除特定干擾后的天文信號。
(3)圖3為自適應(yīng)濾波器基本設(shè)計圖,將原始參考信號與濾波器輸出相關(guān),當(dāng)相關(guān)系數(shù)為0時,達到最佳增益。
相關(guān)項計算公式為
C(g)=(M-g·R)·R,
(3)
當(dāng)C(g)=0時,可剔除主天線的射頻干擾,即
(4)
圖3 自適應(yīng)濾波器基本設(shè)計圖Fig.3 Adaptive filter basic design diagram
代入天線接收的各個分量得
(5)
因為兩個天線的系統(tǒng)噪聲、天文信號、其他信號均與射頻干擾不相關(guān),參考天線中的天文信號非常微弱,可以忽略不計,即Rastr=0,那么上式進一步簡化得
(6)
令Mrfi=ξRrfi,g可以寫為
(7)
(8)
在天文觀測中,主天線指向待觀測的天體,Mrfi在觀測期間可以認為是恒定量,Srfi與干擾噪聲比成反比,即干擾噪聲比越大,Srfi越小,說明提高射頻干擾在參考天線中的信噪比能提高主天線射頻干擾抑制能力。
影響自適應(yīng)濾波性能的幾個因素:
(1)混合射頻干擾源
自適應(yīng)濾波方法消除單源射頻干擾效果較好,但是面對復(fù)雜的射頻干擾環(huán)境,其抑制射頻干擾的性能會大幅度下降。對于混合射頻干擾,當(dāng)兩個干擾信號處于相同頻域時,振幅大的干擾被消減。天文臺址附近射頻干擾來源復(fù)雜,且與天文信號相比具有較高的功率,在此類條件下自適應(yīng)濾波方法射頻干擾抑制效果一般[15]。
(2)多路徑傳播影響
多徑傳播是指由于信號到達接收天線的路徑不同,而存在同一信號多個副本的現(xiàn)象,通常是由大型陸地物體(山脈、 建筑物)、大型水體(湖泊、 瀉湖)和電離層反射產(chǎn)生的。
圖4為多路徑干擾信號傳播場景。因為到達望遠鏡和參考天線的多個副本有不同的時間延遲,如果延遲足夠大,那么添加的信號就可以視為完全不相關(guān)。在這種情況下,多路徑情況相當(dāng)于多個射頻干擾源,射頻干擾信號種類繁多,難以獲得濾波器多徑傳播的通用表達式。防止多徑傳播的最佳措施是將望遠鏡和參考天線放置在盡可能近的位置,以減小傳播距離差異,并通過增加快速傅里葉變換點數(shù)來提高系統(tǒng)的頻率分辨率,或在快速傅里葉變換點數(shù)不變的條件下減小系統(tǒng)帶寬[15]。
圖4 射頻干擾多徑傳播情況Fig.4 RFI multipath propagation situation
(3)違反線性時不變(LTI)條件
假設(shè)干擾傳播路徑至少在濾波器收斂的時間內(nèi)滿足線性時不變條件,如果不滿足線性時不變條件,則表示射頻干擾路徑在某些地方呈現(xiàn)非線性或時變的傳播特性。然而,沒有任何自然介質(zhì)表現(xiàn)出足夠強的非線性,或具有快速變化的傳播特性而影響濾波器的性能,特別是考慮到最終算法收斂時間是毫秒級的。當(dāng)望遠鏡跟蹤天體時,捕獲射頻干擾的旁瓣隨望遠鏡一起移動,被測射頻干擾的路徑特性隨時間逐漸變化。自適應(yīng)濾波方法需要具備相應(yīng)計算能力,不會因望遠鏡緩慢移動而受到明顯影響。
接收機前端的一些模擬元件是信號飽和的,如放大器和頻率混頻器。當(dāng)一個分量達到飽和時,輸入信號的幅值會被削去,從而產(chǎn)生諧波失真,影響系統(tǒng)的線性時不變條件。這種失真被視為附加的損壞信號,其頻率是原始輸入信號中心頻率的幾倍。此外,由于數(shù)字化后的混疊等原因,諧波信號往往被混入基帶,從而破壞天文數(shù)據(jù)。主信道射頻干擾諧波失真會嚴(yán)重破壞濾波器性能,附加的諧波信號不會出現(xiàn)在參考信道中,使得這類射頻干擾更難抑制[15]。
空間濾波方法主要針對多通道射電天文觀測中的射頻干擾抑制問題[16-18],該技術(shù)適用于干涉射電望遠鏡陣列,如荷蘭的Westerbork綜合射電望遠鏡(Westerbork Synthesis Radio Telescope, WSRT)、美國的甚大陣列(Very Large Array, VLA),或配置了相控陣接收系統(tǒng)的單天線望遠鏡。圖5為空間濾波技術(shù)在天線陣列系統(tǒng)中的應(yīng)用。
圖5 天線陣列系統(tǒng)在不同階段抑制射頻干擾
射電望遠鏡接收的信號由3部分組成,射電源信號(擬觀測目標(biāo))、系統(tǒng)噪聲和射頻干擾。系統(tǒng)噪聲由宇宙背景噪聲、大氣噪聲、接收機噪聲等噪聲分量組成。根據(jù)中心極限定理,系統(tǒng)噪聲是時間獨立且高斯分布的信號,在短時間間隔上是短時平穩(wěn)的,且所有的射電源假定在統(tǒng)計學(xué)上彼此獨立[12]。
射電天文學(xué)中的射頻干擾特征是各種各樣的。本文選擇中心窄帶高斯平穩(wěn)、二階非周期和循環(huán)平穩(wěn)信號3種不同的信號特性對射頻干擾建模。
天線陣列共有M個天線,其中x(t)=[x1(t)…xM(t)]T表示M× 1個天線陣列的輸出,其中,第k個天線在t時刻的輸出為xk(t),那么x(t)可以寫為
x(t)=Ac·c(t)+Ar·r(t)+n(t),
(9)
其中,c(t)=[c1(t)…cNc(t)]T表示在t時刻射電源的特征向量,大小為Nc× 1;Ac=[c1(t,θc1,φc1)…cNc(t,θcNc,φcNc)]是射電源的空間特征向量矩陣,大小為M×Nc,其中cn(t,θcn,φcn)=[cn,1(t,θcn,φcn)…cn,M(t,θcn,φcn)]T是第n個射電源的空間特征向量。同理,Ar和r(t)分別代表射頻干擾的空間特征向量矩陣以及在t時刻射頻干擾的信號特征向量,n(t)=[n1(t)…nM(t)]T是系統(tǒng)噪聲在t時刻的向量,大小為M× 1。
通過協(xié)方差矩陣描述射電源在時間維度上的相關(guān)性,即
(10)
其中,R(t,τ)為在t時刻τ范圍內(nèi)射電源信號的相關(guān)性;xH代表x的共軛轉(zhuǎn)置。假設(shè)射頻干擾、射電源和系統(tǒng)噪聲三者相互獨立,即互不相關(guān),那么
(11)
從線性代數(shù)的觀點來看,相控天線陣列射電望遠鏡數(shù)據(jù)協(xié)方差矩陣可以看作是線性變換矩陣。這個矩陣生成一個數(shù)據(jù)向量空間,該向量空間由射頻干擾子空間、射電源子空間和系統(tǒng)噪聲子空間組成。圖6展示了一個無噪聲場景下的二維數(shù)據(jù)向量空間的示例。紅色和黑色矢量分別代表與射電源和射頻干擾源相關(guān)的向量。
使用正交投影技術(shù)減少干擾,將數(shù)據(jù)向量空間投影到與射頻干擾子空間正交的子空間上,投影的射頻干擾子空間完全為0,由此產(chǎn)生的數(shù)據(jù)只包含射電源。
從圖6可以清楚地看出,在投影后,恢復(fù)的射電源能量取決于兩個向量的夾角大小,即
(12)
其中,P2為射電源的功率;θac,arn為射頻干擾向量與射電源向量的夾角大小,在0~90°范圍內(nèi),θac,arn越大,最終投影得到的射電源功率越大。但是射電源子空間和干擾子空間之間的夾角難以測量,需要借助投影矩陣間接計算。
圖6 二維數(shù)據(jù)向量空間的正交投影
設(shè)投影矩陣為P,它的特征值是0或1。特征值為0對應(yīng)的特征向量生成投影核子空間,特征值為1對應(yīng)的特征向量生成值域子空間。因此投影矩陣的秩等于它的值域子空間的維數(shù)。如果H是投影范圍子空間基,K是投影核子空間基,則有
P·H=H,P·K=0.
(13)
由基矩陣H生成的投影矩陣定義為
P=H(HTH)-1HT,
(14)
其值域是正交于H的子空間的正交投影為P⊥,定義為
P⊥=I-H(HTH)-1HT.
(15)
在多干擾的情況下,干擾子空間是多維的,這個子空間是由存儲在矩陣Ar中的獨立射頻干擾向量集合生成。因此,投影矩陣可以表示為
(16)
在預(yù)相關(guān)階段,可用數(shù)據(jù)為天線陣列輸出數(shù)據(jù)向量x(t),將其投影到射頻干擾子空間的正交空間,修正后的數(shù)據(jù)向量xclean(t)為
xclean(t)=Pr⊥x(t).
(17)
從以上內(nèi)容可知,空間濾波需要預(yù)先知道干擾源的來源,以便確定投影矩陣,對于復(fù)雜的干擾環(huán)境,測定干擾源的具體位置是非常困難的。
由于射頻干擾信號強度通常比天文信號大幾個數(shù)量級,閾值法是一種有效抑制射頻干擾的方法。閾值水平通常根據(jù)統(tǒng)計量決定,可以用一段數(shù)據(jù)的均值、均方根等作為閾值參考值,超出這個范圍的值標(biāo)記為射頻干擾。閾值法不足之處是會誤將天文信號標(biāo)記為射頻干擾,在后相關(guān)階段降低射頻干擾檢測的錯誤率是研究射頻干擾抑制問題的一個重要方向。
在頻域和時域上,射頻干擾往往影響相鄰的數(shù)據(jù),因為其強度比較低,不會被標(biāo)記為射頻干擾,增加了檢測射頻干擾的錯誤率。VarThreshold是一種組合閾值算法,其思想是當(dāng)組合樣本的某一統(tǒng)計屬性超過某個限值時,將標(biāo)記樣本的組合為射頻干擾[19-20]。 假設(shè)A和B是相鄰的樣本采樣點,常規(guī)閾值法是分別查看樣本A和B是否超過設(shè)定的閾值水平線,如果超過,則標(biāo)記為射頻干擾。但對于組合閾值來說,只有樣本A和B都超過閾值,才將這一組合的樣本都標(biāo)記為射頻干擾。如果樣本A和B沒有被標(biāo)記為射頻干擾,它們將和下一個相鄰的采樣點C進行組合,繼續(xù)與閾值進行對比,迭代多次完成射頻干擾標(biāo)記。算法公式為
flagυM(υ,t)=?i∈{0,…,M-1}:?j∈{0,…,M-1}:|R(υ+aΔυ,t)|>χM,
(18)
(18)式表達了從t時刻起,M個數(shù)的范圍內(nèi),如果該范圍內(nèi)所有采樣點的絕對值大于χM,那么將這M個數(shù)都標(biāo)記為射頻干擾。
VarThreshold算法用一組嚴(yán)格遞減的閾值序列χi(i=1,…,N)判定某個采樣點是否應(yīng)被標(biāo)記為射頻干擾,公式為
(19)
其中,χ1是單采樣點閾值,當(dāng)ρ=1.5時效果最好。χ1的取值由數(shù)據(jù)的統(tǒng)計水平量決定,即選取的閾值使射頻干擾的假陽率最小。
SumThreshold算法也是一種組合閾值算法[19-20],與VarThreshold算法求解閾值序列類似,只是ρ值不同,當(dāng)ρ=1.2時效果最好。求出一組閾值T={T1,T2,T4, …},通過迭代的方式與樣本進行比較,即T1與單樣本比較,T2與兩個樣本的均值比較,Tm與m個樣本的均值比較,當(dāng)樣本均值大于閾值時,標(biāo)記為射頻干擾,且不參與后續(xù)的迭代計算過程。以一維序列為例,設(shè)序列為{1, 7, 4, 3, 2, 1, 1, 6, 1, 1, 3, 2, 3, 2},閾值χ為{χ1=6,χ2=3,χ4=2}。
圖7、圖8和圖9展示了 SumThreshold算法的過程。從算法角度考慮,該算法的時間復(fù)雜度為
圖7 第1輪,閾值為χ1=6,只有7被標(biāo)記
圖8 第2輪,閾值為χ2=3Fig.8 In the second round, the threshold value is χ2=3
圖9 第3輪,閾值為χ4=2Fig.9 In the third round, the threshold value is χ4=2
O(n2)。為了減小計算速度,當(dāng)閾值M取1, 2, 4, 8, 16, 32, 64, 128, 256 … 時,時間復(fù)雜度降至O(nlogn)。
奇異值分解是線性代數(shù)中一種重要的矩陣分解,能夠提取信息,簡化數(shù)據(jù),去除噪聲等,可將數(shù)據(jù)映射到低維空間[21]。奇異值可以分解為
A=UΣVT.
(20)
如(20)式,奇異值分解將原始矩陣A分解為3個矩陣:U,Σ和VT,其中U和V是正交矩陣,Σ是對角矩陣,對角線上的元素為奇異值。絕大部分射頻干擾信號在時域或頻域上的振幅較大。用A代表接收的天文信號,將其進行奇異值分解,即A=UΣVT,將Σ中最大特征值置為0,逆
向恢復(fù)后,得到新的矩陣A^,那么原矩陣A中幅值較大的信號(射頻干擾)會被抑制。
當(dāng)射頻干擾信號足夠強,且σRFIσastro=0時,算法效果最好。該方法僅適用于寬帶射頻干擾信號,對于遵從高斯分布的射頻干擾信號并不適用[19-20]。
隨著機器學(xué)習(xí)和深度學(xué)習(xí)等技術(shù)快速發(fā)展以及天文數(shù)據(jù)的急速增長,兩者的結(jié)合已成必然趨勢。通過對大量數(shù)據(jù)進行學(xué)習(xí)和訓(xùn)練后,能有效地標(biāo)記天文信號中的射頻干擾,并進行特征提取。
主成分分析是一種用于數(shù)據(jù)特征降維的方法,常用于減少數(shù)據(jù)集的維數(shù),同時保持數(shù)據(jù)集對方差貢獻最大的特征。這樣低階成分往往能夠保留數(shù)據(jù)的重要信息,方便特征提取和分類[22-23]。
文[24]對生活中常見的9種瞬時射頻干擾來源進行分類測試實驗,在時域范圍內(nèi)分別使用標(biāo)準(zhǔn)主成分分析和核主成分分析進行測試。之后用聚類分離的方法比較了兩種方法的聚類精度,結(jié)果如圖10和圖11,發(fā)現(xiàn)核主成分分析在區(qū)分來源方面比標(biāo)準(zhǔn)主成分分析更好,能有效區(qū)分瞬時射頻干擾來源。
圖10 標(biāo)準(zhǔn)主成分分析[24] Fig.10 Standard PCA[24]
圖11 核主成分分析[24]Fig.11 Kernel PCA[24]
在機器學(xué)習(xí)中,支持向量機是在分類與回歸分析中分析數(shù)據(jù)的監(jiān)督式學(xué)習(xí)模型與相關(guān)的學(xué)習(xí)算法[25]。
文[26]選取時間長度為300 μs的非射頻干擾和射頻干擾信號訓(xùn)練,提取均方根、均值、方差、均值與方差之比、偏度、峰度、最大振幅、最小振幅和峰值個數(shù)等信息,導(dǎo)入支持向量機訓(xùn)練模型,之后對測試數(shù)據(jù)進行射頻干擾和非射頻干擾分類,流程如圖12。結(jié)果表明,即使干擾噪聲比低和射頻干擾占空比小的情況下,該方法仍能準(zhǔn)確地檢出射頻干擾,效果良好。
圖12 基于支持向量機的射頻干擾抑制過程Fig.12 RFI suppression process based on SVM
神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)包含輸入層、隱藏層和輸出層,由大量節(jié)點相互連接構(gòu)成,是一種非線性統(tǒng)計數(shù)據(jù)建模工具,常用來對輸入和輸出間復(fù)雜的關(guān)系進行建模,或用來探索數(shù)據(jù)的模式[27]。
文[28]提出了全卷積神經(jīng)網(wǎng)絡(luò)(Deep Fully Convolutional Neural Network, DFCN)用于圖像的分割,解決的核心問題是圖像像素級別的分類。文[29]利用全卷積神經(jīng)網(wǎng)絡(luò),如圖13,H和W分別對應(yīng)輸入的時間和頻率可見性維數(shù),F(xiàn)為濾波器層數(shù),L對應(yīng)輸入和全卷積層之間的層數(shù)總和,以振幅和相位為特征,瀑布圖進行特征提取,并標(biāo)出射頻干擾。
圖13 全卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)[28]Fig.13 DFCN architecture[28]
文[30]提出的U-Net神經(jīng)網(wǎng)絡(luò),是在卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上增加卷積的擴展路徑,可以對小樣本的數(shù)據(jù)集進行較快、有效的圖像分割,常用于醫(yī)學(xué)細胞圖像分割。文[3]成功應(yīng)用了U-Net深度神經(jīng)網(wǎng)絡(luò)模型來識別單天線射電望遠鏡數(shù)據(jù)中的射頻干擾,其結(jié)構(gòu)如圖14。
圖14 U-Net架構(gòu) [3]Fig.14 U-Net architecture [3]
文[5]發(fā)現(xiàn)使用卷積神經(jīng)網(wǎng)絡(luò)對500 m口徑球面射電望遠鏡數(shù)據(jù)進行標(biāo)記射頻干擾時,常常標(biāo)記錯誤,需要進一步人工檢查,帶來了顯著的額外工作量。為了克服這一問題,文[5]提出了一種稱為RFI-Net的神經(jīng)網(wǎng)絡(luò)模型,如圖15,結(jié)果表明,RFI-Net模型優(yōu)于U-Net, KNN(K-nearest Neighbour)和SumThreshold算法。
圖15 RFI-Net架構(gòu) [5]Fig.15 RFI-Net architecture [5]
循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN)是一類用于處理序列數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò),對處理上下文關(guān)聯(lián)的語音[31]數(shù)據(jù)有很好效果。天文信號也是一種時序數(shù)據(jù),非常適合使用循環(huán)神經(jīng)網(wǎng)絡(luò)對其進行處理,文[32]利用循環(huán)神經(jīng)網(wǎng)絡(luò)對射電望遠鏡干涉陣列數(shù)據(jù)進行射頻干擾檢測,根據(jù)巨型米波射電望遠鏡(Giant Metrewave Radio Telescope, GMRT)610 MHz的射頻干擾振幅信息,區(qū)分射頻干擾和非射頻干擾數(shù)據(jù)。
本文系統(tǒng)闡述了射電天文中抑制和標(biāo)記射頻干擾算法和技術(shù),分析了在主動預(yù)防階段、預(yù)相關(guān)階段、后相關(guān)階段射頻干擾抑制方法的優(yōu)勢和不足。采用有效的屏蔽手段可以在主動預(yù)防階段阻止大部分射頻干擾進入系統(tǒng);預(yù)相關(guān)階段基于各個天線中的天文信號具有相關(guān)特性抑制射頻干擾;在后相關(guān)階段大部分算法基于閾值標(biāo)記射頻干擾。通過機器學(xué)習(xí)相關(guān)技術(shù)對射頻干擾進行標(biāo)記和識別是目前的研究熱點,基于海量天文數(shù)據(jù)進行訓(xùn)練能夠極大提高標(biāo)記射頻干擾的正確率,但不足是前期手動標(biāo)記訓(xùn)練樣本中射頻干擾和天文信號十分耗費時間,目前可用的訓(xùn)練樣本有限。
射頻干擾抑制問題需要在不同階段采用多種方法協(xié)同解決,從射電望遠鏡臺址周邊的無線電環(huán)境保護到最終天文數(shù)據(jù)處理過程各個環(huán)節(jié)都需要考慮射頻干擾問題。各天文臺站需要結(jié)合實際需求和所處環(huán)境的電磁干擾情況,合理選擇射頻干擾抑制方法。