魯信金,黃璐瑩,陳繼林,雷 菁,李 為
(國防科技大學 電子科學學院,湖南 長沙 410073)
伴隨著移動通信技術的迅猛發(fā)展,未來6G研究創(chuàng)新窗口悄然而至[1]。衛(wèi)星通信納入6G網絡作為其中一個重要子系統(tǒng)得到普遍認可,目前將衛(wèi)星送入太空的競賽正在火熱進行中,人造衛(wèi)星數量日益暴增[2]。為實現真正全球覆蓋和數據傳輸,衛(wèi)星網絡與地面網絡融合形成的“天網-地網”衛(wèi)星互聯網體系設計將不斷完善,這使得網絡通信從硬件到軟件,再到網絡管理都存在著不安全因素[3-4]。為此衛(wèi)星互聯網受到威脅和攻擊的可能性越來越大,移動通信的脆弱性和安全問題日益突出。
天基衛(wèi)星通信網絡、空基通信網絡、陸地通信網絡和海洋通信網絡構成了衛(wèi)星互聯網系統(tǒng),其組成的復雜性和特殊性使得衛(wèi)星互聯網具有信道開放、節(jié)點暴露、拓撲高度動態(tài)變化等特點[5]。衛(wèi)星節(jié)點暴露且信道開放使得衛(wèi)星互聯網中的衛(wèi)星節(jié)點長期直接暴露于空間軌道上,從而星間、星地等鏈路極易受到竊聽、偽造和干擾等威脅[6-7]。
① 竊聽威脅:衛(wèi)星互聯網通信具有傳輸距離遠、通信速率慢、衛(wèi)星集群密集等特點,使得衛(wèi)星間的通信更容易被敵方竊聽。竊聽方只需一個低成本的衛(wèi)星接收終端,就可截獲到衛(wèi)星通信的傳輸信號,通過專業(yè)的信號分析進一步得到傳輸內容,解析出整個衛(wèi)星系統(tǒng)的通信編碼體制。
② 偽造威脅:目前衛(wèi)星通信中的控制指令是由明文指令發(fā)送或者只進行簡單的加密傳輸,很容易被敵方偽造出假的控制指令向衛(wèi)星發(fā)出指令,造成衛(wèi)星合法通信中斷,使正常數據無法進行傳輸,甚至導致整個衛(wèi)星互聯網系統(tǒng)癱瘓。
③ 通信干擾威脅:衛(wèi)星互聯網的電磁環(huán)境復雜,極易受到惡意信號的電磁干擾以及大氣中的電磁信號及宇宙射線等各類干擾,使得正常衛(wèi)星通信的數據傳輸受到影響甚至發(fā)生中斷[8]。另一方面,由于衛(wèi)星互聯網中的通信都是低功率傳輸,敵方可以通過大功率壓制,使得合法的衛(wèi)星通信業(yè)務無法正常傳輸,造成衛(wèi)星的事實癱瘓。
為解決未來6G衛(wèi)星互聯網存在的上述問題,本文提出了衛(wèi)星互聯網無線通信安全抗干擾技術方案。首先,對于衛(wèi)星互聯網無線安全傳輸方案的設計,設計可變碼率的安全polar編譯碼,使得編碼碼字更具有靈活性和適用性,而且編碼和加密同時進行,保證系統(tǒng)的可靠性和安全性。此外,針對高速移動場景,設計新型調制即正交時頻空(Orthogonal Time and Frequency Space, OTFS)調制加密方案,從而可以對抗信道的動態(tài)時變性。在OTFS調制系統(tǒng)中進行復數域等距變換,使得變換后的星座圖呈現球狀混亂,因而調制方式和信息得以隱蔽,增大了竊聽者的解密難度。
其次,對于衛(wèi)星互聯網物理層用戶身份認證,采用無線信道狀態(tài)信息、設備射頻(Radio Frequency, RF)指紋、物理層信號水印作為認證媒介,從而在底層有效防止用戶的偽裝和非法截獲。衛(wèi)星互聯網的身份認證可以在對信號進行解調和解碼之前進行,避免浪費信號處理資源。此外,物理層認證技術不用考慮數據鏈路層、網絡層、應用層的安全機制的執(zhí)行方式,有很好的兼容性。
最后,針對衛(wèi)星互聯網干擾環(huán)境下用戶通信問題,研究中繼-信道聯合選擇抗干擾決策優(yōu)化方法。采用強化學習算法,將中繼和信道決策過程建模為馬爾科夫決策過程(MDP)。為了避免控制信道被干擾,同時考慮了控制信道的動態(tài)頻譜接入。用戶和中繼節(jié)點通過不斷地和環(huán)境進行交互,加強對環(huán)境的認知,使用戶和中繼節(jié)點能夠在頻譜環(huán)境動態(tài)變化且中繼節(jié)點分布未知的情況下,分別獲得最優(yōu)的中繼節(jié)點和傳輸信道策略。
針對衛(wèi)星互聯網信道編碼層的安全,安全編碼的目的是保證私密信息安全且可靠的前提下,盡量提高私密信息的信息傳輸速率。首先,在有密鑰安全編碼技術中,需要的密鑰體積往往很大,如McEliece公鑰密碼算法[9]。其次,在無密鑰安全編碼技術中,通過加入校驗冗余增強信息之間的聯系來糾正和檢測錯誤,使得合法接收端的信息誤比特率低于正常工作所需的最小誤比特率,從而增加可靠性;通過加入隨機冗余減少信息間的聯系,使竊聽者無法從接收到的部分消息獲知私密信息,增加了安全性;通過盡可能減少各種冗余,提高信息傳輸速率,增加了有效性。
由于polar碼的編譯碼算法[10]都對碼長有限定條件,即碼長必須滿足2的冪次方:N=2n。雖然當碼長N固定時,信息比特長度K可以任意取值,編碼速率R=K/N也能隨之自由變化;但當信息比特長度K固定時,編碼速率無法通過調整碼長實現自由變化。從實際出發(fā),希望設計編譯碼器在不改變基本編譯碼結構的情況下,使碼長和編碼速率都能夠自適應調節(jié)。在設計速率可變的編碼時,刪余是碼元縮減的重要手段,可以提高信道編碼的效率,實現碼字的速率可變性?;趐olar碼的編碼結構和物理層加密技術,在進行polar碼編碼的過程中通過對生成矩陣的刪余和polar碼凍結位的刪余進一步引入碼字縮減,使得polar碼碼字長度減少,這樣可以在不改變基本編譯碼結構的情況下,使碼長和編碼速率都能夠自適應調節(jié)[11]。另外,收發(fā)雙方通過物理層密鑰提取技術,利用信道特點提取初始密鑰,再利用混沌發(fā)生器進一步擴展生成混沌序列,用于控制刪余碼字,從而進一步提升Polar碼傳輸安全性。圖1為一種基于刪余Polar碼的通信系統(tǒng)方案。
圖1 基于刪余Polar碼的通信系統(tǒng)模型
在物理層編碼加密系統(tǒng)中,加密和糾錯在物理層同時完成。首先,合法通信雙方Alice和Bob對主信道進行密鑰提取,由于無線信道的時空唯一性以及混沌系統(tǒng)的初值敏感性,竊聽方Eve無法獲取任何關于密鑰的消息。其次,將提取的密鑰傳輸至混沌序列發(fā)生器,產生擴展密鑰即混沌序列。當Alice傳輸消息給Bob時,將明文通過編碼加密模塊,即利用混沌訓練進行polar碼刪余的具體控制,得到刪余碼字X再傳送至信道。Bob接收到信息Y后,利用譯碼解密模塊,從而得到消息U。由于編碼加密模塊的存在,Eve竊聽到的是加密刪余后的碼字Z,由于Eve無法獲得密鑰,因此無法得到刪余方式。
接下來對其polar碼的刪余控制具體操作進行詳細論述。令N和R表示刪余前polar碼的碼長和碼率,N′和R′表示自適應碼長的polar碼的碼長和碼率。一般的方案中通常不知道被刪除的比特并且將鑿空處的碼字比特設置為無限大或者無限小,這使得誤碼率很大。本文提出的方案將通過在原生成矩陣GN刪掉N-N′行和N-N′列構造一個新的N′×N′矩陣。同時,對應于生成矩陣所刪掉行的N-N′個凍結位也被進一步刪除。
圖2 N′=6時的自適應碼長的polar碼構造
圖3 生成矩陣和凍結位的刪除選擇
廣泛采用的OFDM系統(tǒng)固有的一個缺點是對頻偏非常敏感,而面對快時變信道,OFDM受到了多普勒效應的影響,將會產生載波間干擾,導致性能極速惡化。而目前高鐵、車聯網等高速移動場景中,多普勒效應的存在又是無法避免的。針對這個問題,Hadani等人提出了一種新型調制方式,即OTFS調制[12]。OTFS在高時延高多普勒頻移的快時變信道中實現可靠、高速的數據傳輸。
圖4為OTFS系統(tǒng)的基本結構,顯然OTFS在OFDM的發(fā)送端前,加了一級逆辛傅里葉變換(Inverse Symplectic Finite Fourier Transform, ISFFT),在OFDM的接收端后,加了一級辛傅里葉變換(Symplectic Finite Fourier Transform, SFFT)。通過這兩級二維變換,將信息符號調制在時延-多普勒域上,使傳輸單元中的所有符號都經歷幾乎相同且變換緩慢的稀疏信道,能夠獲得時間和頻率上的全部信道分集,從而可以對抗信道的動態(tài)時變性。OTFS的這些優(yōu)點使其非常適合應用在具有嚴重時頻雙色散信道的衛(wèi)星互聯網通信場景中。
圖4 OTFS系統(tǒng)框圖
如圖5所示,快時變信道響應在時延-多普勒(Delay-Doppler, DD)域中是稀疏的,在時間-頻率(Time-Frequency, TF)域中表現則相反。信道的稀疏有利于提取到信道信息的一致性,可以節(jié)省密鑰提取過程中信息協商時的通信資源[13-14]。此外,從稀疏信道中也可以更加輕易提取信道響應信息。該方案提取DD域中每條子信道的信道響應強度為初始值,經過混沌生成器產生密鑰,從而進一步增加可用密鑰數量。接下來,結合密鑰對OTFS信號星座圖進行相位旋轉加密。
(a) DD域的信道響應
圖6為合法接收方Bob和竊聽方Eve的星座圖對比。圖6(a)為Bob經過相位旋轉解密后的星座圖集合,其點位清晰,可以很輕易地解調出星座圖中的信息;在圖6(b)Eve接收到的星座圖集合中,由于隨機旋轉使得星座圖相位信息全部缺失,在不知道密鑰的情況下無法從中恢復出星座圖原本的信息。
(a) Bob的接收星座圖
面向OTFS安全傳輸是一個融合了通信波形設計和信息安全傳輸的交叉科學問題,將新型調制技術和物理層安全傳輸技術緊密結合在一起,能夠同時滿足衛(wèi)星互聯網通信網絡中信息安全、高效、可靠傳輸的現實需求。
衛(wèi)星互聯網物理層用戶身份認證模型如圖7所示,主要有非法偽裝者、合法發(fā)送方和合法接收方構成。非法偽裝者通過無線信道非法竊聽獲取合法用戶的傳輸信息。發(fā)送方發(fā)來信息后,合法接收方將接收到數據進行鑒別。此時通過認證檢測,判定是來自合法方還是偽裝者,以達到身份認證的目的。
圖7 物理層認證模型
衛(wèi)星互聯網物理層安全認證技術具有機密性、可靠性及易實現等許多特點和諸多優(yōu)勢。首先,物理層認證技術利用通信介質唯一性、時變性和復雜性的特點,能很好實現身份加密和認證,并且其特征很難被模仿,具有優(yōu)良的機密性。其次,物理層認證技術不需要考慮物理層之上的安全機制執(zhí)行方式,有很好的兼容性。最后,物理層認證技術可以在對信號進行解調和解碼之前快速地對通信節(jié)點進行身份認證,從而避免對信號處理資源的浪費。
衛(wèi)星互聯網通信中由于路徑損耗和信道衰落的存在,不同位置的用戶信道狀態(tài)也不同??紤]在時變信道中,利用無線信道的時間相關性輔助消息認證[15]。如果接收到的兩個數據幀間的時間間隔比信道相干時間小,當這兩個數據幀的信道狀態(tài)高度相關時,則這兩個數據幀由同一發(fā)送方發(fā)出;若不相關,則很可能是偽裝者端發(fā)出。對此,可以從機器學習的角度對信道狀態(tài)信息進行學習和檢測,比如采用支持向量機(Support Vector Machine,SVM)算法[16],將SVM算法引入物理層通信中,通過對無線信道特征的訓練和檢測,實現對用戶身份特征進行分類判別,從而完成對用戶身份的認證。
采用二元假設檢驗的方式進行身份認證合法雙方共享兩組不同的密鑰,將密鑰信息隱藏在發(fā)送信號的相位中,通過信息符號進行問詢和響應信息交互,如圖8所示。兩個信息符號經歷相同的信道衰落,最后通過二元假設檢驗的方法實現身份認證判斷。文獻[17]提出了一種基于二元假設檢驗統(tǒng)計量改進的物理層認證方案,該方案可以使得竊聽者的統(tǒng)計分布更容易與合法的通信節(jié)點區(qū)分開,在不同信道條件下具有良好的魯棒性和優(yōu)越性。此外,推導了所提統(tǒng)計量的均值和方差的近似理論閉式表達式。
圖8 基于“問詢-響應”的身份認證
RF指紋[18]可通過收發(fā)機的硬件區(qū)別來識別不同的無線設備,衛(wèi)星互聯網用戶可通過RF指紋設計識別系統(tǒng)進行身份認證。RF指紋分為基于瞬態(tài)信號的方法和基于調制域信號的方法[19]?;谒矐B(tài)信號的識別方法通過設備開/關機瞬態(tài)的無線電信號特征來進行識別,基于調制域信號的識別方法通過從部分已調制的信號中提取特征,根據這些特征進行識別。RF指紋信息具有普遍性、唯一性、穩(wěn)定性、獨立性和可測性等特點。
接收端的RF認證設計如圖9所示,首先合法接收方對射頻信號進行接收,然后進行濾波去噪預處理,再選取合適的提取算法獲得RF指紋特征。將提取的RF指紋連同用戶標簽一起入庫并且對這些特征進行訓練,得到相應分類器。在實際衛(wèi)星互聯網場景下,隨著用戶數目的增加及通信機器的老化等因素,信號特征庫需要進行不斷地更新,分類器也需要定期進行重新訓練。
圖9 通信輻射源個體識別流程圖
然而,針對現有的RF指紋身份識別,偽裝者可通過重放/復現其用來做RF指紋識別的信號攻擊合法用戶端。但是復現RF指紋需要高端的信號分析儀來提取信號中的微小差異,且提取環(huán)境需要一個相對靜止的信道。因此,可進一步對RF指紋識別信號進行設計,使攻擊端難以提取RF指紋并復現。
物理層信號水印[20-21]是將秘密的安全認證信息或標簽疊加在主傳輸信息的波形上一起進行傳輸,不需要額外增加傳輸帶寬。另外,還有一種在物理層認證射頻信號的水印機制,通過將認證信息的每個水印比特與調制后的數據比特進行算數相加。接收端在解調之前采用相同的擴頻碼提取出水印比特,認證信號,并去除水印比特后,可以得到發(fā)送端原始發(fā)送的數據。
如圖10所示,根據射頻指紋和射頻水印存在的位置,可以將其分為以下幾類:編碼水印、調制水印、頻率指紋、輻射指紋和信道指紋。其中射頻水印在基帶信號處理以前,射頻指紋集中在基帶處理之后。
圖10 射頻指紋和射頻水印的分類
然而射頻指紋的存在會對無線信道的互易性產生較大的影響,從而間接影響無線信道密鑰的生成效果。剝離了射頻指紋的無線信道互易性增強,提高了密鑰熵和密鑰的生成速率,從而降低了比特錯誤概率。但是,發(fā)送接收設備的射頻指紋無法同時剝離[22]。因此,可以對發(fā)送設備的射頻指紋進行剝離,然后基于該指紋來實現認證操作;與此同時,采用一致性增強的方法來消除收發(fā)設備射頻指紋的非對稱性對密鑰生成帶來的影響。
圖11 系統(tǒng)模型圖
假設干擾環(huán)境設為雙掃頻干擾,并且干擾范圍有限,通信方在未知動態(tài)環(huán)境下找出最優(yōu)的傳輸策略(中繼節(jié)點、傳輸信道)防止通信被干擾,最大化系統(tǒng)的吞吐量。
強化學習是一種重要的機器學習方法[23-24],它可有效解決智能體根據環(huán)境如何采取行動以獲得最大回報值的問題。強化學習的學習過程可以看做是智能體與環(huán)境不斷交互的過程,從而強化對環(huán)境的認知。在每次交互的過程中,智能體得到環(huán)境當前的狀態(tài)St,然后做出動作At后,智能體會得到一個回報值Rt。智能體和環(huán)境間的交互會產生一個連續(xù)的決策序列:
Q學習是一種常用的抗干擾強化學習方法[26-27],Q學習的核心是Q值表Q(S,a)被用來評估在狀態(tài)S下采取動作a的質量。將衛(wèi)星節(jié)點和所有的中繼節(jié)點都作為智能體,每一個智能體都維護各自的Q值表,用來評估每個狀態(tài)下的不同動作的質量。由于智能體不斷地和環(huán)境進行交互,Q值表不斷進行更新,直到強化學習結束,最后,Q值表中的值會趨向于穩(wěn)定狀態(tài)。
在一個相干時間內將通信傳輸時隙分為若干個長度相等的時隙單元,傳輸時隙定義為K={1,2,…,K},將每個時隙劃分為以下幾個階段,如圖12所示。
圖12 時隙結構圖
① 數據傳輸階段:給定初始狀態(tài)S0=fj(0),衛(wèi)星節(jié)點隨機選擇一個中繼節(jié)點Ri,即在初始時隙衛(wèi)星節(jié)點選擇中繼節(jié)點Ri并且發(fā)送數據。中繼節(jié)點Ri任意選擇一個信道ft(0)向地面用戶節(jié)點轉發(fā)信息;
② 寬帶頻譜感知階段:中繼節(jié)點通過寬帶頻譜感知探測當前時刻各信道的占用情況并獲得干擾信道fj(k);
③ ACK反饋階段:地面用戶節(jié)點接收到數據信息后,計算當前時隙的接收信噪比,將當前感知到的干擾信道和接收信噪比通過ACK反饋給衛(wèi)星節(jié)點和中繼節(jié)點;
在接下來的K-1個時隙內,通過強化學習每個智能體都經歷同樣的過程來做出新的決策。在初始時隙,Q值表為全零矩陣,在后續(xù)時隙中,智能體通過Q學習更新Q值表來反映當前狀態(tài)下所選動作的質量。這樣的循環(huán)執(zhí)行可以不斷地強化智能體對環(huán)境的認知,從而使智能體在動態(tài)變化的環(huán)境中獲取最優(yōu)策略并達到持續(xù)穩(wěn)定的狀態(tài)。
圖13顯示了Q學習收斂前后干擾機和中繼節(jié)點的信道選擇時頻。紅色方框表示干擾信道,綠色方框表示中繼節(jié)點的傳輸信道。二者的重疊部分表示中繼節(jié)點的傳輸受到干擾。從圖13(a)可以看出在學習的早期階段,中繼節(jié)點嘗試在不同的信道中進行傳輸,被干擾的可能性很大高。如圖13(b)所示,Q學習收斂后,中繼節(jié)點完全可以避免干擾。
(a) 學習初期中繼和干擾的時頻信息
衛(wèi)星互聯網由于缺乏安全標準以及足夠防護能力,安全問題可能隨時發(fā)生。從竊取隱私到衛(wèi)星被控制,敵方可以很容易地關閉衛(wèi)星,拒絕提供服務。此外,還可以對衛(wèi)星信號施加干擾或欺騙甚至可以實現對衛(wèi)星的完全控制,因而對衛(wèi)星互聯網通信安全抗干擾技術研究勢在必行。
衛(wèi)星互聯網無線安全傳輸可充分利用無線通信本身的信號格式和無線信道的物理特征,對物理層傳輸信息的特定格式進行加密從而實現安全設計。此外,利用無線媒介和物理層獨特的性質可有效加強網絡用戶的身份認證工作。這些性質包括通信信道特征、收發(fā)硬件特征以及傳輸信號特征。最后利用智能化抗干擾技術,基于“感知-學習-預測-決策-反饋”的邏輯閉環(huán),進行主動抗干擾決策,設計基于強化學習的中繼和信道聯合優(yōu)化抗干擾方案,保證其數據傳輸的有效性和可靠性。