陳天舒,胡愛群,姜 禹,3
1東南大學網(wǎng)絡空間安全學院 南京 中國 211189
2東南大學信息科學與工程學院 南京 中國 210096
3網(wǎng)絡通信與安全紫金山實驗室 南京 中國 211111
隨著現(xiàn)代計算機技術和無線通信技術的迅猛發(fā)展,物聯(lián)網(wǎng)技術的逐漸成熟,移動終端設備的大量普及,網(wǎng)絡通信已滲透到生產生活的方方面面。而無線網(wǎng)絡中傳輸媒介的開放性、終端的移動性和通信系統(tǒng)的不穩(wěn)定性也使得傳輸?shù)目煽啃院桶踩允艿絿乐氐耐{[1],對物聯(lián)網(wǎng)中無線設備的身份認證技術等安全性方面的研究近年來正逐漸成為熱點[2]。
當前,為了解決網(wǎng)絡中終端設備的接入認證問題,比較常見的識別與接入控制技術是基于MAC地址和數(shù)字證書來實現(xiàn),MAC地址極易被偽造和篡改[3];數(shù)字證書認證方式則要求在終端安裝數(shù)字證書客戶端,且需要較強的計算能力來實現(xiàn)對密鑰或證書的分發(fā)[4]。而量子計算機的出現(xiàn)使得暴力破解密碼變得更加容易,傳統(tǒng)的基于密碼學的密鑰分發(fā)協(xié)議在通信中可能會面臨更大的安全挑戰(zhàn)[5]。射頻指紋是無線設備固有的物理特性,具有唯一性和難以克隆的特性,因此,基于設備物理特征的認證機制將可能是物聯(lián)網(wǎng)身份認證未來發(fā)展的趨勢[6]。
通過提取無線設備的射頻指紋信息進而對無線設備個體進行識別認證,這種基于物理層特性的認證方法為上述問題提供了一套安全可靠的解決方案[7]。射頻指紋是一種獨特的物理信息,可理解為無線設備本身的DNA。由于無線發(fā)射設備中包含眾多的電阻、電容、電感等電子元器件,電子元件存在制造容差和漂移容差,不同元器件之間或多或少會存在微小的指標差別,自然環(huán)境的變化、器件老化、印制電路板走線等因素也會造成元件指標值的變化[8]。這些因素導致不同的設備擁有不同的硬件參數(shù)和性能指標,并最終生成不同的射頻指紋,而且這些獨有的指紋信息難以被復制[9]。射頻指紋具有通用性、唯一性、短時不變性、獨立性、穩(wěn)健性等特征,這些特征使得射頻指紋識別系統(tǒng)更加安全可靠[10]。
目前已有一些常用的射頻指紋提取方法,如基于瞬態(tài)響應的提取電磁波幅度包絡和相位信息、瞬時幅度和瞬時頻率、瞬態(tài)強度等特征[11],基于穩(wěn)態(tài)響應的提取前導碼特征[12],基于圖像特征[13]的射頻指紋提取方法等等。近幾年來,針對不同的信號類型和調制方式以及環(huán)境或信道干擾帶來的不穩(wěn)定因素等情況,研究者提出了一些識別正確率更高的改進方法。如針對ZigBee設備提出一種將差分星座軌跡圖、載波頻率偏移等四種特征混合的射頻指紋提取和設備分類方案[14]; 為進一步提高方法的穩(wěn)健性,利用多采樣卷積神經網(wǎng)絡選擇興趣域的信噪比自適應算法[15]和將測量噪聲轉換為標準高斯分布并在訓練階段加入人工噪聲的算法[16]被提出用于ZigBee設備的識別; 針對LoRa設備提出一種有監(jiān)督的機器學習和零樣本圖像分類方法來提高指紋識別率[17]; 針對線性調頻脈沖雷達提出了一種基于分段曲線去噪算法和一種混合射頻指紋的識別方案[18]; 針對無人機在無線信號干擾條件下,采用多級檢測器分離噪聲和有用信號,從而提取有效的指紋特征進行檢測和分類[19]; 針對Wi-Fi設備利用從Wi-Fi前導碼中提取的基于 Gabor變換的射頻指紋,并對該特征進行降維處理,對設備分類的性能和對非法設備拒絕的性能均超過 90%[20],使用瑞利衰落信道可讓識別的可靠性優(yōu)于 95%[21],并進一步研究了載波頻率偏移對指紋的影響[22]。
上述方法中,針對ZigBee、LoRa等其他信號類型的方法大多無法直接應用到Wi-Fi設備上來。這是因為ZigBee等信號帶寬較窄,LoRa及雷達信號是線性擴頻信號,多徑對這些設備的指紋影響較弱。而Wi-Fi屬于寬帶信號,頻譜較為豐富,在復雜的室內環(huán)境中更容易受到多徑、信號衰減、人物走動、墻體和障礙物對信號的反射等因素帶來的干擾[23],但上面文獻中的這些方法均未對各種干擾因素的影響展開研究。一些文獻對Wi-Fi信號的研究采用的設備樣本數(shù)只有幾個,當測試的設備數(shù)量增加后,設備之間的指紋碰撞概率會增大,已有方法并不適用于對大量設備的識別。從目前對Wi-Fi射頻指紋提取方法的研究現(xiàn)狀來看,當前提出的方法考慮還不夠全面,雖然大多考慮了加性高斯白噪聲的影響,但針對射頻指紋的穩(wěn)健性和魯棒性尤其在抗多徑方面還需深入研究[24]。射頻指紋特征極其微小,信號傳輸過程中的多徑影響和噪聲的干擾都極易湮沒設備的指紋信息,要提取設備的射頻指紋仍然面臨著極大的挑戰(zhàn)性。如需對多徑影響開展研究,不僅要對設備在某一個靜止位置上進行射頻指紋的采集與識別,還需要將設備置于不同位置并處于移動狀態(tài)進行實驗。Li等人[25]在2019年提出一種針對Wi-Fi設備的基于幅度商(Amplitude of Quotient,AoQ)的射頻指紋提取方法,該方法考慮了多徑因素的影響,在不同位置測量提取的指紋特征具有不變性,但該篇文章只研究了幾個固定點處的實驗數(shù)據(jù),沒有考慮移動的情況以及其他障礙物帶來的干擾,且該方法針對不同設備的指紋特征區(qū)分度還有待進一步提高。
本文針對IEEE 802.11 Wi-Fi的前導碼信號,提出一種提取其功率譜特征的新的射頻指紋提取方案。首先對接收到的信號完成捕獲、同步、頻偏估計和校正等數(shù)據(jù)預處理步驟,得到有效的正交頻分復用(Orthogonal Frequency Division Multiplexing,OFDM)信號幀。接著從每一幀的數(shù)據(jù)中提取其功率譜特征,得到每一幀數(shù)據(jù)的射頻指紋。隨后利用 K近鄰算法、樸素貝葉斯算法、隨機森林算法等機器學習算法對實際測量數(shù)據(jù)中提取出的指紋進行分類識別,驗證該方法的有效性。最后對實驗結果進行總結,并提出了可進一步研究的工作。
本文要解決的問題包括:
(1)如何只利用一幀數(shù)據(jù)便可提取出有效的指紋特征;
(2)如何抵抗多徑的影響,在無線設備所處環(huán)境變化的情況下,所提取的指紋特征依然穩(wěn)定;
(3)如何抵抗噪聲的干擾,在去噪的同時不丟失指紋信息,在不同信噪比的條件下均能提取出不變的指紋特征。
本文的主要貢獻有:
(1)提出一種基于功率譜特征的射頻指紋提取方法,利用 Wi-Fi OFDM 信號同一幀中短導碼符號和長導碼符號的功率譜的比值形成指紋。該方法只需利用一幀數(shù)據(jù)即可提取出指紋特征,且可以去除信道的影響,使得設備在多徑的環(huán)境下,提取的指紋仍具有較好的不變性。
(2)對27臺Wi-Fi路由器發(fā)出的OFDM信號按此方法提取出的指紋特征利用機器學習方法分類。運用K近鄰、樸素貝葉斯、隨機森林三種模型對特征數(shù)據(jù)進行訓練和測試,使用隨機森林算法分類正確率最高,說明隨機森林模型應用于本文提出的射頻指紋識別方法更具有有效性。
(3)實驗中采集裝置在實驗室內固定的 4個位置和移動狀態(tài)下對路由器發(fā)出的信號進行采集,并考慮了直達徑和非直達徑的情況。實驗時,路由器連續(xù)開機時間超過 1小時,在不同位置和移動情形下完成對數(shù)據(jù)的采集,以驗證該方法的魯棒性以及提取的指紋特征是否具有時空不變性。對這27臺路由器4個靜止點位置的數(shù)據(jù)分類正確率能達到97%,對移動狀態(tài)下的數(shù)據(jù)分類正確率能達到 90%,總體平均分類正確率超過93%。
本文剩余部分安排如下: 第 2節(jié)介紹 Wi-Fi OFDM 信號幀的采集與捕獲以及預處理流程; 第 3節(jié)具體介紹基于功率譜的 Wi-Fi射頻指紋提取方法;第4節(jié)介紹實驗過程并對實驗結果進行分析; 第5節(jié)為總結和展望。
本文以IEEE 802.11n協(xié)議下的OFDM信號為主要研究對象,對Wi-Fi無線通信設備指紋提取與識別分類的流程框圖如圖1所示。
圖1 Wi-Fi射頻指紋提取與識別分類流程框圖Figure 1 Flow chart of Wi-Fi radio frequency fingerprint extraction and classification
本節(jié)首先介紹IEEE 802.11n信號的物理層信號幀格式以及該信號的采集與捕獲方法,并簡述信號預處理的流程,經過該流程處理過的信號消除了頻偏等因素的干擾,能提取出更加穩(wěn)定的指紋。
本文將從IEEE 802.11n Wi-Fi信號物理層的幀格式中提取有效的指紋特征。IEEE 802.11n協(xié)議在OFDM物理層會聚程序(Physical Layer Convergence Procedure,PLCP)子層中定義了PLCP協(xié)議數(shù)據(jù)單元(PLCP Protocol Data Unit,PPDU)的幀格式,其包括PLCP前導碼、PLCP頭、PLCP服務數(shù)據(jù)單元(PLCP Service Data Unit,PSDU)、尾比特和填充比特[26],具體的幀結構格式如圖 2所示。由于信號段和數(shù)據(jù)段會根據(jù)所傳輸?shù)膬热莅l(fā)生變化,而前導碼部分傳輸?shù)膬热菔呛愣ú蛔兊?因此從前導碼中提取射頻指紋更具有可行性。
圖2 PPDU幀格式Figure 2 PPDU frame format
在PLCP前導碼字段中包含10個重復的短導碼符號和 2個重復的長導碼符號,這些符號是由傅里葉逆變換的周期性引起的循環(huán),長導碼符號之前有一段循環(huán)前綴GI2。短導碼符號由12個子載波組成,這些子載波由序列
的組成元素進行調制,OFDM短導碼利用了這52個子載波中的12個,信號由式(2)產生。
其中,wshort(t)為窗函數(shù),NST為子載波的數(shù)量,ΔF為子載波頻率間隔。上述波形在時域是0.8μs的序列,短導碼共有10個這樣的序列,持續(xù)時間8μs。長導碼符號由53個子載波組成,其中包含了一個直流零值,這些子載波由序列
的組成元素進行調制,OFDM長導碼信號由式(4)產生。
其中,wlong(t)為窗函數(shù),NST為子載波的數(shù)量,ΔF為子載波頻率間隔,TGI2為循環(huán)前綴GI2持續(xù)時間。上述波形在時域是3.2μs的序列,為了提高信道估計的精確度,需要發(fā)送兩個周期的長導碼符號,共計6.4μs。增加的 1.6μs的循環(huán)前綴 GI2是由長導碼尾部的信號搬移到頭部構成的,以確保做 FFT循環(huán)卷積運算時,不管從哪里加窗都可以取到一個完整的信號。因此長導碼部分的持續(xù)時間也是8μs。這樣的設計能夠精準地對信號進行捕獲和同步,并進行頻偏估計和頻偏校正。每一幀OFDM信號都有著相同結構的前導碼,從前導碼中提取的指紋特征具有更好的一致性。
采集設備采集到無線 Wi-Fi信號后需要對每一OFDM 幀進行分離,而其前導碼有著固定的重復結構,適合用于對每一幀信號進行快速捕獲。如果能從接收到的信號中找到前導碼的位置,也就定位到了每一幀的數(shù)據(jù)。OFDM前導碼擁有10個重復的短導碼符號,可將采集到的信號逐段順次輸入處理器,計算其與本地短導碼符號的相關值,當連續(xù)檢測到有 8段信號的相關值超過設定的門限,就說明找到了8個短導碼,可認為捕獲成功。
在 20MHz的采樣率下,一個持續(xù) 0.8μs的短導碼有16個采樣點。設本地短導碼符號為x(n),每次送入處理器的長度為 16個樣本點的接收信號為y(n),計算兩者的復數(shù)共軛相關值
其中,x*(n)是x(n)的共軛。根據(jù)實驗結果設定一個門限值TH,當r>TH,則認為捕獲到一個短導碼。考慮到實際信號傳輸當中首尾兩端的符號可能會受到干擾造成波形不穩(wěn)定的情況,當連續(xù)捕獲到 8個短導碼符號,便可認為捕獲到一組 OFDM 信號幀的前導碼,即找到一幀 OFDM 信號。由于后續(xù)對信號都是以幀為單位處理的,因此按上述方法將采集到的信號按幀分離開后,更加便于后續(xù)操作的進行。
在對每一幀 OFDM 信號預處理的流程中,主要包括時間同步、頻偏估計與校正兩大步驟。在之前對信號的捕獲步驟中,只找到了幀起始的大致位置,而在提取射頻指紋時需要定位到每一幀信號如圖 2所示前導碼各字段的準確時刻,即使有一個采樣點的偏差,都會對提取的指紋特征產生較大的影響。同時,精準的時間同步也為后續(xù)的頻偏估計和頻偏校正服務。
時間同步是將接收信號以滑動接收的方法與本地信號的整個前導部分進行復數(shù)共軛相關來實現(xiàn)。整個前導部分由 8μs的短導碼和 8μs的長導碼共計16μs組成,在20MHz的采樣率下共計320個采樣點。由于捕獲過程找到的幀起始位置可能有偏差,因此對捕獲到的每幀信號前后各增加16個采樣點,共截取出352個采樣點用于同步計算。設本地320點前導碼信號為xr(n),352點接收信號為yr(n),計算兩者的復數(shù)相關值
由于信號在發(fā)送端和接收端之間通信時,載波存在一定角頻率偏差,從而對提取出的指紋特征產生一定誤差??赏ㄟ^計算相鄰兩個重復導碼間的相位差,估計出頻偏值,以此消除頻偏的影響。短導碼部分有10個重復相同的長度為16個采樣點的符號序列,計算前后相鄰的兩個短導碼符號序列對應點之間相位差的平均值
其中i= 1 ,2,… ,9 ,θyi(n)是第i個短導碼符號序列的相位值。接下來,計算9個Δθi的平均值
得到相位偏差平均值,再由公式
可估計出頻率偏差平均值Δf,式中間隔的采樣點個數(shù)n取16,Ts指采樣間隔,采樣頻率fs取20MHz。
頻偏校正過程是根據(jù)頻偏估計的結果對接收信號實施頻偏的校正,消除頻偏對指紋的影響。對于精確同步后的信號,將 320點的前導碼整體進行頻偏校正,得到校正后的信號
其中ysyn(n)是已同步好的信號,n= 0 ,1,… ,3 19。對采集到的每一幀OFDM前導碼均按照上述預處理流程處理完后,便可從中提取功率譜特征形成指紋,具體方法將在下一節(jié)中介紹。
針對IEEE 802.11n協(xié)議下的OFDM信號幀,本文重點研究多徑條件下射頻指紋的提取識別方法。
對于20MHz采樣率下長度為320點的OFDM前導碼,取第2至第5個短導碼符號作為序列STF1,第7至第10個短導碼符號作為序列STF2,取第 1個長導碼符號作為序列LTF1,第2個長導碼符號作為序列LTF2。根據(jù)第2.1節(jié)的介紹,取出的這四段序列持續(xù)時間均為 3.2μs,即 64個采樣點。對于理想的本地信號,STF1與 STF2完全相同,LTF1與LTF2完全相同。
當終端設備發(fā)出無線信號后,經信道傳輸,由接收機接收到的信號會受到多徑效應以及加性噪聲的影響,STF1、STF2、LTF1、LTF2四段序列的接收信號可表示為
其中n= 0 ,1,… ,6 3,y(n)為接收信號,s(n)為發(fā)送信號,假設這四段前導序列經歷的多徑信道相同,均為h(n),v(n)為加性噪聲。受位置變動和外界干擾的影響,信道特性處于不斷變化中,從而對射頻指紋的提取造成不利的影響。OFDM的PPDU幀格式定義中對前導碼結構巧妙的設計再次為信道特性和噪聲的消除創(chuàng)造了條件。
加性噪聲v(n)可通過互相關運算消除。ySTF1(n)與ySTF2(n)的互相關函數(shù)為
其 中m=-6 3,- 6 2,… ,- 1 ,0,1,… ,62,63,加 性 噪 聲v(n)可認為是均值為零的平穩(wěn)隨機過程,有用信號與其互不相關,兩者互相關系數(shù)為0,因此
同理可得
由此可見,兩段短導碼序列之間、兩段長導碼序列之間的互相關系數(shù)均與加性噪聲無關。
信道特性h(n)需要變換到頻域來去除。在信號是平穩(wěn)隨機過程的條件下,互相關函數(shù)的傅里葉變換是互功率譜密度,上式(17,18)的頻域表達式為
其中,k= 0 ,1,… ,1 26,H(k)是h(n)的頻域表達式,PSTF(k) 是sSTF1(n) 和sSTF2(n)的 互 功 率 譜,PLTF(k)是sLTF1(n)和sLTF2(n)的互功率譜。將上式(19,20)相除即可得到具有功率譜特征的射頻指紋表達式
由此可見,由式(21)計算得到的RFF(k)的表達式中已去除了信道的影響,只有發(fā)送信號s(n)的功率譜特征,可作為待識別發(fā)送設備的指紋表達式。但在實際信號當中,雖然前導碼部分包含循環(huán)前綴,但h(n)起始點之前的部分為 0,在計算RFF值時信道特性不會完全去除,存在卷積殘留,同時在上述運算過程中也會消除部分指紋特征。另外,由于實際信號只能近似看成平穩(wěn)隨機過程,達不到理想的情況,最終也難以得到理想的純粹的指紋,仍會夾帶一定干擾,但本方法已基本實現(xiàn)了對信道和噪聲干擾最大化的去除以及對設備指紋信息最大化的保留。
本節(jié)將結合實驗探討基于功率譜特征的射頻指紋特征提取方法的有效性和實用性。
實驗采用的通用軟件無線電外設 USRP是Ettus公司的USRP N210,信號采集所用的計算機安裝Linux Ubuntu 16.04操作系統(tǒng),并裝有開源的軟件定義無線電平臺GNU Radio等軟件。為方便移動,上述設備由不間斷電源供電。本實驗所用的采集設備實物圖如圖3所示。信號處理與指紋提取識別所用的計算機安裝Windows 10操作系統(tǒng)并裝有MATLAB軟件,主機采用Intel酷睿i5-7500處理器。
圖3 實驗所用的USRP和計算機實物圖Figure 3 Picture of USRP and computer used in the experiment
實驗研究的待識別設備為 27臺 Wi-Fi路由器,其中包含20臺MERCURY品牌MW305R型號路由器和7臺DLINK品牌DWL-2000AP+A型號路由器,具體信息見表1。實驗過程中,路由器參數(shù)設置如表2所示,IEEE 802.11n是當前Wi-Fi設備的常用協(xié)議,路由器工作在802.11n模式下能產生以OFDM方式調制的信號,本文提出的方法將從 OFDM 的前導碼中提取出射頻指紋特征。
表1 實驗所用的Wi-Fi路由器信息Table 1 Information of Wi-Fi devices used in the experiment
表2 路由器參數(shù)設置Table 2 Parameter configuration of Wi-Fi devices
實驗在10m×9m的實驗室中進行,實驗室場地平面示意圖如圖4所示。實驗場地寬闊,能模擬不同通信距離下的情況,場地內部多徑環(huán)境較為豐富,擁有桌椅等障礙物和地面墻面的反射,可較為完整地模擬真實的多徑通信場景。
圖4 實驗室場地平面示意圖Figure 4 Diagrammatic sketch of laboratory
實驗時,路由器放在固定位置上,USRP等采集設備放在移動推車上,在靜止和移動兩種狀態(tài)下分別采集信號并進行分析,兩種狀態(tài)的具體實驗環(huán)境和信號采集方式描述如下。
(1)靜止狀態(tài): 采集設備在圖 4所標注的四個固定的靜止點p1-p4處采集信號。這四個位置與路由器之間的距離各不相同,每個位置測量信號的信噪比也不同,且路徑上考慮了有障礙物和無障礙物的情況。在這四個固定點采集信號時,移動推車置于指定地點后不再移動,USRP設備及其天線朝向同樣保持不變,實驗者在信號直達徑之外的地方保持靜止不動,且實驗室中沒有其他移動設備,以模擬出相對靜止的不受外界干擾的情形。
(2)移動狀態(tài): 在移動狀態(tài)采集信號時,由實驗者推動移動推車在圖4所示實驗室內以平均1m/s的步行速度勻速移動,移動路線不固定,遍布實驗室每一處空地,包括沿墻邊直線行駛、圍繞桌椅等障礙物做8字形或S形運動、原地旋轉等,移動方向隨機選擇。在推動推車的過程中有一些時刻存在人遮擋天線的情況,產生陰影區(qū)域,從而模擬沒有直達徑的情形。同時另一名實驗人員在實驗室內任意走動,并多次在 USRP與路由器之間穿梭,以模擬受外界干擾的情形。
在整個實驗過程中,同一時間內僅允許一臺路由器上電,其余路由器保持斷電狀態(tài),且實驗室內其他非實驗所需設備也全部關閉,以免設備之間互相干擾。實驗時,以向路由器IP地址發(fā)送ping指令的方式發(fā)起請求,從而獲得路由器發(fā)出的信號幀數(shù)據(jù)。每臺路由器連續(xù)開機時間需要超過1小時,前半小時在p1處以靜止狀態(tài)進行測量,研究在連續(xù)工作情形下指紋是否具有短時不變性,后半小時內在四個靜止點測量,并讓采集設備處于不斷移動的情況下連續(xù)采集信號,每個靜止點測量2分鐘,移動狀態(tài)測量 6分鐘,研究空間變化和多徑信道對指紋產生的影響。
實驗中,在模擬的四個不受外界干擾的靜止情形和簡單的緩慢勻速移動情形下共捕獲到145230個有效的OFDM幀結構,平均每臺設備約5400個,其中每臺設備在每個靜止點大約捕獲到 750幀數(shù)據(jù),移動狀態(tài)下約捕獲到2400幀數(shù)據(jù)。對以上數(shù)據(jù)按照第 2節(jié)描述的信號預處理流程完成時間同步、頻偏估計與校正兩大步驟,隨后按照第 3節(jié)介紹的基于功率譜的方法消除多徑影響,提取待識別設備的射頻指紋特征。由于OFDM短導碼只包含12個子載波,即體現(xiàn)在短導碼的頻譜圖上只有 12個位置處有值,其余均為零值點,計算出的STF1和STF2兩段的互功率譜也是只有12個點處值較大,其余點處的值都很微小。為避免幅值較小點處占比較大的噪聲分量帶來負面影響,在計算得到的 RFF序列中僅選取短導碼有數(shù)值的 12個子載波位置處的特征值形成 12維復數(shù)特征向量作為該幀的射頻指紋。
圖 5~6所示為實驗中某幾臺待識別設備提取的這12維復數(shù)特征的幅度值,同一設備在同一位置處采集到的全部OFDM信號幀提取出的特征值均畫到了同一張圖上。圖5為編號是DLINK002的路由器在四個靜止點采集的信號特征,可見這四張圖之間相似度很高,說明同一設備在不同位置處的特征具有一致性。圖6為另外四臺DLINK路由器在同一位置 p4處采集的信號特征,可明顯地看到這四張圖之間差異性較大,說明即使是同一型號同一批次的不同設備在同一位置處的特征也有一定的區(qū)分度。
圖5 DLINK002設備在四個固定點處的功率譜特征Figure 5 Power spectrum characteristics of device DLINK002 in four fixed positions
圖6 四臺DLINK設備在固定點p4處的功率譜特征Figure 6 Power spectrum characteristics of four DLINK devices in fixed position 4
隨后,在MATLAB軟件上對這27臺路由器提取的145230個樣本特征值利用機器學習方法分類,本次實驗選用K近鄰、樸素貝葉斯、隨機森林三種較為常見的模型對特征數(shù)據(jù)進行訓練和測試,對于每一臺設備在每個固定點位置和移動情況下采集的信號幀各選取 100幀數(shù)據(jù)作為訓練集樣本,每組數(shù)據(jù)中剩余數(shù)據(jù)作為測試集樣本,訓練集樣本和測試集樣本沒有重疊。模型參數(shù)綜合分類結果的正確率和運算時間設定,K近鄰模型中鄰近點k值設為1,距離度量類型選擇歐氏距離,隨機森林模型中樹的數(shù)量設為100。在上述三種模型中,使用隨機森林算法模型進行訓練并測試,得到的分類效果最優(yōu),分類正確的樣本數(shù)為135498個,正確率為93.3%,而使用K近鄰算法的分類正確率為93.1%,樸素貝葉斯算法的分類正確率為86.6%。三種模型下,四個靜止點位置和移動狀態(tài)下具體的分類結果如表3所示??傮w而言,本文提出的基于功率譜的射頻指紋提取方法針對不同設備能提取出具有較高區(qū)分度的指紋特征,分類結果也有著較高的正確率,而本次實驗選取的同一品牌的路由器中都是同一型號同一生產線上的產品,MAC地址也是相近的,設備本身相似度就很高,能達到超過 90%的正確率說明方法本身具備較好的可行性。
表3 三種模型下27臺設備基于功率譜特征的分類正確率Table 3 Classification accuracy of 27 devices based on power spectrum characteristics under three models %
另外,從表中可知,固定點位置采集的數(shù)據(jù)分類正確率要高于移動狀態(tài)下采集的數(shù)據(jù),說明提取的指紋特征中仍殘留部分多徑信息,實際信號在運算過程中無法完全消除信道特性,外界的擾動會對指紋的識別率產生一定影響。在使用K近鄰和隨機森林兩種模型下,p4位置處數(shù)據(jù)的正確率要高于p2位置處,在這四個點處,p4處的接收信號強度最高,為-44dBm,p2處的接收信號強度最低,為-54dBm,p4處接收信號的信噪比略高于p2處,說明噪聲對設備指紋的提取也有一定影響,在信噪比高的情況下,提取出的指紋特征受干擾程度小,判決正確率也越高。
實驗中在每臺設備開機前半小時內持續(xù)采集OFDM 幀信號,以檢驗設備連續(xù)工作一段時間指紋特征是否穩(wěn)定,指紋的識別率是否下降。本次實驗共對7臺DLINK路由器在上電30min內采集了69234幀有效數(shù)據(jù),平均每臺設備近10000幀,對每一幀數(shù)據(jù)按上文所述同樣的步驟分別提取出12維的功率譜特征向量。每臺設備前1min內采集到的信號幀特征向量作為訓練集樣本,1~30min的數(shù)據(jù)作為測試集樣本,使用上文正確率最高的隨機森林算法模型進行訓練并測試,參數(shù)配置同上,7臺設備測試集樣本的平均分類正確率為 97.8%。選取其中五臺設備計算1~30min的每1min內的識別正確率,觀察變化趨勢。圖7為這5臺DLINK設備在上電30min內基于功率譜特征的逐分鐘識別率折線圖。從圖中可看出,這5臺設備的識別正確率都很高,每個時間點都超過了97%。雖然只用了第 1min內的數(shù)據(jù)進行訓練,但隨著開機時間的推移,識別率并沒有出現(xiàn)明顯下降的趨勢,均在±1.5%內上下波動。說明提取出的功率譜特征值在一定時間內能保持一定的穩(wěn)定性,同一設備的特征向量集中在一定的范圍內,沒有出現(xiàn)較大的偏差。
圖7 5臺DLINK設備上電30min內的逐分鐘功率譜特征識別率折線圖Figure 7 Identification accuracy line chart of 5 DLINK devices based on power spectrum characteristics in each minute within 30 minutes after power on
下文將對本文方法與文獻[25]所述的提取 AoQ特征的方法進行對比。針對實驗中的待識別設備利用這兩種方法分別提取出12維復數(shù)特征,并標記在一圓中。將每一維特征的相位歸一化到30°角的區(qū)間內,幅度保持不變。圖8所示為4臺DLINK設備在移動狀態(tài)下提取的射頻指紋特征,同一設備采集到的多個信號幀的特征值疊加在了同一張圖上。左邊一列是利用本文所提的功率譜方法得到的特征,右邊一列是利用AoQ方法得到的特征。從圖中可觀察到,本文方法提取出的每一維特征之間幅度變化較大,不同設備的圖形之間區(qū)分度也較大,不同設備的同一維度的幅值有著明顯的差異。而AoQ方法提取出的特征,每一維度的幅值都很接近,基本落在同一半徑的圓上,不同設備間的圖形相似度很高,區(qū)分度不明顯。此外,兩種方法提取的射頻指紋特征值都比較穩(wěn)定,同一設備的特征向量均較為集中,方差較小,離散程度低,雖然設備處于移動狀態(tài)當中,但受多徑等外界因素影響小,提取的指紋一致性高。而提取AoQ特征的方法雖然能很好地消除信道的影響,但同時也消除了設備的指紋信息。相比于該方法,本文所提的方法不僅實現(xiàn)了抗多徑、抗干擾的目標,同時也保留住了更多的射頻指紋特征。
圖8 四臺DLINK設備在移動狀態(tài)下通過兩種方法提取的特征歸一化示意圖Figure 8 Normalized characteristics diagrams of 4 DLINK devices in moving states under 2 methods
接下來,使用識別正確率這一指標定量地進行比較分析。文獻[25]中利用長導碼部分計算AoQ值,本文再將短導碼部分也考慮進去,利用長導碼和短導碼共同計算AoQ值,作為另一種提取指紋特征的方法進行性能的比較。針對以上三種方法,使用同樣的原始數(shù)據(jù)和機器學習模型進行訓練和測試。本次對比實驗中,選用了 7臺 DLINK路由器采集的35232幀數(shù)據(jù),對每臺設備在每個位置狀態(tài)下的數(shù)據(jù)選取 200幀數(shù)據(jù)作為訓練集樣本,每組數(shù)據(jù)中的剩余數(shù)據(jù)作為測試集樣本,使用效果較好的隨機森林模型,分類結果如表4所示。從表中可看出,利用本文所提的基于功率譜的射頻指紋特征對實驗設備進行分類識別能達到97.3%的正確率,要明顯優(yōu)于利用AoQ特征分類的方法?;陂L導碼的AoQ識別正確率僅有41.5%,在此基礎上加入短導碼計算 AoQ的改進方法雖然能提高到93.0%的正確率,但依然比本文方法低4%以上。
表4 三種不同方法下7臺DLINK設備的分類正確率Table 4 Classification accuracy of 7 DLINK devices under 3 different methods %
總體來看,雖然部分信道特性和噪聲干擾沒有完全消除,但本文所提的基于功率譜特征的新方法無論是在靜止還是移動狀態(tài)下,較已有的方法在性能上均有很大的提高,且以往的研究大多沒有將多徑因素重點考慮,缺少在設備移動情況下的實驗。本文所做的研究特別考慮了相對移動的情況,采集數(shù)據(jù)時將采集設備一直處于隨機路徑的運動當中,運動軌跡遍布整個實驗室空間,實驗所用的27臺設備在移動情形下的分類正確率超過了90%,7臺同一流水線生產的DLINK設備在移動情形下取得96.2%的分類正確率,由此可見本方法體現(xiàn)出較強的抗移動、抗多徑性能。
本文針對IEEE 802.11n協(xié)議的設備提出一種新的射頻指紋提取方案,利用設備發(fā)出的 OFDM 信號幀數(shù)據(jù),提取其前導碼功率譜特征作為設備指紋,實現(xiàn)對不同設備的區(qū)分。本方法重點考慮了信道參數(shù)對射頻指紋的影響,對于不同時間段內采集的數(shù)據(jù)以及訓練和測試地點變換的情況下,通過該方法提取的 Wi-Fi射頻指紋特征具有很好的穩(wěn)定性和時空不變性,受多徑信道影響小,在身份認證和識別領域具有一定的實用價值。本文提出的基于功率譜特征的方法對7臺同一型號同一批次的Wi-Fi路由器識別準確率能達到 97.3%,對 27臺分屬兩種型號的路由器識別準確率超過 93%,在設備數(shù)不大的情況下,該方法的識別準確率要高于現(xiàn)有的其他方法。但本文對移動場景的研究還存在不足,模擬的實驗環(huán)境較為理想。在今后的工作中,可進一步增加待識別設備的數(shù)量,在更復雜的信道多變的移動環(huán)境中進行測試,如考慮隔墻的情況,對移動狀態(tài)下的加速度、瞬時速度、平均速度等參數(shù)定量分析,將外界因素干擾納入考慮之中,并研究如何消除殘留多徑的影響,尋求特征區(qū)分度更大的射頻指紋提取方法。