鄭雅文,任佳鑫,劉銘
(北京交通大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院,交通數(shù)據(jù)分析與挖掘北京市重點(diǎn)實(shí)驗(yàn)室,北京100044)
隨著移動(dòng)網(wǎng)絡(luò)的快速普及,無線網(wǎng)絡(luò)技術(shù)逐漸深入滲透到人們生活中的方方面面,產(chǎn)生了智慧家居、車聯(lián)網(wǎng)、智慧城市、智慧醫(yī)療[1]等新型的物聯(lián)網(wǎng)應(yīng)用,正在形成一個(gè)“萬物互聯(lián)”的世界。無線網(wǎng)絡(luò)的通信過程具有開放性,無線網(wǎng)絡(luò)中不同設(shè)備發(fā)送的無線信號都可能被其他設(shè)備接收到。這種開放性在給無線網(wǎng)絡(luò)帶來部署便利的同時(shí),也產(chǎn)生了用戶信息安全隱患。惡意用戶可能偽裝成合法用戶,入侵無線網(wǎng)絡(luò)展開主動(dòng)攻擊,使得合法用戶信息有被竊取盜用的風(fēng)險(xiǎn)。2016 年美國域名解析服務(wù)提供商Dyn 公司遭受大規(guī)模DDoS攻擊,攻擊源主力為Mirai 病毒控制的物聯(lián)網(wǎng)設(shè)備,導(dǎo)致美國東海岸地區(qū)網(wǎng)絡(luò)大面積癱瘓[2]。惡意用戶也可能偽裝成基站[3]或者設(shè)置釣魚AP[4],欺騙合法用戶接入,可能竊取合法用戶信息甚至控制合法用戶設(shè)備,對合法用戶信息安全造成威脅。在360 互聯(lián)網(wǎng)安全中心最新發(fā)布的《2019 年手機(jī)安全狀況報(bào)告》中顯示[5],360手機(jī)衛(wèi)士識別和攔截的垃圾短信高達(dá)95.3 億條,且因信息竊取引起的電信詐騙損失金額高達(dá)1546.5 萬元。由此可見,一旦惡意用戶突破網(wǎng)絡(luò)接入的安全認(rèn)證環(huán)節(jié),將對無線網(wǎng)絡(luò)安全產(chǎn)生嚴(yán)重影響。因此,保障無線網(wǎng)絡(luò)安全的關(guān)鍵之一在于保障無線設(shè)備接入時(shí)身份識別環(huán)節(jié)的安全。
目前,無線設(shè)備的身份識別技術(shù)主要有傳統(tǒng)基于密碼的方法,這些方法主要使用IP、MAC 地址等作為身份識別的依據(jù)[6],或者使用復(fù)雜的數(shù)學(xué)運(yùn)算、協(xié)議產(chǎn)生密鑰、口令、數(shù)字簽名等用于完成用戶之間的身份識別工作[7]。但這樣的方法存在密鑰信息泄露、篡改等隱患,如今計(jì)算機(jī)能力的不斷提高,也使得破譯密碼的能力不斷增強(qiáng),從而威脅到基于密碼的身份識別方法的有效性。并且物聯(lián)網(wǎng)設(shè)備中包含大量輕量級設(shè)備,其運(yùn)算能力無法滿足這種復(fù)雜度較高的身份識別方法。因此,單純使用加密的方法變得不再可靠,需要尋找一種更加穩(wěn)定和安全的無線設(shè)備身份認(rèn)證方法。
近年來,越來越多研究表明利用射頻指紋(Radio Frequency Fingerprinting,RFF)可以很好地進(jìn)行設(shè)備的身份識別。射頻指紋是無線網(wǎng)絡(luò)設(shè)備在制造生產(chǎn)過程中形成一種固有的設(shè)備缺陷。如圖1 所示,從基帶數(shù)字信號到射頻模擬信號的變換過程中會(huì)對射頻信號產(chǎn)生特有影響,因而可以基于這些固有的、穩(wěn)定且唯一的信號特征實(shí)現(xiàn)無線設(shè)備個(gè)體身份識別。例如正交混頻器中處理同相(I 路)與正交(Q 路)時(shí),由于二者之間的增益和相位不匹配,產(chǎn)生I/Q 偏移[8];振蕩器在發(fā)射機(jī)和接收機(jī)端進(jìn)行載波上變頻和下變頻時(shí),由于二者存在精度差異,導(dǎo)致載波頻偏出現(xiàn)[9];功率放大器在一段時(shí)間的線性增長達(dá)到飽和后會(huì)出現(xiàn)非線性增長的情況,此時(shí)會(huì)由于放大器性能不同而產(chǎn)生輸出信號的壓縮不同[10]。本文選擇主要考慮相位偏移[11]作為射頻指紋來進(jìn)行設(shè)備的身份識別,接收機(jī)端接收到的信號中包含了相位偏移帶來的穩(wěn)定影響,通過深度神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)達(dá)到分類判別的目的。
圖1 射頻指紋的產(chǎn)生機(jī)理
利用射頻指紋進(jìn)行身份識別的識別技術(shù)主要分為兩種。其一是基于統(tǒng)計(jì)分析方法,Polak 等人利用假設(shè)檢驗(yàn)的方法[12],對射頻指紋特征進(jìn)行合適的檢驗(yàn)統(tǒng)計(jì)量設(shè)計(jì),以此進(jìn)行身份識別分類。但該方法要求信號需要高斯分布,在實(shí)際環(huán)境中并不始終成立,因此使用有一定局限性。其二是基于機(jī)器學(xué)習(xí)的方法,彭林寧等人利用K-means 的聚類方法對設(shè)備進(jìn)行分類[13],但其結(jié)果在低信噪比下難以達(dá)到較好的識別效果,且利用差分星座軌跡圖進(jìn)行射頻指紋提取會(huì)因其統(tǒng)計(jì)性丟失一部分射頻指紋特征。在其更新的研究中,使用深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)對差分星座軌跡圖表示的射頻指紋進(jìn)行設(shè)備分類[14],但該方法針對GFSK 調(diào)制設(shè)計(jì),應(yīng)用于其他調(diào)制方式和通信協(xié)議時(shí)性能有所降低。
對此,本文提出一種使用射頻信號的原始采樣數(shù)據(jù),并利用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行射頻指紋特征學(xué)習(xí)與分類的無線設(shè)備身份識別方法。本文方法與以往算法相比,最大的區(qū)別在于直接使用射頻信號的原始采樣數(shù)據(jù)而不需要對采樣數(shù)據(jù)進(jìn)行預(yù)處理,使得設(shè)備識別性能不受信號預(yù)處理的影響,適用面更廣。實(shí)驗(yàn)證明,該方法具有良好的學(xué)習(xí)分類特征的能力,在用戶數(shù)目增加和信噪比降低的環(huán)境中也可以獲得很好的分類準(zhǔn)確率。
考慮一個(gè)存在非法設(shè)備主動(dòng)攻擊的無線通信環(huán)境。如圖2 所示,其中包括一個(gè)合法發(fā)射機(jī)(Bob)、一個(gè)合法接收機(jī)(Alice),以及1 到9 個(gè)非法發(fā)射機(jī)(Eve)。Bob 向Alice 發(fā)送接入請求信號,二者之間的通信為正常通信,此時(shí)此信號首先從基帶數(shù)字信號轉(zhuǎn)化為射頻模擬信號,該過程會(huì)經(jīng)過Bob 設(shè)備發(fā)射機(jī)的射頻前端,因射頻前端在制造過程中存在固有缺陷,會(huì)對模擬信號施加特有的影響。再經(jīng)過隨機(jī)的靜態(tài)瑞利信道HBA,此時(shí)信道以及所處環(huán)境中的噪聲也會(huì)對信號產(chǎn)生一定的影響,通??杀灰暈樵肼曇蛩?。合法接收機(jī)Alice 利用其接收機(jī)射頻前端,將射頻模擬信號再次轉(zhuǎn)化為數(shù)字信號。這一信號轉(zhuǎn)化過程同樣會(huì)對信號產(chǎn)生特定影響。同理,非法設(shè)備Eve 也發(fā)送接入請求,經(jīng)過非法發(fā)射機(jī)的射頻前端、信道HBA、到達(dá)合法接收機(jī)射頻前端,對信號產(chǎn)生不同的影響。此時(shí),若合法通信設(shè)備Bob 的身份識別機(jī)制(如密鑰)被Eve 竊取,則Eve可以模仿Bob 身份,對Alice 實(shí)施入侵。傳統(tǒng)基于密鑰的身份識別機(jī)制將難以發(fā)現(xiàn)此類入侵,若在傳統(tǒng)密鑰的基礎(chǔ)上加上基于射頻指紋的身份認(rèn)證識別方法,在Alice 處設(shè)置一個(gè)基于深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的身份識別判別器D,通過對合法設(shè)備、非法設(shè)備不同射頻指紋的學(xué)習(xí)進(jìn)行判別,則可以依據(jù)發(fā)射機(jī)的射頻指紋特征實(shí)現(xiàn)無線設(shè)備的身份識別。由于射頻指紋來自于射頻信號特征,而與其所承載的信息無關(guān),因而可以在傳統(tǒng)密鑰機(jī)制上為無線網(wǎng)絡(luò)增加另一層安全保障。
圖2 存在惡意攻擊用戶的無線通信系統(tǒng)模型
由于本文所提出的算法從原始射頻采樣信號中提取射頻指紋,因此適用于采用各種調(diào)制方式的系統(tǒng)。為表述清晰起見,本文假設(shè)用戶通信采用QPSK 調(diào)制方式。QPSK 調(diào)制包含四個(gè)輸出相位θ0,分別為每個(gè)相位攜帶兩位二進(jìn)制信息,分別對應(yīng)00、01、11、10。使用QPSK 調(diào)制方式對基帶數(shù)字信號進(jìn)行調(diào)制,首先數(shù)字信號經(jīng)過電平發(fā)生器產(chǎn)生相對應(yīng)的IQ 信號,再經(jīng)過本地振蕩器使I/Q 兩路分別與cosω0t、sinω0t載波進(jìn)行調(diào)制,將信息加在到相應(yīng)輸出波形的相位上。根據(jù)歐拉公式,經(jīng)過QPSK 調(diào)制后的調(diào)制信號可表示為[15]:
由于生產(chǎn)制造中的工藝限制,每個(gè)設(shè)備會(huì)因自身制造誤差產(chǎn)生獨(dú)特且穩(wěn)定的相位偏移,令發(fā)射機(jī)的相位偏移為θT,接收機(jī)的相位偏移為θR,每個(gè)樣本點(diǎn)的采樣相位偏移為Δ。對于不同的發(fā)射機(jī)設(shè)備而言,θT為獨(dú)立且唯一的相位偏移值,以此作為區(qū)別不同設(shè)備的射頻指紋。由于接收信號為同一觀察者Alice,因此θR是相同。假設(shè)系統(tǒng)所處環(huán)境的信道為靜態(tài)瑞利信道,即在一定時(shí)間內(nèi)信道參數(shù)不隨時(shí)間變化而變化。在這樣具備開放性與穩(wěn)定性的無線信道環(huán)境中,攻擊者易于竊聽到穩(wěn)定的合法信號樣本,因此基于密鑰的設(shè)備身份識別機(jī)制非常容易受到攻擊[16]。信道也會(huì)對相位偏移造成影響θH,再設(shè)置環(huán)境中存在加性噪聲N,這些因素會(huì)對射頻指紋的識別帶來一定的干擾[11]。綜上,本文所考慮的信號可以表示為:
隨后本文將基于該模型生成數(shù)據(jù)集,用于仿真實(shí)驗(yàn)和性能驗(yàn)證。
本文將提出一種基于深度神經(jīng)網(wǎng)絡(luò)的設(shè)備身份識別方法,具體而言,本文設(shè)計(jì)了一個(gè)包含三層隱層的全連深度神經(jīng)網(wǎng)絡(luò),使用模擬仿真接收機(jī)接收到的原始采樣射頻信號作為數(shù)據(jù)集進(jìn)行訓(xùn)練學(xué)習(xí)與分類。
深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks,DNN),是一個(gè)擁有多層隱層的神經(jīng)網(wǎng)絡(luò),其學(xué)習(xí)過程依據(jù)前饋神經(jīng)網(wǎng)絡(luò)進(jìn)行[17]。以單個(gè)神經(jīng)元為例,神經(jīng)元在接收到上一層神經(jīng)元的輸入x后會(huì)按照權(quán)值ω與輸入值連接并傳遞,當(dāng)前神經(jīng)元接收到所有輸入后,與閾值進(jìn)行比較,并使用激活函數(shù)激活,得到下一個(gè)神經(jīng)元的輸入:
其中,b為偏置項(xiàng),f(·)為激活函數(shù)。以此類推,在到達(dá)最后一個(gè)神經(jīng)元時(shí),使用BP 算法前向傳播,調(diào)整參數(shù),迭代優(yōu)化,使得最終訓(xùn)練誤差達(dá)到可接受范圍內(nèi)。本文算法使用的誤差函數(shù)為基于二分類的交叉熵函數(shù):
其中y為樣本標(biāo)簽值,來自合法接收機(jī)的射頻信號樣本為1,來自非法接收機(jī)的射頻信號樣本為0。p為經(jīng)過Sigmoid 函數(shù)輸出所測試的射頻信號樣本來自于合法接收機(jī)的概率。
為了適應(yīng)模型的復(fù)雜度,僅僅使用這樣簡單的神經(jīng)網(wǎng)絡(luò)顯然是不夠的。通過增加隱層的神經(jīng)元個(gè)數(shù)可以增加模型復(fù)雜度,但增加隱層層數(shù)會(huì)顯得更有效。因此,深度神經(jīng)網(wǎng)絡(luò)更能滿足復(fù)雜度高、容量大的學(xué)習(xí)任務(wù)。
本文所提出的基于深度神經(jīng)網(wǎng)絡(luò)的設(shè)備身份識別過程如圖3 所示。
圖3 基于深度神經(jīng)網(wǎng)絡(luò)的設(shè)備身份識別流程圖
在接收機(jī)Alice 端接收到分別來自合法發(fā)射機(jī)Bob 和非法發(fā)射機(jī)Eve 發(fā)送的信號,令其為Y和Y' 。與(2)式中的相位偏移對應(yīng),θB與θE分別為合法與非法發(fā)射機(jī)射頻前端對發(fā)射信號造成的相位偏移,而θBA與θEA分別為合法與非法信道對信號產(chǎn)生的相位偏移。θA則是合法接收機(jī)射頻前端對接收信號產(chǎn)生的相位偏移。在訓(xùn)練期過程中,將從Bob 端發(fā)來的信號標(biāo)記為標(biāo)簽1,從Eve 端發(fā)來的信號標(biāo)記為標(biāo)簽0,將信號與標(biāo)簽綁定后輸入網(wǎng)絡(luò)進(jìn)行訓(xùn)練。經(jīng)過一定的訓(xùn)練過程,便可得到一個(gè)本質(zhì)上是分類器的設(shè)備身份識別網(wǎng)絡(luò)。
根據(jù)人工神經(jīng)網(wǎng)絡(luò)領(lǐng)域中的通用近似定理,任意一個(gè)定義在閉集上的連續(xù)函數(shù),均可由三層前饋神經(jīng)網(wǎng)絡(luò)模擬到任意精度[18]。因此,本文設(shè)計(jì)了一個(gè)包含三層隱層的深度神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí)(2)式中的射頻指紋特征。本文所提出的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖4 所示。
圖4 深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
其中,主要包含三個(gè)部分,輸入層、隱層、輸出層。
(1)輸入層:
輸入層由800 個(gè)神經(jīng)元組成。由于本文針對射頻信號的原始IQ 采樣數(shù)據(jù),每個(gè)采樣數(shù)據(jù)均表示為復(fù)數(shù)形式。傳統(tǒng)神經(jīng)網(wǎng)絡(luò)無法直接對復(fù)數(shù)進(jìn)行處理。為了解決這一問題,本文將復(fù)數(shù)信號轉(zhuǎn)化成為實(shí)數(shù)形式后輸入神經(jīng)網(wǎng)絡(luò)進(jìn)行后續(xù)處理[19]。具體而言,將數(shù)據(jù)集中每個(gè)復(fù)數(shù)的實(shí)部ai、虛部bi分離出來,并按照每一個(gè)樣本點(diǎn)的實(shí)部和虛部交替排列,形成輸入數(shù)據(jù)向量。
(2)隱層:
本文提出的隱層采用3 層全連層,神經(jīng)元個(gè)數(shù)分別為200 個(gè)、100 個(gè)、100 個(gè)。隱層中的激活函數(shù)使用ReLU 函數(shù),并在最后一層隱層后使用dropout 層對網(wǎng)絡(luò)參數(shù)進(jìn)行調(diào)整。
(3)輸出層:
最后一層為輸出層,神經(jīng)元個(gè)數(shù)為1 個(gè),采用Sigmoid 函數(shù)作為激活函數(shù)。輸出結(jié)果為一個(gè)0 到1 的實(shí)數(shù),表征該輸入樣本的標(biāo)簽為0 和1 的概率,將其與數(shù)據(jù)的真實(shí)標(biāo)簽用交叉熵函數(shù)作為損失函數(shù)計(jì)算損失值,依此損失值進(jìn)行前饋調(diào)整、迭代學(xué)習(xí)。
依據(jù)前文所述的信號模型產(chǎn)生通信信號的數(shù)據(jù)集。信號所承載的信息為隨機(jī)生成,且各條信號樣本的信息獨(dú)立生成。訓(xùn)練集與測試集中的信號樣本均獨(dú)立。與傳統(tǒng)射頻指紋研究使用固定前導(dǎo)信息進(jìn)行射頻指紋提取不同[20],本文所提出的射頻指紋抽取方式僅與信號波形有關(guān),而與所承載的信息無關(guān)。更適用于傳輸隨機(jī)數(shù)據(jù)的實(shí)際場景。考慮靜態(tài)的瑞利信道,即它對信號產(chǎn)生的是一個(gè)隨機(jī)未知且在一段時(shí)間內(nèi)保持不變的影響。引入加性噪聲為5dB 到40dB,步長為5dB共8 個(gè)信噪比(SNR)值,涵蓋到正常無線通信的信噪比范圍。
根據(jù)研究實(shí)驗(yàn)變量不同,分為兩個(gè)數(shù)據(jù)集,兩個(gè)用戶數(shù)據(jù)集(2users data)、十個(gè)用戶數(shù)據(jù)集(10users data),每個(gè)數(shù)據(jù)集中包含不同信噪比情況下的數(shù)據(jù)樣本。兩個(gè)用戶數(shù)據(jù)集代表的是最簡單常見的設(shè)備身份識別場景,即一個(gè)合法用戶、一個(gè)非法用戶。而十個(gè)用戶數(shù)據(jù)集代表了常見的智慧家庭或者智慧辦公應(yīng)用環(huán)境下每個(gè)接入點(diǎn)所包括的設(shè)備數(shù)量。
(1)2users data:
該數(shù)據(jù)集中包含兩個(gè)用戶,其中,相位偏移設(shè)置為合法發(fā)射機(jī)θB=π/3,合法接收機(jī)θA=π/4,非法接收機(jī)θE=π/6 。在每種信噪比下收集20000 條信號樣本(single SNR data),因此平均混合各個(gè)SNR 的數(shù)據(jù)集后,數(shù)據(jù)集總大小為160000 條信號樣本。
(2)10users data:
該數(shù)據(jù)集中包含十個(gè)用戶,其中相位偏移設(shè)置為合法發(fā)射機(jī)θB=0,合法接收機(jī)θA=π/4,非法發(fā)射機(jī)θE=π/5*n(n=1,2,3,4,5,6,7,8,9),在每種信噪比下收集18000 條信號樣本,因此平均混合各個(gè)SNR 的數(shù)據(jù)集后,數(shù)據(jù)集總大小為144000 條信號樣本。
其中每一個(gè)樣本包含400 個(gè)射頻信號采樣點(diǎn),并將數(shù)據(jù)集按照8:1:1 的比例劃分為訓(xùn)練集、測試集、驗(yàn)證集。
本節(jié)介紹針對不同實(shí)驗(yàn)變量對本文所提出的網(wǎng)絡(luò)進(jìn)行參數(shù)優(yōu)化與性能評估。首先驗(yàn)證不同損失函數(shù)對神經(jīng)網(wǎng)絡(luò)性能的影響,接下來展示在不同用戶場景和不同信噪比情況下的性能。本文所提出算法使用Python 語言和PyTorch 的深度學(xué)習(xí)框架實(shí)現(xiàn)。
本文選用了四種損失函數(shù)進(jìn)行考察,分別為均方誤差損失函數(shù)(MSELoss)、平均絕對誤差損失函數(shù)(L1Loss)、平滑平均絕對誤差損失函數(shù)(SmoothL1Loss)與交叉熵?fù)p失函數(shù)(BSELoss)進(jìn)行對比。并且在三種環(huán)境下進(jìn)行訓(xùn)練和測試,分別為:①使用2users data;②在兩個(gè)用戶的環(huán)境中使用SNR 為5dB 數(shù)據(jù)集(2users single SNR data);③在十個(gè)用戶的環(huán)境中使用SNR為5dB 數(shù)據(jù)集(10users single SNR data)。
得到在不同數(shù)據(jù)集訓(xùn)練下的準(zhǔn)確率結(jié)果表1所示。
表1 不同損失函數(shù)在三種數(shù)據(jù)集訓(xùn)練下的判別準(zhǔn)確率
這里選擇展示在使用2users single SNR data 進(jìn)行訓(xùn)練時(shí)準(zhǔn)確率變化情況與損失函數(shù)值變化情況的實(shí)驗(yàn)結(jié)果如圖5、圖6 所示。
圖5 使用不同損失函數(shù)準(zhǔn)確率變化對比
圖6 使用不同損失函數(shù)損失值變化對比
在三種數(shù)據(jù)集訓(xùn)練下可以發(fā)現(xiàn),除了使用L1Loss無法達(dá)到判別效果,其他三種均可達(dá)到95.57%以上的判別準(zhǔn)確率。在使用2users data 進(jìn)行訓(xùn)練時(shí),更是均達(dá)到99.75%以上的準(zhǔn)確率。而使用BCELoss 是均使準(zhǔn)確率達(dá)到四種損失函數(shù)中最高位。結(jié)合損失值變化曲線也可以發(fā)現(xiàn),在使用BCELoss 時(shí),loss 值也可以更快地降到0 并保持平穩(wěn)。因此使用BCELoss 作為損失函數(shù),無論從運(yùn)行梯度下降的時(shí)間效率上看,還是從訓(xùn)練結(jié)果判別準(zhǔn)確率上看,均為較好的那一個(gè)。
由于本研究針對的模型問題是一個(gè)判別二分類問題,神經(jīng)網(wǎng)絡(luò)模型設(shè)置的最后一層是Sigmoid 函數(shù),Sigmoid 函數(shù)缺點(diǎn)在于其函數(shù)曲線兩端的梯度接近于0,這不利于網(wǎng)絡(luò)的收斂和訓(xùn)練。但使用BCELoss 作為損失函數(shù)時(shí),求得反向傳播的梯度就與Sigmoid 函數(shù)無關(guān)了,從而便于容易進(jìn)行求導(dǎo)運(yùn)算且避免了梯度消失問題。
其次,SmoothL1Loss 的效果略次于BCELoss,但是L1Loss 卻對模型不起作用,使得Loss 值一直為1,判別準(zhǔn)確率也一直是50%。這里是因?yàn)長1Loss 函數(shù)存在缺陷,當(dāng)預(yù)測值與真實(shí)值相差為0 時(shí),損失函數(shù)是不可導(dǎo)的。換句話說,當(dāng)預(yù)測值與真實(shí)值相差不大時(shí),L1Loss容易造成無法收斂的情況出現(xiàn)。使用MSELoss 作為損失函數(shù),當(dāng)預(yù)測值與真實(shí)值差距較大時(shí),反向傳播的梯度會(huì)過大,而使得網(wǎng)絡(luò)訓(xùn)練抖動(dòng)較大,不利于網(wǎng)絡(luò)收斂。SmoothL1Loss 函數(shù)卻可以使得梯度在預(yù)測值與真實(shí)值相差不大時(shí)可以足夠小,在預(yù)測值與真實(shí)值相差很大時(shí)也不至于過高,最大為1,從而可以避免梯度爆炸。
本節(jié)將用戶數(shù)目作為實(shí)驗(yàn)變量,考察在用戶數(shù)目增多時(shí)對深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí)能力的影響。除上一節(jié)中使用的三種數(shù)據(jù)集之外,再增加使用10users data 的情況納入考察范圍。訓(xùn)練后的測試結(jié)果如表2。
表2 四種數(shù)據(jù)集訓(xùn)練下的判別準(zhǔn)確率
圖7 不同用戶數(shù)目訓(xùn)練時(shí)準(zhǔn)確率變化曲線
從圖7、表2 中可以看出,深度神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)到用戶的射頻指紋特征,判別合法非法設(shè)備,并且在用戶數(shù)量增多及環(huán)境噪聲變大時(shí),也可以保證準(zhǔn)確率能
達(dá)到96.33%這樣一個(gè)滿足判別需求的準(zhǔn)確率。在兩個(gè)用戶時(shí),更是能達(dá)到99.7%以上的準(zhǔn)確率。說明本文設(shè)計(jì)的深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)能力會(huì)因?yàn)榄h(huán)境復(fù)雜度變高而稍受影響,兩用戶比十用戶的準(zhǔn)確率高,而且收斂得更快,但準(zhǔn)確率在約23 個(gè)epoch 之后,復(fù)雜度高的一方也可以收斂到的穩(wěn)定值。
本節(jié)主要考慮將多種信噪比情況作為實(shí)驗(yàn)變量,考察本文提出的識別算法的有效性。設(shè)置了8 種信噪比環(huán)境,這8 種信噪比涵蓋了正常無線通信的信噪比范圍,包括低信噪比環(huán)境、中等信噪比環(huán)境和高信噪比環(huán)境。在四種數(shù)據(jù)集下訓(xùn)練后的測試準(zhǔn)確率如表3 所示。
表3 四種數(shù)據(jù)集訓(xùn)練下不同信噪比的判別準(zhǔn)確率
通過表4 中準(zhǔn)確率也可以發(fā)現(xiàn),本文提出的方法不僅實(shí)現(xiàn)了在各個(gè)信噪比環(huán)境中的設(shè)備身份識別分類任務(wù),且在大于10dB 的情況下,均能達(dá)到97.68%以上的準(zhǔn)確率。因此,通過深度神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí),在較差環(huán)境中也可以得到較好的判別準(zhǔn)確率,以滿足實(shí)際系統(tǒng)對非法用戶的鑒別需求。從使用single SNR data 數(shù)據(jù)集的判別準(zhǔn)確率上看,判別準(zhǔn)確率與SNR 之間具有一定正相關(guān)性,即SNR 越大,準(zhǔn)確率越高,但受影響效果并不顯著。但使用10users data 數(shù)據(jù)集時(shí),對信噪比為5dB 的環(huán)境較為敏感,準(zhǔn)確率下降較快,由于該環(huán)境為所有設(shè)置中噪聲影響最大的部分,但也可以得到84.25%的準(zhǔn)確率,并且在單獨(dú)訓(xùn)練5dB 的準(zhǔn)確率能達(dá)到97.61%。因此,在較低的信噪比且環(huán)境模型更為復(fù)雜的情況下,可以進(jìn)行單獨(dú)針對訓(xùn)練,以提高判別準(zhǔn)確率。
針對傳統(tǒng)的無線設(shè)備身份識別所存在的安全漏洞,本文提出一種基于深度神經(jīng)網(wǎng)絡(luò)的設(shè)備身份識別方法,本方法使用設(shè)備射頻前端產(chǎn)生的射頻指紋特征進(jìn)行設(shè)備身份識別,為無線網(wǎng)絡(luò)中設(shè)備身份識別提供了另一層安全保障。本方法從射頻接收機(jī)接收到的原始信號采樣中提取射頻指紋,保留了發(fā)射機(jī)的身份特征。本文設(shè)計(jì)了一種深度神經(jīng)網(wǎng)絡(luò),從所獲得的信號采樣中識別無線設(shè)備身份。通過不同場景下的仿真實(shí)驗(yàn)證明,本文所提出的方法在用戶數(shù)目增加、噪聲影響增大的復(fù)雜環(huán)境中依舊保證較高的識別準(zhǔn)確率,可達(dá)到97.61%以上,證明了本文所提出算法的有效性。