任瑾璇,麻淑婉,王永華,萬(wàn) 頻
(廣東工業(yè)大學(xué) 自動(dòng)化學(xué)院,廣州 510006)
隨著5G技術(shù)的普及和物聯(lián)網(wǎng)技術(shù)的興起,無(wú)線通信業(yè)務(wù)呈指數(shù)級(jí)增長(zhǎng),導(dǎo)致可用的頻譜資源越來(lái)越少。針對(duì)授權(quán)的頻段未得到充分的利用和抵御惡意用戶(Malicious User,MU)的攻擊等問(wèn)題,認(rèn)知無(wú)線電(Cognitive Radio,CR)技術(shù)被提出。頻譜感知是CR中十分重要的環(huán)節(jié),可檢測(cè)主用戶(Primary User,PU)是否處于空閑狀態(tài),空閑時(shí)則允許感知用戶(Cognitive User,CU)獲得許可的頻段[1-3],有效提高頻譜利用率,緩解頻譜短缺。
現(xiàn)階段的頻譜感知技術(shù)面臨著嚴(yán)重的安全問(wèn)題,MU會(huì)通過(guò)發(fā)送錯(cuò)誤的信息對(duì)檢測(cè)用戶發(fā)動(dòng)攻擊來(lái)影響感知結(jié)果?,F(xiàn)有的對(duì)抗MU的頻譜感知研究有一定的局限性:文獻(xiàn)[4-8]限制了攻擊方式,只考慮了頻譜感知數(shù)據(jù)篡改(Spectrum Sensing Data Falsification,SSDF)的攻擊方式,所用算法不具有普遍性;文獻(xiàn)[9]采用了直接軟融合或者直接硬融合方法,這可能會(huì)導(dǎo)致感知矩陣的特征提取不充分,使協(xié)同頻譜感知系統(tǒng)(Cooperative Spectrum Sensing,CSS)的性能無(wú)法提高,無(wú)法有效排除MU的干擾。
為了抵御MU的攻擊,本文通過(guò)數(shù)據(jù)軟融合機(jī)制和模糊處理機(jī)制對(duì)感知數(shù)據(jù)進(jìn)行有效分離和特征提取,將處理后的感知數(shù)據(jù)發(fā)送給數(shù)據(jù)融合中心(Fusion Center,FC),F(xiàn)C通過(guò)制定高效的數(shù)據(jù)融合方案做出全局決策,輸出整個(gè)系統(tǒng)的檢測(cè)結(jié)果。相對(duì)之前所提出的研究方案,本文的研究方案沒(méi)有限制攻擊方式,且無(wú)需關(guān)于MU和CU的任何先驗(yàn)知識(shí),以及信號(hào)和噪聲的分布。
為了提高感知網(wǎng)絡(luò)的服務(wù)質(zhì)量和信息傳輸?shù)乃俾?,本文采用的多天線輸入輸出系統(tǒng)并行融合模型如圖1所示。
圖1 多天線輸入輸出系統(tǒng)
在此方案中,并行融合模型主要包括三個(gè)步驟,分別是本地檢測(cè)、數(shù)據(jù)匯聚和數(shù)據(jù)融合。第一步本地檢測(cè)是FC選擇一個(gè)需要檢測(cè)并且已經(jīng)授權(quán)的頻段后,對(duì)每個(gè)誠(chéng)實(shí)用戶(Honest User,HU)進(jìn)行控制使其執(zhí)行數(shù)據(jù)感知操作。第二步是數(shù)據(jù)匯聚,即CU把收集的每根天線檢測(cè)的感知數(shù)據(jù)通過(guò)信道傳送給FC。第三步是數(shù)據(jù)融合,通過(guò)一系列數(shù)學(xué)方法和機(jī)器學(xué)習(xí)的算法對(duì)感知數(shù)據(jù)進(jìn)行處理,判決出PU是否存在。
認(rèn)知無(wú)線電的頻譜檢測(cè)是二元假設(shè)問(wèn)題[10],信道可分為空閑狀態(tài)和被占用狀態(tài)。 假設(shè)第i個(gè)CU的第j條天線采樣所得到的信號(hào)表示為
(1)
第i個(gè)感知用戶所檢測(cè)到的感知數(shù)據(jù)記為
(2)
在頻譜感知中,主要由虛警概率和檢測(cè)概率兩個(gè)指標(biāo)來(lái)衡量感知的性能。
虛警概率Pf指當(dāng)PU未占用信道時(shí)被檢測(cè)為PU已占用信道,此錯(cuò)誤的檢測(cè)結(jié)果會(huì)導(dǎo)致CU不能接入信道,表示為
Pf=Prob{H1|H0} 。
(3)
檢測(cè)概率Pd指正確判斷該信道是否被占用,表示為
Pd=Prob{H1|H1} 。
(4)
在頻譜感知中,感知過(guò)程和信息交互過(guò)程中可能存在的惡意數(shù)據(jù),會(huì)導(dǎo)致整個(gè)系統(tǒng)的感知能力下降,因此需識(shí)別出潛在的MU并排除MU對(duì)整個(gè)系統(tǒng)的攻擊,避免系統(tǒng)產(chǎn)生錯(cuò)誤的感知判決結(jié)果。MU攻擊方法主要包括三類:第一類是MU通過(guò)模擬PU的信號(hào)進(jìn)行攻擊,使HU的信號(hào)偏離PU的信號(hào),最終將HU被隔離在主系統(tǒng)的頻譜之外;第二類是干擾HU的報(bào)告信道,通過(guò)阻斷、修改、重置等方式來(lái)干擾HU和FC的數(shù)據(jù)輸入通道,從而讓HU的本地決策結(jié)果無(wú)法發(fā)送或者無(wú)法準(zhǔn)確的傳送給FC;第三類是攻擊HU,使HU發(fā)生故障,不斷發(fā)出錯(cuò)誤的本地檢測(cè)結(jié)果和報(bào)告信息,這種攻擊方法將會(huì)導(dǎo)致檢測(cè)概率極大地降低,甚至?xí)?dǎo)致整個(gè)全局系統(tǒng)的崩潰。
在CSS中,MU的存在會(huì)嚴(yán)重降低檢測(cè)效率,影響CSS的系統(tǒng)性能[11]。利用合適的方法對(duì)用戶進(jìn)行選擇可以排除MU對(duì)無(wú)線電網(wǎng)絡(luò)的攻擊,確保CU和PU的感知數(shù)據(jù)的可靠性?;诖吮疚牟捎眉惺竭x擇模型,該模型主要是利用FC對(duì)所有可用的感知數(shù)據(jù)進(jìn)行收集,當(dāng)數(shù)據(jù)收集完畢后,對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步提取、剔除、融合等一系列操作,確保了網(wǎng)絡(luò)的安全性和可靠性。
基于聚類算法的頻譜感知的主要流程有四個(gè)階段:數(shù)據(jù)收集和提取、模糊處理、剔除惡意點(diǎn)和感知數(shù)據(jù)的分類。在數(shù)據(jù)的收集和提取階段,對(duì)每個(gè)CU收集的矩陣數(shù)據(jù)進(jìn)行特征提??;在感知數(shù)據(jù)的模糊處理階段,采用隸屬度函數(shù)對(duì)前一步所提取的特征數(shù)據(jù)進(jìn)行模糊處理,把頻譜感知的二分類問(wèn)題轉(zhuǎn)變成一個(gè)模糊邊界的二分類問(wèn)題,對(duì)處于模糊邊界內(nèi)的數(shù)據(jù)添加不同的隸屬度的值,使分類器在低信噪比的惡劣情況下,仍然具有較好的性能和效率;第三階段進(jìn)行惡意點(diǎn)的剔除,該階段對(duì)數(shù)據(jù)的離群點(diǎn)進(jìn)行了挖掘剔除和融合,使算法的魯棒性更好,降低MU對(duì)整個(gè)無(wú)線電系統(tǒng)的干擾和影響;最后采用K-means++進(jìn)行聚類。
圖2 算法總流程圖
頻譜感知分類是一個(gè)二分類問(wèn)題:
(5)
當(dāng)環(huán)境的信噪比(Signal-to-Noise Ratio,SNR)值比較高且信號(hào)檢測(cè)條件較好時(shí),F(xiàn)C接收到的PU在信道上的信號(hào)強(qiáng)度和PU不在信道上的信號(hào)強(qiáng)度之差較大,有利于感知系統(tǒng)判斷PU的狀態(tài);在SNR較低的情況下,F(xiàn)C進(jìn)行本地檢測(cè)的結(jié)果準(zhǔn)確性不高;隨著SNR值的下降,檢測(cè)結(jié)果的準(zhǔn)確性越低?,F(xiàn)有的頻譜感知不能解決SNR不理想、分類邊界模糊的問(wèn)題,不能表達(dá)PU可能或不可能存在這一類可能性問(wèn)題,使得檢測(cè)的準(zhǔn)確性降低。
在進(jìn)行模糊處理前,先對(duì)信號(hào)樣本X進(jìn)行特征提取,令x={x1,x2,…,xn}表示最大特征值與最小特征值之比的特征值。
本文采用隸屬度函數(shù)對(duì)模糊邊界進(jìn)行分類,當(dāng)隸屬度為1時(shí),代表PU絕對(duì)存在;當(dāng)隸屬度為0時(shí),代表PU絕對(duì)不存在;當(dāng)隸屬度越接近1時(shí),代表PU存在的可能性越大;越接近0,則代表PU不存在的可能性越大。此方法可以對(duì)樣本點(diǎn)進(jìn)行進(jìn)一步的特征處理,提高樣本點(diǎn)的分類準(zhǔn)確度,使系統(tǒng)在SNR較低、距離較遠(yuǎn)等惡劣環(huán)境下也有較好的數(shù)據(jù)感知性能。
隸屬度函數(shù)如下式所示:
(6)
uA(x)為x對(duì)模糊集合A的隸屬度。uA(x)越接近于0,表示x屬于集合A的程度越??;否則表示x屬于集合A的程度越大。uA(x)用札德(Zadeh)記號(hào)法可表示為
(7)
從圖3可以看出,該函數(shù)式單調(diào)遞增并連續(xù),且存在兩個(gè)邊界值λ1和λ2,區(qū)間(0,λ1)所表示的是絕對(duì)的噪聲信號(hào)區(qū)域,區(qū)間(λ2,∞)所表示的是絕對(duì)的信號(hào)區(qū)域,區(qū)間(λ1,λ2)所代表的區(qū)域是“可能”區(qū)域,有一定的概率屬于噪聲信號(hào),也有一定的概率屬于PU信號(hào)。
本文中的離群點(diǎn)指MU為了干擾整個(gè)感知系統(tǒng)產(chǎn)生的偏離正常感知數(shù)據(jù)的數(shù)據(jù)對(duì)象,它與正常的感知數(shù)據(jù)有著顯著的不同。離群點(diǎn)挖掘就是找出行為異常并且不同于其他感知數(shù)據(jù)的數(shù)據(jù)對(duì)象,并將其排除在感知數(shù)據(jù)集之外。
離群點(diǎn)的主要包括三種類型:第一種是全局離群點(diǎn),是指離群點(diǎn)明顯偏離集中的數(shù)據(jù)集;第二種是情景離群點(diǎn),是指在某些情景中,離群點(diǎn)與所給定的集中數(shù)據(jù)有顯著差異;第三種是集體離群點(diǎn),是指多個(gè)離群點(diǎn)作為整體偏離所給定的數(shù)據(jù)集。本文主要采用的是基于距離數(shù)值檢測(cè)的循環(huán)嵌套檢測(cè)方法對(duì)每個(gè)用戶(包括MU)頻譜進(jìn)行檢測(cè),將所檢測(cè)到的數(shù)據(jù)對(duì)象進(jìn)行特征值的模糊處理,將所處理的數(shù)據(jù)遞交給FC,F(xiàn)C會(huì)對(duì)MU產(chǎn)生的離群點(diǎn)進(jìn)行挖掘排除及融合。算法步驟如下:
Step1 輸入循環(huán)次數(shù)n、樣本特征值x、當(dāng)前迭代次數(shù)t、最大迭代次數(shù)maxite、系數(shù)μ。
Step2 初始化數(shù)據(jù)均值mean、方差std。
Step3 判斷(x-mean)<μ×std是否滿足。
Step4 若Step 3不成立,則把該數(shù)據(jù)點(diǎn)x剔除。
Step5 保留使Step 3成立的數(shù)據(jù)點(diǎn),更新mean、std、t=t+1。
Step6 判斷mean是否收斂,或者是否迭代到最大次數(shù)maxite。
Step7 若Step 6成立則輸出保留下來(lái)的x,否則返回Step 3,直至Step 6成立。
Step8 對(duì)保留下來(lái)的x進(jìn)行數(shù)據(jù)融合,循環(huán)n次,直至輸出樣本數(shù)據(jù)集W={c1,c2,c3,…,cH}。
在頻譜感知中,數(shù)據(jù)樣本需要聚類成兩個(gè)類[12-13]。由于K-means聚類算法可伸縮性強(qiáng),運(yùn)行速度快,經(jīng)常被應(yīng)用于頻譜感知技術(shù)中[12,14]。但K-means在算法初始階段時(shí)需要選擇初始的聚類中心,如果選擇不當(dāng),會(huì)導(dǎo)致產(chǎn)生無(wú)效的聚類結(jié)果。該算法很大程度上受到初始聚類中心的影響,本文采用K-means++算法解決了此問(wèn)題。
K-means++ 算法:按照聚類中心是互相離得越遠(yuǎn)越好的原則進(jìn)行選取,在選取第一個(gè)聚類中心時(shí)同樣采用隨機(jī)的方法。
Step1 輸入數(shù)據(jù)集W={c1,c2,c3,…,cH}。
Step2 從數(shù)據(jù)集中隨機(jī)選取一個(gè)點(diǎn)作為初始化的聚類中心,如ψ1=c1。
Step4 重復(fù)Step 3直到選出K個(gè)聚類中心。
Step5 計(jì)算數(shù)據(jù)集中每個(gè)樣本ci與K個(gè)聚類中心的距離,并將其分到距離最小的聚類中心對(duì)應(yīng)的類中。
Step7 重復(fù)Step 5~6,直至ψk不變化,輸出ψk。
把數(shù)據(jù)集分為訓(xùn)練集И和測(cè)試集Й,訓(xùn)練集И送入K-means++算法得到聚類中心ψk,利用公式(8)對(duì)測(cè)試集Й進(jìn)行分類操作:
(8)
式中:ξ是一個(gè)度量參數(shù),且ξ>0。如果上式成立,則可判定為信道可用,否則判定信道不可用。
本文的PU信號(hào)選擇AM信號(hào),設(shè)CU的個(gè)數(shù)為100,其中HU為85,MU為15,F(xiàn)U所接收到的數(shù)據(jù)對(duì)象R=100。圖4和圖5分別給出了模糊處理前后的聚類圖,圖中紅色的“*”代表PU處于活躍的狀態(tài),藍(lán)色的“×”代表PU處于空閑狀態(tài)。通過(guò)對(duì)比觀察圖4和圖5樣本點(diǎn)坐標(biāo)和聚類中心的坐標(biāo)可以看出,未進(jìn)行模糊處理的PU活躍和PU空閑的聚類中心分別是(1.139,1.141)和(1.146,1.144),聚類中心的歐氏距離很近。在進(jìn)行模糊處理之后,PU活躍和空閑的聚類中心變?yōu)?-1.195,-1.294)和(0.806 7,0.771 4),兩個(gè)簇的聚類中心較遠(yuǎn)。經(jīng)過(guò)模糊處理后,各個(gè)樣本點(diǎn)之間的歐氏距離都成倍數(shù)增加,顯著提升了算法的性能和分類的準(zhǔn)確率。
圖4 模糊處理前聚類圖
如圖6所示,黑色的曲線代表未進(jìn)行數(shù)據(jù)的模糊處理的ROC(Receiver Operating Characteristic)曲線,紅色的曲線代表進(jìn)行了模糊處理后的ROC曲線,可以看出當(dāng)SNR為-17 dB時(shí),信號(hào)噪聲的環(huán)境較好,經(jīng)過(guò)模糊處理后的數(shù)據(jù)展示了良好的收斂速度和準(zhǔn)確率;同時(shí)在SNR為-19 dB時(shí),經(jīng)過(guò)模糊處理后的數(shù)據(jù)比未經(jīng)過(guò)模糊處理的數(shù)據(jù)性能更好。
圖6 模糊處理前后ROC圖
圖7展示了聚類算法在不同的MU和HU配比下的ROC曲線,圖中紅色的線代表K-means++算法的分類性能,黑色的線代表K-means的分類性能。對(duì)比曲線可以看出,無(wú)論是哪一種MU和HU配比,采用K-means++聚類算法相比較于K-means聚類算法,曲線的收斂速度和算法性都有顯著提升。
從圖7也可以看出不同MU與HU配比對(duì)算法性能的影響:當(dāng)HU為85 dB、80 dB時(shí),MU對(duì)應(yīng)為15 dB、20 dB,對(duì)比曲線可以看出,無(wú)論是哪一種配比,數(shù)據(jù)的模糊處理機(jī)制都能顯著提升整個(gè)CSS系統(tǒng)的性能。
圖7 不同的MU和HU配比下的ROC圖
圖8對(duì)比了多組在不同SNR情況下采用K-means++的聚類算法和采用K-means聚類算法的ROC曲線圖,從圖中可以看出,無(wú)論SNR為多少,K-means++的性能效果都比K-means要穩(wěn)健,對(duì)MU攻擊的抵御更加有效。
圖8 K-means++與K-means ROC對(duì)比
本文提出了對(duì)感知數(shù)據(jù)進(jìn)行模糊處理的機(jī)制、基于離群點(diǎn)挖掘排除MU攻擊算法和K-means++的聚類算法。模糊處理機(jī)制可以有效增加不同簇?cái)?shù)據(jù)對(duì)象的歐氏距離,有利于對(duì)數(shù)據(jù)進(jìn)行分類處理,提高了認(rèn)知無(wú)線電網(wǎng)絡(luò)系統(tǒng)的穩(wěn)定性,使得系統(tǒng)在低信噪比的惡劣情況下也能保持良好的性能;采用基于離群點(diǎn)挖掘排除MU攻擊,有效抵御了任何攻擊方式,不限制于某一固定攻擊方式;在分類階段,采用K-means++算法對(duì)數(shù)據(jù)進(jìn)行分類,既避免了繁雜的門限推導(dǎo),還改進(jìn)了采用K-means的不足,在其基礎(chǔ)上提高了CSS系統(tǒng)的性能。
接下來(lái)的工作將研究在低信噪比情況下能感知多個(gè)主用戶信號(hào)的算法,優(yōu)化感知算法的復(fù)雜度,以使在大范圍惡意用戶攻擊的情況下算法仍能保持良好的感知性能。