高羅瑩,田增山,李玲霞,張小婭
(重慶郵電大學(xué) 通信與信息工程學(xué)院,重慶 400065)
被動(dòng)入侵檢測(cè)是指被檢測(cè)目標(biāo)在不攜帶任何信號(hào)收發(fā)設(shè)備的條件下,通過檢測(cè)入侵目標(biāo)對(duì)無線電波的擾動(dòng)實(shí)現(xiàn)環(huán)境的異常檢測(cè),在智能家居、老人監(jiān)護(hù)和警務(wù)安保等領(lǐng)域具有潛在的應(yīng)用價(jià)值[1-3]。目前為止已經(jīng)發(fā)展了多種被動(dòng)入侵檢測(cè)系統(tǒng),比如,超寬帶雷達(dá)系統(tǒng)[4],計(jì)算機(jī)視覺系統(tǒng)[5],無線電層析成像系統(tǒng)[6]以及無線傳感器[7]被動(dòng)檢測(cè)系統(tǒng)。這些系統(tǒng)在特定條件下能夠提供較高的檢測(cè)率,但仍有各自的缺點(diǎn)。超寬帶雷達(dá)檢測(cè)系統(tǒng),需要安裝特殊的硬件設(shè)備;計(jì)算機(jī)視覺系統(tǒng)受到直射視距的影響,并且無法在黑暗環(huán)境或者煙霧環(huán)境中工作;無線電層析成像系統(tǒng)和無線傳感器系統(tǒng),需要部署高密度的節(jié)點(diǎn)來實(shí)現(xiàn)監(jiān)測(cè)區(qū)域的全覆蓋,且設(shè)備昂貴,不適宜大規(guī)模商用。相比于這些系統(tǒng),基于無線局域網(wǎng)(wireless local area network,WLAN)的被動(dòng)入侵檢測(cè)系統(tǒng)利用室內(nèi)環(huán)境中廣泛部署的無線網(wǎng)絡(luò),具有易部署、成本較低、覆蓋面積廣等特點(diǎn),從而得到了廣泛的關(guān)注。
現(xiàn)有的基于WLAN的被動(dòng)入侵檢測(cè)技術(shù),主要有基于時(shí)間序列分析的檢測(cè)技術(shù),如移動(dòng)均值(moving average,MA)和移動(dòng)方差(moving variance,MV)檢測(cè)技術(shù)[8];基于統(tǒng)計(jì)異常的檢測(cè)技術(shù),如Ichnaea系統(tǒng)[9];以及基于模式識(shí)別的檢測(cè)技術(shù),如基于最大似然估計(jì)(maximum likelihood estimation, MLE)[10]和支持向量機(jī)(support vector machine, SVM)[11]的檢測(cè)技術(shù)。然而,基于時(shí)間序列分析的檢測(cè)技術(shù),雖然能在短時(shí)間內(nèi)獲得較高的檢測(cè)性能,但是對(duì)環(huán)境變化的穩(wěn)健性較差,隨著時(shí)間和環(huán)境的變化檢測(cè)性能逐漸下降;基于統(tǒng)計(jì)異常的檢測(cè)技術(shù),其單鏈路的檢測(cè)性能取決于置信度水平的取值,因此在多鏈路聯(lián)合檢測(cè)中,為了實(shí)現(xiàn)較好的檢測(cè)性能需要調(diào)整每條鏈路的置信度水平,其應(yīng)用場(chǎng)景有限;基于模式識(shí)別的檢測(cè)技術(shù),需要在訓(xùn)練階段采集大量的正常數(shù)據(jù)和異常數(shù)據(jù)作為訓(xùn)練樣本,才能獲得較好的分類準(zhǔn)確率,因此訓(xùn)練階段時(shí)間開銷較大,不適合在大范圍場(chǎng)景下應(yīng)用。
為了避免以上技術(shù)的不足,本文提出一種基于支持向量域描述(support vector domain description,SVDD)[12-13]的WLAN室內(nèi)被動(dòng)入侵檢測(cè)算法。首先,利用A-distance值分布差異性度量方法[14]與交叉驗(yàn)證法計(jì)算出各種信號(hào)特征對(duì)于正確區(qū)分靜默狀態(tài)與有人運(yùn)動(dòng)狀態(tài)的平均貢獻(xiàn)度,選擇平均貢獻(xiàn)度較高的特征來刻畫環(huán)境中不同的狀態(tài)。然后,根據(jù)特征選取的結(jié)果,提取出靜默狀態(tài)下每條鏈路相應(yīng)的信號(hào)特征,并構(gòu)造出特征矩陣。最后,利用特征矩陣訓(xùn)練SVDD異常檢測(cè)模型,SVDD以SVM為基礎(chǔ),通過非線性變換將特征矩陣從低維輸入空間變換到高維特征空間,并在高維空間中得到一個(gè)超球體異常檢測(cè)邊界,并且利用L1正則化有效地抑制離群點(diǎn)的影響,具有較好的抗噪性。本文最后在復(fù)雜的家居環(huán)境和大范圍的走廊環(huán)境下采集WLAN數(shù)據(jù)用以驗(yàn)證本文算法的有效性。驗(yàn)證結(jié)果表明,本文算法在這2種環(huán)境中的F1-measure值分別達(dá)到0.960和0.945,優(yōu)于現(xiàn)有的基于WLAN的被動(dòng)入侵檢測(cè)技術(shù)。
本文的室內(nèi)入侵檢測(cè)系統(tǒng)包括3個(gè)階段,分別為特征分析階段,離線訓(xùn)練階段,在線監(jiān)測(cè)階段。系統(tǒng)框架如圖1。
特征分析階段。在入侵檢測(cè)系統(tǒng)中,不同的特征組合其檢測(cè)性能存在差異。因此,在特征分析階段需要挑選出最優(yōu)的特征組合,作為之后系統(tǒng)構(gòu)建的特征數(shù)據(jù)基礎(chǔ)。在該階段,本文分析隨機(jī)場(chǎng)景中多種特征在正常和異常狀態(tài)下的分布差異,評(píng)估這些特征在不同傳播路徑下的重要性,并根據(jù)特征重要性排序選擇最優(yōu)的特征組合用于被動(dòng)入侵檢測(cè)。
離線訓(xùn)練階段。采集靜默數(shù)據(jù)來構(gòu)建入侵檢測(cè)模型,用于檢測(cè)環(huán)境中是否存在異常。在該階段,感知區(qū)域中有無人活動(dòng),接收設(shè)備采集每條鏈路的接收信號(hào)強(qiáng)度值。然后,根據(jù)特征分析階段的結(jié)果提取每條鏈路相應(yīng)的特征值,結(jié)合多鏈路信號(hào)特征構(gòu)建特征矩陣。最后,利用特征矩陣訓(xùn)練出SVDD入侵檢測(cè)模型。
在線檢測(cè)階段。利用離線階段訓(xùn)練出的模型來判斷當(dāng)前環(huán)境是否異常。在該階段,提取實(shí)時(shí)信號(hào)的相應(yīng)特征構(gòu)建特征向量,通過判斷特征向量是否在超球體內(nèi)部來判斷感知區(qū)域內(nèi)是否存在入侵,實(shí)現(xiàn)實(shí)時(shí)檢測(cè)。
特征分析階段主要是通過分析各種特征在靜默和入侵2種狀態(tài)下的分布差異,來尋找最優(yōu)的特征組合,用于構(gòu)建被動(dòng)入侵檢測(cè)系統(tǒng)。
2.1.1 信號(hào)特征分布差異性分析
在2.4~5 GHz頻段的無線環(huán)境中,信號(hào)在無變化的環(huán)境中其接收信號(hào)強(qiáng)度(received signal strength,RSS)值相對(duì)穩(wěn)定,但是一旦環(huán)境中存在干擾,信號(hào)在傳播過程中會(huì)受到反射,折射和散射的影響,會(huì)造成RSS值的變化,如圖2,靜默和有人走動(dòng)時(shí),鏈路的信號(hào)具有明顯的差異。因此,接收端RSS信號(hào)的變化情況,能很好地反映無線環(huán)境是否有入侵者。
為了更好地捕捉接收端信號(hào)功率水平的變化,本文使用滑動(dòng)窗函數(shù)提取信號(hào)特征,通過學(xué)習(xí)信號(hào)特征的變化來研究接收信號(hào)變化的規(guī)律。本文主要考慮7種信號(hào)特征,分別是最大值、最小值、均值、中值、極差值、方差以及平均FFT[15](mean of fast fourier transformation,Mean FFT)。其中,平均FFT是信號(hào)的頻域特征,用于捕獲人員入侵的周期模式,能有效地反映信號(hào)的波動(dòng)變化情況。假設(shè)t時(shí)刻的滑動(dòng)窗數(shù)組為Wt=[xt-L+1xt-L+2…xt],t≥L,滑動(dòng)窗長(zhǎng)度為L(zhǎng)。根據(jù)特征提取函數(shù)提取t時(shí)刻滑動(dòng)窗數(shù)組的特征,平均頻率提取公式為
(1)
圖3為4條鏈路的7種特征在靜默和走動(dòng)狀態(tài)下的分布情況??梢钥闯?,不同特征在2種狀態(tài)下的分布差異性是不同的。因此,為了在不同環(huán)境下均能獲得較高的檢測(cè)率,需要對(duì)特征進(jìn)行篩選,選取分布差異較大的特征組合實(shí)現(xiàn)異常檢測(cè)。
2.1.2 特征選取方法與步驟
為了實(shí)現(xiàn)有效的特征選取,本文使用A-distance值評(píng)估每個(gè)特征在靜默和走動(dòng)2種狀態(tài)下的分布差異,選取分布差異程度較大的特征構(gòu)建檢測(cè)模型。其中,A-distance值通常用于度量構(gòu)建2分類器的2組數(shù)據(jù)(Ds和Dt)的分布差異程度[13],A-distance值越大,說明2組數(shù)據(jù)的分布差異性越大,構(gòu)建出的分類器分類誤差就越低。本文中選擇決策樹作為線性分類器h,使用E(h)表示分類器的損失,則A-distance值定義為
dA(Ds,Dt)=2(1-2E(h))
(2)
利用A-distance值和交叉驗(yàn)證法計(jì)算每個(gè)特征的平均貢獻(xiàn)度Cj的具體步驟如下。
步驟1 提取M條鏈路靜默數(shù)據(jù)和走動(dòng)數(shù)據(jù)的7種信號(hào)特征,并構(gòu)建特征矩陣Dnor,i和Dabnor,i,其中,i=1,…,M。
步驟2 將鏈路i(i=1,…,M)中第j(j=1,…,7)個(gè)特征向量Djnor,i和Djabnor,i分別劃分為G個(gè)大小相似的互斥子集
Djnor,i=Dj,1nor,i∪Dj,2nor,i∪…∪Dj,Gnor,i
Djabnor,i=Dj,1abnor,i∪Dj,2abnor,i∪…∪Dj,Gabnor,i
步驟3 構(gòu)造訓(xùn)練集Trgi,j,g=1,…,G和測(cè)試集Tegi,j,g=1,…,G,具體為
其中,靜默數(shù)據(jù)的標(biāo)記為1,走動(dòng)數(shù)據(jù)的標(biāo)記為-1。
步驟4 利用訓(xùn)練集Trgi,j,g=1,…,G構(gòu)造決策樹分類器hgi,j,g=1,…,G。
步驟6 根據(jù)(3)式求出鏈路i中第j個(gè)特征對(duì)應(yīng)的A-distance值,具體為
dAi,j=2(1-2E(hi,j))
(3)
若dAi,j<0,表明特征j不能有效地區(qū)分鏈路i中的靜默狀態(tài)和走動(dòng)狀態(tài),因此令dAi,j=0。然后,依次計(jì)算出鏈路i中7個(gè)特征的A-distance值{dAi,1,dAi,2,…,dAi,7},并進(jìn)行歸一化,得到特征j對(duì)于鏈路i的貢獻(xiàn)度ci,j
(4)
步驟7 計(jì)算M條鏈路中第j個(gè)特征的貢獻(xiàn)度ci,j,i=1,…,M,并求出第j個(gè)特征的平均貢獻(xiàn)度。最后,依次求出7個(gè)特征的平均貢獻(xiàn)度Cj為
(5)
步驟8 根據(jù)平均貢獻(xiàn)度Cj的大小對(duì)特征重要性進(jìn)行從高到低排序,Cj越大,特征重要性排序越靠前。最后,根據(jù)特征重要性排序結(jié)果選取前p(p≤7)個(gè)特征構(gòu)建被動(dòng)入侵檢測(cè)系統(tǒng)。
在實(shí)際部署中,特征數(shù)p的取值,根據(jù)目標(biāo)場(chǎng)景中靜默數(shù)據(jù)的虛警率來確定,當(dāng)特征數(shù)p從1開始逐漸增加時(shí),虛警率會(huì)逐漸降低,當(dāng)特征數(shù)p達(dá)到一定值popt時(shí),虛警率降低到較低水平,并隨著特征數(shù)的繼續(xù)增加,虛警率趨于穩(wěn)定或出現(xiàn)上升的趨勢(shì),此時(shí)特征數(shù)的取值應(yīng)為popt。
離線訓(xùn)練階段通過采集靜默狀態(tài)下多條鏈路信號(hào)數(shù)據(jù),結(jié)合特征分析階段結(jié)果,提取相應(yīng)的特征數(shù)據(jù),構(gòu)建特征矩陣,然后利用特征矩陣訓(xùn)練SVDD入侵檢測(cè)模型,用于在線檢測(cè)階段對(duì)環(huán)境的實(shí)時(shí)監(jiān)測(cè)。
2.2.1 特征矩陣構(gòu)建
用k表示在系統(tǒng)中無線鏈路的數(shù)量,該值等于信號(hào)發(fā)射設(shè)備即接入點(diǎn)(access point,AP)的數(shù)量乘以信號(hào)接收設(shè)備即監(jiān)測(cè)點(diǎn)(monitor point,MP)的數(shù)量,其中,接收機(jī)的接收頻率為1 Hz。
根據(jù)特征選取的結(jié)果,本文選擇貢獻(xiàn)度較高的p(p≤7)個(gè)特征用于運(yùn)動(dòng)檢測(cè),利用滑動(dòng)窗函數(shù)(滑動(dòng)窗長(zhǎng)為L(zhǎng),與特征分析階段相同)提取出每條鏈路j在時(shí)刻t相應(yīng)的p個(gè)信號(hào)特征st,j,即st,j=[s1t,j,…,spt,j],其中,s1t,j和spt,j表示鏈路j在t時(shí)刻提取出的第1個(gè)特征和第p個(gè)特征。將t時(shí)刻k條鏈路的特征構(gòu)成特征向量St,即St=[st,1,…,st,j,…,st,k]。采集T個(gè)時(shí)刻的信號(hào)后,得到T-L+1個(gè)特征向量,利用這T-L+1個(gè)特征向量構(gòu)造特征矩陣S,如(6)式,令N=T-L+1。
(6)
2.2.2SVDD被動(dòng)入侵檢測(cè)模型構(gòu)建
在該部分中,利用特征矩陣S訓(xùn)練得到SVDD入侵檢測(cè)模型。SVDD的目標(biāo)是在高維空間中找到一個(gè)體積最小的超球體,能夠包含所有或者大部分的訓(xùn)練樣本。為了避免離群點(diǎn)的影響,對(duì)每個(gè)訓(xùn)練樣本點(diǎn)引入一個(gè)松弛變量ξi≥0,允許一些點(diǎn)在超球體外部。并且對(duì)每一個(gè)松弛變量ξi,乘以懲罰參數(shù)C,這使得系統(tǒng)具有一定的抗噪性能。目標(biāo)函數(shù)為
s.t. ‖Si-a‖2≤R2+ξi,ξi≥0,i=1,…,N
(7)
根據(jù)(7)式可以構(gòu)建拉格朗日函數(shù)為
(8)
(8)式中,拉格朗日乘子αi≥0,γi≥0。將拉格朗日函數(shù)L分別對(duì)R,a,ξi求偏導(dǎo),并令其等于0,可得
(9)
由αi≥0,γi≥0,可得0≤αi≤C。
根據(jù)拉格朗日對(duì)偶性,求(7)式的極小值問題可變?yōu)槠鋵?duì)偶問題的極大值問題。并引入核函數(shù)K(Si,Sj),實(shí)現(xiàn)由低維輸入空間到高維特征空間的非線性映射。可得以下優(yōu)化問題
(10)
利用序列最小最優(yōu)化算法(sequential minimal optimization,SMO)可以求得αi的最優(yōu)解[16]。當(dāng)αi=0時(shí),表示對(duì)應(yīng)的樣本點(diǎn)位于超球體內(nèi)部;當(dāng)αi=C時(shí),表示對(duì)應(yīng)的樣本點(diǎn)在超球體之外,即為受限支持向量;當(dāng)0<αi R2=‖Vq-a‖2= (11) 在大多數(shù)情況下,高斯核函數(shù)訓(xùn)練出的超球體邊界對(duì)樣本的描述效果較好[12],因此本文選用高斯核函數(shù)KG(Si,Sj)=exp(-‖Si-Sj‖2/σ2),(10)式和(11)式就變?yōu)?/p> (12) (13) 2.2.3SVDD模型參數(shù)調(diào)節(jié) 在SVDD入侵檢測(cè)模型中,有2個(gè)重要的參數(shù),一個(gè)是懲罰參數(shù)C,另一個(gè)是高斯核寬度因子σ,它們的取值在一定程度上會(huì)影響SVDD檢測(cè)的準(zhǔn)確性,下面討論參數(shù)取值對(duì)超球體異常檢測(cè)邊界的影響。 1)懲罰參數(shù)C。 “供給側(cè)結(jié)構(gòu)性改革”由中央財(cái)經(jīng)領(lǐng)導(dǎo)小組于2015年11月提出,其含義為“用改革的辦法推進(jìn)結(jié)構(gòu)調(diào)整,減少無效和低端供給,擴(kuò)大有效和中高端供給,增強(qiáng)供給結(jié)構(gòu)對(duì)需求變化的適應(yīng)性和靈活性,提高全要素生產(chǎn)率,使供給體系更好適應(yīng)需求結(jié)構(gòu)變化?!雹?/p> 2)高斯核寬度因子σ。 當(dāng)σ2→0時(shí),KG(Si,Sj)→0,i≠j,(12)式變?yōu)長(zhǎng)=1-∑iα2i。當(dāng)αi=1/N時(shí),L的值最大。這時(shí)所有的特征樣本都是支持向量,導(dǎo)致該檢測(cè)系統(tǒng)的靈敏度較高,使虛警率升高,造成過擬合現(xiàn)象。過擬合是指某檢測(cè)模型能在訓(xùn)練集上比其他模型有較好的檢測(cè)性能,但是在訓(xùn)練集之外的數(shù)據(jù)集上檢測(cè)性能較差的情形。 當(dāng)σ2→時(shí),KG(Si,Sj)=1,(12)式為當(dāng)僅有一個(gè)αi=1而其他所有的αi=0時(shí)L的值最大,其值為0。這時(shí)只有一個(gè)特征樣本是支持向量,會(huì)造成欠擬合現(xiàn)象,同樣導(dǎo)致虛警率提升,系統(tǒng)檢測(cè)性能下降。欠擬合表示某一檢測(cè)模型在訓(xùn)練集上的性能較差,并且在訓(xùn)練集之外的數(shù)據(jù)集上檢測(cè)性能也較差的情形。 然而,在過擬合和欠擬合之間必有一段σ的取值使得SVDD模型擬合效果較好,此時(shí)的虛警率較低,可利用一段靜默數(shù)據(jù)作為測(cè)試集來找到這段σ,設(shè)為[σmin,σmax]。為了防止邊緣取值使得SVDD模型仍出現(xiàn)一定過擬合或欠擬合,取最優(yōu)σopt為這段取值的中間值,即σopt=(σmin+σmax)/2。 本文以一條鏈路的方差和均值為例,展示核懲罰參數(shù)C和寬度因子σ對(duì)邊界的影響,如圖4。圖4的檢測(cè)邊界為高維空間超球體邊界在2維平面上的投影,當(dāng)懲罰因子C增大時(shí),被排除在邊界外的樣本點(diǎn)減少,相應(yīng)地判決邊界也有所變化。但當(dāng)懲罰因子C大于一定值時(shí),懲罰因子對(duì)超球體邊界的影響較小,圖4中,當(dāng)C=0.4時(shí)與C=0.8時(shí)超球體邊界幾乎相同。而當(dāng)核寬度因子σ增大時(shí),支持向量個(gè)數(shù)減少,判決邊界也有所增大。 在該階段,首先實(shí)時(shí)采集每條鏈路的接收信號(hào)強(qiáng)度讀數(shù),并進(jìn)行與離線訓(xùn)練階段相同的特征提取步驟,構(gòu)建出ton時(shí)刻的特征向量Ston=[ston,1,…,ston,j,…,ston,k]。然后,利用訓(xùn)練出的SVDD模型判斷Ston到球中心的距離a=∑iαiSi不小于R,進(jìn)而感知確定ton時(shí)刻環(huán)境中是否有人入侵,表示為 mton=‖Ston-a‖2/R2 (14) (14)式中,mton表示在ton時(shí)刻環(huán)境的異常程度,當(dāng)mton小于1時(shí),則認(rèn)為當(dāng)前感知區(qū)域內(nèi)沒有人員活動(dòng)。否則,則說明當(dāng)前感知環(huán)境中有人活動(dòng)。 場(chǎng)景1中布置有4個(gè)AP和一個(gè)MP,具體布置位置如圖5a;場(chǎng)景2中布置有3個(gè)AP和2個(gè)MP,如圖5b。首先,進(jìn)行25 min靜默數(shù)據(jù)的采集,利用滑動(dòng)窗函數(shù)提取相應(yīng)的信號(hào)特征,滑動(dòng)窗長(zhǎng)度值L=20;然后,利用2.2節(jié)的方法訓(xùn)練出SVDD入侵檢測(cè)模型;最后,測(cè)試人員在感知區(qū)域內(nèi)任意位置運(yùn)動(dòng)或走出感知區(qū)域,進(jìn)行室內(nèi)入侵檢測(cè)。 為了驗(yàn)證本文提出的被動(dòng)檢測(cè)算法的可靠性和有效性,通常使用虛警率(false positive, FP)、漏檢率(false negative, FN)和F1-measure值作為評(píng)價(jià)指標(biāo)[1]。虛警率表示感知區(qū)域內(nèi)無人員活動(dòng),但是系統(tǒng)卻發(fā)出告警的概率。漏檢率表示感知區(qū)域內(nèi)有人員活動(dòng),但是系統(tǒng)卻沒有檢測(cè)出來的概率,而正檢率(true positive,TP)則與FN相反,其表示感知區(qū)域內(nèi)有人員活動(dòng),系統(tǒng)正確檢測(cè)的概率。F1-measure值則是一種綜合評(píng)價(jià)指標(biāo),用來衡量檢測(cè)算法的有效性,其值為查準(zhǔn)率(precision, P)和查全率(recall, R)的調(diào)和平均,即F1-measure=2PR/(P+R),其中,查準(zhǔn)率P=TP/(P+FP),查全率R=TP/(TP+FN)。 本文選取隨機(jī)場(chǎng)景下30條傳播路徑不同的鏈路,采集靜默數(shù)據(jù)和有人員活動(dòng)數(shù)據(jù),計(jì)算每個(gè)特征的平均貢獻(xiàn)度,結(jié)果如圖6。根據(jù)平均貢獻(xiàn)度值的大小對(duì)特征重要性進(jìn)行排序,得到:極差值>方差>平均FFT>均值>最小值>最大值>中值。下面討論特征數(shù)p對(duì)檢測(cè)性能的影響。 從圖7可以看出,隨著特征數(shù)p的增加,虛警率FP和漏檢率FN逐漸降低,F(xiàn)1-measure逐漸上升;而當(dāng)特征數(shù)p≥5時(shí),虛警率FP和漏檢率FN達(dá)到最低并趨于穩(wěn)定,同時(shí)F1-measure達(dá)到最大并逐漸穩(wěn)定。根據(jù)2.1.2節(jié)所述方法,利用虛警率FP可選擇popt=5,此時(shí)F1-measure也能達(dá)到最高值。 為確定懲罰因子C與高斯核寬度因子σ對(duì)入侵檢測(cè)系統(tǒng)檢測(cè)性能的影響,本文計(jì)算當(dāng)C=2x,x∈{-10,-9.95,…,0} ,σ=2y,y∈{-2,-1.95,…,8}時(shí),2種實(shí)驗(yàn)場(chǎng)景中的虛警率FP,漏警率FN,以及F1-measure值。計(jì)算結(jié)果分別如圖8和圖9。 從圖8和圖9可知,當(dāng)懲罰因子C較小時(shí)(<2-9),L1正則化項(xiàng)對(duì)離群點(diǎn)的抑制程度較低,過多的離群點(diǎn)在超球體外部,使得超球體半徑R過小,從而導(dǎo)致虛警率較高,但隨著C逐漸增加,虛警率逐漸降低,F(xiàn)1-measure值也逐漸升高??梢钥闯鯟>2-7后,對(duì)系統(tǒng)的檢測(cè)率影響較小,但為了防止在實(shí)際部署時(shí),訓(xùn)練數(shù)據(jù)中出現(xiàn)過多的異常點(diǎn)從而導(dǎo)致超球體半徑過大,漏檢率過高的問題,C值不宜較大,故取C=2-4。當(dāng)高斯核寬度因子σ較小時(shí)(<1),系統(tǒng)會(huì)因?yàn)镾VDD模型過擬合而導(dǎo)致虛警率很高,隨著σ增大,虛警率逐漸降低,而當(dāng)σ很大時(shí)(>26),系統(tǒng)會(huì)因?yàn)镾VDD模型嚴(yán)重的欠擬合而導(dǎo)致虛警率較高。綜合評(píng)估指標(biāo)F1-measure作為綜合的評(píng)估指標(biāo)整體呈現(xiàn)出先升后降的趨勢(shì),與2.2.3節(jié)的結(jié)論相符。根據(jù)2.2.3節(jié)所述方法,只需用一組靜默數(shù)據(jù)作為測(cè)試集來計(jì)算虛警率,然后可得到最優(yōu)σ。例如,在場(chǎng)景1中,當(dāng)σ處于[20.3,25.05]時(shí),虛警率較平穩(wěn)且小于0.1,取該段的中值也就是σopt=(20.3+25.05)/2≈17.18作為場(chǎng)景1環(huán)境下σ的最優(yōu)取值。 在本節(jié)中,將本文中所提出的方法與其他主要基于RSSI的被動(dòng)入侵檢測(cè)技術(shù),如MA,MV以及Ichnaea進(jìn)行性能對(duì)比。 首先,分析不同場(chǎng)景下滑動(dòng)窗長(zhǎng)度對(duì)不同檢測(cè)技術(shù)F1-measure值的影響,結(jié)果如圖10。經(jīng)分析可得F1-measure值隨著滑動(dòng)窗長(zhǎng)度的增加呈現(xiàn)出先上升后下降的趨勢(shì),這是由于當(dāng)滑動(dòng)窗較小時(shí),每個(gè)窗內(nèi)數(shù)據(jù)量較少,不能有效地表征信號(hào)波動(dòng)特性,因此檢測(cè)靈敏度較低。而當(dāng)窗較大時(shí),信號(hào)抖動(dòng)特性在一定程度上被忽略,導(dǎo)致檢測(cè)性下降,并且檢測(cè)時(shí)延也較長(zhǎng),因此滑動(dòng)窗長(zhǎng)度不宜過大,在本文中滑動(dòng)窗長(zhǎng)度L=20。與其他檢測(cè)技術(shù)相比,本文所提出的方法在不同滑動(dòng)窗長(zhǎng)度下均有較優(yōu)的檢測(cè)性能,這是由于使用的最優(yōu)特征組合,能有效地刻畫環(huán)境中不同的狀態(tài),增強(qiáng)系統(tǒng)的穩(wěn)定性緣故,因此滑動(dòng)窗長(zhǎng)度對(duì)其檢測(cè)性能的影響較小。 其次,對(duì)比不同檢測(cè)技術(shù)的檢測(cè)性能,表1為性能對(duì)比結(jié)果。分析表1可知,與現(xiàn)有的基于統(tǒng)計(jì)特性的算法相比,本文所提算法在虛警率和漏檢率上均有一定程度的降低,而且本文算法F1-measure值在2種場(chǎng)景下分別達(dá)到了0.960和0.945,優(yōu)于經(jīng)典的Ichnaea系統(tǒng)。 表1 與現(xiàn)有技術(shù)的檢測(cè)性能對(duì)比Tab.1 Comparison of detection performance with existing technologies 為了在真實(shí)無線環(huán)境中實(shí)現(xiàn)準(zhǔn)確的人員活動(dòng)檢測(cè),本文提出一種基于SVDD的WLAN室內(nèi)被動(dòng)入侵檢測(cè)算法,該算法利用A-distance值評(píng)估7種特征對(duì)于正確區(qū)分正常狀態(tài)和異常狀態(tài)的平均貢獻(xiàn)度,并根據(jù)平均貢獻(xiàn)度進(jìn)行特征重要性排序,選擇多個(gè)特征有效地區(qū)分不同感知環(huán)境中的正常狀態(tài)和異常狀態(tài),顯著提高檢測(cè)的準(zhǔn)確率。此外,本文算法只需采集正常狀態(tài)的數(shù)據(jù)構(gòu)建SVDD被動(dòng)入侵檢測(cè)模型,就能有效降低訓(xùn)練階段的開銷,利用L1正則化抑制離群點(diǎn)的影響,具有較好的抗噪性。實(shí)驗(yàn)結(jié)果表明,本文提出的方法在2種不同的室內(nèi)場(chǎng)景下虛警率和漏檢率分別低于5%和9%,同時(shí)F1-measure值高于94%,檢測(cè)性能比基于統(tǒng)計(jì)特性的算法更優(yōu)。2.3 在線監(jiān)測(cè)階段
3 實(shí)驗(yàn)結(jié)果
3.1 測(cè)試環(huán)境
3.2 評(píng)價(jià)指標(biāo)
3.3 隨機(jī)場(chǎng)景下特征的平均貢獻(xiàn)度
3.4 懲罰因子C與高斯核寬度因子σ對(duì)檢測(cè)性能的影響
3.5 性能對(duì)比
4 結(jié)束語