李竟銘 趙明杰 翟 會(huì) 丁國(guó)如 張小飛
(1.南京航空航天大學(xué)電子信息工程學(xué)院,南京,210016; 2.浙江理工大學(xué)信息學(xué)院,杭州,310018; 3.陸軍工程大學(xué)通信工程學(xué)院,南京,210007)
考試是教學(xué)活動(dòng)的重要環(huán)節(jié),是選拔優(yōu)秀人才、檢驗(yàn)教學(xué)質(zhì)量和考察學(xué)生理解程度的主要手段。近年來,為彰顯國(guó)家對(duì)考試公平性的重視,考試作弊首次納入刑法??荚囎鞅姿斐傻奈:O大,它不僅破壞了考試公平,侵犯了其他學(xué)生的利益,損害了學(xué)校的聲譽(yù),更降低了高等教育的公信度,因此成為高校教學(xué)管理研究的熱點(diǎn)問題。隨著無線電通信的廣泛應(yīng)用,考試作弊的手段也趨于隱性化、智能化,作弊者通常使用磁共振耳機(jī)、骨感耳機(jī)和針孔攝像頭等先進(jìn)的作弊器材與外界進(jìn)行試題及答案的傳遞。由于便于隱藏、不需要人為取出且具有強(qiáng)大的收發(fā)功能,無線電作弊設(shè)備已成為大型考試中的作弊利器。目前常見的用來考試防作弊的措施大致有以下幾種:(1)人臉識(shí)別指紋驗(yàn)證;(2)使用金屬探測(cè)儀進(jìn)行安檢;(3)使用屏蔽設(shè)備;(4)視頻監(jiān)控等。
室內(nèi)定位是一種對(duì)室內(nèi)環(huán)境的位置估計(jì)技術(shù)[1,2]。由于受到復(fù)雜的室內(nèi)電波傳播環(huán)境、室內(nèi)建筑布局和人員移動(dòng)性等因素的影響,室內(nèi)信號(hào)衰落模型無法準(zhǔn)確建立,因此其發(fā)展遠(yuǎn)滯后于室外定位技術(shù)。通常室內(nèi)定位技術(shù)通過采集收發(fā)機(jī)之間無線鏈路的到達(dá)時(shí)間 (Time of arrival, TOA)、到達(dá)時(shí)間差(Time difference of arrival, TDOA)、到達(dá)角 (Angle of arrival, AOA)[2]和接收信號(hào)強(qiáng)度 (Receive signal strength indicator, RSSI)[3]來估計(jì)收發(fā)機(jī)之間的距離,以此來構(gòu)建位置估計(jì)模型,從而獲取終端的位置信息。但是基于TOA,TDOA和AOA的定位技術(shù)需要進(jìn)行相對(duì)時(shí)間和角度的測(cè)量,這大大增加了硬件成本,并不適用于廣泛普及,因此本文采用RSSI來構(gòu)建位置估計(jì)模型。
指紋識(shí)別[4,5]方法專注于有效地比較實(shí)時(shí)的頻譜掃描信息與室內(nèi)預(yù)先記錄的掃描數(shù)據(jù)庫(kù),因此對(duì)于本地信號(hào)干擾更為穩(wěn)健。文獻(xiàn)[6]采用最近鄰插值法(K-nearest neighbor,KNN)方法,從指紋數(shù)據(jù)庫(kù)中查詢與其最相似的K個(gè)位置數(shù)據(jù),對(duì)其位置進(jìn)行平均。文獻(xiàn)[7]對(duì)其進(jìn)行了改進(jìn),使用了加權(quán)KNN方法。文獻(xiàn)[8]中,隨機(jī)森林算法也得到了很好的定位精度。然而,傳統(tǒng)的機(jī)器學(xué)習(xí)方法對(duì)數(shù)據(jù)敏感度較高,往往需要對(duì)數(shù)據(jù)進(jìn)行歸一化、濾波等預(yù)處理,且容易過擬合導(dǎo)致泛化能力較弱,隨時(shí)間推移網(wǎng)絡(luò)的預(yù)測(cè)性能會(huì)受到影響。但隨著定位精度的需求越來越高,數(shù)據(jù)量也隨之增大,深度學(xué)習(xí)是一個(gè)很有前途的解決方案[9]。深度學(xué)習(xí)[10]可以直接學(xué)習(xí)提取數(shù)據(jù)隱含的結(jié)構(gòu)特征而不需要預(yù)處理,并且可以有效避免過擬合等問題,從而提高網(wǎng)絡(luò)泛化能力。因此,使用深度學(xué)習(xí)與自動(dòng)編碼器,將數(shù)據(jù)進(jìn)行特征提取和降噪處理。文獻(xiàn)[11]中,就利用深度學(xué)習(xí)算法通過WiFi實(shí)現(xiàn)了室內(nèi)定位;文獻(xiàn)[12]提出了一種對(duì)信道狀態(tài)信息(Channel state information,CSI)進(jìn)行深度學(xué)習(xí)的室內(nèi)指紋系統(tǒng),驗(yàn)證了深度學(xué)習(xí)在室內(nèi)定位領(lǐng)域的廣闊前景。
為了構(gòu)建智慧考場(chǎng),本文在室內(nèi)定位和頻譜監(jiān)測(cè)技術(shù)的基礎(chǔ)上,設(shè)計(jì)了基于深度學(xué)習(xí)的無線電作弊信號(hào)發(fā)現(xiàn)與定位系統(tǒng),系統(tǒng)實(shí)現(xiàn)了無線電作弊設(shè)備判決、定位、告警以及移動(dòng)終端實(shí)時(shí)顯示等功能。本文的主要貢獻(xiàn)為:(1)構(gòu)建了基于通用軟件無線電外設(shè)(Universal software radio peripheral,USRP)平臺(tái)的無線電作弊信號(hào)發(fā)現(xiàn)與定位系統(tǒng),實(shí)現(xiàn)了告警、移動(dòng)終端實(shí)時(shí)顯示等功能; (2)設(shè)計(jì)了基于深度學(xué)習(xí)的定位算法,實(shí)現(xiàn)了對(duì)電磁頻譜數(shù)據(jù)的訓(xùn)練和學(xué)習(xí),使平均定位精度達(dá)到0.178 8 m。
為使考場(chǎng)工作人員方便、直觀、遠(yuǎn)程和實(shí)時(shí)地了解所監(jiān)測(cè)環(huán)境的安全情況,無線電作弊信號(hào)發(fā)現(xiàn)與定位系統(tǒng)利用物聯(lián)網(wǎng)的思想,在互聯(lián)網(wǎng)基礎(chǔ)上,將網(wǎng)絡(luò)延伸到現(xiàn)實(shí)環(huán)境中,進(jìn)行頻譜和視頻信息的采集與共享,實(shí)現(xiàn)對(duì)頻譜監(jiān)測(cè)信息的呈現(xiàn),并且在網(wǎng)頁中為用戶提供了無線電作弊信號(hào)的定位與告警服務(wù),并結(jié)合視頻信息混合判決。 如圖1所示,整個(gè)系統(tǒng)架構(gòu)包含電磁頻譜數(shù)據(jù)采集、數(shù)據(jù)處理中心和網(wǎng)頁端實(shí)時(shí)顯示3個(gè)部分,分別完成對(duì)應(yīng)的工作。
圖1 系統(tǒng)構(gòu)架圖Fig.1 System architecture diagram
為了解當(dāng)前檢測(cè)的室內(nèi)環(huán)境的電磁輻射情況,利用頻譜監(jiān)測(cè)設(shè)備USRP和4根天線測(cè)量并收集當(dāng)前環(huán)境的電磁能量值??紤]到無線電作弊信號(hào)工作周期及工作頻段,將采樣率設(shè)為1 MHz,采樣點(diǎn)數(shù)5 000,監(jiān)測(cè)中心頻率設(shè)為2.09 MHz。為了有助于數(shù)據(jù)的訓(xùn)練和學(xué)習(xí),將室內(nèi)環(huán)境進(jìn)行網(wǎng)格化分割,網(wǎng)格大小為20 cm×20 cm,取7行20列共計(jì)140個(gè)測(cè)試點(diǎn),開啟發(fā)射源,反復(fù)在這140個(gè)測(cè)試點(diǎn)上進(jìn)行測(cè)試,采集4根天線測(cè)得的頻譜數(shù)據(jù)。
系統(tǒng)采樣頻譜圖如圖2所示,圖中橫坐標(biāo)表示頻率,縱坐標(biāo)表示幅度。4幅圖分別對(duì)應(yīng)4根天線采集到的數(shù)據(jù)。當(dāng)頻譜圖出現(xiàn)如圖3所示的情況時(shí),說明當(dāng)前檢測(cè)環(huán)境有信號(hào)發(fā)出,即有存在無線電作弊信號(hào)的可能。
圖2 系統(tǒng)時(shí)域采樣結(jié)果Fig.2 System sampling results on time domain
圖3 作弊信號(hào)的發(fā)現(xiàn)Fig.3 Discovery of cheating signal
同時(shí)在監(jiān)測(cè)環(huán)境中布設(shè)視頻監(jiān)控設(shè)備,用于發(fā)現(xiàn)無線電作弊信號(hào)時(shí),可以實(shí)時(shí)傳輸視頻數(shù)據(jù)到電腦上,便于監(jiān)考人員查看該考生有無作弊行為并留存證據(jù)。
將采集到的數(shù)據(jù)進(jìn)行存儲(chǔ)和集成,為使測(cè)得的樣本數(shù)據(jù)更加精確,對(duì)樣本數(shù)據(jù)利用窄帶濾波器的方法,有效提高了信噪比。為了對(duì)無線電作弊設(shè)備進(jìn)行精確定位,應(yīng)用基于深度學(xué)習(xí)的室內(nèi)定位算法,繼而利用樣本數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,得到模型后便可通過數(shù)值匹配的方法確定小范圍的精確位置。最后,對(duì)定位性能進(jìn)行評(píng)估。本文將精確度和精密度作為評(píng)估標(biāo)準(zhǔn),即精確度越高,定位效果越好,同等精確度時(shí),精密度越高越好。
(1)精確度
精確度是定位系統(tǒng)的關(guān)鍵評(píng)估指標(biāo),通常用平均定位精度來衡量,即估計(jì)位置和實(shí)際位置的均方根誤差(Root mean squared error, RMSE),即
(1)
(2)精密度
與精確度不同,精密度考慮的是系統(tǒng)所獲取的精確度的分布概率,是對(duì)精確度魯棒性的度量。一般情況下,精密度可由幾何精度因子(Geometric dilution of precision, GDOP)或者累計(jì)概率分布(Cumulative probability functions, CPF)表示。本文使用累計(jì)概率分布表示精密度,在同等精確度時(shí),當(dāng)定位精確度在0.2 m范圍內(nèi),精密度越高越好。
當(dāng)發(fā)現(xiàn)異常信號(hào)信息時(shí),軟件界面和網(wǎng)頁終端適時(shí)發(fā)出告警,上報(bào)給終端用戶,終端用戶可立刻通過查看考場(chǎng)監(jiān)控視頻,來綜合判決當(dāng)前環(huán)境和告警位置上有無作弊的隱患,并且通過視頻回放功能留存作弊證據(jù)。
深度學(xué)習(xí)基本模型類似于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的3層結(jié)構(gòu)[13],是由輸入層、隱藏層和輸出層組成的多層網(wǎng)絡(luò)。深度學(xué)習(xí)通過逐層訓(xùn)練方法使得梯度能夠有效傳播,因此深度神經(jīng)網(wǎng)絡(luò)通常含有多隱藏層,提高了網(wǎng)絡(luò)表達(dá)能力。如圖4所示,本系統(tǒng)所采用模型主要分為以下3個(gè)部分:自編碼器、多層感知機(jī)、深度學(xué)習(xí)回歸預(yù)測(cè)模型。
圖4 系統(tǒng)模型圖Fig.4 System model diagram
自編碼器(AutoEncoder)[14]可以用于壓縮數(shù)據(jù),提取特征或者降噪。利用深度學(xué)習(xí)的基本思想和網(wǎng)絡(luò)的特性直接構(gòu)建一個(gè)能夠表達(dá)原始數(shù)據(jù)的網(wǎng)絡(luò)結(jié)構(gòu),通過設(shè)定輸入輸出近似相等,學(xué)習(xí)網(wǎng)絡(luò)的參數(shù)權(quán)值,進(jìn)而構(gòu)建自編碼模型。文獻(xiàn)[15]中提出了一種新穎的基于去噪自編碼器的室內(nèi)定位方法,驗(yàn)證了自編碼器可以提高定位精度。
多層感知機(jī)(Multilayer perceptron, MLP),又稱深度前反饋網(wǎng)絡(luò),是典型的深度學(xué)習(xí)模型。MLP具有多層節(jié)點(diǎn),其中每層與下一層完全連接,隱藏層的每個(gè)節(jié)點(diǎn)都使用非線性激活函數(shù)進(jìn)行操作,并且利用反向傳播模型訓(xùn)練網(wǎng)絡(luò)。
(1)激活函數(shù)
Sigmoid函數(shù):即S型函數(shù),在神經(jīng)網(wǎng)絡(luò)中被廣泛采用。Sigmoid函數(shù)可以將實(shí)數(shù)壓縮到 [0,1]區(qū)間,具有強(qiáng)大的解釋力,但在神經(jīng)元趨于0或者1的時(shí)候會(huì)產(chǎn)生飽和導(dǎo)致梯度彌散,因此權(quán)值需要小心初始化,其公式為
(2)
Tanh函數(shù):該函數(shù)擁有良好的數(shù)據(jù)控制力,其將實(shí)數(shù)映射到 [-1,1]區(qū)間,但依舊存在飽和問題。Tanh函數(shù)公式為
(3)
Relu函數(shù):是線性修正單元,當(dāng)x<0時(shí)為0,當(dāng)x>0時(shí)斜率為1。Relu收斂速度更快,但是Relu也更加脆弱,大的梯度流可能導(dǎo)致神經(jīng)元永久失效,選擇合適的學(xué)習(xí)率或者層間批正則化可以避免這種情況的出現(xiàn)。其公式為
f(x)=max(0,x)
(4)
(2)反向傳播算法
訓(xùn)練樣本集為{(x(1),y(1)),…,(x(m),y(m))},其中m為樣本的個(gè)數(shù),用該樣本集訓(xùn)練神經(jīng)網(wǎng)絡(luò)。實(shí)驗(yàn)中的損失函數(shù)為
(5)
梯度下降法的關(guān)鍵步驟是計(jì)算偏導(dǎo),對(duì)于網(wǎng)絡(luò)的權(quán)值W和偏置項(xiàng)b,其迭代公式分別為
(6)
(7)
其中α為學(xué)習(xí)速率。
采用室內(nèi)指紋定位方案只能對(duì)離散指紋點(diǎn)進(jìn)行預(yù)測(cè)估計(jì),為了實(shí)現(xiàn)更高精度的連續(xù)預(yù)測(cè)定位,利用深度學(xué)習(xí)搭建一個(gè)回歸預(yù)測(cè)模型。該線性回歸模型可表示為
f(x)=wTx+b
(8)
式中:x表示輸入,w表示權(quán)重,b表示偏差。w和b訓(xùn)練成最小化的目標(biāo)函數(shù),該模型首先處理輸入數(shù)據(jù),然后執(zhí)行預(yù)訓(xùn)練;當(dāng)?shù)竭_(dá)輸出層時(shí),模型會(huì)反向傳播;算法達(dá)到收斂時(shí)停止。文獻(xiàn)[16]采用了回歸預(yù)測(cè)模型來對(duì)基因數(shù)據(jù)進(jìn)行學(xué)習(xí)。
圖5 深度學(xué)習(xí)分類仿真結(jié)果Fig.5 Simulation results of deep learning classification
室內(nèi)定位場(chǎng)景通常采取基于指紋的定位方式。對(duì)室內(nèi)環(huán)境的140個(gè)指紋點(diǎn)進(jìn)行采集學(xué)習(xí),從而估計(jì)出新的定位點(diǎn)?;谥讣y的定位是一個(gè)多分類問題,傳統(tǒng)機(jī)器學(xué)習(xí)對(duì)于二分類問題可以取得較好的效果,但是隨著多分類問題數(shù)據(jù)維數(shù)的增高,機(jī)器學(xué)習(xí)問題變得相當(dāng)困難。為了更好的泛化,機(jī)器學(xué)習(xí)方法往往會(huì)提出很強(qiáng)的針對(duì)特定任務(wù)的假設(shè)。同時(shí),S函數(shù)的飽和特性使隱含層數(shù)受到限制,因此導(dǎo)致神經(jīng)網(wǎng)絡(luò)表達(dá)能力的不足。而深度學(xué)習(xí)的核心思想是假設(shè)數(shù)據(jù)由因素或特征組合,這些通用假設(shè)提高了深度學(xué)習(xí)算法。深度學(xué)習(xí)旨在克服機(jī)器學(xué)習(xí)中的‘維數(shù)災(zāi)難’‘梯度彌散’等一系列困難,從而在多分類問題中取得更好的效果。
針對(duì)室內(nèi)定位場(chǎng)景的多分類任務(wù),本文采用深度學(xué)習(xí)框架搭建一個(gè)具有五隱含層的深度神經(jīng)網(wǎng)絡(luò)分類器。為了防止梯度彌散,采用Relu作為隱含層激活函數(shù),并利用Xavier初始化權(quán)重。對(duì)測(cè)試集分類效果進(jìn)行仿真驗(yàn)證的結(jié)果如圖5所示,其中實(shí)心圓為成功定位點(diǎn),方框?yàn)閷?shí)際測(cè)試點(diǎn),三角為錯(cuò)誤預(yù)測(cè)定位點(diǎn)。測(cè)試集樣本數(shù)量為100,仿真結(jié)果顯示定位精度可以達(dá)到90%的準(zhǔn)確率。
(1)單隱含層和三隱含層對(duì)比
兩個(gè)網(wǎng)絡(luò)均不進(jìn)行AutoEncoder且隱含層均采用Relu作為激活函數(shù),對(duì)測(cè)試集進(jìn)行回歸擬合來預(yù)測(cè)坐標(biāo)點(diǎn)的結(jié)果如表1所示。從表中可以看出多隱含層預(yù)測(cè)效果明顯優(yōu)于單層,但是在定位誤差上依舊較大。
表1 單隱含層和三隱含層對(duì)比結(jié)果
表2 AutoEncoder定位結(jié)果對(duì)比
表3 不同隱含層激活函數(shù)定位精度對(duì)比
(2)AutoEncoder
從數(shù)據(jù)分布可以看出,為了提高定位精度有必要將數(shù)據(jù)進(jìn)行特征提取并降噪處理,為此在將數(shù)據(jù)輸入深度學(xué)習(xí)回歸網(wǎng)絡(luò)之前先進(jìn)行自編碼處理,用于提取數(shù)據(jù)的高維特征并減小噪聲影響。表2列出了采用Tanh激活函數(shù)的三隱含層深度回歸預(yù)測(cè)網(wǎng)絡(luò)是否進(jìn)行AutoEncoder的定位精度的對(duì)比結(jié)果。
(3)不同隱含層激活函數(shù)對(duì)比
隱含層激活函數(shù)的選擇也會(huì)在很大程度上響應(yīng)定位的精度。在分類任務(wù)中表現(xiàn)良好的Relu函數(shù)由于其對(duì)數(shù)據(jù)的控制能力較弱,在數(shù)據(jù)分布不均勻的情況下效果并不如Sigmoid等函數(shù)好。由于Tanh相當(dāng)于Sigmoid函數(shù)的擴(kuò)展形式,其中心是關(guān)于零點(diǎn)對(duì)稱的,所以Tanh往往能取得比Sigmoid更好的效果,具體結(jié)果如表3所示。
圖6 仿真結(jié)果Fig.6 Simulation result
根據(jù)實(shí)驗(yàn)結(jié)果,采用三隱藏層的深度學(xué)習(xí)回歸網(wǎng)絡(luò)對(duì)室內(nèi)定位場(chǎng)景進(jìn)行預(yù)測(cè)。將訓(xùn)練參數(shù)保存后利用實(shí)測(cè)數(shù)據(jù)對(duì)實(shí)驗(yàn)環(huán)境定位效果進(jìn)行仿真驗(yàn)證,結(jié)果如圖6所示。由圖6可知,通過本系統(tǒng),利用三隱藏層的深度學(xué)習(xí)回歸網(wǎng)絡(luò)對(duì)室內(nèi)無線電作弊信號(hào)進(jìn)行定位,其定位的精確度可達(dá)到0.170 07 m,符合考場(chǎng)實(shí)際場(chǎng)景對(duì)定位精度的需求。
本系統(tǒng)以無線電作弊信號(hào)的發(fā)現(xiàn)與定位為出發(fā)點(diǎn),通過部署USRP頻譜監(jiān)測(cè)設(shè)備對(duì)室內(nèi)環(huán)境中電磁信號(hào)進(jìn)行檢測(cè),了解目標(biāo)區(qū)域的電磁安全情況。通過部署視頻監(jiān)控設(shè)備對(duì)室內(nèi)環(huán)境進(jìn)行實(shí)時(shí)監(jiān)控,并將采集的實(shí)時(shí)數(shù)據(jù)收集起來,聯(lián)網(wǎng)進(jìn)行處理,運(yùn)用深度學(xué)習(xí)算法將平均定位精度提高到0.170 07 m,系統(tǒng)融合頻譜監(jiān)測(cè)設(shè)備結(jié)果與視頻監(jiān)控設(shè)備結(jié)果,混合判決是否存在作弊現(xiàn)象。最后結(jié)果以網(wǎng)頁及APP形式直觀地展現(xiàn)出來,可使監(jiān)考和巡考人員可以方便、直觀、遠(yuǎn)程和實(shí)時(shí)地了解所監(jiān)測(cè)環(huán)境的安全情況。