黃廷禾 劉夢(mèng)瑤 錢澤昊
(上海立信會(huì)計(jì)金融學(xué)院 上海 201209)
(1)研究背景。近年來,隨著教育改革的推進(jìn),對(duì)學(xué)生的考核日益嚴(yán)格,而考試是評(píng)估學(xué)生知識(shí)掌握程度及教師教學(xué)效果的重要指標(biāo),目前大部分最終考試方式均為傳統(tǒng)的筆試,盡管其考試方式組織實(shí)施簡(jiǎn)單,但存在監(jiān)考力量不足、監(jiān)考任務(wù)繁重、作弊難取證等不足。針對(duì)以上問題,本項(xiàng)目提出一種基于機(jī)器學(xué)習(xí)的智能無人監(jiān)考考試系統(tǒng),其核心基于用于識(shí)別圖像的YOLO模型算法與用于異常行為檢測(cè)的圖像學(xué)算法,對(duì)考生行為及面部等因素進(jìn)行分析,進(jìn)而實(shí)現(xiàn)自動(dòng)化的監(jiān)測(cè)和預(yù)警考生行為,減少了監(jiān)考所需人力的同時(shí)還提升了監(jiān)考的效果,有利于推進(jìn)學(xué)校標(biāo)準(zhǔn)化、智能化考場(chǎng)建設(shè),為監(jiān)考人員減負(fù)的同時(shí)提升監(jiān)考效果,最大程度上保證考試的真實(shí)性。
(2)研究現(xiàn)狀。近年來,隨著教育改革的推進(jìn),對(duì)學(xué)生的考核日益嚴(yán)格,考試科目與次數(shù)都在增加,然而傳統(tǒng)監(jiān)考模式卻已無法滿足學(xué)校對(duì)于監(jiān)考的需求。若采用人工監(jiān)考,需要多個(gè)監(jiān)考老師分區(qū)域的巡邏才能覆蓋整體考場(chǎng),需要的人力更多;且由于考試作弊的行為經(jīng)常發(fā)生在很短的時(shí)間區(qū)間內(nèi),單純以人的注意力很難保證能夠及時(shí)發(fā)現(xiàn)作弊行為;有些作弊行為停止后很難進(jìn)行取證。若采用無人監(jiān)考,存在難以保證考試公平性等問題。因此,研發(fā)一種具有智能化功能的監(jiān)考系統(tǒng)實(shí)乃當(dāng)下所需。
VASM是由美國(guó)國(guó)防高級(jí)研究項(xiàng)目署于1997年設(shè)立的,以卡內(nèi)基梅隆大學(xué)為首,SARNOFF戴維研究中心、麻省理工學(xué)院等美國(guó)十幾所高等院校和研究機(jī)構(gòu)參與的重大視頻監(jiān)控項(xiàng)目。項(xiàng)目研究利用視頻理解、網(wǎng)絡(luò)通信、多種傳感器融合等技術(shù)實(shí)現(xiàn)對(duì)戰(zhàn)場(chǎng)等危險(xiǎn)場(chǎng)景或者監(jiān)控費(fèi)用昂貴的民用場(chǎng)景的自動(dòng)視頻監(jiān)控理解。VSAM 采用分布式主動(dòng)視頻傳感器,包含了許多先進(jìn)的實(shí)時(shí)視頻監(jiān)控技術(shù),如基于靜止與運(yùn)動(dòng)攝像機(jī)的實(shí)時(shí)運(yùn)動(dòng)物體檢測(cè)與跟蹤等。Object Video VEW 系統(tǒng)是智能視頻監(jiān)控技術(shù)領(lǐng)域占據(jù)世界公認(rèn)的領(lǐng)頭首位置的Object Video公司研發(fā)推出的。該系統(tǒng)通過為用戶提供場(chǎng)景過濾功能和Hi-Res功能,來拓寬視頻監(jiān)控的范圍,能夠處理遠(yuǎn)距離的可疑行為,且對(duì)復(fù)雜的戶外環(huán)境有較強(qiáng)的魯棒性,能夠很好的滿足用戶的需求,該產(chǎn)品的配套離線產(chǎn)品Object Video Forensics,通過提高對(duì)歷史記錄的分析速度,在一定程度上改善了Object Video VEW系統(tǒng)的實(shí)時(shí)分析能力。
國(guó)內(nèi)在這方面的研究雖然起步較晚,但目前,國(guó)內(nèi)在計(jì)算機(jī)視覺技術(shù)及視頻處理技術(shù)方面已取得長(zhǎng)足進(jìn)步,為智能監(jiān)考系統(tǒng)的設(shè)計(jì)提供了技術(shù)支持。目標(biāo)檢測(cè)(Object Detection)是計(jì)算機(jī)圖像、視頻處理工作的基礎(chǔ) 。目標(biāo)檢測(cè)即檢測(cè)圖片中的目標(biāo)物體,需輸出圖像中所有目標(biāo)的坐標(biāo)框與目標(biāo)的具體類別。YOLO(You Only Look Once,YOLO)算法和 SSD(Single Shot Multibox Detector,SSD)算法都是深度學(xué)習(xí)網(wǎng)絡(luò)應(yīng)用于目標(biāo)檢測(cè)的典型實(shí)例。
本文基于機(jī)器學(xué)習(xí)算法為核心,設(shè)計(jì)了一種以YOLO模型的智能識(shí)別物體與基于圖形學(xué)異常行為監(jiān)測(cè)為主要功能的智能監(jiān)考系統(tǒng),可通過前期大量訓(xùn)練集的練習(xí),并結(jié)合視頻處理技術(shù)實(shí)現(xiàn)適用于學(xué)校的智能監(jiān)考系統(tǒng)。本系統(tǒng)的使用有利于推進(jìn)學(xué)校標(biāo)準(zhǔn)化、智能化考場(chǎng)建設(shè),為監(jiān)考人員減負(fù)的同時(shí)提升監(jiān)考效果。
YOLO為一種新的目標(biāo)檢測(cè)方法,該方法的特點(diǎn)是實(shí)現(xiàn)快速檢測(cè)的同時(shí)還達(dá)到較高的準(zhǔn)確率。該模型算法將目標(biāo)檢測(cè)任務(wù)看作目標(biāo)區(qū)域預(yù)測(cè)和類別預(yù)測(cè)的回歸問題。方法采用單個(gè)神經(jīng)網(wǎng)絡(luò)直接預(yù)測(cè)物品邊界和類別概率,實(shí)現(xiàn)端到端的物品檢測(cè)。同時(shí),該方法檢測(cè)速非???,基礎(chǔ)版可以達(dá)到45幀/s的實(shí)時(shí)檢測(cè);FastYOLO可以達(dá)到155幀/s。與當(dāng)前最好系統(tǒng)相比,YOLO目標(biāo)區(qū)域定位誤差更大,但是背景預(yù)測(cè)的假陽性優(yōu)于當(dāng)前最好的方法?;谏疃葘W(xué)習(xí)方法的一個(gè)特點(diǎn)就是實(shí)現(xiàn)端到端的檢測(cè)。相對(duì)于其它目標(biāo)檢測(cè)與識(shí)別方法(比如Fast R-CNN)將目標(biāo)識(shí)別任務(wù)分類目標(biāo)區(qū)域預(yù)測(cè)和類別預(yù)測(cè)等多個(gè)流程,YOLO將目標(biāo)區(qū)域預(yù)測(cè)和目標(biāo)類別預(yù)測(cè)整合于單個(gè)神經(jīng)網(wǎng)絡(luò)模型中,實(shí)現(xiàn)在準(zhǔn)確率較高的情況下快速目標(biāo)檢測(cè)與識(shí)別,更加適合現(xiàn)場(chǎng)應(yīng)用環(huán)境。
采用圖形學(xué)原理,對(duì)監(jiān)控錄像的每一幀進(jìn)行像素級(jí)的對(duì)比。使用機(jī)器學(xué)習(xí)技術(shù)對(duì)像素進(jìn)行閾值估計(jì),并采用該閾值作為違規(guī)行為的評(píng)判標(biāo)準(zhǔn)。每一幀像素的變化若超過閾值限定范圍,系統(tǒng)則會(huì)對(duì)該幀進(jìn)行記錄。
本產(chǎn)品系統(tǒng)啟動(dòng)并載入視頻后,將開始自動(dòng)檢測(cè)考試違禁物品與違禁行為,若發(fā)現(xiàn)異常,將鎖定該異常圖像并截屏發(fā)送至后臺(tái)管理員對(duì)異常信息進(jìn)行二次審核,并顯示該場(chǎng)考生已錄入信息。
本系統(tǒng)采用最新版的YOLO模型進(jìn)行檢測(cè),該算法在輸入端采用Mosaic數(shù)據(jù)增強(qiáng)方式,對(duì)圖片進(jìn)行自適應(yīng)縮放,以此提升目標(biāo)檢測(cè)的速度以及對(duì)小目標(biāo)、遮蓋物檢測(cè)的準(zhǔn)確度。同時(shí),YOLOv5的網(wǎng)絡(luò)結(jié)構(gòu)使用兩種CSP結(jié)構(gòu)來增加網(wǎng)絡(luò)的深度和寬度,以此減少計(jì)算量。
嵌入式系統(tǒng)擁有強(qiáng)穩(wěn)定性,弱交互性。嵌入式系統(tǒng)一旦開始運(yùn)行就不需要用戶過多的干預(yù),而這就需要負(fù)責(zé)系統(tǒng)管理的EOS具有較強(qiáng)的穩(wěn)定性。嵌入式操作系統(tǒng)的用戶接口一般不提供操作命令,它通過系統(tǒng)的調(diào)用命令向用戶程序提供服務(wù)。在嵌入式系統(tǒng)中,嵌入式操作系統(tǒng)和應(yīng)用軟件被固化在嵌入式系統(tǒng)計(jì)算機(jī)的ROM中。與其他通常的計(jì)算機(jī)系統(tǒng)相比有更好的硬件適應(yīng)性,也就是良好的移植性。
對(duì)于本系統(tǒng)的廣大用戶群而言,其主要需求是通過本系統(tǒng)完成對(duì)學(xué)生的實(shí)時(shí)監(jiān)控。因而在每天大量的操作中,保持流暢性是用戶最為關(guān)心的事情。守星科技在整個(gè)系統(tǒng)中只響應(yīng)點(diǎn)擊操作,以最大限度地減少設(shè)備的資源占用。在實(shí)際操作的過程中,守星科技竭盡全力減少點(diǎn)擊按鈕的機(jī)會(huì)。本系統(tǒng)被設(shè)計(jì)為只要用戶對(duì)需求進(jìn)行選擇,就可自動(dòng)對(duì)操作結(jié)果進(jìn)行呈現(xiàn)。在這樣的模式下,用戶無須擔(dān)心有學(xué)生的行為被遺漏。在系統(tǒng)響應(yīng)速度方面,守星科技將盡全力對(duì)其進(jìn)行優(yōu)化,最大限度地提升本系統(tǒng)的響應(yīng)速度。
教育行業(yè)如今正在不斷升溫,高校對(duì)于監(jiān)考的需求也在不斷增加,傳統(tǒng)的監(jiān)考模式需要耗費(fèi)巨大的人力物力,而本文中基于YOLO模型與圖像學(xué)的監(jiān)考系統(tǒng),能夠智能化、多元化地對(duì)應(yīng)用于不同場(chǎng)景,同時(shí)該產(chǎn)品安裝流程簡(jiǎn)易,易操作,檢測(cè)識(shí)別的實(shí)時(shí)性較高,能夠更好地滿足當(dāng)今教育行業(yè)對(duì)監(jiān)考的需求。