趙 鳳 李永恒 李 晶 劉漢強
①(西安郵電大學(xué)通信與信息工程學(xué)院 西安 710121)
②(陜西師范大學(xué)計算機科學(xué)學(xué)院 西安 710119)
電力機房作為企業(yè)最重要的場所之一,機房內(nèi)的設(shè)備受到破壞、丟竊等問題會對企業(yè)造成難以想象的損失。視頻監(jiān)控系統(tǒng)因其畫面直觀、查看便利和內(nèi)容多樣的優(yōu)點而得到廣泛應(yīng)用。然而,這種傳統(tǒng)的視頻監(jiān)控系統(tǒng)需要工作人員監(jiān)控查看,不僅浪費人力資源,而且會產(chǎn)生關(guān)鍵信息未及時捕獲的情況。因此,將計算機視覺用于室內(nèi)場景的人員目標(biāo)檢測,使其自動分析視頻,實現(xiàn)智能檢測具有非常重要的應(yīng)用價值。
近年來,深度學(xué)習(xí)在目標(biāo)檢測領(lǐng)域取得飛速發(fā)展,基于深度學(xué)習(xí)的目標(biāo)檢測算法分為兩類:兩階段法(two-stage)和單階段法(one-stage)。兩階段法以R-C N N(R e g i o n s w i t h C o N v o l u t i o n a l Network)[1]為代表,其先使用區(qū)域建議提取候選框的信息,然后再對提取的候選框進(jìn)行分類和回歸得到檢測結(jié)果。單階段法代表算法有YOLO(You Only Look Once)[2], SSD(Single Shot multibox Detector)[3], EfficientDet[4],它們將目標(biāo)檢測看作回歸問題,直接從圖片中獲得物體的類別和位置信息。兩階段法的優(yōu)點是精度高,但是算法實時性差且依賴高性能硬件。單階段法在速度上取得優(yōu)勢,但是在檢測精度上不及兩階段法。
在室內(nèi)人員目標(biāo)檢測領(lǐng)域,為了提高人員檢測的準(zhǔn)確率,Liu等人[5]提出漸近定位擬合網(wǎng)絡(luò)(Asymptotic Localization Fitting Network,ALFNet),提升行人檢測的準(zhǔn)確率。2020年張明偉等人[6]提出一種DE-YOLO的室內(nèi)人員檢測方法,通過結(jié)合密集連接卷積網(wǎng)絡(luò)(Dense convolutional Network, DenseNet)與YOLOv3來構(gòu)建網(wǎng)絡(luò)結(jié)構(gòu)。2021年董小偉等人[7]將多尺度加權(quán)特征融合的方法應(yīng)用于地鐵環(huán)境中的人員檢測,取得了較好的性能。2021年蘇楊等人[8]使用輕量化的卷積神經(jīng)網(wǎng)絡(luò)MobileNet作為特征提取網(wǎng)絡(luò)用來實現(xiàn)輕量化深度學(xué)習(xí)的機房人員檢測,實現(xiàn)了實時檢測的功能。2021年Wang等人[9]在YOLOv4[10]基礎(chǔ)上使用模型縮放的方法提出一種為低端GPU設(shè)備設(shè)計的YOLOv4-tiny網(wǎng)絡(luò),該方法能夠有效提高檢測速度,但是精度下降較多。
上述的檢測算法往往需要高算力GPU加速才能獲得好的精度和速度。然而在實際應(yīng)用中,由于設(shè)備性能受限,直接使用通用檢測算法將無法達(dá)到實際應(yīng)用需求。因此,為了能夠在性能受限設(shè)備上實現(xiàn)檢測算法的部署,并在準(zhǔn)確率和檢測速度上取得均衡提升。本文以YOLOv4-tiny網(wǎng)絡(luò)為基礎(chǔ),在以下3個方面進(jìn)行改進(jìn):(1)使用輕量化的Ghost卷積[11]模塊設(shè)計特征提取主干網(wǎng)絡(luò),然后結(jié)合基于通道混洗機制[12]的深度可分離卷積進(jìn)一步精簡模型;(2)在特征提取主干網(wǎng)絡(luò)部分通過添加多尺度的空洞卷積[13]來獲得更大感受野的特征;(3)在特征融合部分結(jié)合改進(jìn)的空洞空間金字塔池化[14]和包含空間信息的注意力機制[15]實現(xiàn)提取到的特征充分融合,從而提升檢測效果。最后,在多個數(shù)據(jù)集和多個測試平臺來測試本文所提算法性能。結(jié)果表明,本文算法在多個測試平臺上取得了在準(zhǔn)確率和輕量化上的最佳平衡。
YOLOv4-tiny網(wǎng)絡(luò)主要由特征提取主干(Backbone)網(wǎng)絡(luò)、特征融合頸部(Neck)網(wǎng)絡(luò)和檢測頭部(Head)3部分組成。特征提取主干網(wǎng)絡(luò)主要由普通卷積、跨階段連接(Cross Stage Partial, CSP)和最大池化組成,其作用是將輸入圖像進(jìn)行降采樣并提取目標(biāo)特征。特征融合部分使用特征金字塔(Feature Pyramid Networks, FPN)結(jié)構(gòu)將兩個不同尺度的特征進(jìn)行融合。檢測頭部分輸出大小分別為13×13×n×(5+N) , 2 6×26×n×(5+N),其中n為每個網(wǎng)格中的錨框個數(shù),取值為3。5表示目標(biāo)的位置信息 (x,y,w,h)以及置信度(Confidence),N為類別數(shù)。以只檢測人員為例,N=1,輸出的預(yù)測頭尺度大小為 13×13×18 和2 6×26×18。最終每張圖片輸出( 13×13+26×26)×3共計2535個預(yù)測框,通過每個預(yù)測框置信度和非極大值抑制(Non Maximum Suppression, NMS)算法舍棄置信度低的預(yù)測框,得到最終檢測結(jié)果。
2020年Han等人[11]發(fā)現(xiàn)訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)中包含冗余的特征圖,其作用通常是對數(shù)據(jù)有更加全面的理解。普通卷積通過增多通道數(shù)來生成特征圖,但是會增加計算成本,因此Han等人提出Ghost卷積生成更多特征圖,如圖1所示。Ghost卷積主要分為兩個步驟,第1步使用標(biāo)準(zhǔn)的卷積操作生成本源特征圖,第2步基于生成的本源特征圖使用簡單的線性操作生成幻影特征。之后將生成的幻影特征與本源特征合并可得最終的輸出特征圖。在輸入輸出特征圖大小不變情況下,Ghost卷積可以顯著降低參數(shù)和計算量。
圖1 Ghost卷積
本文在YOLOv4-tiny目標(biāo)檢測框架基礎(chǔ)上,對特征提取主干網(wǎng)絡(luò)、特征融合頸部網(wǎng)絡(luò)以及檢測頭部分進(jìn)行改進(jìn),從而實現(xiàn)網(wǎng)絡(luò)模型的輕量化設(shè)計,網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。特征提取主干網(wǎng)絡(luò)使用了Ghost卷積模塊(ghost block),通過少量的卷積操作生成特征圖,同時使用線性變換的方式生成更多的Ghost特征圖,顯著降低了特征提取網(wǎng)絡(luò)的參數(shù)量和計算量。此外,在特征提取網(wǎng)絡(luò)部分還引入多尺度感受野的空洞卷積模塊(dilated conv block),通過增大卷積模塊的感受野使得網(wǎng)絡(luò)模型感知到更大范圍的上下文特征信息而不引入過多的參數(shù)量。同時,受到ShuffleNet[12]中通道混洗機制(channel shuffle)的啟發(fā),本文將特征提取網(wǎng)絡(luò)部分的普通卷積操作替換為帶有通道混洗機制的深度可分離卷積,即卷積+批歸一化+Leaky ReLU+通道混洗(Convolutional Batch normalization Leaky ReLU Channel Shuffle, CBLCS)。在降低參數(shù)量的同時,還可以對提取到的特征進(jìn)行信息重組,以實現(xiàn)特征信息在不同組之間進(jìn)行交互,從而使網(wǎng)絡(luò)模型提取的特征更具有代表性和判別性。特征融合網(wǎng)絡(luò)部分使用了改進(jìn)的空洞空間金字塔池化(Atrous Spatial Pyramid Pooling, ASPP)[14]模塊和包含位置信息的注意力機制(Coordinate Attention, CA)[15],在獲得多尺度特征感受野的同時,使得兩個模塊的輸出特征進(jìn)行更有效的融合。
圖2 改進(jìn)YOLOv4-tiny的輕量化室內(nèi)人員檢測網(wǎng)絡(luò)結(jié)構(gòu)圖
YOLOv4-tiny使用CSP結(jié)構(gòu)對深層特征進(jìn)行提取,該結(jié)構(gòu)一部分直接與輸出進(jìn)行連接,另一部分通過多個重復(fù)的卷積操作,從而實現(xiàn)有效特征提取。從參數(shù)量上分析,該結(jié)構(gòu)存在大量參數(shù),具有很大的優(yōu)化空間。因此本文使用Ghost卷積來設(shè)計特征提取主干網(wǎng)絡(luò),如圖3所示。由倒置殘差結(jié)構(gòu)[16]可知,通道數(shù)越少特征提取能力越弱。因此本文構(gòu)建的網(wǎng)絡(luò)由4個Ghost卷積疊加組成,使用Ghost卷積1作為擴展層,用來增加輸出特征的通道數(shù)量,Ghost卷積2作為壓縮層,用來恢復(fù)輸出通道的特征數(shù)量,通過對通道進(jìn)行先升維再降維能夠提取到更多的特征信息。然后借鑒殘差網(wǎng)絡(luò)的思想,將輸入與兩個Ghost卷積模塊的輸出進(jìn)行合并連接,合并后的特征經(jīng)過Ghost卷積3進(jìn)一步增加輸出特征的數(shù)量。YOLOv4-tiny使用池化進(jìn)行降尺寸操作,池化在深層特征豐富的網(wǎng)絡(luò)中可行,但是在特征較少的網(wǎng)絡(luò)中會損失特征信息。因此本文使用卷積核大小3×3, stride=2的跨步深度卷積來降低尺寸,同時也能提取到更深層次的特征信息。使用Ghost卷積4對輸出特征數(shù)量進(jìn)行恢復(fù),之后與Ghost卷積2提取到的特征層進(jìn)行連接,最后使用1 ×1卷積調(diào)整輸出通道數(shù)。本文通過堆疊多個Ghost卷積來提取特征信息,可以在減少網(wǎng)絡(luò)參數(shù)的同時,仍然有較強的特征提取能力。
圖3 Ghost 卷積特征提取網(wǎng)絡(luò)模塊
卷積神經(jīng)網(wǎng)絡(luò)中淺層的特征圖包含更多的目標(biāo)位置信息,但淺層特征圖的感受野較小,因此在淺層特征提取前增加感受野至關(guān)重要。為了擴大淺層特征感受野,本文在淺層特征提取部分加入多尺度空洞卷積融合模塊,如圖4所示??斩淳矸e通過設(shè)置不同的擴張率可以獲得多尺度的感受野,這比普通卷積挖掘的特征信息更豐富。使用單一擴張率的空洞卷積只關(guān)注某一部分的信息,會使局部的信息丟失,因此本文所設(shè)計的多尺度融合模塊首先經(jīng)過卷積核大小為 3 ×3 , 擴張率為D=2的空洞卷積,然后并聯(lián)兩個擴張率分別為D=3和D=4的空洞卷積,所獲得的感受野大小由原始的3 × 3分別增加到13 × 13與15 × 15。將3組不同尺度感受野的特征進(jìn)行融合,之后參考?xì)埐罹W(wǎng)絡(luò)結(jié)構(gòu)將輸入與輸出進(jìn)一步融合,從而獲得更多特征細(xì)節(jié),提升網(wǎng)絡(luò)的特征表達(dá)能力。
圖4 多尺度空洞卷積融合模塊結(jié)構(gòu)圖
在YOLOv4-tiny中,使用普通卷積對輸入圖像進(jìn)行特征提取并降低圖像分辨率。為了降低網(wǎng)絡(luò)參數(shù)量同時提高網(wǎng)絡(luò)特征提取能力,本文將其中的普通卷積更換為深度可分離卷積,此外還對輸出的特征在通道維度上添加通道混洗操作,這可以提高網(wǎng)絡(luò)中的信息流通,從而增加特征的表達(dá)能力。圖5為本文提出的基于通道混洗機制的深度可分離卷積模塊。其中,通道混洗操作將輸出特征分為3組進(jìn)行隨機重新排列以實現(xiàn)信息交互,從而使輸出特征更加豐富。
圖5 基于通道混洗機制的深度可分離卷積模塊
YOLOv4-tiny舍棄了YOLOv4中提高上下文特征表達(dá)融合能力所采用的空間金字塔池化(Spatial Pyramid Pooling, SPP)[17]結(jié)構(gòu),造成一定精度下降。因此,本文采用不同擴張率的空洞卷積構(gòu)建空洞空間金字塔池化ASPP結(jié)構(gòu),如圖6所示。其思想為使用空洞卷積實現(xiàn)感受野的增大和不同感受野特征圖的融合。但是,直接進(jìn)行通道堆疊會產(chǎn)生冗余重復(fù)特征,因此本文在特征堆疊的頂部為每一個空洞卷積后添加DropBlock[18]操作,DropBlock是一種避免過擬合的正則化方法,該操作會將某一層特征圖的一部分相鄰區(qū)域丟棄,從而網(wǎng)絡(luò)必須從其他特征圖中來擬合特征,因此表現(xiàn)出更好的泛化性能。最后將融合后的特征使用1 ×1卷積改變輸出通道數(shù)目。本文將改進(jìn)的ASPP放置于含有位置信息的注意力機制后,對注意力機制提取到的特征使用不同擴張率的空洞卷積進(jìn)行特征提取和融合,以獲得更多的細(xì)節(jié)特征。
圖6 改進(jìn)的ASPP結(jié)構(gòu)
為了更加精準(zhǔn)地提取感興趣區(qū)域特征,本文在特征融合網(wǎng)絡(luò)中添加了輕量化的注意力機制,如圖7所示。該模塊分為兩個部分:坐標(biāo)信息嵌入(coordinate information embedding)與坐標(biāo)注意力生成(coordinate attention generation)。坐標(biāo)信息嵌入模塊對輸入特征圖使用水平和垂直方向上的1維全局平均池化,將特征聚合為兩個獨立方向感知的特征圖。這兩個特征圖包含空間方向上的長期依賴關(guān)系和精準(zhǔn)位置信息,從而實現(xiàn)更加有效的目標(biāo)定位。坐標(biāo)注意力生成模塊將兩個獨立方向感知的特征圖進(jìn)行拼接,首先使用1 ×1卷積生成包含兩個方向的中間特征圖,然后沿不同維度方向?qū)μ卣鲌D進(jìn)行拆分,之后使用1 ×1卷積對各個通道進(jìn)行調(diào)整,使用Sigmoid激活函數(shù)得到兩個不同方向特征權(quán)重信息,其與輸入的特征圖相乘即可得到包含注意力信息的特征圖。本文將輕量化注意力機制添加到特征提取主干網(wǎng)絡(luò)的兩個輸出部分,以及添加在兩個不同尺度的特征融合部分之后,實現(xiàn)目標(biāo)感興趣區(qū)域的注意力權(quán)重調(diào)整。
圖7 Coordinate Attention模塊結(jié)構(gòu)圖
本文使用PASCAL VOC Person(The Pascal Visual Object Classes)數(shù)據(jù)集[19]、INRIA數(shù)據(jù)集(INRIA person dataset)[20]、CUHK Occlusion數(shù)據(jù)集(CUHK Occlusion dataset for pedestrian detection)[21]和針對機房環(huán)境的自建數(shù)據(jù)集對所提算法進(jìn)行驗證。
(1)PASCAL VOC Person數(shù)據(jù)集:為目標(biāo)檢測領(lǐng)域的常用數(shù)據(jù)集,數(shù)據(jù)集目標(biāo)尺度變化大,因此需要算法有強檢測能力。本文抽取PASCAL VOC 2007+2012數(shù)據(jù)集Person類作為數(shù)據(jù)集,其中訓(xùn)練集9583張,測試集5138張;(2)INRIA數(shù)據(jù)集:Dalal等人[20]提出的一個行人檢測數(shù)據(jù)集,該數(shù)據(jù)集人員動作多樣且場景光線及地點各不相同。訓(xùn)練集包含正樣本614張,負(fù)樣本1218張。測試集包含正樣本288張,負(fù)樣本453張;(3)CUHK Occlusion數(shù)據(jù)集:為香港中文大學(xué)所提遮擋類型的行人檢測數(shù)據(jù)集,主要用于擁擠環(huán)境遮擋人員檢測。數(shù)據(jù)來源為多個公開的行人檢測數(shù)據(jù)集和日常生活中1063幅被遮擋的行人圖像,存在環(huán)境復(fù)雜、人員遮擋和目標(biāo)人員較小等情況;(4)機房環(huán)境自建數(shù)據(jù)集:本文基于某公司室內(nèi)安保監(jiān)控和小型機房環(huán)境兩個真實場景,在不同時間及光照情況下采集非連續(xù)幀圖像共計6180張,使用LabelImg標(biāo)記圖像中的人員位置信息。分為訓(xùn)練集4357張,測試集1823張,用來驗證算法在真實環(huán)境下的性能。
實驗采用精確率(Precision, P)、召回率(Recall, R)、平均精度均值(mean Average Precision, mAP)[19]作為網(wǎng)絡(luò)精度的評價指標(biāo)。mAP為所有類別AP均值,通常作為評估精度的綜合指標(biāo),本文檢測目標(biāo)僅人員一類,mAP等于AP。除此之外,本文使用每秒幀率(frames per second,fps)、幀照片推理耗時、參數(shù)量(Params)、浮點型計算量(FLoating Point Operations, FLOPs)及模型體積來評估模型的輕量化程度。
實驗訓(xùn)練環(huán)境硬件配置為i5 10400F CPU,NVIDIA RTX 2070SUPER GPU,內(nèi)存16 GB主機,軟件配置為Windows10, Python 3.6, Pytorch 1.2。為了驗證算法在不同設(shè)備上的性能,本文在4個設(shè)備上進(jìn)行算法的實時性測試。設(shè)備1為上述訓(xùn)練環(huán)境設(shè)備。設(shè)備2為i5-8250U CPU,內(nèi)存8 GB平板電腦。設(shè)備3為NVIDIA JETSON XAVIER NX嵌入式設(shè)備, ARM V8.2架構(gòu)CPU, NVIDIA Volta架構(gòu)GPU,內(nèi)存8 GB。設(shè)備4為NVIDIA JETSON NANO嵌入式設(shè)備,Cortex-A57 CPU、內(nèi)存4 GB。
實驗采取梯度下降法進(jìn)行訓(xùn)練,使用Adam(Adaptive momentum estimation)優(yōu)化器,初始學(xué)習(xí)率為10–4,使用余弦退火衰減(Cosine Annealing LR)調(diào)整學(xué)習(xí)率。訓(xùn)練PASCAL VOC Person數(shù)據(jù)集時設(shè)置訓(xùn)練輪次為2000。而在訓(xùn)練其他數(shù)據(jù)集時,因為網(wǎng)絡(luò)結(jié)構(gòu)沒有變化,僅數(shù)據(jù)集發(fā)生改變,因此本文直接載入PASCAL VOC Person的模型權(quán)重,用來加速模型訓(xùn)練,訓(xùn)練輪次設(shè)置為500,其余設(shè)置保持不變。
4.4.1 模塊參數(shù)驗證
本文多尺度空洞卷積模塊和改進(jìn)的空洞空間金字塔池化模塊中均包含3個不同擴張率的空洞卷積。擴張率的不同取值會影響網(wǎng)絡(luò)精度。因此本節(jié)實驗比較不同擴張率取值對網(wǎng)絡(luò)性能的影響,使用PASCAL VOC Person數(shù)據(jù)集作為測試數(shù)據(jù)集,實驗結(jié)果如表1所示。通過設(shè)置多組不同的擴張率進(jìn)行實驗。實驗結(jié)果表明,使用3個不同擴張率的精度指標(biāo)優(yōu)于使用3個相同擴張率的精度。同時,擴張率取值太大或太小都會影響精度指標(biāo)。因此,本文在比較精度指標(biāo)mAP的基礎(chǔ)上,在多尺度空洞卷積融合模塊中擴張率取值為[2,3,4],空洞空間金字塔池化特征融合模塊中擴張率為[3,6,9]。
表1 不同擴張率下實驗結(jié)果
4.4.2 模塊驗證實驗
本文使用以下5個模型驗證每個模塊對網(wǎng)絡(luò)的提升效果。添加的5個模塊分別為:Ghost卷積特征提取模塊(ghost block)、通道混洗的深度可分離卷積(BLCS)、空洞空間金字塔池化(ASPP)、包含位置信息的注意力機制(CA)和多尺度空洞卷積融合模塊(dilated conv block)。使用PASCAL VOC Person數(shù)據(jù)集進(jìn)行實驗,實驗結(jié)果如表2所示。可以看出,通過添加所設(shè)計的模塊,在參數(shù)量及FLOPs略有增加的情況下,召回率從57.92%提升至80.43%,綜合指標(biāo)mAP從75.28%提升至82.93%。
表2 模塊驗證結(jié)果
4.4.3 多場景算法精度對比分析
為了驗證本文算法的泛化性能,本文使用4個不同場景的數(shù)據(jù)集進(jìn)行驗證,實驗結(jié)果如表3所示。通過對比4個不同數(shù)據(jù)集上的精度指標(biāo),可以發(fā)現(xiàn)本文所提算法在不同數(shù)據(jù)集的大部分場景中精度指標(biāo)也優(yōu)于YOLOv4-tiny網(wǎng)絡(luò)。
表3 多個數(shù)據(jù)集下檢測效果對比(%)
圖8為YOLOv4-tiny與本文算法在4個數(shù)據(jù)集中室內(nèi)場景的檢測效果對比。對比圖8(a1)—圖8(a4)與圖8(b1)—圖8(b4)可以看出,本文算法在場景人數(shù)較少時無漏檢、誤檢的情況發(fā)生。對比圖8(a5)—圖8(a7)與圖8(b5)—圖8(b7)檢測結(jié)果可以發(fā)現(xiàn)在人數(shù)較多的場景中本文算法也能得到更好的檢測效果。同時,對于存在遮擋和小目標(biāo)的人員檢測也優(yōu)于YOLOv4-tiny網(wǎng)絡(luò)。對比圖8(a8)—圖8(a10)與圖8(b8)—圖8(b10)機房數(shù)據(jù)集的檢測結(jié)果發(fā)現(xiàn),實際場景中存在的人員遮擋、目標(biāo)與背景相似的情況,本文算法也能實現(xiàn)精準(zhǔn)檢測。
圖8 YOLOv4-tiny與本文算法在不同場景下檢測效果對比圖
4.4.4 不同網(wǎng)絡(luò)模型對比分析
為了驗證本文算法的整體性能,本文使用多個目標(biāo)檢測網(wǎng)絡(luò)在PASCAL VOC Person數(shù)據(jù)集上對網(wǎng)絡(luò)的參數(shù)量、計算量、模型體積和模型精度進(jìn)行對比分析,實驗結(jié)果如表4所示。首先,相比于通用目標(biāo)檢測網(wǎng)絡(luò),本文算法在損失極小精度的情況下,參數(shù)量、FLOPs、模型體積大幅度降低。例如,與精度最佳的Y O L O v 4 相比參數(shù)量減少97.4%,F(xiàn)LOPs減少95.2%,模型體積減少97.7%。其次,與輕量化網(wǎng)絡(luò)模型相比,本文算法具有競爭性的精度指標(biāo),同時參數(shù)量、FLOPs、模型體積均優(yōu)于對比算法。例如,與輕量化網(wǎng)絡(luò)YOLOv4-tiny相比,參數(shù)量減少72.8%,F(xiàn)LOPs減少57.4%,模型體積減少71.6%,精度指標(biāo)mAP提升8.3%。特別是,與基于YOLOv4進(jìn)行改進(jìn)的輕量化網(wǎng)絡(luò)相比,對比算法使用3個檢測頭進(jìn)行預(yù)測任務(wù),因此產(chǎn)生多于本文算法1倍的候選框,但其精度提升效果并不明顯。本文算法在精度與最優(yōu)輕量化網(wǎng)絡(luò)算法相差0.17%的情況下,在輕量化指標(biāo)均達(dá)到最優(yōu)。
表4 不同網(wǎng)絡(luò)模型結(jié)果對比
4.4.5 不同網(wǎng)絡(luò)模型推理速度對比分析
本文在4個不同性能設(shè)備上驗證各個算法的推理速度,實驗結(jié)果如表5所示。實驗結(jié)果表明,在不同性能的設(shè)備上,本文所提算法的推理速度達(dá)到最優(yōu)。與通用目標(biāo)檢測算法YOLO v4相比,本文所提算法在4個設(shè)備中的fps分別提升79, 8.99,21.83, 14.55,推理耗時分別減少了74.9%, 99.7%,80.8%, 90.9%。與輕量化目標(biāo)檢測算法YOLOv4-tiny相比,fps分別提升4, 5, 3, 3.53,推理耗時分別減少了3.8%, 53.8%, 7.5%, 22.5%??梢钥闯?,本文算法在4個平臺推理速度均優(yōu)于其他檢測網(wǎng)絡(luò)。
表5 不同性能設(shè)備推理速度對比
4.4.6 輕量化網(wǎng)絡(luò)模型在多場景下綜合指標(biāo)分析
為了能夠?qū)Ρ人崴惴ǖ木C合性能,本節(jié)分別將輕量化網(wǎng)絡(luò)在4個數(shù)據(jù)集下的精度指標(biāo)mAP與算法參數(shù)量、計算量、模型體積及基于GPU加速的fps進(jìn)行對比,實驗如圖9所示。紅色標(biāo)記點代表本文算法,可以看出,本文算法在輕量化指標(biāo)上均達(dá)到最優(yōu),同時在4個數(shù)據(jù)集的精度指標(biāo)也處于領(lǐng)先地位,在INRIA數(shù)據(jù)集、CUHK Occlusion 數(shù)據(jù)集中達(dá)到最優(yōu)。此外,本文對4個數(shù)據(jù)集的mAP指標(biāo)進(jìn)行平均統(tǒng)計,本文算法達(dá)到最優(yōu)。綜合對比發(fā)現(xiàn),在輕量化網(wǎng)絡(luò)結(jié)構(gòu)中,本文所提算法具有很大優(yōu)勢。
電力機房場景的人員檢測具有實際的研究和應(yīng)用價值,本文以YOLOv4-tiny為基準(zhǔn)網(wǎng)絡(luò),提出了一種輕量化的人員檢測網(wǎng)絡(luò)。首先,通過改進(jìn)的Ghost卷積模塊和多尺度感受野的空洞卷積模塊來構(gòu)建特征提取主干網(wǎng)絡(luò)以捕獲豐富的特征信息。其次,采用基于通道混洗機制的深度可分離卷積模塊進(jìn)一步實現(xiàn)輕量化設(shè)計。最后,通過在特征融合部分添加空洞空間金字塔池化模塊和包含位置信息的注意力機制從而使得網(wǎng)絡(luò)達(dá)到最優(yōu)。實驗結(jié)果表明,本文算法在實現(xiàn)輕量化結(jié)構(gòu)設(shè)計的同時,在多個數(shù)據(jù)集上算法指標(biāo)也優(yōu)于YOLOv4-tiny網(wǎng)絡(luò)。此外,在多個設(shè)備上的結(jié)果表明本文所提算法的實時性優(yōu)于其他網(wǎng)絡(luò)。因此,本文算法在嵌入式設(shè)備上
更具有優(yōu)勢。下一步的研究工作將對現(xiàn)有的特征提取結(jié)構(gòu)進(jìn)行優(yōu)化設(shè)計,從而提高精度。之后對模型進(jìn)行壓縮和量化,使所提網(wǎng)絡(luò)更適合部署于資源有限的嵌入式設(shè)備平臺。