鄒輝軍 焦良葆 孟 琳 張智堅(jiān) 趙維科
(南京工程學(xué)院人工智能產(chǎn)業(yè)技術(shù)研究院 南京 211167)
山火煙霧如果不能及時(shí)被發(fā)現(xiàn)并采取措施,較大的煙霧會(huì)污染輸電線路,火勢(shì)較大時(shí)甚至?xí)龤л斪冸娫O(shè)施,造成大規(guī)模停電。由于煙火存在發(fā)生時(shí)間、地點(diǎn)不固定的特點(diǎn),低效率的人工監(jiān)控方式和高成本的服務(wù)器端圖像識(shí)別已無法滿足現(xiàn)階段的需求。因此,迫切需要一種能夠在邊緣計(jì)算平臺(tái)上自動(dòng)進(jìn)行圖像處理的煙火預(yù)警檢測(cè)網(wǎng)絡(luò),來緩解人工監(jiān)控的壓力,降低監(jiān)控成本。
現(xiàn)階段的卷積神經(jīng)網(wǎng)絡(luò)包含單階段(one stage)算法與雙階段(two stage)算法兩個(gè)大類,典型的單階段算法主要有YOLO 系列[10~15]和SSD[16]系列,這些算法檢測(cè)速度快,檢測(cè)精度高。文獻(xiàn)[1]中通過增加VGG16 網(wǎng)絡(luò)中的卷積層和池化層來重構(gòu)SSD算法,提高了煙火的檢測(cè)精準(zhǔn)度。文獻(xiàn)[2]中使用高斯參數(shù)設(shè)計(jì)損失函數(shù),以實(shí)現(xiàn)新的YOLOv3 煙火檢測(cè)模型,相較于原模型準(zhǔn)確度提高了5.5%。這兩種算法在煙火檢測(cè)上的成功應(yīng)用,證明單階段算法滿足實(shí)際煙火檢測(cè)的精準(zhǔn)度需求。文獻(xiàn)[17~19]在不同的場(chǎng)景中運(yùn)用了YOLOv5[10]算法,證明單階段算法YOLOv5,在保持高精準(zhǔn)度的同時(shí),具有很快的運(yùn)行速度,且工程應(yīng)用范圍廣。但上述方法均存在計(jì)算量過大,存在部署不便或成本高昂的問題。
為便于智能檢測(cè)算法在低算力設(shè)備上的部署,業(yè)界提出了諸如MobileNets[3~4]和SqueezeNet[5]等輕量化網(wǎng)絡(luò),2020 年華為諾亞方舟實(shí)驗(yàn)室提出了檢測(cè)速度更快的GhostNet[6]。這些算法雖然減少了大量的卷積運(yùn)算與浮點(diǎn)運(yùn)算,但其精度不足,無法滿足工程實(shí)際中煙火檢測(cè)的精度需求。文獻(xiàn)[7]提出一種使用DH-MobileNet 網(wǎng)絡(luò)結(jié)構(gòu)代替SSD 結(jié)構(gòu)中的VGG16 網(wǎng)絡(luò),以此來簡(jiǎn)化模型,減少了運(yùn)算量。文獻(xiàn)[8]采用GhostNet 所構(gòu)建的殘差結(jié)構(gòu)改進(jìn)yolov4-tiny 后得到Y(jié)OLO-GhostNet,在檢測(cè)速度方面較原網(wǎng)絡(luò)提升了24%,加快了推理速度。文獻(xiàn)[9]提出一種將Ghost 卷積模塊替代原始卷積,并引入三個(gè)SPP 模塊,形成目標(biāo)識(shí)別輕量化算法GS-YOLO,預(yù)測(cè)速度得到了顯著的提升。這類算法普遍將輕量化的網(wǎng)絡(luò)模塊與深度卷積網(wǎng)絡(luò)進(jìn)行融合,提升了運(yùn)行速度,但查全率與查準(zhǔn)率均下降明顯。
為解決上述單階段網(wǎng)絡(luò)計(jì)算量大和輕量化網(wǎng)絡(luò)準(zhǔn)確度低的問題,本文選擇檢測(cè)精度較高且速度快的YOLOv5s[10]算法,在輕量化模塊中添加注意力機(jī)制,形成CG 模塊,并取代YOLOv5s 主干網(wǎng)絡(luò)中的CSP1_X 模塊,構(gòu)成輕量級(jí)識(shí)別網(wǎng)絡(luò)CG-yolo。最后將該網(wǎng)絡(luò)通過模型轉(zhuǎn)換部署到Jetson Nano 平臺(tái)上,滿足了基于邊緣計(jì)算模式煙火監(jiān)測(cè)的性能和效率需求。
YOLOv5s 結(jié)構(gòu)最小的網(wǎng)絡(luò)YOLOv5 具體結(jié)構(gòu)如圖1所示。
圖1 YOLOv5s結(jié)構(gòu)
YOLOv5s 的網(wǎng)絡(luò)結(jié)構(gòu)分為輸入端、Backbone、Neck、預(yù)測(cè)層(Prediction)四個(gè)部分組成,每個(gè)部分都應(yīng)用了一些新技術(shù)。輸入端采用Mosaic 數(shù)據(jù)增強(qiáng)和自適應(yīng)的錨點(diǎn)框計(jì)算,在豐富數(shù)據(jù)多樣性的同時(shí),還進(jìn)一步提升了檢測(cè)速度。主干網(wǎng)絡(luò)Backbone中使用Focus結(jié)構(gòu)和CSP1_X 結(jié)構(gòu),其中X 代表CSP結(jié)構(gòu)中使用的殘差組件,每個(gè)殘差組件都使用了兩個(gè)CBL(Conv+BN+LeakyRelu)結(jié)構(gòu)。網(wǎng)絡(luò)中的Neck 部分采用與YOLOv4 相同的FPN+PAN 結(jié)構(gòu),并且使用CSP2_X 結(jié)構(gòu)來加強(qiáng)網(wǎng)絡(luò)特征融合。YOLOv5s 在邊緣計(jì)算平臺(tái)上直接運(yùn)行,其檢測(cè)速度只有4fps,因此本文提出CG-yolo輕量化算法。
由于bottleneck中的CSP1_X 結(jié)構(gòu)復(fù)雜,本文先將其替換為結(jié)構(gòu)簡(jiǎn)單且計(jì)算量小的Ghostbottleneck模塊。
文獻(xiàn)[6]發(fā)現(xiàn)卷積層的輸出特征圖通常包含很多冗余,并且其中一些可能彼此相似,因此提出了一種新的Ghost 模塊,它通過簡(jiǎn)單的濾波和線性變換得到特征圖中的相似特征,以此來減少計(jì)算量。
Ghostbottleneck 由兩個(gè)堆疊的Ghost 模塊組成。第一個(gè)Ghost 模塊用作擴(kuò)展層,增加了通道數(shù)。第二個(gè)Ghost模塊減少通道數(shù),來與shortcut通道數(shù)匹配。然后,使用shortcut連接這兩個(gè)Ghost模塊的輸入和輸出。其中第二個(gè)Ghost module 不使用ReLU,而其他層在每層之后都應(yīng)用了批量歸一化(BN)和ReLU 激活函數(shù)。而stride=2 的結(jié)構(gòu)是兩個(gè)Ghost module 之間,通過一個(gè)stride=2 的深度卷積(DWConv)進(jìn)行連接。Ghostbottleneck 結(jié)構(gòu)如圖2所示。
圖2 Ghostbottleneck結(jié)構(gòu)圖
本文采用stride=1 的Ghostbottleneck 模塊替代原網(wǎng)絡(luò)中較為復(fù)雜的CSP1_X 模塊,減少網(wǎng)絡(luò)運(yùn)算量,提高檢測(cè)速度。為了確保mAP 指標(biāo)不會(huì)嚴(yán)重下降,需要在Ghostbottleneck 中添加注意力機(jī)制CoordAttention。
文獻(xiàn)[20]提出了一種專為輕量級(jí)網(wǎng)絡(luò)設(shè)計(jì)的新注意力機(jī)制,稱為CoordAttention,簡(jiǎn)稱CA。為了能讓輕量級(jí)網(wǎng)絡(luò)在更大區(qū)域上擁有注意力,同時(shí)減小計(jì)算開銷,該注意力機(jī)制在通道注意力中嵌入了位置信息。該方法的實(shí)現(xiàn)過程分為兩個(gè)步驟:坐標(biāo)信息嵌入(coordinate information embedding)和坐標(biāo)注意力生成(coordinate attention generation),CA 注意力機(jī)制具體結(jié)構(gòu)如圖3所示。
圖3 CoordAttention結(jié)構(gòu)圖
CA 模塊將全局池化分解為兩個(gè)一維的特征編碼操作,實(shí)現(xiàn)沿兩個(gè)空間方向進(jìn)行特征聚合。這樣,可以沿一個(gè)空間方向捕獲遠(yuǎn)程依賴關(guān)系,同時(shí)保存沿另一空間方向的精確位置信息。具體而言,對(duì)輸入X,先使用尺寸(H,1)和(1,W)的池化核沿著水平坐標(biāo)方向和豎直坐標(biāo)方向?qū)γ總€(gè)通道進(jìn)行編碼。然后將生成的特征圖分別編碼為一對(duì)方向感知和位置敏感的attention map,應(yīng)用于輸入特征圖以增強(qiáng)關(guān)注對(duì)象的表示。將坐標(biāo)信息嵌入的操作對(duì)應(yīng)著圖中X AvgPool 和Y AvgPool 兩個(gè)部分。作者在設(shè)計(jì)坐標(biāo)注意力生成操作時(shí),先級(jí)聯(lián)模塊生成的兩個(gè)特征圖,然后使用一個(gè)共享的1×1 卷積進(jìn)行變換,生成中間特征圖。接著,沿著空間維度將f切分為兩個(gè)單獨(dú)的張量,再利用兩個(gè)1×1卷積Fh和Fw將特征圖變換到和輸入X 同樣的通道數(shù)。CA 模塊的最終輸出可以表述如下式。
至此CA模塊同時(shí)完成了水平方向和豎直方向的注意力,同時(shí)它也是一種通道注意力。該注意力機(jī)制優(yōu)于傳統(tǒng)的SE Attention,在保證參數(shù)量的前提下,提高精度且靈活輕量。Ghostbottleneck 模塊過于簡(jiǎn)潔,使得特征提取不足,因此本文選用CA注意力機(jī)制,插入Ghostbottleneck 模塊中,提高網(wǎng)絡(luò)的檢測(cè)準(zhǔn)確度。
YOLOv5s 的主干網(wǎng)絡(luò)中有對(duì)圖片進(jìn)行切片操作的Focus模塊,本文為減少計(jì)算量,將其替換為普通的下采樣。此處引入浮點(diǎn)運(yùn)算數(shù)FLOPs 對(duì)兩個(gè)模塊進(jìn)行比較。FLOPs 常用于衡量算法中模型的復(fù)雜度,F(xiàn)LOPs與算法運(yùn)行速度成反比。計(jì)算時(shí)通常只考慮乘加操作的數(shù)量,而且只考慮Conv 和FC等參數(shù)層的計(jì)算量,一般忽略BN 和激活函數(shù)等。計(jì)算方法是當(dāng)前層filter×輸出的feature map,具體公式如下。
普通下采樣是將一張640×640×3 的圖片輸入3×3 的卷積中,步長為2,輸出通道64,下采樣后得到320×320×64 的特征圖,那么普通卷積下采樣理論的計(jì)算量為88473600。而Focus 進(jìn)行了切片操作,將原來的三輸入通道,改成了12 個(gè)輸入通道,而其他參量與Conv 一樣,可以明顯看到,F(xiàn)ocus 的計(jì)算量是普通卷積的4 倍,但是下采樣時(shí)沒有信息的丟失。為了減輕計(jì)算量,我們將原來的Focus 功能模塊,替換為普通的Conv卷積模塊。
由于YOLOv5 網(wǎng)絡(luò)的結(jié)構(gòu)復(fù)雜性,冗余較大,導(dǎo)致檢測(cè)速度變慢。為了在檢測(cè)性能不變的情況下,提高網(wǎng)絡(luò)的檢測(cè)速度,本文提出一種CG(CA+Ghostbottleneck)模塊來對(duì)YOLOv5 網(wǎng)絡(luò)進(jìn)行輕量化。CG 模塊不僅實(shí)現(xiàn)了YOLOv5 網(wǎng)絡(luò)中冗余特征圖的提取,而且提取的特征圖還體現(xiàn)特征通道重要程度,CG模塊其結(jié)構(gòu)如圖4所示。
圖4 CG模塊結(jié)構(gòu)圖
本文提將CA 注意力機(jī)制融入stride 為1 的Ghostbottleneck 模塊之中,在降低運(yùn)算量的同時(shí)保證了查全率和查準(zhǔn)率。在第一個(gè)Ghost 卷積操作后,由于需要進(jìn)入BN 層對(duì)輸入激活函數(shù)的輸入進(jìn)行歸一化,隨后采用ReLU 激活函數(shù),使得Ghost 卷積表達(dá)能力就更加強(qiáng)大。在ReLU激活函數(shù)后添加CA 注意力機(jī)制,在這樣解決了輸入數(shù)據(jù)發(fā)生偏移和增大的影響,CA 模塊在輸入輸出通道上的不變性,可以在其后繼續(xù)進(jìn)行第二個(gè)Ghost 卷積操作。將新的CG 模塊替換掉原來網(wǎng)絡(luò)Bottleneck 中的CSP1_X 模塊。由此,對(duì)于YOLOv5s 的改進(jìn)完成,改進(jìn)后的YOLOv5網(wǎng)絡(luò)命名為CG-yolo。
現(xiàn)有的輸電通道煙火檢測(cè)方法,主要是從攝像機(jī)捕捉到的畫面中截取圖片,然后通過網(wǎng)線進(jìn)行遠(yuǎn)距離傳輸,最后使用高性能圖形服務(wù)器進(jìn)行檢測(cè)。該方法所需的高性能圖形服務(wù)器價(jià)格高昂,并且網(wǎng)絡(luò)傳輸效率帶來的時(shí)延,使得檢測(cè)并非實(shí)時(shí)。因此,本文提出一種基于邊緣計(jì)算平臺(tái)的輸電線路隱患檢測(cè)方法,能夠在監(jiān)控點(diǎn)實(shí)現(xiàn)無時(shí)延檢測(cè),隨后將隱患信息傳遞至主機(jī)。
邊緣計(jì)算是指在數(shù)據(jù)源頭測(cè),使用廉價(jià)且具有計(jì)算、存儲(chǔ)等能力的平臺(tái),就近進(jìn)行服務(wù)。就煙火檢測(cè)而言,終端計(jì)算需要將大量圖片通過網(wǎng)絡(luò)傳輸?shù)礁咝阅芊?wù)器中,再使用深度卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行檢測(cè),具有運(yùn)行成本高且顯卡利用率不足的短板。邊緣計(jì)算則是利用計(jì)算平臺(tái),直接對(duì)多個(gè)就近的監(jiān)測(cè)點(diǎn)進(jìn)行檢測(cè),最終只將檢測(cè)結(jié)果傳遞回終端或網(wǎng)絡(luò)平臺(tái)。
本文使用CG-yolo 算法對(duì)煙火樣本進(jìn)行訓(xùn)練,將得到的模型部署于NVIDIA 公司提供的Jetson Nano 平臺(tái)上,以此來驗(yàn)證算法的工程實(shí)用性。為了得到更快的檢測(cè)速度,本文使用NVIDIA 開發(fā)的TensorRT 進(jìn)行加速。但由于CG-yolo 算法訓(xùn)練后得到的模型為pt 格式文件,因此需要進(jìn)行模型轉(zhuǎn)換。首先將pt 轉(zhuǎn)為wts 格式,對(duì)模型進(jìn)行可視化操作,驗(yàn)證模型完整性,并根據(jù)可視化后的結(jié)構(gòu)對(duì)C++版的YOLOv5 進(jìn)行更改,最后將wts 文件轉(zhuǎn)為engine文件由此模型轉(zhuǎn)換完成并進(jìn)行部署。
Jetson Nano 平臺(tái)具體配置見表1,設(shè)備實(shí)物如圖5所示。
表1 Jetson Nano平臺(tái)配置
圖5 邊緣平臺(tái)Jetson Nano
為驗(yàn)證基于CG-yolo 的煙火檢測(cè)算法的有效性,本次實(shí)驗(yàn)在Pytorch 深度學(xué)習(xí)框架下進(jìn)行,訓(xùn)練過程使用高性能服務(wù)器,其CPU 為Intel(R)Xeon(R)Gold 5118,兩塊顯卡均為GTX2080ti,單個(gè)顯卡的顯存為12GB。邊緣計(jì)算平臺(tái)為Jetson Nano 4GB,中央處理器為64 位四核ARM A57,GPU 為128核NVIDIA Maxwell。
為了保證算法的適用性,本文使用的煙火數(shù)據(jù)集,主要由國網(wǎng)南京分公司提供。先通過鏡像的方法對(duì)數(shù)據(jù)集進(jìn)行擴(kuò)充,然后使用標(biāo)注軟件labelImg,對(duì)煙霧與山火分開標(biāo)注,標(biāo)注過程如圖6所示。
圖6 labelImg標(biāo)注示例圖
標(biāo)注完成后會(huì)產(chǎn)生一個(gè)xml 文件,使用自制的python 腳本工具將xml 文件轉(zhuǎn)化為帶有圖片信息txt文件,保存到和圖片同一文件夾下。本文按8∶1∶1 的比例隨機(jī)生成訓(xùn)練集、驗(yàn)證集和測(cè)試集,總共擁有1608 張,其中山火圖片401 張,煙霧圖片共計(jì)1207張。具體分配如表2所示。
表2 數(shù)據(jù)集準(zhǔn)備
為比對(duì)本文選取的方法與其他深度卷積檢測(cè)識(shí)別算法的差異,本文主要采用查全率Recall、查準(zhǔn)率Precision、mAP 與FPS 四種指標(biāo)進(jìn)行分析。FPS表示每秒的識(shí)別幀數(shù)。mAP 是所有類別準(zhǔn)確度的平均值。其中Recall、Precision的計(jì)算公式如下:
T表示將目標(biāo)隱患檢測(cè)為相應(yīng)的目標(biāo)。F表示目標(biāo)隱患檢測(cè)為非對(duì)應(yīng)目標(biāo)。P 表示檢測(cè)到的目標(biāo)是沒有隱患的目標(biāo)。通過計(jì)算傳輸通道隱患的查全率和查準(zhǔn)率,繪制出查準(zhǔn)率-查準(zhǔn)率(PR)曲線,mAP 為曲線下面積。在實(shí)際工程應(yīng)用中,為了防止事故的發(fā)生,監(jiān)管者更注重召回和檢測(cè)速度FPS。
本文主要對(duì)YOLOv5s 算法進(jìn)行改進(jìn),得到CG-yolo算法,并最終運(yùn)行在Jetson Nano平臺(tái)上,以此來實(shí)現(xiàn)更低成本的山火煙霧的檢測(cè)與識(shí)別。為了確保實(shí)驗(yàn)的可靠性,我們所有的訓(xùn)練測(cè)試都在同一臺(tái)設(shè)備上進(jìn)行,且保證訓(xùn)練過程一致。在訓(xùn)練過程中,使用YOLOv5 的自動(dòng)聚類方法,設(shè)置整個(gè)訓(xùn)練集的迭代次數(shù)epochs 為400 輪,一次輸入圖片張數(shù)batch-size 為32,輸入圖片尺寸img-size 統(tǒng)一縮放到640×640。測(cè)試時(shí)輸入的圖片尺寸設(shè)置為640,置信度IOU 為0.6。在GPU 上使用CG-yolo 算法對(duì)訓(xùn)練集進(jìn)行訓(xùn)練,花費(fèi)約7h,獲得最終煙火檢測(cè)模型權(quán)重。
在對(duì)比實(shí)驗(yàn)中,本文主要從檢測(cè)數(shù)據(jù)和實(shí)際檢測(cè)結(jié)果圖兩個(gè)方面進(jìn)行對(duì)比分析,輔之以兩種網(wǎng)絡(luò)關(guān)于查全查準(zhǔn)率的實(shí)時(shí)圖。
一方面,在相同的運(yùn)算環(huán)境下,將傳統(tǒng)輕量化的深度學(xué)習(xí)算法YOLOv4-Tiny、傳統(tǒng)單階段算法SSD、原網(wǎng)絡(luò)YOLOv5s 同本文算法進(jìn)行比較分析。通過對(duì)比實(shí)驗(yàn)得出本文算法要優(yōu)于其他三種算法。與原網(wǎng)絡(luò)相比mAP 僅下降0.2%,算法的檢測(cè)速度提高了9.5%,查全率提升1.8%,CG-yolo 更適合實(shí)際工程應(yīng)用。此外,通過與YOLOv4-tiny 相比較,本文算法的速度略慢于tiny,但mAP 遠(yuǎn)優(yōu)于tiny。CG-yolo各項(xiàng)指標(biāo)優(yōu)于SSD 算法。可見在實(shí)際工程應(yīng)用中,本文提出的算法和架構(gòu)更具優(yōu)勢(shì)。三種算法的對(duì)比如表3所示。
表3 幾種深度學(xué)習(xí)網(wǎng)絡(luò)對(duì)比
另一方面,為了驗(yàn)證本文提出的算法在實(shí)際場(chǎng)景應(yīng)用中的有效性,展示如圖7 所示的實(shí)際效果圖。
圖7 CG-yolo與YOLOv5檢測(cè)結(jié)果對(duì)比
第一列圖片為CG-yolo 的檢測(cè)結(jié)果圖,第二列為YOLOv5s 的檢測(cè)結(jié)果圖,通過比較兩組隨機(jī)挑選的測(cè)試結(jié)果圖可知,在速度提升的前提之下,兩種算法關(guān)于火焰與煙霧的識(shí)別效果相同。為了從總體趨勢(shì)上說明CG-yolo 的查全查準(zhǔn)率與原網(wǎng)絡(luò)相近,本文對(duì)圖8與圖9進(jìn)行分析。
圖8 recall對(duì)比圖
圖9 precision對(duì)比圖
圖8 和圖9 是采用每輪訓(xùn)練結(jié)束后的模型,對(duì)測(cè)試集進(jìn)行測(cè)試,計(jì)算其查全查準(zhǔn)率,最終繪制出的曲線圖。其中藍(lán)色線條為改進(jìn)版CG-yolo,橙色線條為YOLOv5s 網(wǎng)絡(luò),橫坐標(biāo)為訓(xùn)練次數(shù),縱坐標(biāo)為查全率與查準(zhǔn)率的小數(shù)形式。從圖中我們可以分析得出,在第400 輪訓(xùn)練結(jié)束時(shí),CG-yolo 在召回率上較原網(wǎng)絡(luò)提升1.8%,查準(zhǔn)率下降1.7%。從整體曲線圖分析增長趨勢(shì),可以發(fā)現(xiàn)查全率高于原網(wǎng)絡(luò),而查準(zhǔn)率略低。
本文在邊緣計(jì)算平臺(tái)上部署一個(gè)能夠?qū)崟r(shí)檢測(cè)的卷積神經(jīng)網(wǎng)絡(luò),因此,將轉(zhuǎn)換后的模型放入邊緣計(jì)算設(shè)備nano 中,利用測(cè)試集進(jìn)行測(cè)試。發(fā)現(xiàn)在邊緣設(shè)備中,我們的算法依然有很好的表現(xiàn),運(yùn)行速度達(dá)到13fps,且檢測(cè)效果與在服務(wù)器端相同,滿足煙火檢測(cè)在邊緣計(jì)算平臺(tái)部署的需求。邊緣設(shè)備運(yùn)行效果如圖10所示。
圖10 在Jetson Nano中的檢測(cè)效果
針對(duì)現(xiàn)有煙火檢測(cè)算法計(jì)算量大,無法在邊緣計(jì)算平臺(tái)上部署的問題,本文提出了一種基于CA-Ghostbottleneck 模塊的YOLO 目標(biāo)識(shí)別模型壓縮算法CG-YOLO。采用高效輕量化模塊Ghostbottleneck 替換原來的CSP1_X 模塊,并在Ghostbottleneck 模塊中添加CA 注意力機(jī)制,在保證精確度的基礎(chǔ)上提升了算法的檢測(cè)速度。本文算法相較于YOLOv5s 的檢測(cè)速度提升了9.5%,但本文僅考慮了使用更加輕量級(jí)模塊,并未考慮到剪枝、量化和蒸餾等減輕模型的有效方法。通過實(shí)驗(yàn)結(jié)果證明,本文提出的方法有效地對(duì)YOLOv5s 結(jié)構(gòu)進(jìn)行了優(yōu)化,相較于傳統(tǒng)的YOLOv5 模型有著更小的體積和更快的預(yù)測(cè)速度,對(duì)算力低、內(nèi)存少的嵌入式平臺(tái)十分友好,并在邊緣計(jì)算設(shè)備Jetson Nano上成功部署,得到了13fps的檢測(cè)速度。此外,本文所提方案不僅可以對(duì)YOLOv5 模型進(jìn)行高效的壓縮與加速,其他卷積神經(jīng)網(wǎng)絡(luò)模型都可參照本文方案進(jìn)行操作模塊的替換,為其他深度學(xué)習(xí)算法部署在資源有限的嵌入式平臺(tái)上提供方法參考。