李家源,曹雪虹,焦良葆,2,張智堅(jiān),陳 燁
(1.南京工程學(xué)院 人工智能產(chǎn)業(yè)技術(shù)研究院,南京 211167;2.江蘇省智能感知技術(shù)與裝備工程研究中心,南京 211167)
隨著新能源的發(fā)展,風(fēng)力發(fā)電得到廣泛應(yīng)用。只有保證風(fēng)機(jī)機(jī)組處于健康狀態(tài),才能確保發(fā)出穩(wěn)定持續(xù)的電能。油液作為風(fēng)機(jī)設(shè)備運(yùn)轉(zhuǎn)的必備部分,常因地域溫差太大、設(shè)備結(jié)構(gòu)設(shè)計(jì)不合理、油封材料質(zhì)量差等原因造成油污現(xiàn)象的發(fā)生,繼而對設(shè)備運(yùn)行環(huán)境造成影響[1]。油液滲漏過多會影響風(fēng)機(jī)中主軸、偏航軸承、偏航減速器、液壓站等設(shè)備的正常運(yùn)行。要保證風(fēng)機(jī)的穩(wěn)定運(yùn)行,務(wù)必減小油污對風(fēng)機(jī)運(yùn)行的影響[2],因此對風(fēng)機(jī)進(jìn)行油污檢測具有十分重要的意義。當(dāng)前風(fēng)機(jī)油污大多靠維護(hù)人員定期檢測,但人工巡檢的質(zhì)量往往受到巡檢經(jīng)驗(yàn)等因素影響,難以做到有效避免。如能借助目標(biāo)檢測方法實(shí)時檢測油污,那么油污所產(chǎn)生的負(fù)面影響會大大下降。
近年來,隨著卷積神經(jīng)網(wǎng)絡(luò)的出現(xiàn),目標(biāo)檢測算法上升到了一個新的高度[3]?;谏疃葘W(xué)習(xí)的目標(biāo)檢測網(wǎng)絡(luò)主要有兩種,一種是雙階段檢測框架如R-CNN(Region based Convolutional Neural Network)、Fast-RCNN(Fast Region based Convolutional Neural Network)。雙階段網(wǎng)絡(luò)首先產(chǎn)生區(qū)域候選框并提取特征,然后產(chǎn)生位置框并預(yù)測類別[4]。另一種是單階段檢測框架如SSD (Single Shot MultiBox Detector)與YOLO系列等。單階段網(wǎng)絡(luò)流程簡單直接產(chǎn)生物體類別率及位置情況,單次檢測即可完成,檢測速度較快[5]。在單階段網(wǎng)絡(luò)檢測油污中,武建華等人使用Mobilenet-SSD深度網(wǎng)絡(luò)模型檢測識別變電站設(shè)備油液滲漏并經(jīng)過部署證明了模型的實(shí)用性[6]。李躍華等人基于Yolov3模型識別油液滲漏現(xiàn)象,在邊緣設(shè)備使用模型進(jìn)行實(shí)時檢測,取得了較好的效果[7]。
基于深度學(xué)習(xí)的目標(biāo)檢測算法對檢測圖片樣本要求較高,一旦檢測目標(biāo)重疊復(fù)雜或檢測環(huán)境差,檢測效果便不太理想。因此針對檢測出現(xiàn)的問題,只有將檢測算法進(jìn)一步改進(jìn),才能滿足實(shí)際的應(yīng)用[8]。針對檢測目標(biāo)重疊漏檢問題,楊喻涵將Soft-NMS與 Faster R-CNN算法相結(jié)合,降低了目標(biāo)的漏檢誤檢率,進(jìn)一步提高了檢測精度[9]。根據(jù)特征融合不充分問題,陳一瀟等人引入CA注意力機(jī)制,在考慮通道關(guān)系的同時兼顧長距離位置關(guān)系,增強(qiáng)了模型對目標(biāo)的捕捉定位能力,進(jìn)一步提高了精度[10]。李陽等人提出CA與YOLOv4相結(jié)合檢測肺結(jié)核數(shù)據(jù),增強(qiáng)了數(shù)據(jù)特征提取與數(shù)據(jù)融合,網(wǎng)絡(luò)檢測精度得到了提升[11]。對于目標(biāo)檢測中邊界框檢測精度較低等問題,陳兆凡等提出了改進(jìn)邊框損失函數(shù)的方法,加入懲罰項(xiàng)對IoU損失函數(shù)進(jìn)行修正,提升了模型的回歸精度[12]。
為了有效解決油污因目標(biāo)混亂、油液濃度低、光線不足等引起的檢測效果下滑的問題,本文通過構(gòu)建風(fēng)機(jī)液壓站,偏航齒圈,偏航軸承集油槽油液滲漏數(shù)據(jù)庫,在YOLOv5n算法的基礎(chǔ)上,對網(wǎng)絡(luò)骨干部分及后處理部分進(jìn)行改進(jìn),通過多組對比消融實(shí)驗(yàn),根據(jù)模型評價(jià)指標(biāo)驗(yàn)證改進(jìn)后模型的有效性,以便更好地運(yùn)用模型檢測風(fēng)機(jī)油污。
YOLOv5家族包括5個成員,分別是YOLO5s、YOL-Ov5m、YOLOv5l、YOLOv5x、YOLOv5n。每種網(wǎng)絡(luò)的深度寬度都不相同。其中,YOLOv5n的模型總參數(shù)最小,更具輕量化。隨著YOLOv5版本的不斷迭代,YOLOv5-6.0版本在5.0的基礎(chǔ)上集成了新特性,微調(diào)了網(wǎng)絡(luò)結(jié)構(gòu),減少了總參數(shù),提高了運(yùn)行速度。
YOLOv5n網(wǎng)絡(luò)結(jié)構(gòu)由輸入端、骨干、頸部、頭部組成,其網(wǎng)絡(luò)結(jié)構(gòu)圖如圖1所示。首先,使用Mosaic方法對輸入數(shù)據(jù)進(jìn)行數(shù)據(jù)增強(qiáng),使用自適應(yīng)縮放操作根據(jù)輸入圖像尺寸大小的不同進(jìn)行自適應(yīng)填充,提升了推理速度。骨干部分主要包括Focus、CBS (Conv (Convolution)+ BN (Batch Normalization)+ SiLU (Sigmoid Weighted Liner Unit))、C3和SPPF (Spatial Pyramid Pooling Fast)等模塊。Focus模塊是YOLOv5舊版本中的一個模塊,核心部分是對圖片進(jìn)行切片操作,減小圖片的高度和寬度,并通過Concat將其整合,其次對整合后的圖像通過大小為 3,步長為 2 的 Conv 卷積模塊進(jìn)行特征提取,此模塊加強(qiáng)了圖片特征提取的質(zhì)量。6.0版本使用了尺寸大小為6×6,步長為2,padding為2的卷積核代替了5.0版本的Focus模塊,便于模型的導(dǎo)出,而且效率高。與之前的BottleneckCSP(Bottleneck Cross Stage Partial)模塊不同,YOLOv5-6.0中使用了C3模塊(圖1用CSP1表示),包含著3個標(biāo)準(zhǔn)卷積層以及多個殘差模塊,C3模塊去掉了殘差模塊所在支路輸出后的Conv模塊。在骨干最后,SPPF(Spatial Pyramid Pooling-Fast)結(jié)構(gòu)將輸入串行通過多個MaxPool層,替代SPP(Spatial Pyramid Pooling)模塊中將輸入并行通過多個不同大小的MaxPool層,進(jìn)一步提高了效率。頸部采用 CSP2 模塊減少模型參數(shù)量,CSP2與Backbone中CSP1的區(qū)別是將殘差模塊變?yōu)镃BS模塊。Neck層使用FPN(Feature Pyramid Network)與PANet(Path Aggregation Network)相結(jié)合的結(jié)構(gòu),使用 CSP2_X,相當(dāng)于CBS將主干網(wǎng)絡(luò)輸出分為兩個分支然后再連接,增強(qiáng)了網(wǎng)絡(luò)的特征融合能力。頭部包含3個檢測層,對頸部3種不同尺度特征圖,通過卷積操作,最終得到3個大小不同的特征圖。特征圖上生成類別概率,置信度得分和包圍框的輸出向量。
圖1 YOLOv5n網(wǎng)絡(luò)結(jié)構(gòu)圖
針對YOLOv5n算法遇到重疊或者距離較近的油污目標(biāo)時存在漏檢而影響檢測效果的問題,使用Soft-NMS算法對YOLOv5n進(jìn)行改進(jìn)[13]。作為目標(biāo)檢測重要的后處理部分,NMS的目的是將目標(biāo)的重復(fù)預(yù)測邊界框合并或者選取最好的框。YOLOv5n默認(rèn)使用NMS算法通過IoU選出候選框,IoU又名交并比,用來判斷真實(shí)框與預(yù)測框的重合度。IoU如公式(1)所示,式中A、B分別代表真實(shí)框與預(yù)測框,IoU計(jì)算值越高,A、B框重合程度就越高,預(yù)測越準(zhǔn)確,模型精度也相應(yīng)越高,反之亦然。
(1)
NMS算法是一個尋找局部最大值的過程,第一步從所有候選框中選取了某一個置信度最高的預(yù)測邊界框作為基本框,然后刪除了周邊與基本框的IoU超過預(yù)定閾值的邊界框,接下來迭代與第一次相同,直到找到目標(biāo)區(qū)域?yàn)橹?。NMS原理表達(dá)式如公式(2)所示。
(2)
其中:Si代表了每個邊框的得分,M為當(dāng)前得分最高的框,bi為剩余框中的某一個框,Nt為設(shè)定的閾值,IoU(M,bi)為最高分框M與剩余框bi的交并比值。當(dāng)所得值小于閾值時保留分?jǐn)?shù),反之,刪除bi框并將其分?jǐn)?shù)歸0。NMS的實(shí)現(xiàn)原理使得整個檢測過程具有以下缺點(diǎn):刪除與基本框交并比值超過閾值的邊界框使得出現(xiàn)在重復(fù)區(qū)域的目標(biāo)檢測物檢測失敗,總的檢測成功率會下降。此外,閾值的選定對檢測的準(zhǔn)確率具有很大的影響。
針對NMS呈現(xiàn)出的問題,采用Soft-NMS進(jìn)行改進(jìn),Soft-NMS算法[14]對與基本框交并值大于閾值的候選框不直接刪除,而對原分?jǐn)?shù)進(jìn)行函數(shù)運(yùn)算,用較低的分?jǐn)?shù)代替原來的高分?jǐn)?shù)。Soft-NMS有線性和高斯兩種表達(dá)式,線性表達(dá)式如公式(3)所示。
(3)
由于線性不連續(xù),所以高斯較為常用,高斯表達(dá)式如公式(4)所示。
Si=Sie-IoU(M,bi)2/σ,?bi?D
(4)
式(4)中D代表最終存放結(jié)果框,σ代表加權(quán)系數(shù),取0.3。使用Soft-NMS算法后能有效解決重疊目標(biāo)的漏檢問題,有效提升網(wǎng)絡(luò)的檢測精度。
Hou Q[15]等提出了一個輕量型的注意力模塊,將其稱為“Coordinate Attention”(簡稱CA)。CA注意力機(jī)制將橫縱方向的位置信息編碼到通道信息,能夠在考慮通道間關(guān)系的同時考慮到長距離的位置信息。因此CA注意力機(jī)制的加入能使得網(wǎng)絡(luò)在不增加大量計(jì)算量的同時能夠關(guān)注大范圍的位置信息,以此增強(qiáng)模型的目標(biāo)定位能力。
CA模塊可視作增強(qiáng)移動網(wǎng)絡(luò)特征表達(dá)能力的計(jì)算單元,它可以對網(wǎng)絡(luò)中的任意中間特征張量作為輸入然后輸出大小相同的增強(qiáng)特征[16]。CA注意力機(jī)制具體結(jié)構(gòu)如圖2所示。
圖2 CA注意力模塊結(jié)構(gòu)圖
CA模塊首先使用池化核(H,1)、(1,W)將輸入信息沿水平垂直兩個方向?qū)γ總€通道分別編碼,將坐標(biāo)信息嵌入對應(yīng)圖中X AvgPool與Y AvgPool兩部分。該過程允許注意力塊在捕捉單方向上的長距離關(guān)系的同時保留另一個方向上的空間信息,增強(qiáng)網(wǎng)絡(luò)定位目標(biāo)的準(zhǔn)確性。接著將一對方向可知的特征圖拼接在一起,使用1×1卷積模塊將其維度降低為原來的C/r,然后使用BN批量化歸一處理,再送入Sigmoid 激活函數(shù)得到包含橫縱空間信息且維度為1×(W+H)×C/r的中間特征。該過程將兩個方向特征連接在一起進(jìn)行特征轉(zhuǎn)化主要為了統(tǒng)一的BN操作,未將兩個方向的特征進(jìn)行強(qiáng)烈的融合。接著將中間特征分為兩個方向獨(dú)立特征,經(jīng)過兩個1×1卷積和Sigmoid激活函數(shù)進(jìn)行特征轉(zhuǎn)化,分別得到特征圖在兩個方向的注意力權(quán)重,并使其維度與輸入保持一致,最后將特征權(quán)重乘法加權(quán)在輸出特征上。
相比與忽視位置信息單考慮通道信息的SE (Squeeze-and-Excitation)模塊以及缺乏長距離信息提取能力的CBAM (Convolutional Block Attention Module)模塊,CA模塊不僅獲取了通道間信息,還考慮了方向相關(guān)的位置信息[17]。此外足夠靈活和輕量的特征使其能夠簡單地插入移動網(wǎng)絡(luò)的核心結(jié)構(gòu)中。本文將CA模塊加入YOLOv5n網(wǎng)絡(luò)中Backbone部分的SPPF層前面。通過實(shí)驗(yàn)發(fā)現(xiàn),CA模塊的加入可有效提高模型的檢測精度。
目標(biāo)檢測網(wǎng)絡(luò)對特征圖上的每個網(wǎng)格進(jìn)行預(yù)測,并對比預(yù)測信息與真實(shí)信息,以便為下一步的收斂方向做指導(dǎo)。損失函數(shù)用來判斷以上兩種信息的差距,若預(yù)測信息越接近真實(shí)信息,則損失函數(shù)值越小。YOLOv5使用CIoU(Complete Intersection over Union)[18]計(jì)算邊界框損失,CIoU損失函數(shù)沒有考慮真實(shí)框與預(yù)測框方向不匹配的問題導(dǎo)致推理速度較慢,效率較低。CIoU的損失計(jì)算公式如式(5)。
(5)
式中,b表示預(yù)測中心坐標(biāo),bgt表示真實(shí)框中心坐標(biāo),ρ代表b、bgt之間的歐式距離,α是平衡比例的參數(shù),它的表達(dá)式如式(6)。
(6)
v用來衡量預(yù)測框與真實(shí)框的高和寬之間的比例的一致性,表達(dá)式如式(7)。
(7)
式中,wgt、hgt分別代表真實(shí)框的寬度、高度,w、h分別代表預(yù)測框的寬度、高度。
針對CIoU損失函數(shù)出現(xiàn)的問題,J He[19]等人提出一種新的power IoU損失函數(shù),稱為α-IoU。該損失函數(shù)將基于IoU的現(xiàn)有損失統(tǒng)一冪化,并通過加上額外的power正則化項(xiàng)推廣到更一般的形式,從而得到一個新的power IoU損失函數(shù)以獲得更準(zhǔn)確的邊界框回歸和目標(biāo)檢測。power參數(shù)α可作為調(diào)節(jié)α-IoU損失的超參數(shù)以滿足不同水平的回歸精度,此次實(shí)驗(yàn)將α值設(shè)為3。在α-IoU損失函數(shù)公式中只列舉α-IoU、α-CIoU損失函數(shù)如公式(8)~(9)所示。
Lα-IoU=1-IoUα
(8)
(9)
式中,α、β代表權(quán)重參數(shù),c表示最小閉包對角線的長度,其余物理量與式(5)相同。
α-IoU損失可以很容易地用于改進(jìn)檢測器的效果[20],對小數(shù)據(jù)集和噪聲的魯棒性更強(qiáng),統(tǒng)一冪化可以增大梯度加速收斂,網(wǎng)絡(luò)的推理速度得到進(jìn)一步縮短。
本次模型訓(xùn)練平臺搭建在GPU運(yùn)算服務(wù)器上,硬件配置如表1所示。
表1 硬件參數(shù)配置
為了保證實(shí)驗(yàn)的對比性,本次實(shí)驗(yàn)均在此臺GPU運(yùn)算服務(wù)器上進(jìn)行,所有訓(xùn)練參數(shù)都保證一致,訓(xùn)練參數(shù)如下:不加預(yù)訓(xùn)練權(quán)重,統(tǒng)一輸入圖片尺寸Img-Size為640×640,迭代次數(shù)epochs設(shè)置為300,batch-size設(shè)置為16,調(diào)用3個GPU,iou閾值為0.5。
數(shù)據(jù)集的準(zhǔn)備過程在基于深度學(xué)習(xí)的目標(biāo)檢測算法中極為重要。為了保證訓(xùn)練后模型具有較好的泛化能力,在風(fēng)機(jī)中分別收集不同光照強(qiáng)度、油液濃度下的易漏油設(shè)備如液壓站,偏航齒圈,偏航減速器的油液滲漏圖像共計(jì)1 073張,其中數(shù)據(jù)集原圖如圖3所示。
圖3 風(fēng)機(jī)設(shè)備油污數(shù)據(jù)圖
本文將待檢測油污設(shè)備分三類,分別為液壓站,偏航齒圈,偏軸軸承,按照對應(yīng)標(biāo)簽進(jìn)行標(biāo)注,液壓站為oil,偏航齒圈為circle,主軸軸承為axle,采用軟件LabelImg對所得到的數(shù)據(jù)圖進(jìn)行人工標(biāo)記,標(biāo)注完的信息以xml的格式保存在相同路徑下。在數(shù)據(jù)集中隨機(jī)選取580張作為訓(xùn)練集,200張作為驗(yàn)證集,293張作為測試集。各類數(shù)據(jù)具體分配如表2。
表2 數(shù)據(jù)集準(zhǔn)備
對訓(xùn)練模型結(jié)果進(jìn)行評估時,具有衡量模型泛化能力的評價(jià)指標(biāo)與科學(xué)的實(shí)驗(yàn)估計(jì)方法具有同等的重要性。此次實(shí)驗(yàn)的評價(jià)指標(biāo)有模型參數(shù)量、訓(xùn)練所得權(quán)重文件大小、模型訓(xùn)練速度、推理時間,查全率R、查準(zhǔn)率P和平均精度均值(mAP,mean average precision)。
訓(xùn)練速度可根據(jù)整個訓(xùn)練消耗時間除以迭代完成輪數(shù)計(jì)算,推理時間表示模型對每張圖的推理時間。查全率R也稱召回率表示在全部真實(shí)正樣本中,預(yù)測真正目標(biāo)的概率,用來評估目標(biāo)檢測模型找的是否完整。查準(zhǔn)率P也稱精確率表示在全部預(yù)測正樣本中,預(yù)測真正目標(biāo)的概率,用來評估目標(biāo)檢測模型找的是否精確。mAP表示各類檢測器分別用R和P作為橫縱軸作圖后圍成的面積總占比的平均值。mAP@.5表示閾值大于0.5的mAP。
實(shí)驗(yàn)觀察R、P的波動情況,兩者是一對矛盾的概念,在保證不下降的前提下,觀察mAP值來判斷模型的精度。mAP指標(biāo)越高,說明模型的檢測性能越強(qiáng)。
3.4.1 不同網(wǎng)絡(luò)模型實(shí)驗(yàn)
通過與其他目標(biāo)檢測算法的對比,可以凸顯出YOLOv5n網(wǎng)絡(luò)的優(yōu)越性,用于對比實(shí)驗(yàn)的目標(biāo)檢測算法有YOLOv3、YOLOv3-tiny(表中用YOLOv3t表示)、YOLOv5x,YOLOv5s。使用相同的數(shù)據(jù)集,相同的實(shí)驗(yàn)平臺,相同的訓(xùn)練參數(shù),只改變網(wǎng)絡(luò)模型。最終根據(jù)模型評價(jià)指標(biāo)綜合評價(jià)各個模型,對比結(jié)果如表3。由表3可知,YOLOv3、YOLOv5x模型參數(shù)量大,訓(xùn)練速度、推理時間耗時長。YOLOv3-tiny在YOLOv3的基礎(chǔ)上輕量化,訓(xùn)練速度與推理時間最短,但其網(wǎng)絡(luò)模型精度最低,mAP值低于75。YOLOv5s的查準(zhǔn)率與精度值最高但由于參數(shù)量較高,推理時間相較于Yolov5n來說較長。YOLOv5n的參數(shù)量及權(quán)重文件大小最少,參數(shù)量是其他對比模型的20.2%~28.6%,精度與YOLOv5s相比,差別甚小,具有較快的訓(xùn)練速度與推理速度。對比可知,從速度與精確度方面考慮,改進(jìn)YOLOv5n網(wǎng)絡(luò)是最好的選擇。
表3 不同網(wǎng)絡(luò)對比實(shí)驗(yàn)
3.4.2 注意力機(jī)制實(shí)驗(yàn)
本文嘗試將注意力機(jī)制加入YOLOv5n模型中的Backbone部分,本次實(shí)驗(yàn)分別對比加入CBAM、(ECA,efficient channel attention)、CA注意力機(jī)制后根據(jù)評價(jià)指標(biāo)評價(jià)各個模型,加入注意力機(jī)制對比實(shí)驗(yàn)如表4所示。由表4可見,加入CA注意力機(jī)制后網(wǎng)絡(luò)精度提升最高、推理時間最短。在四組模型中,只有加入CA后,查準(zhǔn)率與查全率均達(dá)到了80%以上??梢?,CA可以作為添加注意力機(jī)制改進(jìn)網(wǎng)絡(luò)模型的最優(yōu)選擇。
表4 加入注意力機(jī)制對比實(shí)驗(yàn)
3.4.3 損失函數(shù)實(shí)驗(yàn)
本文嘗試改進(jìn)YOLOv5n模型中的損失函數(shù),原YOLOv5n損失函數(shù)為CIoU,此次實(shí)驗(yàn)通過對比(EIoU,efficient intersection over union)、(SIoU,scylla intersection over union)、α-IoU,根據(jù)評價(jià)指標(biāo)對比更換各損失函數(shù)后模型的效果,改進(jìn)損失函數(shù)對比實(shí)驗(yàn)表如表5所示。由表5可知,在參數(shù)量與權(quán)重文件大小維持不變的情況下,EIoU的推理時間與訓(xùn)練速度最快,但精度值下降了1.6個百分點(diǎn)。對比CIoU、SIoU,損失函數(shù)改為α-IoU,雖推理時間略有下降,但查準(zhǔn)率、查全率、精度大幅提升,對比原CIoU損失函數(shù)分別提升了2.78%、15.3%、5.7%。綜上,將損失函數(shù)改為α-IoU效果對網(wǎng)絡(luò)精度的提升最明顯。
表5 改進(jìn)損失函數(shù)對比實(shí)驗(yàn)
3.4.4 消融實(shí)驗(yàn)
此實(shí)驗(yàn)基于原網(wǎng)絡(luò)通過加入注意力機(jī)制CA、改進(jìn)輸出端NMS為Soft-NMS,改進(jìn)損失函數(shù)為α-IoU,分別單獨(dú)加入特定模塊、組合加入模塊,做消融實(shí)驗(yàn)。消融實(shí)驗(yàn)表如表6所示。由表6可知,對比原YOLOv5n網(wǎng)絡(luò),加入CA可以將網(wǎng)絡(luò)精度提高4%,改進(jìn)Soft-NMS可以提高5.29%,同時加入CA并改進(jìn)Soft-NMS將mAP值提高了5.34%,在此基礎(chǔ)上,將損失函數(shù)更換為α-loss,網(wǎng)絡(luò)精度提高到92%,相比原始模型提高了8.1個百分點(diǎn),此外網(wǎng)絡(luò)查全率提高到87.4%,網(wǎng)絡(luò)的推理速度提高了28.6%。綜上,原網(wǎng)絡(luò)在三者同時改進(jìn)的情況下,網(wǎng)絡(luò)的檢測效果提升最大。
表6 消融實(shí)驗(yàn)
為了凸顯網(wǎng)絡(luò)改進(jìn)效果的直觀性,列舉改進(jìn)前后網(wǎng)絡(luò)的檢測效果圖,檢測效果圖如圖4所示,左圖(a)代表原網(wǎng)絡(luò)檢測效果圖、右圖(b)代表改進(jìn)后網(wǎng)絡(luò)檢測效果圖。由圖4(a)可見,原網(wǎng)絡(luò)在檢測過程中油污漏檢問題較為嚴(yán)重,油污目標(biāo)混亂復(fù)雜檢測難度較高,部分油污難以完整識別。將模型進(jìn)行改進(jìn)后,由圖4(b)可見,模型對油污的識別能力明顯增強(qiáng),檢測到的油污較為完整,同時置信度明顯增加,檢測精度顯著提高。
圖4 改進(jìn)前后網(wǎng)絡(luò)檢測效果對比圖
針對現(xiàn)有風(fēng)機(jī)油污目標(biāo)混亂、檢測環(huán)境復(fù)雜等引起的油污檢測效果下降的問題,本文提出了一種基于改進(jìn)YOLOv5n的油污檢測算法。本文的主要工作如下:
1)改進(jìn)YOLOv5n的NMS結(jié)構(gòu)為Soft-NMS,有效解決重疊目標(biāo)的漏檢問題;添加CA注意力機(jī)制,在保證精度的基礎(chǔ)上增強(qiáng)網(wǎng)絡(luò)對目標(biāo)的識別定位能力;更換損失函數(shù)為α-IoU損失函數(shù),統(tǒng)一冪化增大梯度加速收斂,加快網(wǎng)絡(luò)的推理速度;
2)實(shí)驗(yàn)結(jié)果表明,本文改進(jìn)的模型精度達(dá)到92%,推理速度達(dá)到0.7 ms,在不增加參數(shù)量的同時,模型的精度速度都得到了提升。后續(xù)工作可將改進(jìn)后的輕量化模型部署在邊緣計(jì)算設(shè)備上,搭建于風(fēng)機(jī)機(jī)艙實(shí)際應(yīng)用場景,進(jìn)一步優(yōu)化檢測環(huán)節(jié),全方面提升模型對風(fēng)機(jī)油污的檢測效果。