田 浩,周 強(qiáng),賀晨龍
陜西科技大學(xué) 電氣與控制工程學(xué)院,西安 710000
“雙碳”目標(biāo)是我國的重大戰(zhàn)略決策,發(fā)展清潔低成本的光伏發(fā)電是實(shí)現(xiàn)這一戰(zhàn)略目標(biāo)的重要途經(jīng)和技術(shù)保障[1]。光伏(photovoltaic,PV)發(fā)電是利用光伏組件的光生伏特效應(yīng)將太陽能輻射直接轉(zhuǎn)變?yōu)殡娔艿囊环N方法[2],光伏組件的工作狀態(tài)將直接影響發(fā)電效率。由于生產(chǎn)、運(yùn)輸和安裝過程中的損壞,光伏組件不可避免地會產(chǎn)生一些缺陷,如斷柵、隱裂、黑芯等,這些缺陷會導(dǎo)致組件的光伏轉(zhuǎn)換效率降低,使用壽命縮短,甚至可能導(dǎo)致電路板短路,產(chǎn)生安全隱患[3]。因此研究光伏組件的缺陷檢測方法是提高光伏發(fā)電可靠性和穩(wěn)定性的關(guān)鍵,對于促進(jìn)光伏能源的發(fā)展具有重要意義。
目前,電致發(fā)光[4](electroluminescence,EL)成像因其非接觸式、魯棒性、速度快、成像分辨率高等優(yōu)點(diǎn)被廣泛應(yīng)用于光伏組件檢測領(lǐng)域[5]。EL 成像基本原理是基于硅材料的電致發(fā)光效應(yīng),通過向晶體硅電池組件施加正向偏置電壓,組件中被電場激發(fā)的電子在能級間進(jìn)行躍遷、變化、復(fù)合而發(fā)射特定波長的光,使用電荷耦合器件(charge coupled device,CCD)圖像傳感器捕獲該波長范圍內(nèi)的光并對其進(jìn)行成像。通過EL圖像的分析可以有效地發(fā)現(xiàn)硅片、電池片和組件生產(chǎn)過程中可能存在的缺陷,對改進(jìn)生產(chǎn)工藝、提高生產(chǎn)效率和提高產(chǎn)品質(zhì)量有著重要的作用[6]。對于光伏組件的檢測來說,以往大多采用肉眼觀察EL 圖像的方式判斷光伏組件狀況。然而,光伏組件缺陷大多是一些肉眼難以識別的微裂紋,并且特征不明顯、形狀不規(guī)則,需要大量的經(jīng)驗(yàn)和積累才能準(zhǔn)確識別[7]。而且,人工檢測缺陷的方式容易受到主觀因素的影響,檢測效率低下,難以大規(guī)模應(yīng)用于光伏組件檢測中。
隨著光伏產(chǎn)業(yè)規(guī)模的不斷擴(kuò)大和計算機(jī)視覺技術(shù)的飛速發(fā)展,基于機(jī)器視覺和深度學(xué)習(xí)的自動化檢測方法已經(jīng)逐漸取代人工檢測[8]。在光伏組件檢測領(lǐng)域,Tsai等[9]提出了一種基于傅里葉圖像重建方法,用于識別太陽能電池表面裂紋、斷柵等缺陷。Anwar等[10]采用各向異性擴(kuò)散濾波和形狀分類的多晶硅太陽能電池微裂紋檢測算法,利用支持向量機(jī)(support vector machine,SVM)訓(xùn)練分類器進(jìn)行二分類。Tsai等[11]提出一種基于獨(dú)立成分分析(independent component analysis,ICA)的監(jiān)督學(xué)習(xí)方法,用于識別太陽能電池中是否存在缺陷,但無法識別缺陷的形狀和位置?;跈C(jī)器學(xué)習(xí)的缺陷檢測方法依賴于人工特征提取,需要專業(yè)知識且調(diào)參過程復(fù)雜,算法泛化能力弱、魯棒性較差。Deitsch 等[12]提出了一種基于CNN 和SVM 的模型,對2 624 張光伏組件EL 圖像進(jìn)行缺陷檢測,取得88.24%的準(zhǔn)確率。Tang 等[13]結(jié)合傳統(tǒng)的圖像處理方法和生成對抗網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)增強(qiáng),提出了一種基于CNN的EL圖像自動分類模型。Han 等[14]采用區(qū)域建議網(wǎng)絡(luò)(region proposal network,RPN)來生成底層缺陷區(qū)域,將生成的圖像引入改進(jìn)的分割網(wǎng)絡(luò)中檢測。
雖然上述算法在光伏組件缺陷檢測任務(wù)中取得了較好的效果,但是能夠檢測的缺陷種類較少,且大多只針對裂紋和斷柵,并且無法提供缺陷位置,難以進(jìn)一步評價缺陷對光伏組件發(fā)電性能的影響。與此同時,光伏組件缺陷具有形狀多樣性,尺寸差異較大,易受復(fù)雜背景的干擾等特點(diǎn)[15],導(dǎo)致光伏組件缺陷檢測問題極具挑戰(zhàn)性。為了解決上述問題,本文提出一種基于多尺度特征融合的光伏組件缺陷檢測方法。以YOLOv5s 為框架,綜合考慮提高小目標(biāo)召回率,缺陷識別精確率以及模型推理速度對算法進(jìn)行改進(jìn)。首先,在主干網(wǎng)絡(luò)中引入坐標(biāo)注意力機(jī)制[16](coordinate attention,CA),使模型聚焦于目標(biāo)中的重要信息,忽略無用信息,提高任務(wù)處理的效率和準(zhǔn)確性;其次,在頸部網(wǎng)絡(luò)中采用雙向特征金字塔網(wǎng)絡(luò)[17](bidirectional feature pyramid network,BiFPN),以自適應(yīng)權(quán)重方式進(jìn)行多尺度特征融合,讓網(wǎng)絡(luò)學(xué)習(xí)每個輸入特征的重要性;然后,在預(yù)測層將自適應(yīng)空間特征融合模塊[18](adaptively spatial feature fusion,ASFF)和檢測頭結(jié)合,過濾不同檢測頭間的沖突信息,提高特征尺度的不變性;最后,添加一個微小檢測頭,提高網(wǎng)絡(luò)對小目標(biāo)缺陷的關(guān)注度,減少小目標(biāo)漏檢率。
YOLOv5是一種單階段的目標(biāo)檢測算法,根據(jù)網(wǎng)絡(luò)寬度和深度分為s、m、l、x四種網(wǎng)絡(luò)基本結(jié)構(gòu),模型架構(gòu)大小和參數(shù)個數(shù)依次增加,特征提取能力也逐漸提高,推理速度逐漸減慢。由于光伏組件缺陷檢測任務(wù)對檢測精度和速度都有較高的要求,故本文選擇YOLOv5s作為基礎(chǔ)網(wǎng)絡(luò)架構(gòu),在此基礎(chǔ)上設(shè)計一種針對光伏組件缺陷檢測的算法。
YOLOv5s 網(wǎng)絡(luò)由輸入端(Input)、主干網(wǎng)絡(luò)(Backbone)、頸部網(wǎng)絡(luò)(Neck)、預(yù)測層(Prediction)四部分組成。輸入端采用Mosaic 數(shù)據(jù)增強(qiáng),通過隨機(jī)選擇四張圖片,以隨機(jī)縮放、隨機(jī)裁剪、隨機(jī)排布的方式進(jìn)行拼接,從而增加小目標(biāo)樣本數(shù)量。同時,將輸入圖像自適應(yīng)縮放成640×640×3,用于提高目標(biāo)檢測推理速度。主干網(wǎng)絡(luò)主要用于提取圖像特征,由Focus 結(jié)構(gòu)、CSP(cross stage partial)結(jié)構(gòu)和SPP(spatial pyramid pooling)結(jié)構(gòu)組成。頸部網(wǎng)絡(luò)采用路徑聚合網(wǎng)絡(luò)(path aggregation network,PANet),由FPN 和PAN 組成,用于對不同尺度的特征圖進(jìn)行特征融合。FPN 采用自頂向下的結(jié)構(gòu)傳達(dá)語義特征,得到進(jìn)行預(yù)測的特征圖,但FPN 經(jīng)過多層卷積網(wǎng)絡(luò)作用后,底層的位置信息減少。因此在FPN基礎(chǔ)上添加PAN,加入自底向上的結(jié)構(gòu),彌補(bǔ)并加強(qiáng)定位特征,從不同的主干層到不同的檢測層進(jìn)行參數(shù)聚合。預(yù)測層采用CIOU_LOSS作為損失函數(shù)和非極大值抑制(non-maximum suppression,NMS)篩選目標(biāo)檢測框,提高檢測效率。
由于光伏組件缺陷容易受到復(fù)雜背景的干擾,同類型缺陷的形狀具有多樣性,網(wǎng)絡(luò)持續(xù)下采樣會導(dǎo)致小目標(biāo)缺陷特征逐漸消失等問題,使得原始的YOLOv5s 網(wǎng)絡(luò)不適用于光伏組件缺陷檢測任務(wù)。圖1 給出了光伏組件數(shù)據(jù)集中各類型缺陷尺寸分布,可以看出黑芯、裂紋缺陷尺寸差異較大,斷柵缺陷的形狀基本為細(xì)長狀,星形裂紋、短路和粗線大多為正方形,并且缺陷樣本數(shù)量較少。
圖1 光伏組件數(shù)據(jù)集各類型缺陷尺寸分布Fig.1 Size distribution of defects in PV module dataset
針對以上問題,本文的主要貢獻(xiàn)如下:(1)YOLOv5主干網(wǎng)絡(luò)第八層的CSP 結(jié)構(gòu)中嵌入坐標(biāo)注意力機(jī)制(CA),將位置信息嵌入通道注意力中,幫助模型準(zhǔn)確地定位和識別缺陷目標(biāo)。(2)在頸部網(wǎng)絡(luò)中引入雙向自適應(yīng)多尺度特征融合網(wǎng)絡(luò),讓網(wǎng)絡(luò)學(xué)習(xí)不同輸入特征對預(yù)測的重要性,對不同輸入特征進(jìn)行有差別的融合。(3)ASFF 模塊結(jié)合預(yù)測層的檢測頭形成ASFF_Head 模塊,將不同預(yù)測層的特征圖進(jìn)行自適應(yīng)空間特征融合,提高特征尺度的不變性。(4)在預(yù)測層中添加一個由淺層且高分辨特征圖生成的微小檢測頭,加強(qiáng)模型對小目標(biāo)的敏感性。改進(jìn)后的YOLOv5網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
圖2 改進(jìn)的YOLOv5網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.2 Improved YOLOv5 network structure diagram
當(dāng)YOLOv5s網(wǎng)絡(luò)檢測較為密集的光伏組件微小缺陷時,由于圖像背景較為復(fù)雜并且隨著下采樣的進(jìn)行會丟失大量位置信息,對斷柵、隱裂等缺陷經(jīng)常出現(xiàn)漏檢或誤檢。因此,本文在C3 模塊中引入CA 機(jī)制形成C3CA 模塊,加強(qiáng)網(wǎng)絡(luò)對重要信息的關(guān)注,提高網(wǎng)絡(luò)的性能。C3CA模塊的組成如圖3所示。
圖3 C3CA模塊Fig.3 C3CA module
CA 機(jī)制將位置信息嵌入到通道注意力中,不僅可以捕獲通道信息,還捕獲方向感知和位置敏感信息,使得網(wǎng)絡(luò)能夠關(guān)注大范圍位置信息的同時不會產(chǎn)生過多的計算量。
CA結(jié)構(gòu)如圖4所示,首先將全局平均池化沿著X、Y方向分解成兩個一維向量編碼。使用(H,1)和(1,W)池化核對輸入X沿著水平方向和垂直方向編碼,因此高度為h的第c個通道輸出為:
圖4 CA結(jié)構(gòu)Fig.4 CA module
同樣,寬度為w的第c個通道輸出為:
將兩個一維池化的結(jié)果拼接起來,使用1×1 的卷積、批量歸一化和非線性激勵進(jìn)行特征轉(zhuǎn)化:
隨后將f分為兩個獨(dú)立的特征gh、gω,分別使用1×1的卷積和sigmoid 函數(shù)進(jìn)行特征轉(zhuǎn)換,使得維度與輸入X一致:
將輸出gh、gω合并成權(quán)重矩陣并與輸入X相加,CA模塊輸出為:
卷積神經(jīng)網(wǎng)絡(luò)的不同層次能夠提取到不同層次的圖像特征,網(wǎng)絡(luò)提取到的淺層特征主要反應(yīng)圖像明暗、邊緣等細(xì)節(jié),而網(wǎng)絡(luò)提取到的深層特征則反應(yīng)更加豐富的圖像整體結(jié)構(gòu)。單獨(dú)使用淺層特征無法包含圖像的整體結(jié)構(gòu)信息,會減弱特征的表達(dá)能力,而單獨(dú)使用深層特征會導(dǎo)致提取的位置信息較少,不利于小目標(biāo)檢測。YOLOv5中采用PANet結(jié)構(gòu),在進(jìn)行自頂向下的特征融合后,再進(jìn)行自底向上的特征融合,深層特征和淺層特征相互融合,兼顧細(xì)節(jié)和整體,使得預(yù)測層具有較高的語義信息和位置信息[19]。但PANet 在融合不同尺度特征時是通過簡單的、不加區(qū)分的特征相加方式。由于不同輸入特征的分辨率不同,對融合輸出特征的貢獻(xiàn)通常也不同,簡單地將不同尺度的特征進(jìn)行相加是不合理的。
針對上述問題,本文采用一種簡單高效的加權(quán)雙向特征金字塔網(wǎng)絡(luò)(BiFPN),通過融合不同層次的特征信息來提高檢測精度,如圖5所示。引入可學(xué)習(xí)的權(quán)重來學(xué)習(xí)不同輸入特征層的重要性,同時重復(fù)應(yīng)用自頂向下和自底向上的多尺度特征融合。并且當(dāng)原始輸入節(jié)點(diǎn)和輸出節(jié)點(diǎn)處于同一層時,添加額外的跨層拼接,以融合更多的缺陷特征,從而減少光伏組件復(fù)雜背景的干擾。
圖5 BiFPN模塊Fig.5 BiFPN module
YOLOv5 的預(yù)測層采用三個檢測頭分別對大、中、小尺寸的特征進(jìn)行檢測,深層特征檢測大目標(biāo),淺層檢測小目標(biāo)。然而當(dāng)某個目標(biāo)在某一層被當(dāng)作正類時,相應(yīng)地該目標(biāo)區(qū)域在其他層被當(dāng)作負(fù)類。如果一幅圖像同時包含大小目標(biāo),不同特征層之間的沖突往往占據(jù)特征金字塔的主要部分。這種不一致性干擾了訓(xùn)練過程中的梯度計算,降低了特征金字塔的有效性。YOLOv5將不同輸出特征層分辨率調(diào)整成統(tǒng)一尺寸后,進(jìn)行直接拼接或者相加,但這種方式無法充分利用不同尺寸的特征,甚至可能丟失重要的信息或引入噪聲,從而導(dǎo)致檢測效率降低。
本文將自適應(yīng)空間特征融合(ASFF)模塊與預(yù)測頭結(jié)合構(gòu)成ASFF_Head網(wǎng)絡(luò),如圖6所示。通過引入可學(xué)習(xí)權(quán)重在空間上過濾沖突信息以抑制梯度回歸時的不一致,從而提高特征的尺度不變性,并且加快推理速度。
圖6 ASFF_Head網(wǎng)絡(luò)結(jié)構(gòu)Fig.6 ASFF_Head network structure
ASFF_Head模塊對于某一特征層,首先將其他特征層分辨率調(diào)整到與該層相同并進(jìn)行融合,然后對其進(jìn)行訓(xùn)練,尋找最優(yōu)的融合方式。在每個空間位置,不同的特征層被自適應(yīng)地融合,即一些特征在該位置攜帶矛盾信息時可能被濾除,一些特征可能提供更具辨別力的信息以提高檢測效率。以ASFF-3為例,由Level1、Level2、Level3 三個不同尺度特征圖乘上相應(yīng)的可學(xué)習(xí)權(quán)重參數(shù)、、并相加得到新的特征融合ASFF-3。其中、表示三個不同層到l層特征圖的權(quán)重參數(shù),并且滿足以下關(guān)系式:
最終第l層的輸出結(jié)果為:
在光伏組件缺陷檢測任務(wù)中,斷柵、隱裂等小目標(biāo)缺陷出現(xiàn)概率較大,并且在大多圖像中同時包含多種缺陷,在特征提取過程中,容易被無效信息干擾,造成小目標(biāo)特征的丟失。本文基于多尺度特征融合方式對YOLOv5 進(jìn)行改進(jìn),添加ASFF_Head 網(wǎng)絡(luò),進(jìn)一步將三種尺度的輸出進(jìn)行自適應(yīng)特征融合,有效解決了目標(biāo)特征信息丟失的問題,提高了預(yù)測頭對小目標(biāo)的預(yù)測效果。
YOLOv5s的預(yù)測層將多尺度特征融合后的特征圖按照32、16和8倍下采樣分為三個檢測頭,分別對應(yīng)大、中、小目標(biāo)檢測。由圖1 可以看出,光伏組件中缺陷尺寸分布不均勻,且尺寸主要集中在中、小目標(biāo)。由于小目標(biāo)在經(jīng)過多次下采樣之后容易造成特征信息丟失,本文在YOLOv5 基礎(chǔ)上增加一個經(jīng)過四倍下采樣的小目標(biāo)檢測頭,使用高分辨率的特征圖提高小目標(biāo)的檢測精度,使模型對小目標(biāo)更敏感,從而加強(qiáng)了模型的檢測能力,降低了小目標(biāo)缺陷的漏檢、誤檢率。
本文采用數(shù)據(jù)集由兩部分組成,一部分是由河北工業(yè)大學(xué)和北京航空航天大學(xué)聯(lián)合發(fā)布的PVEL-AD數(shù)據(jù)集[20],一共包含12 個不同類別的缺陷圖像,圖像的分辨率為1 024×1 024×3。由于部分類別缺陷在光伏組件制造過程中極少出現(xiàn),導(dǎo)致樣本數(shù)量較少而不利于進(jìn)行模型訓(xùn)練,因此本文采用其中的裂紋、斷柵、黑芯、粗線、星形裂紋、短路六種缺陷類別共4 193 張圖片進(jìn)行實(shí)驗(yàn)。另一部分是由Buerhop-Lutz 等[21]創(chuàng)建的ELPV 數(shù)據(jù)集,通過將44 張?zhí)柲茈姵匕灏凑针姵貑卧M(jìn)行裁剪,得到2 624 張光伏組件圖像[22],選擇其中具有上述六種缺陷的EL圖像作為訓(xùn)練樣本。圖7給出了部分光伏組件缺陷的圖像,包含黑芯、斷柵和裂紋等缺陷。
圖7 光伏組件缺陷圖像Fig.7 Defect image of photovoltaic module
由于數(shù)據(jù)集中缺陷類別分布極為不均衡,訓(xùn)練時模型會忽略數(shù)量較少的缺陷類別,而關(guān)注其他類別缺陷,導(dǎo)致檢測精度大幅降低。圖8 給出了數(shù)據(jù)增強(qiáng)前數(shù)據(jù)集中各類別缺陷的占比。由圖可知,不同類別缺陷數(shù)量嚴(yán)重不平衡,短路和星形裂紋缺陷數(shù)量太少,斷柵缺陷數(shù)量太多。因此本文在進(jìn)行模型訓(xùn)練前通過翻轉(zhuǎn)、平移、添加噪聲等離線數(shù)據(jù)增強(qiáng)方式擴(kuò)充了短路和星形裂紋缺陷圖像的數(shù)量,從而保證了數(shù)據(jù)集的均衡性。經(jīng)過數(shù)據(jù)擴(kuò)充后數(shù)據(jù)集共有5 200 張圖像,按照8∶1∶1 的比例劃分成訓(xùn)練集、驗(yàn)證集和測試集。
圖8 數(shù)據(jù)集各類別缺陷占比Fig.8 Defect proportion of each category in dataset
本文實(shí)驗(yàn)采用的操作系統(tǒng)為Windows10,CPU型號為Intel?Core?i5-8500,GPU 型號為NVIDIA GeForce RTX 1060,顯存為6 GB,使用深度學(xué)習(xí)框架為PyTorch 1.10.0,CUDA為11.3進(jìn)行加速訓(xùn)練。
網(wǎng)絡(luò)訓(xùn)練參數(shù)如下所示:輸入圖像尺寸為640×640×3,初始學(xué)習(xí)率為0.01,動量系數(shù)為0.937,批量大小為16,迭代次數(shù)為200 次,優(yōu)化器為隨機(jī)梯度下降(stochastic gradient descent,SGD),采用余弦退火策略動態(tài)調(diào)整學(xué)習(xí)率。
為了客觀全面地檢驗(yàn)?zāi)P托阅?,本?shí)驗(yàn)使用精確率(precision,P)、召回率(recall,R)、各類別精度的平均值(mean average precision,mAP)作為評價指標(biāo),具體的計算公式如下:
其中,TP(true positive)表示正樣本被預(yù)測為正的數(shù)量,F(xiàn)P(false positive)表示負(fù)樣本被預(yù)測為正的數(shù)量,F(xiàn)N(false negative)表示負(fù)樣本被預(yù)測為負(fù)的數(shù)量,C表示數(shù)據(jù)集缺陷類別個數(shù)。
3.4.1 注意力機(jī)制對比實(shí)驗(yàn)
為驗(yàn)證CA機(jī)制在本文改進(jìn)的光伏組件缺陷檢測模型中的有效性,將CA 機(jī)制和SE[23]、CBAM[24]、GAM[25]注意力機(jī)制進(jìn)行對比實(shí)驗(yàn)。實(shí)驗(yàn)采用YOLOv5s,將模型的第八層的CSP 結(jié)構(gòu)分別替換成C3CA、C3SE、C3CBAM和C3GAM模塊進(jìn)行測試,實(shí)驗(yàn)結(jié)果如表1所示。
表1 不同注意力模塊結(jié)果對比Table 1 Comparison of results of different attention modules 單位:%
由表1 可知,原YOLOv5s 模型的精確率為87.3%,召回率為86.3%,mAP 為88.7%。引入不同注意力機(jī)制后,各種指標(biāo)均有提升,其中C3CA效果最好,精確率提高了1.8個百分點(diǎn),召回率提高1.2個百分點(diǎn)。雖然添加C3CBAM后mAP提升最大,但精確率和召回率較低,且增加的計算量較大。CBAM 注意力機(jī)制由通道注意力和空間注意力兩個模塊組成,其中空間注意力模塊需要進(jìn)行最大池化、平均池化和卷積等操作,增加了計算復(fù)雜度。相比之下,CA 注意力機(jī)制只需要進(jìn)行全局平均池化和全連接層操作,計算效率高,可以更高效地進(jìn)行特征加權(quán),更有效地捕捉光伏組件中與缺陷相關(guān)的重要通道特征。因此本文選擇在主干網(wǎng)絡(luò)中插入CA 注意力機(jī)制進(jìn)行改進(jìn),以提高光伏組件缺陷檢測的準(zhǔn)確性和效率。
3.4.2 消融實(shí)驗(yàn)
本文通過消融實(shí)驗(yàn),驗(yàn)證改進(jìn)的YOLOv5s 模型對光伏組件缺陷檢測的性能提升。以YOLOv5s 為基線,組合上述不同模塊在光伏組件數(shù)據(jù)集中訓(xùn)練,驗(yàn)證各模塊對網(wǎng)絡(luò)模型性能的影響。消融實(shí)驗(yàn)結(jié)果如表2 所示。圖9 為不同模型在光伏組件缺陷數(shù)據(jù)集上mAP 的比較。
表2 消融實(shí)驗(yàn)結(jié)果對比Table 2 Comparison of ablation results 單位:%
圖9 不同模型訓(xùn)練mAP對比Fig.9 Comparison of training mAP of different models
由表2 和圖9 可以看出,本文改進(jìn)的網(wǎng)絡(luò)模型與原YOLOv5s相比,精確率和召回率均有所提升,其中精確率提高了3.8個百分點(diǎn),召回率提高了4.5個百分點(diǎn),mAP提高了3.2個百分點(diǎn)。僅添加微小目標(biāo)檢測頭對網(wǎng)絡(luò)識別準(zhǔn)確率提升并不明顯,但是召回率提高了2.9 個百分點(diǎn),光伏組件缺陷檢測中的小目標(biāo)漏檢問題得到了改善。僅添加CA注意力機(jī)制,使模型側(cè)重于提取圖像中的關(guān)鍵信息,精確率提高了1.8個百分點(diǎn);添加BiFPN和ASFF_Head為模型引入了多尺度特征融合能力,提高了模型對不同尺寸目標(biāo)的檢測能力。本文提出的改進(jìn)方法在少量增加計算量的同時,使得精確率和召回率都有了較大的提升,并且在本文實(shí)驗(yàn)設(shè)備上可達(dá)到31 FPS的運(yùn)行速度,能夠滿足檢測的實(shí)時性要求。
3.4.3 單階段目標(biāo)檢測算法對比
為了驗(yàn)證本文所提的改進(jìn)算法對光伏組件缺陷檢測的有效性,在光伏組件數(shù)據(jù)集上,訓(xùn)練了幾種主流的單階段目標(biāo)檢測算法進(jìn)行對比。實(shí)驗(yàn)均使用采用相同配置,從精確率(P),召回率(R)、精度(mAP)、檢測速度(FPS)幾個方面衡量算法的性能。實(shí)驗(yàn)結(jié)果如表3所示。
表3 主流單階段目標(biāo)檢測算法檢測結(jié)果對比Table 3 Comparison of detection results of mainstream single-stage target detection algorithms
由表3 可以看出,與YOLO 系列其他算法相比,YOLOv5s 更適用于光伏組件缺陷檢測任務(wù),在滿足實(shí)時檢測的前提下,召回率和各類別檢測平均精度均為最高。YOLOv7s 雖然精度和召回率略高于YOLOv5s,但是由于算法較為復(fù)雜且參數(shù)量巨大,使得檢測速度大大降低,無法滿足光伏組件實(shí)時檢測的需求。而本文提出的算法相較于YOLOv5s,對主干網(wǎng)絡(luò)、頸部網(wǎng)絡(luò)、預(yù)測層分別進(jìn)行改進(jìn),引入注意力機(jī)制和多尺度特征融合,提高了算法特征融合能力,在檢測精度和魯棒性方面均有較大提升。雖然檢測速度有所下降,但依然可以滿足工業(yè)實(shí)時檢測要求。相比于SSD和EfficientDet,本文算法在計算資源的使用上更加高效,同時可以實(shí)現(xiàn)更高的檢測精度。綜合考慮檢測速度和檢測精度,本文提出的算法在光伏組件缺陷檢測任務(wù)中有著最優(yōu)的表現(xiàn),對光伏組件缺陷的識別和定位更加精準(zhǔn),對小目標(biāo)缺陷更加敏感。
為了進(jìn)一步驗(yàn)證本文算法對光伏組件缺陷檢測效果,從測試集中選取光伏缺陷檢測中較為復(fù)雜的場景圖,分別使用YOLOv5s和改進(jìn)后算法進(jìn)行檢測,效果圖如圖10所示。
圖10 檢測效果圖Fig.10 Detection effect drawing
由圖10 可以看出,YOLOv5s 在缺陷種類較為單一且干擾較少的場景,可以檢測出大部分缺陷但檢測精度不高,置信度低。而光伏組件缺陷的產(chǎn)生通常是多種因素的綜合結(jié)果,導(dǎo)致組件的缺陷通常是成對出現(xiàn)的,且具有多樣性和復(fù)雜性。針對這種復(fù)雜場景,YOLOv5s算法檢測效果不佳,小尺寸斷柵和大尺寸裂縫存在漏檢的情況,而改進(jìn)后算法可以精準(zhǔn)地識別出各類別缺陷種類和位置,沒有出現(xiàn)漏檢和誤檢,同時檢測精度均高于YOLOv5s算法。
由于光伏組件缺陷檢測具有多樣性和復(fù)雜性、易受外部環(huán)境影響以及自動化和智能化需求等特點(diǎn),需要針對性地開發(fā)適應(yīng)性強(qiáng)、高效準(zhǔn)確的缺陷檢測方法,以提高光伏組件地質(zhì)量、性能和可靠性。本文針對光伏組件中六種常見缺陷,提出一種基于YOLOv5s 的多尺度特征融合網(wǎng)絡(luò)結(jié)構(gòu)。通過在主干網(wǎng)絡(luò)的CSP 結(jié)構(gòu)中嵌入CA機(jī)制形成C3CA模塊,提高了網(wǎng)絡(luò)特征提取能力;將原始YOLOv5 頸部網(wǎng)絡(luò)的PANet 更改為雙向特征金字塔網(wǎng)絡(luò)BiFPN,提高了網(wǎng)絡(luò)多尺度特征融合能力;在預(yù)測層中采用ASFF_Head模塊進(jìn)一步加強(qiáng)了多尺度的特征融合,有效改善了由于光伏組件圖像中同時含有不同尺寸缺陷造成的預(yù)測沖突,解決了檢測效率低的問題;通過添加一個微小目標(biāo)檢測頭,提高了模型對小目標(biāo)缺陷的檢測能力。改進(jìn)后的算法相比于原始YOLOv5s算法,在計算量略微增加的前提下,精確率、召回率和mAP 三項指標(biāo)分別上漲了3.8、4.5 和3.2 個百分點(diǎn)。相比主流的目標(biāo)檢測模型,本文提出的模型更加適合解決復(fù)雜背景下的光伏組件缺陷檢測問題,且運(yùn)行速度能夠滿足工業(yè)檢測的實(shí)時性要求,對研究缺陷對光伏組件性能的影響具有較高的實(shí)用價值。