(淮北師范大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 淮北 235000)
在制作太陽(yáng)能電池片時(shí),表面成膜工藝的好壞決定了太陽(yáng)光的吸收效率。目前工業(yè)界主要應(yīng)用等離子化學(xué)氣相沉積技術(shù)經(jīng)高溫把氮化硅沉積于電池片表面,由于各電池片沉積的多少不一,使得電池片表面顏色深淺不一致,業(yè)界根據(jù)顏色深淺程度,把太陽(yáng)能電池片分為六類(lèi):淺淡藍(lán)(Light-Light Blue,LLB)、中淡藍(lán)(Medium Light Blue,MLB)、深淡藍(lán)(Dark Light Blue,DLB)、淺深藍(lán)(Light Dark Blue,LDB)、中深藍(lán)(Medium Dark Blue,MDB)和深深藍(lán)(Deep Dark Blue,DDB)。一張野外用的大電池板要使用相同顏色的電池片,使光照吸收均勻,外觀顏色一致。而太陽(yáng)能電池片顏色差別小,難以區(qū)分,并且人眼長(zhǎng)時(shí)間工作,會(huì)產(chǎn)生視覺(jué)疲勞導(dǎo)致無(wú)法正確分類(lèi)太陽(yáng)能電池片。
針對(duì)人工分類(lèi)太陽(yáng)能電池片的困難,國(guó)內(nèi)外學(xué)者對(duì)其花紋和顏色的分類(lèi)進(jìn)行了研究。文獻(xiàn)[1]利用bp神經(jīng)網(wǎng)絡(luò)對(duì)不同花紋太陽(yáng)能電池片進(jìn)行分類(lèi)以便于比較不同絨面效果對(duì)光電轉(zhuǎn)換效率的影響,但該方法需人為提取特征作為輸入。文獻(xiàn)[2~3]利用基于顏色直方圖統(tǒng)計(jì)對(duì)太陽(yáng)能電池片顏色進(jìn)行分類(lèi)。但太陽(yáng)能電池片表面顏色分布不均勻,且需要選擇標(biāo)準(zhǔn)樣品做對(duì)比實(shí)驗(yàn),因此實(shí)驗(yàn)無(wú)法確定統(tǒng)一標(biāo)準(zhǔn),實(shí)驗(yàn)結(jié)果誤差大。以上方法都依賴(lài)人為主觀意識(shí)獲取太陽(yáng)能電池片的分類(lèi)特征,這對(duì)太陽(yáng)能電池片的分類(lèi)結(jié)果有很大的影響。
近年來(lái)隨著深度學(xué)習(xí)的發(fā)展,通過(guò)監(jiān)督學(xué)習(xí)式或非監(jiān)督學(xué)習(xí)式的特征學(xué)習(xí)方法已漸漸替代手工獲取特征方式。其中卷積神經(jīng)網(wǎng)絡(luò)[4]是深度學(xué)習(xí)的代表算法之一。1990年,Lecun等開(kāi)發(fā)了Lenet-5[5]卷積神經(jīng)網(wǎng)絡(luò)。2012年,Krizhevsky等基于Lenet-5網(wǎng)絡(luò)設(shè)計(jì)的Alexnet[6]在大規(guī)模圖像問(wèn)題上識(shí)別率遠(yuǎn)高于傳統(tǒng)的識(shí)別方法。Alexnet的成功為其他CNN模式帶來(lái)靈感,如ZFnet[7]、Vggnet[8]、Googlenet[9]、Resnet[10]、Densenet[11]等。然而,訓(xùn)練像Alexnet、Vggnet和Googlenet等這些深層的網(wǎng)絡(luò)是非常困難的,且時(shí)間復(fù)雜度高,難以滿(mǎn)足工業(yè)實(shí)時(shí)性要求。這使得國(guó)內(nèi)外學(xué)者對(duì)初始網(wǎng)絡(luò)的改進(jìn)進(jìn)行了研究。李勇[12]等在LeNet-5卷積神經(jīng)網(wǎng)絡(luò)中引入了跨連接的思想進(jìn)行面部表情識(shí)別;林哲聰[13]等使用卷積層代替全連接層,提出一種GMP-LeNet-5卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行車(chē)牌識(shí)別。白創(chuàng)[14]等提出了通過(guò)改進(jìn)網(wǎng)絡(luò)結(jié)構(gòu)實(shí)現(xiàn)人臉識(shí)別的LeNet-FC模型。上述方法都是對(duì)LeNet-5網(wǎng)絡(luò)進(jìn)行改進(jìn)并應(yīng)用在不同領(lǐng)域。因此,本文考慮在太陽(yáng)能電池片的顏色分類(lèi)任務(wù)中引入LeNet-5網(wǎng)絡(luò)。然而LeNet-5網(wǎng)絡(luò)中的Sigmoid激活函數(shù)容易產(chǎn)生梯度彌撒、收斂速度慢的問(wèn)題,導(dǎo)致分類(lèi)準(zhǔn)確率低。除此之外,考慮到是對(duì)太陽(yáng)能電池片的顏色進(jìn)行分類(lèi)[15],僅以RGB顏色空間圖像作為輸入,會(huì)忽略其他顏色空間在圖像分類(lèi)模型上的作用[16~20]。
為此提出了基于多顏色空間的太陽(yáng)能電池片智能分類(lèi)算法。首先構(gòu)建太陽(yáng)能電池片基本分類(lèi)模型,通過(guò)改進(jìn)LeNet-5的網(wǎng)絡(luò)結(jié)構(gòu)和修改激活函數(shù)提高模型性能;然后分析不同顏色空間在太陽(yáng)能電池片分類(lèi)中的作用,并給出多顏色空間分類(lèi)融合算法。經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)證,算法滿(mǎn)足工業(yè)生產(chǎn)流水作業(yè)的要求,達(dá)到識(shí)別率不低于90%的預(yù)期效果。
LeNet-5卷積神經(jīng)網(wǎng)絡(luò)是一個(gè)多隱層的人工神經(jīng)網(wǎng)絡(luò)。如圖1所示其基本結(jié)構(gòu)主要包括輸入層、卷積層(C1,C3)、池化層(S2,S4)、全連接層(C5,C6)和輸出層,激活函數(shù)為Sigmoid。
LeNet-5網(wǎng)絡(luò)最初是應(yīng)用于手寫(xiě)數(shù)字識(shí)別,但用于識(shí)別太陽(yáng)能電池片分類(lèi)時(shí),網(wǎng)絡(luò)模型收斂速度慢,泛化能力差。由于與手寫(xiě)數(shù)字圖片相比,太陽(yáng)能電池片圖片顏色豐富,紋理復(fù)雜。因此必須對(duì)傳統(tǒng)的LeNet-5網(wǎng)絡(luò)進(jìn)行相應(yīng)的改進(jìn)。
圖1 LeNet-5網(wǎng)絡(luò)結(jié)構(gòu)圖
針對(duì)傳統(tǒng)LeNet-5網(wǎng)絡(luò)在識(shí)別太陽(yáng)能電池片出現(xiàn)的問(wèn)題,做了如下改進(jìn)。
1)結(jié)構(gòu)改進(jìn)
增加了一層卷積層和一層池化層以學(xué)習(xí)到數(shù)據(jù)的更高層特征;將全連接層中的第二層改為dropout層,dropout層可以使網(wǎng)絡(luò)中某些隱藏層節(jié)點(diǎn)在訓(xùn)練期間不工作,但它們的權(quán)重將根據(jù)需要保留。dropout層可以提高訓(xùn)練集的錯(cuò)誤率,降低測(cè)試集的錯(cuò)誤率,提高網(wǎng)絡(luò)的泛化能力。
另外,太陽(yáng)能電池片圖片的顏色和紋理比手寫(xiě)數(shù)字圖片更為復(fù)雜,原有網(wǎng)絡(luò)的參數(shù)用于太陽(yáng)能電池提取特征效果并不好。參考文獻(xiàn)[14]中9種不同結(jié)構(gòu)CNN的性能測(cè)試表明3×3的卷積核是最佳的。因此,本文將原5×5卷積核的尺寸改為3×3。此外,為了獲得更豐富的特性,每層卷積核的數(shù)量分別設(shè)置為32、50和64。全連接層的第一層中的節(jié)點(diǎn)數(shù)更改為1024。太陽(yáng)能電池片分類(lèi)模型網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
圖2 太陽(yáng)能電池片分類(lèi)模型網(wǎng)絡(luò)結(jié)構(gòu)圖
2)修改激活函數(shù)
原有的Sigmoid激活函數(shù)在訓(xùn)練網(wǎng)絡(luò)時(shí)出現(xiàn)梯度消失現(xiàn)象,導(dǎo)致基于LeNet-5模型的太陽(yáng)能電池片顏色分類(lèi)訓(xùn)練中收斂速度慢。根據(jù)ReLU和sig?moid激活函數(shù)的計(jì)算公式(1)~(2)可知,ReLU本身計(jì)算量遠(yuǎn)小于Sigmoid激活函數(shù),并且其一階導(dǎo)數(shù)是1,不會(huì)造成梯度消失。
另外ReLU激活函數(shù)具有單邊抑制負(fù)輸入和正輸入線性映射的特性。因此ReLU激活函數(shù)的非線性映射具有稀疏性,可以使網(wǎng)絡(luò)更稀疏,解決了sig?moid激活函數(shù)引起的梯度消失問(wèn)題。此外,ReLU激活函數(shù)的梯度很好計(jì)算,大大縮短了訓(xùn)練時(shí)間,提高了收斂速度。
圖像分類(lèi)是計(jì)算機(jī)視覺(jué)領(lǐng)域最基本的應(yīng)用之一。大多數(shù)用于圖像分類(lèi)的數(shù)據(jù)集往往由彩色圖像組成,并且以往的圖像分類(lèi)算法沒(méi)有對(duì)數(shù)據(jù)集進(jìn)行顏色空間轉(zhuǎn)換,而是直接使用RGB顏色空間圖像進(jìn)行分類(lèi),忽略了其他顏色空間的作用。因此本小節(jié)主要討論以下幾種計(jì)算機(jī)視覺(jué)常用到的顏色空間(包括RGB、HSV、Lab、YUV和YCbCr)對(duì)太陽(yáng)能電池片分類(lèi)的影響。
顏色空間是定義在三維空間中,包含定義的顏色域中的所有顏色。RGB顏色空間是目前最常用的顏色空間之一,使用紅、綠、藍(lán)三原色來(lái)定量表示顏色。RGB顏色空間每個(gè)通道值的范圍是0到255。在RGB顏色空間,任意色光F都有可以用RGB三種顏色不同分量的相加混合而成。
HSV顏色空間是將RGB顏色空間中的點(diǎn)在倒圓錐體中的表示方式,是從人類(lèi)如何看待顏色的角度開(kāi)發(fā)的顏色空間。HSV顏色空間即色相(Hue)、飽和度(Saturation)和明度(Value)。H的范圍是0~360,S和V的范圍是0~1。
Lab顏色空間用數(shù)字化的方式描述人對(duì)顏色的感知,由亮度L和有關(guān)色彩的a、b三個(gè)要素組成。a表示從洋紅色至綠色的范圍,b表示從黃色到藍(lán)色的范圍。RGB顏色空間無(wú)法直接轉(zhuǎn)換成Lab顏色空間,需先轉(zhuǎn)換成XYZ顏色空間,再轉(zhuǎn)換成Lab顏色空間。
YUV顏色空間是被歐洲電視系統(tǒng)所采用的一種顏色編碼方法,Y代表亮度(Luma),U和V代表的是色度(Chrominance)和濃度(Chroma)。YCbCr是YUV經(jīng)過(guò)縮放和偏移的顏色空間。YCbCr顏色空間由亮度Y和有關(guān)色度的Cb、Cr三個(gè)要素組成。Cb反映的是RGB輸入信號(hào)藍(lán)色部分與RGB信號(hào)亮度值之間的差異。Cr反映了RGB輸入信號(hào)紅色部分與RGB信號(hào)亮度值之間的差異。
利用第二節(jié)提出的改進(jìn)LeNet-5網(wǎng)絡(luò)作為太陽(yáng)能電池片基本分類(lèi)模型,研究分析不同顏色空間對(duì)太陽(yáng)能電池片分類(lèi)的作用。將原始RGB顏色空間的太陽(yáng)能電池片圖片轉(zhuǎn)換為HSV、Lab、YUV和YCbCr顏色空間圖片,分別將不同顏色空間圖片作為太陽(yáng)能電池片基本分類(lèi)模型的輸入。另外,基于本文是對(duì)太陽(yáng)能電池片顏色分類(lèi)的研究,因此考慮直接提取太陽(yáng)能電池片B通道的值作為輸入研究對(duì)太陽(yáng)能電池片分類(lèi)的影響,而不是直接輸入RGB圖片。圖3展示了不同顏色空間的太陽(yáng)能電池片數(shù)據(jù)集在太陽(yáng)能電池片分類(lèi)模型上的準(zhǔn)確率隨迭代次數(shù)的增加的變化。
圖3 不同顏色空間的識(shí)別準(zhǔn)確率對(duì)比
由圖3可知,可發(fā)現(xiàn)使用不同的顏色空間會(huì)給實(shí)驗(yàn)帶來(lái)不同的結(jié)果?;赗GB、HSV、Lab、YUV、YCbCr顏色空間和B通道的太陽(yáng)能電池片隨著迭代次數(shù)的增加,準(zhǔn)確率以不同的上升速度上升,最后準(zhǔn)確率趨于0.8~1之間。為了獲得更有用的分類(lèi)效果信息,將太陽(yáng)能電池片在不同顏色空間的每一類(lèi)準(zhǔn)確率統(tǒng)計(jì)出來(lái),如表1所示。
表1 太陽(yáng)能電池片每一類(lèi)在不同顏色空間的準(zhǔn)確率
通過(guò)對(duì)表1更仔細(xì)的觀察,可發(fā)現(xiàn)不同類(lèi)別的太陽(yáng)能電池片在不同顏色空間下有不同的準(zhǔn)確率。具體表現(xiàn)在LLB和DDB兩類(lèi)太陽(yáng)能電池片均獲得較高的準(zhǔn)確率,主要原因在于這兩類(lèi)太陽(yáng)能電池片的顏色辨別度高,易于分類(lèi)。而MLB、DLB、LDB和MDB位于中間的四類(lèi)太陽(yáng)能電池片顏色差別小,分類(lèi)準(zhǔn)確率較低。其中MLB、DLB、LDB和MDB分別在HSV、YCbCr、Lab和RGB顏色空間取得最高準(zhǔn)確率。
另外,通過(guò)觀察基于B通道分類(lèi)太陽(yáng)能電池片的準(zhǔn)確率,發(fā)現(xiàn)太陽(yáng)能電池片識(shí)別準(zhǔn)確率較低。考慮太陽(yáng)能電池片表面是由藍(lán)色和白色線條組成,若只基于B通道分類(lèi)太陽(yáng)能電池片會(huì)忽略其他相關(guān)隱性特征,因此后續(xù)實(shí)驗(yàn)去除基于B通道分類(lèi)太陽(yáng)能電池片。
基于以上發(fā)現(xiàn),可以得出一個(gè)重要結(jié)論:不同類(lèi)別的太陽(yáng)能電池片可以更好地用不同顏色空間表示并且各顏色空間之間沒(méi)有存在百分之百的相關(guān)性。因此可以利用RGB、HSV、Lab、YUV和YCbCr多種顏色空間相互補(bǔ)充,以獲得更好的分類(lèi)結(jié)果。
根據(jù)上述得出的結(jié)論提出基于多顏色空間的太陽(yáng)能電池片智能分類(lèi)算法。算法結(jié)構(gòu)如圖4所示。
圖4 基于多顏色空間的太陽(yáng)能電池片分類(lèi)算法圖
有圖4可知,算法首先將不同顏色空間圖片作為太陽(yáng)能電池片基本分類(lèi)模型的輸入,訓(xùn)練得到各基分類(lèi)器;然后由多顏色空間分類(lèi)融合算法決定最終分類(lèi)結(jié)果。多顏色空間分類(lèi)融合算法具體步驟如下。
1)分別對(duì)圖像的不同顏色空間做分類(lèi),獲得各基分類(lèi)器的分類(lèi)概率P;
2)選擇P最大的作為各基分類(lèi)標(biāo)簽Pr;
3)利用多數(shù)表決原則對(duì)不同顏色空間的分類(lèi)結(jié)果做統(tǒng)計(jì),若存在最大概率的分類(lèi)標(biāo)簽可以決定最終分類(lèi)結(jié)果;否則由4)計(jì)算得到分類(lèi)結(jié)果。
4)最終分類(lèi)結(jié)果的標(biāo)簽由式(3)計(jì)算得到,定義如下:
其中,y為最終預(yù)測(cè)分類(lèi)標(biāo)簽,n為分類(lèi)正確的個(gè)數(shù),c為顏色空間種類(lèi)個(gè)數(shù);Pc為太陽(yáng)能電池片在各顏色空間預(yù)測(cè)的標(biāo)簽。w為分類(lèi)投票權(quán)重,當(dāng)Pc等于Pr時(shí),w賦值為1,否則,w賦值為0。
本實(shí)驗(yàn)中太陽(yáng)能電池片的數(shù)據(jù)采集平臺(tái)是由環(huán)形無(wú)影光源和固定在頂端的工業(yè)相機(jī)組成,工業(yè)相機(jī)型號(hào)為Basler acA2500。如圖5所示。通過(guò)拍攝6類(lèi)不同顏色的太陽(yáng)能電池片,并隨機(jī)翻轉(zhuǎn)增強(qiáng)太陽(yáng)能電池片數(shù)據(jù)集最終得到2934張圖片,圖片尺寸大小為224×224。將每類(lèi)太陽(yáng)能電池片圖片按8∶2的比例分成訓(xùn)練集和測(cè)試集。
圖5 太陽(yáng)能電池片的數(shù)據(jù)采集平臺(tái)
本次實(shí)驗(yàn)硬件平臺(tái)顯卡為RTX2080Ti,軟件平臺(tái)為python,應(yīng)用TensorFlow框架構(gòu)建改進(jìn)的LeNet-5分類(lèi)模型,結(jié)合不同的顏色空間實(shí)現(xiàn)太陽(yáng)能電池片的智能分類(lèi)。實(shí)驗(yàn)首先比較分析不同模型在太陽(yáng)能電池片分類(lèi)中的性能,驗(yàn)證了改進(jìn)的LeNet-5網(wǎng)絡(luò)的有效性;然后對(duì)不同的顏色空間組合對(duì)太陽(yáng)能電池片分類(lèi)效果做分析,發(fā)現(xiàn)RGB、Lab和HSV三種顏色空間的組合模型分類(lèi)效果最佳,準(zhǔn)確率高達(dá)94.56%。
4.2.1 不同模型在太陽(yáng)能電池片分類(lèi)性能比較
圖6 太陽(yáng)能電池片在不同網(wǎng)絡(luò)的識(shí)別準(zhǔn)確率
為了驗(yàn)證改進(jìn)的LeNet-5網(wǎng)絡(luò)性能,本文太陽(yáng)能電池片基礎(chǔ)分類(lèi)模型與傳統(tǒng)的LeNet-5網(wǎng)絡(luò)、bp神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)(Support Vector Machine,SVM)進(jìn)行對(duì)比。設(shè)置迭代次數(shù)為3000次,批量大小為64,學(xué)習(xí)率為0.0001。太陽(yáng)能電池片隨迭代次數(shù)在不同網(wǎng)絡(luò)上的識(shí)別準(zhǔn)確率結(jié)果如圖6所示。由圖6可知,改進(jìn)的LeNet-5網(wǎng)絡(luò)在識(shí)別準(zhǔn)確率上均高于其他網(wǎng)絡(luò)。傳統(tǒng)的LeNet-5網(wǎng)絡(luò)因sig?moid激活函數(shù)收斂速度慢,學(xué)習(xí)能力差,實(shí)現(xiàn)太陽(yáng)能電池片分類(lèi)的準(zhǔn)確率維持在45%左右,分類(lèi)效果差。另外,由于太陽(yáng)能電池片表面顏色差別小且不均勻,提取的顏色特征容易對(duì)Bp神經(jīng)網(wǎng)絡(luò)和SVM造成分類(lèi)影響,因此對(duì)太陽(yáng)能電池片識(shí)別準(zhǔn)確均低于改進(jìn)的LeNet-5網(wǎng)絡(luò)。
4.2.2 不同顏色空間對(duì)太陽(yáng)能電池片分類(lèi)效果分析
表2 太陽(yáng)能電池片在結(jié)合不同顏色空間的準(zhǔn)確率
基于太陽(yáng)能電池片在不同顏色空間的識(shí)別準(zhǔn)確率不同,因此結(jié)合不同顏色空間相去實(shí)現(xiàn)太陽(yáng)能電池片的分類(lèi),表2給出結(jié)合不同顏色空間的分類(lèi)結(jié)果。
由表2可知,太陽(yáng)能電池片在結(jié)合YUV和YCbCr顏色空間時(shí),準(zhǔn)確率都會(huì)有所下降。這是由于太陽(yáng)能電池片最主要的顯性特征是顏色,從YUV和YCbCr顏色空間的物理意義和開(kāi)發(fā)角度可知這兩個(gè)顏色空間將亮度和色度分離,更加注重亮度,減少了色度分量。而RGB、HSV和Lab顏色空間是基于顏色感知的顏色模型,用飽和度和色調(diào)描述色彩,更有利于基于顏色分類(lèi)的應(yīng)用。
另外,結(jié)合表1和表2可發(fā)現(xiàn)當(dāng)識(shí)別太陽(yáng)能電池片準(zhǔn)確率較高的顏色空間結(jié)合識(shí)別準(zhǔn)確率較低的顏色空間時(shí),準(zhǔn)確率會(huì)有所下降;識(shí)別太陽(yáng)能電池片準(zhǔn)確率較高的顏色空間結(jié)合識(shí)別準(zhǔn)確率較高的顏色空間時(shí),準(zhǔn)確率都會(huì)有所上升。因此結(jié)合多個(gè)識(shí)別準(zhǔn)確率高的顏色空間會(huì)得到較好的識(shí)別準(zhǔn)確率。所以針對(duì)本文太陽(yáng)能電池片分類(lèi)問(wèn)題,最終選擇結(jié)合RGB、Lab和HSV三種顏色空間實(shí)現(xiàn)太陽(yáng)能電池片的智能分類(lèi),分類(lèi)準(zhǔn)確率為94.56%。
本文在對(duì)太陽(yáng)能電池片分類(lèi)識(shí)別問(wèn)題的研究上引入卷積神經(jīng)網(wǎng)絡(luò)方法,針對(duì)傳統(tǒng)LeNet-5卷積神經(jīng)網(wǎng)絡(luò)在太陽(yáng)能電池片分類(lèi)識(shí)別上的不足進(jìn)行改進(jìn),使太陽(yáng)能電池片識(shí)別準(zhǔn)確率均高于傳統(tǒng)的LeNet-5網(wǎng)絡(luò)、bp神經(jīng)網(wǎng)絡(luò)和SVM。并在改進(jìn)的LeNet-5網(wǎng)絡(luò)基礎(chǔ)上,研究不同顏色空間對(duì)于太陽(yáng)能電池片分類(lèi)的影響。實(shí)驗(yàn)結(jié)果表明太陽(yáng)能電池片在結(jié)合RGB、Lab和HSV三種顏色空間時(shí)獲得最高準(zhǔn)確,而在YUV和YCbCr顏色空間準(zhǔn)確率較低,不適合用于太陽(yáng)能電池片分類(lèi)。與傳統(tǒng)方法相比,本文算法更加高效,具有較好的泛化性,分類(lèi)準(zhǔn)確率滿(mǎn)足工業(yè)應(yīng)用需求。