摘"要:精準(zhǔn)識(shí)別鐵路車(chē)號(hào)可以為煤廠(chǎng)裝車(chē)提供依據(jù),從而保證裝車(chē)環(huán)節(jié)高效順利地完成。為此,提出了基于深度信任網(wǎng)絡(luò)模型的烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像識(shí)別方法。首先,利用高速攝像機(jī)設(shè)備采集原始的車(chē)號(hào)圖像,并利用索貝爾算子檢測(cè)圖像邊界;然后,根據(jù)列車(chē)車(chē)號(hào)的字體筆畫(huà)寬度特點(diǎn),采筆畫(huà)寬度變換算法定位確定圖像中的車(chē)號(hào)區(qū)域,并利用LBP算法提取車(chē)號(hào)區(qū)域內(nèi)的特征;最后,將提取的特征輸入到深度信任網(wǎng)絡(luò)模型中,在訓(xùn)練網(wǎng)絡(luò)模型并不斷更新參數(shù)后,準(zhǔn)確識(shí)別車(chē)號(hào)圖像。實(shí)驗(yàn)表明:該方法能夠精準(zhǔn)識(shí)別烏東選煤廠(chǎng)鐵路列車(chē)車(chē)號(hào)圖像。在深度信任網(wǎng)絡(luò)模型中,當(dāng)受限玻爾茲曼機(jī)網(wǎng)絡(luò)為4層、隱含層節(jié)點(diǎn)個(gè)數(shù)為128個(gè)時(shí),該模型的分類(lèi)識(shí)別能力最強(qiáng),訓(xùn)練損失最小,性能最佳。
關(guān)鍵詞:深度信任網(wǎng)絡(luò);邊界檢測(cè);車(chē)號(hào)定位;圖像識(shí)別;筆畫(huà)寬度變換;特征提取
中圖分類(lèi)號(hào):TP751""""""文獻(xiàn)標(biāo)識(shí)碼:A
Image"Recognition"Method"of"Railway"Car"Number"of"Wudong"
Coal"Preparation"Plant"Based"on"Deep"Trust"Network"Model
WEI"Weijie1,"QI"Jian1,"ZHOU"Nan1,"LIU"Huanan1,"GAO"Huiying2
(1.National"Energy"Group"Xinjiang"Energy"Co.,"Ltd.,"washing"Center,Urumqi,"Xinjiang"830000,"China;
2.Tianjin"Meiteng"Technology"Co.,Ltd.,"Tianjin"300000,China)
Abstract:Accurate"identification"of"railway"vehicle"number"can"provide"basis"for"coal"plant"loading,"thus"ensuring"the"efficient"and"smooth"completion"of"the"loading"process."Therefore,"a"method"of"railway"vehicle"number"image"recognition"based"on"deep"trust"network"model"in"Wudong"Coal"Preparation"Plant"is"proposed."Firstly,"the"original"vehicle"number"image"is"collected"by"highspeed"camera"equipment,"and"the"image"boundary"is"detected"by"Sobel"operator;"Then,"based"on"the"font"stroke"width"characteristics"of"the"train"number,"a"stroke"width"transformation"algorithm"is"used"to"locate"and"determine"the"train"number"area"in"the"image,"and"the"LBP"algorithm"is"used"to"extract"features"within"the"train"number"area;"Finally,"the"extracted"features"are"input"into"the"deep"trust"network"model."After"training"the"network"model"and"constantly"updating"the"parameters,"the"vehicle"number"image"is"accurately"recognized."The"experiment"shows"that"this"method"can"accurately"recognize"the"train"number"image"of"Wudong"Coal"Preparation"Plant."In"the"deep"trust"network"model,"when"the"restricted"Boltzmann"network"is"4"layers"and"the"number"of"hidden"layer"nodes"is"128,"the"model"has"the"strongest"classification"recognition"ability,"the"minimum"training"loss"and"the"best"performance.
Key"words:deep"trust"network;"boundary"detection;"vehicle"number"positioning;"image"recognition;"stroke"width"change;"feature"extraction
烏東選煤廠(chǎng)坐落于新疆,是我國(guó)西部地區(qū)規(guī)模最大的動(dòng)力煤選煤廠(chǎng)[1,2]。在該煤廠(chǎng)原裝車(chē)系統(tǒng)中,已配備了RFID車(chē)號(hào)識(shí)別系統(tǒng),正常情況下可以滿(mǎn)足日常作業(yè)需求,但是車(chē)廂射頻識(shí)別IC卡消磁或RFID系統(tǒng)出現(xiàn)故障時(shí),則無(wú)法對(duì)煤廠(chǎng)鐵路車(chē)號(hào)進(jìn)行識(shí)別,進(jìn)而影響裝車(chē)作業(yè)進(jìn)度。另外在自動(dòng)化改造的大環(huán)境下,對(duì)鐵路車(chē)號(hào)實(shí)行自動(dòng)化識(shí)別改造也是一種趨勢(shì),所以提出另外一種鐵路車(chē)號(hào)圖像識(shí)別方法對(duì)原有RFID車(chē)號(hào)識(shí)別系統(tǒng)進(jìn)行補(bǔ)充非常必要[3-5]。
近年來(lái),國(guó)內(nèi)外學(xué)者關(guān)于車(chē)號(hào)圖像識(shí)別問(wèn)題進(jìn)行了較多研究,并取得了一定的研究成果,如李猛坤等[6]利用車(chē)載視頻獲取原始車(chē)號(hào)圖像,再通過(guò)濾鏡算法對(duì)原始車(chē)號(hào)圖像實(shí)行預(yù)處理,去除圖像噪聲及畸變影響,再將去噪后的圖像輸入至深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中識(shí)別車(chē)號(hào)。王志明等[7]依據(jù)YOLOv3算法將車(chē)號(hào)圖像的識(shí)別過(guò)程分為兩個(gè)階段,首先是利用全局檢測(cè)確定車(chē)號(hào)所在區(qū)域,然后通過(guò)局部檢測(cè)獲取車(chē)號(hào)字符,依據(jù)字符的空間關(guān)系確定最終的車(chē)號(hào)。上述兩種方法雖然可以對(duì)車(chē)號(hào)圖像起到一定的識(shí)別作用,但是第一種方法在對(duì)車(chē)號(hào)圖像進(jìn)行識(shí)別前沒(méi)有對(duì)車(chē)號(hào)所在區(qū)域進(jìn)行定位,這會(huì)導(dǎo)致算法在對(duì)車(chē)號(hào)進(jìn)行識(shí)別時(shí),不能直接找到準(zhǔn)確位置,影響識(shí)別效率;第二種方法則沒(méi)有對(duì)原始車(chē)號(hào)圖像進(jìn)行預(yù)處理,這樣會(huì)影響最終的識(shí)別效果。
此外,文獻(xiàn)[8]中提出了一種基于深度學(xué)習(xí)的模糊車(chē)牌字符識(shí)別方法,該方法首先將卷積循環(huán)神經(jīng)網(wǎng)絡(luò)中的常規(guī)卷積神經(jīng)網(wǎng)絡(luò)改為深度可分離的微改模型,并引入CTC損失函數(shù)訓(xùn)練網(wǎng)絡(luò)模型?;诖?,為避免模型訓(xùn)練過(guò)程過(guò)擬合,在損失函數(shù)中加入L2正則項(xiàng)。最后,引入批量歸一化算法來(lái)加快訓(xùn)練過(guò)程中的學(xué)習(xí)速度,使得該方法可以在復(fù)雜場(chǎng)景下識(shí)別模糊車(chē)牌字符。文獻(xiàn)[9]中提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的復(fù)雜光照變化車(chē)牌圖像識(shí)別方法。該方法針對(duì)復(fù)雜光照變化環(huán)境,首先對(duì)車(chē)牌圖像的核心目標(biāo)實(shí)施聚類(lèi)增強(qiáng),并將其輸入到深度可分離卷積網(wǎng)絡(luò)中,獲取車(chē)牌圖像特征圖。然后,將其變換為特征序列,通過(guò)雙向循環(huán)神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)與預(yù)測(cè)過(guò)程,得到車(chē)牌圖像特征序列,從而實(shí)現(xiàn)對(duì)車(chē)牌圖像的識(shí)別?;谏鲜龇治?,考慮到深度信任網(wǎng)絡(luò)模型是深度學(xué)習(xí)模型的一種,該模型兼具了無(wú)監(jiān)督學(xué)習(xí)與有監(jiān)督學(xué)習(xí)的優(yōu)點(diǎn),具有學(xué)習(xí)深度高、分類(lèi)識(shí)別能力強(qiáng)的特點(diǎn)[10],因此,本文提出基于深度信任網(wǎng)絡(luò)模型的烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像識(shí)別方法,可以實(shí)現(xiàn)對(duì)烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像的精準(zhǔn)識(shí)別,具有較強(qiáng)的應(yīng)用性。
1"烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像識(shí)別
1.1"烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像識(shí)別基本框架
通常情況下,列車(chē)車(chē)號(hào)由字母和數(shù)字混合組成,采用噴繪的方式標(biāo)識(shí)在列車(chē)上[11,12],烏東選煤廠(chǎng)也采用此種方法對(duì)鐵路列車(chē)車(chē)號(hào)進(jìn)行標(biāo)識(shí)。列車(chē)車(chē)號(hào)的特點(diǎn)主要為:
①車(chē)號(hào)字符容易受到光照條件影響;
②車(chē)號(hào)字符采用水平方式進(jìn)行排列,但沒(méi)有明顯輪廓邊框;
③車(chē)號(hào)區(qū)域周?chē)臋M向紋理較為顯著;
④車(chē)號(hào)字符的筆畫(huà)寬度大致相同,但大小未必相同。
根據(jù)烏東選煤廠(chǎng)鐵路列車(chē)運(yùn)行實(shí)際情況,結(jié)合列車(chē)車(chē)號(hào)的特點(diǎn),設(shè)計(jì)了烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像識(shí)別基本框架,如圖1所示。
圖1"車(chē)號(hào)圖像識(shí)別基本框架
根據(jù)此基本框架可知,對(duì)烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像進(jìn)行識(shí)別主要分為五個(gè)部分,即車(chē)號(hào)圖像的采集、圖像預(yù)處理、車(chē)號(hào)區(qū)域定位、圖像特征提取、字符識(shí)別。其中,車(chē)號(hào)區(qū)域定位是整個(gè)識(shí)別方法中較為重要的部分,它是進(jìn)行鐵路車(chē)號(hào)圖像識(shí)別的前提,只有精準(zhǔn)定位了車(chē)號(hào)所在區(qū)域,才能實(shí)現(xiàn)烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像的正確識(shí)別。
1.2"烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像的采集與預(yù)處理
1.2.1"車(chē)號(hào)圖像采集
烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像的采集可以通過(guò)高速攝像機(jī)、數(shù)碼相機(jī)等設(shè)備來(lái)實(shí)現(xiàn),具體做法為:在拍攝區(qū)域內(nèi)安裝可調(diào)節(jié)支架,將裝有拍攝設(shè)備的保護(hù)箱固定在支架上,根據(jù)實(shí)際情況對(duì)支架高度與角度進(jìn)行調(diào)整,并利用LED光源對(duì)拍攝區(qū)域的光線(xiàn)進(jìn)行補(bǔ)償,以此提升拍攝圖像的質(zhì)量。
1.2.2"車(chē)號(hào)圖像預(yù)處理
由于采集到的烏東選煤廠(chǎng)鐵路原始車(chē)號(hào)圖像通常為連續(xù)的動(dòng)態(tài)圖像,圖像的邊界較為模糊,不利于車(chē)號(hào)的識(shí)別。為了增強(qiáng)車(chē)號(hào)圖像邊界,避免圖像干擾,就需要對(duì)采集到的原始車(chē)號(hào)圖像進(jìn)行邊界檢測(cè)。車(chē)號(hào)圖像邊界實(shí)際就是某些像素點(diǎn)的集合,這些像素點(diǎn)描述了四周像素灰度值出現(xiàn)階躍或屋頂?shù)母淖?,使圖像灰度具有間斷性。圖像邊界檢測(cè)的結(jié)果直接影響后續(xù)圖像的定位與識(shí)別。本文采用在邊界問(wèn)題中應(yīng)用較為廣泛的索貝爾(Sobel)算子對(duì)烏東選煤廠(chǎng)鐵路原始車(chē)號(hào)圖像進(jìn)行邊界檢測(cè)。
令G(x,y)表示烏東選煤廠(chǎng)鐵路原始車(chē)號(hào)圖像,選定相同尺寸區(qū)域中的數(shù)據(jù),在3×3的矩陣模板中得到梯度值A(chǔ)。用A與設(shè)置好的臨界值C作對(duì)比。當(dāng)Agt;C時(shí),該區(qū)域就是車(chē)號(hào)圖像的邊界;當(dāng)A≤C時(shí),該區(qū)域不是車(chē)號(hào)圖像的邊界。另外,不同場(chǎng)景中,A與C的值也不一樣,應(yīng)根據(jù)車(chē)號(hào)圖像實(shí)際的拍攝條件對(duì)臨界值進(jìn)行相應(yīng)的設(shè)置。針對(duì)烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像的灰度值,可將上一幀圖像的平均梯度值當(dāng)作目前幀圖像的梯度臨界值,再采用模板對(duì)檢測(cè)后的烏東選煤廠(chǎng)鐵路車(chē)號(hào)二值圖像實(shí)行腐蝕操作,去除孤立點(diǎn)并細(xì)化圖像邊緣,得到邊界清晰的車(chē)號(hào)圖像。
1.3"基于SWT算法的烏東選煤廠(chǎng)鐵路車(chē)號(hào)區(qū)域定位
由于列車(chē)車(chē)號(hào)具有字體筆畫(huà)寬度較為相近的特點(diǎn),為此本文從車(chē)號(hào)圖像的邊界特征著手,通過(guò)筆畫(huà)寬度變換(Stroke"Width"Transform,SWT)算法對(duì)烏東選煤廠(chǎng)鐵路車(chē)號(hào)進(jìn)行定位。SWT算法首先通過(guò)運(yùn)算得到關(guān)于筆畫(huà)寬度的車(chē)號(hào)圖像檢測(cè)圖,然后根據(jù)車(chē)號(hào)字符筆畫(huà)的寬度對(duì)檢測(cè)圖進(jìn)行挑選,形成連通域,提取所有具有可能性的候選車(chē)號(hào)區(qū)域,并分析這些候選區(qū)域的集合特征,從而獲取車(chē)號(hào)區(qū)域位置。
利用SWT算法對(duì)烏東選煤廠(chǎng)鐵路車(chē)號(hào)進(jìn)行定位的步驟如下。
步驟1:將經(jīng)過(guò)邊界檢測(cè)的烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像輸入至SWT算法中。
步驟2:計(jì)算所有車(chē)號(hào)圖像邊界點(diǎn)的筆劃寬度。設(shè)定車(chē)號(hào)圖像邊界像素點(diǎn)用P描述,沿梯度方向的射線(xiàn)用H=P+nDP(n≥0)描述,其中,筆劃寬度用D描述,搜尋范圍用n=5D描述。由P開(kāi)始沿H進(jìn)行搜尋,若搜尋到另一個(gè)邊界像素Q,如果Q和P的梯度指向相反且DP+DQlt;π2,則終止搜尋,二者構(gòu)成一個(gè)筆畫(huà),其寬度D=‖P-Q‖。如果在ngt;5D時(shí),仍未找到符合要求的P,則選擇新的邊界點(diǎn)進(jìn)行上述操作。
步驟3:利用步驟2遍歷整個(gè)烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像,得到SWT檢測(cè)圖,并進(jìn)行二值化操作。如果拐角位置出現(xiàn)同一邊界點(diǎn)存在多個(gè)筆畫(huà)寬度,且每個(gè)寬度值均不正確,那么就需要對(duì)其進(jìn)行二次運(yùn)算,得到合理的筆畫(huà)寬度值。
步驟4:根據(jù)車(chē)號(hào)字符筆畫(huà)的寬度對(duì)檢測(cè)圖進(jìn)行挑選,形成連通域。
步驟5:將獲取的分散的連通域形成車(chē)號(hào)區(qū)域。根據(jù)車(chē)號(hào)字體筆畫(huà)寬度較為相近的分布特點(diǎn),通過(guò)閉運(yùn)算去掉中間間隔,初步篩選連通域,然后將符合筆畫(huà)寬度條件的像素點(diǎn)通過(guò)高斯濾波直接聚合成車(chē)號(hào)區(qū)域,再根據(jù)車(chē)號(hào)區(qū)域的幾何特征進(jìn)行二次篩選,最終鎖定車(chē)號(hào)區(qū)域位置。
1.4"烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像識(shí)別
為了減少模型的運(yùn)算量,提升車(chē)號(hào)圖像的識(shí)別效率,在對(duì)烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像進(jìn)行識(shí)別前,先對(duì)其進(jìn)行特征提取。
1.4.1"基于LBP算法提取車(chē)號(hào)圖像特征
局部二值模式(Local"Binary"Patterns,LBP)算法是描述圖像局部特征的非參數(shù)算法,可以較好地表示出特征像素點(diǎn)和所有像素點(diǎn)的灰度關(guān)系,尤其在圖像紋理信息提取方面的表現(xiàn)極為突出[13-15]。而烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像的特征主要就表現(xiàn)在紋理特征方面,因此本文利用該算法對(duì)其進(jìn)行特征提取。
通常情況下,LBP算法的鄰域?yàn)?×3的窗口,設(shè)定經(jīng)過(guò)定位后的烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像中位于某一區(qū)域的像素點(diǎn)用sm(xm,ym)描述,并將其作為參考值。然后,對(duì)該像素點(diǎn)8個(gè)方向上的鄰域像素點(diǎn)實(shí)施二值化處理,從而獲得各像素點(diǎn)的灰度值s′。如果s′≤sm,那么鄰域點(diǎn)值就設(shè)置成0;如果灰度值s′gt;sm,則鄰域點(diǎn)值設(shè)置成1。關(guān)于LBP的編碼可以描述為:
TLBP(xm,ym)=∑7k=0f(sk-sm)2kf(x)=1,xgt;00,x≤0(1)
式中,位置是k的鄰域像素點(diǎn)用sk描述。
利用LBP算法提取烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像特征的過(guò)程可以描述為:首先利用LBP對(duì)車(chē)號(hào)圖像各像素點(diǎn)進(jìn)行編碼,得到烏東選煤廠(chǎng)鐵路車(chē)號(hào)LBP編碼圖像,然后提取LBP直方圖,利用直方圖描述烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像特征。為了方便后續(xù)運(yùn)算,將提取出的特征轉(zhuǎn)換為數(shù)據(jù)矩陣。
1.4.2"基于深度信任網(wǎng)絡(luò)模型的鐵路車(chē)號(hào)圖像
識(shí)別
深度信任網(wǎng)絡(luò)(Deep"Belief"Network,DBN)在各類(lèi)識(shí)別問(wèn)題中有著廣泛的應(yīng)用,其可以分為兩部分內(nèi)容,分別為受限玻爾茲曼機(jī)(RBM)網(wǎng)絡(luò)與BP神經(jīng)網(wǎng)絡(luò),其中RBM是無(wú)監(jiān)督網(wǎng)絡(luò),層數(shù)為多個(gè),而B(niǎo)P網(wǎng)絡(luò)則為有監(jiān)督網(wǎng)絡(luò),層數(shù)為1個(gè)。本文采用DBN模型對(duì)烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像進(jìn)行識(shí)別。
深度信任網(wǎng)絡(luò)的訓(xùn)練分為預(yù)訓(xùn)練與微調(diào)二部分。其中,預(yù)訓(xùn)練主要是針對(duì)RBM的訓(xùn)練,其訓(xùn)練方式為依次訓(xùn)練所有的層次;而微調(diào)部分則是利用對(duì)BP網(wǎng)絡(luò)的訓(xùn)練來(lái)調(diào)節(jié)整個(gè)DBN參數(shù)。總的來(lái)說(shuō),訓(xùn)練RBM在本質(zhì)上就是對(duì)BP網(wǎng)絡(luò)權(quán)值的初始化,這樣可以解決BP網(wǎng)絡(luò)訓(xùn)練時(shí)間過(guò)長(zhǎng)以及易進(jìn)入局部最優(yōu)的問(wèn)題,從而可以快速、準(zhǔn)確地對(duì)烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像進(jìn)行識(shí)別。
①RBM
RBM的主要結(jié)構(gòu)為可見(jiàn)層和隱含層,二者間以神經(jīng)元互聯(lián)的形式連接,各層內(nèi)部則不存在任何連接。
設(shè)定可見(jiàn)層和隱含層都是二值變量,兩層中神經(jīng)元個(gè)數(shù)用I與J描述,可見(jiàn)層內(nèi)處于位置i的神經(jīng)元用vi描述,隱含層內(nèi)處于位置j的神經(jīng)元用hj描述,那么關(guān)于RBM的能量函數(shù)可以描述成:
E(v,hθ)=-∑Ii=1aivi-∑Jj=1bjhj-
∑Ii=1∑Jj=1wijvihj(2)
式中,vi和hj的連接權(quán)值用wij描述,二者的偏置值分別用ai和bj描述,RBM的參數(shù)用θ=(wij,ai,bj)描述?;贓(v,hθ),獲取關(guān)于(v,h)的聯(lián)合概率分布為:
p(v,hθ)=exp-E(v,hθ)/Z(θ)"(3)
式中,配分函數(shù)用Z(θ)=∑v∑hexp-E(v,hθ)描述。
因?yàn)镽BM中各層中的神經(jīng)元沒(méi)有任何連接關(guān)系,如果已知可見(jiàn)層中節(jié)點(diǎn)狀態(tài),所有隱含層中節(jié)點(diǎn)在激活狀態(tài)下互為獨(dú)立,那么隱含層中位置是j的節(jié)點(diǎn)的激活概率可以描述為:
p(hj=1v,θ)=σ(bj+∑Ii=1wijvi)(4)
式中,Sigmoid函數(shù)用σ(x)=11+exp"-x描述。
如果已知隱含層中節(jié)點(diǎn)狀態(tài),那么可見(jiàn)層中位置是i的節(jié)點(diǎn)的激活概率可以描述為:
p(vi=1h,θ)=σ(ai+∑Jj=1wijhj)(5)
獲取θ值是RBM訓(xùn)練要實(shí)現(xiàn)的目標(biāo),只有得到θ值,才可以擬合訓(xùn)練數(shù)據(jù)。θ的獲取可以描述為:
θ=arg"max"L(θ)θ=
arg"max"∑Mm′=1ln"p(vm′θ)θ(6)
式中,似然函數(shù)用L()描述,樣本數(shù)量用M描述,m′∈M。
利用對(duì)比散度(Contrastive"Divergence,CD)算法更新來(lái)RBM中的參數(shù),過(guò)程如下:
Δwij=l(〈vihj〉data-〈vihj〉recon)(7)
Δai=l(〈vi〉data-〈vi〉recon)(8)
Δbj=l(〈hj〉data-〈hj〉recon)"(9)
式中,學(xué)習(xí)率用l描述,數(shù)學(xué)期望用〈〉data描述,更新后的期望用〈〉recon描述。
②BP網(wǎng)絡(luò)
在DBN中,可以將BP網(wǎng)絡(luò)看作有監(jiān)督的識(shí)別器,識(shí)別從RBM獲取的關(guān)于烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像的向量信息,并調(diào)整深度信任網(wǎng)絡(luò)的參數(shù),通過(guò)迭代尋優(yōu)實(shí)現(xiàn)對(duì)烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像的準(zhǔn)確識(shí)別。
BP網(wǎng)絡(luò)的訓(xùn)練方式為前向與后向相結(jié)合的傳播方式。首先把RBM獲取的關(guān)于烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像向量信息由輸入層傳播至輸出層,得到烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像識(shí)別結(jié)果,用該結(jié)果與預(yù)設(shè)的期望結(jié)果對(duì)比可得二者誤差,此過(guò)程為前向傳播;后向傳播的目的在于向后回傳誤差,并調(diào)整DBN參數(shù)。在后向傳播時(shí),需要求出各層的靈敏度ζ,利用ζ的傳播調(diào)整權(quán)值參數(shù)。在輸出層中,假設(shè)ci、gi分別表示節(jié)點(diǎn)i處的實(shí)際輸出與期望輸出,則ζ的計(jì)算過(guò)程為:
ζi=ci(1-ci)(gi-ci)"(10)
對(duì)于位置是l的隱含層來(lái)說(shuō),其ζ可以描述為:
ζli=yli(1-yli)∑jwlijζl+1j"(11)
式中,隱含層l的輸出用yli描述。
求得每一層的靈敏度后,便可以更新DBN的權(quán)值參數(shù),描述為:
wlij=wlij+l′×yliζl+1j(12)
blj=blj+l′×ζl+1j"(13)
利用上述方法便可完成DBN模型的構(gòu)建。將經(jīng)過(guò)特征提取后的烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像數(shù)據(jù)輸入至DBN模型中,最終可實(shí)現(xiàn)車(chē)號(hào)圖像的識(shí)別。
綜上所述,基于LBPDBN算法的烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像識(shí)別的實(shí)現(xiàn)過(guò)程如下。
過(guò)程1:在烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像樣本集中,劃分出訓(xùn)練集與測(cè)試集兩部分。然后利用LBP算法提取樣本特征,將提取后的特征轉(zhuǎn)換成行向量數(shù)據(jù)矩陣,將用于模型訓(xùn)練的特征數(shù)據(jù)矩陣集作為訓(xùn)練數(shù)據(jù)集。
過(guò)程2:構(gòu)建關(guān)于烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像識(shí)別的DBN模型。設(shè)置DBN模型RBN層數(shù)為4層、各隱含層節(jié)點(diǎn)個(gè)數(shù)為128個(gè)。
過(guò)程3:將轉(zhuǎn)換成特征數(shù)據(jù)矩陣的訓(xùn)練樣本輸入至構(gòu)建好的DBN模型內(nèi)進(jìn)行訓(xùn)練。在RBN網(wǎng)絡(luò)中,上一層隱含層的輸出可當(dāng)作下一層可見(jiàn)層的輸入,利用CD算法逐層迭代訓(xùn)練RBN網(wǎng)絡(luò)包含的所有層,直至訓(xùn)練完成,得到RBN網(wǎng)絡(luò)的最優(yōu)參數(shù)。
過(guò)程4:將獲取的RBN最優(yōu)參數(shù)輸入BP網(wǎng)絡(luò)中,在正反向傳播過(guò)程中,根據(jù)靈敏度的變化情況調(diào)整模型的參數(shù),得到最優(yōu)模型。
過(guò)程5:將轉(zhuǎn)換成特征數(shù)據(jù)矩陣的測(cè)試樣本輸入至已調(diào)整好的DBN模型內(nèi)進(jìn)行測(cè)試,得到烏東選煤廠(chǎng)鐵路車(chē)號(hào),完成對(duì)車(chē)號(hào)圖像的識(shí)別。
2"實(shí)驗(yàn)與結(jié)果分析
以烏東選煤廠(chǎng)鐵路列車(chē)為實(shí)驗(yàn)對(duì)象,該廠(chǎng)屬于礦井型選煤廠(chǎng),使用的是重介工藝,洗選深度高,生產(chǎn)能力強(qiáng),產(chǎn)品質(zhì)量好。該選煤廠(chǎng)生產(chǎn)出的產(chǎn)品主要通過(guò)鐵路運(yùn)輸?shù)姆绞竭M(jìn)行運(yùn)送。
為了驗(yàn)證本文方法的有效性,實(shí)驗(yàn)對(duì)烏東選煤廠(chǎng)鐵路列車(chē)車(chē)號(hào)進(jìn)行了識(shí)別。實(shí)驗(yàn)使用Basler"acA1920-40gc"GigE高速攝像機(jī)、Kowa"LM6HC工業(yè)鏡頭、100"W可控LED補(bǔ)償光源作為獲取原始車(chē)號(hào)圖像的拍攝設(shè)備。實(shí)驗(yàn)相關(guān)參數(shù)如表1所示。
由圖2可知,根據(jù)烏東選煤廠(chǎng)鐵路列車(chē)車(chē)號(hào)圖像平臺(tái)可以直觀(guān)地看出,利用本文方法對(duì)烏東選煤廠(chǎng)鐵路列車(chē)車(chē)號(hào)進(jìn)行了精準(zhǔn)定位與識(shí)別,最后得到的識(shí)別結(jié)果為C800025874,與采集的車(chē)號(hào)圖像信息一致。由此說(shuō)明本文方法有效,且識(shí)別精度高,可以為烏東選煤廠(chǎng)裝車(chē)作業(yè)提供依據(jù)。
Kappa系數(shù)是描述識(shí)別結(jié)果和參考數(shù)據(jù)符合程度的評(píng)價(jià)指標(biāo),具有較強(qiáng)的客觀(guān)性。該指標(biāo)值與識(shí)別精度呈正相關(guān)性。因此實(shí)驗(yàn)在不同信噪比條件下,運(yùn)用Kappa系數(shù)對(duì)本文方法的性能進(jìn)行考量。Kappa系數(shù)可以描述為:
K=N∑i=1oii-∑i=1(oi+o′i)N2-∑i=1(oi+o′i)(14)
式中,樣本總數(shù)用N描述,混淆矩陣中位于第i行與第i列數(shù)據(jù)分別用oi和o′i描述。
經(jīng)過(guò)測(cè)試得出的實(shí)驗(yàn)結(jié)果,如圖3所示。
由圖3可知,利用本文方法識(shí)別烏東選煤廠(chǎng)鐵路列車(chē)車(chē)號(hào)圖像,在Kappa系數(shù)方面表現(xiàn)較好,即使是在信噪比為0,學(xué)習(xí)率為0.03的條件下,Kappa系數(shù)值也達(dá)到0.85以上;當(dāng)信噪比為160"dB,學(xué)習(xí)率為0.05時(shí),Kappa系數(shù)值更是接近1。由此說(shuō)明,本文方法對(duì)于烏東選煤廠(chǎng)鐵路列車(chē)車(chē)號(hào)圖像的識(shí)別精度高,性能好。
為了測(cè)試網(wǎng)絡(luò)深度及節(jié)點(diǎn)個(gè)數(shù)對(duì)DBN模型分類(lèi)識(shí)別效果的影響,實(shí)驗(yàn)在識(shí)別不同數(shù)量烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像的情況下,對(duì)DBN模型中RBN層數(shù)為3層、4層、5層時(shí)的識(shí)別精度,以及各隱含層節(jié)點(diǎn)個(gè)數(shù)分別為64、128、256時(shí)的訓(xùn)練損失情況進(jìn)行了測(cè)試,得出的結(jié)果如圖4所示。
由圖4可知,從識(shí)別精度方面看,RBN層數(shù)為4層時(shí)DBN模型的識(shí)別精度最高,均在95%以上,尤其是車(chē)號(hào)圖像數(shù)量為50時(shí),識(shí)別精度已趨于100%,而其他結(jié)構(gòu)的DBN模型的在識(shí)別精度方面均遜色于該結(jié)構(gòu)。由此說(shuō)明,在DBN模型中RBN層數(shù)設(shè)置4層時(shí),有著較強(qiáng)的分類(lèi)識(shí)別能力。
從訓(xùn)練損失方面看,各條訓(xùn)練損失曲線(xiàn)均隨著車(chē)號(hào)圖像數(shù)量的增加呈小幅度上升趨勢(shì),其中各隱含層節(jié)點(diǎn)的數(shù)量為264個(gè)時(shí),DBN模型的訓(xùn)練損失最大;隱含層節(jié)點(diǎn)的數(shù)量為128個(gè)時(shí),訓(xùn)練損失值最小。
綜上所述,當(dāng)RBN層數(shù)為4層、各隱含層節(jié)點(diǎn)個(gè)數(shù)為128個(gè)時(shí),DBN模型的分類(lèi)識(shí)別能力最強(qiáng),訓(xùn)練損失最小,性能最佳。
3"結(jié)"論
為了解決烏東選煤廠(chǎng)原裝車(chē)系統(tǒng)中,有時(shí)不能識(shí)別鐵路列車(chē)車(chē)號(hào)的問(wèn)題,提出了一種基于深度信任網(wǎng)絡(luò)模型的烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像識(shí)別方法,對(duì)原有的裝車(chē)系統(tǒng)進(jìn)行了有力補(bǔ)充。該方法利用深度信任網(wǎng)絡(luò)模型較強(qiáng)的學(xué)習(xí)能力,實(shí)現(xiàn)了烏東選煤廠(chǎng)鐵路車(chē)號(hào)圖像的精確識(shí)別。通過(guò)實(shí)驗(yàn)證明,本文方法在車(chē)號(hào)圖像識(shí)別方面有著較好的表現(xiàn),比較適合用于此類(lèi)問(wèn)題的解決。
參考文獻(xiàn)
[1]"郭松,范存群.基于重要度理論的圖像識(shí)別方法[J].計(jì)算機(jī)集成制造系統(tǒng),2021,27(9):2736-2740.
[2]"劉昱彤,李鵬,孫云云,等.基于深度動(dòng)態(tài)聯(lián)合自適應(yīng)網(wǎng)絡(luò)的圖像識(shí)別方法[J].計(jì)算機(jī)科學(xué),2021,48(6):131-137.
[3]"王軍敏,樊養(yǎng)余,李祖賀.基于深度卷積神經(jīng)網(wǎng)絡(luò)和遷移學(xué)習(xí)的紋理圖像識(shí)別[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2022,34(5):701-710.
[4]"胡龍輝,王朝立,孫占全,等.基于WGAN的圖像識(shí)別方法[J].控制工程,2020,27(12):2168-2175.
[5]"樊紅衛(wèi),胡德順,高爍琪,等.基于深度信念網(wǎng)絡(luò)的鐵譜圖像智能識(shí)別方法與試驗(yàn)驗(yàn)證[J].潤(rùn)滑與密封,2021,46(7):15-22.
[6]"李猛坤,柯正軒,于定榮,等.基于移動(dòng)邊緣計(jì)算的車(chē)聯(lián)網(wǎng)車(chē)牌號(hào)碼識(shí)別算法[J].計(jì)算機(jī)工程與設(shè)計(jì),2021,42(11):3151-3157."
[7]"王志明,劉志輝,黃洋科,等.基于深度學(xué)習(xí)的高效火車(chē)號(hào)識(shí)別[J].工程科學(xué)學(xué)報(bào),2020,42(11):1525-1533.
[8]"張彩珍,李穎,康斌龍,等.基于深度學(xué)習(xí)的模糊車(chē)牌字符識(shí)別算法[J].激光與光電子學(xué)進(jìn)展,2021,58(16):259-266.
[9]"陸志香,楊梅.基于卷積神經(jīng)網(wǎng)絡(luò)的復(fù)雜光照變化車(chē)牌圖像識(shí)別[J].激光雜志,2022,43(5):145-150.
[10]劉洋,金忠.一種結(jié)合非局部和多區(qū)域注意力機(jī)制的細(xì)粒度圖像識(shí)別方法[J].計(jì)算機(jī)科學(xué),2021,48(1):197-203.
[11]趙升,趙黎.基于雙向特征金字塔和深度學(xué)習(xí)的圖像識(shí)別方法[J].哈爾濱理工大學(xué)學(xué)報(bào),2021,26(2):44-50."
[12]秦毅,吳蔚.基于CNN的計(jì)算機(jī)生成圖像識(shí)別方法[J].西南師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2019,44(5):109-114.
[13]曹子昱,任宛星,付連著,等.基于卷積神經(jīng)網(wǎng)絡(luò)的調(diào)車(chē)機(jī)車(chē)前方車(chē)列圖像識(shí)別算法[J].中國(guó)鐵道科學(xué),2020,41(6):156-163.
[14]徐自遠(yuǎn),蔡妍娜.復(fù)雜形狀物體的圖像識(shí)別方法研究[J].計(jì)算機(jī)仿真,2022,39(6):228-232.
[15]閆涵,張旭秀,張凈丹.多感知興趣區(qū)域特征融合的圖像識(shí)別方法[J].智能系統(tǒng)學(xué)報(bào),2021,16(2):263-270.
計(jì)算技術(shù)與自動(dòng)化2024年2期