邱 岳*,吳連軍
(中車工業(yè)研究院(青島)有限公司,山東 青島)
隨著軌道交通的快速發(fā)展,列車受電弓作為從接觸網(wǎng)導(dǎo)線上受取電流的關(guān)鍵裝置,在列車運(yùn)行中發(fā)揮著重要作用[1]。然而,受電弓的準(zhǔn)確定位是列車故障診斷中的關(guān)鍵問題。受電弓的錯(cuò)位或故障可能導(dǎo)致供電中斷、設(shè)備損壞甚至事故發(fā)生。因此,開展列車受電弓的智能定位研究,對(duì)提高軌道運(yùn)輸?shù)陌踩院涂煽啃跃哂兄匾饬x[2]。
近年來,隨著計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)等技術(shù)的快速發(fā)展,基于圖像處理的方法在列車受電弓定位研究中得到了廣泛應(yīng)用。而Haar-like 特征分類器,作為一種有效特征表示方法,具有對(duì)圖像灰度變化的良好描述能力和魯棒性[3]。通過利用Haar-like 特征分類器,可以對(duì)監(jiān)測(cè)圖像中受電弓位置進(jìn)行檢測(cè),從而為其故障診斷和維護(hù)提供重要依據(jù)。
本研究旨在基于Haar-like 特征分類器,開展列車受電弓智能定位的研究工作。通過采用積分圖計(jì)算方法高效提取Haar-like 特征,并結(jié)合Adaboost 級(jí)聯(lián)分類器的訓(xùn)練和檢測(cè)算法,實(shí)現(xiàn)對(duì)列車受電弓位置的實(shí)時(shí)監(jiān)測(cè)和定位。最后通過實(shí)驗(yàn)驗(yàn)證,提高列車受電弓定位的準(zhǔn)確性和穩(wěn)定性,為軌道交通系統(tǒng)的安全運(yùn)行及受電弓的故障檢測(cè)提供可靠的支持。
本文所提出基于Haar-like 特征分類器的列車受電弓智能定位技術(shù)原理如圖1 所示。首先,采用多樣化和全面的訓(xùn)練樣本集,綜合考慮了受電弓的識(shí)別特征和背景條件。同時(shí)對(duì)圖像樣本進(jìn)行了預(yù)處理,以確保數(shù)據(jù)的質(zhì)量和一致性。其次,使用四類高效的Haarlike 特征模板對(duì)受電弓的特征進(jìn)行提取。同時(shí)利用積分圖實(shí)現(xiàn)了Haar-like 特征值的計(jì)算,降低了計(jì)算復(fù)雜度并提高了處理速度。再次,采用Adaboost 學(xué)習(xí)算法對(duì)提取的Haar-like 特征進(jìn)行訓(xùn)練,生成強(qiáng)分類器。Adaboost 算法能夠有效地結(jié)合多個(gè)弱分類器,提高分類器的性能和準(zhǔn)確性。在線上實(shí)時(shí)識(shí)別過程中,對(duì)實(shí)時(shí)采集到的受電弓圖像進(jìn)行預(yù)處理。包括圖像預(yù)處理、Haar-like 特征提取和特征值的計(jì)算。最后,將提取的特征輸入訓(xùn)練完畢的強(qiáng)分類器中,以實(shí)現(xiàn)對(duì)受電弓目標(biāo)的準(zhǔn)確識(shí)別。
圖1 基于Haar 特征分類器的列車受電弓智能定位技術(shù)原理流程圖
由于受電弓的工作環(huán)境復(fù)雜多變,為了更為全方位多角度地分析受電弓的特征,本研究采用綜合分析策略,從顏色、形態(tài)、空間、紋理等目標(biāo)固有特征,光照和背景等外部特征進(jìn)行分析。通過上述分析策略,能更好地滿足受電弓圖像采樣的需求,并更為有效地選取合適的圖像特征。
圖像選取方面,考慮到受電弓遮擋、復(fù)雜背景、光照影響等影響因素。在顏色特征方面,除了在黑暗背景下,受電弓在不同背景下能夠與背景明顯區(qū)分開來。通過圖像觀察,可以清楚地看到受電弓在其他背景條件下具有鮮明的顏色特征,如圖2 所示。但不能排除天空及隧道中其他顏色因素的干擾。形態(tài)特征方面,受電弓以固定的弓形形態(tài)特征點(diǎn)呈現(xiàn),受電弓各個(gè)時(shí)間段內(nèi)結(jié)構(gòu)呈現(xiàn)大致相同的特征。
圖2 受電弓顏色特征
空間關(guān)系特征方面,主要考慮受電弓同天空背景中線纜、電桿、山體和建筑物的關(guān)系,如山體重疊、線桿遮擋。其中線桿遮擋是一個(gè)常見的難題,特別是線桿的顏色與受電弓的顏色特征相差不大。這種情況下,僅僅通過顏色特征很難對(duì)受電弓和線桿進(jìn)行區(qū)分,如圖3 所示。因此,在受電弓特征選取時(shí),需要綜合考慮顏色、形態(tài)、空間關(guān)系和紋理等多個(gè)特征,并充分理解各個(gè)特征的優(yōu)勢(shì)和局限性。通過綜合選取這些特征,增強(qiáng)受電弓的識(shí)別能力,克服線桿遮擋等困難問題,并提高受電弓識(shí)別的準(zhǔn)確性和魯棒性。
圖3 受電弓空間特征
Haar-like 特征作為一種常用的計(jì)算機(jī)圖像視覺領(lǐng)域特征描述算子。它最初定義了水平特征、垂直特征和對(duì)角線特征三種基本特征結(jié)構(gòu),如圖4 所示。這些特征結(jié)構(gòu)可以視為滑動(dòng)窗口,在圖像上以步長(zhǎng)為1 的方式進(jìn)行滑動(dòng),覆蓋整個(gè)圖像。通過計(jì)算滑動(dòng)窗口內(nèi)的像素值之差或像素值之和,可以得到Haar-like 特征的矩形特征值。這些特征值即可用于后續(xù)的特征分類任務(wù)。
圖4 Haar-like 特征基本特征結(jié)構(gòu)
隨著Haar-like 特征的廣泛應(yīng)用,研究者根據(jù)不同研究對(duì)象的特殊性,進(jìn)一步對(duì)特征結(jié)構(gòu)進(jìn)行了擴(kuò)展,取得了良好的效果,擴(kuò)展后的Haar-like 特征結(jié)構(gòu)如圖5所示。目前常用的Haar-like 特征主要包括線性特征、邊緣特征、點(diǎn)特征(也稱為中心特征)和對(duì)角線特征。
圖5 擴(kuò)展Haar-like 特征結(jié)構(gòu)
Haar-like 通過定義一系列特征結(jié)構(gòu)來捕捉圖像中的局部特征。特征值的計(jì)算基于矩形內(nèi)白色區(qū)域像素值的總和減去黑色區(qū)域像素值的總和。這種特征值反映了圖像中的灰度變化,能夠有效地提取顏色、形狀、紋理等特征,用于描述和識(shí)別目標(biāo)。為了獲取多樣化的特征,可通過改變特征結(jié)構(gòu)的大小和位置,生成大量不同位置和尺度的矩形特征,提取相應(yīng)的特征值。
為了實(shí)現(xiàn)受電弓的智能定位識(shí)別,本文采用了四類Haar-like 特征矩形[4,5]。這些特征矩形分別被分類為A 類、B 類、C 類和D 類。A 類特征矩形是邊緣特征,它能夠捕捉到受電弓邊緣的細(xì)微變化,幫助我們區(qū)分受電弓與周圍環(huán)境的邊界。B 類特征矩形是線性特征,它關(guān)注受電弓的線性結(jié)構(gòu),可以識(shí)別出受電弓的形狀、輪廓等特征。C 類特征矩形是中心特征,它聚焦于受電弓的中心部分,捕捉到中心區(qū)域與周圍區(qū)域的灰度差異,從而幫助我們準(zhǔn)確地定位受電弓。D 類特征矩形是擴(kuò)展Haar-like 特征,它通過進(jìn)一步擴(kuò)展和變形特征矩形,能夠捕捉到更加復(fù)雜和多樣化的受電弓特征。通過綜合利用這四類特征矩形,能夠有效地描述和區(qū)分受電弓的特征,實(shí)現(xiàn)精準(zhǔn)的受電弓定位識(shí)別。
1.3.1 積分圖計(jì)算
為了提高Haar-like 特征的計(jì)算速度和算法的實(shí)時(shí)性,在獲取矩形特征后,引入了積分圖算法進(jìn)行快速特征提取。積分圖的概念如圖6 所示。
圖6 積分圖
對(duì)于坐標(biāo)A(x,y),其對(duì)應(yīng)的積分圖是以圖6(a)其左上角為起點(diǎn)的矩形區(qū)域內(nèi)所有像素值的累加和。即積分圖中的每個(gè)像素值表示了原始圖像中相應(yīng)位置以左上角為起點(diǎn)的矩形區(qū)域內(nèi)像素值的總和。
式中ii(x,y)代表積分圖,i(x′ ,y′)代表原始圖像。通過A,B,C 和D 區(qū)域端點(diǎn)的積分圖可計(jì)算相應(yīng)區(qū)域的像素值。在圖6(b)中,A,B,C 和D 區(qū)域分別用ii(1),ii(2)-ii(1),ii(3)-ii(1),ii(4)-ii(2)-ii(3)+ii(1)表示。因此通過使用積分圖,可以在只遍歷一次原始圖像的情況下,計(jì)算出特定區(qū)域的像素值。
以D 類特征矩形為例,利用積分圖來計(jì)算其特征值。在圖6(c)中,將D 類特征矩形所覆蓋的區(qū)域分為四個(gè)子區(qū)域,分別標(biāo)記為A、B、C、D。通過積分圖,可以得到每個(gè)子區(qū)域的像素灰度值的累加和。
1.3.2 Adaboost 分類學(xué)習(xí)
Adaboost 算法是一種集成學(xué)習(xí)方法,通過改變數(shù)據(jù)的分布來提升分類器的性能[6]。它根據(jù)每個(gè)樣本的分類準(zhǔn)確性以及前一輪分類器的整體準(zhǔn)確率,來確定每個(gè)樣本的權(quán)重。通過調(diào)整樣本權(quán)重,新的數(shù)據(jù)集被送入下一級(jí)分類器進(jìn)行訓(xùn)練。最后,所有訓(xùn)練得到的分類器被結(jié)合起來,形成最終的決策分類器[7]。在使用Haar-like 特征時(shí),每個(gè)特征的判別閾值被視為一個(gè)弱分類器[8]。通過Adaboost 算法的學(xué)習(xí)過程,可以得到一個(gè)測(cè)試樣本集,其中不同樣本的分布權(quán)重不同。每次訓(xùn)練過程都會(huì)增加誤分類樣本的權(quán)重,減少分類正確樣本的權(quán)重。將經(jīng)過權(quán)重調(diào)整的樣本與其他新樣本組成新的訓(xùn)練樣本集,進(jìn)行下一輪的學(xué)習(xí)訓(xùn)練。經(jīng)過T次迭代循環(huán)后,會(huì)得到T 個(gè)弱分類器,最終將這些弱分類器的權(quán)重進(jìn)行級(jí)聯(lián),得到一個(gè)強(qiáng)分類器。Adaboost算法的關(guān)鍵在于通過迭代訓(xùn)練不斷調(diào)整樣本權(quán)重,使得分類器能夠重點(diǎn)關(guān)注那些難分類的樣本,從而提高整體分類性能。具體流程步驟如下所示:
(1) 樣本構(gòu)建,將訓(xùn)練樣本編號(hào),其中有效正樣本為“1”,其他非有效負(fù)樣本為“-1”,得到一個(gè)樣本標(biāo)簽向量Y。然后,按照樣本編號(hào)的順序,將從圖像中提取的Haar-like 特征值組合成特征矩陣X。
式中,D 為樣本集,(xi,yi)為樣本,n 為樣本數(shù),i=1,2,…,T。
(2) 初始化權(quán)值矩陣,訓(xùn)練學(xué)習(xí)之前樣本應(yīng)具有相同的權(quán)值:
式中,D(i)為各樣本的初始權(quán)值。
(3) 迭代循環(huán)T 次,表達(dá)式如下:
式中,Dt(i)為t 次迭代時(shí)i 樣本的權(quán)值,t=1,2,…,T,εt為t 次迭代時(shí)的被誤判分類的樣本權(quán)值之和,ht為t 次迭代時(shí)的閾值。迭代前利用誤判率εt最小原則,對(duì)當(dāng)前閾值ht進(jìn)行更新。利用更新的閾值,可得到此次迭代生成的弱分類器ht(xt)。更新后的樣本權(quán)值Dt+1 為
(4) 構(gòu)造強(qiáng)分類器H(x),即
Adaboost 算法通過改變數(shù)據(jù)的權(quán)重分布來進(jìn)行訓(xùn)練。在每一輪訓(xùn)練中,根據(jù)上一輪的分類準(zhǔn)確率和每個(gè)樣本的分類結(jié)果,調(diào)整樣本的權(quán)重。分類錯(cuò)誤的樣本會(huì)被賦予更高的權(quán)重,而分類正確的樣本權(quán)重會(huì)減小。這樣,后續(xù)的分類器會(huì)更加關(guān)注錯(cuò)分的樣本,以提高整體的分類性能。
為驗(yàn)證本文所提出檢測(cè)器的有效性和精度,本文采用2 段真實(shí)的受電弓監(jiān)控視頻流進(jìn)行說明。該視頻流來源于固定在動(dòng)車組車頂上的受電弓監(jiān)視攝像頭,其中列車1 由深圳北站駛往虎門站,行駛時(shí)長(zhǎng)16 min;列車2 由咸寧北站駛往岳陽東站,行駛時(shí)長(zhǎng)10 min。列車運(yùn)行過程中,監(jiān)控?cái)z像機(jī)所采集到的背景復(fù)雜多樣,包含白天、夜晚、大霧、隧道等,見圖7。
圖7 數(shù)據(jù)集中所包含的典型樣本
依據(jù)幀頻,將上述視頻流劃分為連續(xù)幀圖像,其中,與列車1 相對(duì)應(yīng)的視頻幀劃分為訓(xùn)練集,而與列車2 相對(duì)應(yīng)的視頻幀劃分為測(cè)試集。相關(guān)數(shù)據(jù)集詳細(xì)信息見表1。
表1 數(shù)據(jù)集信息
圖8 展示了在白天強(qiáng)光干擾、夜晚光照不足等環(huán)境下的受電弓區(qū)域檢測(cè)案例,可以看出,即便在較強(qiáng)干擾下,本文所提出的基于Haar-like 特征分類器的列車受電弓智能定位技術(shù)也能智能定位出受電弓位置。從圖中可以看到,總體上受電弓定位的召回率較高,沒有發(fā)生漏檢,然而,在定位精度方面稍低,檢測(cè)到的受電弓區(qū)域中包含較多的背景噪聲,后續(xù)將從數(shù)據(jù)增強(qiáng)、魯棒性特征提取等角度以增強(qiáng)檢測(cè)器的抗干擾能力。
圖8 受電弓區(qū)域檢測(cè)案例
受電弓區(qū)域的準(zhǔn)確定位檢測(cè)是實(shí)現(xiàn)動(dòng)車組受電弓相關(guān)故障檢測(cè)的一個(gè)重要前處理步驟,可減少外界復(fù)雜多變的環(huán)境所帶來的相關(guān)干擾。因此本文對(duì)受電弓的智能檢測(cè)工作進(jìn)行了研究,充分利用Haar-like特征反映圖像灰度變化、像素分模塊求差值的特點(diǎn),利用四類Haar-like 特征模板以進(jìn)行特征提取。同時(shí),運(yùn)用積分圖計(jì)算方式來高效完成受電弓監(jiān)控視頻流的Haar-like 特征值,以適應(yīng)工程應(yīng)用中實(shí)時(shí)檢測(cè)的實(shí)際需求。最后將提取的Haar-like 特征進(jìn)行Adaboost 學(xué)習(xí)訓(xùn)練以生成用于受電弓在線識(shí)別的強(qiáng)分類器,極大抑制弓網(wǎng)線纜、天氣背景等因素的干擾,實(shí)現(xiàn)了復(fù)雜背景噪聲下受電弓區(qū)域的準(zhǔn)確有效定位。