王劍(山西醫(yī)科大學(xué) 汾陽學(xué)院, 汾陽 032200)
一種新的貨運列車車號定位方法
王劍
(山西醫(yī)科大學(xué) 汾陽學(xué)院, 汾陽 032200)
貨運列車車號定位是車號識別的關(guān)鍵步驟,在鐵路貨運物流管理方面有重要意義。為了適應(yīng)室外復(fù)雜環(huán)境下的貨運列車車號定位,對圖像進行了圖像增強處理,進行了二值化。對二值圖進行形態(tài)學(xué)處理和連通域濾波,獲得車號候選區(qū)域,利用水平投影法和連通域分析定位各塊車號的大致位置,采用掃描線精確定位每部分車號。實驗結(jié)果表明,對于不同的車型是魯棒的,并且定位的準(zhǔn)確率達到97%以上,基本滿足了實際應(yīng)用的需要。
貨運列車; 車號定位; 車號識別
Abstract: Freight train license location is the key step in the train license identification, and has important significance in railway freight logistics management. In order to meet the complex outdoor environment of freight train license, firstly, image was enhanced, then binarized. Secondly, in order to get the train license candidate regions, morphological processing and connected domain filtering were used and horizontal projection and connected domain analysis were used to find train license general location of various pieces. Lastly, scanning line was used to accurately locate each part of the train license. The experimental results are robust to different models, and positioning accuracy is more than 97%. It basically meets the need of the practical application.
Keywords: Freight train; License position; License identification
鐵路貨物運輸是現(xiàn)代運輸?shù)闹饕绞街?,而貨運列車車廂上的車號信息,作為車廂的唯一標(biāo)識,在鐵路運輸過程中起著舉重輕重的作用[1]?,F(xiàn)階段,大多數(shù)的鐵路運輸站使用無線射頻技術(shù)來記錄車廂信息,該技術(shù)具有識別準(zhǔn)確率高,全天候工作,不受光照等客觀條件影響的優(yōu)點,但是,此方法的一個最大缺點是隨著使用時間的長久化,車廂底部的標(biāo)簽會被污損甚至自動脫落,這使得人工維護起來非常的耗時耗力。
隨著數(shù)字圖像處理技術(shù)的不斷發(fā)展,人們開始探索以數(shù)字圖像處理技術(shù)為主的視頻識別技術(shù),貨運列車車號定位也成為了研究熱點,至今,人們的探索已經(jīng)初見成效,收貨了一些可借鑒的方法,但是,目前的方法受室外復(fù)雜光照條件和各類環(huán)境因素的影響,車號定位的魯棒性欠佳,而且準(zhǔn)確率還有待進一步的提高[2]。
本文借鑒已有的研究,針對車號定位過程中面臨的一系列難點,譬如,不同光照條件下的圖像增強問題、背景較為復(fù)雜時的圖像二值化問題和車號區(qū)域規(guī)格不統(tǒng)一等,利用數(shù)字圖像處理相關(guān)知識,挖掘車號區(qū)域的形狀、位置、幾何以及紋理等特征,探索和研究車號自動定位的技術(shù)和方法。本文的車號定位技術(shù)著眼于不同車型的魯棒性和定位的準(zhǔn)確率,實驗表明,該方法能夠滿足實際中的應(yīng)用需求。
鐵路貨車車號定位是車號識別的前提,為了保證車號識別的準(zhǔn)確率,必須準(zhǔn)確定位好車號的位置,將車號進行提取。在實際的車號識別過程中,圖像的采集過程是在室外條件下進行的,這樣采集到的圖像就存在光照不均,陰影以及噪聲的影響,如果不考慮到這些因素直接去進行車號定位與識別,那么識別率會受到很大的影響。因此設(shè)計了如下的一系列車號定位方法。
(1) 為了提高車號字符與車廂皮的對比度,對車廂圖像進行了冪次變換;為了壓制圖像中存在的光照不均、陰影和噪聲,采用了同態(tài)濾波和中值濾波對車廂圖像進行增強[3]。
(2) 針對從車廂圖像中提取車號候選區(qū)域的問題,提出了一種車廂圖像的綜合二值化和連通域濾波方法。首先選擇多個結(jié)構(gòu)元素分別對圖像進行頂帽變換和二值化,以獲得多幅二值圖,再通過加權(quán)融合得到最終的二值圖,接下來對二值圖進行形態(tài)學(xué)處理[4],以將連通域集結(jié)成塊區(qū),最后根據(jù)車號字塊的先驗知識,提取并分析塊區(qū)的連通域特征,進而去除非車號區(qū)域,保留車號區(qū)域。
(3) 針對從連通域濾波后的車廂圖像中定位車號區(qū)域的問題,提出了適用于貨運列車車號區(qū)域的粗精組合的定位算法。首先,結(jié)合車號區(qū)域的位置和形狀特征,并利用水平投影和連通域分析實現(xiàn)了各個車號小區(qū)域的粗(初步)定位;然后,利用掃描線算法結(jié)合車號字符的紋理和邊緣特征,實現(xiàn)小區(qū)域的精確定位。
(4) 為了評價本文算法的定位準(zhǔn)確率,設(shè)計了實驗,并對車號定位準(zhǔn)確度的進行了評價。
2.1 圖像預(yù)處理
基于實際情況的調(diào)研和圖像處理的研究,設(shè)計了一個車廂圖像預(yù)處理流程,如圖1所示。
圖1 圖像預(yù)處理流程圖
(1) 用冪次變換提高字符和背景的對比度。有些車廂的車號字符與車廂背景之間的對比度不明顯,給車號區(qū)域的定位帶來不便,采用冪次變換提高車號字符和車廂背景之間的對比度。
(2) 用同態(tài)濾波抑制光照不均和陰影影響。野外環(huán)境下拍攝的車廂圖像有時存在的陰影、反光等光照不均現(xiàn)象,不利于車號區(qū)域的定位,采用同態(tài)濾波消除圖像中存在的光照不均并減弱陰影的影響。
(3) 用中值濾波壓制噪聲點。車廂圖像在采集和傳輸中,往往受到噪聲的干擾,利用中值濾波降低圖像中的噪聲點。
利用以上的預(yù)處理方法對車廂圖像進行預(yù)處理。結(jié)果如圖2所示。
(a)灰度圖像(b)冪次變換后的圖
(c)同態(tài)濾波后的圖(d)中值濾波后的圖
圖2 圖像預(yù)處理示例
可見,經(jīng)過預(yù)處理,圖像中的噪聲點減少了,車廂圖像中的車號字符和車廂背景之間的對比度有了很大提高,而且,圖像的細節(jié)保留得很好。
2.2 連通域濾波
(1) 車廂圖像大多存在復(fù)雜的背景,直接二值化圖像效果欠佳,采用頂帽變化可以使背景變得簡單均勻,但是頂帽變化需要選擇合適的結(jié)構(gòu)算子。然而,列車車廂號的印刷沒有嚴格統(tǒng)一的規(guī)范,車號字符的筆畫寬度、字符間距、字符高度和寬度存在一定差異,這是導(dǎo)致適合不同車廂圖像的結(jié)構(gòu)算子也不相同。結(jié)構(gòu)算子尺寸較小時,導(dǎo)致車號作為背景被抹掉,相反,則使更多的背景保留下來,使得背景抑制效果降低。因此,提出了二值圖的加權(quán)融合算法。具體的算法如下[5]:
第一步:選用尺寸大小D為2、4和6的圓形結(jié)構(gòu)算子分別對車廂圖像進行頂帽變換和二值化,得到三幅二值圖(BW1、BW2和BW3)。另外,為了增加二值化的魯棒性,補償經(jīng)頂帽處理可能造成的車號缺失,再將車廂圖像直接利用Otsu算法二值化,得到二值圖BW0。
第二步:將四幅二值圖BW0、BW1、BW2和BW3,按照公式(1)進行加權(quán)融合,得到灰度圖BW,如式(1)。
BW=BW0*w0+BW1*w1+BW2*w2+BW3*w3
(1)
其中,加權(quán)系數(shù)的取值為:w0=w1=0.2,w2=w3=0.4。
第三步:依據(jù)公式(2)把BW的灰度范圍線性擴展到[0,1]區(qū)間,如式(2)。
BW=[BW-min(BW)]/[max(BW)-min(BW)]
(2)
第四步:根據(jù)公式(3)閾值T取為0.4將圖像BW二值化,至此,得到融合的二值圖,如式(3)。
(3)
根據(jù)以上二值化過程,圖像二值化流程如圖3所示。
圖3 基于頂帽變換的二值化流程圖
(2) 經(jīng)過二值化處理的車廂圖像往往包含車號字符連通域和干擾連通域,因此采用連通域分析的方法提取車號候選區(qū)域。由于車號字符沒有統(tǒng)一的噴繪規(guī)格,字符存在粘連和斷裂現(xiàn)象,并且字符間距大小不等,為了屏蔽這些差異,首先對車廂二值圖像中的前景像素點進行形態(tài)學(xué)處理,將字符區(qū)域集結(jié)成塊,然后標(biāo)記圖像中的連通區(qū)域,提取連通區(qū)域的特征,再結(jié)合先驗知識,對圖像進行連通域濾波。連通域濾波方法的流程圖如圖4所示。
圖4 圖像連通域濾波流程圖
采用以上的預(yù)處理和連通域濾波處理三種主要車型(即C64K、C70A和C80)的車廂圖像,如圖5~圖7所示。
由圖5、圖6和圖7可見,車廂圖像經(jīng)過預(yù)處理和連通域濾波后,得到只包含少數(shù)白塊的車廂二值圖,極大地方便了車廂號區(qū)域的定位。同時,這也說明,本文的預(yù)處理和連通域濾波方法對于不同車型的車廂圖像是魯棒的。
(a)車廂灰度圖像(b)預(yù)處理后的結(jié)果圖
(c)二值化后的結(jié)果圖(d)連通域濾波后的圖
圖5 C64K車廂預(yù)處理和連通域濾波示例圖
(c)二值化后的結(jié)果圖(d)連通域濾波后的圖
圖6 C70A車廂預(yù)處理和連通域濾波示例圖
(c)二值化后的結(jié)果圖(d)連通域濾波后的圖
圖7 C80車廂預(yù)處理和連通域濾波示例
車廂圖像經(jīng)過連通域濾波得到的白色塊,不僅包含車廂號的粗略區(qū)域,也包含某些非車號區(qū)域,還可能含有許多干擾像素,它還不能精確指示車型、車箱號的外邊界。關(guān)于車號區(qū)域定位的主要研究內(nèi)容是通過分析連通域濾波后的二值圖,初步獲得車號區(qū)域的邊框位置和車號子圖,然后去除車號子圖中的干擾像素,精確定位出車號區(qū)域。該部分是列車車號定位的關(guān)鍵內(nèi)容,最終得到的車號區(qū)域應(yīng)包含全部車號字符,并且包含盡可能得少的噪聲像素[6-7]。
3.1 車號區(qū)域初步定位
車廂二值圖經(jīng)連通域濾波后往往包含非車號區(qū)域,本文結(jié)合車號區(qū)域的特征,采用水平投影和連通域分析的方法從中定位每部分車號區(qū)域,如圖8所示。
圖8 初步定位
(1) 水平投影
專有知識成員比例被定義為CPIKN中專有知識成員數(shù)量占CPIKN成員總數(shù)量的比例。進一步,專有知識成員比例
由于濾波后二值圖中的車型號和車廂號區(qū)域在水平方向具有較多的白色像素,水平投影后,車型號和車廂號區(qū)域?qū)?yīng)兩個波峰,而且波峰寬度基本相同,并且峰頂位置在一定的距離范圍之內(nèi)。因而,對連通域濾波后的二值圖進行水平投影,保留在一定距離和寬度范圍內(nèi)的水平波峰組合,即可得到可能包含兩行車號的波峰組合[6,8]。
(2) 連通域分析
以上的水平投影只能描述車號區(qū)域所在的行,并不能準(zhǔn)確描述每塊車號的具體位置。需要結(jié)合車號區(qū)域的先驗知識,對每組波峰的左右邊界(即二值圖中可能包含車號區(qū)域的上下邊界)之間的連通域進行分析。
車號區(qū)域有一定的印刷規(guī)范,即車型號位于上一行,車廂號兩部分位于下一行且水平對齊,車型號和左半部分的車廂號左邊框基本對齊,3塊區(qū)域高度基本相同,中心之間滿足一定的距離范圍,兩行車號有一定的水平間距。
結(jié)合以上3塊車號的先驗知識,考查相應(yīng)連通域的高度、寬度、長寬比和中心位置等是否滿足預(yù)設(shè)的比例或范圍,直至得到可能包含車廂號和車型號的車號區(qū)域。通常情況下,車廂號和車型號區(qū)域位于水平投影的最大峰和次大峰處。至此,可以得到車號區(qū)域圖像和每部分車號區(qū)域的位置[9]。
3.2 掃描線精確定位技術(shù)
初步定位后的車廂圖像大多存在較寬的邊緣和噪聲點,為了獲得更怯準(zhǔn)確的車號圖像,本文首先采用Canny算法提取每部分車號圖像的邊緣信息,然后按行掃描邊緣圖像中的跳變點并統(tǒng)計其信息,最后,分析掃描行的跳變點信息,縮緊車號圖像的邊框,實現(xiàn)精確定位,其流程,如圖9所示。
圖9 精確定位
第一步,采用Canny算子檢測車號子圖像的邊緣,并將邊緣圖二值化。
第二步,對邊緣二值圖按行掃描,統(tǒng)計在一定距離范圍(車廂號小于等于30個像素,車廂號小于等于60個像素)的跳變點個數(shù)、首尾跳變點所在的列坐標(biāo)以及跳變點之間的間距和。每個掃描行的跳變點個數(shù)與間距和必須滿足一定的范圍(跳變點大于1個且小于等于60個,間距和大于子圖像寬度的1/10且小于等于子圖像寬度),舍棄不符合要求的掃描行,合并相鄰的掃描行,然后保留連續(xù)行數(shù)在[20, 45]之間的掃描行。
第三步,由于車號字符印刷時本身存在一定的間隙,需要合并上一步得到的連續(xù)掃描行間距小于等于5的掃描行。掃描行數(shù)在[35, 45]范圍內(nèi),則完成一個車號子圖像的定位。
第四步,重復(fù)以上過程,直到完成3個子圖像定位。
利用以上的車號定位方法對三種主要車型(即C64K、C70A和C80)的車廂圖像進行了車號定位實驗,結(jié)果如圖10、圖11和圖12所示。
(a)車廂灰度圖像(b)連通域濾波后的圖
(c) 圖(a)經(jīng)初步定位后得到的車號子圖,從左到右依次為:車型號子圖、左車號子圖和有車號子圖
(a)車廂灰度圖像(b)連通域濾波后的圖
(c) 圖(a)經(jīng)初步定位后得到的車號子圖,從左到右依次為:車型號子圖、左車號子圖和有車號子圖
由圖10、圖11和圖12可見,對于連通域濾波后的車廂二值圖,采用本文的定位方法能夠準(zhǔn)確的定位出車廂圖中的車號區(qū)域。同時,這也表明,本文的車號定位方法對于不同車型的車廂圖像均適用。
為了說明本文提出的一系列方法是有效的,做了以下的實驗,實驗結(jié)果如表1所示。
由表1可知3部分車號區(qū)域和整體車號區(qū)域的定位準(zhǔn)確率基本相同,均達到了97%以上,但存在一定的差異。具體表現(xiàn)為以下3點:
(a)車廂灰度圖像(b)連通域濾波后的圖
(c) 圖(a)經(jīng)初步定位后得到的車號子圖,從左到右依次為:車型號子圖、左車號子圖和有車號子圖
表1 車號定位實驗結(jié)果
(1) 車型號區(qū)域的定位準(zhǔn)確率最低,分析原因:一方面,車型號部分的字體高度不完全一致,在定位過程中的形態(tài)學(xué)連通域處理后,得到的白塊不夠完整;另一方面,車型號區(qū)域位于車廂號上方,但水平位置不固定,在結(jié)合位置信息和連通域分析定位時,得到的車型號區(qū)域的位置存在偏差。
(2) 左部分和右部分車號區(qū)域的高度基本相同,上下邊界基本一致,因而定位的準(zhǔn)確率幾乎相等。
(3) 整個車號區(qū)域的準(zhǔn)確率較高,這是由于整個車號區(qū)域在三塊區(qū)域之間包含一些干擾的區(qū)域,考慮整個區(qū)域的位置時,這些干擾區(qū)域不必去除,使得定位容易一些。
綜上所述,本文提出的鐵路貨運列車車號對于不同的車型是魯棒的,并且定位的準(zhǔn)確率達到97%以上,基本滿足了實際應(yīng)用的需要。
分析了鐵路貨運列車車號的特點和定位過程中面臨的難點,并針對這些特點和難點提出了一系列的解決方案,首先完成圖像的預(yù)處理,車廂圖像經(jīng)過預(yù)處理,不僅噪聲點減少了,而且車號字符和車廂背景之間的對比度提高了,還很好的保留了圖像的細節(jié)信息,為后續(xù)處理奠定了基礎(chǔ)。其次利用綜合二值化與連通域濾波方法檢測車號候選區(qū)域。最后利用精確掃描法準(zhǔn)確定位車號區(qū)域。并通過實驗結(jié)果說明,本文提出的方法是確實可行的,定位率達到了97%以上。
[1] 王曉鋒,馬鐘. 基于卷積神經(jīng)網(wǎng)絡(luò)LeNet-5的貨運列車車號識別研究[J]. 現(xiàn)代電子技術(shù),2016,(13):63-66+71.
[2] 程達文. 基于動態(tài)信息集成的鐵路調(diào)度指揮系統(tǒng)研究[D].成都:西南交通大學(xué),2015.
[3] Al-amri S S, Kalyankar N V, Khamitkar S D.Linear and non-linear contrast enhancement image[J]. Int. J. Comput. Sci. Network Security, 2010, 10(2): 139-143.
[4] 魯昌華, 劉玉娜. 基于同態(tài)濾波和改進形態(tài)學(xué)的圖像邊緣檢測[J].儀器儀表學(xué)報, 2011, 32(6): 74-78.
[5] Abolghasemi V, Ahmadyfard A. Local Enhancement of Car Image for License Plate Detection[C]. 15th European Signal Processing Conference (EUSIPCO). 2007: 2179-2183.
[6] 顧勝蘭. 自然場景下的文本定位與提取[D]. 上海:上海交通大學(xué), 2008.
[7] 朱成軍, 蒲菊華. 基于Tophat變換和文字紋理的車牌定位算法[J]. 北京航空航天大學(xué)學(xué)報, 2008, 34(5): 541-545.
[8] 任俊明. 鐵路車號識別系統(tǒng)數(shù)據(jù)的自動化采集[J]. 電腦迷,2016,(04):30.
[9] Kai-Hsiang Lin, Hao Tang, Thomas S. Huang. Robust License Plate Detection Using Image Saliency[C]. Proceedings of 2010 IEEE 17th International Conference on Image Processing, 2010: 3945-3948.
ANewMethodofFreightTrainLicenseLocation
Wang Jian
(FengYang College, Shanxi Medical University, Fenyang 032200, China)
TP391
A
2017.04.25)
山西醫(yī)科大學(xué)汾陽學(xué)院人才引進科研啟動基金的支持(2016D01)
王劍(1988-),男,山西省汾陽市,工學(xué)碩士,助教,研究方向:圖像處理、視線跟蹤。
1007-757X(2017)09-0032-04