于雙芳
(空軍工程大學航空機務士官學校,河南 信陽 464000)
在國內外,關于運動目標識別方面的研究已經(jīng)有很久遠的歷史,最早的體現(xiàn)是在英國完成了車輛圖像識別系統(tǒng);自此,產(chǎn)生了車輛自動識別系統(tǒng),它最先用于被盜車輛的檢測[1]。目前車牌檢測系統(tǒng)的研究在國外已經(jīng)達到了一個非常高的水平。在國內,中科院在運動狀態(tài)下檢測目標信息方面研究做的較好,它生產(chǎn)的“漢王眼”就是一個優(yōu)秀的產(chǎn)品[5]。在現(xiàn)代,隨著科學技術技術的提高,電子產(chǎn)品性能越來越優(yōu)越,圖像處理技術的發(fā)展,進一步促進了圖像識別技術的發(fā)展,提高了圖像識別系統(tǒng)的性能。
由于運動目標的圖像采集是在室外進行,天氣的變化直接影響著采集的圖像質量好壞,曝光不足或過分曝光的圖像經(jīng)常出現(xiàn),除此之外還有它干擾的存在,都使圖像質量下降。因此對原圖像進行預處理,去除原圖像中的干擾信息是必不可少的,而且要保證不增加原圖像額外的信息量,從而達到增強部分圖像的效果。圖像預處理方法使用尺寸調整、亮度校正、灰度化、濾波、銳化和腐蝕。
首先對圖像進行字符的分割,為了使單個字符的特征明顯,識別效率高,進而使用顏色填充把字符變?yōu)閷嵭捏w,最后對字符進行識別。
選用投影法進行單個字符的分割[1]。分割結果見圖1,從圖1 中可以看出投影法對數(shù)字的分割結果是比較理想的,但對漢字和較小字符的分割結果不理想,不過可以滿足本研究的要求。
圖1 投影分割方法的結果
顏色填充常用的一種方法是種子填充,它與邊緣檢測運算剛好相反,互為逆運算。為了保證運動目標編號自動識別系統(tǒng)的實時性,本研究選用掃描線種子填充法。
字符識別是根據(jù)每個字符獨有的特征比較分類[3]。字符識別包括漢字的識別、數(shù)字的識別和英文字母的識別,對于數(shù)字和英文字母來說,數(shù)字只有0~9 10個字符,英文大寫字母和小寫字母共52 個[5],都屬于小字符集,提取特征比較容易;而常用漢字就有3 755個[2],其他漢字更是結構復雜,屬于大字符集,所以提取特征就比較難。字符識別從宏觀上講屬于圖像識別,圖像識別又被稱為模式識別,根據(jù)模式識別的概念,識別一幅圖像,無論圖像中是字符還是景物都是除掉表面現(xiàn)象找出它們的共有特征,然后根據(jù)每個字符獨有的特征進行分類。
神經(jīng)網(wǎng)絡識別是一種人工模擬人腦神經(jīng)網(wǎng)絡編寫的識別方法[5]。神經(jīng)網(wǎng)絡識別系統(tǒng)的準確性和實時性很高[6],BP 神經(jīng)網(wǎng)絡(Error back propagation neural network)是目前字符識別中經(jīng)常用到的一種識別方法。BP 神經(jīng)網(wǎng)絡識別流程見圖2。
圖2 BP 神經(jīng)網(wǎng)絡識別流程
BP 神經(jīng)網(wǎng)絡與其他識別方法相比,最大的優(yōu)勢在于其分類器含有一個向后傳播神經(jīng)網(wǎng)絡,可以將新訓練得到的不理想結果修正后再次匹配,BP 網(wǎng)絡分類器見圖3。
圖3 BP 網(wǎng)絡分類器
BP 神經(jīng)網(wǎng)絡訓練需要權重系數(shù),但BP 網(wǎng)絡的權重系數(shù)不是人為設置的一個不變系數(shù),它是不斷訓練、不斷變化的。BP 網(wǎng)絡是一種簡單地表示模型,圖4 為三層BP 網(wǎng)絡簡圖,它分為三層,層與層之間相連,而同層之間的單元沒有聯(lián)系。當BP 網(wǎng)絡輸出層給出的響應結果不正確時,它會向它的前面一級傳送修正[6]。
圖4 三層BP 網(wǎng)絡簡圖
假設有N 個訓練樣本,對第q(q∈Z)個訓練樣本,隱層j 的實際輸出為Oqj,它的第i 個神經(jīng)元的輸出為Oqi,設
式中:Dqj表示對q 個訓練樣本,單元j 的期望輸出[7]。
利用梯度最速下降法,使權值沿誤差函數(shù)的負梯度方向改變[7]。若權值的變化量記為Δwij,即
式中:η 為學習因子。
BP 網(wǎng)絡的訓練算法如下:
(1)初始化,給所有節(jié)點一個小閾值;
(2)訓練足夠多的樣本圖像,使訓練樣本的是正確率達到要求;
(3)輸出結果與期望結果比較,如果在誤差范圍內,則進入下一個樣本的訓練,否則執(zhí)行(4);
(4)誤差后向傳播,修正權重系數(shù)wji(t+1)=wji(t)+ηδqjOqj,再進行樣本的訓練。
神經(jīng)網(wǎng)絡識別方法具有好的容錯性,而且識別速度快[8]。所以本研究設計系統(tǒng)使用BP 神經(jīng)網(wǎng)絡識別方進行運動目標編號的識別。
本研究利用上述算法應用VC++ 平臺結合OpenCV 庫編制成一套適用于現(xiàn)場運行的軟件系統(tǒng),本章結合系統(tǒng)的算法流程圖,下面就根據(jù)算法流程圖對各個模塊的實現(xiàn)進行分析說明并給出系統(tǒng)運行結果。
運動目標編號識別自動識別系統(tǒng)主要包含五部分:圖像采集、圖像預處理、定位、識別、車廂編號提取。
(1)圖像的采集,把運行運動目標編號的圖像拍攝下來,作為目標圖像。
(2)圖像預處理,把原圖像尺寸歸一化、校正亮度、銳化、灰度化、濾波以及膨脹與腐蝕。
(3)定位,先把灰度圖像進行邊緣檢測二值化,然后對運動目標編號區(qū)域定位。
(4)識別,先把定位出的運動目標編號區(qū)域中的字符分成單個字符圖像;為了識別更確切,利用種子填充算法把單個字符圖像填充完整,然后再進行識別。
(5)運動目標編號的提取,把識別出的運動目標編號顯示在屏幕上。
3.2.1 圖像的采集
本研究設計的運動目標編號自動識別系統(tǒng)中的圖像采集,直接使用場地現(xiàn)有的圖像采集設備,這樣不僅可以省去很多復雜的過程,還可以節(jié)省資源。場地現(xiàn)有設備是通過傳感器與照相機設備相連,當有運動目標經(jīng)過時,傳感器會將感應信號轉化為動作信號啟動照相機采集圖像,然后將采集的圖像經(jīng)過輸入線路傳輸給運動目標編號識別系統(tǒng)。采集的原圖像尺寸為7 728×5 368 像素。
3.2.2 圖像預處理
由運動目標編號自動識別系統(tǒng)算法流程圖可知,圖像預處理包含尺寸調整、亮度校正、銳化、灰度化、濾波以及腐蝕[9]。
3.2.3 運動目標編號的識別
由運動目標編號識別系統(tǒng)算法流程圖可知,運動目標編號的識別部分包括字符分割、顏色填充和字符識別。
(1)字符分割,為字符的識別做準備。本研究設計的系統(tǒng)選用投影法進行單個字符的分割,從實驗結果中也可以看出,投影法對圖像中數(shù)字的分割結果是比較理想的,但對較小字符和漢字的分割并不是很準確,不過這一點對本研究運動目標編號的識別提取沒有太大的影響,是可以滿足要求的。
(2)顏色填充,是為了字符識別更準確。顏色填充這一方法是在實驗的過程中加入的,因為圖像中的數(shù)字8 總是識別不準確,大部分被識別成了3 或者6,所以這里想利用顏色填充,把字符變成實心體,這樣字符的特征就會變得更多一些,然后再進行字符訓練,達到更高的識別率。本研究使用的顏色填充方法是種子填充算法中的掃描填充算法,并在其基礎上加入了一些限制條件,可以從定位出來的車廂編號區(qū)域看出,除了字符邊緣是白色點之外,其他地方都是黑色點,根據(jù)這一特點在找像素段時,當遇到像素段只有一端有白色像素點時,這種像素段優(yōu)先填充。
(3)字符識別,識別出有用信息進行存儲和顯示,這是本系統(tǒng)的目標。運動目標編號自動識別系統(tǒng)中,由于外在原因和內在條件的影響,存在著很多不利因素,當然也有它的便利性。運動目標編號區(qū)域的字符集有以下四個特點:
A.小字符集。運動目標編號區(qū)域的字符是比較固定的。漢字包括車、空、調、發(fā)、電等字符;英文字母包括A,K,X,D,T 等字符;數(shù)字包括0~9 10 個字符。
B.單個字符的圖像像素小。運動目標編號區(qū)域在圖像中占的比例并不大,定位出的區(qū)域被分割為單個字符之后,圖像變得更加小,增加了識別難度。
C.外界因素干擾大。圖像的采集是在運動目標高速運行的情況下進行的,而且外界光線的的變化也會給圖像的采集帶來困難,很可能采集的圖像是光線不足或者光線過強,又或者是字符黏連的。
D.相似字符的相互干擾。在字符訓練的過程中常出現(xiàn)的一個錯誤就是2 被識別成了Z。
神經(jīng)網(wǎng)絡分類器比其他分類器多了一個學習規(guī)則,更適用于本研究設計的系統(tǒng),所以選擇BP 神經(jīng)網(wǎng)絡識別方法。
運用本研究設計系統(tǒng)對運動目標編號進行識別的結果見表1,圖像的識別正確率和平均反應時間還是比較理想的。從表1 中可以看出圖像的識別正確率與圖像的質量有很大關系,在下一步的研究中加入圖像融合技術,可以使圖像的質量更好,從而提高識別率,但也要保證系統(tǒng)的實時性。
表1 運動目標編號識別結果的統(tǒng)計
本研究研究了現(xiàn)有運行運動目標編號定位和識別系統(tǒng)的現(xiàn)狀,查閱了大量國內外的技術文獻和資料。經(jīng)過對三層BP 神經(jīng)網(wǎng)絡識別方法進行識別技術的研究,提出了一種適用于運動目標編號區(qū)域的粗定位和精確定位兩層定位方法。經(jīng)過現(xiàn)場試驗運行,表明本研究設計的運動目標編號自動識別系統(tǒng)對所采集圖像的識別正確率是達到預期目標的。