潘彥豐
摘 要:為提高火車票識別精度和效率,將圖像處理技術(shù)和BP神經(jīng)網(wǎng)絡(luò)結(jié)合,提出了一種基于圖像處理和BP神經(jīng)網(wǎng)絡(luò)的火車票號識別算法。首先,通過圖像預(yù)處理、目標(biāo)區(qū)域的定位、二值化、傾斜校正和字符分割,提取火車票的身份證號碼特征信息,建立特征信息庫;之后,將特征信息庫作為BP神經(jīng)網(wǎng)絡(luò)的輸入,數(shù)字和字符類別作為BP神經(jīng)網(wǎng)絡(luò)的輸出,建立BP神經(jīng)網(wǎng)絡(luò)的火車票號識別模型。研究結(jié)果表明,與模板匹配和SVM相比,提出的方法可以有效提高火車票號的識別精度和效率,識別精度高達97.7%,從而為火車票號識別提供新的方法。
關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò);二值化;字符分割
中圖分類號:TP391.1 ? ? ?文獻標(biāo)識碼:A
Abstract:In order to improve the accuracy and efficiency of train ticket identification, an algorithm based on image processing and BP neural network is proposed by combining image processing technology with BP neural network. Firstly, through image preprocessing, target location, binarization, skew correction and character segmentation, the identity card number feature information of train ticket is extracted and the feature information database is established, a train ticket recognition model based on BP neural network is established, in which the feature database is the input of BP neural network and the types of numbers and characters are the output of BP neural network. The results show that compared with template matching and SVM, the proposed method can effectively improve the accuracy and efficiency of train ticket recognition, and the recognition accuracy is up to 97.7% , thus providing a new method for train ticket recognition.
Key words: neural network; binary; character segmentation
目前國內(nèi)火車站已全面實現(xiàn)購票實名制驗證和上車前火車票機器驗票,然而火車票機器驗票僅可以驗證該票的合法性,持票人是否與身份證和票相符,則要通過人工方法才能進行確認(rèn),浪費大量人力成本,同時具有勞動強度高和識別率低的缺點[1]。隨著圖像識別技術(shù)的發(fā)展,基于圖像識別應(yīng)用已日益廣泛。常見的包括支持向量機模型、高斯混合模型、基于紋理特征等圖像識別和特征提取算法,但由于技術(shù)復(fù)雜、環(huán)境多變等因素,傳統(tǒng)的支持向量機的圖像分類技術(shù)識別準(zhǔn)確率不到50%[2]。而部分學(xué)者研究將卷積神經(jīng)網(wǎng)絡(luò)結(jié)合推薦方法相完成圖像特征提取,準(zhǔn)確度有提升但性能下降明顯[3]。如何將圖像識別技術(shù)的算法進行改進提升識別的正確率的同時也不影響性能,成為研究熱點所在。隨著圖像處理技術(shù)和光學(xué)字符識別技術(shù)(Optical Character Recognition,OCR)的發(fā)展[4],使得識別乘客、火車票和身份證信息三者是否一致的軟件成為可能,為實現(xiàn)火車票相關(guān)信息的識別,本文將圖像處理技術(shù)和神經(jīng)網(wǎng)絡(luò)結(jié)合起來,提出一種基于圖像處理和神經(jīng)網(wǎng)絡(luò)的火車票識別算法。通過火車票目標(biāo)區(qū)域的定位、二值化、傾斜校正以及分割,提取火車票身份證號碼特征信息,建立特征信息庫,之后運用BP神經(jīng)網(wǎng)絡(luò)進行火車票識別。研究結(jié)果表明,與模板匹配和SVM相比,提出的方法可以有效提高火車票的識別精度和效率,從而證明該方法的有效性和可靠性。
1 識別框架
針對新版火車票進行識別,新版火車票如圖1所示。對于火車票重點識別項主要步驟包括對圖像進行預(yù)處理、票面字符的提取、關(guān)鍵字符篩選、火車票核心特征項提取以及火車票識別等。整體的流程圖2所示。
圖像預(yù)處理主要由車票的二維碼定位、二維碼角點提取和火車票圖像傾斜校正幾部分組成。
1.1 火車票定位
結(jié)合火車票的圖像特征,根據(jù)火車票的二維碼所在位置能夠精確地進行火車票定位。
1.2 二值化
二值化就是將圖像灰度變成0和255的過程,主要目的是將圖像分為目標(biāo)和背景[5],消除圖像中不必要的灰度信息,加快圖像處理速度。通常圖像二值化方法主要有局部閾值法和全局閾值法,但二者可能損失圖像的許多信息,為了控制火車票圖像信息的損失,本文運用基于熵的圖像二值化方法,二維碼分割效果如圖3所示。
1.3 傾斜方式和校正
一般地,傾斜的二維碼圖像可以被看成一個近似的平行四邊形,傾斜方式包括水平傾斜、垂直傾斜和混合傾斜[6],如圖4所示。
3.1 不同訓(xùn)練集比例
首先采集500張車票樣本的圖像數(shù)據(jù)集合,按照20%到40%的測試采樣比率對500張車票圖像數(shù)據(jù)集進行訓(xùn)練,其余的車票作為測試樣本,經(jīng)訓(xùn)練并測試后的BP神經(jīng)網(wǎng)絡(luò)識別檢測準(zhǔn)確率如圖10所示。
根據(jù)圖10顯示,在訓(xùn)練樣本選擇20%、30%、40%的比率時,BP神經(jīng)網(wǎng)絡(luò)識別檢測準(zhǔn)確率分別為95.2%、97.1%和97.7%,隨著訓(xùn)練樣本所占比例的增加識別準(zhǔn)確率呈現(xiàn)增加趨勢。
3.2 不同算法對比
為了說明SVM、模板匹配和BP神經(jīng)網(wǎng)絡(luò)所設(shè)置實驗訓(xùn)練樣本的比率采用20%、30%以及40%時,其對應(yīng)的識別準(zhǔn)確率結(jié)果對比如表1所示。
對比表1中的不同的訓(xùn)練樣本比率下的識別準(zhǔn)確率可以發(fā)現(xiàn),BP神經(jīng)網(wǎng)絡(luò)應(yīng)用于火車票識別的最佳準(zhǔn)確率為96.74%,平均準(zhǔn)確率也達到了96.61%,效果明顯高于其他的方法,具有很大的優(yōu)勢。
3.3 不同算法效率對比
表2展示了不同算法的執(zhí)行效率對比,由表中數(shù)據(jù)可以發(fā)現(xiàn),本文提出的使用BP神經(jīng)網(wǎng)絡(luò)進行火車票識別的使用在精度為96.54%時,僅僅用了504秒,對比其他兩種算法,精度上分別提高了7.51%、4.18%,但是使用時間卻減少了6.6 s和4.47 s,從而進一步證明運用BP神經(jīng)網(wǎng)絡(luò)進行火車票識別的有效性和可靠性。
4 結(jié) 論
為提高火車票識別精度和效率,將圖像處理技術(shù)和BP神經(jīng)網(wǎng)絡(luò)結(jié)合,提出一種基于圖像處理和BP神經(jīng)網(wǎng)絡(luò)的火車票識別算法。通過火車票目標(biāo)區(qū)域的定位、二值化、傾斜校正以及分割,提取火車票身份證號碼特征信息,建立特征信息庫,之后運用BP神經(jīng)網(wǎng)絡(luò)進行火車票識別。研究結(jié)果表明,與模板匹配和SVM相比,提出的方法可以有效提高火車票的識別精度和效率,從而證明該方法的有效性和可靠性。
參考文獻
[1] 薛圣利, 蔡啟仲, 楊海林, 等.基于OpenCV的火車票識別算法[J]. 廣西科技大學(xué)學(xué)報, 2016, 27(2):46-51.
[2] 吳萍, 胡瑞敏, 艾浩軍. 火車票查詢系統(tǒng)中語音識別的研究及實現(xiàn)[J]. 計算機工程與應(yīng)用, 2003(33):227-229.
[3] GUAN H, KASAHARA R, YANO T. Traffic light recognition and dangerous driving events detection from surveillance video of vehicle camera[J]. Electronic Imaging, 2017(4):3-10.
[4] BRASIL R H, MACHADO A M C. Automatic detection of red light running usingvehicular cameras[J]. IEEE Latin America Transactions, 2017, 15(1):81-86.
[5] 韓雪, 粟慧龍. 基于Android臥鋪車廂車票識別APP的系統(tǒng)設(shè)計[J]. 數(shù)字技術(shù)與應(yīng)用, 2017(10):162-163.
[6] 葛露露, 沈苑苑, 左海山, 等. 基于車票識別的鐵路客運站旅客引導(dǎo)系統(tǒng)[J]. 石家莊鐵道大學(xué)學(xué)報(自然科學(xué)版), 2014, 27(1):69-73.
[7] 陳超, 毛堅桓, 劉寅, 等. 基于卷積神經(jīng)網(wǎng)絡(luò)的鐵路貨運網(wǎng)站驗證碼識別[J]. 指揮信息系統(tǒng)與技術(shù), 2016, 7(4):91-96.
[8] 羅駿,朱晉, 李智強. 基于SCILAB實現(xiàn)人臉識別火車票預(yù)售系統(tǒng)[J]. 電子技術(shù), 2013,5(7): 65-67.
[9] 劉永玲, 路勇, 王夢. 基于UHF頻段RFID技術(shù)的實名制火車票研究[J]. 微型機與應(yīng)用, 2012, 31(14):44-46.
[10]呂行軍, 韓憲忠, 王克儉, 等. 基于最大方差閾值法的火車票圖像二值化處理[J]. 計算機應(yīng)用與軟件, 2012, 29(7):249-253.
[11]HUANG Guang-bin . An insight into extreme learning machines: random neurons, random features and kernels[J]. Cognitive Computation, 2014, 6(3):376-390.
[12]邱曉歡, 吳啟超. 一種基于改進EAST網(wǎng)絡(luò)和改進CRNN網(wǎng)絡(luò)的火車票站名識別系統(tǒng)[J]. 南方職業(yè)教育學(xué)刊, 2019, 54(6):85-92.