王文 袁君奇 王成林
摘 要:實現(xiàn)鋼板號點陣噴印字符的自動識別是鋼廠生產(chǎn)線實現(xiàn)自動化生產(chǎn)物料跟蹤的關(guān)鍵環(huán)節(jié),對字符的準(zhǔn)確定位又是字符能夠準(zhǔn)確識別的重要步驟。針對某鋼廠寬厚板1號生產(chǎn)線鋼板檢測所涉及到的點陣噴印字符定位問題,提出了一種基于角點檢測的鋼板號點陣噴印字符定位算法。運用改進的meanshift聚類算法找出角點的中心,并以該中心為字符區(qū)域的中心,進而完成鋼板點陣噴印字符的定位。結(jié)果表明,該定位算法能快速、準(zhǔn)確地完成鋼板號點陣噴印字符的定位,具有更好的準(zhǔn)確性和快速性,能滿足實際生產(chǎn)的需求。
關(guān)鍵詞:自動化生產(chǎn)、字符定位、角點檢測、meanshift
引言:
OCR (Optical Character Recognition,光學(xué)字符識別)是指電子設(shè)備檢查打印在各種物品上的字符(如產(chǎn)品LOGO、生產(chǎn)日期、編碼等),通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機文字的過程。1929年,德國人Tausheck提出了光學(xué)字符識別的定義[1]。近年來,國內(nèi)外掀起了新一波圖像字符識別的熱潮,國內(nèi)外許多機構(gòu)致力于OCR的研究。光學(xué)字符識別技術(shù)大致包括四個步驟,它們分別是圖像預(yù)處理,字符定位,字符分割,字符識別[2]。
目前,大多鋼廠檢測鋼板表面的點陣噴碼字符都是通過人工檢測的方式,此種方式存在一定缺陷,不足之處表現(xiàn)為:(1)鋼廠生產(chǎn)線環(huán)境較為惡劣,產(chǎn)品往往附帶高溫燙傷、運動造成的機械傷害、粉塵污染等對工人身體造成身體損傷的危險因素,安全性較差;(2)工人工作效率低,檢測的鋼板需要肉眼判定,人工錄入,且長時間工作易產(chǎn)生視覺疲勞,出現(xiàn)誤檢漏檢現(xiàn)象,從而影響鋼板的處理,導(dǎo)致鋼板質(zhì)量受到不可逆的影響。伴隨著鋼鐵產(chǎn)業(yè)在國內(nèi)的持續(xù)發(fā)展,鐵水產(chǎn)量和鋼水產(chǎn)量不斷創(chuàng)出新高,鋼鐵廠生產(chǎn)線生產(chǎn)速度加快,產(chǎn)品質(zhì)量要求提高,人工檢測鋼板號的傳統(tǒng)方法已不能滿足現(xiàn)代鋼鐵工業(yè)生產(chǎn)的需求,迫切需要研究鋼板號點陣噴碼識別技術(shù)替換人工檢測的方法,提高鋼鐵生產(chǎn)的智能化水平,實現(xiàn)鋼鐵廠生產(chǎn)過程中的智能檢測和識別。通過對現(xiàn)有字符區(qū)域定位算法的研究,分析了現(xiàn)有字符區(qū)域定位算法的優(yōu)缺點,以鋼廠實際生產(chǎn)線上點陣噴印字符區(qū)域定位為目標(biāo),借鑒了多種算法的思想,提出了應(yīng)用于實際生產(chǎn)中的鋼板點陣噴印字符區(qū)域的定位算法,并與以往傳統(tǒng)算法在準(zhǔn)確率和時間上做了對比,通過實地測試,驗證了該算法能精確定位出鋼板點陣字符區(qū)域,能較好地應(yīng)用于復(fù)雜多變的鋼廠生產(chǎn)環(huán)境,具有較高的可靠性和有效性。
當(dāng)前金屬生產(chǎn)標(biāo)記方法介紹
冶金產(chǎn)品的標(biāo)識方式有:金屬標(biāo)簽打印,墨水噴印,涂料噴印,金屬粉末單槍噴印,壓印,熱態(tài)針打印或者刀片壓印等,也有采用電化學(xué)方法對金屬表面進行蝕刻來標(biāo)記[3]。
另外,也有輥壓式,沖打式的標(biāo)記方法[4]。寬厚板廠1號生產(chǎn)線采用點陣熱噴碼技術(shù)噴印在鋼板上的。
難點
(1)寬厚板生產(chǎn)線現(xiàn)場環(huán)境復(fù)雜,鋼板在生產(chǎn)線上動作速度不均勻,持續(xù)的高溫和為了降溫采取的噴水霧造成字符模糊情況,諸多不穩(wěn)定的現(xiàn)場圖像采集條件等都不利于相機的拍攝,直接導(dǎo)致相機采集到的圖片質(zhì)量不高,從而間接影響了鋼板點陣噴印字符定位的準(zhǔn)確度。
(2)現(xiàn)場的線陣相機實際采集到的圖片大小為2048*10000,而字符區(qū)域從180*450到220*650不等,且由于客戶需求不同,生產(chǎn)的鋼板大小不一從而導(dǎo)致字符區(qū)域在整個鋼板的位置變化不定,這加大了字符定位的難度。圖1.1為線陣相機采集到的鋼板圖像。
(3)鋼板表面粗糙、易生銹,且處理環(huán)節(jié)較多,一些使用噴水霧對鋼板降溫的過程導(dǎo)致拍攝到的圖片中字符背景顏色復(fù)雜且噪聲多。
(4)鋼板在輥道上運動時噴印點陣字符,采集鋼板圖像時鋼板也處于運動狀態(tài)。而點陣噴印設(shè)備的機械故障以及噴嘴口堵塞會造成字符區(qū)域傾斜、變形等,增大了鋼板號點陣噴印字符的定位難度。
大多數(shù)字符區(qū)域定位方法都是基于特定的場合或者特定字符,例如:Shekar采用梯度作為紋理特征并結(jié)合啟發(fā)式規(guī)則對字符區(qū)域進行定位[5]。Tian YingLi和Li ChunCai等人利用字符區(qū)域的梯度特征和顏色均勻性來形成候選字符區(qū)域,并利用結(jié)構(gòu)分析形成文本行[6]。胡正平采用筆畫作為紋理特征并利用支持向量機來區(qū)分字符和非字符區(qū)域[7]。Mariano等人對圖像進行顏色聚類操作,并分析聚類結(jié)果獲得候選字符區(qū)域[8]。本文研究的內(nèi)容是從線陣相機采集到的鋼板圖片中,圖像采集質(zhì)量不穩(wěn)定。因此,一般的字符區(qū)域定位方法不能適用于復(fù)雜生產(chǎn)線上鋼板號點陣噴印字符,無法準(zhǔn)確定位出鋼板點陣噴印字符的具體位置,并提取出鋼板號點陣字符。
4.1 meanshift聚類算法
meanshift算法是一種基于密度的非參數(shù)聚類算法,它是通過迭代尋優(yōu)找到概率分布的極值。meanshift最初的含義是偏移的均值向量。現(xiàn)在,meanshift算法通常指一種迭代的步驟,具體步驟為:算出當(dāng)前中心點的偏移均值,將當(dāng)前中心點移動到偏移均值點上,然后以此為新的起點計算出該點的偏移均值后繼續(xù)移動,不斷重復(fù)上述步驟,直至滿足一定要求后結(jié)束。
基本的Meanshift推導(dǎo)過程如下:
Meanshift算法是將中心點持續(xù)不斷的沿著概率密度增大的方向上移動,直至中心點移動到密度最大處。中心點移動步長和概率密度、梯度有關(guān),越靠近概率密度峰值的概率密度大的地方移動的步長就會越小一些,而在概率密度小的地方,中心點移動的步長比較大。但是基本的meanshift聚類算法缺點較為明顯,易受到初值影響,初值設(shè)定不恰當(dāng)可能會陷入局部最優(yōu)。
4.2 改進的meanshift聚類算法
基本的meanshift算法能很好找出角點集的中心,但它受設(shè)定初值的影響較多,可能陷入局部最優(yōu),無法解決偏離設(shè)定初值較多時出現(xiàn)異常情況的問題。本文針對此問題,根據(jù)寬厚板廠1號生產(chǎn)線鋼板號點陣噴印字符區(qū)域的特點,提出了改進的meanshift聚類算法,并將其運用在鋼板號點陣字符區(qū)域定位上。
生產(chǎn)線上采集到的鋼板圖片是二維圖像,且鋼板點陣噴印字符區(qū)域為矩形而非圓形,因此,meanshift算法中指定區(qū)域采用圓形區(qū)域并不能很好地涵蓋字符角點區(qū)域。經(jīng)過現(xiàn)場大量測試,本文針對鋼板號點陣字符矩形區(qū)域的特點,將圓形區(qū)域改為矩形區(qū)域,大小為字符區(qū)域的最大值即220*650,當(dāng)Meanshift算法移到密度中心的時候,檢測區(qū)域與字符區(qū)域可保證基本重合。
由于采集圖像的異常情況較多,用改進的FAST角點檢測算法檢測出的角點中,仍有部分角點為噪聲角點,這些角點大多是零散的分布在圖像的各個地方,使用傳統(tǒng)的meanshift算法進行聚類,若初始中心點為一個孤立的噪聲角點則會出現(xiàn)局部最優(yōu)的問題,針對此問題,本文在傳統(tǒng)的meanshift算法中加了一個判定從而避免了噪聲角點造成定位錯誤的情況出現(xiàn)。改進的meanshift算法具體步驟如下:
(1)程序?qū)z測區(qū)域設(shè)置為220*650的矩形區(qū)域,從點集中隨機選取一點為中心點。
(2)程序計算該矩形檢測區(qū)域內(nèi)的偏移均值,計算公式為式1.1。
(3)程序?qū)⒅行狞c的位置加上M_h (x)得到新的偏移均值點。
(4)程序?qū)⒅行狞c移到新的偏移均值點處。
(5)程序重復(fù)步驟(2)-(4),直至滿足設(shè)定要求后進行下一步操作。
(6)程序統(tǒng)計檢測區(qū)域內(nèi)角點的數(shù)量,若小于設(shè)定閾值為陷入局部最優(yōu),則從步驟(1)中重新開始;若大于設(shè)定閾值則聚類完成。
在改進的meanshift算法中,實際字符區(qū)域大小與檢測區(qū)域的大小基本相同,字符區(qū)域中心點與聚類的中心點基本重合。
4.3準(zhǔn)確定位鋼板點陣噴印字符區(qū)域
通過對改進檢測算法檢測到的候選角點進行分析,發(fā)現(xiàn)采集到的不噴印點陣鋼號字符的鋼板圖片即空圖中只有少數(shù)的幾個噪聲角點,而有噴印字符的圖片中,角點數(shù)量基本穩(wěn)定在算法設(shè)定的范圍區(qū)間之內(nèi),根據(jù)這一特征,算法先根據(jù)檢測到的角點數(shù)量區(qū)分空圖和有字符圖。如果總角點數(shù)量大于設(shè)定值,判定為有效字符圖,程序進行處理分析;但如果總角點數(shù)量小于設(shè)定值則為判定為空圖,程序直接越過meanshift算法,進行下一張圖像的檢測。
通過分析對比發(fā)現(xiàn),有效圖中字符角點分布密集且有規(guī)律性,角點集的中心一般為字符區(qū)域的中心,因此考慮用聚類算法找出角點集的中心并進行定位。
經(jīng)過大量的實驗證明,改進的meanshift聚類算法能通過檢測角點集的中心的方法確定字符區(qū)域的中心,從而準(zhǔn)確定位出鋼板號點陣噴印字符區(qū)域,且不易出現(xiàn)噪聲角點造成定位錯誤的情況。
4.4 實驗結(jié)果分析
圖4.2展示了對比度較大、噴印清晰的正常的圖像。由圖4.2可以看出,對于對比度大、噴印清晰的正常圖片,該算法能準(zhǔn)確的定位出點陣字符的位置。在生產(chǎn)線采集的圖像中上,大部分圖片是類似于圖4.2的噴印清晰、字符對比度和背景對比度較大的圖片,而字符區(qū)域相對整張圖片來說十分小。與普通字符的定位不同,該鋼板圖片是灰度圖,字符與背景的灰度都是無法采用固定參數(shù)設(shè)定,加之該鋼板點陣字符是由一個個油漆點噴印組成,具有離散性,無法形成大片的連通區(qū)域,對字符的定位增加了不小的難度。而本文的定位算法能快速、準(zhǔn)確的定位出點陣噴印字符區(qū)域。
從實驗結(jié)果看,本文的算法能很好的滿足寬厚板廠1號生產(chǎn)線生產(chǎn)需求,可以準(zhǔn)確、快速的定位出鋼板號點陣噴印字符區(qū)域,對于背景與字符對比度比較小、字符區(qū)域較小或者噴印效果差的圖像也能較高的定位準(zhǔn)確率。
對測試集中的圖像進行測試,總的實驗結(jié)果如下:
總結(jié)
本文在來源于某鋼廠寬厚板1號線物料跟蹤項目的背景下,通過對現(xiàn)有OCR定位算法的研究,分析現(xiàn)有OCR定位算法的優(yōu)缺點,并以實際生產(chǎn)線上點陣噴印字符區(qū)域定位為目標(biāo),借鑒多種算法的思想,提出了應(yīng)用于實際生產(chǎn)中的鋼板號點陣噴印字符區(qū)域的改進定位算法,并與傳統(tǒng)算法在準(zhǔn)確率和時間上做了對比,通過大量實驗驗證了該算法能精確定位出鋼板點陣字符區(qū)域,能較好地適合生產(chǎn)環(huán)境復(fù)雜多變的鋼廠生產(chǎn)線物料跟蹤項目,解決物料跟蹤項目中的實際問題,因此該算法具有較高的可靠性和有效性。
參考文獻
[1]Mori S. Historical Review of OCR Research and Development[J]. Proceedings of IEEE, 1992, 80(7): 1029-1058
[2]Liu C, Wang C, Dai R. Text detection in images based on unsupervised classification of edge-based features[C]//Document Analysis and Recognition, 2005. Proceedings. Eighth International Conference on. IEEE, 2005: 610-614.
[3]王燕.金屬工業(yè)中的標(biāo)記[J].鍛壓技術(shù),1982(05):64+63.
[4]呂福在. 鋼鐵產(chǎn)品標(biāo)識技術(shù)的現(xiàn)狀及其發(fā)展[A]. 中國金屬學(xué)會青年委員會、北京機械工程學(xué)會.第三屆先進軋鋼精整、包裝及鋼材加工配送技術(shù)學(xué)術(shù)研討會論文集[C].中國金屬學(xué)會青年委員會、北京機械工程學(xué)會:,2010:9.
[5] Shekar, ?B.H.; ?Smitha, ?M.L., ?"Text ?localization ?in ?video/scene ?images ?using ?Kirsch Directional Masks," in Advances in Computing, Communications and Informatics (ICACCI), 2015 International Conference on , Aug. 2015, pp.1436-1440.
[6] Yi ?C, ?Tian ?Y ?L. ?Text ?string ?detection ?from ?natural ?scenes ?by ?structure-based ?partition ?and grouping[J]. Image Processing, IEEE Transactions on, 2011, 20(9): 2594-2605.
[7] 胡正平,王瑾.多尺度-方向筆畫結(jié)合 SVM 驗證的文字區(qū)域定位[J]. ?儀器儀表學(xué)報,2010,04:916-922.
[8] Mariano V Y, Kasturi R. Locating uniform-colored text in video frames[C]//Pattern Recognition, 2000. Proceedings. 15th International Conference on. IEEE, 2000, 4: 539-542.