錢江 張桂榮 姚江 季建中 何平 顧宋華
摘 要:為實(shí)現(xiàn)晝夜間船名精準(zhǔn)檢測(cè),本文提出一種基于計(jì)算機(jī)視覺(jué)的船名檢測(cè)方法。該方法使用Retinex算法對(duì)船舶圖像預(yù)處理,隨后基于MSER獲取文字候選區(qū)域,根據(jù)先驗(yàn)知識(shí)和筆畫寬度變換特征得到最終候選區(qū)域,最后使用級(jí)聯(lián)分類器確定單字符區(qū)域,進(jìn)而得到船名位置完成船名檢測(cè)。實(shí)驗(yàn)結(jié)果表明,該方法在晝間和夜間均能實(shí)現(xiàn)船名精準(zhǔn)檢測(cè),晝間船名檢測(cè)準(zhǔn)確率高達(dá)90.4%。
關(guān)鍵詞:計(jì)算機(jī)視覺(jué) 船名檢測(cè) 最穩(wěn)定極值區(qū)域 筆畫寬度 級(jí)聯(lián)分類器
1.引言
近年來(lái)內(nèi)河航運(yùn)發(fā)展迅速,運(yùn)輸船舶數(shù)量顯著增加,人工審核船名信息工作逐漸繁重,一種有效的船名檢測(cè)方法亟待提出。
崔晶等人基于無(wú)線局域網(wǎng),結(jié)合AIS系統(tǒng)實(shí)現(xiàn)了船舶識(shí)別;何春燕[]利用雷達(dá)進(jìn)行船舶目標(biāo)檢測(cè),通過(guò)抗干擾算法提高船舶檢測(cè)率;鄭艷[]基于RFID技術(shù)提出有效的防碰撞算法實(shí)現(xiàn)船舶識(shí)別;潘美蓮在AIS系統(tǒng)中基于計(jì)算機(jī)視覺(jué)實(shí)現(xiàn)船舶銘牌識(shí)別和船舶跟蹤。上述四種方法存在著人為干擾大、部署成本高等問(wèn)題,本文提出的方法基于現(xiàn)有視頻監(jiān)控設(shè)備改造,可自動(dòng)識(shí)別船舶信息,滿足監(jiān)管監(jiān)控要求。
在水運(yùn)領(lǐng)域,計(jì)算機(jī)視覺(jué)技術(shù)多應(yīng)用于船舶監(jiān)控、船舶跟蹤和船舶流量統(tǒng)計(jì)。基于視覺(jué)的船名檢測(cè)技術(shù)尚處于起步階段,較少研究學(xué)者對(duì)其進(jìn)行研究。因此本文對(duì)于船名字符檢測(cè)的研究在一定程度上彌補(bǔ)了船名檢測(cè)在計(jì)算機(jī)視覺(jué)方面的空白。
2.船名檢測(cè)方法
基于計(jì)算機(jī)視覺(jué)的船名字符檢測(cè)流程如圖1所示。第一步,將船舶圖像轉(zhuǎn)化為灰度圖像并使用 Ret i nex算法進(jìn)行預(yù)處理;第二步,搜索圖像的最穩(wěn)定極值區(qū)域(MSER),將MSER區(qū)域作為船名字符候選區(qū)域;第三步,利用幾何形狀、尺寸等先驗(yàn)知識(shí)對(duì)候選區(qū)域進(jìn)行篩選過(guò)濾,得到符合先驗(yàn)知識(shí)的字符候選區(qū);第四步,對(duì)符合先驗(yàn)知識(shí)的文字候選區(qū)域做筆畫寬度變換,設(shè)定筆畫寬度均值方差閾值,得到符合筆畫寬度特征的字符候選區(qū)域;第五步,訓(xùn)練一個(gè)文字非文字分類器,用二分類器對(duì)字符候選區(qū)域進(jìn)行分類得到最終文字區(qū)域。
2.1船舶圖像預(yù)處理
由于室外拍攝船舶圖像易受光照、天氣等環(huán)境因素影響,應(yīng)對(duì)所得船舶圖像預(yù)處理以提高字符檢測(cè)精度。隨后對(duì)彩色船舶圖像灰度化,減少后續(xù)處理計(jì)算量,之后采用 Retinex算法進(jìn)行對(duì)船舶圖像進(jìn)行對(duì)比度增強(qiáng)處理。
R e t i n e x理論由L a n d和McCann提出,該理論認(rèn)為原始圖像S(x,y)可以看成是光照?qǐng)D像L(x,y)和反射率圖像R (x,y)的乘積,即S(x,y)=R(x,y)* L(x,y)?;赗etinex的圖像增強(qiáng)的核心即從原始圖像S(x,y)中估計(jì)出光照L(x,y),從而分解出R(x,y),消除光照不均的影響。
Retinex理論假設(shè)圖像的噪聲來(lái)源于圖像各個(gè)位置反射率不同,因此去除反射圖像的噪聲便可還原圖像。首先將圖像變換到對(duì)數(shù)域,圖像變換過(guò)程如式;反射分量噪聲通過(guò)歸一化去除,歸一化過(guò)程如式;對(duì)去噪后的反射分量求指數(shù),反變換到實(shí)數(shù)域得增強(qiáng)后圖像。
圖2左圖為灰度化圖像,右圖為使用Retinex算法預(yù)處理后的圖像。從圖中可以看出,預(yù)處理后圖像對(duì)比度得到提高,船名特征得到增強(qiáng)。
2.2連通域分析
本文采用基于連通域的方法進(jìn)行文字檢測(cè),提取最穩(wěn)定極值區(qū)域作為文字候選區(qū)域,該算法對(duì)圖像具有較強(qiáng)的仿射變換不變性。
2.3筆畫寬度變換與級(jí)聯(lián)分類
筆畫寬度變換(Stroke Width Transform, SWT)由微軟提出,用于自然場(chǎng)景文字檢測(cè)。筆畫寬度特征屬于文字的獨(dú)有特征,一般而言統(tǒng)一的文本都具有統(tǒng)一的筆畫寬度,如圖4所示。
最終的文字區(qū)域由一個(gè)級(jí)聯(lián)分類器確定,因此需要訓(xùn)練一個(gè)級(jí)聯(lián)文字非文字二分類器對(duì)字符候選區(qū)域進(jìn)行分類得到最終文字區(qū)域。本文采用的文字非文字二分類器基于局部二值特征和Adaboost算法進(jìn)行級(jí)聯(lián),級(jí)聯(lián)分類器如圖5所示。
弱分類器的訓(xùn)練過(guò)程如下:計(jì)算所有訓(xùn)練樣本的特征值并排序;對(duì)順序排列的每個(gè)元素計(jì)算四個(gè)指標(biāo),全部文字樣本的權(quán)重和T0、全部非文字樣本的權(quán)重和最小T0、在此元素前文字樣本的權(quán)重和S0、在此元素前非文字樣本的權(quán)重和S1;選取當(dāng)前元素特征值和前一個(gè)特征值的均值作為閾值,閾值的分類誤差為e =min (S1+(T0-S0),S0+(T1-S1));將誤差最小的閾值作為最優(yōu)閾值,得到弱分類器。
將若干個(gè)弱分類器級(jí)聯(lián)成強(qiáng)分類器過(guò)程如下:訓(xùn)練庫(kù)樣本數(shù)為N,其中文字樣本為N0,非文字樣本數(shù)為N1,最大迭代次數(shù)為T,初始化樣本權(quán)重為1/N;第一次迭代訓(xùn)練所有樣本得第一個(gè)弱分類器;提高上一步中被誤識(shí)別的樣本權(quán)重,將錯(cuò)分類樣本和新樣本作為下一個(gè)弱分類器的訓(xùn)練樣本;重復(fù)訓(xùn)練新的弱分類器,T輪迭代后得到T個(gè)最優(yōu)弱分類器;最后將弱分類器組合成強(qiáng)分類器,組合方式如式(3)
使用級(jí)聯(lián)分類器對(duì)字符候選區(qū)域分類,得到每個(gè)區(qū)域的類別和得分,對(duì)得分設(shè)定一定閾值,大于閾值則視為合格文字區(qū)域,組合文字區(qū)域得到船名區(qū)域。圖6左圖為分類器對(duì)字符候選區(qū)域的分類結(jié)果,右圖紅框?yàn)樽罱K船名檢測(cè)區(qū)域。
3.實(shí)驗(yàn)及分析
在級(jí)聯(lián)分類器的訓(xùn)練過(guò)程中,船名字符為正樣本,正樣本包括數(shù)字字符和漢字字符,圖像中除船名以外的圖像作為負(fù)樣本。其中正樣本5000張,負(fù)樣本8000張。船名檢測(cè)測(cè)試實(shí)驗(yàn)中,測(cè)試圖像共計(jì)500張,其中晝間圖像300張,夜間圖像200張,共計(jì)4000個(gè)船名字符,其中漢字字符1525個(gè),數(shù)字2457個(gè)。
經(jīng)測(cè)試得出,本方法正確檢測(cè)的晝間圖片282張,準(zhǔn)確率高達(dá)93.6%;正確檢測(cè)的夜間圖片170張,準(zhǔn)確率達(dá)85.5%,總準(zhǔn)確率為90.4%。經(jīng)分析發(fā)現(xiàn),被測(cè)船舶中數(shù)字字符識(shí)別率較高,漢字字符檢測(cè)準(zhǔn)確率較低,這導(dǎo)致了船名中很多漢字漏檢測(cè),因此出現(xiàn)10%左右的船名僅能正確檢測(cè)部分字符。
4.結(jié)論
本研究提出一種基于計(jì)算機(jī)視覺(jué)的船名檢測(cè)方法,結(jié)合連通域分析和筆畫寬度變換,通過(guò)級(jí)聯(lián)分類器確定最終文字區(qū)域。通過(guò)實(shí)驗(yàn)和分析,驗(yàn)證了該方法的可行性。實(shí)驗(yàn)結(jié)果表明,該方法在晝間和夜間均能實(shí)現(xiàn)船名精準(zhǔn)檢測(cè)。本文對(duì)于船名字符檢測(cè)的研究在一定程度上彌補(bǔ)了船名檢測(cè)在計(jì)算機(jī)視覺(jué)方面的空白,同時(shí)本研究也節(jié)省了人工查看視頻獲取船名所花費(fèi)的大量人力成本。
參考文獻(xiàn):
[1]崔晶,賈冬青,陳玉芳.基于無(wú)線局域網(wǎng)中船舶自動(dòng)識(shí)別通信平臺(tái)設(shè)計(jì)[J].艦船科學(xué)技術(shù),2016(10):100-102.
[2]何春燕,余曉玫,高飛.面向識(shí)別的船舶目標(biāo)雷達(dá)回波技術(shù)研究[J].艦船科學(xué)技術(shù),2017(22):103-105.
[3]鄭艷.基于有源RFID技術(shù)的船舶識(shí)別與控制終端系統(tǒng)研究[J].艦船科學(xué)技術(shù),2017(16): 142-144.
[4]潘美蓮.船舶自動(dòng)識(shí)別系統(tǒng)中的計(jì)算機(jī)視覺(jué)技術(shù)應(yīng)用[J].艦船科學(xué)技術(shù),2017(6):99-101.
[5]周勇.基于計(jì)算機(jī)視覺(jué)技術(shù)的內(nèi)河船舶智能監(jiān)控系統(tǒng)研究與實(shí)現(xiàn)[D].上海交通大學(xué),2016.
[6]楊高星.基于計(jì)算機(jī)視覺(jué)的船舶跟蹤及類型識(shí)別研究[D].大連海事大學(xué),2017.
[7]李蕓.視頻監(jiān)測(cè)在船舶流量檢測(cè)中的應(yīng)用[J].中國(guó)航海,2012,35(3):35-39.
[8]Aldenize Xavier,Carlos Eduardo Guerra,André Andrade .Fracture analysis in borehole acoustic images using mathematical morphology[J].Journal of Geophysics and Engineering,2015(3).