蔣昭穎,郝福珍
(華北計算技術(shù)研究所后勤信息化事業(yè)部,北京100083)
傷票是醫(yī)療單位記錄傷員受傷信息和統(tǒng)計傷員出現(xiàn)的病情,救治傷員過程的記錄承載方式,是衛(wèi)生機(jī)構(gòu)醫(yī)療單位做統(tǒng)計匯總信息的主要參考樣本,也是后勤單位保障工作經(jīng)驗總結(jié)與醫(yī)學(xué)研究的重要資料和數(shù)據(jù)[1]。伴隨著我國軍事化改革的浪潮不斷興起以及后勤單位醫(yī)護(hù)保障系統(tǒng)的階段性革新,紙質(zhì)化傷票逐漸采用電子化手段進(jìn)行保存和使用,電子化、信息化、網(wǎng)絡(luò)化、智能化成為了傷病員管理方式的新趨勢[2]。采用圖像識別技術(shù),將紙質(zhì)傷票的信息提取并存入后臺數(shù)據(jù)庫中。經(jīng)過這一系列的操作,既保證了醫(yī)護(hù)人員在緊急情況下對傷病員信息的處理,又可以實現(xiàn)高效的后勤保障服務(wù)。由此可見,紙質(zhì)傷票的電子化管理在傷病員信息化管理方面占有舉足輕重的地位。
文中主要研究傷票圖像識別定位算法,該算法的復(fù)雜性在于傷票圖像的廣泛差異性。這種差異來自于光照條件、拍照角度以及破損情況等。而且圖像中的傷票往往嵌入在混亂的場景和背景中,鏡頭本身的抖動也會對處理結(jié)果產(chǎn)生影響。文中通過模板匹配的方法對傷票進(jìn)行識別粗定位,并且對其中的相關(guān)系數(shù)法進(jìn)行改進(jìn),提升算法速度及準(zhǔn)確率,采用數(shù)學(xué)形態(tài)學(xué)方法對傷票邊緣集合特征進(jìn)行精確定位,并與模板圖片進(jìn)行匹配度驗證。
傷票識別的匹配策略分為兩種,一種是完全匹配,即兩幅圖像的特征完全相同,另一種是按照相關(guān)性匹配,即兩幅樣本的感興趣部分之間的距離小于某一個設(shè)定好的數(shù)值,這兩種辦法是當(dāng)今時代圖像辨識范疇內(nèi)最常用的算法。
在匹配算法中,歸一化互相關(guān)匹配算法是應(yīng)用非常多的一種方法,非常典型。在該方法中,我們需要計算出兩幅圖片的互相關(guān)程度,從而得到采集的傷票圖像與模板的樣本二者的匹配關(guān)系。歸一化互相關(guān)值的計算與選擇的二維數(shù)組模板有關(guān),不同的位置將會在該范圍內(nèi)計算出不同的互相關(guān)值,從而決定該位置是否為最佳位置?;ハ嚓P(guān)有兩種定義形式,分別為:
歸一化互相關(guān)算法具有高精度和適應(yīng)性,在互相關(guān)計算中,圖像的自相關(guān)值相對較大,相似度形成相對于模板的真實位置相對平緩的峰值,但是不能精確地檢測峰值位置。換句話說,當(dāng)模板劃痕圖像偏離真實位置時,圖像相關(guān)值較大,這使得難以確定模板圖像在實際損傷圖像中的精確位置。歸一化互相關(guān)算法的缺點(diǎn)是計算復(fù)雜度高,計算時間長。
在160×160的滑動窗口內(nèi),首先計算模板的均值,然后計算樣本的均值。模板像素值與均值做差,同時樣本像素值與樣本均值做差,二者相乘,將窗口內(nèi)每一位置處的該數(shù)值進(jìn)行累加,這個累加值就是歸一化相關(guān)系數(shù)法的分子。分母的計算如下:模板像素值與均值做差,然后將該差值做平方運(yùn)算,累加窗口內(nèi)的每一位置處的平方值。同時按相同的方法計算樣本像素值與均值做差,并平方之后累加。二者相乘然后進(jìn)行開方運(yùn)算,得到的就是該位置處的歸一化相關(guān)系數(shù)。歸一化相關(guān)系數(shù)匹配效果圖,如圖1所示。
圖1 歸一化相關(guān)系數(shù)匹配效果圖
我們將每一位置處的歸一化相關(guān)系數(shù)以及行值和列值用一張三維圖來形象的表示,能夠發(fā)現(xiàn)歸一化相關(guān)系數(shù)的值均在0~1范圍內(nèi),且能夠發(fā)現(xiàn)最大的歸一化相關(guān)系數(shù)就是最佳的匹配位置。歸一化相關(guān)系數(shù)匹配法各坐標(biāo)點(diǎn)處的相關(guān)系數(shù)三維圖,如圖2所示。
通過歸一化相關(guān)系數(shù)圖,我們可以得到在傷票采集圖像中的最大歸一化相關(guān)系數(shù)的位置,從而可以得到最佳匹配位置。
圖2 歸一化相關(guān)系數(shù)匹配法相關(guān)系數(shù)圖
表1 歸一化相關(guān)系數(shù)匹配算法分析
對式(2)進(jìn)行化簡,得式(3)
在不影響相似性度量的前提下,對(3)式進(jìn)行相關(guān)系數(shù)近似計算。本文從兩方面對相關(guān)系數(shù)計算進(jìn)行改進(jìn),一方面從公式的近似和化簡,另一方面從計算量和搜索位置進(jìn)行改進(jìn)。
該算法結(jié)合順序相似性檢測算法(SSDA)算法的思想進(jìn)行改進(jìn)。SSDA是基于匹配操作的思想,然后給出一種閾值計算方法。閾值可以隨著匹配操作的進(jìn)行而被調(diào)整,并且它可以反映匹配操作是否可能超過閾值結(jié)果。因此,可以在每個匹配操作的過程期間的任何時間檢測匹配操作是否繼續(xù)。歸一化互相關(guān)匹配方法在計算上較大的原因是搜索窗口在捕獲的票圖像上跳過并且每次滑動執(zhí)行匹配相關(guān)計算。而且,除匹配點(diǎn)外,其他非匹配點(diǎn)并不需要進(jìn)行運(yùn)算,但是歸一化相關(guān)匹配在每一點(diǎn)都進(jìn)行了相關(guān)計算,這就導(dǎo)致了圖像匹配算法的計算耗費(fèi)大量增加,對實際的匹配影響卻并沒有很大。綜上所述,SSDA的思想就是如果找到模板定位的目標(biāo)像素點(diǎn)為非準(zhǔn)確像素點(diǎn)就果斷丟掉,停止計算,立即換到新的像素點(diǎn)位置計算,采用這樣的思路,能夠大幅度提高算法的實時性。
具體實現(xiàn)該算法的過程如下:我們利用SSDA的思想改進(jìn)歸一化相關(guān)系數(shù)匹配算法,需要明確SSDA選擇開關(guān)值的算法策略。選擇二維數(shù)組窗口,利用該窗口內(nèi)的像素值依次計算該位置的歸一化相關(guān)系數(shù),同時每經(jīng)過一次計算需要與SSDA的開關(guān)值進(jìn)行比較,如果計算完的數(shù)值超過了開關(guān)值,則認(rèn)為該位置處的二維窗口的歸一化相關(guān)系數(shù)與開關(guān)值不一致,即該位置的二維窗口為無效窗口,停止接下來的計算,進(jìn)行下一個位置處搜索窗口的計算,該思想能夠完成匹配算法的加速。
文中,模板的大小為420×420,采集圖片大小為640×480,針對模板與采集圖片大小,我們對搜索位置進(jìn)行優(yōu)化。由于在掃描傷票過程中,傷票位置均處于屏幕的中間區(qū)域,所以,搜索的位置我們從圖片的1/3處開始搜索,直至圖片的2/3處結(jié)束。兩條紅線為搜索范圍,藍(lán)色矩形為起始模板位置,黃色矩形為終止模板位置。我們只需要搜索1/3圖片區(qū)域即可找到是否有匹配的區(qū)域,通過該算法,可以將匹配運(yùn)算時間提高2/3。
由于文中在場景中只需要尋找傷票,所以,為了提高運(yùn)算效率,不需要每個點(diǎn)都進(jìn)行計算,文中采取的方法是隔一個點(diǎn)進(jìn)行一次運(yùn)算,這樣只需要進(jìn)行(M×N)/4次加法運(yùn)算,運(yùn)算效率可以大幅提高。
圖3 改進(jìn)算法各坐標(biāo)相關(guān)系數(shù)
通過改進(jìn)相關(guān)系數(shù)法我們發(fā)現(xiàn),通過門限值的設(shè)定,該算法只需搜索120個點(diǎn)的位置,即可找到最佳匹配位置。而傳統(tǒng)的匹配算法需要搜索3 744個點(diǎn),通過處理時間的分析,我們也可以發(fā)現(xiàn)改進(jìn)的算法大大減少了匹配處理時間,79 ms的處理時間也滿足傷票的實時檢測需求。
表2 改進(jìn)的匹配算法分析
在粗定位前,首先進(jìn)行模板匹配,判斷場景中是否存在傷票,并且獲取模板位置。對采集的傷票分別采用傳統(tǒng)相關(guān)系數(shù)匹配與改進(jìn)的相關(guān)系數(shù)匹配法,其實驗結(jié)果如圖4所示,算法耗時比較如表2所示。
表3 兩種算法耗時比較
模板匹配能夠得到復(fù)雜場景中傷票的大體位置,該區(qū)域可以作為ROI區(qū)域,由于傷票最終的目的是要提取出選中信息,所以需要精確定位傷票并且將其每點(diǎn)坐標(biāo)映射到二維直角坐標(biāo)系中,便于定位選中點(diǎn)信息。所以,本文給出基于邊緣幾何特征的數(shù)學(xué)形態(tài)學(xué)算法進(jìn)行傷票的精確定位。
數(shù)學(xué)形態(tài)學(xué)最早由Martin提出,并廣泛應(yīng)用于圖像處理領(lǐng)域[7]。所提出的基于邊緣幾何特征的數(shù)學(xué)形態(tài)學(xué)算法依據(jù)ROI區(qū)域中傷票的大小和結(jié)構(gòu),利用開操作和閉操作將不含有傷票信息的候選區(qū)域濾除并最終得到傷票精確定位點(diǎn)。綜合考慮影響傷票精確定位的主要因素,主要包括在拍攝傷票過程中可能出現(xiàn)的外界干擾因素:例如曝光過度、陰影遮擋等。使用自適應(yīng)閾值算法,能夠獲得穩(wěn)定的傷票定位結(jié)構(gòu)。
為了解決陰影和光照條件下會造成閾值的誤分割這一問題,我們需要采用自適應(yīng)局部閾值分割方法。本文采用中值濾波和加權(quán)平均法實現(xiàn)自適應(yīng)閾值的計算實現(xiàn)圖像的二值化。
自適應(yīng)局部閾值的原理是在需要確定門限值的位置選取一個模板窗口,根據(jù)模板窗口內(nèi)的所有灰度值,動態(tài)計算出一個閾值作為該位置處的門限值。這種方法能夠避免全局閾值法單一門限值的缺陷,特別適用于在圖片各點(diǎn)光照不均勻的情況使用。即用規(guī)范之后的像素亮度值來進(jìn)行圖片的光照補(bǔ)償,根據(jù)規(guī)范化的像素值決定該點(diǎn)是黑色像素還是白色像素。文中采用該方法進(jìn)行陰影區(qū)域的消除以及曝光過度區(qū)域的補(bǔ)償。第一步,將圖片分塊,計算每個區(qū)域的灰度像素直方圖。然后,計算每一個區(qū)域的門限值,所求位置處的門限值需要結(jié)合相鄰區(qū)域的門限值進(jìn)行插值獲取。
對采集的圖片進(jìn)行固定閾值分析以及自適應(yīng)閾值分析,結(jié)果如圖4所示。可以發(fā)現(xiàn),固定閾值無法兼顧光照和陰影的補(bǔ)償,左下角部分受陰影的影響,導(dǎo)致選取的閾值過高,右上角部分受光照的影響,導(dǎo)致選取的閾值過低,無法得到清晰完整的二值圖片。而自適應(yīng)閾值可以很好的補(bǔ)償光照和陰影的缺陷,恢復(fù)完整圖像。
圖4 固定閾值與自適應(yīng)閾值對比圖
在文中研究的傷票中,我們?nèi)藶橹付ǖ臉?biāo)志塊為矩形,所以本文對閉合邊緣曲線進(jìn)行矩形擬合。對于二維平面內(nèi)的任意矩形,可以用5個參數(shù)對其進(jìn)行唯一定位和描述,重心位置(x,y),矩形4個頂點(diǎn)坐標(biāo)P1(x,y),P2(x,y),P3(x,y),P4(x,y)。
首先,采用矩的方法對擬合矩形的重心位置(x,y)進(jìn)行估算,公式如下[35]:
其中,f(x,y)為權(quán)值,當(dāng)統(tǒng)計點(diǎn) (x,y)在閉合曲線所圍區(qū)域內(nèi)時取1,否則取0,M、N為閉合曲線所圍區(qū)域的最小外接矩形的長和寬,可以通過各輪廓點(diǎn)坐標(biāo)得到,S為閉合區(qū)域面積,mij為矩形區(qū)域內(nèi)像素點(diǎn)位置(i+j)階原點(diǎn)矩,其中(m01,m10)為閉合區(qū)域的重心位置。
得到矩形重心位置后,遍歷輪廓邊緣坐標(biāo),計算重心與每一個邊緣坐標(biāo)的絕對距離,選取距離最大的 4 個點(diǎn),分別為P1(x,y),P2(x,y),P3(x,y),P4(x,y)。再對其4個頂點(diǎn)坐標(biāo)進(jìn)行排序,令其按照左上、左下、右上、右下的順序進(jìn)行存儲。
對數(shù)學(xué)形態(tài)學(xué)處理后的圖片進(jìn)行矩形擬合,我們將閉合曲線所圍區(qū)域用實心表示,然后對其進(jìn)行矩形擬合,選取左上角、右上角和下方擬合矩形結(jié)果,處理結(jié)果如圖5所示。
圖5 提取輪廓效果圖和矩形擬合效果圖
得到擬合矩形后,提取左上角點(diǎn)坐標(biāo)、右上角點(diǎn)坐標(biāo)、左下角點(diǎn)坐標(biāo)、右下角點(diǎn)坐標(biāo)進(jìn)行透視變換,將其映射到二維平面上,對其進(jìn)行提取信息操作。
文中采集各種場景下的傷票進(jìn)行傷票自動識別實驗。傷票自動識別檢測是在手持機(jī)Android4.2系統(tǒng)中運(yùn)行,結(jié)合Opencv2.4.9所實現(xiàn)的。通過檢測傷票的邊緣幾何特征,基于改進(jìn)模板匹配算法的傷票識別與定位的方法,精確度高,魯棒性強(qiáng),適用于各種復(fù)雜場景中識別并定位傷票。算法對相關(guān)系數(shù)匹配法進(jìn)行改進(jìn),針對其速度慢的缺點(diǎn)進(jìn)行算法上的優(yōu)化,優(yōu)化效果明顯,速度可以大幅提高。采用自適應(yīng)閾值的方法消除曝光過度和陰影對傷票檢測影響,實驗表明,自適應(yīng)閾值能夠完全補(bǔ)償曝光和陰影。采用數(shù)學(xué)形態(tài)學(xué)的方法對傷票邊緣進(jìn)行封閉連接,保證傷票的3個標(biāo)記塊位置處的區(qū)域時閉合的。采用基于邊緣特征的矩形擬合方法,對標(biāo)記塊進(jìn)行矩形擬合,精確得出傷票的4個角點(diǎn),從而定位傷票位置,便于后續(xù)研究。
圖6 傷票標(biāo)記區(qū)域提取效果圖
表4 標(biāo)記區(qū)域提取信息表
參考文獻(xiàn):
[1]張樹華.戰(zhàn)時衛(wèi)生勤務(wù)學(xué)[M].北京:解放軍出版社,2006.
[2]師廷偉,金長江.基于FPGA的并行全比較排序算法[J].數(shù)字技術(shù)與應(yīng)用,2013(10):126-127.
[3]岡薩雷斯.數(shù)字圖像處理[M].北京:電子工業(yè)出版社,2011.
[4]廖春生.基于數(shù)學(xué)形態(tài)學(xué)車牌定位算法仿真研究[J].計算機(jī)仿真,2011,28(12):353-356.
[5]陳鑫元.自適應(yīng)閾值圖像二值化及形態(tài)學(xué)處理的FPGA實現(xiàn)[J].電子測量技術(shù),2016,39(7):68-71.
[6]劉紫燕,祁佳.實時圖像邊緣檢測形態(tài)學(xué)優(yōu)化設(shè)計及FPGA實現(xiàn)[J].計算機(jī)技術(shù)與應(yīng)用,2013,39(9):132-134.
[7]鄧俊俊.基于內(nèi)容的圖像檢索技術(shù)研究[D].南京:南京理工大學(xué),2012.
[8]謝季峰.基于霍夫變換的劃痕檢測算法應(yīng)用[J].電腦知識與技術(shù),2012(20):4957-4958,4961.
[9]張明慧,盧振泰,張娟.基于多圖譜活動輪廓模型的腦部圖像分割[J].計算機(jī)學(xué)報,2016:39(7):1491-1500.
[10]SONG Xin-hang,JIANG Shu-qiang,Herranz L.Joint multifeature spatial context for scene recognition in the semantic manifold[C]//Proc of the IEEE Conf on Computer Vision and Pattern Recognition.Piscataway,NJ:IEEE,2015:1312-1320.
[11]胡永強(qiáng),宋良圖,張潔,等.基于稀疏表示的多特征融合害蟲圖像識別[J].模式識別與人工智能,2014,27(11):985-992.
[12]劉紫燕,祁佳.實時圖像邊緣檢測形態(tài)學(xué)優(yōu)化設(shè)計及FPGA實現(xiàn)[J].計算機(jī)技術(shù)與應(yīng)用,2013,39(9):132-134.
[13]余江.基于輪廓的形狀匹配方法研究[D].安徽:安徽大學(xué),2013.
[14]王宇新.基于特征分布的圖像識別方法研究與應(yīng)用[D].大連:大連理工大學(xué),2012.
[15]Krizhevsky A,Sutskever I,Hinton G E.ImageNet classification with deep convolutional neural networks[C]//Proc of the 26th Annual Conf on Neural Information Processing Systems.Cambridge,MA:MIT Press,2012:1097-1105.
[16]XIAO Jian-xiong,Hays J,Ehinger K,et al.Sun database:Large-scale scene recognition from abbeytozoo[C]//ProcoftheIEEE Confon Computer Vision and Pattern Recognition.Piscataway,NJ:IEEE,2015:3485-3492.