肖春景 ,喬永衛(wèi) ,賀懷清 ,c
(中國(guó)民航大學(xué) a.計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院;b.工程技術(shù)訓(xùn)練中心;c.天津市智能信號(hào)與圖像處理重點(diǎn)實(shí)驗(yàn)室,天津 300300)
由于手寫(xiě)體簽名在信用卡身份檢查、支票簽名及機(jī)場(chǎng)登機(jī)身份驗(yàn)證等安全檢查方面的應(yīng)用,使手寫(xiě)體簽名自動(dòng)識(shí)別已成為模式識(shí)別重要的研究領(lǐng)域。離線手寫(xiě)體簽名識(shí)別已丟失書(shū)寫(xiě)過(guò)程的動(dòng)態(tài)信息,僅依靠簽名圖像的靜態(tài)信息,可用信息較少,識(shí)別難度較大。
目前的離線簽名識(shí)別有結(jié)構(gòu)和統(tǒng)計(jì)兩種方法。結(jié)構(gòu)方法中利用空間分布特征、筆段特征、輪廓檢測(cè)等方法提取字形結(jié)構(gòu)[1-2],對(duì)結(jié)構(gòu)特征較敏感,區(qū)分相似字的能力較強(qiáng),但是結(jié)構(gòu)特征難以抽取,不穩(wěn)定;以自組織映射方法、神經(jīng)網(wǎng)絡(luò)、概率密度函數(shù)、支撐向量機(jī)等為主的統(tǒng)計(jì)方法[3-7],按一定的距離度量匹配準(zhǔn)則,采用多維特征值累加的辦法,把局部噪聲和微小畸變淹沒(méi)在最后的累加和里,具有良好的魯棒性、較好的抗干擾抗噪聲的能力,但是可以用來(lái)區(qū)分“敏感部位”的差異也隨之消失。特征提取是這些方法中非常重要且必須的步驟,并且特征提取結(jié)果將影響分類器的設(shè)計(jì)和性能以及最后的識(shí)別結(jié)果。基于統(tǒng)計(jì)的特征提取方法主要有灰度值、梯度、方向分布和灰度密度等方法,基于結(jié)構(gòu)的方法主要有簽名圖像寬高比、簽名點(diǎn)面積和圖像總面積比、連通域和網(wǎng)格個(gè)數(shù)等;基于偽動(dòng)態(tài)特征的方法主要有筆鋒特征、簽名骨架方向的灰度特征、灰度面積等。這些特征提取方法基本都是基于復(fù)雜預(yù)處理和分割后二值圖像,并且提取過(guò)程不可逆。但是復(fù)雜數(shù)據(jù)預(yù)處理、較大計(jì)算量、復(fù)雜的過(guò)程、連筆現(xiàn)象導(dǎo)致的復(fù)雜分割都使特征提取變得非常困難。這些將直接影響識(shí)別系統(tǒng)的效率和結(jié)果。
為了解決復(fù)雜預(yù)處理、簽名分割和不可逆的特征提取等問(wèn)題,本文提出了一種基于小波包的特征提取方法。首先,數(shù)據(jù)預(yù)處理過(guò)程只對(duì)簽名圖像進(jìn)行了大小歸一化而沒(méi)有其他操作;其次,利用小波包對(duì)整個(gè)簽名進(jìn)行分解并表示成二維空間上點(diǎn)的集合并利用這些點(diǎn)來(lái)進(jìn)行手寫(xiě)體簽名識(shí)別。其數(shù)據(jù)預(yù)處理簡(jiǎn)單,不需要分割并且特征提取是完全可逆的,具有較好的抗噪性、魯棒性和適應(yīng)性。
很多特征提取方法都是基于復(fù)雜數(shù)據(jù)預(yù)處理和圖像分割。數(shù)據(jù)預(yù)處理技術(shù)主要包括過(guò)濾、去噪、旋轉(zhuǎn)、變換、標(biāo)準(zhǔn)化、平滑、二值化等,這些導(dǎo)致計(jì)算量非常大或在書(shū)寫(xiě)過(guò)程中要增加限制條件,并且因?yàn)檫B筆現(xiàn)象的存在使得圖像分割變得異常困難,這些都影響著算法的應(yīng)用和識(shí)別效率。本文方法的數(shù)據(jù)預(yù)處理簡(jiǎn)單,僅包含大小歸一化,沒(méi)有去噪、變換、旋轉(zhuǎn)和其他過(guò)程,這將保持原始簽名圖像的特征,增加其魯棒性和抗噪性,并且其特征提取是全局信息提取,不需復(fù)雜分割。因此,它可應(yīng)用到含噪脫機(jī)手寫(xiě)體簽名識(shí)別。本文共40類簽名,每類15個(gè)真簽名和10個(gè)偽簽名,每個(gè)簽名被歸一化為32×64大小。圖1和圖2列舉了40類簽名的實(shí)例。
圖1和圖2表明真實(shí)簽名和刻意模仿的偽簽名之間的差別非常小。這就要求識(shí)別系統(tǒng)的特征提取方法能夠提取它們之間的微小差別,以保證識(shí)別效果。
Coiffman等人提出的小波包理論將頻帶進(jìn)行了多層次的劃分,對(duì)小波變換沒(méi)有細(xì)分的高頻部分進(jìn)一步分解(如圖3所示),并能根據(jù)特征向量的特征自適應(yīng)地選擇頻帶,克服了正交小波變換的不足,是一種更為精細(xì)的分析方法,現(xiàn)已被廣泛應(yīng)用到了數(shù)字信號(hào)處理領(lǐng)域。
小波包分解算法為
從式(1)和圖3可以看出,在每一層被分解對(duì)象都被分解成4個(gè)子序列。第1個(gè)子序列是低頻部分描述被分解對(duì)象的主要特征,其他3個(gè)子序列是高頻部分描述被分解對(duì)象的細(xì)節(jié)部分。一個(gè)n×2n的高維信號(hào)經(jīng)過(guò)log2n層小波包分解可以表示成二維空間序列的形式。也即是高維空間的對(duì)象能夠表示成低維空間的形式,這起到了降維的作用。因此,可以把Rn空間轉(zhuǎn)換成多個(gè)二維空間的連接,也即是 Rn=R2?R2?…?R2,這里R?Q=({x,y)x∈R,y∈Q}。也就是說(shuō),2n 維空間上的點(diǎn)可分解成n個(gè)二維點(diǎn)。
小波包重構(gòu)公式為
式(2)表明利用此公式重構(gòu)4個(gè)子序列部分可以得到上一層的父節(jié)點(diǎn),基于此方法經(jīng)過(guò)n層重構(gòu)可以得到最原始的信號(hào)。
簽名圖像可看成是高維空間的信號(hào),經(jīng)過(guò)若干層的小波包分解后可被表示成二維空間的點(diǎn),這些點(diǎn)即為簽名圖像的特征值。因此經(jīng)過(guò)n=log2m層小波包分解,m×2m大小的簽名圖像可以表示成m×m個(gè)二維空間的點(diǎn)的集合。原始簽名數(shù)據(jù)在二維空間上都有其相應(yīng)的分量,利用小波包重構(gòu)算法對(duì)這些分量進(jìn)行重構(gòu)可得到原始的簽名圖像。本文中簽名圖像已被歸一化成32×64,因此,這里m=32,n=5分解后的二維點(diǎn)的集合為?R2,i=1,2,…,L,k=1,2,…,Sf,其中 L 為樣本的類別40,Sf為第5層小波包分解的頻段數(shù)1024。圖4為第9類簽名“”分解后的二維點(diǎn)集合的例子。
圖4(a)為簽名圖像完整的特征提取圖。從圖4(a)可以看出簽名圖像的能量主要集中在兩部分,具有較大值的低頻部分和特征值集中在0附近的高頻部分。如果僅保留低頻部分而忽略高頻部分,簽名圖像的細(xì)節(jié)將丟失,這些細(xì)節(jié)對(duì)于識(shí)別結(jié)果將有至關(guān)重要的影響。圖4(b)是高頻部分的放大圖。從圖4(b)可以看出高頻部分存在著一定的聚集性。在建立識(shí)別模型的過(guò)程中可以利用其聚集性,這樣不但保留了高頻的特征又沒(méi)有過(guò)多的增加計(jì)算量,具體的應(yīng)用過(guò)程可以參見(jiàn)文獻(xiàn)[6~7]。
通過(guò)特征提取的整個(gè)過(guò)程可以看出,如果對(duì)小波包分解得到的二維點(diǎn)進(jìn)行重構(gòu)可以得到原始信號(hào)的完整圖片而沒(méi)有任何信息的丟失。但一般的特征提取是一個(gè)從Rn→(fx)Rm,n>m的降維過(guò)程并且該過(guò)程不可逆,即利用 (fx)把x1∈Rn映射成y1∈Rm后,幾乎所有特征提取方法卻不能利用(fx)-1把y1∈Rm完全映射到x1∈Rn,而利用小波包分解對(duì)簽名數(shù)據(jù)進(jìn)行特征提取是完全且可逆的過(guò)程。把經(jīng)過(guò)小波包分解得到的二維向量集合進(jìn)行小波包重構(gòu)即可得到原始的簽名圖像數(shù)據(jù),在整個(gè)分解與重構(gòu)的過(guò)程中沒(méi)有信息丟失,保證了對(duì)簽名進(jìn)行充分的特征提取。
本文利用Matlab 7.0進(jìn)行數(shù)據(jù)仿真,共采集到40人簽名,每人15個(gè),其中10個(gè)作為訓(xùn)練樣本、5個(gè)作為測(cè)試樣本。偽簽名共400個(gè),每類10個(gè),由6個(gè)人去模仿真實(shí)簽名得到。試驗(yàn)過(guò)程中分別采用haar、db4、sym8、coif3、bior2.6 幾種不同的小波基對(duì)圖像進(jìn)行了特征提取,試驗(yàn)結(jié)果如表1所示。
表1 不同小波基的識(shí)別結(jié)果Tab.1 Results of different wavelets
由試驗(yàn)結(jié)果可知,不同小波基對(duì)于識(shí)別結(jié)果影響很小,因而本文采用了最簡(jiǎn)單的haar小波基,動(dòng)態(tài)聚類的范圍NUM=2,并把本文方法與比較成熟的HMM方法進(jìn)行了比較。HMM方法每個(gè)數(shù)據(jù)分成4段,每段3個(gè)狀態(tài),Viterbi算法估測(cè)最佳路徑,試驗(yàn)結(jié)果如圖5和圖6所示。
由圖5和圖6可知,本文方法共識(shí)別184個(gè)測(cè)試樣本,誤識(shí)25個(gè),識(shí)別率和誤識(shí)率分別為92%和6.25%,而隱馬爾可夫識(shí)別175個(gè),誤識(shí)34個(gè),識(shí)別率和誤識(shí)率分別為87.5%和8.5%,本文方法的識(shí)別率略高于HMM方法,誤識(shí)率稍低于HMM方法,得到了比較滿意的結(jié)果。本文方法數(shù)據(jù)預(yù)處理簡(jiǎn)單,原始圖像的特征得到最大保留,這樣增加了其魯棒性和抗噪性;它能提取全局信息,避免了復(fù)雜分割;利用小波包特征提取是完全可逆的過(guò)程,而一般方法不但細(xì)節(jié)丟失而且不可逆。
本文提出了一種基于小波包的特征提取方法,其僅需簡(jiǎn)單的數(shù)據(jù)預(yù)處理,提取全局信息,避免復(fù)雜分割,特征提取過(guò)程完整可逆。試驗(yàn)結(jié)果表明:其識(shí)別率較高、誤識(shí)率較低,并且具有很好的抗噪性和魯棒性,是含噪脫機(jī)手寫(xiě)體簽名識(shí)別的一種可行解決方案。
[1]PESSOA L F C,MARAGOS P.Neural networks with hybrid morphological/rank/Li-near nodes:a unifying framework with applications to handwritten character recognition[J].Pattern Recognition,2000,33:945-960.
[2]LV HAIRONG,WANG WENYUAN,WANG CHONG,et al.Offline Chinese signature verification based on support vectormachines[J].Pattern Recognition,2005,26:2390-2399.
[3]ALESSANDRO L KOERICH,ROBERT SABOURIN,CHING Y.Recognition and verification of unconstrained handwritten words[J].IEEE Transaction on Patten Analysis and Machine Intelligence,2005,27:1509-1522.
[4]MOHAMED M A,GADER P.Generalized hidden markov modelspartⅡ:application to handwritten word recognition[J].IEEE Trans Fuzzy Systems,2000,8(1):82-95.
[5]鄧穎娜.手寫(xiě)體簽名真?zhèn)舞b別技術(shù)的研究[D].西安:西安理工大學(xué),2006.
[6]肖春景,李春利,喬永衛(wèi),等.用于手寫(xiě)體簽名識(shí)別的小波包混合高斯模型[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(36):161-164.
[7]肖春景,李春利,張 敏.脫機(jī)手寫(xiě)體簽名識(shí)別的小波包隱馬爾可夫模型[J].計(jì)算機(jī)應(yīng)用,2010,30(2):445-448.