王新春,程 滿,劉渝民,岳開華
(楚雄師范學(xué)院物理與電子科學(xué)學(xué)院,云南 楚雄 675000)
基于曲波變換決策融合的掌紋識別*
王新春,程滿,劉渝民,岳開華
(楚雄師范學(xué)院物理與電子科學(xué)學(xué)院,云南 楚雄 675000)
摘要:用曲波變換提取出掌紋圖像在不同尺度下的圖像特征,通過降維處理的主成分分析 (PCA)方法,由徑向基函數(shù)網(wǎng)絡(luò)訓(xùn)練或判決,按照用戶的要求,選擇不同的決策規(guī)則,對各種尺度下的識別結(jié)果進(jìn)行融合,可達(dá)到較高的掌紋識別率。
關(guān)鍵詞:曲波變換;徑向基函數(shù);決策融合;掌紋識別
曲波變換[1,2](Curvelet transform)是一種最稀疏的表示曲線方法。它結(jié)合了脊波變換各向異性的特點和小波變換多尺度的特性,在對圖像進(jìn)行分析過程中,能夠表達(dá)更多的圖像特征信息。曲波變換是一種多分辨,帶通,多方向的函數(shù)分析方法。具備生理學(xué)研究所指出的“最優(yōu)”圖像表示方法應(yīng)該具有的三種特征。能夠從不同的視覺層次提取出不同尺度下的圖像信息。
徑向基函數(shù)[3](Radial Basis Function,RBF)是多維空間插值的傳統(tǒng)技術(shù),其結(jié)構(gòu)簡單,訓(xùn)練簡潔,收斂速度快,能夠逼近任意非線性函數(shù)。因此,被廣泛應(yīng)地用于模式識別和圖像處理領(lǐng)域。
一般基于圖像非頻域特征檢測方法[4,5,6]都沒有充分的利用好掌紋的圖像信息,本文采用曲波變換對掌紋圖像提取出不同尺度下的圖像信息,仿照人眼生理判決的方式在每個尺度下分析圖像信息的特征,用徑向基網(wǎng)絡(luò)進(jìn)行訓(xùn)練或判決,最后根據(jù)不同要求將每層的識別結(jié)果選擇決策融合的方式來靈活地進(jìn)行掌紋識別。
曲波變換是加二進(jìn)制正方形窗的脊波變換[8],即將曲線細(xì)分成足夠短的近似直線后進(jìn)行脊波變換。然而這樣的變換存在很大的數(shù)據(jù)冗余性。因此,對第一代曲波變換進(jìn)行改進(jìn),可得到第二代曲波變換,其運算速度更快,冗余性更小。
首先在二維空間R2中,定義x為空間位置參量,w為頻域參量,r、θ為頻域極坐標(biāo)。W(r)和V(r)分別為平滑非負(fù)的“半徑窗”和“角窗”,同時要滿足容許條件:
與小波理論一樣,曲波也包括粗尺度和精尺度下的成分。引入一個低通窗口W0,滿足:
定義粗尺度下的曲波為:
所以粗尺度下的曲波不具有方向性。整個Curvelet變換是由精尺度下的方向性元素和粗尺度下各向同性的小波組成的。
曲波變換得到的系數(shù)分布:層數(shù)越高包含的圖像高頻信息和噪聲就越多;每一個層內(nèi)系數(shù)的數(shù)量級是相同的,而在不同角度矩陣?yán)锵禂?shù)分布還是有差別的。雖然粗尺度下的曲波系數(shù)分布不具有方向性,但精尺度下的系數(shù)是在圖像的頻域里通過帶通濾波得到的,以方向塊為矩陣來存儲。圖1是對一幅掌紋圖像進(jìn)行curvelet變換,得到各層的特征系數(shù),單獨取出后進(jìn)行逆curvelet變換得到的圖像。
圖1 掌紋圖像經(jīng)過Curvelet變換后提取的每層的特征圖像
一般情況下,RBF神經(jīng)網(wǎng)絡(luò)[9]由三層構(gòu)成:第一層為輸入層,由信號源節(jié)點構(gòu)成;第二層為隱含層,隱單元的個數(shù)由所描述的問題來確定,隱單元的變換函數(shù)是對中心點徑向?qū)ΨQ且衰減的非負(fù)非線性函數(shù);第三層為輸出層,它對輸入模式的作用做出響應(yīng)。
設(shè)訓(xùn)練樣本集X=[X1,X2,…,XN]T,其中任一訓(xùn)練樣本X=[Xk1,Xk2,…,XkN]T,對應(yīng)的實際輸出為Y=[Yk1,Yk2,…,YkN]T,(K=1,2,…,N),期望輸出為dk=[dk1,dk2,…,dkN]T,(K= 1,2,…,N)。當(dāng)輸入訓(xùn)練樣本為Xk時,第j個輸出神經(jīng)元的實際輸出為
當(dāng)“基函數(shù)”為高斯函數(shù)時,可表示如下:式中ti=[tl1,tl2,…,tlm]為高斯函數(shù)的中心,δi為高斯函數(shù)的方差。
RBF網(wǎng)絡(luò)的訓(xùn)練方法有多種,使用自組織選取中心法,要訓(xùn)練的參數(shù)有三個基函數(shù)的中心和方差以及隱含層與輸出層的權(quán)值。其步驟主要分兩步:一是自組織訓(xùn)練階段對隱含層基函數(shù)的中心與方差進(jìn)行訓(xùn)練,二是有監(jiān)督訓(xùn)練階段對輸出層的權(quán)值進(jìn)行訓(xùn)練。
由于第一層的系數(shù)無方向性,比較穩(wěn)定,則可直接當(dāng)作特征信息來進(jìn)行識別;掌紋圖像Curvelet變換后的第二層系數(shù)有方向性,不能直接作為特征信息,而第二層系數(shù)反變換得到的圖像有很好的抗平移和旋轉(zhuǎn)性,可作為特征信息進(jìn)行識別; Curvelet 變換后的第三層的系數(shù)有很強的方向敏感性,不能直接作為特征信息,單獨取出進(jìn)行反變換后的特征圖像容易受平移和旋轉(zhuǎn)的影響,也不能直接用作特征信息。所以,針對每層圖像特征的不同,應(yīng)用不同的方法提取特征向量。掌紋圖片的像素大小為128* 128。
( 1) 粗尺度特征向量的提取
進(jìn)行Curvelet 變換得到第一層系數(shù),將變換后的32* 32 個系數(shù)作為特征信息,從左到右逐列串聯(lián),歸一化后作為特征向量,選取一定的壓縮比( 保留的系數(shù)與原來系數(shù)個數(shù)的百分比) ,通過PCA 降維,再送到RBF 網(wǎng)絡(luò)分類器進(jìn)行訓(xùn)練或識別。
( 2) Curvelet 域第二層特征向量提取
將圖像Curvelet 變換后的第二層系數(shù)單獨取出,進(jìn)行反變換得到特征圖像( 如圖1 ( c) ) ,將特征圖像的像素從左到右逐列串聯(lián)取出,作為特征向量( 大小為16384) ,選定一定的壓縮比,經(jīng)過PCA 降維,送到RBF 網(wǎng)絡(luò)進(jìn)行訓(xùn)練或識別。
( 3) Curvelet 域第三層特征向量的提取
將圖像Curvelet 變換后的第三層系數(shù)單獨取出,先降噪處理,再反變換得到特征圖像,并進(jìn)行二值化處理( 大小仍為128* 128) ,隨后將其分成4* 4 大小相鄰而不重疊的塊( 總共有32* 32 個小塊) ,統(tǒng)計每個塊的像素和,然后從左到右逐列串聯(lián)取出作為特征向量( 大小為1024) ,經(jīng)過PCA 降維,再送到RBF 網(wǎng)絡(luò)進(jìn)行訓(xùn)練或識別。
以下進(jìn)行每層的識別實驗。該實驗利用香港理工大學(xué)掌紋庫中的48 個人( 每人10 張) 加噪聲和不加噪聲的兩組掌紋圖片進(jìn)行識別。每人其中的5 張用來訓(xùn)練,其余的5 張圖片用作安全性測試。
如圖2 所示,橫坐標(biāo)為PCA 的壓縮率,縱坐標(biāo)為識別率。加噪圖像的識別率用實線表示,沒有噪聲圖像的識別率用虛線表示。從圖2 可以看出: 第一層和第二層的兩條曲線相差不大,說明噪聲對其影響較小; 第三層兩條線相差較大,說明噪聲對第三層的影響較大。第一層和第三層的識別曲線隨壓縮比呈增長趨勢,說明特征向量維數(shù)選取不宜太少,而第二層特征向量本來的維數(shù)很大,所以壓縮比應(yīng)當(dāng)小一些比較好。這樣RBF 網(wǎng)絡(luò)通過一定數(shù)目的訓(xùn)練樣本能夠得到充分的訓(xùn)練。
圖2 每層識別率與壓縮率的關(guān)系曲線
掌紋圖像通過分解會得到三個識別結(jié)果,最后要對三個識別結(jié)果進(jìn)行綜合判別,才能得到最后的識別結(jié)果,必然要采用決策融合。采取下面兩種融合法則進(jìn)行兩組實驗。
當(dāng)作為安全系數(shù)比較高的門禁系統(tǒng)時,一般采取邏輯與的方法來進(jìn)行判別。如表1所示,當(dāng)每個掌紋圖像經(jīng)Curvelet變換分解成三層分別識別得出單個識別結(jié)果:有三個識別結(jié)果為同一個用戶的時候才輸出這個用戶的序號;三層的識別輸出都不相同的時候為非法用戶;只有兩個識別相同的時候,要進(jìn)行重新識別,這種情況下一般要限定重新識別的次數(shù),超過了限定的次數(shù)的時候認(rèn)為是非法用戶。在本節(jié)實驗中重新識別的次數(shù)設(shè)為1次;當(dāng)作為一般的安全性不高的門禁系統(tǒng)時,如果每個掌紋圖像經(jīng)Curvelet變換后有兩層識別結(jié)果一致時,就可認(rèn)為是正確的輸出。當(dāng)三層的輸出都不相同的時候認(rèn)為是非法用戶。
表1 安全性要求很高的系統(tǒng)決策融合法則
該實驗利用香港理工大學(xué)掌紋庫中的48個人 (每人10張)加噪聲和不加噪聲的兩組掌紋圖片進(jìn)行實驗。另外5個人 (每個人2張)的掌紋圖像只在識別過程中用作安全性測試。本實驗過程分為三大步:
第一步掌紋識別的訓(xùn)練過程:
將用于訓(xùn)練的掌紋圖像經(jīng)Curvelet變換后,按照“特征向量處理”所提到的每層特征向量的提取方法先提取出來,接著選擇每層特征向量的最佳壓縮比 (即第一、三層為60%,第二層為50%),進(jìn)行特征向量的壓縮,最后分別單獨進(jìn)行RBF網(wǎng)絡(luò)訓(xùn)練。
第二步掌紋識別的識別過程:
RBF網(wǎng)絡(luò)的中間隱含層的系數(shù)經(jīng)訓(xùn)練之后就已經(jīng)確定下來。將識別樣本和用于安全測試的圖像三層征向量提取出來后,按照圖2中的實驗選擇最佳壓縮比進(jìn)行特征壓縮,最后單獨進(jìn)行每層的RBF網(wǎng)絡(luò)識別,得到每一幅待測掌紋三個尺度層的識別輸出。
第三步?jīng)Q策融合
每幅待測圖像的三個層次的識別結(jié)果得出來之后,根據(jù)安全性的要求,需要選擇不同的決策法則來進(jìn)行決策融合。
表2 安全性要求很高的系統(tǒng)識別結(jié)果
訓(xùn)練的樣本數(shù)為48*5個,訓(xùn)練的樣本為48*5+5*2個。48*5個是合法的測試樣本,非法的測試樣本為5*2。由表2可以看出:當(dāng)安全性要求很高時,不合法的樣本被識別為合法的樣本數(shù)都為0,加噪聲和不加噪聲的情況下合法被識別為不合法的樣本數(shù)分別為30和19。加噪聲和不加噪聲的情況下識別正確的個數(shù)為208和219張,被識別為正確的分別為210和221張。這種系統(tǒng)的錯誤接受率為0,正確識別率很高,安全性可靠;但是錯誤拒絕率偏高,影響總體的識別率,也就限制了使用性。當(dāng)安全性要求一般的系統(tǒng)的識別結(jié)果。加噪聲和不加噪聲的情況下不合法的樣本被識別合法數(shù)目為3和1個,加噪聲和不加噪聲的情況下合法的被識別為不合法的樣本數(shù)分別為4和2。加噪聲和不加噪聲的情況下識別正確的張數(shù)為225和232。被識別為正確的個數(shù)都為239張。這種系統(tǒng)的錯誤接受率為比較低,正確識別率不是很高,所以安全性一般;但是錯誤的拒絕率較低,總體的識別率較高,所以可以應(yīng)用于很多方面。
特殊掌紋圖像識別系統(tǒng)的識別可根據(jù)圖像的普遍特性來制定融合決策法則,比如某臺系統(tǒng)采集的圖像有嚴(yán)重局部曝光不足時,當(dāng)?shù)诙雍腿龑拥呐袆e結(jié)果都相同的時候就可以做出正確判決,這種情況,將在以后的研究中給出。
利用curvelet變換提取不同尺度下得到掌紋圖像的特征信息進(jìn)行識別,能充分有效地利用圖像的特征信息。同時利用神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)的特性,避免了識別過程中參數(shù)繁瑣的設(shè)定。Curvelet變換還能依據(jù)不同用戶的要求進(jìn)行決策融合,在保證較高的識別率的同時,其靈活性較強,從而使得其應(yīng)用范圍更為廣泛。
參考文獻(xiàn):
[1]D.L.Donoho,M.R.Duncan.Digital curvelet transform:strategy,implementation and experiments.Proc.Aerosense 2000,Waveler Application VII.SPIE,2000,4056,12—29.
[2]E.J.Candès.D.L.Donoho.Curvelet,multiresolution represention,and scaling laws.In:Proc.SPIE.San Jose,CA:SPIE Press,2000.1—12.
[3]潘立登.徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)正交最小二乘改進(jìn)算法的實現(xiàn).北京化工大學(xué)學(xué)報,2002,29(04).
[4]X.Q.Wu,K.Q.Wang,and D.Zhang.Palmprint Recognition Using Valley Features[C]. Proceedings of 2005 International Conference on Machine Learning and Cybernetics,Guangzhou,China,2005:4881—4885.
[5]X.Wei,D.Xu,and G.Yuan.Authorization Based on Palmprint[C].Proceedings of ICIC 2005,Hefei,China,2005:174—183.
[6]D.Zhang and W.Shu.Two Novel Characteristics in Palmprint Verification:Datum Point Invariance and Line Feature Matching[J].Pattern Recognition,1999,32(04):691—702.
[7]CANDES E J,DEMANET L,DONOHO D L,YI NG Lexing.Fast discrete curvelet transforms [J].MultiscaleModeling Si mulati on,2005,5(03):861—899.
[8]E.J.Candès.Ridgelets:Theory and application:[Ph.D.disseration],Department of Statistics,Stanford University,1998.
[9]孫毅剛等.一種用于徑向基函數(shù) (RBF)神經(jīng)網(wǎng)絡(luò)訓(xùn)練的有效方法.哈爾濱工業(yè)大學(xué)學(xué)報,1997,29(04):103—106.
(責(zé)任編輯司民真)
*資助項目:楚雄師院后備人才資助項目,項目編號:11YJRC21。
中圖分類號:TP183
文章標(biāo)識碼:A
文章編號:1671-7406(2015)03-0016-05
收稿日期:2015-01-12
作者簡介:王新春 (1970—),男,教授,研究方向:無線計算機(jī)網(wǎng)絡(luò)、泛在無線傳感器網(wǎng)絡(luò)及非對稱輪詢系統(tǒng)控制技術(shù)。
Palmprint Recognition with Decision-making in Curvelet Domino
WANG Xinchun,CHENG Man,LIU Yumin&YUE Kaihua
(School of Physics&Electronic Science,Chuxiong Normal University,Chuxiong,675000,Yunnan Province)
Abstract:Curvelet transform is a multi-scale method that can represent curves most sparsely.The main feature of palmprint images is that it is made up of several curves.This paper uses the curvelet transform to get the features information of palmprint images under different scales,deals with the information by dimension reduction of PCA(Principal Component Analysis),then provides the information for RBF network to study and make decisions.Finally,according to the customers'requirements,this paper chooses decision rule to get the fusion of the results and attain the goal of palmprint recognition.It has been proved by the experiments that this method can fully make use of the features information of images and can get higher recognition rate than other methods.
Key words:Curvelet transform;Radial Basis Function;fusion decision;palmprint recognition