蓋杉
(南昌航空大學(xué)信息工程學(xué)院,江西 南昌 330063)
隨著人們對(duì)流通紙幣質(zhì)量要求的提高以及自動(dòng)取款機(jī)和出納機(jī)的迅速普及,銀行對(duì)于自動(dòng)化紙幣清分技術(shù)的需求日趨強(qiáng)烈。紙幣清分系統(tǒng)是一種光機(jī)電一體化的復(fù)雜產(chǎn)品,其主要功能是對(duì)紙幣圖像進(jìn)行分析與處理,并根據(jù)處理結(jié)果實(shí)現(xiàn)對(duì)紙幣圖像自動(dòng)分類與檢測(cè)。鑒于紙幣的重要性,銀行對(duì)其分類的準(zhǔn)確性要求極高。因此,紙幣特征提取是紙幣清分系統(tǒng)最為關(guān)鍵的環(huán)節(jié),區(qū)分性好的特征將有利于后續(xù)識(shí)別性能的提升。
由于不同幣值的人民幣和意大利幣幾何尺寸具有差異性,Kato等[1]將紙幣圖像的長(zhǎng)度、寬度等幾何特征作為識(shí)別的重要依據(jù)。Takeda等[2]運(yùn)用隨機(jī)函數(shù)在特定區(qū)間內(nèi)產(chǎn)生與輸入特征向量維數(shù)相當(dāng)?shù)碾S機(jī)掩模,通過計(jì)算未被遮掩的像素個(gè)數(shù)得到特征向量,簡(jiǎn)稱掩模特征方法即簡(jiǎn)記為 MASK(mask feature)方法。類haar特征[3-4]主要采用積分圖像描述原始紙幣圖像,然后使用基于Ada-Boosting(adaptive boosting)的學(xué)習(xí)算法對(duì)原始特征向量進(jìn)行選擇,得到更為有效的級(jí)聯(lián)分類器。劉家鋒等[5]將整幅紙幣圖像按一定大小劃分為互不重疊的矩形區(qū)域,將每個(gè)矩形區(qū)域的灰度均值作為原始特征,運(yùn)用 K-L(Karhunen-Loeve)變換等方法提取更為有效的紙幣圖像特征,簡(jiǎn)稱網(wǎng)格特征方法即簡(jiǎn)記為GRID方法。Choi等[6]利用離散小波變換(DWT,discrete wavelet transform)獲取描述紙幣圖像邊緣紋理信息的高頻分量,將通過預(yù)先設(shè)定的閾值提取紙幣圖像的高頻分解系數(shù)作為特征向量。蓋杉等[7]采用 contourlet變換獲取紙幣圖像不同方向與尺度上的頻域信息,在此基礎(chǔ)上引入模糊邏輯獲取紙幣圖像識(shí)別特征(CFFE,contourlet-fuzzy feature extraction)。
上述方法雖然在紙幣識(shí)別中取得了一定的效果,但是仍然存在一些不足。當(dāng)紙幣圖像出現(xiàn)傾斜、折角等情況,幾何特征的有效性將會(huì)下降,進(jìn)而影響到最終的識(shí)別性能。掩模特征雖然能夠克服紙幣特征的不穩(wěn)定性,但是最優(yōu)掩蓋集如何選取仍然是個(gè)技術(shù)難點(diǎn)。多尺度變換特征缺乏對(duì)紙幣圖像相位信息的有效描述。類haar特征計(jì)算復(fù)雜度較高,難以滿足紙幣實(shí)時(shí)性要求。網(wǎng)格特征提取的難點(diǎn)是如何確定方向塊的大小及位置。因此如何找到一種有效的圖像分析方法是提取模式有效特征、提高識(shí)別率的重要途徑。四元矩陣[8-10]是一種基于頻域的新圖像表述方式,從解析信號(hào)組成的角度來看,四元矩陣?yán)碚撌窃谒脑鷶?shù)與 Hilbert變換理論的基礎(chǔ)上發(fā)展而來的。四元矩陣能夠有效地描述圖像結(jié)構(gòu)紋理特征信息和局部位移信息,并且比幅值含有更多的含熵信息。
本文通過引入四元矩陣將紙幣圖像的結(jié)構(gòu)紋理信息與相位信息作為整體直接進(jìn)行分析處理,提出一種基于四元矩陣?yán)碚摴部臻g模式紙幣圖像特征提取算法(QCSP, quaternion-common spatial pattern),并采用BP(back propagation)神經(jīng)網(wǎng)絡(luò)作為分類器完成識(shí)別。實(shí)驗(yàn)結(jié)果表明本文提出的算法能夠取得較高的識(shí)別率,提取的紙幣特征具有較好的可分性,并且能夠滿足實(shí)際紙幣清分系統(tǒng)的實(shí)時(shí)性要求。
作為復(fù)數(shù)的推廣,四元數(shù)是實(shí)數(shù)域基向量{1,i,j,k}的線性組合,即由一個(gè)實(shí)部和 3個(gè)虛部構(gòu)成,采用式(1)定義為
其中,qr,qi,qj和qk為實(shí)數(shù),3個(gè)正交單位向量i、j、k 滿足
四元數(shù)乘方運(yùn)算能夠描述單位向量的統(tǒng)計(jì)信息,利用四元數(shù)具有的自反特性給出其定義,則有
根據(jù)式(4),給出四元向量的定義如下
其中,I表示單位矩陣,qR表示四元數(shù)對(duì)應(yīng)的實(shí)系數(shù)向量,ψ表示由實(shí)數(shù)域到四元數(shù)域的轉(zhuǎn)換矩陣。令η ∈ {i,j,k},式(4)可簡(jiǎn)化為qη=-ηq η,然后采用協(xié)方差矩陣與 3個(gè)厄米特協(xié)方差矩陣來描述四元數(shù)的實(shí)部與虛部之間具有的相關(guān)性與二階統(tǒng)計(jì)特性。為了進(jìn)一步解決四元矩陣的因式分解項(xiàng),本文引入如下定理[11]。
定理1 設(shè)Q為四元酉矩陣,Λx為實(shí)非負(fù)對(duì)角矩陣,則對(duì)任意的四元矩陣X,其因式分解表示為
四元矩陣能夠?qū)垘艌D像實(shí)現(xiàn)四元線性時(shí)變系統(tǒng)的稀疏描述,可以利用等價(jià)的復(fù)伴隨矩陣對(duì)其進(jìn)行快速求解。四元矩陣分解具有的3個(gè)相位信息能夠描述紙幣圖像結(jié)構(gòu)具有的互為正交方向上的強(qiáng)度變化。另外,四元矩陣分解具有的幅值信息能夠揭示紙幣圖像的能量分布情況。
受復(fù)數(shù)共空間模式構(gòu)造原理啟發(fā),本文首次將復(fù)數(shù)共空間模式推廣到四元數(shù)域。令xγ(γ = 1 ,2,… ,n)表示屬于某類別γ的紙幣樣本向量,則空間協(xié)方差矩陣定義如式(6)所示。
其中, E [·]表示數(shù)學(xué)期望算子。對(duì)屬于類別γ的所有紙幣樣本空間協(xié)方差矩陣求平均值,即得到Cγ。為了能夠同時(shí)對(duì)這些協(xié)方差矩陣進(jìn)行對(duì)角化,給出復(fù)合協(xié)方差矩陣即,采用式(7)對(duì)該協(xié)方差矩陣進(jìn)行對(duì)角化,即
其中,Cc是厄米特矩陣,U表示四元酉矩陣,Σ表示對(duì)角矩陣,H表示厄米特共軛轉(zhuǎn)置算子。采用白化矩陣對(duì)復(fù)合協(xié)方差矩陣C進(jìn)行白化,即
c
結(jié)合式(8)與式(9),采用式(10)計(jì)算四元矩陣空間濾波器,則有
因此,紙幣樣本xγ經(jīng)過四元矩陣空間濾波器作用后,得到矩陣yγ=Γxγ。對(duì)于四元數(shù)q=qr+qη(η = i ,j,k),根據(jù) STU-CCSP(strong uncorrelating transform complex common spatial pattern)算法[12]的思路,采用等價(jià)的復(fù)數(shù)描述四元數(shù)固定系數(shù)對(duì)之間的內(nèi)在聯(lián)系。受此啟發(fā),本文采用上述定義的厄米特協(xié)方差矩陣Cqη(η =i,j,k)來挖掘矩陣yγ分解系數(shù)之間具有的內(nèi)在聯(lián)系。接下來,采用式(11)對(duì)厄米特協(xié)方差矩陣Cqη(η =i,j,k)進(jìn)行擴(kuò)展,則有
其中,厄米特協(xié)方差矩陣可以分解為如式(2)所示。
其中,Qη為四元酉矩陣,Λη為實(shí)對(duì)角矩陣。結(jié)合式(11)與式(12),Λη定義為
如上所述,對(duì)于紙幣樣本xγ,經(jīng)過四元濾波器作用后得到四元分解矩陣yγ,采用四元數(shù)實(shí)部與虛部的方差作為紙幣圖像分類識(shí)別的特征向量,即
采用式(14)~式(17)計(jì)算得到屬于某一類別的紙幣樣本特征向量
綜上所述,基于四元共空間模式特征提取算法的具體步驟如下:
步驟1定義所有類別的空間協(xié)方差矩陣Cγ;
步驟2計(jì)算復(fù)合協(xié)方差矩陣Cc,并對(duì)Cc進(jìn)行對(duì)角化;
步驟3計(jì)算白化矩陣M與白化數(shù)據(jù)vγ=Mxγ,并對(duì)Cc進(jìn)行白化操作;
步驟4對(duì)矩陣Gγ進(jìn)行對(duì)角化,并計(jì)算得到特征向量W;
步驟 5計(jì)算厄米特協(xié)方差矩陣
步驟 6構(gòu)造復(fù)合厄米特協(xié)方差矩陣Ccη=并對(duì)Ccη進(jìn)行對(duì)角化
步驟 7計(jì)算標(biāo)準(zhǔn)四元矩陣濾波器和復(fù)合四元矩陣濾波器
步驟8根據(jù)yγ=Γcx與yηγ=Γηx,計(jì)算紙幣樣本的特征向量
本文提出的QCSP特征提取算法不僅具有較高的穩(wěn)定性,同時(shí)還具有較低的時(shí)間計(jì)算復(fù)雜度。首先,從數(shù)學(xué)分析的角度證明本文特征提取算法的穩(wěn)定性。對(duì)于在高速采集過程中受噪聲干擾的紙幣樣本向量定義如式(19)所示。其中,xγ′是原始紙幣樣本,Τψ是四元矩陣變換,μ是紙幣特征區(qū)域上的噪聲信號(hào)。通過引入條件理論中的變換條件數(shù)作為特征穩(wěn)定性的度量,基于變換集合Θ,給出類條件數(shù)定義,則有
式(20)存在下界,即
其中,X表示四元矩陣, σmax(X)是四元矩陣的最大奇異值。因此,當(dāng)XTX的奇異值足夠大時(shí),QCSP算法能夠獲得足夠穩(wěn)定的特征向量。另外,采用式(5)計(jì)算得到四元向量的增廣向量q? =ψqR,其具有的增廣協(xié)方差矩陣定義為
經(jīng)上述推導(dǎo),并結(jié)合式(22)與式(23),可以得出QCSP特征提取算法的時(shí)間復(fù)雜度是基于復(fù)數(shù)共空間模式特征提取算法的四分之一。因此,基于QCSP紙幣特征提取算法能夠滿足實(shí)際紙幣清分系統(tǒng)對(duì)實(shí)時(shí)性的要求。
本文自行設(shè)計(jì)清分系統(tǒng)的圖像模塊采用基于“接觸式傳感器(CIS)-FPGA-DSP”的結(jié)構(gòu)模式。將對(duì)實(shí)時(shí)性要求較高的邏輯運(yùn)算放在FPGA中完成,將紙幣圖像預(yù)處理、特征提取與識(shí)別放在DSP中完成。為了驗(yàn)證本文提出算法的有效性,從自行設(shè)計(jì)的紙幣清分系統(tǒng)中分別采集人民幣、美元與歐元構(gòu)建3個(gè)紙幣圖像數(shù)據(jù)庫。
紙幣圖像樣本是通過接觸式圖像傳感器得到,具體構(gòu)建的3個(gè)實(shí)驗(yàn)數(shù)據(jù)庫描述如下:1) 數(shù)據(jù)庫1(D1, database 1)由20 000張人民幣樣本圖像組成,具有100元、50元、20元、10元、5元等5個(gè)主幣,每個(gè)幣值有4個(gè)面向,共有20種圖像;2) 數(shù)據(jù)庫2 (D2, database 2)由18 000張美元樣本圖像組成,具有100美元、50美元、20美元、10美元、2美元、1美元6種主幣,每個(gè)幣值有4個(gè)面向,共有24種圖像;3) 數(shù)據(jù)庫3 (D3, database 3)由15 000張歐元樣本圖像組成,具有500歐元、200歐元、100歐元、50歐元、20歐元、10歐元、5歐元7種主幣,每個(gè)幣值有4個(gè)面向,共有28種圖像。其中,全新的紙幣樣本有32 860張,占比62%;各種污損紙幣樣本為15 105張,占比28.5%;扭曲變形和噪聲紙幣樣本為5 035張,占比9.5%。
本文中所處理的紙幣圖像樣本來自于高速掃描裝置,紙幣在一個(gè)機(jī)械通道中高速運(yùn)行,由圖像傳感器對(duì)其進(jìn)行掃描,獲得圖像信息。由于紙幣在通道中高速連續(xù)運(yùn)行,這樣就不可避免地造成紙幣圖像發(fā)生傾斜、側(cè)移等現(xiàn)象。因此在進(jìn)行紙幣圖像特征提取之前需要經(jīng)過一個(gè)預(yù)處理過程,首先利用錢幣圖像邊緣為直線的特點(diǎn),采用在圖像上等間隔位置檢測(cè)邊緣的方法,在每一條邊上檢測(cè)出一個(gè)邊緣點(diǎn)序列,然后對(duì)邊緣點(diǎn)序列采用最小二乘擬合得到錢幣圖像的邊緣。
為了驗(yàn)證本文提出算法的有效性,將QCSP算法應(yīng)用于紙幣識(shí)別中,并將QCSP算法與一些經(jīng)典的紙幣特征提取算法如DWT[6]算法、MASK[2]算法、GRID[5]算法和 CFFE[7]算法進(jìn)行比較。另外,鑒于BP神經(jīng)網(wǎng)絡(luò)能夠自適應(yīng)地發(fā)現(xiàn)紙幣樣本數(shù)據(jù)之間的規(guī)律性,而且具有較強(qiáng)的自學(xué)與自組織能力,本文將BP神經(jīng)網(wǎng)絡(luò)作為紙幣識(shí)別階段的分類器。使用BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的輸入層節(jié)點(diǎn)個(gè)數(shù)為提取紙幣圖像的特征維數(shù),輸出層節(jié)點(diǎn)個(gè)數(shù)為各幣種具有的面值與面向,2個(gè)隱含層節(jié)點(diǎn)個(gè)數(shù)分別為18與32,訓(xùn)練權(quán)系數(shù)更新步長(zhǎng)為0.1,最小誤差為10-8,最大迭代次數(shù)為9×104次。數(shù)據(jù)庫D1~D3中測(cè)試樣本的平均識(shí)別率如圖3~圖5所示,實(shí)驗(yàn)結(jié)果表明采用本文提出的QCSP算法所獲得的平識(shí)別率明顯高于其他 4種算法,3個(gè)數(shù)據(jù)庫的識(shí)別率分別提高到98.86%, 99.18%與93.68%。
圖1 人民幣數(shù)據(jù)庫D1平均識(shí)別率
圖2 美元數(shù)據(jù)庫D2平均識(shí)別率
為了進(jìn)一步驗(yàn)證本文提取紙幣特征的抗干擾性,對(duì)其中15 105張具有不同污損程度的紙幣樣本進(jìn)行實(shí)驗(yàn)。采用 DWT算法、MASK算法、GRID算法、CFFE算法和QCSP算法的紙幣識(shí)別率分別為82.31%,88.54%,92.57%,96.89%和98.24%,這本文提出的QCSP算法紙幣特征提取算法相比于其他算法能夠更有效地克服污損對(duì)紙幣圖像特征造成的影響。另外,在采集大量紙幣樣本的過程中,不可避免地會(huì)出現(xiàn)樣本圖像殘缺不全、受噪聲干擾導(dǎo)致紙幣圖像定位不準(zhǔn)確以及紙幣圖像傾斜過大等情況,針對(duì)上述情況,本文在紙幣識(shí)別階段引入拒識(shí)類的策略,有效地增加了算法的穩(wěn)定性。表1~表3顯示了采用本文提出的QCSP算法與DWT算法、MASK算法、GRID算法、CFFE算法所得到的實(shí)測(cè)識(shí)別率與拒識(shí)率。實(shí)驗(yàn)結(jié)果表明采用本文提出的QCSP算法較其他4種方法取得了更高的識(shí)別率和較低的拒識(shí)率。
圖3 歐元數(shù)據(jù)庫D3平均識(shí)別率
在Intel Core I7 2.4 GHz CPU和8 GB RAM的平臺(tái)上給出紙幣特征提取與識(shí)別的運(yùn)行時(shí)間如表 4所示。實(shí)驗(yàn)結(jié)果表明本文算法較其他算法具有更低的時(shí)間復(fù)雜度。另外,紙幣清分系統(tǒng)是一種高速運(yùn)行的裝置,考慮到紙幣圖像掃描裝置與控制裝置的動(dòng)作時(shí)間,本文提出的算法較其他算法更能夠滿足紙幣清分系統(tǒng)的實(shí)時(shí)性要求。
針對(duì)紙幣圖像具有豐富的相位結(jié)構(gòu)特征信息,結(jié)合四元矩陣自身的特性,本文提出一種基于四元共空間模式的紙幣圖像特征提取算法。該算法能夠有效地克服掩模特征的不穩(wěn)定性以及網(wǎng)格特征較難區(qū)分風(fēng)格相近紙幣圖像的難題。另外,本文提出的算法還能夠彌補(bǔ)小波變換與 contourlet變換缺乏對(duì)紙幣圖像相位信息描述的缺陷。為了驗(yàn)證提出算法的有效性,本文將其應(yīng)用到紙幣識(shí)別系統(tǒng)中,實(shí)驗(yàn)結(jié)果表明本文提出的算法不僅能夠取得較高的識(shí)別率,而且對(duì)于污損、扭曲變形和受噪聲干擾的紙幣圖像也具有良好的可分性。為了進(jìn)一步提高紙幣識(shí)別的穩(wěn)定性和準(zhǔn)確性,本文在紙幣識(shí)別階段引入拒識(shí)類的策略。本文提出的算法已成功應(yīng)用在一個(gè)資源約束的嵌入式清分系統(tǒng)中,并且能夠滿足系統(tǒng)實(shí)時(shí)性的要求。
表1 數(shù)據(jù)庫D1實(shí)際測(cè)試數(shù)據(jù)(識(shí)別率/拒識(shí)率)
表2 數(shù)據(jù)庫D2實(shí)際測(cè)試數(shù)據(jù)(識(shí)別率/拒識(shí)率)
表3 數(shù)據(jù)庫D3實(shí)際測(cè)試數(shù)據(jù)(識(shí)別率/拒識(shí)率)
表4 紙幣識(shí)別時(shí)間/ms