熊澤本
(荊楚理工學(xué)院數(shù)理學(xué)院,湖北荊門 448000)
生物特征識(shí)別技術(shù)主要是通過辨別人類的生理特征如手形、指紋、臉形、虹膜、視網(wǎng)膜等,或者是行為特征如字跡、聲音等進(jìn)行身份鑒別認(rèn)證技術(shù).其特征識(shí)別技術(shù)主要涉及到計(jì)算機(jī)視覺技術(shù)、圖像和語音處理技術(shù)、可視化模擬、傳感器和智能機(jī)器人探測(cè)系統(tǒng)等.顱骨在人體的內(nèi)部,特征穩(wěn)定,并且不易被破壞,所以它不易偽裝,相對(duì)于指紋和人臉識(shí)別系統(tǒng)來說,有更高的穩(wěn)定性,而且每個(gè)人的顱骨特征也不相同,至今為止,還沒有發(fā)現(xiàn)兩個(gè)人有完全相同的顱骨,而且只要人成年后,顱骨特征一般就不會(huì)發(fā)生改變了,基于顱骨特征的眾多優(yōu)點(diǎn),基于顱骨的生物特征識(shí)別技術(shù)是當(dāng)前國內(nèi)外學(xué)者研究的熱點(diǎn).
在進(jìn)行顱骨特征識(shí)別前,先要對(duì)醫(yī)學(xué)掃描圖像進(jìn)行預(yù)處理,包括要對(duì)圖像進(jìn)行除噪、插值、分割處理,預(yù)處理完成后就要對(duì)圖像進(jìn)行三維重建,在這里采用的是基于等值面提取的表面重建算法,獲得顱骨的三維模型,文中獲取的是顱骨的三維網(wǎng)格信息,利用的是Marching Cubes算法,在VC軟件開發(fā)平臺(tái)上編程實(shí)現(xiàn),三維網(wǎng)格信息中既包括顱骨的三維幾何信息,同時(shí)還有三維模型的網(wǎng)絡(luò)拓?fù)湫畔?,基于本文的目的就是想?duì)顱骨的幾何信息進(jìn)行研究,所以又對(duì)得到的三維信息進(jìn)行處理,利用Matlab編程提取出顱骨的三維幾何信息,獲取信息后就要進(jìn)行識(shí)別的關(guān)鍵處理,也即物體的特征提取.
三維模型數(shù)據(jù)壓縮算法有很多種,根據(jù)三維模型的表達(dá)式,一般都用網(wǎng)格結(jié)構(gòu)對(duì)它進(jìn)行描述,一個(gè)三維網(wǎng)格模型是由幾何數(shù)據(jù)、拓?fù)鋽?shù)據(jù)和屬性數(shù)據(jù)組成的[1].有的時(shí)候圖像中可能沒有屬性數(shù)據(jù),只有幾何和屬性數(shù)據(jù)兩種.幾何數(shù)據(jù),它描述的是頂點(diǎn)的位置坐標(biāo).拓?fù)鋽?shù)據(jù)描述的是面與面、頂點(diǎn)與頂點(diǎn)的一種連接關(guān)系,屬性數(shù)據(jù)描述的是各個(gè)頂點(diǎn)的顏色值和它的紋理特征.文中是想通過顱骨的坐標(biāo)值來對(duì)其進(jìn)行識(shí)別,所以在對(duì)圖像模型進(jìn)行處理時(shí),只是針對(duì)圖像的幾何數(shù)據(jù)進(jìn)行壓縮,因?yàn)樗枋龅氖琼旤c(diǎn)的坐標(biāo)值.
首先利用MATLAB編程PLY格式的數(shù)據(jù)轉(zhuǎn)換為三維網(wǎng)格數(shù)據(jù).編程代碼為:
然后再利用編程把三維網(wǎng)格中的幾何坐標(biāo)提取出來
這樣就把三維網(wǎng)格模型的幾何數(shù)據(jù)讀取了出來,也就是把模型的頂點(diǎn)坐標(biāo)讀取了出來,接下來的目的就是要對(duì)這些坐標(biāo)值進(jìn)行壓縮處理,進(jìn)而選取出重要的特征點(diǎn)進(jìn)行識(shí)別.實(shí)際上就涉及到一個(gè)多行三列的矩陣問題.進(jìn)而就把問題轉(zhuǎn)化到了二維空間,這時(shí)所得的數(shù)據(jù)量就相當(dāng)于一幅二維的圖像.接下來就要利用模式識(shí)別的知識(shí)對(duì)圖像數(shù)據(jù)進(jìn)行處理,提取里面的重要特征.實(shí)驗(yàn)結(jié)果如下圖1所示:
圖1 顱骨重建
在收集信息的過程中,總是希望能夠從眾多信息中把我們感興趣的那部分信息提取出來.這樣在進(jìn)行模型識(shí)別時(shí)就可以提高速度,節(jié)省時(shí)間.而且維數(shù)大的模式空間在處理時(shí)可能會(huì)導(dǎo)致系統(tǒng)癱瘓,還有就是維數(shù)太多也會(huì)影響數(shù)據(jù)的分類.而且并不是每一個(gè)特征對(duì)事物的描述都有相同意義.特征選擇和提取的基本任務(wù)就是如何從許多特征中找出那些最有效的特征.把特征提取出來后,目的就是為了后邊的分類識(shí)別使用.在對(duì)物體進(jìn)行分類識(shí)別時(shí),必須使提取出特征的錯(cuò)誤概率最小.
在對(duì)圖像進(jìn)行處理時(shí),用到的特征一般有[2]:
(1)直觀性特征.不用經(jīng)過處理,一看就知道的特征,這種也是最簡單的特征識(shí)別.它包括圖像的邊緣、紋理、幾何形狀等等,直觀性特征具有速度快,識(shí)別率高的特點(diǎn).
(2)統(tǒng)計(jì)特征,如直方圖特征,主分量特征等,將圖像看作一種二維隨機(jī)過程,可以引入統(tǒng)計(jì)上的各階矩作為特征來描述和分析圖像,它們能夠在保留主要分類信息的基礎(chǔ)上大大降低特征的維數(shù).
(3)變換系數(shù)特征,對(duì)圖像進(jìn)行各種數(shù)學(xué)變換,可以將變換的系數(shù)作為圖像的一種特征,如Fourier變換、極半徑均差Legender變換等在圖像特征提取中均有廣泛的應(yīng)用.
特征提取的步驟可以分為特征形成和特征提取.特征形成就是被識(shí)別對(duì)象所產(chǎn)生的一組基本特征,它可以是計(jì)算出來的,也可以是用傳感器,智能儀表檢測(cè)出來的信號(hào).特征提取就是從圖像中形成的原始特征向量值非常大,如果直接把這些值送入分類器,就會(huì)給分類器造成很大的壓力.不僅數(shù)據(jù)的識(shí)別速度會(huì)很慢,而且重要的是還會(huì)給數(shù)據(jù)處理的軟件系統(tǒng)造成很大的壓力,導(dǎo)致系統(tǒng)癱瘓或者使數(shù)據(jù)識(shí)別的錯(cuò)誤概率變大.而特征提取正好解決了這個(gè)的問題,它的目的就是從眾多特征中找出我們最需要的特征,把它們作為信息特征提取的特征向量,這可以看成是一種降維的過程,人體顱骨特征作為一種新的生物識(shí)別方式,它的提取一般分為兩類:
(1)二維信息特征提取.如邊緣、輪廓等.
(2)三維信息特征提取.主要就是顱骨的三維幾何信息.
主成分分析[3](Principal Component Analysis,PCA)也稱主分量分析,旨在利用降維的思想,把多指標(biāo)轉(zhuǎn)化為少數(shù)幾個(gè)綜合指標(biāo),是一種掌握事物主要矛盾的統(tǒng)計(jì)分析方法,它可以從多元事物中解析出主要影響因素,揭示事物的本質(zhì),簡化復(fù)雜的問題.對(duì)于多元統(tǒng)計(jì)分析中,若有n個(gè)變量的m個(gè)觀察值,形成一個(gè)nm的數(shù)據(jù)矩陣,n通常比較大.在實(shí)證問題研究中,為了全面、系統(tǒng)地分析問題,人們希望可以抓住體現(xiàn)事物主要特征的幾個(gè)主要變量,在具體分析時(shí),只需要將這幾個(gè)變量分離出來.但是,在一般情況下,并不能直接找出這樣的關(guān)鍵變量.這時(shí)我們可以把給定的一組相關(guān)變量通過線性變換轉(zhuǎn)成另一組不相關(guān)的變量,用原有變量的線性組合來表示事物的主要方面,這就是PCA.
PCA分析也即主分量分析方法,用在顱骨特征提取方面它的具體步驟是:首先初始化我們的圖像訓(xùn)練庫,計(jì)算出特征向量,輸入要識(shí)別的顱骨圖像數(shù)據(jù),和庫里的數(shù)據(jù)進(jìn)行比較,通過檢查圖像與特征空間的距離來進(jìn)行判斷,看看的圖像是否是數(shù)據(jù)庫中的一個(gè),從而進(jìn)行識(shí)別.
對(duì)于前面獲得的顱骨的幾何數(shù)據(jù),在此用f(x,y)表示矩陣的行列信息[4],這時(shí)實(shí)際上就相當(dāng)于在二維空間對(duì)圖像進(jìn)行處理,而對(duì)于任意的點(diǎn)x、y.f正比于圖像在該點(diǎn)的灰度值,如果把顱骨的數(shù)據(jù)集設(shè)為{Ri|i=1,…,M},M這為圖像的總個(gè)數(shù),則這M個(gè)顱骨的平均向量為
每個(gè)顱骨圖像與顱骨平均向量的差值向量是
該訓(xùn)練集的總體散步矩陣為
或者是
如果直接計(jì)算一個(gè)M2×M2的矩陣,那計(jì)算量是非常大的,所以要想辦法減小它,在這可以構(gòu)造一個(gè)矩陣,
這是個(gè)M×M的較小的矩陣,和原數(shù)據(jù)量相比,減少了很多,接著計(jì)算矩陣的特征值和特征向量,特征向量是正交歸一的.這個(gè)正交歸一的特征向量就是顱骨圖像的特征向量.
假設(shè)X代表了一個(gè)m維的列向量,而這里的二維數(shù)據(jù)矩陣是一個(gè)隨機(jī)的n×m矩陣,這時(shí)就可以通過有一個(gè)線性轉(zhuǎn)換,把圖像信息投影到X軸上,于是得出:
通過投影計(jì)算,就可以得出一個(gè)n×1維的向量,這個(gè)向量就是二維數(shù)據(jù)矩陣的一個(gè)特征投影向量.那么一個(gè)好的投影矩陣就顯得尤為重要,實(shí)際上,可以通過計(jì)算投影向量的協(xié)方差矩陣來表示數(shù)據(jù)信息樣本的總的分散量.通過分析可以獲得下列的判別規(guī)則
公式中的Tx代表了數(shù)據(jù)樣本集的投影特征向量的協(xié)方差矩陣,通過上式可以看出,這個(gè)判別準(zhǔn)則最重要的一點(diǎn)就是找到一個(gè)合適的投影方向軸,使所有數(shù)據(jù)信息投影到這個(gè)軸上的時(shí)候,所得樣本總的離散度是最大的,經(jīng)過分析可得,Tx可以表示為
則
如果我們?cè)O(shè)定一個(gè)矩陣Rt,
則Rt就是數(shù)據(jù)矩陣的一個(gè)離散度矩陣,而且從上式可以看出來,Rt是一個(gè)行數(shù)和列數(shù)相同的方陣,這樣就可以利用數(shù)據(jù)訓(xùn)練樣本來直接估計(jì)Rt.
假設(shè)現(xiàn)在一共獲取了M個(gè)人的顱骨數(shù)據(jù)信息,把這些數(shù)據(jù)做為訓(xùn)練樣本,如果第i個(gè)人的數(shù)據(jù)樣本被表示成為一個(gè)m×n的矩陣,暫且把這個(gè)矩陣記為A,總的數(shù)據(jù)信息的平均向量是A1,則Rt可以表示為:
則判決規(guī)則就可以表示為:
式中的X是一個(gè)一元的特征向量,把上式這個(gè)標(biāo)準(zhǔn)看成是總的離散度準(zhǔn)則,其中X就是我們的最優(yōu)化的投影軸,換一句話說就是當(dāng)準(zhǔn)確的選擇好矩陣X軸的投影以后,就能夠使總樣本的離散度最大化,這樣就很好的壓縮了樣本的數(shù)據(jù)信息.但是在實(shí)際應(yīng)用的過程中,只有一個(gè)最優(yōu)化的軸是不夠的,大多數(shù)情況下,需要選擇一系列的軸,X1,X2,…,Xn,這一系列的X所對(duì)應(yīng)的判別準(zhǔn)則就是
則最優(yōu)的特征軸就是Rt的正交向量所對(duì)應(yīng)的前n個(gè)最大的特征值.
前面已經(jīng)介紹過了,X1,X2,…,Xn就是數(shù)據(jù)樣本一系列最優(yōu)的特征向量,進(jìn)行圖像數(shù)據(jù)的特征提取,利用的也是這幾個(gè)最優(yōu)特征向量.
在采用主分量分析進(jìn)行特征提取之前,首先要找出樣本集的一系列投影軸,這些軸可以使總樣本級(jí)的離散度最大化,找出這一系列的投影軸后,就可以獲得投影向量,它們分別是X1,X2,…,Xn,它們被叫做圖像的主成分向量,獲得的向量經(jīng)常用于形成一個(gè)m×n維的矩陣,這個(gè)矩陣就叫做特征矩陣.
基于二維主成分分析的優(yōu)點(diǎn),速度快、簡單,而且也可以較大程度的保留原始圖像的數(shù)據(jù)信息,因此本文在對(duì)二維數(shù)據(jù)進(jìn)行處理上,采用的是二維主成分分析算法.
4.3.1 數(shù)據(jù)分析
首先利用二維主成分分析方法對(duì)二維數(shù)據(jù)進(jìn)行處理,體現(xiàn)在程序上采用的是MATLAB工具箱進(jìn)行的,通過分析可以看出,選取投影向量時(shí),只需要選擇樣本集的前n個(gè)最優(yōu)特征向量就好了,而且選取的圖像數(shù)據(jù)越多,所得圖像就越清晰,同時(shí)恢復(fù)后的圖像也越來越接近于原始圖像.
4.3.2 利用主成分分析的具體實(shí)現(xiàn)
一般來說,采用兩種方法來提取特征,一維主成分分析和二維主成分分析,為了比較,這里對(duì)兩種方法都進(jìn)行了比較計(jì)算,具體過程實(shí)現(xiàn)的流程圖如圖2所示.
對(duì)圖像數(shù)據(jù)進(jìn)行處理后,計(jì)算所有圖像數(shù)據(jù)的投影軸,進(jìn)行求取識(shí)別的特征向量,對(duì)于特征向量的求取方法,前面已經(jīng)詳細(xì)的介紹過了,這里不在做討論.
為了分析比較,在此采用了一維和二維兩種主成分分析的方法,當(dāng)分類方法相同時(shí),兩種方法的識(shí)別率相差很大,并且二維主成分分析的識(shí)別率明顯高于一維主成分分析,如表1所示.
圖2 流程圖
表1 識(shí)別率
4.3.3 分類器的選擇
在完成了特征的選擇和提取后,接下來的目的就是對(duì)這些特征進(jìn)行處理,對(duì)它們進(jìn)行識(shí)別,識(shí)別的方法很多,但是不管是哪種方法,它們的本質(zhì)是一樣的,目的都是為了采用某種判別準(zhǔn)則把特征向量進(jìn)行分類,進(jìn)而把物體區(qū)分開來.
一般情況下都是根據(jù)給定的特征把物體進(jìn)行分類,來確定識(shí)別的物體到底屬于哪個(gè),但是現(xiàn)實(shí)中,因?yàn)樗玫臉颖局g總是存在很大的相似性,所以在進(jìn)行分類識(shí)別的時(shí)候,不可避免的會(huì)出現(xiàn)一些分類錯(cuò)誤,在分類的過程中,不可能完全的消除它們,只能是進(jìn)最大努力,使錯(cuò)誤達(dá)到最小化,因此判斷一個(gè)分類準(zhǔn)則到底好不好的標(biāo)準(zhǔn)就是看看利用這種方法進(jìn)行識(shí)別時(shí),出現(xiàn)的錯(cuò)誤率是不是最小的,這個(gè)標(biāo)準(zhǔn)是模式識(shí)別中研究的關(guān)鍵性的問題.因此要根據(jù)自己實(shí)際的要求選擇合適的識(shí)別方法.
在進(jìn)行分類識(shí)別時(shí),可以采用的分類方法很多[6],有最近鄰法、K近鄰法、神經(jīng)網(wǎng)絡(luò)法,還有貝葉斯算法,現(xiàn)在有些研究機(jī)構(gòu)也可以研究把兩種方法融合在一起,組成多類混合法.本文中采用的是最常用的分類識(shí)別方法.
最近鄰法[5]進(jìn)行分類的根據(jù)是:首先假設(shè)一共有w個(gè)類別,它們分別為d1,d2,…,dw,在每個(gè)表明的類別中,又有m個(gè)樣本,標(biāo)準(zhǔn)規(guī)定了某類的判別函數(shù)為測(cè)試的樣本與其最近的樣本之間的距離值.
其中k值代表了m類樣本中的第k個(gè)樣本.
文中采用的是最近鄰法,距離的度量值在此選取的是余弦[7].當(dāng)然也可以選擇歐式距離來識(shí)別.
設(shè)Ttest為需要進(jìn)行識(shí)別的圖像數(shù)據(jù)信息的特征向量,Ttrain為參與訓(xùn)練的已知樣本的特征向量值,則根據(jù)最近鄰的規(guī)則,它們之間的余弦可以定義為
于是,對(duì)于最近鄰法則來說,基于余弦的最近鄰距離為
4.3.4 實(shí)驗(yàn)結(jié)果與分析
整個(gè)識(shí)別過程中,由于條件的限制,文中一共采用了18個(gè)人的顱骨切片數(shù)據(jù)信息,在這18個(gè)人中,每個(gè)人都只采集了1次,為了表格分析,這里只列出了10個(gè)人的特征識(shí)別結(jié)果,在識(shí)別過程中,每個(gè)人都進(jìn)行了10次比對(duì),通過MATLAB軟件編程仿真和分析,可以看出選取的特征樣本具有很好的可聚類性能,通過二維主成分分析得到的特征向量也很好的反映了數(shù)據(jù)的細(xì)節(jié)信息,識(shí)別時(shí),能夠快速的對(duì)個(gè)體做出識(shí)別,識(shí)別率也很可觀,見表2所示.
表2 識(shí)別結(jié)果分析表
文章主要介紹了圖像的特征提取的定義,介紹了兩種特征提取的算法,一種是一維主分量分析,一種是二維主分量分析,并分析了兩者的優(yōu)缺點(diǎn),因?yàn)樗脠D像都是二維的,所以在利用二維主分量分析的時(shí)候就不用經(jīng)過一個(gè)降維的處理,這樣可以很好的提高識(shí)別效率,節(jié)省識(shí)別時(shí)間,所以本文中在對(duì)圖像進(jìn)行壓縮特征提取時(shí),采用的是二維主分量分析的方法.識(shí)別過程中,采用的是最常用的最近鄰比較算法,文中是以數(shù)據(jù)的余弦作為距離的度量值,通過實(shí)驗(yàn)結(jié)果和分析可以看出來,利用二維主成分分析對(duì)數(shù)據(jù)進(jìn)行識(shí)別有很好的識(shí)別效果,識(shí)別率達(dá)到了98.6%.
[1]邊祺.模式識(shí)別[M].北京:清華大學(xué)出版社,1998.
[2]周杰,盧春雨,張長水,等.人臉自動(dòng)識(shí)別方法綜述[J].電子學(xué)報(bào),2000,28(4):102-106.
[3]張翠平,蘇光大.人臉識(shí)別技術(shù)綜述[J].中國圖像圖形學(xué)報(bào),2000,5A(11):885-894.
[4]徐之海,馮華君,李奇,等.基于K-L變換的人臉識(shí)別研究[J].光電工程,2001,28(6):48-51.
[5]胡廣書.現(xiàn)代信號(hào)處理教程[M].北京:清華大學(xué)出版社,2005.
[6]Yang Jian,Zhang David,Yang Jingru.Two-Dimensional PCA:A new approach to appearance-based face reprentation and recognition[J].IEEE Trans.On Pattern Analysis Machine Intelligence,2004,26(1):131-133.
[7]段曉東,王存睿,劉向東,等.人臉的民族特征抽取及其識(shí)別[J].計(jì)算機(jī)科學(xué),2010,37(8):276-301.