王怡田
摘 要:特征抽取是模式識(shí)別研究中的基本。就圖像識(shí)別而言,抽取有效的圖像特征在完成識(shí)別任務(wù)中十分重要。線性和非線性投影分析在特征抽取中是比較經(jīng)典且應(yīng)用范圍最廣的方法,且取得了成功,在線性和非線性投影分析中主要是處理模式中的特征,不適合大量的表示數(shù)據(jù)特征中的融合與抽取。
關(guān)鍵詞:圖像識(shí)別;特征提??;圖像識(shí)別
中圖分類號(hào): TP391 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1673-1069(2016)14-158-2
0 引言
主成分分析的基本思路是找出最優(yōu)的單位正交矢量集,在線性組合下重建原始樣本,重建后樣本和原樣本間會(huì)出現(xiàn)比較小的誤差。一般情況下會(huì)采用訓(xùn)練樣本協(xié)方差矩陣方法作為開展基,選擇適合的若干最大非零特征的特征向量最終成為主成分或是主分量,模式樣本在主成分中的投影系數(shù)被稱為主成分特征。
1 非線性投影分析
1.1 在流形基礎(chǔ)上的特征提取
復(fù)雜高維模式樣本可能會(huì)通過(guò)一組維數(shù)中出現(xiàn)嚴(yán)重低于樣本特征維數(shù)實(shí)現(xiàn)確定。就幾何學(xué)而言,上述屬性數(shù)據(jù)簡(jiǎn)稱為流形。將流形假設(shè)當(dāng)成基礎(chǔ),利用流形中的基本性質(zhì),研究高維空間數(shù)據(jù)并簡(jiǎn)化數(shù)據(jù),降低維數(shù),對(duì)復(fù)雜式的內(nèi)在規(guī)律學(xué)習(xí)方法進(jìn)行探尋叫作流形學(xué)習(xí)。更加嚴(yán)格的表述是:假設(shè)數(shù)據(jù)是均勻采樣在一個(gè)高維空間中的低維流形,求得對(duì)應(yīng)的嵌入映射,目的是實(shí)現(xiàn)維數(shù)約減或者是對(duì)其可視化需求進(jìn)行滿足。Seung等人在2000年站在的認(rèn)知角度上對(duì)流形角度開展了討論,確定感知是在流形的方式下存在,并在實(shí)驗(yàn)中證明了人腦的確存在穩(wěn)態(tài)流形,這就是在模式識(shí)別以及人類的感知中構(gòu)架其連同橋梁,使得流形學(xué)習(xí)存在了較為堅(jiān)實(shí)的理論基礎(chǔ)。主流行、譜分析以及變分法在本世紀(jì)初流形的學(xué)習(xí)研究中是三個(gè)熱點(diǎn),具有代表性的方法是同構(gòu)映射、局部線性嵌入和拉普拉斯本征映射等。通過(guò)以上方法會(huì)獲取較好的低維可視效果,針對(duì)映射非線性,如何得到測(cè)試樣本低維將會(huì)存在一定的困難,對(duì)此不適合對(duì)特征降維實(shí)現(xiàn)直接性的應(yīng)用。
此時(shí)需要注意,若將流形的學(xué)習(xí)映射轉(zhuǎn)為限制線性投影,流形學(xué)習(xí)方法線性化方式,取得測(cè)試樣本低維表示形式會(huì)更加容易。在如此的初衷基礎(chǔ)上,He等人提出了局部的保持投影以及鄰域保持嵌入等,分別通過(guò)LE和LLE的線性化方法的基礎(chǔ)上,成功應(yīng)用在人臉識(shí)別當(dāng)中。
1.2 稀疏學(xué)習(xí)上特征中的提取
針對(duì)以上線性投影方法,學(xué)習(xí)投影向量在所有原始特征變量基礎(chǔ)上實(shí)現(xiàn)線性組和,做出特征和變量層方面的解釋含義較為困難,這是其不能說(shuō)明什么變量在數(shù)據(jù)中的表示和分類中的十分關(guān)鍵作用的原因。實(shí)踐性利用線性投影抽取特征,不但會(huì)獲取最有效低維特征,還能更清楚了解什么樣的維數(shù)在壓縮中的作用更加關(guān)鍵,進(jìn)而對(duì)未來(lái)的數(shù)據(jù)特征的采集當(dāng)作指導(dǎo)和參考,同時(shí)也可以進(jìn)一步加深人們對(duì)數(shù)據(jù)的更深層次的理解。一方面可以對(duì)關(guān)鍵特征進(jìn)行少量的收集,降低工作難度及強(qiáng)度;此外還能對(duì)算法的時(shí)間以及空間效應(yīng)進(jìn)行提升。也就是在這一應(yīng)用背景下,提取樣本稀疏特征,正確方式是模式的識(shí)別舞臺(tái)。[1]對(duì)系數(shù)特征進(jìn)行提取,在一定基礎(chǔ)上引入L0和L1范數(shù)同時(shí)對(duì)其實(shí)現(xiàn)優(yōu)化,其中的一部分表征變量權(quán)重系數(shù)將0作為目的。0元素對(duì)應(yīng)的變量在特征提取中未做到貢獻(xiàn),因此,稀疏特征就提取本質(zhì)上可看作特征選擇。
2 相關(guān)投影分析
2.1 典型相關(guān)分析的基本理論和研究
典型相關(guān)分析屬于經(jīng)典的多元統(tǒng)計(jì)方法,該方法的首次提出者是Hotelling,CCA在很多的領(lǐng)域中都被進(jìn)行了應(yīng)用,除了應(yīng)用價(jià)值,在理論上也存在著較為深刻的意義,因而被研究學(xué)者所重視,多元回歸分析在某種意義上,可以判別分析等數(shù)據(jù),被看作歸結(jié)典型分析的特例。
典型相關(guān)分析主要是研究?jī)山M的隨機(jī)矢量數(shù)據(jù)相關(guān)性問(wèn)題,具體來(lái)講,已經(jīng)存在的兩個(gè)已被去掉的均值隨機(jī)矢量樣本X=[x1,x2,…,xn]∈Rp×N和Y=[y1,y2,…,yn]∈Rp×N,CCA的目的是要找出一對(duì)投影的方向w和u,對(duì)投影后的樣本特征進(jìn)行滿足后,z1=wTX和z2=uT之間是存在最大相關(guān)性的。通常情況下,投影方可以在最大化準(zhǔn)則下將得到函數(shù):
2.2 偏最小二乘基本理論
偏最小二乘的回歸分析是在應(yīng)用領(lǐng)域中對(duì)新型多元數(shù)據(jù)分析法來(lái)提取,該理論是Word等人在1983年提出的。近20年后,PLS通過(guò)方法、理論、應(yīng)用取得了十分快速的發(fā)展。PLS模型的魯棒性使得其出現(xiàn)了回歸性的分析以及維數(shù)壓縮分類中的有力工具,在最近幾年被廣泛應(yīng)用在了程序控制、圖像處理等領(lǐng)域內(nèi)。
偏最小二乘的基本思想是對(duì)兩個(gè)去掉均值的隨機(jī)樣本X=[x1,x2,x3,…,xN]∈Rp×N和Y=[y1,y2,y3,…,yN]∈Rq×N,找出一對(duì)投影方向上w和u,對(duì)于投影后樣本特征z1=wTX與Z2=uTY相互的最大協(xié)方差系數(shù)。在投影的方向選擇中,可以在最優(yōu)化情況獲得最優(yōu)的目標(biāo)函數(shù):
JPLS(w,u)=Cov(z1,z2)=wTSxyu
上式中的約束條件為:wTw=uTu=1,Sxy表示的為兩組特征相互間的協(xié)方差矩陣。對(duì)函數(shù)極值準(zhǔn)則進(jìn)行優(yōu)化,轉(zhuǎn)為兩組特征矩陣下SxyTSxy和SxySxyT最大本征值同本征向量的求解相關(guān)問(wèn)題。[3]
3 圖像識(shí)別中的應(yīng)用
3.1 人臉識(shí)別
人臉識(shí)別是在計(jì)算機(jī)作為輔助手段下,對(duì)靜態(tài)人臉圖像以及動(dòng)態(tài)序列圖像實(shí)現(xiàn)各種人臉圖像的匹配和分類。人臉識(shí)別技術(shù)可以被看做是模式識(shí)別研究中的重點(diǎn)研究?jī)?nèi)容,這是圖像處理、模式識(shí)別和計(jì)算機(jī)視覺(jué)較差影響的最為積極的研究方向。人臉識(shí)別中的關(guān)鍵性問(wèn)題是如何在人臉圖像中抽取穩(wěn)定有效的個(gè)體特征,并且使其可以和其他個(gè)體之間進(jìn)行區(qū)別。這一方式存在多種運(yùn)用優(yōu)勢(shì)。
無(wú)侵犯性是人臉識(shí)別技術(shù)中最大的優(yōu)點(diǎn),該技術(shù)可在不被識(shí)別察覺(jué)中實(shí)行,基本上不需要被識(shí)別者進(jìn)行合作,更不會(huì)造成反感情緒,進(jìn)而被廣泛的運(yùn)用在安全監(jiān)控和嫌疑人認(rèn)定等場(chǎng)景內(nèi)。
較為自然,人臉識(shí)別方式和人類識(shí)別特征相互之間有著較高相似度。日常生活中人們相互間的身份識(shí)別最直接且對(duì)常用的手段就是人臉識(shí)別。因此對(duì)于其他的生物特征,該方式更易被人接受。
性價(jià)比高,在人臉識(shí)別中運(yùn)用的硬件設(shè)備十分簡(jiǎn)單,基本上只需要對(duì)普通攝像頭進(jìn)行使用就可以,并且可以利用人臉識(shí)別的數(shù)據(jù)庫(kù)資源,這種情況下引起的系統(tǒng)成本往往比較低。
交互性強(qiáng),就人臉識(shí)別來(lái)看,授權(quán)用戶交互和配合可有效提升系統(tǒng)可靠性與可用性,就虹膜和指紋等識(shí)別系統(tǒng)而言,一般的用戶識(shí)別并不會(huì)發(fā)揮正常的作用。
3.2 手寫字體識(shí)別
在獲得字符的特征表示之后,我們可以對(duì)投影分析實(shí)行二次特征抽取和分類,通過(guò)這一方式可以消除原始特征變量的相關(guān)性,隨后降低特征空間的維數(shù),并且在識(shí)別的過(guò)程中可以在低維特征空間內(nèi)實(shí)施,進(jìn)而提升識(shí)別的速度。
3.3 圖像集的匹配和分類
匯總識(shí)別圖像的過(guò)程,就單復(fù)圖像的目標(biāo)可能會(huì)遭遇各種問(wèn)題引起的結(jié)果不穩(wěn)定情況,并且圖像會(huì)受到光照、視覺(jué)以及姿態(tài)和距離等多種因素的影響,進(jìn)而出現(xiàn)鑒別信息不穩(wěn)定的情況,或是在出現(xiàn)突發(fā)事件后造成目標(biāo)特征不顯著的問(wèn)題。在現(xiàn)實(shí)的生活中總是會(huì)出現(xiàn)大量的圖像資源,并且多數(shù)場(chǎng)合是在視頻序列下通過(guò)多模態(tài)的形式而出現(xiàn)的,常見的有多方位以及全天候的視頻監(jiān)控,就相同的監(jiān)控以及考察對(duì)象而言,其中是會(huì)存在各種不同的視角以及多個(gè)成像方式的問(wèn)題的。[4]傳統(tǒng)的識(shí)別方法是在多個(gè)圖像資源中選取比較高的成像質(zhì)量,且目標(biāo)十分明確的一張或者是多個(gè)圖片,實(shí)現(xiàn)分別判斷。
4 小結(jié)
文章在投影特征的分析基礎(chǔ)上開展深入的研究與分析,同時(shí)對(duì)圖像識(shí)別在一般情況下的運(yùn)用進(jìn)行了詳細(xì)的介紹,希望可以為相關(guān)工作者和研究者提供一定的參考。
參 考 文 獻(xiàn)
[1] 施展.圖像特征提取與識(shí)別的跡空間投影方法研究[D].華南理工大學(xué),2012:10-24.
[2] 侯書東.基于相關(guān)投影分析的特征提取研究及在圖像識(shí)別中的應(yīng)用[D].南京理工大學(xué),2012:15-29.
[3] 胡俐蕊.非負(fù)矩陣分解方法及其在選票圖像識(shí)別中的應(yīng)用[D].安徽大學(xué),2013:21-39.
[4] 湯德俊.人臉識(shí)別中圖像特征提取與匹配技術(shù)研究[D].大連海事大學(xué),2013:14-27.