衛(wèi)小強
摘要:該文研究了小樣本統(tǒng)計學習在生物識別中的數(shù)學模型估計問題,并探討了先驗風險優(yōu)化替代實際風險優(yōu)化的可行性以及機器學習的深度與廣度的矛盾性,最后在小樣本采集,識別,建立樣本數(shù)據(jù)庫等方面進行了分析研究。
關(guān)鍵詞:統(tǒng)計學習;學習深度;SVM;小樣本采樣
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2017)18-0178-02
人臉的識別與重建是一個系統(tǒng)辨識的課題。人臉特征是維度非常高的復雜特征模式,即使通過PCA處理,相應維數(shù)也多至40-60維,但這些特點使得在實踐中去采集相當數(shù)量的人臉圖像是不可行的,所以人臉分類驗證是一個小樣本統(tǒng)計學習問題。樣本之間的聚類,辨別及驗證實質(zhì)上是樣本間的分界面數(shù)學模型的選擇問題。人臉的特征提取過程中不僅維度高,還受到如膚色,頭發(fā),陽光,環(huán)境,眼鏡,帽子等諸多因素的影響。這些因素使得建模很難實現(xiàn),求解也過于復雜,是以統(tǒng)計學習法成為新興的有效可行手段。然而經(jīng)典統(tǒng)計分析理論大多構(gòu)建于大樣本條件下,大樣本的一致性,無偏性等理論是統(tǒng)計分析的前提和基礎。另一方面如神經(jīng)網(wǎng)絡,遺傳算法等新興智能學習方法在系統(tǒng)辨識方面有選擇網(wǎng)絡拓撲結(jié)構(gòu),局部最優(yōu),過學習與欠學習等弊端。所以有限小樣本的機器學習理論即統(tǒng)計學習理論在現(xiàn)實中有著無可比擬的優(yōu)勢。
1統(tǒng)計學習問題的實質(zhì)即函數(shù)模型構(gòu)成
3學習深度與適應性的矛盾
人工神經(jīng)網(wǎng)絡研究中,為追求Remp(a)的最小,通過多次迭代使誤差變小,在某些情況下,由此帶來人工學習機器對未來輸出進行正確預測能力的柔性下降,即適用的場合范圍下降即過學習的問題。因此在實際應用中出現(xiàn)使用的分類器相對比較簡單如線性分類器,卻比神經(jīng)網(wǎng)絡分類器適用性更廣。
之所以出現(xiàn)過學習原因:一是因為學習樣本畢竟有限而非全面,提取樣本時不具同一性。二是學習機器總體設計不完備。兩者有關(guān)聯(lián),但首要原因是主要矛盾方面。試圖用一個復雜模型去擬合有限不具有獨立同一性的樣本,結(jié)果反而喪失其應當具備的適應性或可移植性。如神經(jīng)網(wǎng)絡中對于有限樣本,其網(wǎng)絡學習能力過強,在此基礎上經(jīng)驗風險很小幾乎收斂為零。但對一些未出現(xiàn)的新的同類樣本,該網(wǎng)絡則出現(xiàn)拒絕而非合并的結(jié)果。從而形成了學習深刻性與模型適用性之間的柔性矛盾。由此可得出下面的結(jié)論:(1)經(jīng)驗風險最小并不總是與期望風險最小具有一致性。(2)學習機器的深度不但與所構(gòu)建的系統(tǒng)相關(guān),而且與有限的學習樣本獲得密切相關(guān)。因此我們研究了相應彌補方法,如訓練中對學習函數(shù)矩陣復雜性進行修正,或通過交叉驗證等進行模式選擇以控制復雜度等。但以上方法終究只是相應對矛盾進行調(diào)整或緩解,真正需要修正的是對有限樣本進行科學及合理的采集和選擇。
4小樣本統(tǒng)計學習的生物識別抽樣分類
小樣本統(tǒng)計學習的訓練原則,首先使用一個人臉典型樣本集合A來訓練SVM,接著應確保該SVM對所有的訓練樣本完全分類正確即學習修正過程,接著使用修正過的SVM來驗證人臉。對于驗證失敗樣本,將其在充實到人臉樣本集A中,再進行SVM迭代訓練。通過學習→錯誤修正→樣本集整合→再學習的迭代運算,以提高改善SVM性能并且更需要保持所獲樣本的普遍性和典型性。但不管如何選取樣本圖像以及選取的圖像范圍有多廣泛,都無法保證所選的樣本圖像有足夠典型性和普遍性,也不能夠保證所選的圖像樣本涵蓋了全部樣本范圍。這一點在非人臉樣本的選取中已得到證實。是以選取盡可能多的人臉圖像,使人臉樣本分布盡可能遍布整個范圍。在整個圖像空間之中所有人臉樣本為其中一子空間集合,這個子空間要小得多且易聚類。與其說盡可能多的人臉樣本,不如盡可能拓寬該子空間的外圍分界面函數(shù),這些間接可改善分類器性能,但受實際條件限制。人臉樣本圖像獲取數(shù)量也是有限的,另一方面人臉樣本和非人臉樣本具有復雜多樣性,無法一開始就搜集到足夠多并且足夠普遍的樣本,并且訓練樣本集的選擇也缺乏合理正確理論指導,實際上還沒有相應理論來指導選擇訓練樣本,也沒有給出明確相關(guān)參數(shù),用來度量訓練樣本集普遍性和典型性。正是由于系統(tǒng)性能受到訓練樣本的極大制約,甚至可以說缺乏樣本選擇理論的指導,已經(jīng)成為限制系統(tǒng)性能的一個瓶頸。針對于此可采用一種再學習機制解決這一問題促使系統(tǒng)的性能得以完善。
所謂再學習機制,是指人臉驗證系統(tǒng)首先具有一定人臉先驗知識,即在人臉驗證中如存在錯分現(xiàn)象則將這一新的錯分樣本賦于較大訓練權(quán)值并添加到樣本系統(tǒng),另一方面若出現(xiàn)新的未知人臉將其處理歸類添加入數(shù)據(jù)庫,接著再對人臉驗證系統(tǒng)進行再學習,來調(diào)整網(wǎng)絡的支撐向量和相關(guān)權(quán)值,從而使其對新的添加樣本具有新的適應性。正是通過這樣的過程對于一個初始的,具有不完整的樣本庫的系統(tǒng),經(jīng)過不斷再學習循環(huán),再添加再擴充的過程,可使得該系統(tǒng)不斷的完善修正。
樣本庫中的每個人包含多幅圖像既有不同的偏移角度又有不同表情,如每個人臉共20幅圖像,選其16幅圖像作為訓練樣本,剩余4幅作為測試圖像,通過獨立同分布的選取,要使得訓練樣本和測試樣本同時具備較大的差異性或典型性,也要使樣本盡可能具有普遍性。是以訓練圖像分別為免冠正面,各種偏轉(zhuǎn)角度,而且表情各異。測試樣本可選正面,左偏20度,上偏5度或下偏5度,帶說話表情變化。
為保持系統(tǒng)有高辨識精度的要求,且保證系統(tǒng)實時性。我們不是對每個人所有樣本進行主成份分析,而是以人臉樣本的共性聚類特征為依據(jù),以人體測量學生物識別的分類方法為基礎,選取形態(tài)面指數(shù)和顴下頜寬指數(shù)這兩個面型參數(shù)作為臉型的一級粗分類,需檢測測點包括鼻根點,左右顴點,左右下頜角點及頦下點,進而得到面寬,下頜間寬,形態(tài)面高這三個測量數(shù)據(jù)。在實際中人臉可能會發(fā)生各種角度偏轉(zhuǎn),這會產(chǎn)生相應的測量誤差。為了避免此類平面內(nèi)旋轉(zhuǎn),通常采用兩點間歐氏距離取代水平或垂直距離已達到幾何不變性。
形態(tài)面指數(shù)=(形態(tài)面高/面寬)*100%
顴下頜寬指數(shù)=(下頜間寬/面寬)*100% (5)
其中,形態(tài)面指數(shù)用來區(qū)分大致的臉型特征。指數(shù)越大則面部越瘦長,反之面部寬短;而顴下頜寬指數(shù)用來區(qū)分面部輪廓,即可按參照值大小分為方下巴,橢圓下巴,尖下巴等。通過上述計算可將人臉大致分為圓型,橢圓型,方型,三角型或其他臉型5個大的一級子類。在對每一個一級子類通過相應特征等間隔細分類分成若干第二級子類。任一級子類都要對其進行PCA分析,以至到第N級子類。以保證每個人臉都可通過一系列相應特征臉的投映特征來表征,將人臉對應的相應n維向量作為訓練樣本,來對多個支撐向量基組成的矩陣進行訓練,這些訓練矩陣可實現(xiàn)對人臉的準確實時歸類。
當進行人臉圖像識別時,先將測試樣本與第一級子類進行歐氏距離閾值自適應歸類,自動歸入距離最小的一類,并確定相應類別。以此類推,再對第二級以至到第n集的子類進行閾值自適應歸類。當?shù)搅说趎級的子類中每一個人臉特征數(shù)據(jù),在閾值之內(nèi)就可確認進行了適當分類,即測試獲的樣本數(shù)據(jù)若為數(shù)據(jù)庫已存在的人臉數(shù)據(jù),若無相關(guān)人臉數(shù)據(jù),則確定為新的人臉數(shù)據(jù),在其計算數(shù)據(jù)最接近的子類,歸入該類成為數(shù)據(jù)庫新的人臉數(shù)據(jù)。
5結(jié)束語
該文深入探討了統(tǒng)計學習理論在人臉識別中的可行性,從采樣學理論上合理地解決廣義上樣本的無窮性與實際樣本的有限性之間的矛盾,在闡述樣本采樣的重要性的基礎上,論述了一些科學采樣的方式與方法,對人臉檢測定位和識別以及為今后收集樣本保證樣本的普遍性和典型性提供了依據(jù)。endprint