楊劍鵬 江蘇省廣電有線信息網(wǎng)絡(luò)股份有限公司南京分公司
人臉識別是生物特性鑒別技術(shù)的一個主要方向,它涉及圖像處理,模式識別,計算機視覺等多個研究領(lǐng)域,具有十分廣泛的應(yīng)用前景,多年來一直是一個研究熱點。相對于其它人體生物特征識別技術(shù),如指紋識別、虹膜識別、掌紋識別,人臉識別技術(shù)是最直接、最自然、最容易被人接受的。與其它技術(shù)相比,它具有侵犯性小、較少需要或不需要用戶的主動配合、樣本采集方便、應(yīng)用場合廣泛、潛在的數(shù)據(jù)資源豐富、設(shè)備成本低等優(yōu)點。人臉識別系統(tǒng)具備操作及流程簡單、適用面廣、支持一對一或一對多比對、支持多點同時采集比對、帶有數(shù)據(jù)庫支持記錄及查詢功能,對采集現(xiàn)場環(huán)境要求較低,可在極短的時間里判斷出進出者的身份是否合法,杜絕使用他人鑰匙、密碼、磁卡等非法進入。人臉識別技術(shù)的安全性、可靠性較高,且擁有廣泛的市場需求,它可以應(yīng)用于公安部門的犯人檔案管理、犯人辨認查找、刑偵破案、安全驗證系統(tǒng)、信用卡驗證、醫(yī)學、檔案管理、視頻會議、人機交互系統(tǒng)、證件核對、保安監(jiān)視、門禁控制及至自動柜員機(ATM)等多種場合。
人臉識別對人類來說是件自然而然的事情,但對計算機而言,人臉識別卻遠非一個已解決的課題。所有的人臉都具有相似的結(jié)構(gòu),在紋理上也十分相近。另外圖像受光照、成像角度及成像距離等外界條件影響,具有“一人千面”的特點,欲建立一種具有各種不變性的描述模型還是比較困難的。此外,人臉識別技術(shù)研究與相關(guān)科學的發(fā)展及人腦的認識程度緊密相關(guān)。諸多因素都使人臉識別研究成為一項極富挑戰(zhàn)性的課題。一方面信息化進程的日益加快,電子商務(wù)、重要場所的安全認證、智能化環(huán)境等許多應(yīng)用領(lǐng)域?qū)εc人臉有關(guān)的信息處理提出了迫切要求;另一方面,硬件和軟件技術(shù)的發(fā)展,為滿足實際應(yīng)用系統(tǒng)對人臉檢測、跟蹤及識別技術(shù)的實時化要求提供了可能性。
所以,人臉識別的研究不僅涉及心理學、生理學、人工智能、模式識別、計算機視覺、圖像分析與處理等多個學科領(lǐng)域,更是模式識別、人工智能和計算機視覺的典型案例之一。對這一問題的研究和解決,有助于對其他對象識別問題的研究分析和解決,人臉識別也因此成為這些基礎(chǔ)研究領(lǐng)域的重要課題之一,具有重要的理論研究價值。
隨著安全入口控制和金融貿(mào)易方面應(yīng)用需要的快速增長,生物統(tǒng)計識別技術(shù)得到了新的重視。目前,微電子和視覺系統(tǒng)方面取得的新進展,使該領(lǐng)域中高性能自動識別技術(shù)的實現(xiàn)代價降低到了可以接受的程度。而人臉識別是所有的生物識別方法中應(yīng)用最廣泛的技術(shù)之一,最近幾年倍受重視。
人臉識別技術(shù)(Face Recognition Technology)是機器視覺和模式識別領(lǐng)域最富有挑戰(zhàn)性的課題之一,同時也具有較為廣泛的應(yīng)用意義。在諸如證件檢驗、銀行系統(tǒng)、軍隊安全、安全檢查方面都具有相當大的應(yīng)用前景。這方面的研究最早始于二十世紀七十年代初期,由于當時計算機技術(shù)發(fā)展水平等因素的限制,此項研究并沒有受到廣泛的重視,甚至一度處于相對停滯狀態(tài)。進入二十世紀九十年代以來,計算機人臉識別的研究重新成為人們所關(guān)注的熱點。在心理學、“神經(jīng)網(wǎng)絡(luò)”、“工程學”、“圖像處理及分析”、“數(shù)字圖像處理”、“計算機視覺”等方面發(fā)表了大量的關(guān)于人臉識別的論文,僅從1995年至2001年之間,EI檢索到的相關(guān)文獻就多達數(shù)千篇。由于人臉表情豐富,并且受光照、成像角度及成像距離等因素的影響,還涉及模式識別和神經(jīng)網(wǎng)絡(luò)等學科,同時也和對人臉的認識程度密切相關(guān),這諸多因素使得人臉識別成為一項極富挑戰(zhàn)性的研究課題。
人類在日常的社交活動中經(jīng)常需要“認人”,這主要是通過識別人身上最獨特、最重要的特征——人臉,人類識別人臉的能力非常強,是目前所有用計算機實現(xiàn)的自動人臉識別系統(tǒng)所無法比擬的。
人像識別技術(shù)的研究范圍包括:
(1)人像采樣 : 識別的基礎(chǔ)是樣本空間需要足夠大。整個樣本空間不僅需要包括基本的人臉特征,還需要大量的基礎(chǔ)環(huán)境特征。光線,服飾,發(fā)型等各類因素會使人像檢測問題變得很復(fù)雜。
(2)人像檢測:主要目的是把一個圖像或者場景分為人像區(qū)和非人像區(qū),為后續(xù)處理做好準備。
(3) 人像表征 : 人像量化和編碼,采樣的數(shù)據(jù)如何稱之為人像,需要通過特定的標識。通常的表示法包括幾何特征(如歐氏距離、曲率、角度) 、代數(shù)特征(如矩陣特征矢量) 、固定特征模板、特征臉等。
(4) 人像匹配: 采集的待識別的人像與數(shù)據(jù)庫中的人像元素進行匹配,得出相關(guān)信息,這一過程是選擇適當?shù)娜讼癖碚鞣绞脚c匹配算法,系統(tǒng)的構(gòu)造與人像的表征方式密切相關(guān)。通?;蚴沁x擇全局的方法或是選擇基于特征的方法進行匹配。
(5) 表情分析: 即對待識別人像的表情信息(快樂、悲傷、恐懼、驚奇等) 進行分析,并對其加以歸類。
(6) 生理分類: 即對待識別人像的生理特征進行分析,得出其種族、年齡、性別、職業(yè)等相關(guān)信息。這些信息,可以在某個特定的場景下進行描述。如人口普查,機場安檢等。人像識別的原理如圖1 所示:
人像識別的技術(shù)優(yōu)點如下:
(1) 非接觸式感知
在一般環(huán)境下普通攝像頭即可采集人像,以非接觸的方式在識別對象未察覺的情況下完成識別過程。
(2) 直觀
基本的人物辨別以相貌為主。人像識別方便人工確認,降低了復(fù)核的難度。
(3) 使用通用性設(shè)備
隨著硬件的提升,普通的攝像頭加上普通PC即可滿足識別要求。
(4) 采樣方便
現(xiàn)場采樣、或利用標準證件照掃描,很容易獲取基礎(chǔ)信息。
整個系統(tǒng)架構(gòu)如圖2所示。攝像頭采集到人像圖像后提交到人像比對服務(wù)器上,與各類特殊人群數(shù)據(jù)庫進行比對。比對的結(jié)果將實時顯示在監(jiān)控顯示器上,一旦有人員命中,系統(tǒng)將觸發(fā)監(jiān)控室的語音提示系統(tǒng)。
圖1 人像識別原理
圖2 人臉識別系統(tǒng)架構(gòu)圖
系統(tǒng)對傳輸過來的人像圖像首先要進行光照補償、人像定位、矯正有旋轉(zhuǎn)角度的人像圖像等預(yù)處理操作。
2.1 光照補償
人像顏色會隨光照強度的改變而改變,光照變化是影響人像識別性能的關(guān)鍵因素之一,對該問題的解決影響到人像識別系統(tǒng)的成敗??刹捎萌缦碌淖赃m應(yīng)光照亮度補償算法:
(1) 選擇光照均勻的標準圖像,并計算出圖像中各象素點的亮度平均值;
(2) 計算待檢測圖像中各象素點的亮度平均值;
(3) 若標準圖像象素點的亮度平均值減去待檢測圖像的亮度平均值大于7 則對該象素點進行亮度補償。
公式(1)中: r′, g′, b′分別為待檢測圖像中需要進行光照補償象素點的R , G,B 分量;r , g , b 分別為標準圖像象素點的R ,G,B 分量; mr , mg , mb 分別為標準圖像各象素點的R , G,B分量的平均值;mr′, mg′, mb′分別為待檢測圖像各象素點的R ,G,B 分量的平均值;sr , sg , sb 分別為標準圖像各象素點的R ,G,B 分量的方差;sr′, sg′, sb′分別為待檢測圖像各象素點的R ,G,B 分量的方差。
2.2 用輻射模板計算人像旋轉(zhuǎn)角度并轉(zhuǎn)換成正面人像圖像
對人像進行特征提取之前首先利用輻射模板法計算人像的偏轉(zhuǎn)角度,然后利用坐標變換將其恢復(fù)成正臉圖像。本文重點介紹輻射模板法。輻射模板是一個被均分為若干個扇形的圓形模板。自頂開始按照逆時針方向各扇形依次編號0~15 。令人像面部中心與輻射模板中心重合,分別計算落入每一個扇形中的邊緣象素點的個數(shù),由此得到一個輻射模板直方圖。
2.3 人像特征的提取
(1) 眼睛特征的提取
眼睛的典型特征包括左、右眼睛的坐標,左、右眼睛的高和寬,以及眼距等。眼睛的4 個邊緣點及中心坐標容易得到,眼睛的高等于下邊緣點的縱坐標減去上邊緣點的縱坐標,眼睛的寬等于右邊緣點的橫坐標減去左邊緣點的橫坐標,眼距等于右眼的左邊緣點的橫坐標減去左眼的右邊緣點的橫坐標。
(2) 鼻子特征的提取
鼻子的特征值包括鼻子的寬、高以及鼻子的最左邊緣點和最右邊緣點的橫坐標。眼睛所在區(qū)域下面的第一個投影區(qū)即為鼻子所在的區(qū)域。求出該區(qū)域水平投影的最大值即為鼻尖的縱坐標,由此以一定步長向下搜索,直到投影值為0 ,得到鼻子最下端的縱坐標。根據(jù)搜索路徑易得鼻心的坐標和鼻子的高。在鼻子所在的區(qū)域內(nèi)從鼻心開始向左、向右各取一定的偏移量求其垂直投影,投影的最左、最右的第一個不為0 的點就是鼻子的左、右邊緣點,鼻子的寬即為鼻子左、右邊緣點的差。
(3) 眉毛特征的提取
眉毛的特征值包括眉毛的高、寬以及眉距。首先求出眉毛所在區(qū)域的水平投影的最大值y 及左、右眉毛的垂直投影的最大值x1 , x2 ,則( x1 , y) , ( x2 , y) 分別是左、右眉毛的一個內(nèi)點?,F(xiàn)以左眉毛特征的提取為例。從( x1, y ) 開始向上、下以一定步長進行水平投影, 直到投影值為0 得到左眉毛最上邊緣點和最下邊緣點的縱坐標, 兩個縱坐標的差即左眉毛的高。以( x1 , y) 開始向左、右以一定步長進行垂直投影,直到投影值為零得到左眉毛最左邊緣點和最右邊緣點的橫坐標,兩個橫坐標的差即左眉毛的寬。眉距:右眉毛的最左邊緣點的橫坐標與左眉毛的最右邊緣點的橫坐標的差。
(4) 嘴巴特征的提取
嘴巴的特征值包括嘴巴的寬、高、最左邊緣點和最右邊緣點的橫坐標。首先求嘴巴所在區(qū)域的水平投影的最大值y 及垂直投影的最大值x ,則( x , y) 為嘴巴的一個內(nèi)點。按照前面求鼻子左、右邊緣點的方法求出嘴巴的最左邊緣點和最右邊緣點,嘴巴的寬度等于所求得的左、右邊緣點的橫坐標差。由于拍攝到的嘴巴可能張著, 也可能閉著, 故嘴巴高度的求解要分情況處理。根據(jù)先驗知識,上面求得的y 要么在上嘴唇要么在嘴的中央而不可能在下嘴唇,因此從( x , y) 點向上以一定步長進行水平投影, 直到投影值為0 得到嘴巴的上邊緣點。二值化后的嘴巴可能有空洞,因此在求嘴巴的下邊緣點時從( x , y) 向下取一個偏移量, 新位置記為( x , yy) , ( x , yy)只能取在嘴巴的下方或下嘴唇上,而不能取在上下嘴唇的中間。求坐標( x ,yy) 所在區(qū)域的水平投影,若投影值為0 ,表明( x , yy) 取在了下嘴唇的下方, 則繼續(xù)向上搜索, 直到投影值不為0 ,得到嘴巴的下邊緣點, 若投影值不為0 , 表明( x , yy) 取在下嘴唇上,則繼續(xù)向下搜索, 直到投影值為0 得到嘴的下邊緣點,嘴的高度等于所得到的上嘴唇和下嘴唇的差。
2.4 特征臉譜
對于任何模式識別問題, 首先要用各種可能的手段,對識別對象的性質(zhì)作各種測量,并將這些測量值作為分類用的特征。通??梢蕴崛碓疵枋鎏卣? 也可以提取差異特征。在傳統(tǒng)的人像識別中, 大多是尋找描述性特征, 確定眼睛、鼻子、嘴等人臉成員形狀、位置及其相互關(guān)系來描述人臉樣本, 以作為分類的依據(jù)。但人臉形狀極不規(guī)則,要精確描述人臉, 其特征量是很大的。受信息論思想的啟發(fā), 我們需要盡可能地提取人臉圖象中有用的信息, 并盡可能高效地對它進行編碼, 以供識別使用。考慮到人臉圖象之間具有很大的相似性, 因此, 拋棄具體的細節(jié)特征抽取人臉圖象整體上的差異信息, 既不會損失人臉圖象中包含的有用信息, 又簡單直接便于編碼比較。我們可利用主分量分析, 消除模式特征之間的相關(guān)性, 突出其差異性。鑒于一組特征向量可以刻畫協(xié)方差矩陣中的差異, 我們考慮用組“ 特征臉譜” 來描述人臉圖象的差異信息。從一組原始的人臉圖象集合出發(fā), 我們可考慮用一組“ 特征臉譜” 來描述人臉圖象的差異信息。從一組原始的人臉圖象集合出發(fā), 尋找可用于確定所有人臉圖象的一個最佳的坐標系統(tǒng)。任何人臉圖象均可以映射到這一坐標系統(tǒng), 每個坐標向量在確定一幅人臉圖象中或多或少地起著作用。這些坐標向量也是N2維的, 它們描述的NxN的圖象類似于人臉圖象, 故可形象地稱它們?yōu)椤?特征臉譜” , 這樣,我們可以用特征臉譜的線性組合來比較準確地刻畫人臉圖象間的差異信息。對任何一幅人臉圖象, 我們僅需保留一組它的差值圖象對應(yīng)于各個特征臉譜的權(quán)值作為分類特征。
任何一幅NxN圖象均可以看作一個N2維的向量,則任何圖象都可以映射到N2維空間中的一點。既然所有人臉圖象在總體結(jié)構(gòu)上具有很大的相似性, 故而它們不會在如此巨大的圖象空間上自由分布, 我們可以用一個維數(shù)較低的子空間描述它們。特征臉譜作為最基本的圖象集合,任何一幅人臉差值圖象都可以唯一表示為它們的線性組合, 也就是尋找那些最能說明人臉差值圖象在空間中分布的坐標向量的過程, 這些坐標向量所描述的NxN的圖象均是各個人臉差值圖象的線性組合, 它們定義了人臉圖象所聚集的人臉差空間, 可以刻畫出人臉圖象間的差別。
人像識別技術(shù)的最主要的功能就是通過攝像頭,計算機智能識別人像交通違章監(jiān)控,重要公共場所治安監(jiān)控,利用人像識別技術(shù),可以大大降低人工判斷所耗費的時間以及存在的誤差。
通過員工現(xiàn)場采集,或者提供有效身份證件照片來建立員工人像庫,依次來進行考勤管理,相對于傳統(tǒng)的指紋、考勤卡方式,更加靈活便利,可信度高。
1.1 系統(tǒng)結(jié)構(gòu)
基于人像識別技術(shù)的考勤系統(tǒng)包括高清紅外攝像頭,視頻存儲,人像識別、考勤應(yīng)用服務(wù)器,監(jiān)控平臺。如辦公地點分散,可利用局域網(wǎng)技術(shù)建立B/S架構(gòu),形成統(tǒng)一的考勤體系。
1.2 系統(tǒng)特點
可進行準確快速的身份識別,節(jié)約打卡時間,避免代打考勤現(xiàn)象的出現(xiàn)。
1.3 應(yīng)用場景
通過現(xiàn)場采集或職員身份證照片,建立員工人像庫。通過合適的算法,精確地進行身份識別。對于中大型生產(chǎn)型企業(yè),可以提高考勤效率。
在居民小區(qū)、社區(qū)公共場所,交通樞紐等場所,利用網(wǎng)絡(luò)攝像頭,建立起高精度的海量人像識別系統(tǒng)。可用于人員進出,治安巡邏,安檢進站,可以從原先的人眼識別,轉(zhuǎn)變?yōu)橛嬎銠C智能識別,更加有效地快速的核實人員身份。
2.1 系統(tǒng)結(jié)構(gòu)
圖3 基于人像識別技術(shù)的考勤系統(tǒng)
基于人像識別技術(shù)的安防系統(tǒng)包括高清紅外攝像頭,視頻存儲,人像識別應(yīng)用服務(wù)器,監(jiān)控平臺??衫没ヂ?lián)網(wǎng)技術(shù)擴展到B/S架構(gòu),實現(xiàn)小區(qū)、社區(qū)、街道直至縣市區(qū)域級別的安防系統(tǒng)。
2.2 系統(tǒng)特點
能準確快速的身份識別,避免繁瑣的人工處理工作。
2.3 應(yīng)用場景
在高端住宅小區(qū)通過非接觸式的身份識別,可避免矛盾,提升物業(yè)服務(wù)品質(zhì)。酒店賓館,便于管理者方便的識別客戶。機場車站街道,可有效的提升治安水平,提升城市安全度。
本文所簡述人像識別算法在一定程度上解決了采集人像圖像時光照的不均勻性問題和采集的人像圖像存在旋轉(zhuǎn)角度的問題等。同時,通過本文的闡述可以發(fā)現(xiàn),基于人像識別技術(shù)的智能視頻監(jiān)控系統(tǒng)可以有效地解決目前數(shù)字監(jiān)控系統(tǒng)存在的某些難題,如確定監(jiān)控場景中是否有人、對監(jiān)控對象難以跟蹤、確定當前監(jiān)控對象的身份等問題。因此可以看出,基于人像識別的智能化視頻監(jiān)控系統(tǒng)作為安防行業(yè)的高中端產(chǎn)品,具有十分廣泛的應(yīng)用前景。
圖4 基于人像識別技術(shù)的安防系統(tǒng)
[1]岡薩雷斯,數(shù)字圖像處理[M].北京:電子工業(yè)出版社,2003:120-308.
[2]楊帆等,數(shù)字圖像處理與分析[M].北京:北京航空航天大學出版社,2007:35-87.