高見
(揚州市職業(yè)大學 江蘇省揚州市 225000)
伴隨著當前公眾環(huán)保意識的提高和信息技術(shù)的發(fā)展,人臉識別技術(shù)在我們?nèi)粘I钇鸬降淖饔迷絹碓蕉鄻踊5请S著人臉識別的普及,各種各樣的問題也隨著出現(xiàn),常見的就有人臉角度問題、光照問題、面部多余問題等等,這一方面對人臉識別技術(shù)的進一步應(yīng)用做出了考驗,另一方面也是對相關(guān)企業(yè)的技術(shù)創(chuàng)新進行了檢查。本文正是以當前人臉識別的需求識別出發(fā),以YOLOV2 神經(jīng)算法為基礎(chǔ),進而構(gòu)建起完整的識別模型,為當前環(huán)節(jié)人臉識別的需求現(xiàn)狀提供了參考依據(jù)。
人臉識別的需求在各個時間段呈現(xiàn)不同的狀態(tài),所以在進行相關(guān)算法的選擇時要注意對識別方法選擇,常用的識別方法包括德爾菲法、神經(jīng)網(wǎng)絡(luò)、時間序列發(fā)、機器學習、回歸分析法、彈性系數(shù)法和灰色識別法等等,在對各種方法進行分析和討論之后,最終決定使用神經(jīng)網(wǎng)絡(luò)中的YOLOV2 算法來構(gòu)建相關(guān)的模型。
YOLOV2 算法起源于上世紀末的YOLOV1 算法,經(jīng)過幾十年的發(fā)展在各個領(lǐng)域之中均有著廣泛的應(yīng)用,是當前神經(jīng)網(wǎng)絡(luò)模型的代表。YOLOV2 算法的本質(zhì)是一種多層前饋神經(jīng)網(wǎng)絡(luò),特點是能夠依照誤差逆向傳播法對相關(guān)的網(wǎng)絡(luò)進行訓(xùn)練,最終得到與期望向量最大程度接近的輸出向量。本次實驗的所應(yīng)用的神經(jīng)網(wǎng)絡(luò)算法模型的基本流程可以分為以下幾個步驟:
首先,將相關(guān)的學習參數(shù)和權(quán)初始化為績效的隨機數(shù),設(shè)置相關(guān)的偏置;第二,是設(shè)置期望輸入和加輸入;第三,是對相關(guān)輸出層和隱層的輸出進行計算;第四,是對相關(guān)輸出層和隱層的連接權(quán)值進行調(diào)節(jié)后改變訓(xùn)練樣板;第五是確定是否訓(xùn)練終止,如果不終止訓(xùn)練,就重復(fù)第二到第四步驟,如果終止訓(xùn)練則進行第六步;第六,相關(guān)實驗的迭代次數(shù)+1,直到迭代終止,如果選擇繼續(xù)迭代,重復(fù)第二到第六步驟,如果選擇終止迭代,則輸出相應(yīng)的輸出向量。
本次數(shù)據(jù)來源基于某人臉識別企業(yè)的內(nèi)部數(shù)據(jù),某門禁企業(yè)的使用人數(shù)為7.664 人,選取樣本的時間為2020年4月25日,當天某人臉識別系統(tǒng)的回饋整體數(shù)據(jù)樣本為9000 條。本實驗將這些參數(shù)統(tǒng)共劃分為記錄編號(id)、1 小時內(nèi)某企業(yè)人臉識別的整體需求量(y)、某人臉識別企業(yè)投放業(yè)務(wù)的正臉人臉(face)、30°人臉(30°face)、60°人臉(60°face)、90°人臉(90°face)、人臉小片陰影(Small shadow)、人臉中片陰影(Medium shadow)、所人臉大片陰影(Big shadow),共9 個特征變量。

圖1:YOLOV2 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)識別模型的拓撲結(jié)構(gòu)示意圖
本次設(shè)計的YOLOV2 算法人臉識別數(shù)據(jù)庫采用YOLOV2 網(wǎng)絡(luò)為基礎(chǔ),作為一種面向?qū)ο蟮年P(guān)系型數(shù)據(jù)庫,YOLOV2 網(wǎng)絡(luò)支持在標準數(shù)據(jù)庫系統(tǒng)中管理相關(guān)數(shù)據(jù),一方面能夠?qū)崿F(xiàn)數(shù)據(jù)的完整性,另一方面能夠保證使用過程的安全?;诒敬卧囼瀸嶋H情況,筆者將YOLOV2 算法人臉識別數(shù)據(jù)庫系統(tǒng)的構(gòu)建分為如下幾步:
首先是針對該本次試驗的人臉識別系統(tǒng)信息數(shù)據(jù)進行搜集和整理,針對不同的分類完成格式、單位和尺度的統(tǒng)一,最終將該本次試驗的YOLOV2 算法人臉識別編程有效的字段名和表頭;其次是完成Geodatabase 的構(gòu)建,依照流域的實際情況將不同的圖層進行分類和儲存;第三是把剩下的數(shù)據(jù)儲存到access 屬性的二維表數(shù)據(jù)庫中,同時完成分類和編碼;最后是完善YOLOV2 網(wǎng)絡(luò)各版塊的構(gòu)建和相應(yīng)的管理系統(tǒng)。本次采樣的信息可以分為正臉人臉(face)、30°人臉(30°face)、60°人臉(60°face)、90°人臉(90°face)、人臉小片陰影(Small shadow)、人臉中片陰影(Medium shadow)、所人臉大片陰影(Big shadow)。YOLOV2 網(wǎng)絡(luò)的構(gòu)建主要是為了服務(wù)本次試驗的長江流域水系統(tǒng),所以需要依靠圖像頻譜來獲取相關(guān)的人臉知識并進行存儲?;谏鲜鰣D像處理的人臉識別方式很容易受到相應(yīng)的干擾,在將數(shù)據(jù)錄入Geodatabase 數(shù)據(jù)庫之前需要對人臉識別的方式進行相應(yīng)的優(yōu)化,來幫助數(shù)據(jù)庫更好的甄別檢測數(shù)據(jù)的準確性。這一方面需要針對外界干擾信號或者偽造信號的原理進行分析,另一方面需要針對Geodatabase 數(shù)據(jù)庫的缺陷來制定相應(yīng)的優(yōu)化方案,從根本上對這個問題進行解決就需要針對Geodatabase 數(shù)據(jù)庫的特性設(shè)置相應(yīng)的識別和糾錯能力。

表1:檢測測試數(shù)據(jù)訓(xùn)練結(jié)果

表2:檢測訓(xùn)練數(shù)據(jù)評價結(jié)果
基于上述9 個特征變量,本次試驗YOLOV2 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)識別模型的構(gòu)建步驟如下所示:首先在構(gòu)建模型之間需要對YOLOV2神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)識別模型的拓撲結(jié)構(gòu)進行分析和設(shè)置,其拓撲結(jié)構(gòu)如圖1所示,YOLOV2 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)識別模型的結(jié)構(gòu)特點為其輸入層、隱層和輸出層三層都可以完成由n 維到m 維的映射,進而可以將60°人臉(60°face)、90°人臉(90°face)、人臉小片陰影(Small shadow)、人臉中片陰影(Medium shadow)、所人臉大片陰影(Big shadow)、30°人臉(30°face)作為本次識別模型的特征變量,將1 小時內(nèi)某企業(yè)人臉識別的整體需求量(y)作為本次實驗識別模型的目標變量;其次是對隱含層內(nèi)的神經(jīng)元數(shù)量和最大迭代次數(shù)進行設(shè)置,根據(jù)本次人臉識別模型的需求,本實驗將最大迭代次數(shù)設(shè)置為300,將隱層神經(jīng)元的數(shù)量設(shè)置為150,在對數(shù)值的計算方面選擇了相關(guān)大規(guī)模數(shù)值計算表現(xiàn)較好的L-BFGS 算法進行計算;最后根據(jù)圖1 的相關(guān)拓撲結(jié)構(gòu)代入相關(guān)的參數(shù),其中Xn 代表相應(yīng)的特征變量,Y 代表1 小時內(nèi)某企業(yè)人臉識別的整體需求量,Wn 則代表了相關(guān)的閾值。
基于上述人臉識別企業(yè)的數(shù)據(jù),將其引入相關(guān)實驗平臺后,本次試驗可以分為三個步驟:
首先引入超參數(shù)k 作為網(wǎng)絡(luò)的增長率。網(wǎng)絡(luò)的增長率表示每一個系統(tǒng)輸出的特征圖的個數(shù)為k 個,為了防止網(wǎng)絡(luò)變得太寬,并且提升網(wǎng)絡(luò)的計算效率,將k 值限制成一個較小的整數(shù)。在YOLOV2中將每一個系統(tǒng)輸出的特征圖的個數(shù)設(shè)置為32,即k=32。實驗證明,當k 值是一個較小的正整數(shù)時,網(wǎng)絡(luò)的表現(xiàn)性能也更好;然后引入瓶頸層。YOLOV2 采取密集連接的方式,雖然每一層產(chǎn)生k個特征圖,但是整個網(wǎng)絡(luò)產(chǎn)生的特征圖的數(shù)量是巨大的。為了控制YOLOV2 網(wǎng)絡(luò)中特征圖的數(shù)量,在網(wǎng)絡(luò)的構(gòu)建中引入了瓶頸層;最后對網(wǎng)絡(luò)進行壓縮。通過壓縮過渡層中的特征圖,增強模型的緊湊性。在YOLOV2 中,當系統(tǒng)包含m 個特征圖時,網(wǎng)絡(luò)中隨后的過渡層產(chǎn)生的特征圖的個數(shù)為θm。同時將θ 的值設(shè)置為0.5,即過渡層將前一個系統(tǒng)產(chǎn)生的特征圖的數(shù)量減半。
在采用了四種激活函數(shù)的情況下,對模型進行評估,檢測訓(xùn)練數(shù)據(jù)評價結(jié)果如表1所示,檢測測試數(shù)據(jù)訓(xùn)練結(jié)果如表2所示。因此,YOLOV2 神經(jīng)網(wǎng)絡(luò)的激活函數(shù)為Tanh 函數(shù)基于已經(jīng)找到的人臉識別模型,選擇正臉人臉1 的數(shù)據(jù)集,以face、60°face、Medium shadow、Small shadow、Big shadow、30°face、90°face 為特征變量,id 作為編號,過濾掉其他的無關(guān)變量。結(jié)果表明,基于YOLOV2算法的密集連接的網(wǎng)絡(luò)結(jié)構(gòu)相比于YOLOV1 網(wǎng)絡(luò),不僅能夠提取到更為細粒度、更為抽象的人臉特征,而且使得網(wǎng)絡(luò)提取到的人臉特征在整個任務(wù)中最大化地被網(wǎng)絡(luò)利用,并學習到新的人臉特征,提升人臉檢測算法的性能。
總而言之,YOLOV2 網(wǎng)絡(luò)是當前人臉識別系統(tǒng)構(gòu)建領(lǐng)域的重要工具,將之組合不僅能夠挖掘傳輸識別過程中各個已有數(shù)據(jù)之間的潛在關(guān)系,更能快速地構(gòu)建起相關(guān)的預(yù)測模型。當然本次研究也存在著許多的不足,雖然對YOLOV2 網(wǎng)絡(luò)在當前人臉識別系統(tǒng)構(gòu)建應(yīng)用中存在的問題進行了分析,但仍不夠深入,希望將來能有機會繼續(xù)對人臉識別系統(tǒng)構(gòu)建的問題進行研究,進而為我國相關(guān)領(lǐng)域的發(fā)展做出貢獻。