韓 東, 王學(xué)軍
(吉林大學(xué) 通信工程學(xué)院, 長(zhǎng)春 130022)
人臉識(shí)別技術(shù)由于相較于其他生物特性辨別技術(shù)(指紋識(shí)別、 虹膜識(shí)別等)具有隱蔽性、 易操作性與結(jié)果直觀性的特點(diǎn), 因此廣泛應(yīng)用于居民日常監(jiān)控、 國(guó)家金融安全和信息技術(shù)安全等領(lǐng)域[1-4]。但在非約束環(huán)境下, 攝像頭往往采集不到非常合適的人臉, 各種不同姿態(tài)的人臉圖像對(duì)識(shí)別技術(shù)造成了較大的干擾。
近年來(lái)卷積神經(jīng)網(wǎng)絡(luò)[5]已成為越來(lái)越多科研工作人員研究的對(duì)象, 它將深度學(xué)習(xí)的思想引入神經(jīng)網(wǎng)絡(luò)中, 通過(guò)卷積運(yùn)算和池化運(yùn)算等方式由淺入深的多個(gè)層級(jí)的提取圖像的特征, 從而模仿大腦神經(jīng)突觸的工作方式, 使卷積神經(jīng)網(wǎng)絡(luò)所提取的特征與生物系統(tǒng)相類似, 利用其高度并行性特征、 非線性特征、 穩(wěn)定性特征以及容錯(cuò)性, 應(yīng)用在圖像識(shí)別處理等領(lǐng)域中[6]。
LeNet-5經(jīng)典CNN(Convolutional Neural Network)結(jié)構(gòu)[7]已經(jīng)在手寫(xiě)數(shù)字識(shí)別領(lǐng)域中得到了應(yīng)用, 筆者通過(guò)分析LeNet-5經(jīng)典CNN結(jié)構(gòu), 利用卷積和數(shù)目和池化方式對(duì)其進(jìn)行了改進(jìn), 取得了較好的識(shí)別效果。
在我國(guó)農(nóng)村金融創(chuàng)新過(guò)程中,需要在農(nóng)村開(kāi)展普惠性的金融教育,提升農(nóng)民及新型農(nóng)業(yè)經(jīng)營(yíng)主體的金融意識(shí)、信用意識(shí)、法律意識(shí),特別是培育負(fù)債經(jīng)營(yíng)意識(shí),逐漸建立農(nóng)村金融消費(fèi)者自我保護(hù)意識(shí),防止盲目投資和過(guò)度負(fù)債。
卷積神經(jīng)網(wǎng)絡(luò)主要由卷積層和池化層組成[8], 每個(gè)卷積層后都需設(shè)置池化層, 最后由全連接層進(jìn)行連接輸出, 卷積層的所有神經(jīng)元都不只與前一層單一局部感受野相連接, 同時(shí)對(duì)局部感受野內(nèi)的圖像特征進(jìn)行提取, 經(jīng)過(guò)提取的不同特征圖組合后經(jīng)過(guò)非線性激活函數(shù)變換輸出。并且由非線性激活函數(shù)對(duì)圖像信息進(jìn)行多次非線性變換, 最終得到一個(gè)多維的圖像特征向量。
圖1所示的圖像矩陣尺寸為5×5, 經(jīng)過(guò)尺寸為3×3的卷積核進(jìn)行卷積后, 得到一個(gè)3×3的特征圖, 其計(jì)算公式為(5-3+1)×(5-3+1)。卷積層的某個(gè)卷積核W通過(guò)對(duì)上一層全集得到的特征圖像進(jìn)行卷積, 然后通過(guò)激活函數(shù)f(·)進(jìn)行非線性變換, 最終得到輸出特征圖X。輸入圖像進(jìn)行多次卷積后得到輸出圖, 用數(shù)學(xué)語(yǔ)言描述為
卷積層的主要作用是對(duì)圖像進(jìn)行特征提取, 每種卷積圖都可提取一種圖像特征, 在卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中, 每個(gè)卷積層由于含有多個(gè)卷積圖, 所以該卷積層可提取多個(gè)特征。卷積運(yùn)算過(guò)程如圖1所示。
圖1 卷積過(guò)程Fig.1 Convolution process
即將到來(lái)的各種節(jié)日,不僅是奢侈腕表,更是幾乎所有奢侈品牌爭(zhēng)奪的營(yíng)銷主戰(zhàn)場(chǎng)。想要從中分一杯羹,創(chuàng)新的營(yíng)銷形式、精準(zhǔn)的渠道選擇以及電商導(dǎo)入能力,在品牌營(yíng)銷中更加至關(guān)重要了。
(1)
在卷積核數(shù)目的增加過(guò)程中, 人臉識(shí)別率也會(huì)隨之提高, 但在卷積核的數(shù)目增加到一定數(shù)值時(shí), 識(shí)別正確率開(kāi)始變化不大。所以, 當(dāng)(C1 C2)選擇(8 16)時(shí), 卷積神經(jīng)網(wǎng)絡(luò)能最大化地對(duì)圖像特征進(jìn)行提取, 且能保持一定的正確率。
1)地名本體是從人的思維出發(fā),受到內(nèi)部的人的因素(思維、語(yǔ)言、文化傳統(tǒng)等)影響,外部的歷史、政治、經(jīng)濟(jì)等因素影響,使得地名本體構(gòu)建相對(duì)困難,此外,目前指導(dǎo)地名本體構(gòu)建的規(guī)范性的方法和技術(shù)手段還沒(méi)有,雖然大家認(rèn)可了地名本體在GIS中發(fā)揮的重要性,但是在地名本體的實(shí)際構(gòu)建中,還處在自編自建的階段。
卷積神經(jīng)網(wǎng)絡(luò)的性能受許多參數(shù)影響, 筆者通過(guò)對(duì)卷積核數(shù)目、 卷積核尺寸、 池化層方式和正則化手段等參數(shù)的實(shí)驗(yàn)對(duì)比, 分析這些參數(shù)對(duì)卷積神經(jīng)網(wǎng)絡(luò)性能的影響, 通過(guò)選取最優(yōu)參數(shù)構(gòu)建適合多姿態(tài)人臉識(shí)別的卷積神經(jīng)網(wǎng)絡(luò)。
最大池化[9](max-pooling)就是將池化窗口中的最大值元素選出作為該池化窗口的輸出值, 平均池化[10](average-pooling)是將池化窗口內(nèi)的所有元素求和, 求其平均值, 其表達(dá)公式如下
(Sk)max-pooling=max(ai)i∈Rk(2)
隨機(jī)池化[11]按照概率p隨機(jī)的選擇窗口內(nèi)的元素作為輸出值。其公式如下
(4)
池化窗口內(nèi)把第i個(gè)元素的值與窗口內(nèi)元素值總和相除, 得到該元素的概率值, 然后在按照概率值對(duì)單位長(zhǎng)度進(jìn)行劃分, 大的概率值對(duì)應(yīng)長(zhǎng)的區(qū)間, 最后隨機(jī)地由算法生成一個(gè)數(shù), 該數(shù)所屬區(qū)間所對(duì)應(yīng)的元素值, 即為隨機(jī)池化的輸出值。
其中Mi代表數(shù)值矩陣, 且第i層神經(jīng)元所輸出的維度與數(shù)值矩陣的維度相同。Mi中的元素除了以概率p設(shè)為0的, 其余皆設(shè)置為1。Dropconnect方式[13]是在dropout方法的基礎(chǔ)上進(jìn)行了改進(jìn), 與dropout類似, Dropconnect方式也在訓(xùn)練的過(guò)程中將隱含層的某些值以概率p設(shè)置為0, 當(dāng)權(quán)值進(jìn)行更新時(shí), 與該節(jié)點(diǎn)相連的權(quán)值不再更新。不同的是, Dropconnect方式隨機(jī)將節(jié)點(diǎn)的輸入權(quán)值清零, 而不是將隱藏層節(jié)點(diǎn)的輸出清零。
卷積神經(jīng)網(wǎng)絡(luò)由于要對(duì)海量的數(shù)據(jù)進(jìn)行處理, 所以非常容易出現(xiàn)過(guò)擬合現(xiàn)象。如果卷積神經(jīng)網(wǎng)絡(luò)中使用Dropout方式[12]進(jìn)行正則化處理, 則可有效避免過(guò)擬合現(xiàn)象的出現(xiàn)。Dropout方式以概率p(0
(5)
增加Dropout正則化后, 式(5)可改為
(6)
新媒體賦權(quán)對(duì)倫理世界的影響和變革,是從對(duì)傳統(tǒng)倫理世界的解構(gòu)開(kāi)始的。最初,媒體只是影響社會(huì)文化和公眾輿論的眾多因素之一,但是發(fā)展到新媒體階段,高科技信息方式的融入逐漸且不可避免地改變了人們認(rèn)知和理解世界的方式和態(tài)度。當(dāng)前,新媒體所創(chuàng)造的數(shù)字化社會(huì)語(yǔ)境已經(jīng)徹底改變了傳統(tǒng)的對(duì)話方式,對(duì)社會(huì)語(yǔ)境、人類生活和生命個(gè)體都產(chǎn)生了革命性的影響,給傳統(tǒng)的家——國(guó)——社會(huì)的倫理機(jī)制賦予了新的內(nèi)涵。媒體賦權(quán)的倫理本質(zhì),從傳統(tǒng)大眾傳播媒體時(shí)代的被動(dòng)賦予,向新媒體時(shí)代的主動(dòng)建構(gòu)過(guò)渡,形成了一種去中心化的倫理關(guān)系、一種多元化的倫理場(chǎng)域和一種實(shí)踐性的倫理情感。
卷積層對(duì)圖片進(jìn)行特征提取得到維度通常都會(huì)很高, 這將為分類器的訓(xùn)練帶來(lái)更大挑戰(zhàn), 而且會(huì)出現(xiàn)過(guò)擬合現(xiàn)象, 為了解決此類問(wèn)題, 則需進(jìn)行池化采樣。池化層可通過(guò)對(duì)卷積層進(jìn)行池化操作, 從而降低特征的維度, 最大程度的避免過(guò)擬合現(xiàn)象的發(fā)生。以下3種池化方式最為常用: 隨機(jī)池化、 平均池化和最大值池化, 每種池化方式的選擇都能夠?yàn)榫矸e神經(jīng)網(wǎng)絡(luò)產(chǎn)生不同的效果。
以LeNet-5為基礎(chǔ), 更改其池化方式, 并選取其中3種有代表性的池化方式, 在CAS_PEAL人臉庫(kù)上進(jìn)行人臉識(shí)別實(shí)驗(yàn), 并對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行采集和統(tǒng)計(jì), 結(jié)果如表3所示。
表1 卷積核數(shù)目對(duì)比表
以LeNet-5為基礎(chǔ), 更改其卷積核窗口的大小, 并選取其中10種有代表性的卷積核尺度參數(shù), 在CAS_PEAL人臉庫(kù)上進(jìn)行人臉識(shí)別實(shí)驗(yàn), 并對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行了采集和統(tǒng)計(jì), 結(jié)果如表2所示。
氣象導(dǎo)航誕生于20世紀(jì)50年代,發(fā)展到今天,已經(jīng)成為一門(mén)學(xué)科。實(shí)踐也證明氣象導(dǎo)航明顯地提高了船舶航行的安全性,其主要表現(xiàn)在以下幾個(gè)方面:
表2 卷積核尺度對(duì)比表
從表2中的數(shù)據(jù)可看出, 卷積核滑動(dòng)窗口的尺度與該卷積神經(jīng)網(wǎng)絡(luò)的識(shí)別性能相關(guān), 卷積核窗口過(guò)小或過(guò)大都會(huì)降低識(shí)別正確率。由以上實(shí)驗(yàn)數(shù)據(jù)分析可得出, 當(dāng)卷積核窗口的尺寸設(shè)置為(5,5)時(shí), 能最大程度提高人臉識(shí)別正確率。
選取滿足覆蓋人臉識(shí)別需求的十組卷積核數(shù)目對(duì), 以LeNet-5為基礎(chǔ), 按照該十組卷積核的數(shù)目設(shè)置10個(gè)卷積神經(jīng)網(wǎng)絡(luò)模型, 為保證實(shí)驗(yàn)數(shù)據(jù)的全面性, 選取CAS_PEAL人臉庫(kù)[14]中男女各10幅不同姿態(tài)的圖像進(jìn)行識(shí)別實(shí)驗(yàn), 并對(duì)每組卷積神經(jīng)網(wǎng)絡(luò)的實(shí)驗(yàn)數(shù)據(jù)計(jì)算其平均值, 結(jié)果如表1所示。
由表3可知, 最大池化模型和隨機(jī)池化模型在人臉識(shí)別的效果上優(yōu)于平均池化模型, 在訓(xùn)練時(shí)間上, 最大池化效率明顯高于隨機(jī)池化。所以, 當(dāng)卷積神經(jīng)網(wǎng)絡(luò)使用最大值池化時(shí), 能使人臉識(shí)別更加精確、 高效。
表3 池化方式對(duì)比表
筆者在LeNet-5結(jié)構(gòu)上分別增加以上兩種正則化手段, 設(shè)計(jì)兩種實(shí)驗(yàn)?zāi)P? 為保證實(shí)驗(yàn)數(shù)據(jù)的全面性, 選取CAS_PEAL人臉庫(kù)中男女各10幅不同姿態(tài)的圖像進(jìn)行識(shí)別實(shí)驗(yàn), 并對(duì)每組卷積神經(jīng)網(wǎng)絡(luò)的實(shí)驗(yàn)數(shù)據(jù)計(jì)算其平均值, 結(jié)果如表4所示。
本系統(tǒng)程序設(shè)計(jì)采用順序功能圖進(jìn)行編程,將復(fù)雜的控制過(guò)程分成若干工作步,步與步之間通過(guò)轉(zhuǎn)移條件連接。圖8和圖9為根據(jù)系統(tǒng)控制要求編制的順序功能圖,根據(jù)該功能圖在西門(mén)子smart 200軟件中編程,并分別下載到PLC中運(yùn)行,即可分別實(shí)現(xiàn)集熱系統(tǒng)對(duì)太陽(yáng)高度角和方位角的追蹤,制冷系統(tǒng)中對(duì)太陽(yáng)能清洗電機(jī)、溶液泵電機(jī)和循環(huán)泵電機(jī)的控制。通過(guò)主站S7-300來(lái)實(shí)現(xiàn)對(duì)兩個(gè)從站S7-200之間數(shù)據(jù)的讀寫(xiě)操作,完成整個(gè)系統(tǒng)的通信,從而實(shí)現(xiàn)太陽(yáng)能制冷系統(tǒng)的功能。
表4 正則化方法對(duì)比
綜上實(shí)驗(yàn)對(duì)比分析, 兩種正則化方法都能在一定程度上提升人臉識(shí)別的效果, 筆者選取Dropconnect正則化方法的神經(jīng)網(wǎng)絡(luò)表現(xiàn)相對(duì)較好, 并且其值設(shè)定為0.5能更好地提高識(shí)別率。
綜上所述, 經(jīng)過(guò)大量的實(shí)驗(yàn), 筆者改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)的主要結(jié)構(gòu)如圖2所示。
圖2 改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)Fig.2 Improved convolutional neural network
卷積層負(fù)責(zé)特征提取工作, 池化層負(fù)責(zé)特征壓縮。輸入圖像的一些基本特征通過(guò)可學(xué)習(xí)的卷積核提取, 比如角點(diǎn)特征和邊緣特征等。然后將這些基礎(chǔ)特征進(jìn)行整合、 匯總, 形成了圖像的全局特征。每個(gè)卷積核都能提取一種基礎(chǔ)特征, 當(dāng)增加卷積核的數(shù)目時(shí), 對(duì)同一幅圖像所提取到的不同特征圖也就增多, 將這些不同的特征圖進(jìn)行組合就是卷積層的輸出。
初始條件設(shè)為有機(jī)溶劑用量10mL,KOH甲醇質(zhì)量濃度為0.2g/mL,用量5mL,提取溫度為40℃,提取時(shí)間為2h,BHT添加量為0.2g,研究甲醇、四氫呋喃、正己烷和乙酸乙酯對(duì)稻谷中葉黃素提取效果的影響。取上述實(shí)驗(yàn)的最佳有機(jī)溶劑,溶劑用量分別設(shè)為 5mL、10mL、15mL、20mL,探究有機(jī)溶劑用量對(duì)稻谷中葉黃素提取量的影響。
a 查詢圖像 b 搜索結(jié)果圖3 人臉識(shí)別結(jié)果Fig.3 Face recognition results
通過(guò)筆者構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò)提取的特征向量維度可經(jīng)過(guò)PCA算法[15]降低到一定的特征向量維度。使用筆者改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)對(duì)CAS_PEAL人臉庫(kù)進(jìn)行特征向量提取, 并分別建立5種常見(jiàn)不同維度的特征向量庫(kù), 然后在CAS_PEAL人臉庫(kù)中選取10名志愿者(男女各5名)的9種不同姿態(tài)的人臉圖像作為待識(shí)別人臉圖像。
筆者實(shí)驗(yàn)算法比較復(fù)雜, 為更好地實(shí)現(xiàn)算法效果, 選用專業(yè)性、 便捷性都很強(qiáng)大的Matlab R2015b作為仿真實(shí)驗(yàn)工具。對(duì)待識(shí)別人臉圖像分別在筆者所建立的5種不同維度的特征向量庫(kù)進(jìn)行人臉識(shí)別實(shí)驗(yàn), 實(shí)驗(yàn)結(jié)果如圖3所示。
本實(shí)驗(yàn)主要通過(guò)識(shí)別效果、 識(shí)別時(shí)間分別對(duì)筆者算法進(jìn)行評(píng)估。
阿聯(lián)酋是中東地區(qū)重要產(chǎn)油國(guó),歐佩克組織主要成員,油氣資源豐富且對(duì)外開(kāi)放,政治生態(tài)開(kāi)明,政局穩(wěn)定,社會(huì)安全,經(jīng)濟(jì)金融開(kāi)放,匯率穩(wěn)定。該國(guó)政府尊重合同,具備契約精神,適合油氣項(xiàng)目投資。該國(guó)油氣項(xiàng)目曾長(zhǎng)期由埃克森美孚、BP和道達(dá)爾等西方大型石油公司掌控。2014年以來(lái),中國(guó)石油抓住歷史機(jī)遇,踐行“一帶一路”倡議,利用技術(shù)及一體化優(yōu)勢(shì),成功進(jìn)入阿聯(lián)酋油氣領(lǐng)域,短短幾年已取得不菲的成績(jī),同時(shí)促進(jìn)了工程建設(shè)及技術(shù)服務(wù)隊(duì)伍的合作,成為這一全球油氣高端市場(chǎng)的重要合作伙伴。
1) 識(shí)別效果分析。本實(shí)驗(yàn)識(shí)別率的計(jì)算方式: 對(duì)同一角度下的10名志愿者人臉圖像分別進(jìn)行10次實(shí)驗(yàn), 每次實(shí)驗(yàn)?zāi)芡瑫r(shí)檢索到9幅不同姿態(tài)的人臉判定為識(shí)別正確, 最后計(jì)算識(shí)別率, 其計(jì)算方式如下
得到的實(shí)驗(yàn)數(shù)據(jù)如表5所示。由表5和圖4可知, 在提取的特征向量是32維時(shí), 識(shí)別正確率最低, 這是由于卷積神經(jīng)網(wǎng)絡(luò)所提取的32維特征向量不足以代表人臉的全部特征; 在提取的特征向量為512維度時(shí), 由于提取了過(guò)多的人臉特征向量, 超過(guò)了正常能代表人臉特征向量的范圍, 多余的特征向量對(duì)正常的特征向量在識(shí)別的過(guò)程中造成了干擾, 所以識(shí)別率并不是最高; 當(dāng)提取的特征向量控制在128維時(shí), 足以代表人臉?biāo)璧娜刻卣? 所以能達(dá)到最好的識(shí)別效果。
在農(nóng)民培訓(xùn)過(guò)程中,農(nóng)民科技教育中心承擔(dān)著重要的工作職能,參加培訓(xùn)農(nóng)民的組織和管理以及培訓(xùn)內(nèi)容和項(xiàng)目的策劃,都需要農(nóng)民科技教育中心提前進(jìn)行規(guī)劃和設(shè)計(jì)。在此過(guò)程中,農(nóng)民科技教育中心應(yīng)該不斷地強(qiáng)化自身的管理水平,對(duì)農(nóng)民教育培訓(xùn)過(guò)程中的關(guān)鍵問(wèn)題展開(kāi)深入的調(diào)研和探討,然后結(jié)合農(nóng)民的實(shí)際學(xué)習(xí)情況,對(duì)于培訓(xùn)內(nèi)容提出相應(yīng)的合理建議。
表5 不同維度識(shí)別率數(shù)據(jù)表
圖4 不同姿態(tài)維度識(shí)別率對(duì)比圖Fig.4 Comparison of recognition rates of different dimensions
2) 識(shí)別時(shí)間分析。對(duì)同一角度下的10名志愿者人臉圖像分別進(jìn)行10次實(shí)驗(yàn), 并對(duì)每次實(shí)驗(yàn)的訓(xùn)練時(shí)間和識(shí)別時(shí)間進(jìn)行記錄, 訓(xùn)練時(shí)間為對(duì)CAS_PEAL人臉庫(kù)(1 070張人臉圖片)進(jìn)行特征提取的總時(shí)間, 識(shí)別時(shí)間為對(duì)各個(gè)人臉進(jìn)行識(shí)別的平均時(shí)間, 具體實(shí)驗(yàn)數(shù)據(jù)如表6所示。從表6可知, CAS_PEAL人臉庫(kù)的訓(xùn)練時(shí)間并不隨特征向量的維度增加而增加, 但識(shí)別時(shí)間有少量增加, 其主要原因在于識(shí)別階段, 經(jīng)過(guò)卷積神經(jīng)網(wǎng)絡(luò)所提取的特征向量維度增加, 余弦相似度計(jì)算量也隨之增加, 所以導(dǎo)致識(shí)別時(shí)間也少量增加。
表6 算法時(shí)間對(duì)比表
筆者提出的一種基于改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)的多姿態(tài)人臉識(shí)別算法在包含有各種不同角度、 姿態(tài)的人臉數(shù)據(jù)庫(kù)CAS_PEAL人臉庫(kù)上取得了較高的識(shí)別率, 同時(shí), 具有一定的魯棒性。