張 揚, 孫大勇, 耿英保, 金 力
(安徽中醫(yī)藥大學 醫(yī)藥信息工程學院,安徽 合肥 230012)
人臉識別是生物特征識別的一種,它利用計算機分析圖像人臉信息,識別其對應的人物身份[1].由于該技術能夠通過生物體本身的特征來區(qū)分個體,提高了生物體識別的精確度,因此得到廣泛關注.如何有效準確地進行人臉識別,成為當今學術界研究的熱點之一.
本文研究的資料均來源于中國知網(wǎng)1990~2019年發(fā)表的人臉識別文獻,使用文獻計量學的方法,同時利用CiteSpace(可視化分析軟件),生成國內人臉識別研究知識圖譜,揭示近三十年來人們在人臉識別研究領域的研究狀況、當前的熱點及研究前沿,為讀者在這方面的進一步研究提供參考和幫助.
選擇全球最大的中文數(shù)據(jù)庫CNKI(中國學術文獻網(wǎng)絡出版總庫)為數(shù)據(jù)來源采集數(shù)據(jù),以保證研究數(shù)據(jù)的全面性和準確性,研究的期刊時間跨度設置為1990~2019年,檢索方式選擇專業(yè)檢索,將“人臉識別”設為主題字段進行精確檢索,選取SCI、EI、CSSCI、CSCD及北大核心作為期刊來源.共檢索到有關期刊3 754篇,經(jīng)人工篩選出和研究有關的期刊有效文獻3 633篇.
CiteSpace是一款可視化文獻分析軟件,利用CiteSpace可以尋找某一學科領域的研究進展和當前的研究前沿及其對應的知識基礎[2].
本文首先從CNKI檢索所需文獻,按照Refworks格式進行保存,并對文獻計量指標進行統(tǒng)計分析,然后借助CiteSpace繪制所需知識圖譜,分析人臉識別研究現(xiàn)狀、研究熱點及前沿研究等.
發(fā)文數(shù)量是衡量一個研究領域發(fā)展態(tài)勢的重要指標[3].整理檢索到的3 633篇文獻,繪制出發(fā)文數(shù)量年度分布圖(圖1),其中橫坐標表示年份,縱坐標表示年度發(fā)文量.
由圖1可知:國內有關人臉識別的學術文獻最早出現(xiàn)于1992年,1992~1996年為人臉識別技術研究的起步階段,此階段核心期刊發(fā)文總體較少,但已成持續(xù)增長的均勢.1997~2012年,人臉識別技術逐漸受到廣泛關注,迎來發(fā)展熱潮,發(fā)文量出現(xiàn)急增.從2013年以來核心期刊發(fā)文量較前期相對減少,但仍保持較高數(shù)量,這表明該領域的理論研究已進入一個相對穩(wěn)定的時期,同時有資料表明,2014年以來我國和人臉識別技術有關的專利申請數(shù)量大幅增多,在2011年我國的申請量尚不足200件,但在2016年這一數(shù)字則變?yōu)榻? 200件,并在2017年保持了增長的趨勢[4],這表明該領域的研究已逐漸由基礎研究轉向應用階段.
圖1 發(fā)文數(shù)量年度分布圖
通過對檢索的文獻中基金資助數(shù)據(jù)分析,人臉識別研究得到了各類國家級和省部級基金項目資助,其中獲得國家級基金資助的計有2 093篇,占所統(tǒng)計文獻的57.6%,這說明在當前人工智能、物聯(lián)網(wǎng)等前沿技術迅速發(fā)展的帶動下,人臉識別研究領域也受到了社會的重視.具體的基金資助情況如表1所列.
表1 1990-2019年人臉識別研究文獻基金分布表
期刊核心作者的確定可以依據(jù)普賴斯定律,即期刊最高產(chǎn)作者的發(fā)文量來確定核心作者范圍[5].將核心作者發(fā)文量用Mp表示,計算公式如下:
式中,Npmax代表發(fā)文量排名最高作者的發(fā)文數(shù)量,此處Npmax=56.
根據(jù)以上公式,核心作者的發(fā)文量界定為6篇或6篇以上,發(fā)文量前10的核心作者如表2所列.
表2 發(fā)文量前10的核心作者
利用CiteSpace可視化軟件,將時間跨度設置為1990-2019年,時間片TimeSlicing設為1年,運行軟件后得到作者共現(xiàn)網(wǎng)絡圖譜(圖2).
圖2 作者共現(xiàn)網(wǎng)絡圖
圖2中每個圓點代表一位作者,圓點所占區(qū)域大小和作者發(fā)文數(shù)量成正比,各節(jié)點之間的連接線代表作者之間的合作關系.由圖2可知,對于有關人臉識別領域的研究,從1990-2019年期間形成了若干以所示節(jié)點為中心的研究隊伍,如南京理工大學的楊靜宇、程永清、金忠,四川大學的周激流、張曄、劉靖,江南大學的王士同、李光早、袁少峰等學者隊伍,這些隊伍不斷新舊交替融合,為有關人臉識別領域的研究奠定了基礎,促進了該領域研究的持續(xù)發(fā)展.
為了更好地對1990-2019年間各機構所發(fā)表的有關人臉識別研究文獻進行統(tǒng)計研究,借助CiteSpace軟件繪制了各研究機構合作網(wǎng)絡知識圖譜(圖3),同樣,圖中圓點所占區(qū)域越大,表示該機構的發(fā)文量也越多,圖中的連線表明各機構之間的相互合作關系.各機構發(fā)文統(tǒng)計情況如表3所列.
表3 機構發(fā)文表
由表3和圖3可知,國內各大高等院校構成了人臉識別領域內的研究主體,其中以南京理工大學計算機科學與技術學院、江南大學物聯(lián)網(wǎng)工程學院、重慶大學光電技術及系統(tǒng)教育部重點實驗室以及揚州大學信息工程學院等院校為主要研究機構,在人臉識別研究領域發(fā)表了大量高水平的學術性文章,為該領域的研究發(fā)展作出了重大貢獻.同時通過圖3及發(fā)文分析,我們發(fā)現(xiàn)國內各個研究機構之間的橫向合作比較松散,建議根據(jù)研究方向共同組建研發(fā)實體,便于從更深層次進行大范圍的科研合作,以提升科研水平.
2.5.1 研究熱點
作為文獻主旨的體現(xiàn),關鍵詞必不可少.CiteSpace中的關鍵詞共現(xiàn)是基于文獻內容,從文章中提取出關鍵詞,并對文章中高頻關鍵詞進行分類,往往能夠探尋到該領域的研究熱點[6].圖4是利用CiteSpace軟件繪制的高頻關鍵詞共現(xiàn)圖譜,通過該圖可以探尋人臉識別研究領域當前的熱點方向.
在圖4中,每一個圓形節(jié)點代表一個關鍵詞,節(jié)點越大表示關鍵詞出現(xiàn)的頻次越高,節(jié)點之間的連線表示關鍵詞之間的共現(xiàn)系數(shù),連線越多,表明關鍵詞之間相互聯(lián)系越緊密[7].選取1990~2019年間出現(xiàn)頻次在60次以上的關鍵詞,列出如下人臉識別研究熱點高頻關鍵詞頻次統(tǒng)計表(表4).
在對圖4進行關鍵詞分析的基礎上,結合表4,發(fā)現(xiàn)目前國內人臉識別研究的核心工作主要偏重于基礎理論研究,即對人臉識別相關算法的研究,其研究熱點主要圍繞以下兩方面展開.
(1)人臉特征數(shù)據(jù)的采集與前期處理研究
如何對人臉檢測定位,提取特征以建立用于特征識別的特征庫,在提高人臉識別精準度方面起到關鍵作用,人臉數(shù)據(jù)的獲取及相關數(shù)據(jù)集的構建,成為人臉識別研究的熱點之一.在這方面,袁芳林等[8]利用結構光相移測量技術快速獲取人臉三維面貌數(shù)據(jù),同時結合二維人臉圖像中的人臉特征識別手段,使計算機自動提取人臉圖像的主要特征點,這種方法提取速度快、準確度高,對不同人臉模型都有較好的通用性.王大為等[9]針對三維人臉數(shù)據(jù)中可能存在的一些和人臉識別無關的信息及姿態(tài)變化、孔洞等干擾因素,通過切割、數(shù)據(jù)規(guī)整、平滑和姿態(tài)矯正等數(shù)據(jù)預處理方法加以處理,從而弱化噪聲和冗余信息的影響,提高定位精度以節(jié)省搜索時間.在人臉在被物體遮擋的情況下,如何快速、準確地檢測特征臉的位置,楊帆等[10]提出一種遮擋人臉特征點定位算法,此方法首先檢測人面部所提取特征點遮掩狀態(tài),然后根據(jù)所選特征點被遮掩的概率,自動調整其紋理特征所占比重,以減少面部遮擋后對特征的影響,提高特征臉定位的準確性.人臉的檢測定位、特征提取是人臉識別研究的兩個關鍵問題,對高效的人臉識別有至關重要的作用,學者們從不同角度提出了各具特色的算法,隨著計算機性能的提高、網(wǎng)絡及人工智能的發(fā)展,相關研究將會進一步發(fā)展.
表4 高頻關鍵詞頻次統(tǒng)計表
(2)人臉識別方法研究
在高效提取人臉生物特征的基礎上,如何對人臉進行識別比對,成為學者們關注的另一熱點.其中何元烈等[11]針對視頻中動態(tài)人臉識別效果差的問題,提出基于深度學習的動態(tài)人臉識別方法.用預先訓練好的模型提取視頻中每一幀人臉圖像特征,并對其同時跟蹤和識別,利用增強學習進一步提高識別效果,使用循環(huán)神經(jīng)網(wǎng)絡對一段視頻進行識別.實驗結果表明:此種方法識別準確性接近最好成績且魯棒性有了較大提升.
對于低分辨率人臉圖像缺少有效信息而導致識別率較低的問題,歐陽寧等[12]提出一種結合哈爾小波與遞歸神經(jīng)網(wǎng)絡的低分辨率人臉識別方法,實驗表明:即使在極低的分辨率條件下,其識別能力仍優(yōu)于目前領先的超分辨率重建算法.胡靜等[13]則針對存在光照、遮擋、噪聲污染等情況下的人臉識別問題,提出一種基于低秩矩陣恢復的群稀疏表示人臉識別方法.將人臉圖像由空域轉換至對數(shù)域,并通過低秩矩陣恢復算法恢復每個子類訓練樣本和增強恢復數(shù)據(jù)的鑒別力等方法,以提高人臉識別率.在大規(guī)模人臉圖像數(shù)據(jù)庫建立的基礎上,人臉的匹配識別技術也取得了很大進步,但在識別速度和精確度方面仍有待于進一步提升.
2.5.2 研究前沿
運用CiteSpace軟件的突變檢測(Burst Detection)算法,探測關鍵詞詞頻的時間分布,將詞頻變化率高的關鍵詞探測出來,從中可以辨識和追蹤學科領域的研究動態(tài)和發(fā)展趨勢[14].基于此目標,利用CiteSpace軟件對采集的人臉識別研究文獻中的高頻關鍵詞進行突變性探測,列出突變性較高的前10位關鍵詞(表5),突變強度越高說明該研究主題越活躍,也是未來發(fā)展趨勢和研究熱點.
同時,為了更好地展現(xiàn)國內人臉識別文獻中高頻關鍵詞在時間上的分布,按照時區(qū)分析法構建了高頻關鍵詞時區(qū)圖譜(圖5).
表5 關鍵詞突變強度表
圖5 人臉識別高頻關鍵詞時區(qū)圖譜
通過對表4、表5和圖5的綜合分析,可以發(fā)現(xiàn)從20世紀90年代以來,關于人臉識別的技術更替經(jīng)歷了一代又一代變化,特別是2013年后,人工智能(關鍵詞:三維人臉識別、卷積神經(jīng)網(wǎng)絡、深度學習等)等新技術的興起,成為提升人臉識別準確度的關鍵.從表5和圖5可以有效預測今后人臉識別領域的研究熱點與前沿,主要將圍繞以下幾方面開展.
(1)基于深度學習的人臉識別技術研究
在人臉識別中,大訓練數(shù)據(jù)集對于有效提升非受限環(huán)境下的人臉識別很重要.然而,經(jīng)典方法難以處理大規(guī)模數(shù)據(jù)集的訓練場景,因此需要重點研究基于深度學習的人臉識別技術,在此基礎上建立多樣化的人臉模型,才能實現(xiàn)快速與精準的人臉識別,而卷積神經(jīng)網(wǎng)絡正是深度學習方法在人臉識別上的典型應用.
(2)圖像預處理研究
表5中的小波變換、稀疏表示、局部二值模式等,都是針對人臉圖像進行采集與預處理的關鍵詞,主要是為了降低實驗數(shù)據(jù)的維度,提高圖像的質量,提升實驗數(shù)據(jù)處理的效率.隨著人臉識別的應用領域越來越多,數(shù)據(jù)的來源也會越來越多,數(shù)據(jù)的預處理就顯得尤為重要[15].建立系統(tǒng)的預處理模式,總體提升人臉識別的效率也將成為今后研究熱點之一.
(3)復雜背景下人臉識別技術研究
由于人臉特征易受光照、姿勢、表情等因素影響,并且會受復雜背景、眼鏡、胡須等因素嚴重干擾,這些都增加了人臉識別的難度.對此,國內學者們從各個角度進行了探討以提升人臉識別的效率,如對復雜背景下的人臉圖像,采取包括基于膚色模型和OpenCV的綜合方法進行人臉檢測定位,并對圖像重新保存處理以克服光照因素的干擾.為消除復雜背景對人臉識別不利因素的影響,采用二維主成分分析算法,對同一個人多幅不同表情的人臉圖像進行采集和特征提取并歸類;還要采用3D識別技術將人臉立體化,全面反映人臉的面部特征以解決復雜背景下的人臉識別問題,這些都在一定程度上提高了人臉的識別率,可以預測,隨著人臉識別技術在社會上的廣泛應用,提高各種復雜背景下人臉識別精準度也是目前的研究趨勢之一.
本文利用可視化軟件CiteSpace,對從中國知網(wǎng)CNKI獲取的1990~2019年國內有關人臉識別文獻,從研究機構、作者、關鍵詞等計量指標進行了文獻計量統(tǒng)計及知識圖譜分析,得到了以下結論:國內人臉識別研究近年來不但升溫,且正由理論研究邁向實用階段,研究機構以高等院校為主,人臉識別研究的熱點領域主要包括人臉特征數(shù)據(jù)的采集處理及人臉識別算法的研究;隨著人工智能的來臨,人臉識別研究的前沿熱點集中在基于深度學習的人臉識別技術、人臉圖像預處理技術以及復雜背景下人臉識別技術研究3個方面.本文由于只選取了該領域內的核心期刊作為數(shù)據(jù)來源,因此存在一定的局限性,期望本文能為讀者全面了解當前國內人臉識別領域的研究熱點和發(fā)展趨勢提供一定的幫助.