劉 琦
(河南警察學院,河南 鄭州 450000)
隨著技術發(fā)展,主動配合的圖像采集及識別技術非常成熟,靜態(tài)人臉圖像識別準確率更是達到99.999 9%,無限接近于100%。但是動態(tài)人像布控中一個極為關鍵的問題是非主動配合人臉圖像采集的質(zhì)量問題。路人庫中充斥著大量低質(zhì)量人臉圖片,因無法達到人臉檢測最低標準而無法充分利用。搭建低質(zhì)量人臉圖像數(shù)據(jù)庫,并與相對應高質(zhì)量人臉圖像進行比對,為下一步處理低質(zhì)量人臉圖像奠定基礎。
人臉識別技術發(fā)展迅速[1-3],通用的圖像質(zhì)量評估流程如圖1所示。不難發(fā)現(xiàn),當圖像的質(zhì)量被評估為不合格后,就會被丟棄或僅僅報警處理。但是,往往路人庫中存在著豐富的低質(zhì)量圖像,無法達到檢測標準。對低質(zhì)量圖像進行研究,融合其他技術甚至是傳統(tǒng)技術,較好地解決這一問題至關重要,具有非常重要的研究意義和實用價值。
圖1 人臉識別系統(tǒng)中質(zhì)量評估框圖
如果低質(zhì)量圖像的問題得以解決,會為人們生活各個方面帶來更好的安全保障。例如在公安機關涉及的相關案件處理流程中,可以簡化更多偵破流程,提高辦案效率。在案件偵查階段,公安機關會從監(jiān)控視頻資料中截取所需嫌疑人的人臉圖像,但大多數(shù)情況圖像的質(zhì)量極低,通過算法處理之后可以提高圖像的識別概率,從而極大地縮小目標范圍,提高調(diào)查取證效率。在訴訟階段,可以更好地提高公訴質(zhì)量,在電視報道中可以經(jīng)常看見,檢察機關在批捕或起訴各類犯罪案件時,常因為視頻錄像或嫌疑人圖像的模糊無法有力地證實犯罪,極大地影響了公訴的進程。在證據(jù)出示階段,往往由于現(xiàn)場勘驗的空間狹小、光線不足等條件影響圖像質(zhì)量,從而因證據(jù)不足審判無法繼續(xù)。
綜上,低質(zhì)量圖像問題的解決無論是對于公安系統(tǒng)案件偵破效率的提高,還是對于居民人生安全的保障來看,都起著至關重要的作用。
對于低質(zhì)量圖像,在識別時往往會出現(xiàn)模糊、有遮擋、亮度不夠等側(cè)重于主觀方面的詞匯[4-5],本文在界定低質(zhì)量圖像時則采用人臉圖像質(zhì)量評估算法來界定,當該評估結(jié)果為“低質(zhì)量圖像”時,則為本文所討論的對象。
本論文的研究對象為低質(zhì)量圖像,為更好地研究相關算法以及進行數(shù)據(jù)庫的搭建與測試,從某地市公安局得到了涉及低質(zhì)量圖像識別的案件信息及嫌疑人圖像,以下對所收集圖像的具體情況進行闡述。
根據(jù)某地市公安局提供信息,共得到相關案件30 起,案件信息如圖2所示,案件性質(zhì)類型涉及持刀搶劫、入室盜 竊、飛車搶奪、無名女尸身份確認等;案件信息包括案件詳情描述、監(jiān)控視頻、人臉截圖、系統(tǒng)對比圖像等;共計得到人臉低質(zhì)量圖像273 張,根據(jù)圖像審核標準選出質(zhì)量較好的圖像47 張,供后文數(shù)據(jù)測試使用。
案件情況與篩選出的低質(zhì)量圖像匯總?cè)鐖D3所示,其中的命名方式為:首位數(shù)字為涉及案件的數(shù)字代碼、次位數(shù)字為該圖片在該案件中出現(xiàn)的順序。
圖2 案件信息
圖3 低質(zhì)量人臉圖像匯總
圖像的分類使得多個圖像根據(jù)自身特征信息劃分到不同類別,有助于圖像的檢索、收集、存儲與使用。相比人眼視覺效果的區(qū)分效果,科學的分類規(guī)則更能體現(xiàn)圖像的各自特征信息。
本小節(jié)針對以上所篩選出的47 張圖像,進行不同方式的分類,為數(shù)據(jù)庫圖像信息的錄入打下基礎。
3.1.1 基于圖像格式的分類
圖像的格式即計算機用于存儲圖片的格式,格式不同,也就決定著圖像有著不同的優(yōu)缺點,如JPG 格式圖片之所以能被廣泛地應用,因為它下載速度快、文件的尺寸小,各種類型的瀏覽器均支持該圖像格式;但同時它也存在著會被壓縮耗損而降低數(shù)據(jù)質(zhì)量的缺點。
常見的圖像類型有:JPG、PNG、TIFF、SWF、BMP、PCX、TGA、WEBP、AI、EXIF、CDR、PCD、WMF、FPX、EPS、DXF、PSD、RAW、EPS、PSD、UFO 和SVG 等,本文所討論對象中有45 張JPG 格式圖像、2 張PNG 格式圖像。
3.1.2 基于圖像大小的分類
作為圖像屬性的大小與數(shù)據(jù)庫的搭建工作有著密不可分的關系,圖像大小決定了用于存儲該圖像文件所需要磁盤存儲空間的大小,它的度量單位是字節(jié),計算公式為:
文件的大小與該圖像的像素數(shù)目有著直接的關系。將圖像按照大于1 G、小于1 G 大于100 k、小于100 k 分為三個等級,統(tǒng)計三個等級數(shù)量分別為4 張、20 張、23 張。
3.1.3 基于圖像分辨率的分類
分辨率是生活中常常提到用來描述圖像清晰程度的專業(yè)名詞,專業(yè)來講,它是表達圖像內(nèi)所含數(shù)據(jù)量多少的一個參數(shù)。包含數(shù)據(jù)越多,文件的長度越長,那么就能夠展現(xiàn)出該圖像更多的細節(jié);然而當數(shù)據(jù)非常少時,圖像就會隨之變得粗糙,這樣的狀況在將圖像尺寸放大時表現(xiàn)更為明顯。本文所討論的就是后者這類分辨率的低質(zhì)量圖像。根據(jù)數(shù)據(jù)的大小將所得圖像進行了分類,分為高、中、低三個等級,分別有23 張、14 張、10 張。
上述三種方式都能實現(xiàn)對圖像的分類,本論文的研究重點為圖像的質(zhì)量問題,所以本設計數(shù)據(jù)庫搭建工作采用基于分辨率的分類方式進行分類。
根據(jù)需求搭建預處理模板數(shù)據(jù)表、深度學習功能模塊數(shù)據(jù)表和人臉識別模塊數(shù)據(jù)表,如圖4、圖5、圖6所示。
圖4 預處理模塊數(shù)據(jù)表
圖5 深度學習功能數(shù)據(jù)表
圖6 人臉識別數(shù)據(jù)表
3.2.1 預處理模塊數(shù)據(jù)表
所得到的低質(zhì)量圖像的原始照片多在某些因素上被影響,其中有無法恢復的部分,比如大小、分辨率等,但部分因素造成的影響可以在預處理的流程中被處理,比如飽和度、亮度、色調(diào)等,該數(shù)據(jù)表則對圖像的具體信息進行統(tǒng)計與存儲[6-8]。
3.2.2 深度學習功能數(shù)據(jù)表
該數(shù)據(jù)庫是為后續(xù)小組另一位成員算法的實現(xiàn)而搭建,該算法的核心思想為通過基于深度學習的訓練來提升低質(zhì)量圖像與高質(zhì)量圖像的識別概率,即需要一個數(shù)據(jù)表來存儲兩者圖像的標識,便于數(shù)據(jù)庫的調(diào)取。
3.2.3 人臉識別數(shù)據(jù)表
提升低質(zhì)量圖像的根本目的即為獲取圖像中人員信息,便于公安機關展開對嫌疑人的抓捕工作或案件審判中的舉證工作,需創(chuàng)建人臉識別結(jié)果信息存儲的數(shù)據(jù)表,信息內(nèi)容包含人員的姓名、性別、民族、戶籍等相關信息。
在數(shù)據(jù)中添加數(shù)據(jù)表后,開始對數(shù)據(jù)庫的運行做測試,部分代碼如下:
運行結(jié)果如圖7所示,該數(shù)據(jù)庫能夠調(diào)取數(shù)據(jù)表里圖像的信息并進行成功比對,得出兩者的相似度。由此測試搭建的數(shù)據(jù)庫可以滿足需求。
圖7 運行結(jié)果
本文對低質(zhì)量數(shù)據(jù)庫采集后如何分類,建立預處理表、功能表及識別數(shù)據(jù)表,代碼實現(xiàn)結(jié)果的測試等問題進行了研究與技術實現(xiàn)。本文的工作對于進一步處理低質(zhì)量圖像起到較好的支撐作用。