李海亭,李艷紅,彭清山,王 閃
(1. 武漢市測(cè)繪研究院,湖北 武漢 430022; 2. 精密工程與工業(yè)測(cè)量國(guó)家測(cè)繪地理信息局
重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430022; 3. 武漢大學(xué)資源與環(huán)境科學(xué)學(xué)院,湖北 武漢430079)
Research on Privacy Information Hiding in Panoramic Map
LI Haiting,LI Yanhong,PENG Qingshan,WANG Shan
?
全景地圖隱私信息處理的關(guān)鍵技術(shù)研究
李海亭1,2,李艷紅3,彭清山1,2,王閃1,2
(1. 武漢市測(cè)繪研究院,湖北 武漢 430022; 2. 精密工程與工業(yè)測(cè)量國(guó)家測(cè)繪地理信息局
重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430022; 3. 武漢大學(xué)資源與環(huán)境科學(xué)學(xué)院,湖北 武漢430079)
Research on Privacy Information Hiding in Panoramic Map
LI Haiting,LI Yanhong,PENG Qingshan,WANG Shan
摘要:全景地圖系統(tǒng)在數(shù)據(jù)生產(chǎn)中存在一些可能涉及泄漏個(gè)人隱私的信息。本文提出了通過(guò)采用特征提取和監(jiān)督學(xué)習(xí)分類的方法來(lái)檢測(cè)和處理隱私信息的方法。以人臉和車牌號(hào)為例,分別采用支持向量機(jī)和投影定位的方法進(jìn)行了隱私信息定位檢測(cè)。試驗(yàn)證明,該方法具有較好的可行性。
關(guān)鍵詞:全景地圖;隱私信息;特征提??;監(jiān)督分類;目標(biāo)檢測(cè)
一、引言
全景地圖技術(shù)是一種由全景技術(shù)與電子地圖發(fā)布技術(shù)相結(jié)合的、可定位展示真實(shí)場(chǎng)景的虛擬現(xiàn)實(shí)技術(shù),是目前在全球范圍內(nèi)迅速發(fā)展并逐步流行的一種視覺(jué)新技術(shù)[1]。全景地圖主要采用360°全景瀏覽的方式展示空間信息。在全景數(shù)據(jù)的采集過(guò)程中,往往包含了較多可能涉及泄漏個(gè)人隱私的信息,如人臉、車牌號(hào)等。目前,圍繞空間數(shù)據(jù)安全開(kāi)展了大量的數(shù)字水印技術(shù)研究[2-4],在空間數(shù)據(jù)的版權(quán)保護(hù)、使用跟蹤、內(nèi)容認(rèn)證等方面發(fā)揮了很好的作用,但仍無(wú)法滿足全景地圖中某些特定隱私信息的保護(hù)。如何將這些隱私信息進(jìn)行自動(dòng)識(shí)別和保護(hù)是全景地圖系統(tǒng)數(shù)據(jù)處理的一項(xiàng)重要任務(wù)。
二、隱私信息特征提取與定位
隱私信息檢測(cè)一般包括數(shù)據(jù)預(yù)處理、特征提取、樣本學(xué)習(xí)和目標(biāo)檢測(cè)4個(gè)過(guò)程。其中,特征提取是隱私信息定位的關(guān)鍵技術(shù),選取的特征直接影響到目標(biāo)檢測(cè)的精度。特征提取的方法較多,包括幾何特征提取法(geometry features extraction,GFE)、主成分分析法(principal component analysis,PCA)及神經(jīng)網(wǎng)絡(luò)特征提取法(neural network features extraction,NNFE)等。本文以人臉和車牌為例,闡述隱私信息的特征提取與定位過(guò)程。
1. 人臉檢測(cè)
人臉檢測(cè)即從不同的全景圖像中檢測(cè)出人臉的存在并確定其位置。人臉檢測(cè)受光照、噪聲及遮擋影響較大。用于人臉檢測(cè)的特征提取在提取之前需對(duì)人臉圖像進(jìn)行歸一化處理,通常包括灰度預(yù)處理、角度預(yù)處理和尺度預(yù)處理3個(gè)過(guò)程。
(1) 灰度預(yù)處理
灰度預(yù)處理主要去除不同光照對(duì)人臉圖像的影響,比較常用的方法為直方圖法。直方圖表示數(shù)字圖像中每一個(gè)灰度級(jí)與其出現(xiàn)的頻率之間的統(tǒng)計(jì)關(guān)系。直方圖變換函數(shù)包括高斯、瑞利、對(duì)數(shù)、指數(shù)等方式。對(duì)數(shù)形式的變換函數(shù)如下
(1)
式中,f(x,y)為輸入圖像;g(x,y)為輸出圖像;a、b、c為調(diào)整曲線的位置、形狀參數(shù)。
(2) 角度預(yù)處理
在人臉識(shí)別過(guò)程中,通常假設(shè)輸入的人臉圖像的位置是正立的[5]。由于全景采集中人臉的姿態(tài)各異,因此需要對(duì)圖像進(jìn)行角度糾正。人臉姿態(tài)的糾正主要分為平面旋轉(zhuǎn)與深度旋轉(zhuǎn)。角度預(yù)處理后的姿態(tài)正立度估計(jì)方法有兩種:模版匹配法和灰度統(tǒng)計(jì)法。
(3) 尺度預(yù)處理
由于全景采集過(guò)程中成像距離的任意性,人臉圖像的尺寸差異較大,因此必須對(duì)圖像進(jìn)行尺度歸一化處理。主要依賴于特征提取的方法,通常是先對(duì)人眼的兩個(gè)瞳孔進(jìn)行定位,然后將兩個(gè)瞳孔之間的距離作為比例系數(shù)進(jìn)行圖像的縮放,進(jìn)而得到人臉歸一化圖像。
在歸一化處理的過(guò)程中,首先要對(duì)眼睛進(jìn)行準(zhǔn)確定位。眼睛定位可采用混合投影[6]或模板匹配[7]的方法。由于兩眼中心間距受光照或表情變化的影響最小,因此兩眼中心的連線可作為圖像旋轉(zhuǎn)和尺度處理的依據(jù)。由于同一張全景影像可能存在多個(gè)人臉的情況,歸一化處理后即生成多個(gè)搜索區(qū)域,然后通過(guò)監(jiān)督學(xué)習(xí)的方法對(duì)每個(gè)搜索區(qū)域進(jìn)行自動(dòng)識(shí)別分類。
(4) 監(jiān)督分類與信息隱藏
監(jiān)督分類是機(jī)器學(xué)習(xí)中的一個(gè)方法,可以由訓(xùn)練樣本中學(xué)到或建立一個(gè)模型,并以此模型推測(cè)新的實(shí)例。目前常用的監(jiān)督學(xué)習(xí)方法主要有支持向量機(jī)(support vector machine,SVM)、人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)、決策樹(shù)(decision tree)等。其中,支持向量機(jī)分類是一種基于統(tǒng)計(jì)學(xué)習(xí)理論的監(jiān)督式機(jī)器學(xué)習(xí)方法,即已知訓(xùn)練點(diǎn)的類別,求訓(xùn)練點(diǎn)和類別之間的對(duì)應(yīng)關(guān)系,以便將訓(xùn)練集按照類別分開(kāi),或是預(yù)測(cè)新的訓(xùn)練點(diǎn)所對(duì)應(yīng)的類別[8-9]。它具有泛化能力強(qiáng)、全局最優(yōu)和計(jì)算速度快等突出優(yōu)點(diǎn)。本文在試驗(yàn)中采用支持向量機(jī)對(duì)全景影像中的人臉進(jìn)行檢測(cè),然后通過(guò)高斯模糊算法對(duì)人臉區(qū)域進(jìn)行模糊化處理。
2. 車牌定位
車牌號(hào)碼是全景地圖中的重要隱私信息。車牌快速定位的技術(shù)方法很多,包括彩色分割、形態(tài)學(xué)分析、區(qū)域生長(zhǎng)、小波變換等。其中,基于投影圖像分布特征的車牌自動(dòng)檢測(cè)定位技術(shù)[10]具有良好的魯棒性。該方法的主要過(guò)程如下:
(1) 灰度預(yù)處理
全景影像中包含大量顏色信息,對(duì)全景影像進(jìn)行灰度化處理不僅可以減小存儲(chǔ),還可以加快特征提取的計(jì)算速度。
(2) 二值化
二值圖像是指整幅圖像畫(huà)面內(nèi)僅黑、白二值的圖像。在二值化圖像時(shí)把大于某個(gè)臨界灰度值的像素灰度設(shè)為灰度極大值,把小于這個(gè)值的像素灰度設(shè)為灰度極小值,從而實(shí)現(xiàn)二值化。在車牌定位過(guò)程中,圖像二值變換的關(guān)鍵是確定合適的閾值。二值變換后的圖像須具有原始的特征分布。
(3) 邊緣檢測(cè)
邊緣檢測(cè)是形狀特征提取和圖像分割的基礎(chǔ),主要是通過(guò)檢測(cè)每個(gè)像素和其鄰域的狀態(tài),以判定該像素是否位于一個(gè)物體的邊界上。邊緣檢測(cè)的步驟主要包括濾波、增強(qiáng)、檢測(cè)和定位4個(gè)過(guò)程。常用的邊緣檢測(cè)算子主要包括Roberts算子、Sobel算子、Prewitt算子、Krisch算子和高斯-拉普拉斯算子等。
(4) 開(kāi)運(yùn)算
對(duì)上述運(yùn)算得到的圖像進(jìn)行形態(tài)學(xué)圖像分析,主要包括腐蝕和膨脹運(yùn)算。腐蝕是一種消除邊界點(diǎn)的過(guò)程,可有效消除孤立噪聲點(diǎn);膨脹是將與目標(biāo)物體接觸的背景點(diǎn)合并到物體的過(guò)程,可填補(bǔ)目標(biāo)物體中的空洞。開(kāi)運(yùn)算即先腐蝕后膨脹的過(guò)程,具有消除噪聲、平滑較大邊界的作用。
(5) 車牌定位與信息隱藏
車牌定位包括上下邊界定位和左右邊界定位。經(jīng)開(kāi)運(yùn)算處理后的圖像,車牌區(qū)域具有相對(duì)集中且規(guī)則的紋理特征,并具有連續(xù)性。因此,可根據(jù)車牌區(qū)域黑白跳變次數(shù)先確定車牌的上下邊界,然后根據(jù)車牌字符在豎直方向的投影值來(lái)確定車牌的左右邊界,最后通過(guò)高斯模糊算法對(duì)車牌區(qū)域進(jìn)行模糊化處理。
三、試驗(yàn)
本文對(duì)武漢市江漢區(qū)部分道路的全景影像進(jìn)行了試驗(yàn),包括人臉檢測(cè)和車牌定位。整個(gè)試驗(yàn)在Matlab 2011a環(huán)境下實(shí)現(xiàn),支持向量機(jī)函數(shù)庫(kù)采用LibSVM,同時(shí)采用線性回歸(linear regression)和徑向基函數(shù)(radial basis function,RBF)作為核函數(shù)進(jìn)行分類結(jié)果比較。試驗(yàn)過(guò)程如下:
1. 人臉檢測(cè)
首先對(duì)全景影像進(jìn)行灰度、角度和尺度預(yù)處理。圖1為人體部分采用對(duì)數(shù)變換方式后的效果及圖像直方圖對(duì)比圖。由于車載全景影像采集過(guò)程中通常采用定焦鏡頭,并且行人與相機(jī)之間的距離大于某特定值(如車寬),因此可識(shí)別人臉的尺寸保持在一定范圍內(nèi)。經(jīng)多次試驗(yàn),采用25像素×25像素作為人臉尺寸的大小。試驗(yàn)采用LibSVM進(jìn)行監(jiān)督分類,在監(jiān)督分類過(guò)程中采用PRTools軟件自帶的人臉樣本庫(kù)進(jìn)行訓(xùn)練。采用交叉驗(yàn)證對(duì)懲罰系數(shù)進(jìn)行尋優(yōu),得到最佳C=0.001,精度為94.5%。利用線性回歸、徑向基函數(shù)的比較結(jié)果及高斯模糊效果如圖2所示。
2. 車牌號(hào)定位
在車牌號(hào)定位過(guò)程中,灰度處理采用的公式為
Gray =R×0.299+G×0.587+B×0.114
(2)
試驗(yàn)采用Otsu閾值分割算法對(duì)圖像進(jìn)行二值化處理,并采用Robert算子進(jìn)行邊緣檢測(cè),然后對(duì)得到的圖像進(jìn)行開(kāi)運(yùn)算,最后使用投影法實(shí)現(xiàn)車牌區(qū)域的定位。試驗(yàn)結(jié)果如圖3所示。
圖1 對(duì)數(shù)變換的效果比較及圖像直方圖對(duì)比
圖2 線性回歸和SVM分類結(jié)果比較及信息隱藏
圖3 車牌號(hào)定位
四、結(jié)束語(yǔ)
本文采用支持向量機(jī)和投影法實(shí)現(xiàn)了全景地圖影像中人臉和車牌區(qū)域的檢測(cè),并采用高斯模糊實(shí)現(xiàn)了此類敏感信息的隱藏處理,大大提高了數(shù)據(jù)的處理效率。試驗(yàn)過(guò)程中還存在一些學(xué)習(xí)不充分、識(shí)別精度不足等問(wèn)題。在以后的研究中,將對(duì)目標(biāo)特征和模型參數(shù)進(jìn)行優(yōu)化,進(jìn)一步提高全景地圖隱私數(shù)據(jù)處理的自動(dòng)化水平。
參考文獻(xiàn):
[1]李海亭,彭清山,王閃.?dāng)?shù)字城市中的全景地圖系統(tǒng)建設(shè)方法研究[J]. 測(cè)繪通報(bào),2011(4):71-73.
[2]符浩軍,朱長(zhǎng)青,趙毅,等. 面向網(wǎng)絡(luò)環(huán)境的地理空間數(shù)據(jù)數(shù)字水印模型[J].測(cè)繪學(xué)報(bào),2013,42(6):891-897.
[3]賈培宏,馬勁松,史照良,等. GIS空間數(shù)據(jù)水印信息隱藏與加密技術(shù)方法研究[J].武漢大學(xué)學(xué)報(bào):信息科學(xué)版,2004,29(8):747-751.
[4]朱長(zhǎng)青,楊成松,任娜. 論數(shù)字水印技術(shù)在地理空間數(shù)據(jù)安全中的應(yīng)用[J].測(cè)繪通報(bào),2010(10):1-3.
[5]HUANG J, SHAO X, WECHSLER H. Face Pose Discrimination Using Support Vector Machines(SVM)[C]∥Proceeding of International Conference Recognition. Brisbane:[s.n.], 1998:154-156.
[6]耿新,周志華,陳世福.基于混合投影函數(shù)的眼睛定位[J].軟件學(xué)報(bào),2003,14(8):1394-1400.
[7]梁路宏,艾海舟,肖習(xí)攀.基于模板匹配與支持矢量機(jī)的人臉檢測(cè)[J].計(jì)算機(jī)學(xué)報(bào),2002,25(1):22-29.
[8]鄧乃楊,田英杰.?dāng)?shù)據(jù)挖掘中的新方法——支持向量機(jī)[M].北京:科學(xué)出版社,2004.
[9]楊志民,劉廣利.不確定性支持向量機(jī)[M].北京:科學(xué)出版社,2007.
[10]楊衛(wèi)平,李吉成,沈振康.車牌目標(biāo)的自動(dòng)定位技術(shù)[J].中國(guó)圖象圖形學(xué)報(bào),2002,7(8):835-839.
[11]張智勇.全景移動(dòng)測(cè)量系統(tǒng)及其應(yīng)用前景展望[J].測(cè)繪通報(bào),2014(3):79-81.
通信作者:李艷紅。E-mail: yanhongli1979@163.com
作者簡(jiǎn)介:李海亭(1980—),男,博士,高級(jí)工程師,主要從事車載激光掃描數(shù)據(jù)處理研究。E-mail: 120059908@qq.com
基金項(xiàng)目:國(guó)家自然科學(xué)基金青年基金(41101449);精密工程與工業(yè)測(cè)量國(guó)家測(cè)繪地理信息局重點(diǎn)實(shí)驗(yàn)室開(kāi)放研究基金(PF2011-26)
收稿日期:2014-11-12
中圖分類號(hào):P283
文獻(xiàn)標(biāo)識(shí)碼:B
文章編號(hào):0494-0911(2015)12-0074-03
引文格式: 李海亭,李艷紅,彭清山,等. 全景地圖隱私信息處理的關(guān)鍵技術(shù)研究[J].測(cè)繪通報(bào),2015(12):74-76.DOI:10.13474/j.cnki.11-2246.2015.383