沈愛敏,張正道
(江南大學(xué) 輕工過程先進控制教育部重點實驗室,江蘇 無錫214122)
隨著移動互聯(lián)網(wǎng)時代的到來,人們將越來越多地使用手機等移動設(shè)備訪問電子商務(wù)、E-mail、游戲、社交等網(wǎng)絡(luò)應(yīng)用,同時移動設(shè)備上的密碼,個人識別碼(PIN)等傳統(tǒng)身份認(rèn)證方式也面臨著信息安全問題的嚴(yán)峻挑戰(zhàn)。目前,手機等移動設(shè)備大都配備了攝像頭、加速度傳感器、陀螺儀等各種傳感器,這些傳感器能記錄下每個人所特有的生理特征或行為特征,利用這些生物特征進行身份認(rèn)證能夠克服傳統(tǒng)身份認(rèn)證方式的缺陷[1],且省去了手動輸入認(rèn)證信息的麻煩。
在基于行為特征的生物認(rèn)證方法中,靜態(tài)手勢認(rèn)證,相比手在三維空間運動的動態(tài)手勢認(rèn)證,受外部環(huán)境的制約更小,只需將手或手臂保持一個固定姿勢即可,操作簡便,手勢更容易記憶。目前,靜態(tài)手勢認(rèn)證主要通過手勢的靜態(tài)圖像來區(qū)分不同的用戶[2]。Aumi M 等人用紅外線深度傳感器探測用戶做靜態(tài)手勢時,五個手指指尖和手掌心相對于傳感器的3D 坐標(biāo),實現(xiàn)身份認(rèn)證[3]。實際上,在保持靜態(tài)手勢時,人體的肌肉群,特別是上肢的肌群,會產(chǎn)生生理性震顫,即人的身體某一個或多個部分的肌肉產(chǎn)生無意識、節(jié)律性的顫動[4]。目前,生理震顫信號已經(jīng)作為生物特征[5,6]在醫(yī)學(xué)等方面獲得了應(yīng)用。文獻[7,8]研究了通過加速度傳感器獲取震顫信號,用高階統(tǒng)計量和支持向量機區(qū)分生理震顫信號和其他類型震顫信號的方法。Woods A M 等人在手機上實現(xiàn)了上述應(yīng)用[6]。Albert M等人通過分析人體的生理性震顫信號區(qū)分了不同的靜態(tài)手勢[9]。但上述研究均未涉及身份認(rèn)證。Liberty M G 等人提出了一種基于人體生理震顫的身份認(rèn)證3D 指示設(shè)備[5],該設(shè)備采用旋轉(zhuǎn)矢量傳感器、加速度傳感器、陀螺儀等多個傳感器獲取生理震顫信號,實現(xiàn)身份認(rèn)證。
由于靜態(tài)手勢所產(chǎn)生的生理震顫在不同個體間存在差異[5,6],且震顫信號的獲取簡便,因此,本文以生理震顫信號作為生物特征,設(shè)計了一種基于靜態(tài)手勢的手機持有人身份認(rèn)證方法,通過Android 智能手機內(nèi)置的加速度傳感器采集由用戶持手機做靜態(tài)手勢產(chǎn)生的生理震顫信號,以信號的功率譜密度(power spectral density,PSD)為特征,采用動態(tài)時間規(guī)整(dynamic time warping,DTW)算法計算測試信號與模板之間的相似度,以此來區(qū)分不同用戶的震顫信號,實現(xiàn)身份認(rèn)證。
實驗流程包括注冊階段和認(rèn)證階段,其中注冊階段包括模板信號的采集、預(yù)處理,特征提取,然后確定認(rèn)證模板,通過DTW 算法確定認(rèn)證閾值。在認(rèn)證階段,通過DTW 算法將認(rèn)證手勢與認(rèn)證模板進行匹配,最后得到認(rèn)證結(jié)果。
1.1.1 信號采集與預(yù)處理
在注冊階段,用戶持手機做一個靜態(tài)姿勢,并重復(fù)該姿勢三次作為注冊模板,做手勢時上肢需伴隨有肌肉震顫,肘部不應(yīng)由身體支撐,由手機內(nèi)置的加速度傳感器記錄下生理震顫信號,設(shè)置傳感器采樣頻率為50 Hz[10]。每次采集要求保持姿勢為10 s,采集完一次信號,手臂需放松后,再進行下一次采集,以防止因連續(xù)采集造成上肢疲勞造成模板不可靠。采集的加速度信號已經(jīng)通過Android 平臺去除了重力的影響,且包含了X,Y,Z 三個軸的加速度序列,下文數(shù)據(jù)處理方法以X 軸為例,Y 軸和Z 軸均采用相同的處理方式。
由于開始時會因用戶操作帶來較大的震動,故保留第100 個數(shù)據(jù)點以后包含320 個數(shù)據(jù)點的加速度序列。但僅進行簡單截取并不能保證模板的準(zhǔn)確性,說話、咳嗽等干擾因素會使手臂抖動幅度過大造成模板錯誤,所以,模板采集時應(yīng)進行穩(wěn)定性判斷,去除干擾因素,對不穩(wěn)定信號,需重新采集,以保證模板的可靠、準(zhǔn)確。穩(wěn)定性判斷的方法為:
將截取得到的X 軸加速度序列分成等長的10 段,并求取每一段的標(biāo)準(zhǔn)差,得到10 個標(biāo)準(zhǔn)差記為STDX=(stdx1,stdx2,…,stdx10),若標(biāo)準(zhǔn)差的最大值減去最小值再除以其平均值小于判斷閾值,即
則可判定該X 軸信號為穩(wěn)定信號。其中,當(dāng)φ 值取8.0時能有效地判定穩(wěn)定信號與受干擾的信號。若X,Y,Z 三軸均小于φ,則該條信號為穩(wěn)定信號;否則,信號不穩(wěn)定,需重新采集。
采集完成后,對加速度序列進行標(biāo)準(zhǔn)化,并進行低通濾波,以避免混疊效應(yīng)和緩慢漂移[10]。
1.1.2 特征提取
本實驗采用Welch 法求得的功率譜密度為特征,其具體方法如下:
1)先將預(yù)處理后長度為N=320 的X 軸加速度序列進行分段,其中每小段長度設(shè)為M=32,兩相鄰小段之間重疊的長度設(shè)為M/2,使分得的段數(shù)為
2)對每一小段加相同的平滑窗w(n),并求取傅里葉變換,得到
其中,i=1,2,…,L,上式中的窗函數(shù)w(n)選擇漢明窗[11],其表達式為
其中,0 <n≤M-1。
3)求取每一小段功率譜的平均值,得到X 軸的功率譜密度為
1.1.3 認(rèn)證模板的確定
在完成模板信號的預(yù)處理和特征提取之后,設(shè)三條模板信號的X 軸功率譜密度分別為,于是得到X 軸的認(rèn)證模板為三條信號功率譜密度的平均值,即
同理,得到Y(jié) 軸和Z 軸的認(rèn)證模板Py,Pz。
1.1.4 DTW 算法
DTW 算法通過動態(tài)規(guī)劃方法使兩個序列的重要特征排列一致,并使序列間的總距離最小化,適用于兩個序列的趨勢相同但序列長度不一致,或者雖然序列長度一致,但某些重要特征在時間軸上存在錯位的情況,以X 軸為例,利用DTW 確定完成認(rèn)證所需的閾值的計算過程如下:
設(shè)X 軸上的模板序列P=p1,p2,…,pj,…,pn和信號功率譜密度序列S=s1,s2,…,sk,…sn,序列長度均為n。其中,分別是模板序列P 和信號功率譜密度序列S 中的元素。構(gòu)造一個n×n 的矩陣,矩陣中的第(jth,kth)元素為點pi和sj的距離d(pj,sk),通常使用歐氏距離,即
為了找到兩序列間的最佳匹配,定義規(guī)整路徑W=w1,w2,…,wm,…,wM,n≤M≤2n。W 為P,S 間的映射,W 中的第m 個元素為wm=(j,k),1≤j,k≤n。于是,DTW 可表示為如下目標(biāo)函數(shù)的最優(yōu)化問題
且規(guī)整路徑須滿足:
1)起點和終點約束:w1=(1,1),wm=(n,n);
2)連續(xù)性:對于wm=(j,k)和wm-1=(j',k'),滿足jj'≤1,k-k'≤1;
3)單調(diào)性:對于wm=(j,k)和wm-1=(j',k'),滿足jj'≥0,k-k'≥0。
通過動態(tài)規(guī)劃方法求解最優(yōu)化問題(8),可得到最佳路徑,其累積距離為
其中,γ(1,1)=d(1,1)。最后得到最優(yōu)目標(biāo)函數(shù)為
1.1.5 閾值的確定
確定認(rèn)證模板之后,將注冊時采集的三條信號的X 軸功率譜密度分別運用DTW 算法與認(rèn)證模板進行匹配,得到三個DTW 距離,并求其平均,即
同樣方法得到μy和μz,于是得到閾值為
其中,α 為不小于1 的常數(shù)。α 越接近1,則要求認(rèn)證信號越接近于模板。
認(rèn)證時,用戶持手機做一個靜態(tài)手勢得到認(rèn)證信號,經(jīng)過與注冊階段相同的信號預(yù)處理和特征提取,得到加速度信號在三個軸上的功率譜密度為Srx,Sry,Srz,然后對這三個功率譜密度分別利用上述DTW 算法與模板進行匹配,得到三個DTW 距離,并求得三個距離之和為
最后,將θ 與閾值μ 進行比較,若θ <μ,則認(rèn)證成功;否則,認(rèn)證失敗。μ 較小時,真實用戶認(rèn)證成功率會降低,用戶體驗較差;μ 較大時,非真實用戶認(rèn)證成功率會提高,認(rèn)證安全性低。因此,需選取式(12)中合適的閾值調(diào)節(jié)參數(shù)α,在保證認(rèn)證安全性的同時,提高用戶體驗度。
由于疲勞、疾病、飲酒會使得震顫的幅度加劇,會對認(rèn)證結(jié)果產(chǎn)生影響[10],本文僅討論用戶在正常情況下手臂放松時的認(rèn)證效果。實驗中,總共采集3 000 組數(shù)據(jù),其中包括:5 名實驗者作為真實認(rèn)證用戶,每名實驗者按要求分別做100 組認(rèn)證手勢,共計500 組;由10 名志愿者模仿5 名真實用戶的手勢,模仿每名真實用戶做500 組,共計2 500 組。
本文選取等錯誤率(equal error rate,EER)和半錯誤率(half total error rate,HTER)作為評價認(rèn)證性能的指標(biāo)。EER 為錯誤拒絕率(false rejection rate,F(xiàn)RR)和錯誤接受率(false acceptance rate,F(xiàn)AR)相等時的錯誤率,HTER 為FRR和FAR 的均值,EER 和HTER 越低,則認(rèn)證效果越好。其中,F(xiàn)RR 為真實用戶認(rèn)證信號匹配失敗的比率,F(xiàn)AR 為非真實用戶認(rèn)證信號匹配成功的比率。α 越小FRR 越高,F(xiàn)AR 越低,α 越大則相反,不同的α 值對FRR 和FAR 的影響,如圖1 所示。不用用戶的EER 和最小HTER 如表1 所示。
圖1 不同α 值對FRR 和FAR 的影響Fig 1 Effect of different α value on FAR and FAR
表1 不同用戶的EER 和最小HTERTab 1 EER and minimum HTER of different users
本認(rèn)證方法的平均EER 為5.46%,得到EER 時的α 值在1.60~1.85,最小HTER 為5.18%,均低于10%,說明本方法認(rèn)證效果良好,且優(yōu)于步態(tài)、擊鍵、在線簽名這些基于行為的認(rèn)證方法[12~14],同時在攻擊者觀察到認(rèn)證手勢時的平均認(rèn)證準(zhǔn)確率也高于文獻[15]的動態(tài)手勢識別方法。
本文利用DTW 算法實現(xiàn)了基于人體生理震顫的身份認(rèn)證,算法簡單,且對硬件要求低,適合在智能手機等移動設(shè)備上實現(xiàn)。實驗結(jié)果表明:本方法認(rèn)證效果良好,且有較好的用戶體驗度。
[1] Jain A K.Technology:Biometric recognition[J].Nature,2007,449:38-40.
[2] Fong S,Zhuang Y,F(xiàn)ister I.A biometric authentication model using hand gesture images[J].Biomedical Engineering Online,2013,12(1):111-128.
[3] Aumi M,Kratz S.AirAuth:Towards attack-resilient biometric authentication using in-air gestures[C]∥CHI’14 Extended Abstracts on Human Factors in Computing Systems,ACM,2014:1585-1590.
[4] Surangsrirat D,Intarapanich A,Thanawattano C,et al.Tremor assessment using spiral analysis in time-frequency domain[C]∥2013 Proceedings of IEEE Southeast Con,IEEE,2013:1-6.
[5] Liberty M G,Roller C D,Simpkins D S,et al.Methods and devices for identifying users based on tremor:US,7236156[P].2007—06—26.
[6] Woods A M,Nowostawski M,F(xiàn)ranz E A,et al.Parkinson's disease and essential tremor classification on mobile device[J].Pervasive and Mobile Computing,2013,12(4):1-12.
[7] Jakubowski J,Kwiatos K,Chwaleba A,et al.Higher order statistics and neural network for tremor recognition[J].IEEE Transactions on Biomedical Engineering,2002,49(2):152-159.
[8] 艾玲梅,王 玨.基于雙譜分析和支持向量機的手震顫加速度信號識別[J].電子學(xué)報,2008,36(11):2165-2170.
[9] Albert M V,Kording K P.Determining posture from physiological tremor[J].Experimental Brain Research,2011,215(3/4):247-255.
[10]Timmer J,Lauk M,H?u?ler S,et al.Cross-spectral analysis of tremor time series[J].International Journal of Bifurcation and Chaos,2000,10(11):2595-2610.
[11]韓紀(jì)慶,張 磊,鄭鐵然.語音信號處理[M].北京:清華大學(xué)出版社,2004:46-47.
[12]Terada S,Enomoto Y,Hanawa D,et al.Gait authentication using a wearable sensor[C]∥Defense Science Research Conference and Expo 2011,IEEE,2011:1-3.
[13]Killourhy K,Maxion R.Why did my detector do that[C]∥Recent Advances in Intrusion Detection,Berlin,Heidelberg,Springer,2010:256-276.
[14]Houmani N,Garcia-Salicetti S,Dorizzi B,et al.On-line signature verification on a mobile platform[C]∥The Second International Conference on Mobile Computing,Applications,and Services/International Workshop on Mobile Security,2012:396-400.
[15]Liu J,Zhong L,Wickramasuriya J,et al.User evaluation of lightweight user authentication with a single tri-axis accelerometer[C]∥Proceedings of the 11th International Conference on Human-Computer Interaction with Mobile Devices and Services,ACM,2009:15-25.