王 林,賀冰清
西安理工大學(xué) 自動(dòng)化與信息工程學(xué)院,西安 710048
近年來(lái),人們使用大量的在線網(wǎng)絡(luò)應(yīng)用程序,這些程序包括社交媒體平臺(tái)(如Facebook、Twitter、Weibo)、云存儲(chǔ)服務(wù)(如Drobox、Google Drive)和一些在線網(wǎng)絡(luò)游戲。然而這些網(wǎng)絡(luò)應(yīng)用程序帶來(lái)的網(wǎng)絡(luò)犯罪竟然在不知不覺中蔓延到了世界各地。嚴(yán)重的網(wǎng)絡(luò)犯罪是指一些犯罪分子利用互聯(lián)網(wǎng)侵入受害者的賬戶,盜取包括密碼和金融財(cái)產(chǎn)在內(nèi)的敏感信息。為了解決盜竊問題,人們通過一種額外的生物認(rèn)證機(jī)制進(jìn)入到在線程序或設(shè)備中來(lái)提高用戶賬號(hào)的安全性。在目前的各種計(jì)算機(jī)安全措施中,一種是使用基于口令的傳統(tǒng)身份驗(yàn)證技術(shù),但是口令容易泄漏;另一種是使用一些物理令牌(智能卡等)來(lái)代替簡(jiǎn)單口令,但是該方法要求系統(tǒng)配備相應(yīng)的硬件設(shè)備,使得成本增加,而且也存在物理令牌丟失、竊取、復(fù)制等問題。由于人的生物特征具有不可復(fù)制、難以改變等特性,使得生物特征識(shí)別技術(shù)成為研究熱點(diǎn)。常見的生物特征識(shí)別技術(shù)有指紋識(shí)別技術(shù)、人臉識(shí)別技術(shù)、虹膜識(shí)別技術(shù)等。但上述技術(shù)都需要配備成本較高的硬件設(shè)備,使其應(yīng)用不方便且難以普及。
20世紀(jì)80年代初期,美國(guó)國(guó)家標(biāo)準(zhǔn)局和國(guó)家科學(xué)基金通過研究已經(jīng)證實(shí)了人的擊鍵行為特征能夠被識(shí)別。人與人之間按鍵的力度和節(jié)奏會(huì)有較明顯的差異,在一般情況下可以用來(lái)區(qū)分不同的人,從而對(duì)人的身份進(jìn)行識(shí)別。
擊鍵動(dòng)態(tài)身份認(rèn)證是一種基于擊鍵特性(例如擊鍵時(shí)延、擊鍵力量等)進(jìn)行身份識(shí)別的生物認(rèn)證技術(shù)。該方法通過監(jiān)測(cè)用戶的鍵盤輸入,采集擊鍵數(shù)據(jù),對(duì)用戶的擊鍵行為特征進(jìn)行分類建模,由此來(lái)進(jìn)行用戶身份的判別。擊鍵動(dòng)態(tài)身份認(rèn)證不僅解決了傳統(tǒng)基于口令身份驗(yàn)證的安全性問題,同時(shí)和其他生物識(shí)別技術(shù)相比,不需要額外昂貴的硬件設(shè)備,具有成本低、靈活性高等優(yōu)點(diǎn)。
當(dāng)前研究的擊鍵特征主要分兩類[1]:一是分析固定文本(比如用戶密碼)的擊鍵特征;另一類是分析自由文本的擊鍵特征。下面分別簡(jiǎn)述這兩類的研究現(xiàn)狀:
(1)固定文本。2010年,Harun等人[2]針對(duì)靜態(tài)文本下的Latency特征進(jìn)行了研究,提出了一種人工智能神經(jīng)網(wǎng)絡(luò)的分類算法,并將平均錯(cuò)誤率降低到3%左右。2012年,Li等人[3]提出了一種將統(tǒng)計(jì)和加權(quán)算法相結(jié)合的改進(jìn)算法,使得認(rèn)證的準(zhǔn)確度高于單一的統(tǒng)計(jì)學(xué)算法。2014年,李福祥等人[4]對(duì)面向擊鍵動(dòng)態(tài)身份認(rèn)證的多模板選擇算法進(jìn)行研究,提出均衡概率多模板選擇算法,該算法相比單模板具有一定優(yōu)勢(shì),可將認(rèn)證錯(cuò)誤率控制在合理范圍內(nèi)。2015年,易彬等人[5]在樸素貝葉斯分類理論的背景下,提出一種改進(jìn)的加權(quán)貝葉斯方法;Darabseh等人[6]研究了利用遺傳、粒子群等優(yōu)化算法,從大量的擊鍵特征中提取更有效的特征量,進(jìn)而降低訓(xùn)練和識(shí)別的時(shí)間和計(jì)算量。2016年,Putri等人[7]將擊鍵動(dòng)態(tài)和觸摸手勢(shì)相結(jié)合,提出一種可應(yīng)用于安卓手機(jī)系統(tǒng)的混合認(rèn)證算法。2017年,Alpar等人[8]將時(shí)域上的擊鍵特征量通過短時(shí)間的離散傅里葉變換轉(zhuǎn)移到時(shí)-頻域上,采用高斯-牛頓神經(jīng)網(wǎng)絡(luò)分類器得到了4.1%的相等錯(cuò)誤率;Ho等人[9]利用小批量打包(Mini-Batch Bagging)方法提出一種用于擊鍵認(rèn)證的機(jī)器學(xué)習(xí)改進(jìn)算法;何斯譯等人[10]提出一種擊鍵認(rèn)證的模板雙更新方法,該方法同時(shí)更新模板中的中心點(diǎn)及其容忍半徑,能適應(yīng)用戶在前期擊鍵習(xí)慣變化較大而在后期基本不變的特點(diǎn)。
上述文獻(xiàn)中均采用擊鍵時(shí)間間隔和擊鍵持續(xù)時(shí)間作為特征向量,區(qū)別僅在于采用了不同的認(rèn)證識(shí)別算法。另外,大多數(shù)文獻(xiàn)由于沒有公開性能測(cè)試中所使用的數(shù)據(jù)集,相關(guān)認(rèn)證算法的應(yīng)用范圍可能具有一定程度的局限性。
(2)自由文本。相對(duì)于固定文本,自由輸入的擊鍵特征的分析更困難,識(shí)別率也相對(duì)低一些。自由輸入擊鍵特征的分析方法借鑒了成熟的固定文本的擊鍵特征的分析方法,常用的包括統(tǒng)計(jì)學(xué)方法[11]、神經(jīng)網(wǎng)絡(luò)[12]、決策樹[13]、支持向量機(jī)[14]、加權(quán)相對(duì)距離[15]和相對(duì)熵[16]等。
本文主要研究固定文本的擊鍵認(rèn)證算法。通過對(duì)大量擊鍵認(rèn)證算法文獻(xiàn)的研究可知,大部分的擊鍵認(rèn)證算法均使用由擊鍵時(shí)間間隔和擊鍵持續(xù)時(shí)間構(gòu)成的時(shí)間特征向量,主要研究基于不同原理的識(shí)別算法,而沒有研究如何引入新的特征量以提高認(rèn)證效果。這些認(rèn)證算法僅利用了擊鍵時(shí)間特征向量中所包含的每個(gè)特征值的大小來(lái)進(jìn)行身份識(shí)別,而沒有考慮任意兩個(gè)相鄰特征值之間的變化率。在一些情況下,可能導(dǎo)致認(rèn)證準(zhǔn)確度并不是十分理想。此外,大多數(shù)文獻(xiàn)未使用公開的數(shù)據(jù)集檢驗(yàn)認(rèn)證算法性能,導(dǎo)致相關(guān)算法在應(yīng)用范圍方面具有一定程度的局限性。因此,針對(duì)上述問題,本文提出了一種擊鍵特征曲線差異度的概念,其既與擊鍵時(shí)間特征向量中每個(gè)特征值的大小相關(guān),還能體現(xiàn)出任意兩個(gè)相鄰特征值之間的變化率信息。與此同時(shí),利用已公開的數(shù)據(jù)集進(jìn)行大量實(shí)驗(yàn)以檢驗(yàn)所提算法的性能。
本文將擊鍵特征曲線差異度的思想應(yīng)用于擊鍵動(dòng)態(tài)身份認(rèn)證,提出了一種新穎的基于擊鍵特征曲線差異度的識(shí)別算法。實(shí)驗(yàn)表明,與已經(jīng)廣泛應(yīng)用的傳統(tǒng)認(rèn)證方法相比,本文算法的錯(cuò)誤拒絕率(False Reject Rate,F(xiàn)RR)、錯(cuò)誤接受率(False Accept Rate,F(xiàn)AR)和相等錯(cuò)誤率(Equal Error Rate,EER)更低,識(shí)別準(zhǔn)確度更高,效果更好,即使在訓(xùn)練樣本較少的情況下,依然能取得較好的認(rèn)證效果。
當(dāng)用戶敲擊鍵盤進(jìn)行輸入時(shí),若干特征可以被檢測(cè)到,主要包括擊鍵時(shí)間間隔、擊鍵持續(xù)時(shí)間、總的輸入速度、錯(cuò)誤頻率、使用鍵盤上額外按鍵的習(xí)慣、大寫字母的輸入方式和擊鍵力度(需要使用特殊的鍵盤)等。但是,一般的擊鍵認(rèn)證算法的設(shè)計(jì)并不必采用所有上述特征,其中擊鍵時(shí)間間隔和持續(xù)時(shí)間是最常用的特征量。
擊鍵持續(xù)時(shí)間指某個(gè)按鍵被按下到其彈起的時(shí)間間隔。
擊鍵時(shí)間間隔指從某個(gè)鍵被按下到其緊挨著的下一個(gè)鍵被按下的時(shí)間間隔。
與其他生物認(rèn)證技術(shù)類似,主要有以下指標(biāo)用于評(píng)估擊鍵動(dòng)態(tài)認(rèn)證的性能。
(1)錯(cuò)誤拒絕率(FRR)
合法用戶的登錄請(qǐng)求被當(dāng)作非法用戶(而被拒絕)的比例。錯(cuò)誤拒絕率越高,表明認(rèn)證系統(tǒng)越嚴(yán)格,系統(tǒng)可行性與便利性越低。
(2)錯(cuò)誤接受率(FAR)
非法用戶以合法用戶的身份進(jìn)行登錄的請(qǐng)求被系統(tǒng)接受的比例。錯(cuò)誤接受率越高,表明認(rèn)證系統(tǒng)性能越低,系統(tǒng)被非法用戶攻入的機(jī)會(huì)越大。
(3)相等錯(cuò)誤率(EER)
FAR與FRR隨閾值變化曲線的交點(diǎn)值,該點(diǎn)處FAR與FRR值相等。在算法中,可以通過調(diào)節(jié)來(lái)達(dá)到不同安全強(qiáng)度的參數(shù),叫作閾值。EER可以作為一個(gè)單項(xiàng)性能指標(biāo),因?yàn)樗砻鳟?dāng)FAR和FRR相等時(shí)的誤差量度,EER值越低,代表這個(gè)認(rèn)證或識(shí)別方法的性能越好。
由于傳統(tǒng)的擊鍵認(rèn)證算法通常僅采用擊鍵持續(xù)時(shí)間和擊鍵時(shí)間間隔的大小,導(dǎo)致在一些情況下無(wú)法正確識(shí)別用戶身份。例如,采集用戶A和B輸入相同密碼“tire”時(shí)的擊鍵特征,用戶A某次采集的擊鍵持續(xù)時(shí)間向量為,擊鍵時(shí)間間隔向量為[210,180,230]ms,用戶B某次采集的擊鍵持續(xù)時(shí)間向量為,擊鍵時(shí)間間隔向量為[170,220,190]ms。假設(shè)用戶A和B所有采集樣本的平均擊鍵持續(xù)時(shí)間向量和擊鍵時(shí)間間隔向量相同此時(shí)如果采用經(jīng)典的曼哈頓距離(Manhattan)算法,則無(wú)法正確區(qū)分用戶A和B。
但是,通過分析可知,用戶A和B任意兩個(gè)相鄰特征值之間的變化率是完全相反的。例如,用戶A按鍵“t”和“i”的持續(xù)時(shí)間分別為70 ms和60 ms,其變化率為-10 ms;用戶B按鍵“t”和“i”的持續(xù)時(shí)間分別為60 ms和80 ms,其變化率為20 ms。因此,利用兩個(gè)相鄰特征值之間的變化率,可以很容易地將用戶A和B區(qū)分開來(lái)。
為了將任意兩個(gè)相鄰特征值之間的變化率引入擊鍵認(rèn)證算法中,本文定義了一種擊鍵特征曲線差異度的概念,既包含了常規(guī)的擊鍵特征量,又能體現(xiàn)出任意兩個(gè)相鄰特征值之間的變化率信息?;谏鲜鏊枷耄疚奶岢鲆环N新穎的識(shí)別算法,可以進(jìn)一步提高擊鍵認(rèn)證算法的性能,識(shí)別準(zhǔn)確度更高,效果更好。
對(duì)于具體的某個(gè)用戶,通過預(yù)先多次采集其擊鍵數(shù)據(jù)可以構(gòu)成一個(gè)擊鍵數(shù)據(jù)集,其中的樣本均屬于與該用戶相對(duì)應(yīng)的模式類。
擊鍵數(shù)據(jù)集由兩個(gè)子集組成,分別是輸入密碼時(shí)的擊鍵持續(xù)時(shí)間數(shù)據(jù)集Spr和擊鍵時(shí)間間隔數(shù)據(jù)集Spp。
數(shù)據(jù)集Spr中的任意元素均可用曲線表示,曲線的橫坐標(biāo)為 j,縱坐標(biāo)為j=1,2,…,n ,如圖1(a)所示。同理,數(shù)據(jù)集Spp中的任意元素也可用曲線表示,曲線的橫坐標(biāo)為k,縱坐標(biāo)為k=1,2,…,n-1,如圖1(b)所示。文中將上述曲線稱為擊鍵特征曲線。
圖1 擊鍵特征曲線
根據(jù)每個(gè)數(shù)據(jù)集Spr和Spp中所包含的元素取值,可獲得相應(yīng)的m條擊鍵特征曲線,然后采用統(tǒng)計(jì)學(xué)方法計(jì)算擊鍵特征曲線的上下邊界。
首先,設(shè)集合Spr和Spp中所包含元素的均值分別為,則:
其次,設(shè)集合Spr和Spp中所包含元素的標(biāo)準(zhǔn)差分別為,則:
最后,設(shè)集合Spr中所包含元素的上、下邊界分別為,集合 Spp中所包含元素的上、下邊界分別為,則:
式中,ξ1為可調(diào)節(jié)的閾值,取值范圍為0~3。
注1 ξ1的取值范圍是根據(jù)中心極限定理(即假定采集的擊鍵時(shí)間特征量服從正態(tài)分布)而確定的。ξ1值越大,上、下邊界的范圍越大,樣本處于邊界內(nèi)的概率增加,從而使FRR值減小,F(xiàn)AR值增大;ξ1值越大,上、下邊界的范圍越小,樣本處于邊界內(nèi)的概率減小,進(jìn)而使得FRR值增大,F(xiàn)AR值減小。選取的ξ1值應(yīng)盡可能使EER值達(dá)到最小值,ξ1取值范圍是0~3,一般可選取ξ1=2。
圖2 擊鍵特征曲線上/下邊界
根據(jù)上述擊鍵特征曲線邊界的定義可知,上、下邊界曲線將整個(gè)二維平面劃分為內(nèi)部區(qū)域和外部區(qū)域,如圖3所示。圖3中陰影區(qū)域稱為數(shù)據(jù)集內(nèi)部區(qū)域,其余的非陰影區(qū)域則統(tǒng)稱為外部區(qū)域。
圖3 擊鍵數(shù)據(jù)集區(qū)域劃分示意圖
根據(jù)上述定義可知,如果一個(gè)樣本是某個(gè)數(shù)據(jù)集的外部樣本,在相應(yīng)的外部區(qū)域內(nèi),這個(gè)樣本的特征曲線必定會(huì)與其數(shù)據(jù)集的上邊界或下邊界曲線構(gòu)成若干個(gè)封閉區(qū)域(如圖4中的陰影區(qū)域所示)。所有封閉區(qū)域的總面積越大,表示樣本與此數(shù)據(jù)集的差異越大,樣本不屬于此數(shù)據(jù)集的可能性越大。因此基于上述原理,本文提出一種新穎的特征曲線差異度的概念,其定義如下:
圖4 擊鍵特征曲線差異度物理含義示意圖
式中:
根據(jù)擊鍵特征曲線差異度的定義可知,特征曲線差異度不僅與擊鍵持續(xù)時(shí)間(j=1,2,…,n)和擊鍵時(shí)間間隔相關(guān),還與其任意兩個(gè)相鄰的時(shí)間特征值1,2,…,n-2)之間的變化率相關(guān),主要包括變化方向和幅度。因此,與僅使用擊鍵持續(xù)時(shí)間和擊鍵時(shí)間間隔的傳統(tǒng)擊鍵認(rèn)證算法相比,基于特征曲線差異度的用戶身份認(rèn)證識(shí)別算法性能更好。
基于擊鍵特征曲線差異度的用戶身份認(rèn)證算法步驟如下:
(1)數(shù)據(jù)采集
根據(jù)式(3)和式(4),設(shè) Spr和 Spp為用戶A的擊鍵持續(xù)時(shí)間數(shù)據(jù)集和擊鍵時(shí)間間隔數(shù)據(jù)集,數(shù)據(jù)集的樣本個(gè)數(shù)為m,用戶輸入的密碼長(zhǎng)度為n。
(2)訓(xùn)練過程
步驟1根據(jù)式(5)和式(6)分別計(jì)算數(shù)據(jù)集Spr和Spp中元素的均值 μpr和 μpp。
步驟2根據(jù)式(7)和式(8)分別計(jì)算數(shù)據(jù)集Spr和Spp中元素的標(biāo)準(zhǔn)差σpr和σpp。
步驟3根據(jù)式(9)和式(10)分別計(jì)算數(shù)據(jù)集Spr和Spp中元素的特征曲線上、下邊界和
步驟4根據(jù)式(11)和式(12)分別計(jì)算數(shù)據(jù)集Spr和Spp中每個(gè)元素的特征曲線差異度,并構(gòu)成擊鍵持續(xù)時(shí)間特征曲線差異度集合Qpr、擊鍵時(shí)間間隔特征曲線差異度集合Qpp和總的擊鍵特征曲線差異度集合
步驟5計(jì)算集合Qtotal中元素的均值μD和方差σD:
(3)測(cè)試過程
步驟1根據(jù)式(11)和式(12)分別計(jì)算測(cè)試樣本為和的特征曲線差異度和。
步驟2計(jì)算測(cè)試樣本總的特征曲線差異度Ds:
步驟3根據(jù)下式對(duì)測(cè)試樣本進(jìn)行判定:
式中,ξ2為可調(diào)閾值,取值范圍為ξ2>0。
如果不等式(18)成立,認(rèn)定此測(cè)試樣本屬于用戶A;否則,認(rèn)定此測(cè)試樣本不屬于用戶A。
注2 ξ2是影響FRR和FAR的重要參數(shù),ξ2取值越大,由式(18)可知,測(cè)試樣本被判定為屬于某用戶的可能性越大,因此FRR值越低而FAR值越高。故通常需要根據(jù)算法性能指標(biāo)要求與ξ1的值來(lái)選取合適的ξ2,盡可能使EER值最小。
本文使用的數(shù)據(jù)來(lái)自于卡耐基梅隆大學(xué)Benchmark的數(shù)據(jù)集[9],采用已公開的第三方數(shù)據(jù)對(duì)各個(gè)算法進(jìn)行比較會(huì)更客觀,產(chǎn)生的結(jié)果也更具有可比性。
他們從校園里招募了51名志愿者,覆蓋了學(xué)校里所有專業(yè)的學(xué)生。在記錄擊鍵信息時(shí),所有的參與者都輸入相同的密碼,每一個(gè)志愿者要求輸入400次密碼(共分為8輪,每輪輸入50遍,每輪之間的間隔至少一天)。密碼選定為“.tie5Roanl”,該密碼長(zhǎng)度為10,且包含了大小寫字母、數(shù)字和符號(hào),是一個(gè)強(qiáng)度較高的密碼。
數(shù)據(jù)集中共包含了51名用戶對(duì)同一個(gè)密碼序列(“.tie5Roanl”)的重復(fù)錄入信息,即密碼序列共10位,則包含19個(gè)擊鍵特征信息,其中10個(gè)描述持續(xù)時(shí)間,9個(gè)描述擊鍵時(shí)間間隔。
該數(shù)據(jù)集在采集過程中,每個(gè)用戶的擊鍵信息分8輪采集,每輪之間的間隔至少一天,可能導(dǎo)致所采集的用戶擊鍵信息穩(wěn)定性較差,波動(dòng)幅度較大。因此,本文采用統(tǒng)計(jì)學(xué)的方法對(duì)原始實(shí)驗(yàn)數(shù)據(jù)進(jìn)行預(yù)處理。
步驟1根據(jù)式(5)~式(8),分別計(jì)算每個(gè)用戶的擊鍵數(shù)據(jù)集Spr、Spp中向量元素的均值 μpr、μpp和標(biāo)準(zhǔn)差σpr、σpp。
步驟2對(duì)Spr、Spp中的每個(gè)元素計(jì)算Δpr=如果(j為維度下標(biāo),j=1,2,…,n)或(k為維度下標(biāo),k=1,2,…,n-1),則將元素和從 Spr、Spp中刪除。
步驟3遞歸上述步驟,直至Spr、Spp中的所有元素均滿足且
經(jīng)過實(shí)驗(yàn),認(rèn)證算法的識(shí)別效果相比不進(jìn)行預(yù)處理時(shí)有較顯著的改觀。
首先,在算法訓(xùn)練階段,依次取每個(gè)用戶采樣數(shù)據(jù)集(預(yù)處理后)中前20%、40%、60%和80%的樣本作為訓(xùn)練樣本來(lái)建立該用戶的模板。為便于實(shí)驗(yàn)結(jié)果分析,用變量TP表示上述用戶的訓(xùn)練樣本數(shù)量占總樣本數(shù)量的百分比。
然后,分別取數(shù)據(jù)集中后80%、60%、40%和20%的樣本作為測(cè)試樣本,計(jì)算該用戶的錯(cuò)誤拒絕率FRR。
接下來(lái),使用其他50個(gè)用戶的全部采樣樣本(預(yù)處理后)作為攻擊密碼,計(jì)算該用戶的錯(cuò)誤接受率FAR。
上述過程會(huì)循環(huán)下去,直至51個(gè)用戶的FRR和FAR全部計(jì)算出來(lái)。最后,取所有用戶FRR和FAR的平均值作為身份認(rèn)證算法的性能指標(biāo)。
由于算法性能受閾值ξ1和ξ2的影響,首先實(shí)驗(yàn)分析閾值ξ1和ξ2對(duì)FRR和FAR的影響規(guī)律,為閾值ξ1和ξ2的設(shè)置提供參考依據(jù)。當(dāng)ξ2≡1時(shí),F(xiàn)RR和FAR隨ξ1的變化曲線如圖5(a)所示;當(dāng) ξ1≡1時(shí),F(xiàn)RR和FAR隨ξ2的變化曲線如圖5(b)所示。由此可知,F(xiàn)RR隨 ξ1和ξ2的增大而減小,F(xiàn)AR隨ξ1和ξ2的增大而增大,應(yīng)設(shè)置合適的閾值ξ1和ξ2使得EER達(dá)到最小值。
圖5 閾值ξ1和ξ2對(duì)FRR和FAR的影響
為驗(yàn)證算法的性能,將本文提出的基于擊鍵特征曲線差異度的用戶身份認(rèn)證算法與Manhattan距離算法[17]、Manhattan(scaled)算法[17]和統(tǒng)計(jì)學(xué)算法(Statistics)[3]、神經(jīng)網(wǎng)絡(luò)算法(Neural networks)[8]和機(jī)器學(xué)習(xí)算法(Machine learning)[9]進(jìn)行對(duì)比。上述5種比對(duì)算法是目前在擊鍵動(dòng)力學(xué)中廣泛應(yīng)用且認(rèn)證效果較好的方法。
實(shí)驗(yàn)得到了用戶訓(xùn)練樣本數(shù)量占總樣本數(shù)量的比例(TP)分別為20%、40%、60%和80%情況下,各種算法的錯(cuò)誤拒絕率(FRR)、錯(cuò)誤接受率(FAR)和相等錯(cuò)誤率(EER)。
通過分析表1~表4中的實(shí)驗(yàn)結(jié)果可知,在TP取值不同的情況下,本文提出的基于擊鍵特征曲線差異度的認(rèn)證算法的相等錯(cuò)誤率(EER)分別為12.01%、7.88%、7.09%和5.81%,均顯著優(yōu)于其他5種比對(duì)算法,識(shí)別準(zhǔn)確度高,對(duì)擊鍵序列的認(rèn)證效果更理想。
表1 TP為20%時(shí)算法性能指標(biāo)
表2 TP為40%時(shí)算法性能指標(biāo)
表3 TP為60%時(shí)算法性能指標(biāo)
表4 TP為80%時(shí)算法性能指標(biāo)
由圖6可知,隨著訓(xùn)練樣本數(shù)量(TP)的增加,各算法的相等錯(cuò)誤率(EER)均逐漸減小。但是,與其他5種算法相比,本文算法的EER隨TP的收斂速度快。神經(jīng)網(wǎng)絡(luò)算法和機(jī)器學(xué)習(xí)算法在訓(xùn)練樣本較小的情況下,性能與本文算法存在一定的差距,僅在訓(xùn)練樣本足夠多的情況下,性能指標(biāo)才與本文算法接近。例如,在TP為20%時(shí),本文算法的EER為12.01%,顯著優(yōu)于Manhattan算法的 29.32%、Manhattan(scaled)算法的 18.60%、Statistics算法的17.60%、神經(jīng)網(wǎng)絡(luò)算法的17.12%和機(jī)器學(xué)習(xí)算法的14.97%。這說(shuō)明,即使在訓(xùn)練樣本較少的情況下,本文算法依然能取得較好的認(rèn)證效果。
圖6 各算法的EER指標(biāo)隨TP的變化曲線
因此,上述實(shí)驗(yàn)結(jié)果表明,本文提出的采用擊鍵特征曲線差異度的認(rèn)證算法比目前應(yīng)用的傳統(tǒng)算法的識(shí)別準(zhǔn)確度更高,性能更好。
本文提出了一種新穎的基于擊鍵特征曲線差異度的用戶身份認(rèn)證方法。相對(duì)于傳統(tǒng)的認(rèn)證算法,本文算法不僅使用了常規(guī)的擊鍵時(shí)間特征量,例如擊鍵持續(xù)時(shí)間和擊鍵時(shí)間間隔,而且引入了任意兩個(gè)相鄰時(shí)間特征值之間的變化率,并給出了擊鍵特征曲線差異度的概念和相關(guān)的認(rèn)證算法。通過實(shí)驗(yàn)對(duì)比,相比于傳統(tǒng)算法,采用擊鍵特征曲線差異度的認(rèn)證算法的錯(cuò)誤拒絕率(FRR)、錯(cuò)誤接受率(FAR)和相等錯(cuò)誤率(EER)更低,即使在訓(xùn)練樣本較少的情況下,依然能取得較好的識(shí)別效果,在一定程度上反映出本文算法的有效性和優(yōu)越性。