摘 要:旨在探討光電容積脈搏波(photoplethysmography,PPG)信號(hào)的動(dòng)力學(xué)特征對(duì)身份識(shí)別系統(tǒng)準(zhǔn)確率的影響,并提出一種新的身份認(rèn)證方法,以填補(bǔ)該領(lǐng)域?qū)γ}搏波信號(hào)動(dòng)力學(xué)特征研究的空白。通過對(duì)脈搏波信號(hào)進(jìn)行非線性混沌特性分析,重構(gòu)其動(dòng)力學(xué)系統(tǒng)的等價(jià)拓?fù)淇臻g,并結(jié)合相空間重構(gòu)技術(shù)與長短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM)模型,構(gòu)建脈搏波信號(hào)的建模、預(yù)測(cè)和身份認(rèn)證框架。成功實(shí)現(xiàn)了基于PPG信號(hào)的身份認(rèn)證,對(duì)采集數(shù)據(jù)和公開數(shù)據(jù)集進(jìn)行分析,評(píng)估了所提方法的性能和泛化能力,結(jié)果表明該方法在身份識(shí)別準(zhǔn)確率上優(yōu)于既有方法。最后,證明了PPG信號(hào)的動(dòng)力學(xué)特征在身份識(shí)別中的重要性,并展示了結(jié)合相空間重構(gòu)和LSTM模型的有效性,進(jìn)一步探討了遠(yuǎn)程光電容積脈搏波描記法(remote photoplethysmography,rPPG)作為生物識(shí)別特征的應(yīng)用潛力。
關(guān)鍵詞:脈搏波;身份識(shí)別;特征提??;深度學(xué)習(xí);相空間重構(gòu)
中圖分類號(hào):TU"" 文獻(xiàn)標(biāo)志碼:A""" 文章編號(hào):1001-3695(2025)03-026-0840-09
doi: 10.19734/j.issn.1001-3695.2024.08.0307
Construction of identity authentication system based on phase spacereconstruction of pulse wave signals and time series prediction
Fu Youping1, Zhang Hang2, Li Menghan2, Meng Jun2
(1.School of Computer amp; Information Technology, Zhejiang Changzheng Vocational amp; Technical College, Hangzhou 310023, China; 2. College of Electrical Engineer, Zhejiang University, Hangzhou 310058, China)
Abstract:This paper investigated the influence of the dynamic characteristics of PPG signals on the accuracy of identity recognition systems, and proposed a new identity authentication method to fill the gap in the study of dynamic characteristics of pulse wave signals in this field. By analyzing the nonlinear chaotic characteristics of the pulse wave signal, it reconstructed the equivalent topological space of the dynamic system, and constructed the modeling, prediction and identity authentication framework of the pulse wave signal by combining the phase space reconstruction technology and LSTM model. In this study, the identity authentication based on PPG signal was successfully realized, the collected data and public datasets were analyzed, and the performance and generalization ability of the proposed method were evaluated. And the results show that the proposed method is better than the existing methods in terms of identity recognition accuracy. Finally, this study proved the importance of the kinetic features of PPG signals in identity recognition, and demonstrated the effectiveness of combining phase space reconstruction and LSTM models, and further explored the application potential of rPPG as a biometric feature.
Key words:pulse wave; identity recognition; feature extraction; deep learning; phase-space reconstruction
0 引言
近年來,隨著互聯(lián)網(wǎng)和移動(dòng)設(shè)備的普及,身份盜竊風(fēng)險(xiǎn)持續(xù)上升。身份識(shí)別技術(shù)作為保護(hù)個(gè)人信息安全和防止身份盜竊的重要手段備受關(guān)注。人們對(duì)其便利性、安全性和實(shí)用性提出了新的更高要求。生物識(shí)別技術(shù)是指利用個(gè)人生理特征和行為特征進(jìn)行身份識(shí)別的技術(shù)。相較于傳統(tǒng)方法,生物識(shí)別技術(shù)[1]具備更高的便利性和安全性。用戶無須記憶冗長易受攻擊的密碼,同時(shí)生物特征具有“隨身攜帶”的特點(diǎn),避免了易丟失和易被盜取等問題。
近年來,生物識(shí)別技術(shù)逐漸成為研究熱點(diǎn)。當(dāng)前,受到廣泛關(guān)注的生物識(shí)別特征包括指紋、人臉、聲紋、虹膜、DNA、靜脈、掌紋、步態(tài)等?;诠怆娙莘e脈搏波(photoplethysmography, PPG)的生物識(shí)別技術(shù)是新興的研究方向之一。相較于其他生物特征,脈搏波具有活體檢測(cè)、安全性、低成本和便利性等獨(dú)特優(yōu)勢(shì)。此外,脈搏波的活體檢測(cè)特性有助于與其他穩(wěn)健的生物識(shí)別特征融合,構(gòu)建一個(gè)抗偽造攻擊的生物識(shí)別系統(tǒng)[2, 3]。
目前,基于脈搏波的生物識(shí)別技術(shù)的研究仍處于初步階段,但脈搏波所具備的活體檢測(cè)、安全性、低成本、便利性等優(yōu)點(diǎn)使其成為極具發(fā)展前景的生物識(shí)別特征之一。2003年,文獻(xiàn)[4]首次提出了基于PPG信號(hào)的生物識(shí)別方法,為該領(lǐng)域的創(chuàng)新作出了重要貢獻(xiàn)。此后,國內(nèi)外研究人員對(duì)此進(jìn)行了廣泛的探索和研究,并取得了一定的成果。
PPG信號(hào)的導(dǎo)數(shù)蘊(yùn)涵豐富的特征,可用于生物識(shí)別。例如,Kavsaolu等人[5]從PPG信號(hào)及其一階、二階導(dǎo)數(shù)中提取了40個(gè)時(shí)域特征,并提出了一種特征排序算法對(duì)其進(jìn)行排序,最終實(shí)現(xiàn)了94.4%的準(zhǔn)確率;Jaafar等人[6]驗(yàn)證了加速度體積描記信號(hào)(APG)在生物識(shí)別系統(tǒng)中的穩(wěn)健性和可靠性。
基于PPG信號(hào)的特征點(diǎn),可以提取各特征點(diǎn)的峰值、時(shí)間間隔、斜率等時(shí)域特征,從而制定特征向量模板。Lee等人[7]從單周期PPG信號(hào)中提取了22個(gè)時(shí)域特征參數(shù),包括面積、角度、拐點(diǎn)數(shù)據(jù)等,并采用前饋神經(jīng)網(wǎng)絡(luò)(feedforward neural network,F(xiàn)NN)來完成對(duì)個(gè)體身份的識(shí)別。該方法的個(gè)人識(shí)別錯(cuò)誤接受率為4.2%,錯(cuò)誤拒絕率為3.7%。
根據(jù)PPG信號(hào)的整體形態(tài),通常采用時(shí)間或頻率分析來獲取統(tǒng)計(jì)特征,以從PPG波形中提取鑒別性信息。在2017年,Karimian等人[8]研究了PPG生物識(shí)別的非基準(zhǔn)特征提取方法。該方法對(duì)單周期PPG信號(hào)進(jìn)行離散小波變換,將小波變換系數(shù)作為特征向量,然后分別使用有監(jiān)督機(jī)器學(xué)習(xí)和無監(jiān)督機(jī)器學(xué)習(xí)進(jìn)行分類。實(shí)驗(yàn)結(jié)果顯示,有監(jiān)督機(jī)器學(xué)習(xí)和無監(jiān)督機(jī)器學(xué)習(xí)的分類準(zhǔn)確率分別達(dá)到了99.75%和99.84%。
此外,由于深度學(xué)習(xí)的泛化性,使得其在幾乎所有圖像處理相關(guān)的領(lǐng)域均有良好的應(yīng)用與較高的準(zhǔn)確性,如文獻(xiàn)[9,10]使用輕量級(jí)的MobileViT以及MobileRaT網(wǎng)絡(luò)在實(shí)時(shí)星座圖像分類應(yīng)用場(chǎng)景下得到了良好的準(zhǔn)確率。
因此一些研究將PPG信號(hào)特征與深度學(xué)習(xí)結(jié)合用于身份識(shí)別。Jeon等人[11]提出了一種新的方法,稱為多層嵌套遞歸圖(MsNRP),使用有噪聲的PPG信號(hào)進(jìn)行人識(shí)別。MsNRP展示了對(duì)噪聲的魯棒性,從而為實(shí)際場(chǎng)景中的識(shí)別提供了可靠的解決方案。Lee等人[12]提出了一種基于長短期記憶(LSTM)和卷積神經(jīng)網(wǎng)絡(luò)(CNN)的集成身份識(shí)別技術(shù)。在預(yù)處理步驟中使用濾波器來去除該噪聲,并且從原始信號(hào)中提取時(shí)域特征作為LSTM的輸入,獲得了一定程度上的身份識(shí)別性能提升。
隨著非接觸式遠(yuǎn)程光電容積脈搏波(remote photoplethysmography, rPPG)技術(shù)的不斷發(fā)展,非接觸采集的rPPG信號(hào)也逐漸被用于身份識(shí)別。在2024年,Wu等人[13]將rPPG與CNN網(wǎng)絡(luò)結(jié)合,用于滿足物聯(lián)網(wǎng)設(shè)備對(duì)身份識(shí)別的要求。該研究不僅提高了復(fù)雜環(huán)境中的識(shí)別精度,還增強(qiáng)了系統(tǒng)對(duì)環(huán)境變化的適應(yīng)性。新方法為物聯(lián)網(wǎng)認(rèn)證技術(shù)的進(jìn)步提供了新的解決方案。
綜上所述,基于脈搏波的身份識(shí)別研究已經(jīng)取得了一定的進(jìn)展。然而,現(xiàn)有研究在特征提取方面往往忽略了對(duì)脈搏波信號(hào)動(dòng)力學(xué)特征的挖掘,多數(shù)僅在時(shí)域或頻域中進(jìn)行特征提取,而忽略了生理系統(tǒng)表現(xiàn)出的非線性和混沌性。而生理系統(tǒng)表現(xiàn)出來的非線性特征對(duì)身份識(shí)別的重要作用體現(xiàn)在以下幾點(diǎn):
a)提升識(shí)別系統(tǒng)的魯棒性。傳統(tǒng)基于時(shí)域或頻域特征的PPG識(shí)別方法容易受到噪聲、個(gè)體差異和生理變化的影響,導(dǎo)致識(shí)別準(zhǔn)確率下降。而PPG信號(hào)的非線性特征可以提供更加穩(wěn)定和魯棒的識(shí)別信息,因?yàn)樗鼈兡軌蚍从砅PG信號(hào)中更加深層的動(dòng)態(tài)特性和復(fù)雜模式,不受簡(jiǎn)單噪聲或生理變化的影響。非線性特征可以捕捉到PPG信號(hào)中隱藏的個(gè)體差異,這些差異在傳統(tǒng)的線性特征中可能無法體現(xiàn)。這使得識(shí)別系統(tǒng)能夠更好地區(qū)分不同個(gè)體,提高識(shí)別準(zhǔn)確率。
b)提高識(shí)別系統(tǒng)的準(zhǔn)確性。非線性特征可以提供更加細(xì)致的個(gè)體差異信息,提高識(shí)別系統(tǒng)的區(qū)分能力,從而提升識(shí)別系統(tǒng)的準(zhǔn)確率。通過分析非線性特征,可以發(fā)現(xiàn)PPG信號(hào)中與個(gè)體身份相關(guān)的特殊模式,例如心率變異性、脈搏波傳播時(shí)間等,這些模式在傳統(tǒng)的線性特征中可能難以識(shí)別。
c)增強(qiáng)識(shí)別系統(tǒng)的泛化能力。非線性特征能夠捕捉PPG信號(hào)中的復(fù)雜關(guān)系,使得識(shí)別系統(tǒng)能夠更好地適應(yīng)不同環(huán)境、不同個(gè)體以及不同測(cè)量條件,從而增強(qiáng)識(shí)別系統(tǒng)的泛化能力。由于非線性特征的魯棒性,基于非線性特征的PPG身份識(shí)別系統(tǒng)可以更好地應(yīng)對(duì)現(xiàn)實(shí)環(huán)境中存在的各種干擾,例如噪聲、運(yùn)動(dòng)、溫度變化等。
為此,本文提出了一種新的脈搏波信號(hào)建模、預(yù)測(cè)和身份認(rèn)證方法,創(chuàng)新性地結(jié)合了相空間重構(gòu)和LSTM模型。該方法利用預(yù)測(cè)精度來決定身份認(rèn)證結(jié)果,為脈搏波身份認(rèn)證提供了新的思路。具體來說,首先提取脈搏波信號(hào),然后對(duì)其進(jìn)行混沌識(shí)別,接著構(gòu)建時(shí)間序列預(yù)測(cè)模型。最后,基于所提模型分別對(duì)PPG和rPPG信號(hào)進(jìn)行身份認(rèn)證。
1 系統(tǒng)總體設(shè)計(jì)方案
研究表明,一些生理系統(tǒng)可以表現(xiàn)出非線性和混沌的特性[14]。例如,心臟系統(tǒng)是一個(gè)非線性的復(fù)雜系統(tǒng),而脈搏波信號(hào)則是經(jīng)由心臟搏動(dòng)和血管微循環(huán)產(chǎn)生,因此具有非線性和非平穩(wěn)的特征。此外,研究表明,探究PPG信號(hào)的非線性特征有助于提高PPG身份識(shí)別系統(tǒng)的準(zhǔn)確率。因此,深入研究脈搏波信號(hào)的非線性特性具有重要意義。
非線性時(shí)間序列中的一些非線性動(dòng)態(tài)特征被隱藏在相空間中。相空間重構(gòu)是分析非線性時(shí)間序列常用的方法之一,它可以將序列重新構(gòu)建為高維相空間,以挖掘信號(hào)中所包含的非線性動(dòng)態(tài)特征,并重構(gòu)其內(nèi)在動(dòng)力學(xué)系統(tǒng)的等價(jià)拓?fù)浣Y(jié)構(gòu)。
此外,脈搏波的獨(dú)特性意味著其等價(jià)動(dòng)力學(xué)吸引子具有一致性。因此,其背后確定性下的吸引子軌跡具有短期可預(yù)測(cè)性。換句話說,可以通過重構(gòu)等價(jià)動(dòng)力學(xué)吸引子的短期預(yù)測(cè)性精度來進(jìn)行個(gè)體身份認(rèn)證。
基于以上分析,本文提出了一個(gè)基于脈搏波相空間重構(gòu)預(yù)測(cè)的身份認(rèn)證系統(tǒng)。該系統(tǒng)首先對(duì)脈搏波進(jìn)行相空間重構(gòu),然后利用重構(gòu)序列對(duì)脈搏波進(jìn)行預(yù)測(cè),并基于預(yù)測(cè)結(jié)果進(jìn)行身份認(rèn)證。系統(tǒng)包括注冊(cè)階段和認(rèn)證階段兩個(gè)主要階段,其基本框架如圖1所示。
在注冊(cè)階段,注冊(cè)用戶首先輸入注冊(cè)ID。隨后,系統(tǒng)采集注冊(cè)用戶的脈搏波信號(hào),并對(duì)其進(jìn)行預(yù)處理和相空間重構(gòu)。相空間重構(gòu)的結(jié)果包括嵌入維數(shù)和時(shí)延,被存儲(chǔ)到數(shù)據(jù)庫中,并與注冊(cè)ID關(guān)聯(lián)。接著,系統(tǒng)將重構(gòu)的脈搏波數(shù)據(jù)輸入LSTM時(shí)間序列預(yù)測(cè)模型進(jìn)行訓(xùn)練,將訓(xùn)練得到的時(shí)間序列預(yù)測(cè)模型同樣存儲(chǔ)到數(shù)據(jù)庫中,并與注冊(cè)ID關(guān)聯(lián)。這樣,每個(gè)主體都擁有一個(gè)個(gè)性化的預(yù)測(cè)模型。
在認(rèn)證階段,用戶首先輸入要認(rèn)證的ID。系統(tǒng)隨后會(huì)收集認(rèn)證用戶的脈搏波信號(hào),并從數(shù)據(jù)庫中提取與認(rèn)證ID相關(guān)聯(lián)的嵌入維度和時(shí)延信息,對(duì)采集的脈搏波信號(hào)進(jìn)行相空間重構(gòu)。接著,系統(tǒng)從數(shù)據(jù)庫中檢索與認(rèn)證ID相關(guān)聯(lián)的預(yù)測(cè)模型,并將重構(gòu)后的脈搏波數(shù)據(jù)輸入到預(yù)測(cè)模型中進(jìn)行預(yù)測(cè)。最終,根據(jù)預(yù)測(cè)準(zhǔn)確度來確定身份認(rèn)證結(jié)果。
本文采用一種新的脈搏波信號(hào)身份認(rèn)證方法,對(duì)脈搏波信號(hào)進(jìn)行相空間重構(gòu)、預(yù)測(cè)和身份認(rèn)證。與傳統(tǒng)方法不同的是,該方法無須事先建立主觀模型,而是通過挖掘信號(hào)中的非線性動(dòng)態(tài)特征,并根據(jù)其內(nèi)在動(dòng)力學(xué)系統(tǒng)的等價(jià)拓?fù)淇臻g進(jìn)行建模預(yù)測(cè),從而實(shí)現(xiàn)身份認(rèn)證。這種方法能夠有效地避免模型的主觀性,提高身份認(rèn)證的準(zhǔn)確性和可信度。
值得注意的是,本文所引入非線性特征的脈搏波身份識(shí)別系統(tǒng)能夠應(yīng)用在以下領(lǐng)域,并可以根據(jù)具體實(shí)際需求進(jìn)行系統(tǒng)的微調(diào):a)安全領(lǐng)域,門禁系統(tǒng)、移動(dòng)支付、網(wǎng)絡(luò)安全。b)醫(yī)療領(lǐng)域,病人識(shí)別、醫(yī)療設(shè)備控制、遠(yuǎn)程醫(yī)療。c)金融領(lǐng)域,金融交易、ATM機(jī)識(shí)別、網(wǎng)上銀行。
2 相空間重構(gòu)原理
對(duì)于非線性時(shí)間序列,相位吸引子可以重構(gòu)為新的吸引子,重構(gòu)的新吸引子子系統(tǒng)具有與原系統(tǒng)相同的動(dòng)態(tài)特性。1980年,物理學(xué)家Packard提出了相空間重構(gòu)理論用于分析混沌時(shí)間序列?;诖?,Takens于1981年提出了嵌入定理[15]:對(duì)于無限長、無噪聲的d′維混沌吸引子的一維標(biāo)量時(shí)間序列{xi,i=1,2,…,n},都可以在拓?fù)洳蛔兊囊饬x下找到一個(gè)d維的嵌入相空間,其中,d≥2d′+1。
設(shè)原始一維序列為X[x1,x2,…,xn],對(duì)原始序列進(jìn)行相空間重構(gòu)得到新的m維序列:
根據(jù)Takens嵌入定理,τ延遲時(shí)間和嵌入維數(shù)m是相空間重構(gòu)的兩個(gè)關(guān)鍵參數(shù)。在計(jì)算延遲時(shí)間和嵌入維數(shù)時(shí),有兩種主要觀點(diǎn)。一種觀點(diǎn)認(rèn)為可以先確定延遲時(shí)間,然后基于延遲時(shí)間確定嵌入維數(shù);而另一種觀點(diǎn)認(rèn)為延遲時(shí)間和嵌入維數(shù)之間存在相關(guān)性。針對(duì)第一種觀點(diǎn),常見的延遲時(shí)間計(jì)算方法包括自相關(guān)法、平均位移法、復(fù)相關(guān)法和互信息法;而嵌入維數(shù)的計(jì)算方法則包括幾何不變法、虛假最鄰近法(1 nearest neighbors,F(xiàn)NN)和改進(jìn)的Cao氏法。本文采用互信息法確定延遲時(shí)間τ,并采用虛假最鄰近法確定嵌入維數(shù)m。
針對(duì)延遲時(shí)間τ的選擇,若選擇太小,則相空間中的兩個(gè)序列將在數(shù)值上非常接近,難以區(qū)分,導(dǎo)致無法提供獨(dú)立的坐標(biāo)分量;而若選擇太大,則兩個(gè)序列將完全獨(dú)立,混沌吸引子軌跡在兩個(gè)方向上的投影將失去相關(guān)性。因此,需要一種適當(dāng)?shù)姆椒▉泶_定合適的延遲時(shí)間。采用互信息法確定延遲時(shí)間τ的過程如下:
a)設(shè)有兩個(gè)離散信息系統(tǒng)S{s1,s2,…,sm},Q{q1,q2,…,qn},它們的信息熵分別為
e)互信息曲線I(τ)=I(S,Q)的第一個(gè)極小值代表了x(i)和x(i+1)最大可能不相關(guān),該點(diǎn)所對(duì)應(yīng)的τ即為所求的延遲時(shí)間。
在確定嵌入維數(shù)m時(shí),通常通過計(jì)算吸引子的某些幾何不變量來進(jìn)行實(shí)際計(jì)算。在確定了一個(gè)合適的延遲時(shí)間后,逐步增加嵌入維數(shù)m,直到這些幾何不變量不再發(fā)生變化為止。本文采用虛假最鄰近點(diǎn)法計(jì)算嵌入維數(shù)m,過程如下:
a)對(duì)于相空間重構(gòu)后的每一個(gè)序列xi,都有一個(gè)最鄰近點(diǎn)xj,兩者之間的歐幾里德距離表示為
c)從m=2開始,隨著m逐漸增加,計(jì)算虛假臨近點(diǎn)的比例。當(dāng)比例小于5%,或者隨著m的增加,虛假臨近點(diǎn)的個(gè)數(shù)不再減少時(shí),認(rèn)為整個(gè)運(yùn)動(dòng)軌跡已經(jīng)恢復(fù),此時(shí)的m即為嵌入維數(shù)。
3 脈搏波信號(hào)混沌時(shí)間序列的判定
根據(jù)研究表明,進(jìn)行混沌預(yù)測(cè)的前提是先確定時(shí)間序列是否是混沌序列,即進(jìn)行混沌識(shí)別。研究指出,如果時(shí)間序列具有飽和關(guān)聯(lián)維數(shù),則可以判定該序列為混沌時(shí)間序列。
分形是非線性動(dòng)力學(xué)的一個(gè)重要分支,用于反映事物本身固有的結(jié)構(gòu)特征[16]。關(guān)聯(lián)維數(shù)是分形維數(shù)的一種,能夠定量評(píng)估信號(hào)的復(fù)雜程度。在1982年,Grassberger等人[17]基于相空間重構(gòu)理論和“嵌入定理”,提出了G.P算法,用于計(jì)算一維序列的關(guān)聯(lián)維數(shù)。
本文采用G.P算法來計(jì)算脈搏波信號(hào)(PPG信號(hào))的關(guān)聯(lián)維數(shù),具體過程如下:
a)相空間重構(gòu)。設(shè)原始一維序列為X[x1,x2,…,xn],對(duì)原始序列進(jìn)行相空間重構(gòu)得到新的m維序列,如式(1)。
b)計(jì)算關(guān)聯(lián)積分C(r):
本文采用互信息法計(jì)算PPG信號(hào)的延遲時(shí)間τ,并選取嵌入維數(shù)為2~10進(jìn)行關(guān)聯(lián)維數(shù)分析,結(jié)果如圖2所示。圖2中l(wèi)nC(r)-lnr直線段的斜率即為關(guān)聯(lián)維數(shù)。觀察圖2可以看出,隨著嵌入維數(shù)m的增加,關(guān)聯(lián)維數(shù)也不斷增加。當(dāng)嵌入維數(shù)m增至7時(shí),關(guān)聯(lián)維數(shù)DR趨于飽和,這表明PPG信號(hào)具有飽和關(guān)聯(lián)維數(shù),并且滿足混沌時(shí)間序列的判定。
4 時(shí)間序列預(yù)測(cè)模型的構(gòu)建
基于身份認(rèn)證的目標(biāo),每個(gè)主體在注冊(cè)時(shí)都會(huì)訓(xùn)練一個(gè)個(gè)性化的時(shí)間序列預(yù)測(cè)模型。在認(rèn)證時(shí),系統(tǒng)從數(shù)據(jù)庫中提取出認(rèn)證對(duì)象的嵌入維度m和延遲時(shí)間τ,然后對(duì)采集到的脈搏波信號(hào)進(jìn)行相空間重構(gòu)。接下來,將重構(gòu)后的序列輸入到數(shù)據(jù)庫中提取出的認(rèn)證對(duì)象的時(shí)間序列預(yù)測(cè)模型中。最后,根據(jù)預(yù)測(cè)精度來決定認(rèn)證結(jié)果。
決策標(biāo)準(zhǔn)為:若個(gè)性化模型對(duì)脈搏波信號(hào)的預(yù)測(cè)均方根誤差(RMSE)不超過預(yù)先設(shè)定的閾值,則認(rèn)證結(jié)果為“接受”;反之,認(rèn)證結(jié)果為“拒絕”。因此,時(shí)間序列預(yù)測(cè)模型在預(yù)測(cè)所屬主體的脈搏波信號(hào)時(shí),應(yīng)使RMSE盡可能小,而對(duì)其他主體脈搏波信號(hào)的預(yù)測(cè)誤差較大。
本文采用LSTM模型作為時(shí)間序列預(yù)測(cè)模型。在模型輸入方面,LSTM模型的輸入維度等同于相空間重構(gòu)的嵌入維數(shù)。
對(duì)于單步預(yù)測(cè),模型的訓(xùn)練集{X,Y}為
即模型可以預(yù)測(cè)未來的τ個(gè)數(shù)據(jù)點(diǎn)。
在模型構(gòu)建方面,設(shè)計(jì)的時(shí)間序列模型由三個(gè)LSTM層組成,結(jié)構(gòu)如圖3所示。在第一層LSTM層之后,引入了dropout層,然后連接了兩層LSTM層,并最終通過一層全連接層輸出預(yù)測(cè)結(jié)果。三個(gè)LSTM層的節(jié)點(diǎn)個(gè)數(shù)分別為128、64和32。dropout層的丟棄概率設(shè)置為0.5。
5 身份認(rèn)證實(shí)驗(yàn)與分析
5.1 基于PPG信號(hào)的身份認(rèn)證
本文利用華科HKG-07C紅外脈搏傳感器分別獲取了四個(gè)主體的PPG數(shù)據(jù),每組數(shù)據(jù)采樣時(shí)長為50 s,采樣頻率為125 Hz,總共包含6 250個(gè)采樣點(diǎn)。為了進(jìn)行用戶注冊(cè),本文從每組數(shù)據(jù)中提取了前40 s的數(shù)據(jù)。注冊(cè)過程包括相空間重構(gòu),其中包括延遲時(shí)間和嵌入維度的計(jì)算,以及時(shí)間序列預(yù)測(cè)模型的訓(xùn)練。對(duì)于身份認(rèn)證,本文則使用每組數(shù)據(jù)后10 s的數(shù)據(jù)。認(rèn)證過程同樣包括相空間重構(gòu),基于認(rèn)證用戶在數(shù)據(jù)庫中存儲(chǔ)的延遲時(shí)間和嵌入維度進(jìn)行預(yù)測(cè)。本文根據(jù)預(yù)測(cè)的均方根誤差(RMSE)來決定身份認(rèn)證結(jié)果,以評(píng)估本文提出的身份認(rèn)證方法的性能。
為了方便區(qū)分,本文將四個(gè)主體分別標(biāo)記為A、B、C、D;將它們的PPG信號(hào)分別標(biāo)記為PPG_A、PPG_B、PPG_C、PPG_D;而它們的時(shí)間序列預(yù)測(cè)模型分別標(biāo)記為modelA、modelB、modelC、modelD。
5.1.1 相空間重構(gòu)結(jié)果與分析
正如前文所述,本文使用互信息法來確定PPG信號(hào)的延遲時(shí)間,并采用虛假臨近點(diǎn)法來確定PPG信號(hào)的嵌入維度。針對(duì)四個(gè)主體的PPG信號(hào),本文分別應(yīng)用這兩種方法來確定延遲時(shí)間和嵌入維度。記主體A的延遲時(shí)間為τA,嵌入維度為mA;主體B的延遲時(shí)間為τB,嵌入維度為mB;主體C的延遲時(shí)間為τC,嵌入維度為mC;主體D的延遲時(shí)間為τD,嵌入維度為mD,結(jié)果如圖4所示。
基于上述延遲時(shí)間和嵌入維度,本文對(duì)各主體的PPG信號(hào)進(jìn)行相空間重構(gòu),并將其投影到二維平面上,結(jié)果如圖5所示。
可以觀察到,不同主體的PPG信號(hào)在相空間重構(gòu)后的軌跡明顯不同。這是因?yàn)镻PG信號(hào)的動(dòng)力學(xué)系統(tǒng)與個(gè)體的心臟系統(tǒng)和血液微循環(huán)系統(tǒng)密切相關(guān),所以在不同受試者之間存在明顯差異。這表明,通過相空間重構(gòu)可以揭示出其內(nèi)在動(dòng)力學(xué)系統(tǒng)的等價(jià)拓?fù)浣Y(jié)構(gòu)。
5.1.2 時(shí)間序列預(yù)測(cè)模型結(jié)果與分析
本文針對(duì)四個(gè)主體各自訓(xùn)練了一個(gè)時(shí)間序列預(yù)測(cè)模型,分別標(biāo)記為modelA、modelB、modelC、modelD。以下以modelA的訓(xùn)練為例進(jìn)行說明:
主體A用于訓(xùn)練的PPG數(shù)據(jù)為40 s,共5 000個(gè)采樣點(diǎn)。根據(jù)上節(jié)相空間重構(gòu)的結(jié)果τA=13,mA=5,則重構(gòu)的相空間大小為5×4 948。將其作為LSTM模型的輸入,模型訓(xùn)練超參數(shù)設(shè)置為:優(yōu)化器為Adam,epochs為250,batch size為200,學(xué)習(xí)率為0.01。模型訓(xùn)練過程如圖6所示。
基于medelA對(duì)PPG_A分別進(jìn)行單步(τ個(gè)數(shù)據(jù)點(diǎn))預(yù)測(cè)和多步迭代預(yù)測(cè),結(jié)果如圖7所示。對(duì)于多步迭代預(yù)測(cè),第一步預(yù)測(cè)的τA個(gè)數(shù)據(jù)點(diǎn)的RMSE為0.098,第二步預(yù)測(cè)的τA個(gè)數(shù)據(jù)點(diǎn)的RMSE為0.325,第三步預(yù)測(cè)的τA個(gè)數(shù)據(jù)點(diǎn)的RMSE為1.922??梢?,隨著迭代預(yù)測(cè)次數(shù)的增加,模型預(yù)測(cè)的準(zhǔn)確率反而降低。
由于混沌序列預(yù)測(cè)具有初始值敏感的特性,所以上一步預(yù)測(cè)的誤差可能會(huì)在下一步造成更大的誤差?;谶@一特性,本文選擇單步預(yù)測(cè)模型來進(jìn)行身份認(rèn)證。單步預(yù)測(cè)模型可以準(zhǔn)確地預(yù)測(cè)τ個(gè)數(shù)據(jù)點(diǎn),且形成的預(yù)測(cè)誤差足以區(qū)分不同的輸入。
采用modelA分別對(duì)PPG_A和PPG_B進(jìn)行單步預(yù)測(cè),預(yù)測(cè)結(jié)果如圖8所示。
從圖8可以觀察到,modelA可以很好地預(yù)測(cè)PPG_A的信號(hào),但在對(duì)PPG_B的預(yù)測(cè)曲線中,可以看到出現(xiàn)了PPG_A的特征。這是因?yàn)閷?duì)PPG信號(hào)進(jìn)行相空間重構(gòu)后,可以恢復(fù)并刻畫原始動(dòng)力學(xué)系統(tǒng)的特征。所以,modelA學(xué)習(xí)了主體A的動(dòng)力學(xué)特征,只對(duì)主體A的PPG信號(hào)有良好的預(yù)測(cè)結(jié)果。
進(jìn)一步分析modelA、modelB、modelC、modelD對(duì)PPG_A、PPG_B、PPG_C、PPG_D的預(yù)測(cè)精度,如表1所示。
從表1可以看出,各模型都只對(duì)其所屬主體的PPG信號(hào)有很好的預(yù)測(cè)精度。這進(jìn)一步驗(yàn)證了相空間重構(gòu)所揭示的動(dòng)力學(xué)特征在預(yù)測(cè)中的有效性,以及模型對(duì)于特定主體的動(dòng)態(tài)模式學(xué)習(xí)的能力。
值得注意的是,盡管本文的身份認(rèn)證系統(tǒng)需要為每個(gè)用戶存儲(chǔ)一個(gè)時(shí)間序列預(yù)測(cè)模型,但所構(gòu)建的LSTM模型相對(duì)較小,每個(gè)用戶的時(shí)間序列預(yù)測(cè)模型所需存儲(chǔ)空間僅約為480 KB。
5.1.3 身份認(rèn)證系統(tǒng)的閾值
基于表1的預(yù)測(cè)精度,本文采用支持向量機(jī)尋找最優(yōu)分類超平面的思想,計(jì)算得到了一個(gè)最佳閾值。如圖9所示,展示了四個(gè)模型對(duì)四個(gè)主體的PPG信號(hào)的預(yù)測(cè)RMSE。其中,每個(gè)模型對(duì)其對(duì)應(yīng)主體的PPG信號(hào)的預(yù)測(cè)RMSE標(biāo)記為“○”,而對(duì)其他主體的PPG信號(hào)的預(yù)測(cè)RMSE標(biāo)記為“+”。經(jīng)過計(jì)算,最終求得的閾值為0.71。
5.1.4 身份認(rèn)證系統(tǒng)的性能分析
該身份驗(yàn)證系統(tǒng)建立在四名用戶注冊(cè)的基礎(chǔ)上,并需進(jìn)一步研究其在用戶數(shù)量增加的情況下的可靠性。
以A為例,為了進(jìn)一步驗(yàn)證系統(tǒng)的性能和實(shí)際可用性,本文試圖將更多的PPG數(shù)據(jù)輸入身份認(rèn)證系統(tǒng)。首先,基于τA、mA對(duì)輸入的PPG數(shù)據(jù)進(jìn)行相空間重構(gòu),然后利用modelA對(duì)相空間重構(gòu)后的PPG數(shù)據(jù)進(jìn)行預(yù)測(cè)。具體結(jié)果如圖10所示,其中橫坐標(biāo)1~14的PPG數(shù)據(jù)來自用戶A,而15~100的PPG數(shù)據(jù)則來自MIMIC數(shù)據(jù)庫的不同主體。
通過觀察圖10,可以發(fā)現(xiàn)對(duì)于來自用戶A的PPG信號(hào),modelA的預(yù)測(cè)均方根誤差(RMSE)均小于設(shè)定的閾值,因此身份認(rèn)證結(jié)果為“接受”;而對(duì)于來自MIMIC數(shù)據(jù)庫的PPG信號(hào),modelA的預(yù)測(cè)RMSE均大于閾值,因此身份認(rèn)證結(jié)果為“拒絕”。
如圖10所示,身份認(rèn)證系統(tǒng)的認(rèn)證準(zhǔn)確率達(dá)到了100%。因此,本文提出的基于PPG信號(hào)相空間重構(gòu)預(yù)測(cè)的身份認(rèn)證系統(tǒng)表現(xiàn)出了優(yōu)秀的認(rèn)證性能和泛化能力。
5.2 基于rPPG信號(hào)的身份認(rèn)證
相對(duì)于PPG信號(hào),rPPG信號(hào)具有一系列優(yōu)點(diǎn),包括無須接觸采集和能夠進(jìn)行遠(yuǎn)程監(jiān)測(cè)。前文已經(jīng)證明了利用PPG信號(hào)和本文模型進(jìn)行身份認(rèn)證的可行性。本節(jié)將進(jìn)一步分析基于rPPG信號(hào)進(jìn)行身份認(rèn)證的可行性。
5.2.1 rPPG信號(hào)提取
所有rPPG技術(shù)都經(jīng)過視頻采集、感興趣區(qū)域(RoI)選擇和rPPG信號(hào)提取三個(gè)主要步驟。
在提取rPPG信號(hào)時(shí),首先利用人臉識(shí)別和特征點(diǎn)檢測(cè)技術(shù)來標(biāo)定和跟蹤皮膚區(qū)域(region of interest, RoI)。不同的RoI選取方法會(huì)直接影響到rPPG信號(hào)的提取精度,同時(shí)也會(huì)對(duì)時(shí)間序列分類模型的識(shí)別結(jié)果產(chǎn)生影響。因此,RoI的選擇至關(guān)重要。接著,對(duì)標(biāo)定的RoI區(qū)域進(jìn)行空間像素平均,并利用rPPG算法提取人臉面部的rPPG信號(hào)。
在RoI的選擇過程中,即在視頻的每一幀中確定一個(gè)進(jìn)行像素平均的區(qū)域。一個(gè)出色的RoI選取方法應(yīng)該能夠盡量減少或消除非皮膚區(qū)域,因?yàn)檫@有助于降低計(jì)算成本,并減少非皮膚區(qū)域的像素變化所帶來的噪聲干擾。RoI的選取方法主要包括整個(gè)臉部區(qū)域的選取和局部區(qū)域的選取兩種思路。
在整臉區(qū)域選取方法中,將整個(gè)人臉作為RoI,通過使用人臉識(shí)別算法來確定一個(gè)包含人臉的矩形區(qū)域作為RoI。這種RoI選取方法相對(duì)來說簡(jiǎn)單方便,但是由于矩形區(qū)域的選取可能會(huì)包含背景,所以會(huì)引入較多的噪聲。
局部區(qū)域選取方法只選取人臉皮膚的部分區(qū)域作為RoI。研究表明,人臉的額頭和臉頰的脈搏波信號(hào)具有較高的信噪比,因此更適合作為RoI區(qū)域[19]。通常,這種方法需要與面部特征識(shí)別技術(shù)相結(jié)合,以實(shí)現(xiàn)RoI的準(zhǔn)確選取和跟蹤。
相較于整臉區(qū)域RoI,局部區(qū)域RoI具有更強(qiáng)的抗干擾能力,但卻面臨著RoI區(qū)域皮膚像素較少的缺點(diǎn)。
鑒于此,本文提出了一種全新的RoI選取方法,即F-EM_RoI(face-eyes and mouth RoI)。該方法選取包含人臉區(qū)域的多邊形作為RoI,旨在確保RoI區(qū)域具有足夠多的像素?cái)?shù)量,同時(shí)減少甚至消除背景像素變化對(duì)結(jié)果的影響。此外,該方法還考慮到眨眼和說話對(duì)RoI區(qū)域空間像素平均值的影響,并將眼睛和嘴巴區(qū)域從RoI中剔除。
為了實(shí)現(xiàn)圖11所示的RoI區(qū)域的跟蹤和標(biāo)定,需要對(duì)攝像頭采集的每一幀圖像進(jìn)行處理。首先,利用dlib模型[20]進(jìn)行人臉檢測(cè)和人臉特征點(diǎn)檢測(cè)。在獲得的68個(gè)特征點(diǎn)的基礎(chǔ)上,連接序號(hào)為1~17的特征點(diǎn),并選擇18、27特征點(diǎn)垂直向上一段像素距離的兩個(gè)點(diǎn)以形成全臉封閉區(qū)域,如圖12所示。接著,根據(jù)人眼和嘴巴特征點(diǎn)的位置,剔除人臉和嘴巴,最終從人臉圖像中分割出RoI區(qū)域。
接下來進(jìn)行對(duì)比實(shí)驗(yàn),評(píng)估本文RoI選取方法對(duì)rPPG信號(hào)提取精度的影響。
本節(jié)采用了公開的LGI-PPGI-Face-Video數(shù)據(jù)集[21],該數(shù)據(jù)集包含了四個(gè)不同場(chǎng)景(resting、talking、gym、rotation)下的視頻記錄。每位受試者在每個(gè)場(chǎng)景下的記錄時(shí)間約為1 min,總共涉及25位受試者,共產(chǎn)生了100段視頻。攝像頭設(shè)備為Logitech HD C270網(wǎng)絡(luò)攝像頭,平均幀率為25 frames/s。同時(shí),為了提供參考,該數(shù)據(jù)集還通過串口通信協(xié)議同步了一個(gè)手指脈搏血氧計(jì)——CMS50E PPG,采樣頻率為60 Hz。
在本節(jié)中,本文采用文獻(xiàn)[22]使用的信噪比(SNR)來評(píng)估不同RoI選取方法下的rPPG信號(hào)的精度。rPPG信號(hào)的信噪比定義為參考心率頻率±0.1 Hz及其第一次諧波±0.2 Hz內(nèi)所含的功率與0.5~4.0 Hz所有其他功率之和的比率(以dB為單位)。
為了探究RoI選取方法對(duì)rPPG信號(hào)提取精度的影響,本文將比較不同的RoI選取方法在G[23]、ICA[24]、CHROM[25]、POS[26]和LGI[27]五種rPPG算法上的實(shí)際效果。具體比較結(jié)果詳見表2~5,表中加粗?jǐn)?shù)據(jù)為最優(yōu)。
通過對(duì)表2~5的分析,可以得出以下結(jié)論:
a)在resting場(chǎng)景中,由于用戶沒有頭部或面部運(yùn)動(dòng),本文RoI選取方法F-EM_RoI在五種不同的rPPG算法中表現(xiàn)出色,并獲得了最高的信噪比。而在gym場(chǎng)景下,選取額頭作為RoI在大多數(shù)rPPG算法中取得了最高的信噪比。因此,針對(duì)不同的場(chǎng)景,應(yīng)采用不同的RoI選取方法。
b)對(duì)于CHROM和LGI算法,在五種RoI選取方法中,F(xiàn)-EM_RoI多次取得了最高的信噪比,表現(xiàn)出最佳效果。因此,針對(duì)這兩種算法,應(yīng)選擇F-EM_RoI作為RoI。
c)在resting、talking和rotation三個(gè)場(chǎng)景中,采用F-EM_RoI+LGI算法獲得了最高的信噪比。
綜上所述,根據(jù)實(shí)驗(yàn)結(jié)果可以得知,在多數(shù)場(chǎng)景下,采用F-EM_RoI+LGI算法能夠取得出色的表現(xiàn)。因此,本文選擇基于F-EM_RoI+LGI算法來提取面部rPPG信號(hào)。
5.2.2 rPPG特征參數(shù)選取
為了獲得更為全面的身份識(shí)別特征,有必要對(duì)rPPG信號(hào)進(jìn)行頻域分析[28]。
功率譜是功率譜密度函數(shù)(power spectral density, PSD)的簡(jiǎn)稱,它描述了信號(hào)功率隨頻率變化的情況,并在各個(gè)領(lǐng)域得到了廣泛應(yīng)用[29]。對(duì)功率譜的估計(jì)通常采用兩種方法:a)基于給定數(shù)據(jù)集的非參數(shù)估計(jì),即經(jīng)典譜估計(jì)方法;b)是基于參數(shù)模型的參數(shù)估計(jì),即現(xiàn)代譜估計(jì)方法。與現(xiàn)代譜估計(jì)方法相比,經(jīng)典譜估計(jì)方法具有較低的分辨率和較差的方差性,但由于算法簡(jiǎn)單且具有明確的物理意義,在誤差范圍較寬的情況下同樣可以獲得良好的效果[30]。
傳統(tǒng)的譜估計(jì)方法通過選取數(shù)據(jù)序列的部分內(nèi)容,并將其余部分假設(shè)為零,相當(dāng)于對(duì)數(shù)據(jù)施加了窗口。這些方法通常包括相關(guān)函數(shù)法和周期圖法,其中平均修正周期圖法(Welch法)是一種改進(jìn)的周期圖法。為了提取rPPG信號(hào)的頻域特征參數(shù),本文采用了Welch功率譜估計(jì)方法。
該方法的計(jì)算過程如下:a)將信號(hào)分成重疊的分段;b)對(duì)每個(gè)段信號(hào)施加窗口,常見的窗函數(shù)包括矩形窗、凱瑟窗、漢寧窗、切比雪夫窗等;c)計(jì)算每段信號(hào)的功率譜,并對(duì)功率譜進(jìn)行平均估計(jì)。
通過Welch功率譜估計(jì)方法得到功率譜,并按照頻域范圍劃分,提取頻域特征參數(shù)值。具體參數(shù)名稱及頻域范圍見表6。
參數(shù)名稱頻域范圍/Hz參數(shù)名稱頻域范圍/Hz
power_10~0.02 power_50.13~0.16
power_20.02~0.05 power_60.16~0.3
power_30.05~0.09 power_70.3~1.0
power_40.09~0.13 power_all0~1.0
除了頻域特征外,rPPG信號(hào)還呈現(xiàn)出顯著的非線性特性,這些特性與心臟等器官的活動(dòng)密切相關(guān),而不同個(gè)體的rPPG信號(hào)的非線性參數(shù)對(duì)于身份識(shí)別具有重要意義。本文選擇了三個(gè)非線性特征參數(shù)進(jìn)行分析,包括排列熵(permutation entropy, PermEn)[31]、模糊熵(fuzzy entropy, FuzzyEn)[32]和精細(xì)復(fù)合多尺度散布熵(refined composite multiscale dispersion entropy, RCMDE)[33]。
5.2.3 基于rPPG信號(hào)的相空間重構(gòu)預(yù)測(cè)
基于前述研究,本文試圖對(duì)rPPG信號(hào)進(jìn)行相空間重構(gòu),并對(duì)重構(gòu)后的數(shù)據(jù)進(jìn)行預(yù)測(cè),以評(píng)估利用rPPG信號(hào)進(jìn)行身份認(rèn)證的可行性。
按照5.2.1節(jié)介紹的rPPG提取算法,本文從一個(gè)用戶的面部視頻中提取了rPPG信號(hào)。首先,使用華為MATE 20手機(jī)的攝像頭錄制了60 s的面部視頻,幀率為25 frames/s。隨后,基于F-EM_RoI標(biāo)定和跟蹤面部皮膚區(qū)域,利用LGI算法提取出了用戶的rPPG信號(hào)。提取的rPPG信號(hào)包含了1 500個(gè)數(shù)據(jù)點(diǎn),其中1 200個(gè)數(shù)據(jù)點(diǎn)用于訓(xùn)練模型,300個(gè)數(shù)據(jù)點(diǎn)用于驗(yàn)證預(yù)測(cè)的準(zhǔn)確度。
同樣地,本文采用了互信息法來確定rPPG信號(hào)的延遲時(shí)間,并使用虛假臨近點(diǎn)法來確定其嵌入維度,具體結(jié)果見圖13。
利用所得到的延遲時(shí)間和嵌入維度對(duì)信號(hào)進(jìn)行相空間重構(gòu)后,本文采用第4節(jié)中介紹的時(shí)間序列預(yù)測(cè)模型進(jìn)行訓(xùn)練。圖14展示了相應(yīng)的預(yù)測(cè)結(jié)果,并顯示模型能夠相當(dāng)準(zhǔn)確地預(yù)測(cè)rPPG信號(hào)的波動(dòng)情況。
隨后,本文將不同主體的rPPG數(shù)據(jù)輸入到模型中,并觀察到模型對(duì)不同主體的rPPG數(shù)據(jù)的預(yù)測(cè)與RMSE相近,難以利用預(yù)測(cè)精度進(jìn)行身份認(rèn)證。
對(duì)于這一結(jié)果,本文進(jìn)行了以下分析:
首先,根據(jù)5.1節(jié)的實(shí)驗(yàn)結(jié)果,本文得知對(duì)PPG信號(hào)進(jìn)行相空間重構(gòu)預(yù)測(cè)可以實(shí)現(xiàn)身份認(rèn)證。這表明,通過對(duì)信號(hào)進(jìn)行相空間重構(gòu),然后輸入到LSTM模型中,模型能夠?qū)W習(xí)到信號(hào)的非線性動(dòng)力學(xué)特征,從而可以根據(jù)預(yù)測(cè)結(jié)果進(jìn)行身份認(rèn)證。因此,本文方法是可行的。
其次,通過對(duì)rPPG信號(hào)進(jìn)行相空間重構(gòu),然后輸入到LSTM模型中,可以實(shí)現(xiàn)對(duì)rPPG信號(hào)的預(yù)測(cè)。然而,可以觀察到模型對(duì)不同主體的預(yù)測(cè)精度相近。這說明,模型僅僅學(xué)習(xí)到了rPPG信號(hào)的波動(dòng)特征。
這一現(xiàn)象的原因在于,rPPG信號(hào)中含有大量噪聲,而噪聲與有效信號(hào)混合在一起,導(dǎo)致脈搏波信號(hào)中重要的波形特征被掩蓋。因此,本文模型只能夠?qū)W習(xí)到rPPG信號(hào)的波動(dòng)特征。若要分離噪聲和有效脈搏波信號(hào),就需要增加樣本數(shù)量或改進(jìn)傳感器。當(dāng)樣本數(shù)量足夠時(shí),可以訓(xùn)練一個(gè)模型,使其能夠?qū)W習(xí)到噪聲對(duì)身份認(rèn)證沒有意義的事實(shí)。換言之,對(duì)于rPPG信號(hào),噪聲不是其本質(zhì)特征,當(dāng)樣本數(shù)足夠時(shí),可以將噪聲與有效信號(hào)區(qū)分開來。
盡管由于樣本數(shù)量不足,目前本文尚難以基于rPPG信號(hào)實(shí)現(xiàn)身份認(rèn)證,但這并不意味著基于rPPG信號(hào)的身份認(rèn)證是不可行的。
5.2.4 rPPG信號(hào)的方差分析
為了評(píng)估基于rPPG信號(hào)進(jìn)行身份認(rèn)證的可行性,本文在相同時(shí)間和場(chǎng)景下收集了兩名雙胞胎(標(biāo)記為S1和S2)的面部視頻和手背視頻,并分別從其面部和手部提取了rPPG信號(hào)。其中,記S1的面部脈沖信號(hào)為P11,S1手部脈沖信號(hào)為P12;S2的面部脈沖信號(hào)為P21,S2手部脈沖信號(hào)為P22。
采集到的rPPG信號(hào)之間存在差異,這些差異可能是由于個(gè)體(即人)的不同,也可能是由于偶然誤差(即噪聲)所致。本文利用方差分析來檢驗(yàn)rPPG信號(hào)的唯一性,即確定不同主體的rPPG信號(hào)是否存在顯著性差異。
本文將采集到的不同主體的rPPG信號(hào)(P11和P21)的RCMDEn、FuzzEn、PermEn、power_2等作為實(shí)驗(yàn)指標(biāo),以人作為因素進(jìn)行方差分析,得到的p值如表7所示。
參數(shù)名稱方差分析參數(shù)名稱方差分析
RCMDEn1.64×10-2power_29×10-4FuzzEn1.45×10-2power_32.1×10-4
PermEn3.79×10-2power_all3.5×10-3
表7顯示所有的p值均小于0.05,這表明不同主體的rPPG信號(hào)在RCMDEn、FuzzEn、PermEn、power_2等方面存在顯著性差異。因此,可以得出不同主體的rPPG信號(hào)之間存在明顯的差異。
接下來,對(duì)同一主體的rPPG信號(hào)(P11與P12、P21與P22)進(jìn)行了進(jìn)一步分析。以皮膚區(qū)域?yàn)橐蛩兀瑢CMDEn、FuzzEn、PermEn、power_2等作為實(shí)驗(yàn)指標(biāo)進(jìn)行方差分析,結(jié)果見表8。
根據(jù)表8數(shù)據(jù)顯示,所有的p值都大于0.05,這意味著同一主體在不同皮膚區(qū)域的rPPG信號(hào)在RCMDEn、FuzzEn、PermEn、power_2等方面都沒有顯著性差異。因此,可以得出結(jié)論,同一主體的rPPG信號(hào)在不同皮膚區(qū)域之間沒有顯著性差異。
綜上所述,rPPG信號(hào)可以被視為一種可用于身份認(rèn)證的生物識(shí)別特征。
6 結(jié)束語
本文通過驗(yàn)證脈搏波信號(hào)的混沌非線性特性,提出了一種全新的脈搏波信號(hào)建模、預(yù)測(cè)和身份認(rèn)證方法,結(jié)合了相空間重構(gòu)和LSTM模型。該方法利用預(yù)測(cè)精度來決策身份認(rèn)證結(jié)果,為脈搏波身份認(rèn)證帶來了新的思路。
在構(gòu)建基于用戶PPG信號(hào)的身份認(rèn)證系統(tǒng)方面,首先對(duì)PPG信號(hào)進(jìn)行了相空間重構(gòu),并計(jì)算了其延遲時(shí)間和嵌入維度。接著,利用訓(xùn)練好的LSTM時(shí)間序列預(yù)測(cè)模型對(duì)重構(gòu)的PPG數(shù)據(jù)進(jìn)行預(yù)測(cè),基于預(yù)測(cè)的RMSE值來確定身份認(rèn)證結(jié)果。最后,通過對(duì)100個(gè)PPG數(shù)據(jù)(來自87個(gè)主體)的評(píng)估和驗(yàn)證,結(jié)果表明,基于PPG相空間重構(gòu)預(yù)測(cè)的身份認(rèn)證系統(tǒng)達(dá)到了100%的準(zhǔn)確率。
此外,本文還探討了基于rPPG信號(hào)的身份認(rèn)證的可行性。通過對(duì)兩名主體在不同皮膚區(qū)域的rPPG信號(hào)進(jìn)行方差分析,結(jié)果表明,同一主體的rPPG信號(hào)之間沒有顯著性差異,而不同主體的rPPG信號(hào)之間存在顯著性差異。
在本文的基礎(chǔ)上,未來進(jìn)一步的研究方向可以有以下幾個(gè)方面:
a)多樣本研究。擴(kuò)大樣本量和多樣本來源,涵蓋不同年齡、性別、種族和健康狀況的個(gè)體,以驗(yàn)證所提身份認(rèn)證方法的適用性和魯棒性。
b)動(dòng)態(tài)環(huán)境下的應(yīng)用??疾煸谶\(yùn)動(dòng)、光照變化及其他動(dòng)態(tài)環(huán)境條件下,PPG信號(hào)的穩(wěn)定性和身份認(rèn)證的準(zhǔn)確率,以評(píng)估其在現(xiàn)實(shí)場(chǎng)景中的應(yīng)用潛力。
c)增強(qiáng)學(xué)習(xí)與優(yōu)化模型。引入增強(qiáng)學(xué)習(xí)技術(shù),以優(yōu)化LSTM模型的參數(shù)設(shè)置,并探索其他深度學(xué)習(xí)算法(如引入注意力機(jī)制)在脈搏波信號(hào)處理中的應(yīng)用。
d)綜合生物特征融合。探索將PPG信號(hào)與其他生物識(shí)別特征(如指紋、面部識(shí)別等)結(jié)合的多模態(tài)身份認(rèn)證策略,以提高系統(tǒng)的安全性和可靠性。
參考文獻(xiàn):
[1]Rajaram S, Vollala S,Ramasubramanian N, et al. Enhanced and secured random number generation for eUASBP [J]. International Journal of System Assurance Engineering and Management, 2022, 13(3): 1135-1150.
[2]Spooren J, Preuveneers D, Joosen W. PPG2Live:using dual PPG for active authentication and liveness detection [C]// Proc of International Conference on Biometrics. Piscataway, NJ: IEEE Press, 2019: 1-6.
[3]Nowara E M, Sabharwal A, Veeraraghavan A. PPGSecure:biometric presentation attack detection using photopletysmograms [C]// Proc of the 12th IEEE International Conference on Automatic Face amp; Gesture Recognition. Piscataway, NJ: IEEE Press, 2017: 56-62.
[4]Engelsma J J, Grosz S, Jain A K. PrintsGAN:synthetic fingerprint generator [J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 2023, 45(5): 6111-6124.
[5]Kavsaolu A R, Polat K, Bozkurt M R. A novel feature ranking algorithm for biometric recognition with PPG signals [J]. Computers in Biology and Medicine, 2014, 49: 1-14.
[6]Jaafar N A L, Sidek K A, Azam S N A M. Acceleration plethysmogram based biometric identification [C]// Proc of International Conference on BioSignal Analysis, Processing and Systems. Piscataway, NJ: IEEE Press, 2015: 16-21.
[7]Lee A, Kim Y. Photoplethysmography as a form of biometric authentication [C]// Proc of IEEE SENSORS. Piscataway, NJ: IEEE Press, 2015: 1-2.
[8]Karimian N, Tehranipoor M, Forte D. Non-fiducial PPG-based authentication for healthcare application [C]// Proc of IEEE EMBS International Conference on Biomedical amp; Health Informatics. Pisca-taway, NJ: IEEE Press, 2017: 429-432.
[9]Zheng Qinghe, Tian Xinyu, Yu Zhiguo, et al. MobileRaT: a lightweight radio Transformer method for automatic modulation classification in drone communication systems [J]. Drones, 2023, 7(10): 596.
[10]Zheng Qinghe, Saponara S, Tian Xinyu, et al. A real-time constellation image classification method of wireless communication signals based on the lightweight network MobileViT [J]. Cognitive Neurodynamics, 2024, 18(2): 659-671.
[11]Jeon Y, Kang S J. Multi-slice nested recurrence plot (MsNRP): a robust approach for person identification using daily ECG or PPG signals [J]. Engineering Applications of Artificial Intelligence, 2023, 126: 106799.
[12]Lee J, Kwak K C. Personal identification using an ensemble approach of 1D-LSTM and 2D-CNN with electrocardiogram signals [J]. Applied Sciences, 2022, 12(5): 2692.
[13]Wu Liwan, Yang Chong. IoT device identity authentication method based on rPPG and CNN facial recognition [J]. International Journal of Advanced Computer Science and Applications, 2024, 15(5): 0150517.
[14]Rukhsar S, Rehman H, Khan Y U,et al. Detection of epileptic seizure in EEG signals using phase space reconstruction and Euclidean distance of first-order derivative [C]// Proc of International Confe-rence on Inventive Computing and Informatics. Piscataway, NJ: IEEE Press, 2017: 821-826.
[15]Takens F. Detecting strange attractors in turbulence [C]// Proc of Dynamical Systems and Turbulence. Berlin: Springer, 1981: 366-381.
[16]黨建武, 黃建國. 基于G.P算法的關(guān)聯(lián)維計(jì)算中參數(shù)取值的研究 [J]. 計(jì)算機(jī)應(yīng)用研究, 2004, 21(1): 48-51. (Dang Jianwu, Huang Jianguo. Study of the parameters used in calculating correlative dimension based on G.P algorithm [J]. Application Research of Computers, 2004, 21(1): 48-51.)
[17]Grassberger P, Procaccia I. Characterization of strange attractors [J]. Physical Review Letters, 1983, 50(5): 346-349.
[18]胡杰, 許力, 孟武強(qiáng), 等. 基于相空間重構(gòu)的駕駛風(fēng)格定量評(píng)估 [J]. 儀器儀表學(xué)報(bào), 2017, 38(3): 635-642. (Hu Jie, Xu Li, Meng Wuqiang, et al. Quantitative evaluation of driving style based on phase space reconstruction [J]. Chinese Journal of Scientific Instrument, 2017, 38(3): 635-642.)
[19]Kwon S, Kim J, Lee D,et al. RoI analysis for remote photoplethysmography on facial video [C]// Proc of the 37th Annual International Conference of the IEEE Engineering in Medicine and Biology Society. Piscataway, NJ: IEEE Press, 2015: 4938-4941.
[20]King D E. Dlib-ml: a machine learning toolkit [J]. Journal of Machine Learning Research, 2009, 10: 1755-1758.
[21]Pilz C S, Zaunseder S, Krajewski J,et al. Local group invariance for heart rate estimation from face videos in the wild [C]// Proc of IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops. Piscataway, NJ: IEEE Press, 2018: 1335-13358.
[22]de Haan G, Jeanne V. Robust pulse rate from chrominance-based rPPG [J]. IEEE Trans on Bio-medical Engineering, 2013, 60(10): 2878-2886.
[23]Verkruysse W, Svaasand L O, Stuart Nelson J. Remote plethysmographic imaging using ambient light [J]. Optics Express, 2008, 16(26): 21434-21445.
[24]Poh M Z, McDuff D J, Picard R W. Non-contact, automated cardiac pulse measurements using video imaging and blind source separation [J]. Optics Express, 2010, 18(10): 10762-10774.
[25]Wang Wenjin, Stuijk S, De Haan G. A novel algorithm for remote photoplethysmography: spatial subspace rotation [J]. IEEE Trans on Bio-medical Engineering, 2016, 63(9): 1974-1984.
[26]Gu Y Y, Zhang Y, Zhang Y T. A novel biometric approach in human verification by photoplethysmographic signals [C]// Proc of the 4th International IEEE EMBS Special Topic Conference on Information Technology Applications in Biomedicine. Piscataway, NJ: IEEE Press, 2003: 13-14.
[27]陳婉琳. 基于光電容積脈搏波的全身麻醉鎮(zhèn)痛水平監(jiān)測(cè)的研究 [D]. 杭州: 浙江大學(xué), 2021. (Chen Wanlin. Monitoring the level of analgesia based on photoplethysmography under general anesthesia[D]. Hangzhou: Zhejiang University, 2021.)
[28]Bandt C, Pompe B. Permutation entropy: a natural complexity mea-sure for time series [J]. Physical Review Letters, 2002, 88(17): 174102.
[29]Chen Weiting, Wang Zhizhong, Xie Hongbo, et al. Characterization of surface EMG signal based on fuzzy entropy [J]. IEEE Trans on Neural Systems and Rehabilitation Engineering, 2007, 15(2): 266-272.
[30]Azami H, Rostaghi M, Abasolo D, et al. Refined composite multiscale dispersion entropy and its application to biomedical signals [J]. IEEE Trans on Bio-medical Engineering, 2017, 64(12): 2872-2879.