王雪婷,張燁菲,張顯飛,趙治棟
(杭州電子科技大學(xué),浙江 杭州 310018)
物聯(lián)網(wǎng)和人工智能技術(shù)的飛速發(fā)展,為高安全性、高隱私性的新型識別技術(shù)提供了必要的技術(shù)支持。生物特征識別技術(shù)(Biometric Identification Technology,BIT)是利用個體生物特征進行身份識別認(rèn)證的技術(shù),例如人臉識別、指紋識別、虹膜識別等。雖然基于生物特征的識別技術(shù)提高了個人或者企業(yè)信息的安全性,但是同樣存在一定的安全隱患問題,例如AI換臉技術(shù)、假指紋、指紋信息還原技術(shù)等增加了個人信息被盜的風(fēng)險,對信息安全系統(tǒng)帶來了較大的威脅。因此,尋求一種高安全性和高隱私性的身份識別方法尤為重要。
隨著國內(nèi)外研究學(xué)者在生物特征識別技術(shù)領(lǐng)域的不斷挖掘和探索,一種基于心電信號的生物特征身份識別技術(shù)憑借其高防偽性、高安全性以及高隱私性的特點,迅速成為生物特征識別技術(shù)的研究熱點,被很多國內(nèi)外學(xué)者認(rèn)為是最具高安全性潛力的生物識別技術(shù)[1]。
2001年,Biel等人[2]首次提出了將ECG信號的基準(zhǔn)點信息作為特征提取實現(xiàn)個體的身份識別。在此之后,得益于深度學(xué)習(xí)技術(shù)的飛速發(fā)展,2017年,Zhang等人[3]提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)的ECG身份識別方法,得到了93.5%的識別率。2018年,Donida Labati等人[4]提出了從單導(dǎo)聯(lián)或多導(dǎo)聯(lián)的心電信號中,提取一組含有m個QRS復(fù)合波的特征信息作為CNN網(wǎng)絡(luò)層輸入,獲得了95%的識別率。2019年,Hou等人[5]聯(lián)合長短期記憶神經(jīng)網(wǎng)絡(luò)(Long Short Term Memory,LSTM)和Auto-Encoder進行心電信號特征提取,對5類異常心拍分類的準(zhǔn)確率達(dá)到了99.74%。2021年,劉昱昕等人[6]提出了基于GoogleNet的心電信號分類模型,對3種類型的心電信號進行分類并取得了100%的識別率。
深度學(xué)習(xí)依靠其自身強大的特征自學(xué)習(xí)能力,在對心電波形質(zhì)量要求相對不高的情況下,仍然能夠保證較高的識別準(zhǔn)確率,更適用于實驗數(shù)據(jù)量較大的情況。
本文針對噪聲干擾較大的單導(dǎo)聯(lián)心電信號的身份識別技術(shù)展開研究,分別從心電信號的質(zhì)量評估、信號去噪、生成ECG軌跡圖、基于卷積神經(jīng)網(wǎng)絡(luò)的身份識別模型4個方面進行研究,實驗流程如 圖1所示。
圖1 實驗流程
本文首先對采集到的單導(dǎo)聯(lián)心電信號進行質(zhì)量評估,對質(zhì)量評估等級為可疑的心電信號進行去噪處理得到干凈的ECG信號;其次利用廣義S變換對質(zhì)量評估合格的一維ECG信號進行時頻域分析,將其轉(zhuǎn)換為二維的ECG軌跡圖片作為網(wǎng)絡(luò)層的輸入;最后提出基于卷積神經(jīng)網(wǎng)絡(luò)的深度遷移識別算法,對ECG軌跡圖進行特征自學(xué)習(xí),實現(xiàn)基于心電信號個體身份識別。
本文首先提出基于支持向量機[7](Support Vector Machine,SVM)的ECG質(zhì)量評估算法,通過對ECG信號的波形特征和噪聲特征進行計算分析,得到一系列能夠反映信號質(zhì)量等級的質(zhì)量評估指數(shù)(Signal Quality Index,SQI)作為評價標(biāo)準(zhǔn);其次依據(jù)這些SQI對心電數(shù)據(jù)集進行質(zhì)量指數(shù)特征提?。蛔詈罄糜?xùn)練好的SVM模型對測試集進行不同質(zhì)量等級的分類。質(zhì)量評估算法的具體流程如 圖2所示。
圖2 質(zhì)量評估算法流程
本文在基于ECG信號波形特征和噪聲特征的基礎(chǔ)上,提出了8個能夠反映出心電信號質(zhì)量等級的信號質(zhì)量指數(shù)特征,具體如下文所述。
(1)QRS波形清晰指數(shù)SQI1。當(dāng)一段ECG信號中的噪聲含量較多時,QRS波形是很難被識別出來的,通過使用兩個對噪聲敏感度不同的噪聲檢測器對同樣一段QRS波群進行檢測[8],分別得出兩者檢測到的心拍個數(shù)Ne和Nw。將SQI1定義為兩者檢測出的心拍個數(shù)的比值,表達(dá)式為:
(2)偏度SQI2。當(dāng)心電信號含噪較多,波形分布不均勻時,得到的偏度值也會較大。定義信號的偏度值為SQI2,計算方式為:
式中:為信號x的平均值;σ為信號x的標(biāo)準(zhǔn)差;N為心電信號的采樣點數(shù)。
(3)峰度SQI3。含噪越多的信號波形形態(tài)表現(xiàn)越不穩(wěn)定,極端值出現(xiàn)的概率也就越大,對應(yīng)的峰度也就越大。因此,通過計算心電信號的峰度值大小可以判斷信號的含噪程度。以峰度值定義的SQI3的公式為:
(4)功率譜分布指數(shù)SQI4。將包含能量中心頻率的某一小段頻帶(5~15 Hz)的功率譜密度與整體心電信號集中頻段(5~40 Hz)的功率譜密度的比值定義為SQI4,表達(dá)式為:
式中:f為頻率;p(f)為信號在該頻率下的功率。
(5)基線偏移指數(shù)SQI5。將基線的頻率分布在0~1 Hz之間的功率譜密度與整個頻帶的功率譜密度比值定義為SQI5:
式中:f為頻率;p(f)為信號在該頻率下的功率。
(6)QRS波能量指數(shù)SQI6。心電信號中QRS波形的能量占比最高,通過計算QRS波形能量占總心電信號波形能量的比例,將QRS波形能量指數(shù)作為衡量ECG質(zhì)量等級的一個指標(biāo),定義為指數(shù)SQI6,表達(dá)式為:
式中:Eri為一個QRS波群的能量;i為檢測的QRS波群;Ea為整個心電片段的總能量。
(7)RR間期穩(wěn)定指數(shù)SQI7。定義了RR間期穩(wěn)定指數(shù)SQI7,用來衡量ECG信號波形在周期內(nèi)的穩(wěn)定程度,表達(dá)式為:
式中:和分別為心電信號在RR間期內(nèi)的標(biāo)準(zhǔn)差和均值。RR間期越不穩(wěn)定,SQI7值越大時,信號質(zhì)量越差;反之,信號質(zhì)量越好。
(8)純度SQI8。信號的純度值SQI8越大,說明信號的含噪量越小,信號的質(zhì)量也就越好。定義SQI8為:
式中:wn表示n階譜矩。
將基于ECG波形特征和噪聲特征提取到的8個SQI指數(shù)作為對原始心電信號質(zhì)量的評判依據(jù),然后利用SVM分類器對采集到的原始單導(dǎo)聯(lián)心電信號分別進行合格、可疑、較差3種不同質(zhì)量等級的分類。其中,質(zhì)量表現(xiàn)為合格的心電信號不需要進行去噪處理,質(zhì)量表現(xiàn)為可疑的心電信號需要進行下面的去噪處理,質(zhì)量表現(xiàn)為較差的心電信號直接舍棄不予處理。
本文提出了基于廣義S變換的時頻域分析算法,將一維ECG信號轉(zhuǎn)化為頻域上的二維ECG軌跡圖作為深度學(xué)習(xí)模型的輸入,從而進行特征自學(xué)習(xí)。
廣義S變換是在S變換的基礎(chǔ)上引入高斯函數(shù)作為窗函數(shù),對于任意的一個平方可積的信號x(t),得到廣義S變換的標(biāo)準(zhǔn)形式:
式中:f為頻率;τ為時移參數(shù);λ和p分別為高斯函數(shù)窗口的高度和寬度,可以通過調(diào)節(jié)其大小獲得最佳的心電信號頻域特征狀態(tài)。
經(jīng)過廣義S變換后輸出為一個包含實部和虛部的復(fù)數(shù)矩陣,矩陣的每一列代表時間值,每一行代表頻率變換,即每列代表瞬時的時頻域特征。對矩陣中的每個數(shù)據(jù)進行處理,其中以每個數(shù)據(jù)的實部為橫坐標(biāo)、虛部為縱坐標(biāo),繪制出每個時間點的ECG軌跡圖作為網(wǎng)絡(luò)層的輸入。
卷積神經(jīng)網(wǎng)絡(luò)主要由輸入層、卷積層、激活層、池化層、全連接層構(gòu)成。目前使用最為廣泛的CNN網(wǎng)絡(luò)模型主要包括AlexNet、VGG-Net、GoogLeNet等模型,模型結(jié)構(gòu)對比如表1所示。表1中“√”代表“有”,“×”代表“沒有”。
表1 常見的CNN模型對比
由表1可知,GoogleNet網(wǎng)絡(luò)擁有比VGGNet和AlexNet更深的網(wǎng)絡(luò)結(jié)構(gòu),但是其參數(shù)量只有750萬個,相比于前兩個網(wǎng)絡(luò)結(jié)構(gòu)而言,GoogLeNet網(wǎng)絡(luò)在保證計算復(fù)雜度不高的同時又提高了準(zhǔn)確度,解決了當(dāng)下為了提高準(zhǔn)確率,不斷堆疊CNN卷積層,造成參數(shù)量過大、計算資源損耗嚴(yán)重等問題。
基于深度學(xué)習(xí)獲得的特征具有很強的遷移能力。本節(jié)構(gòu)建了基于GoogleNet網(wǎng)絡(luò)的深度遷移識別模型。基于心電信號的個體身份識別的訓(xùn)練過程可分為第一次遷移和第二次遷移兩個階段。
基于單導(dǎo)聯(lián)心電信號的第一次遷移識別學(xué)習(xí)對原始GoogLeNet模型中的Inception模塊進行優(yōu)化。如圖3所示,原始的Inception模塊采用5×5大卷積層的網(wǎng)絡(luò)結(jié)構(gòu),將其換成兩個3×3的小卷積層,如圖4所示。改進后的GoogleNet網(wǎng)絡(luò)模型不僅減少了計算參數(shù)量,而且增加了網(wǎng)絡(luò)深度,從而提高了身份識別的準(zhǔn)確率,并將改進后的模型命名為GoogleNet-T1,用來完成第一次遷移學(xué)習(xí)訓(xùn)練。
圖3 原始Inception模塊
圖4 改進后的Inception模塊
第二次遷移訓(xùn)練采用凍結(jié)和微調(diào)的技術(shù)。首先將第一次遷移學(xué)習(xí)后的GoogleNet-T1網(wǎng)絡(luò)前9層凍結(jié),用于提取樣本中的相同特征,保留后面的網(wǎng)絡(luò)層數(shù),搭配微調(diào)技術(shù),用于提取目標(biāo)領(lǐng)域樣本中的細(xì)節(jié)特征。另外為了防止過擬合現(xiàn)象發(fā)生,第9層、24層和30層的卷積層后都加上Dropout層,并將其命名為GoogleNet-T2,具體如圖5所示。
圖5 第二次遷移學(xué)習(xí)模型
通過凍結(jié)加微調(diào)部分網(wǎng)絡(luò)層操作的二次遷移學(xué)習(xí)模型,不僅減少了模型訓(xùn)練時間,而且實現(xiàn)了遷移學(xué)習(xí)過程中目標(biāo)領(lǐng)域?qū)υ搭I(lǐng)域模型的充分適應(yīng)。
2.1.1 ECG-ID心電數(shù)據(jù)集
該數(shù)據(jù)庫來源于年齡在13~75歲之間的90名健康個體,通過500 Hz的采樣頻率進行采集,共得到310條長度在20 s左右的ECG信號。本文利用該數(shù)據(jù)庫中90條心電信號作為身份識別實驗數(shù)據(jù),并將其記為數(shù)據(jù)庫D1。
2.1.2 MIT-BIH心電數(shù)據(jù)集
作為常見的心電數(shù)據(jù)集之一,該數(shù)據(jù)庫共包含從47名受測者采集到的48組心電數(shù)據(jù),每組數(shù)據(jù)信號的長度為30min。本文選取該數(shù)據(jù)庫中47名受測者的心電信號,作為實驗中質(zhì)量評估、身份識別的實驗數(shù)據(jù),記為數(shù)據(jù)庫D2。
2.1.3 PhysioNet/Cinc Challenge 2017 training數(shù)據(jù)集
此數(shù)據(jù)集是由AliveCor公司提供的,并且該數(shù)據(jù)集共包含8 528組的數(shù)據(jù)均由單導(dǎo)聯(lián)心電采集裝備得到[9]。另外,訓(xùn)練集中的ECG心電數(shù)據(jù)均由300 Hz的采樣頻率采樣得到,長度在9~60 s之間。本文從該數(shù)據(jù)庫中分別引用100組正常心律、100組心房顫動以及50組含噪信號,共250組實驗數(shù)據(jù)用于本文中心電信號的預(yù)處理研究,記為數(shù)據(jù)庫D3。
2.2.1 性能指標(biāo)
為了從多角度分析本文提出的基于SVM的ECG質(zhì)量評估算法,本文引入準(zhǔn)確性(Accuracy,ACC)、特異性(Specificity,Sp)和靈敏度(Sensitive,Se)3項指標(biāo)來衡量模型性能。分別定義如下:
式中:TP、TN分別是正確預(yù)測的質(zhì)量為可接受和不可接受的ECG信號個數(shù);FP、FN則分別為錯誤預(yù)測的質(zhì)量為可接受和不可接受的ECG信號個數(shù)。
2.2.2 訓(xùn)練模型
本節(jié)采用MIT-BIH數(shù)據(jù)庫D2對質(zhì)量評估模型進行訓(xùn)練,首先從數(shù)據(jù)庫D2中的47名受測者中截取到長度為10 s的干凈心電信號;其次利用文獻[10]中提出的信號加噪算法,給這些干凈的心電片段分別加上不同信噪比的真實心電信號噪聲,制造有噪聲的心電數(shù)據(jù)庫,并根據(jù)噪聲含量將心電信號的質(zhì)量等級分為合格、可疑、較差3種類型,如圖6所示,最終可以獲得47×3個心電信號片段。
圖6 MIT-BIH數(shù)據(jù)庫質(zhì)量評估效果
將141組心電數(shù)據(jù)集分成訓(xùn)練集93組和測試集48組,然后分別對訓(xùn)練集和測試集提取8個質(zhì)量指數(shù)特征量評估指數(shù)特征,作為SVM分類器的輸入對其質(zhì)量等級進行分類,實驗結(jié)果如表2 所示。
由表2可看出SQI7的識別準(zhǔn)確度最高,SQI6的表現(xiàn)最差。于是將特征表現(xiàn)較差的SQI6質(zhì)量評估指數(shù)剔除,最終確定7個質(zhì)量評估指數(shù)為SQI1(QRS波形清晰指數(shù))、SQI2(偏度)、SQI3(峰度)、SQI4(功率譜分布指數(shù))、SQI5(基線偏移指數(shù))、SQI7(RR間期穩(wěn)定指數(shù))、SQI8(純度)用于模型的特征輸入。
2.2.3 實驗結(jié)果
采用PhysioNet/Cinc Challenge 2017數(shù)據(jù)庫D3中250組不同質(zhì)量的ECG信號,結(jié)合上節(jié)中得到的7個質(zhì)量評估指數(shù)S={SQI1,SQI2,SQI3,SQI4,SQI5,SQI7,SQI8},對訓(xùn)練好的質(zhì)量評估模型進行測試,運行結(jié)果如表3所示。
表3 PhysioNet/Cinc Challenge 2017數(shù)據(jù)集質(zhì)量評估結(jié)果
綜上分析,本文所研究的基于SVM的ECG質(zhì)量評估模型,結(jié)合選取7個質(zhì)量指數(shù)特征,在數(shù)據(jù)集總共有250組不同質(zhì)量心電信號的情況下,得到的合格心電信號數(shù)量為150組,可直接用于后續(xù)的識別模型和分類器的輸入;可疑信號為75組,將進行后續(xù)的消噪處理;較差的有25組,這些信號將直接剔除數(shù)據(jù)集。
對單導(dǎo)聯(lián)心電信號質(zhì)量評估之后,再利用基于軟閾值的小波變換去噪法對75組可疑心電信號進行消噪處理,去噪效果前后對比如圖7所示。
圖7 心電信號去噪前后對比
2.3.1 實驗數(shù)據(jù)劃分
分別截取ECG-ID數(shù)據(jù)集D1和MIT-BIH數(shù)據(jù)集D2中500個樣本點作為實驗數(shù)據(jù),將其經(jīng)過廣義S變換轉(zhuǎn)換成二維ECG軌跡作為深度遷移學(xué)習(xí)模型的輸入。其中,數(shù)據(jù)集D1作為第一次遷移學(xué)習(xí)模型的輸入,數(shù)據(jù)集D2作為第二次遷移學(xué)習(xí)模型的輸入,ECG軌跡如圖8所示。
圖8 ECG頻譜軌跡
兩次遷移學(xué)習(xí)模型的訓(xùn)練集和測試集樣本都按照8∶2的比例進行分配,具體如表4所示。
表4 實驗數(shù)據(jù)劃分
2.3.2 模型性能指標(biāo)
為了更全面地評估出識別模型的性能優(yōu)劣,本節(jié)提出了以下3個性能指標(biāo)。
(1)識別時間
識別時間(T/s)是指在進行識別任務(wù)中對一組未知數(shù)據(jù)從輸入到識別結(jié)束所花費的時間。
(2)等錯誤率
在識別任務(wù)中采用等錯誤率(Equal Error Rate,EER)可以很好地評估識別模型的性能,當(dāng)EER值越低時,說明該模型的性能較好,定義為:
式中:FAR為誤識率,代表識別過程中應(yīng)該拒絕通過,但是實際卻通過的概率大小;FRR為拒識率,代表應(yīng)該被允許通過,但是實際卻沒有通過識別的概率大小。
(3)識別準(zhǔn)確率
識別分類模型一般都是圍繞模型的準(zhǔn)確率進行的,定義ACC為:
2.3.3 實驗結(jié)果
基于以上提出的3種性能指標(biāo),分別采用數(shù)據(jù)集D1和數(shù)據(jù)集D2對兩次遷移學(xué)習(xí)模型進行性能測試,實驗結(jié)果如圖9、圖10所示。
圖9 第一次遷移學(xué)習(xí)結(jié)果
圖10 第二次遷移學(xué)習(xí)結(jié)果
由圖9和圖10可以看出,第二次遷移學(xué)習(xí)后的EER明顯小于第一次遷移學(xué)習(xí)后的EER值。由此可知,第二次遷移學(xué)習(xí)相比于第一次遷移學(xué)習(xí),在模型的性能上有很大的提升,這主要歸功于第二次遷移學(xué)習(xí)中本文對傳統(tǒng)GoogleNet模型的輸出層進行了優(yōu)化。此外,實驗結(jié)果表明,可以將訓(xùn)練好的第一次遷移學(xué)習(xí)模型作為第二次遷移學(xué)習(xí)訓(xùn)練過程中心電信號相同特征的提取器。
接著本文又分別利用兩個數(shù)據(jù)庫對模型的識別準(zhǔn)確率和識別過程所花費的時間進行了實驗測試,結(jié)果匯總?cè)绫?所示。
表5 識別實驗結(jié)果
由表5可看出,在訓(xùn)練集上,第一次遷移學(xué)習(xí)模型獲得了97.22%的識別準(zhǔn)確率和8.62 s的識別時間,而第二次遷移學(xué)習(xí)模型獲得了98.40%的識別準(zhǔn)確率,但是識別時間僅為4.36 s,相比于第一次遷移學(xué)習(xí)的時間縮短了將近一倍。
在測試集上,第一次遷移學(xué)習(xí)模型獲得了94.44%的準(zhǔn)確率和8.28 s的識別時間,第二次遷移學(xué)習(xí)模型獲得了97.87%的準(zhǔn)確率和僅3.16 s的識別時間。分析可知,經(jīng)過兩次遷移學(xué)習(xí)后的模型不僅準(zhǔn)確率有一定的提升,而且大大縮短了識別時間,這主要是因為第二次遷移學(xué)習(xí)模型將第一次遷移學(xué)習(xí)模型作為相同特征的特征提取器,只更新3層網(wǎng)絡(luò)用于提取心電信號的細(xì)節(jié)特征,這樣使得第二次遷移學(xué)習(xí)的識別時間大大縮短了。
為了更全面地測試出本文所提出模型的廣泛性和準(zhǔn)確性,將本文所提出的基于GoogleNet遷移學(xué)習(xí)模型與參考文獻中提出的其他網(wǎng)絡(luò)模型進行了對比分析,如表6所示。
表6 實驗結(jié)果對比分析
綜上可知,相比于其他文獻中提到的方法,本文所提出的基于GoogleNet遷移學(xué)習(xí)的ECG身份識別模型在識別準(zhǔn)確率上明顯高于其他方法,這主要歸功于在識別模型的設(shè)計上對GoogleNet網(wǎng)絡(luò)模型進行了兩次遷移學(xué)習(xí)過程。
本文研究了基于單導(dǎo)聯(lián)心電信號的身份識別技術(shù)。圍繞低信噪比、噪聲干擾大的單導(dǎo)聯(lián)心電信號,并分別從心電信號的質(zhì)量評估模型、去噪處理、生成ECG軌跡圖和身份識別4個方面進行深入研究。本文提出的心電信號質(zhì)量評估算法能有效篩選出合格的ECG信號,從而降低了計算量,減少了資源損耗。本文還構(gòu)建了基于卷積神經(jīng)網(wǎng)絡(luò)的深度遷移識別模型,該模型在花費較短識別時間的同時,又保證了較高的識別準(zhǔn)確率,為金融、公安、安防等信息安全領(lǐng)域提供了一種魯棒性強、防偽能力高的生物識別新途徑。
然而,本文也存在一定的不足,一方面盡管本文所構(gòu)建的識別模型在兩個網(wǎng)絡(luò)數(shù)據(jù)庫中的大量樣本中,均取得了較高的識別準(zhǔn)確率,但是單單兩個網(wǎng)絡(luò)數(shù)據(jù)集的結(jié)果很難體現(xiàn)出模型強大的泛化能力,并且與經(jīng)過大量實測數(shù)據(jù)集訓(xùn)練過的模型相比,還存在一定的差距;另一方面應(yīng)該不斷深入研究優(yōu)化深度學(xué)習(xí)算法,不斷提高識別率,在適當(dāng)增加輸入層數(shù)量的同時,獲得更高的識別率。