盧 清,陳建萍,胡俊勇,葉莉華
( 贛南師范大學(xué) 物理與電子信息學(xué)院,江西 贛州 341000)
生物識(shí)別技術(shù)是利用個(gè)體固有的生理特性(如人臉、虹膜、指紋)和行為特征(如聲音、筆跡、步態(tài)等)來(lái)進(jìn)行身份識(shí)別,已廣泛應(yīng)用于區(qū)域訪問(wèn)管理、安防監(jiān)控、金融安全等領(lǐng)域.它具有穩(wěn)定、普遍、唯一、高度安全和低成本的特點(diǎn).而借助于人體內(nèi)蘊(yùn)的心電信號(hào)具備這樣的特點(diǎn),因此基于心電信號(hào)的生物特征識(shí)別成為國(guó)際身份識(shí)別技術(shù)研究的熱點(diǎn).基于基準(zhǔn)、非基準(zhǔn)和混合基準(zhǔn)識(shí)別算法是目前心電信號(hào)身份識(shí)別的三大方向.本文重點(diǎn)研究的是第二種.Biel L在2001年分析了利用心電信號(hào)作為身份識(shí)別的可行性[1].楊向林將ECG波形的小波特征、波形特征作為特征向量,通過(guò)相關(guān)系數(shù)閾值法對(duì)35位被試者識(shí)別,身份識(shí)別率分別為87.5%、82.5%[2].趙治棟提出了對(duì)心電單周期進(jìn)行快速傅里葉變換的匹配追蹤稀疏分解,將原子的時(shí)頻參數(shù)和投影值作為特征參數(shù),SVM作為分類(lèi),實(shí)現(xiàn)了97.1%[3].駱騰飛采用小波與形態(tài)學(xué)的組合特征輸入到特征學(xué)習(xí)網(wǎng)絡(luò)中,構(gòu)成50維的維度,達(dá)到心跳分類(lèi)準(zhǔn)確率為87%,身份識(shí)別準(zhǔn)確率96%[4].WAN X把R峰定位得到5種搏動(dòng)波形數(shù)據(jù),以心跳周期作為輸入來(lái)構(gòu)造四層一維卷積神經(jīng)網(wǎng)絡(luò)(CNN)進(jìn)行特征提取和分類(lèi),在MIT-BIH數(shù)據(jù)庫(kù)中驗(yàn)證,該方法分類(lèi)準(zhǔn)確率達(dá)到99.10%[5].LIU X最近探討了一種兩級(jí)融合特征的新型心電識(shí)別系統(tǒng).首先從分割后的心跳數(shù)據(jù)中提取希爾伯特變換和功率譜特征,得到一個(gè)基本的融合特征,再利用PCANet提取信號(hào)的判別深度特征.獲得的兩層學(xué)習(xí)特征利用MF (MaxFusion)算法來(lái)融合和壓縮,其識(shí)別結(jié)果達(dá)到95%以上[6].WANG J等根據(jù)多重分形去趨勢(shì)波動(dòng)分析(MF-DFA)和多重分形去趨勢(shì)交叉相關(guān)分析(MF-DXA),分析健康受測(cè)者與心功能障礙受測(cè)者的多重分形特性,把赫斯特(Hurst)指數(shù)作為輸入向量,將其帶入支持向量機(jī)(SVM)進(jìn)行分類(lèi)[7].
本文研究基于多重分形特征的心電身份識(shí)別方法.由于人的心臟是一個(gè)復(fù)雜的混沌系統(tǒng)[8],而心電信號(hào)又是心臟電活動(dòng)的一種體現(xiàn),所以可以利用多重分形來(lái)分析屬于混沌系統(tǒng)的心電信號(hào).首先介紹多重分形原理.
分形能描述整體與局部的自相似性,但單一分形維難以全面刻畫(huà)其細(xì)微結(jié)構(gòu)[9-11].為此,Grassberger等人[12]系統(tǒng)地提出了多重分形的概念,引入質(zhì)量指數(shù)和多重分形譜來(lái)描述分形體多重分形.其理論已成為研究復(fù)雜非線性混沌系統(tǒng)的重要方法之一.
多重分形可以刻畫(huà)分形體在不同分形尺度下的生長(zhǎng)過(guò)程.若把分形體看作一個(gè)整體,被分成若干個(gè)分形生長(zhǎng)小區(qū)域,小區(qū)域的面積記為ε,小區(qū)域總數(shù)記為Nε,并將第i個(gè)小區(qū)域內(nèi)的生長(zhǎng)概率記為Pi(ε),則不同分形小區(qū)域的生長(zhǎng)概率Pi(ε)和其面積ε之間的關(guān)系如式所示[9]:
Pi(ε)∝εσi,i=1,2,…,N,
(1)
其中σi稱(chēng)為奇異指數(shù)或局部分形維,其值反映不同面積分形區(qū)域的生長(zhǎng)概率.多重分形幾何體被定義為所研究對(duì)象被分成的小區(qū)域具有不同的奇異指數(shù)值;反之,單分形幾何體被定義為所研究對(duì)象被分成的小區(qū)域具有相同或相近的奇異指數(shù)值.
將式(1)兩邊同時(shí)取q次方并求和得到一個(gè)配分函數(shù):
(2)
對(duì)式(2)兩邊取對(duì)數(shù)后,推導(dǎo)出lnΓ(q,ε)與lnε間的變化率,叫做質(zhì)量指數(shù)τ(q),即:
(3)
若τ(q)與q間滿足線性關(guān)系,則分形體具有單分形特性;若τ(q)是變量q的凸函數(shù),則分形體具有多重分形特性.
下面將推導(dǎo)多重分形譜f(σ)與σ之間的關(guān)系.根據(jù)
(4)
式(4)可進(jìn)一步表示為[11]
Γ(q,ε)=∑εσq-f(σ)=ετ(q).
(5)
可將式(5)右邊等式改寫(xiě)為[12]
∑εσq-f(σ)-τ(q)=1.
(6)
分析可知當(dāng)ε→0時(shí),只有σq-f(σ)-τ(q)=0的項(xiàng)被保留下來(lái),即有[12]
f(σ)=σq-τ(q).
(7)
式(7)表示多重分形譜f(σ)~σ之間的關(guān)系.由于f(σ)表示具有相同奇異指數(shù)的分形子集的分形維,從整體上進(jìn)一步反映了分形體生長(zhǎng)分布概率的分布特征.
可見(jiàn),質(zhì)量指數(shù)τ(q)~q和多重分形譜f(σ)~σ是描述多重分形的兩組參量.
本文研究基于多重分形特征的心電身份識(shí)別方法,其過(guò)程圖如圖1所示.
圖1 本算法的過(guò)程圖
由于心電信號(hào)在采集過(guò)程中容易受到工頻干擾、肌電干擾、基線漂移等干擾,所以首先需要對(duì)原始的心電訓(xùn)練數(shù)據(jù)進(jìn)行消噪.本文使用數(shù)字濾波器過(guò)濾噪聲.然后對(duì)心電信號(hào)標(biāo)準(zhǔn)化分割,消除ECG的心率變異,使其得到長(zhǎng)度相同的標(biāo)準(zhǔn)心跳周期.再對(duì)每個(gè)心跳進(jìn)行多重分形分析,從其質(zhì)量指數(shù)、多重分形譜中提取質(zhì)量指數(shù)對(duì)稱(chēng)度、多重分形譜寬度、最大最小概率子集分形維數(shù)差、多重分形譜非對(duì)稱(chēng)指數(shù)這4個(gè)特征,將其存入模板數(shù)據(jù)庫(kù)中.心電測(cè)試數(shù)據(jù)同理,其標(biāo)準(zhǔn)化的心跳周期也獲得這4個(gè)特征參數(shù).最后通過(guò)SVM分類(lèi)將測(cè)試數(shù)據(jù)的特征參數(shù)與模板數(shù)據(jù)庫(kù)逐一比對(duì),找出最佳匹配的心跳周期.心跳判別結(jié)果通過(guò)多數(shù)投票規(guī)則,來(lái)判斷受測(cè)者的身份,最終結(jié)果通過(guò)身份識(shí)別率來(lái)衡量.
多重分形理論已成為解決非線性混沌系統(tǒng)的重要方法.由于人的心臟是一個(gè)復(fù)雜的混沌系統(tǒng),而心電信號(hào)又是心臟電活動(dòng)的一種體現(xiàn),所以利用多重分形分析手段來(lái)研究心電的混沌也是一種趨勢(shì)[13-15].
首先需研究不同的心電信號(hào)是否體現(xiàn)出多重分形特性, 所以在無(wú)標(biāo)度區(qū)間內(nèi)分析其多重分形特性.從PTB心電數(shù)據(jù)庫(kù)隨機(jī)選取了5個(gè)受測(cè)者的ECG,實(shí)驗(yàn)結(jié)果如圖2、3所示.圖2(a)、3(a)是長(zhǎng)度為880 ms(一個(gè)心跳周期)心電的質(zhì)量指數(shù)τ(q)和多重分形譜f(σ)曲線圖.可見(jiàn),質(zhì)量指數(shù)具有一定的弱非線性,ECG1、ECG3的凸函數(shù)性比其他3個(gè)更強(qiáng);多重分形譜中奇異指數(shù)σ分布有一定的取值范圍,粗略在0.96到1.28之間,ECG1的最寬,而ECG4最窄;f(σ)表達(dá)的分形維數(shù)范圍也較豐富,在0.17到1.2之間,ECG3、ECG4的分形維數(shù)差最大,而ECG1、ECG5的最小,同時(shí)ECG5的多重分形譜呈現(xiàn)左對(duì)稱(chēng)的鉤狀,其他4條則右對(duì)稱(chēng)的鉤狀.可見(jiàn)t=880 ms時(shí),多重分形譜曲線比質(zhì)量指數(shù)曲線更豐富地表達(dá)了心電的特征.圖2(b)、3(b)是長(zhǎng)度為20 s心電的質(zhì)量指數(shù)τ(q)及多重分形譜f(σ)曲線圖.與圖2相比,圖3在數(shù)據(jù)加長(zhǎng)情況下,5個(gè)受測(cè)者質(zhì)量指數(shù)的凸函數(shù)性明顯增強(qiáng),特別ECG2增強(qiáng)最明顯;多重分形譜中奇異指數(shù)σ分布的范圍也凸顯加寬,大致在1.4到4.4之間.f(σ)表達(dá)的分形維數(shù)差值也加劇,如ECG4由原來(lái)差值約0.6增長(zhǎng)到1.2.通過(guò)圖2、3分析,說(shuō)明心電信號(hào)具有多重分形特性.
圖2 心電信號(hào)的質(zhì)量指數(shù)
圖3 心電信號(hào)的多重分形譜
根據(jù)2個(gè)曲線特性上的差異,從質(zhì)量指數(shù)曲線中自定義了1個(gè)參數(shù),多重分形譜中自定義了3個(gè)參數(shù),共4個(gè)參數(shù)作為心電識(shí)別的多重分形特征.
(8)
Δσ=σmax-σmin
(9)
Δf=|f(σmin)-f(σmax)|,
(10)
(11)
式(11)中,ΔσL=σ0-σmin,ΔσR=σmax-σ0.其中,σ0為譜最大值maxf(σ)所對(duì)應(yīng)的奇異指數(shù).
Rτ體現(xiàn)了心電信號(hào)多重分形特性的對(duì)稱(chēng)程度;Δσ刻畫(huà)了心電信號(hào)多重分形特性的顯著程度;Δf則描述多重分形譜大、小峰值所占的比例;Rσ從整體上體現(xiàn)了多重分形譜曲線的非對(duì)稱(chēng)程度.
圖4是前述5名受測(cè)者在訓(xùn)練時(shí)間20 s條件下,被標(biāo)準(zhǔn)化成多個(gè)心跳后對(duì)應(yīng)的4種多重分形特征的概率密度圖.可知,被自定義的4種特征均有一定的辨識(shí)力.圖4(a)中,Rτ容易把ECG1和ECG3區(qū)別開(kāi),對(duì)ECG2、ECG4無(wú)能為力;圖4(d)中,Rσ易將ECG5與其他受測(cè)者分開(kāi),而對(duì)其他受測(cè)者辨別能力較差.結(jié)合圖4(b)和(c),Δσ和Δf一起分析才能區(qū)分ECG2、ECG4.因此需要融合這4種特征來(lái)識(shí)別各個(gè)受測(cè)者.
圖4 4種多重分形特征的概率密度曲線
支持向量機(jī)的原理是基于損失函數(shù)最小,在輸入空間中創(chuàng)造出一個(gè)超平面與不同類(lèi)樣本集之間的距離最大.此時(shí)的超平面稱(chēng)為最優(yōu)分類(lèi)超平面.在線性可分時(shí),直接在輸入空間尋求樣本的最優(yōu)超平面;線性不可分時(shí),將低維的輸入空間樣本先映射到高維空間,然后使用線性算法尋找最優(yōu)超平面.它具有較好的泛化能力全局最優(yōu)性.目前支持向量機(jī)既支持二元分類(lèi)也支持多元分類(lèi).
本文使用了MIT-BIH Normal Sinus Rhythm心電數(shù)據(jù)庫(kù)[18]、PTB心電數(shù)據(jù)庫(kù)[19]和MIT-BIH ST Change心電數(shù)據(jù)庫(kù)[20].第1個(gè)數(shù)據(jù)庫(kù)的心率變化相對(duì)穩(wěn)定,并且訓(xùn)練與測(cè)試的數(shù)據(jù)來(lái)自同一個(gè)記錄時(shí)間.第2個(gè)數(shù)據(jù)庫(kù)包含了豐富的醫(yī)療診斷狀況的心電數(shù)據(jù),如心肌炎、瓣膜病、心肌梗死等,用于訓(xùn)練與測(cè)試的數(shù)據(jù)記錄時(shí)間跨度從幾個(gè)月到幾年不等.第3個(gè)數(shù)據(jù)庫(kù)的心率變異性較大,因?yàn)樗窃诓煌\(yùn)動(dòng)條件下采集的;選取心率在50 bpm~70 bpm之間(即存在較大的心率變異)的ECG數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),其他時(shí)段的心率數(shù)據(jù)作為測(cè)試數(shù)據(jù).
為方便處理,本實(shí)驗(yàn)均將3個(gè)數(shù)據(jù)庫(kù)的采樣率重采樣至250 Hz,并從中各選取了10名受測(cè)者的心電數(shù)據(jù).截取了20 s長(zhǎng)度的心電數(shù)據(jù)進(jìn)行訓(xùn)練,8 s長(zhǎng)度的心電數(shù)據(jù)用于測(cè)試.使用了質(zhì)量指數(shù)對(duì)稱(chēng)度、多重分形譜寬度、最大最小概率子集分形維數(shù)差、多重分形譜非對(duì)稱(chēng)指數(shù)這4個(gè)參數(shù)作為單個(gè)心跳周期的特征.SVM分類(lèi)器中,最佳的核函數(shù)對(duì)應(yīng)下面3個(gè)數(shù)據(jù)庫(kù)依次是Quadratic SVM、Linear SVM、Medium Gaussian SVM.測(cè)試得到的心跳判別結(jié)果通過(guò)多數(shù)投票規(guī)則,來(lái)判斷受測(cè)者的身份,最終結(jié)果通過(guò)身份識(shí)別率來(lái)衡量.本文提出的算法測(cè)試性能如表1所示.
表1 心電的四個(gè)多重分形特征在3個(gè)數(shù)據(jù)庫(kù)的識(shí)別結(jié)果
表2 本文方法與其他算法之間的比較
表2是本文方法與其他算法之間的比較.其中楊向林利用小波特征,識(shí)別率只有87.5%,明顯不足.駱騰飛的方法對(duì)特征降維后仍是50維,時(shí)間與空間復(fù)雜度仍很高,時(shí)效性偏差;趙治棟的方法雖用了快速傅里葉變換的稀疏分解,但速度仍較慢.相比,本文方法的特征只有四維,程序簡(jiǎn)單,識(shí)別率也能達(dá)到可行的水平.
本文研究了一種基于多重分形特征的心電身份識(shí)別方法.它提取質(zhì)量指數(shù)對(duì)稱(chēng)度、多重分形譜寬度、最大最小概率子集分形維數(shù)差、多重分形譜非對(duì)稱(chēng)指數(shù)作為單個(gè)心跳周期的多重分形特征,最后構(gòu)建SVM進(jìn)行分類(lèi),身份識(shí)別率達(dá)到96.67%,取得了較高的識(shí)別率.多重分形特性能對(duì)心電信號(hào)進(jìn)行精細(xì)地描述,也將為正常與非正常竇性心律的分類(lèi)和辨識(shí)提供一種可能.