蔣芳芳, 王浩乾, 程天慶, 洪楚航
(東北大學(xué) 醫(yī)學(xué)與生物信息工程學(xué)院, 遼寧 沈陽(yáng) 110169)
近年來(lái)心血管疾病的發(fā)病率逐年上升,其高致殘率和高死亡率嚴(yán)重危害人類健康[1].房顫作為一種常見(jiàn)的心律失常疾病,其發(fā)病率也呈現(xiàn)逐年上升趨勢(shì),且易導(dǎo)致心房血栓、缺血性腦卒中等惡性事件[2].由于房顫的發(fā)作具有時(shí)間不確定、臨床表現(xiàn)不明顯等特征,故研究其日常實(shí)時(shí)、連續(xù)監(jiān)測(cè)與診斷的方法尤為重要.
目前,臨床上多以心電圖(electrocardiogram, ECG)作為房顫診斷的金標(biāo)準(zhǔn).其主要表現(xiàn)為:由心房活動(dòng)異常引起的P波消失,以及R-R間期紊亂等特征[3-5].由于ECG的檢測(cè)過(guò)程需要在人體體表安裝電極等裝置,且需要特定的檢測(cè)設(shè)備及檢測(cè)人員,不但會(huì)對(duì)受試者的皮膚產(chǎn)生刺激,其活動(dòng)范圍也會(huì)被約束,不適于日常長(zhǎng)期監(jiān)測(cè)使用.因此,面向家庭監(jiān)測(cè)的非接觸式房顫?rùn)z測(cè)方法成為當(dāng)今研究熱點(diǎn).
心沖擊(ballistocardiogram, BCG)信號(hào)記錄由心臟搏動(dòng)與大動(dòng)脈血液循環(huán)所導(dǎo)致的與心跳同步的身體振動(dòng),是一種非接觸式的心臟功能實(shí)時(shí)檢測(cè)方法[6].目前,BCG在心率提取、心律變異等方面已取得較為顯著的研究成果[7-8].關(guān)于房顫診斷的研究,近幾年也呈現(xiàn)上升趨勢(shì).Bruser等[9]提取了BCG信號(hào)的經(jīng)典時(shí)頻特征,并應(yīng)用機(jī)器學(xué)習(xí)算法開(kāi)展了對(duì)房顫、竇性心律和體動(dòng)的三分類研究.Yu等[10]通過(guò)小波變換提取BCG信號(hào)的時(shí)頻特征,應(yīng)用機(jī)器學(xué)習(xí)分類器實(shí)現(xiàn)了房顫與非房顫的二分類診斷.Wen等[11]將BCG轉(zhuǎn)換為能量信號(hào),并提取了新型的數(shù)據(jù)序列特征,最終通過(guò)機(jī)器學(xué)習(xí)算法檢測(cè)房顫.綜上,當(dāng)前基于BCG信號(hào)的房顫診斷研究,主要集中于應(yīng)用機(jī)器學(xué)習(xí)分類器對(duì)信號(hào)的時(shí)頻特征進(jìn)行分類,并取得了初步的成果,能夠證明應(yīng)用BCG信號(hào)進(jìn)行房顫?rùn)z測(cè)的可行性.
但是,基于時(shí)頻特征的檢測(cè)方法較為依賴于信號(hào)的波形變化,而B(niǎo)CG信號(hào)受個(gè)體差異、不同檢測(cè)裝置、外界干擾等因素影響較大,故難以保證房顫診斷精度的穩(wěn)定性.因此,本文提出應(yīng)用相空間重構(gòu)理論提取BCG信號(hào)的二維節(jié)律特征,并結(jié)合卷積神經(jīng)網(wǎng)絡(luò),提高房顫診斷的自適應(yīng)性與穩(wěn)定性.通過(guò)對(duì)相空間重構(gòu)過(guò)程中嵌入維數(shù)與時(shí)間延遲等參數(shù)的討論,探索面向房顫診斷的BCG信號(hào)新型特征提取方法,為其在房顫等心血管疾病診斷中的實(shí)際應(yīng)用提供一種可行的解決方案和嶄新的研究方向.
本文采用基于聚偏氟乙烯(polyvinlidene fluoride, PVDF)壓電薄膜傳感器的臥姿BCG信號(hào)檢測(cè)裝置和CT-08S動(dòng)態(tài)心電記錄儀分別采集同步的BCG信號(hào)和ECG信號(hào),采樣頻率分別為125 Hz和200 Hz.其中,ECG信號(hào)作為房顫診斷的金標(biāo)準(zhǔn),主要起到為同步BCG信號(hào)設(shè)置標(biāo)簽的作用.共有59名受試者參與該實(shí)驗(yàn),男性34名,女性25名,年齡分布為27至93歲.記錄時(shí)間均為8h(晚上12點(diǎn)至次日8點(diǎn)),記錄環(huán)境為醫(yī)院病房臥姿采集方式.
為了解決不同采樣率的問(wèn)題,本文對(duì)ECG信號(hào)進(jìn)行降采樣,統(tǒng)一采樣率為125 Hz.并根據(jù)房顫診斷的常用分幀方法,設(shè)定分幀長(zhǎng)度為24 s,共計(jì)3 000采樣點(diǎn)[12].將BCG數(shù)據(jù)分為房顫(AF)和非房顫(NAF)兩類,設(shè)定標(biāo)簽0為NAF,1為AF.通過(guò)對(duì)原始信號(hào)進(jìn)行篩選和預(yù)處理,濾除波幅過(guò)大的體動(dòng)及波幅過(guò)小的離床時(shí)段,最終共獲得2 000幀較為純凈的BCG數(shù)據(jù),其中AF與NAF各1 000幀.
本文所提方法流程如圖1所示.
圖1 所提方法流程框圖
主要工作包括:選取合適的嵌入維數(shù)m和時(shí)間延遲τ進(jìn)行相空間重構(gòu),以保證所提二維節(jié)律特征對(duì)房顫的表征性能;構(gòu)建適于對(duì)二維節(jié)律特征進(jìn)行分類的卷積神經(jīng)網(wǎng)絡(luò)模型.下面分別介紹這兩部分的具體方法.
相空間重構(gòu)是一種用于分析復(fù)雜系統(tǒng)的數(shù)學(xué)方法,其將離散的一維時(shí)間序列x(t)轉(zhuǎn)化為x(t)與x(t+τ),…,x[t+(m-1)τ]共同形成的m維空間,其中τ為時(shí)間延遲,m為嵌入維數(shù)[13-15].通過(guò)高維映射實(shí)現(xiàn)對(duì)波形形態(tài)的實(shí)時(shí)量化,在保證與原始序列相同的動(dòng)態(tài)行為前提下,挖掘時(shí)間序列中所隱含的動(dòng)態(tài)信息,從而彌補(bǔ)經(jīng)典時(shí)頻特征中有可能被丟失的潛在信息,更適于處理較長(zhǎng)的非平穩(wěn)數(shù)據(jù).因此,考慮將一維BCG信號(hào)映射到高維的相空間中,從而獲取表征房顫節(jié)律異常的特征參數(shù).
設(shè)單個(gè)時(shí)間序列x(t)=(x1,x2,…,xN),其中N為x(t)中數(shù)據(jù)采樣點(diǎn)數(shù),則延遲重構(gòu)的狀態(tài)向量為vi=(xi,xi+τ,xi+2τ,…,xi+(m-1)τ).基于時(shí)間序列x(t)的相空間重構(gòu)表示為
(1)
該方法的具體實(shí)現(xiàn)過(guò)程主要包括以下三步:
1) 確定延遲參數(shù)τ和嵌入維數(shù)m;
2) 通過(guò)延遲τ個(gè)采樣點(diǎn),將BCG信號(hào)映射到m維相空間中,獲取其m維相空間軌跡;
3) 將m維相空間軌跡映射到二維平面上,以提高其輸入神經(jīng)網(wǎng)絡(luò)進(jìn)行分類的效率.其中,二維映射平面的選擇要遵循高維信息最大化描述準(zhǔn)則[13],從而獲取最優(yōu)二維節(jié)律特征.
2.2.1 延時(shí)參數(shù)τ的確定
延遲參數(shù)τ的選取,直接影響重構(gòu)相空間軌跡的表征性能.若τ選取過(guò)小,則相空間軌跡會(huì)擠壓于同一位置,反之則會(huì)使各分量相互獨(dú)立,無(wú)法得到有效的特征[16].因此選取合適的τ值,不僅能夠有效反映心血管系統(tǒng)的特性,而且能夠提高后期房顫診斷的分類性能.目前,τ的選取方法主要包括:自相關(guān)函數(shù)法(autocorrelation, AC)、互信息法(mutual information, MI)、嵌入窗法等[17-18].本文采用AC法和MI法兩種方法,對(duì)其所選τ值的分類性能進(jìn)行比較,以獲取最優(yōu)重構(gòu)參數(shù).
AC法所估算的τ值為自相關(guān)函數(shù)的過(guò)零點(diǎn)[19],其計(jì)算公式為
(2)
MI法所估算的τ值為互信息函數(shù)的局部最小值點(diǎn)[20],其計(jì)算公式為
(3)
式中:pi為x(t)值為i的概率;pi,j為x(t)為i,x(t+τ)為j的聯(lián)合分布概率.
AC法和MI法在估算τ值的過(guò)程中理論上僅需要提取首個(gè)過(guò)零點(diǎn)和局部最小值點(diǎn).然而,在實(shí)踐中,由于噪聲和微小波動(dòng)的存在,真實(shí)的τ值之前可能會(huì)出現(xiàn)偽過(guò)零點(diǎn)或偽局部最小值點(diǎn),從而導(dǎo)致無(wú)法繪制出最優(yōu)的相空間軌跡.因此,本文選取了前三個(gè)過(guò)零點(diǎn)或局部最小值點(diǎn)τ1,τ2和τ3,作為最優(yōu)τ值的候選項(xiàng),而后通過(guò)實(shí)驗(yàn)確定最終的τ值.圖2為AC法前三個(gè)過(guò)零點(diǎn)處的τ1,τ2和τ3.圖3為MI法前三個(gè)局部最小值點(diǎn)處的τ1,τ2和τ3.
圖2 AC法估算τ值
圖3 MI法估算τ值
2.2.2 嵌入維數(shù)m的確定
嵌入維數(shù)m決定時(shí)間序列重構(gòu)相空間的維度,若m較小,則吸引子無(wú)法完全展開(kāi),反之則會(huì)使得計(jì)算量劇增,誤差變大[16].因此,本文選擇常用的虛假最近鄰點(diǎn)法(false nearest neighbor, FNN)來(lái)選擇最適合BCG信號(hào)重構(gòu)的嵌入維數(shù),有效避免信息被隱藏的同時(shí),減小噪聲的影響[21-23].該方法的原理為:在足夠大的維度d上相鄰的兩個(gè)點(diǎn)在維度d+1上并不相鄰,即虛假鄰點(diǎn).隨著d的增大,相空間重構(gòu)軌跡會(huì)逐漸展開(kāi),虛假鄰近點(diǎn)也會(huì)逐步被消除,從而得到能夠還原動(dòng)力學(xué)系統(tǒng)的相空間軌跡.當(dāng)鄰近點(diǎn)減少至可忽略,則選取此時(shí)的d為嵌入維數(shù)m.該算法通過(guò)計(jì)算d與d+1維相空間之間歐氏距離的平方來(lái)確定鄰近點(diǎn)數(shù)量,其計(jì)算公式為
(4)
(5)
其中:r為最近鄰點(diǎn)的數(shù)目;τ為通過(guò)2.2.1節(jié)所估算的最優(yōu)延遲參數(shù).
理論上,若式(4)右側(cè)第二項(xiàng)接近于零,則選擇此時(shí)的d作為相空間重構(gòu)的最優(yōu)嵌入維數(shù).但由于虛假最近鄰點(diǎn)接近零的過(guò)程耗時(shí)較長(zhǎng)或無(wú)法完全實(shí)現(xiàn),因此實(shí)際情況下當(dāng)虛假最近鄰點(diǎn)小于某一閾值(1%或5%),即選定d為合適的嵌入維數(shù).將%FNN作為函數(shù)來(lái)表征d增加過(guò)程中虛假最近鄰點(diǎn)的變化,公式為
(6)
其中:FNN為當(dāng)前虛假最近鄰點(diǎn)的個(gè)數(shù);totalN為最初虛假最近鄰點(diǎn)的個(gè)數(shù).
圖4為將BCG信號(hào)作為輸入時(shí)所得FNN的變化情況.
圖4 虛假最近鄰點(diǎn)法估算m值
由圖4可見(jiàn),當(dāng)m為3時(shí)%FNN值已小于5%,故本文選取3作為BCG信號(hào)相空間重構(gòu)的最優(yōu)嵌入維數(shù).
卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)是一種包含卷積或相關(guān)計(jì)算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò)[24].由于卷積核參數(shù)的共享性和層間連接的稀疏性,使得卷積神經(jīng)網(wǎng)絡(luò)能夠以較少的計(jì)算量實(shí)現(xiàn)網(wǎng)格狀的拓?fù)涮匦?從而更適用于圖像分析.
2.3.1 神經(jīng)網(wǎng)絡(luò)的輸入
由于信號(hào)的檢測(cè)時(shí)間較長(zhǎng),體動(dòng)等因素的干擾致使信號(hào)出現(xiàn)基線漂移、不穩(wěn)定等問(wèn)題.本文沿(1,1,1)方向?qū)ο嗫臻g軌跡進(jìn)行了坐標(biāo)軸轉(zhuǎn)換[25],轉(zhuǎn)換公式為
(7)
(8)
(9)
經(jīng)過(guò)以上坐標(biāo)轉(zhuǎn)換,信號(hào)x(t)的垂直移動(dòng)即u(t)的變化,不會(huì)引起v和w的變化.此時(shí),將三維相空間軌跡投影到(v,w)平面上,可避免信號(hào)垂直基線漂移的影響,以突出描述波形形狀和頻率隨時(shí)間的變化.因此,本文將相空間軌跡垂直于向量(1,1,1)平面的投影定義為二維節(jié)律特征,以作為卷積神經(jīng)網(wǎng)絡(luò)的輸入.
2.3.2 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
本文基于相空間重構(gòu)得到的二維節(jié)律特征,設(shè)計(jì)了一個(gè)16層的卷積神經(jīng)網(wǎng)絡(luò):8層卷積層、4層池化層、1層flatten層、3層全連接層,其框圖如圖5所示.卷積層不僅可以對(duì)數(shù)據(jù)深入分析,提取高維特征,而且可以通過(guò)共享權(quán)值參數(shù)提高訓(xùn)練速度,同時(shí)卷積之后的dropout操作提高了模型抗過(guò)擬合能力.池化層可以在保留特征的同時(shí)減少特征矩陣和網(wǎng)絡(luò)參數(shù),也可以增加阻力避免過(guò)擬合.最后,Flatten層和全連接層對(duì)前向傳播的特征進(jìn)行處理,并由softmax函數(shù)激活,輸出二分類結(jié)果.
圖5 所設(shè)計(jì)的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
3.1.1 時(shí)間延遲τ的選擇
為確定適于BCG 信號(hào)房顫?rùn)z測(cè)的時(shí)間延遲τ,分別應(yīng)用經(jīng)典的AC法和MI法估算的AF與NAF數(shù)據(jù)的τ1,τ2和τ3值,并繪制統(tǒng)計(jì)直方圖如圖6、圖7所示.
圖6 AC法估算τ值直方圖
圖7 MI法估算τ值直方圖
由圖6與圖7可見(jiàn),通過(guò)AC法估算的τ值直方圖分布較為雜亂,無(wú)法顯著區(qū)分AF與NAF.而MI法所估算的τ值直方圖均趨于正態(tài)分布,且對(duì)AF和NAF有一定的區(qū)分度.由此可見(jiàn),MI法較AC法能避免噪聲和其他微小波動(dòng)對(duì)τ值計(jì)算的影響,更適合于延遲參數(shù)的選擇.此外,通過(guò)比較圖7中τ1,τ2與τ3的直方圖分布,可見(jiàn)τ2和τ3較τ1可更明顯地區(qū)分出AF和NAF,而τ3相對(duì)于τ2具有更小的偏度,這表明在大多數(shù)情況下τ3使得x(t)與x(t+1)有最小的依賴性.因此,初步選定τ3為最佳延遲參數(shù).
為定量驗(yàn)證以上結(jié)論,分別應(yīng)用兩種方法估算了全部BCG分幀的τ值,并繪制了τ1,τ2和τ3的分布箱線圖,如圖8、圖9所示.
圖8 AC法估算τ值箱線圖
圖9 MI法估算τ值箱線圖
通過(guò)比較可見(jiàn),在相同BCG數(shù)據(jù)下,MI法的異常值較少,具有較好的魯棒性,箱體的上下線分布對(duì)于AF與NAF的區(qū)分度也最為明顯,與直方圖分布顯示結(jié)果一致.因此,最終選定τ3為最佳延遲參數(shù).
3.1.2 嵌入維數(shù)m的選擇
為定量驗(yàn)證2.2.2中初步選定的嵌入維數(shù)3,本文應(yīng)用FNN算法分別估算嵌入維數(shù)m1,m2和m3,并繪制AF與NAF的分布箱線圖,如圖10所示.
由圖10可見(jiàn),m1,m2與m3的平均值均介于2和3之間.同時(shí),根據(jù)相空間重構(gòu)理論,嵌入維數(shù)的選取應(yīng)盡可能足夠大,以充分還原系統(tǒng)的動(dòng)力學(xué)特性.因此,最終選定m=3為最佳嵌入維數(shù).
圖10 FNN估算m值箱線圖
3.2.1 二維節(jié)律特征獲取
應(yīng)用m=3,τ=τ3繪制BCG信號(hào)的相空間軌跡,并將其投影到與向量(1,1,1)正交的二維平面上.所獲取的二維節(jié)律特征如圖11所示.
由圖11可見(jiàn),通過(guò)選取適合的相空間重構(gòu)參數(shù),所繪制的二維節(jié)律特征圖可較為顯著地區(qū)分出AF與NAF.
圖11 BCG信號(hào)的二維節(jié)律特征圖
3.2.2 分類性能比較
為驗(yàn)證所提方法的檢測(cè)性能,本文復(fù)現(xiàn)了文獻(xiàn)[26]中的基于BCG信號(hào)的經(jīng)典房顫診斷方法.通過(guò)提取BCG信號(hào)的17個(gè)經(jīng)典時(shí)頻特征(6個(gè)時(shí)域特征,11個(gè)時(shí)頻域特征),作為機(jī)器學(xué)習(xí)分類器的輸入,以實(shí)現(xiàn)AF與NAF的區(qū)分.本文共比較了5個(gè)機(jī)器學(xué)習(xí)分類器,分別為support vector machine(SVM),naive Bayesian(NB),bootstrap aggregated decision trees(BAT),random forests(RF)和decision tree(DT).
性能參數(shù)方面選取了準(zhǔn)確率(Acc)、靈敏度(Sen)、精確度(Pre)、特異性(Spe)四個(gè)參數(shù)以評(píng)估所提方法的分類性能.其計(jì)算公式分別為
Acc=(TP+TN)/(TP+FP+TN+FN) ,
(10)
Sen=TP/(TP+FN) ,
(11)
Pre=TP/(TP+FP) ,
(12)
Spe=TN/(TN+FP) .
(13)
其中:TP為真陽(yáng)數(shù)據(jù)值;TN為真陰數(shù)據(jù)值;FP為假陽(yáng)數(shù)據(jù)值;FN為假陰數(shù)據(jù)值,均由混淆矩陣計(jì)算所得.
最終十折交叉驗(yàn)證所獲得的混淆矩陣及對(duì)應(yīng)的分類結(jié)果如表1、表2所示.
表1 十折交叉驗(yàn)證混淆矩陣
表2 分類性能對(duì)比
通過(guò)對(duì)比可見(jiàn):
1) 對(duì)于基于經(jīng)典時(shí)頻特征的機(jī)器學(xué)習(xí)分類方法, RF分類器的性能最佳,這一結(jié)論與文獻(xiàn)[26]的結(jié)論一致.但分類的絕對(duì)精度低于文獻(xiàn)[26],這主要由于本文所采用的實(shí)驗(yàn)數(shù)據(jù)量與受試者的人數(shù)均高于文獻(xiàn)[26],更接近日常篩查的數(shù)據(jù)環(huán)境,而經(jīng)典的時(shí)頻特征對(duì)數(shù)據(jù)波形的差異性依賴較大,從而導(dǎo)致分類精度的下滑.
2) 本文所提方法的分類性能總體優(yōu)于基于經(jīng)典時(shí)頻特征的RF分類器.這主要由于本文所提取的二維節(jié)律特征,較經(jīng)典時(shí)頻特征,對(duì)房顫的異常節(jié)律信息有更顯著的區(qū)分度.此外,神經(jīng)網(wǎng)絡(luò)分類器較機(jī)器學(xué)習(xí)分類器具有更高的自適應(yīng)性,因此更適于多受試者的數(shù)據(jù)分類.由此驗(yàn)證了所提方法在日常房顫篩查中的優(yōu)越性.
1) 通過(guò)討論相空間重構(gòu)過(guò)程中的時(shí)間延遲τ和嵌入維數(shù)m的最優(yōu)解,獲取了BCG信號(hào)針對(duì)房顫診斷的最優(yōu)重構(gòu)參數(shù).較經(jīng)典時(shí)頻特征,提出了二維節(jié)律特征,并在房顫?rùn)z測(cè)方面取得了較為理想的表征效果,為BCG信號(hào)相空間重構(gòu)理論在心血管疾病診斷領(lǐng)域的應(yīng)用提供了參考依據(jù).
2) 針對(duì)重構(gòu)軌跡的二維節(jié)律,設(shè)計(jì)了自動(dòng)診斷房顫的CNN分類器.并通過(guò)與經(jīng)典機(jī)器學(xué)習(xí)分類器進(jìn)行對(duì)比,獲得了更優(yōu)的房顫分類性能.從而驗(yàn)證了端對(duì)端分類器的優(yōu)越性,為基于BCG信號(hào)的心血管疾病智能監(jiān)測(cè)提供了新的研究思路.