蔚文婧,王尋,張鵬遠,顏永紅,2,3
1.中國科學院聲學研究所語言聲學與內(nèi)容理解重點實驗室,北京100190;2.中國科學院新疆理化技術(shù)研究所新疆民族語音語言信息處理實驗室,新疆烏魯木齊830011;3.中國科學院大學,北京100049
房顫是最常見的心律失常,發(fā)生在1%~2%的普通人群中,可引起中風、心力衰竭、冠狀動脈等疾病,有很高的發(fā)病率和死亡率[1-2]。心電 圖(Electrocardiogram, ECG)檢查是臨床上醫(yī)生診斷心血管疾病的重要依據(jù)[3-4]。但是房顫現(xiàn)象有時是突發(fā)性的,需要長時監(jiān)測ECG 才能確診,因此,有必要利用人工智能技術(shù)對ECG 信號進行深入分析,從而實現(xiàn)智能的房顫監(jiān)測診斷。目前單導聯(lián)的便攜式ECG設(shè)備可隨時隨地進行操作[5],結(jié)合智能識別技術(shù),可在家庭、社區(qū)以及農(nóng)村推廣使用,實現(xiàn)房顫的智能篩查。
ECG 自動診斷算法一般包含兩個步驟:提取有效病理信號特征以及利用分類器進行正常/疾病的判別。在ECG 波形中,QRS復合波特征最為明顯,可作為后續(xù)特征查找的基準點,是ECG 自動分析的關(guān)鍵環(huán)節(jié)[6],也是可用于房顫識別的有效特征[7-8]。R波檢測算法的研究至今已有幾十年,識別R波的主要方法有:(1)信號變換法,一般有濾波器組法、差分法[9]、小波變換法[10]、香農(nóng)能量(Shannon Energy)法[11]、經(jīng)驗?zāi)B(tài)分解法(Empirical Mode Decomposition, EMD)[12]、希爾伯特變換(Hilbert Transform)[13]等。主要是根據(jù)ECG 信號的特點進行相應(yīng)變換,放大R 波特征。其中,差分法是根據(jù)R波的高幅值、大斜率特點[14],對ECG 做差分濾波后用閾值判定R 波位置,這種方法簡單但抗噪性差;小波變換法主要根據(jù)小波系數(shù)中的模極值過零點與信號中的奇異點相對應(yīng)的關(guān)系來確定R 波位置,對于工頻干擾、一些低頻干擾都可以得到較好的檢測結(jié)果,檢測率較高,但是計算量較大,時間代價較高;其他變換方法也有計算量較大,時間代價較高的問題。(2)數(shù)學形態(tài)學法[15],這是一種基于集合運算的非線性信號處理方法?;谛盘柕木植啃螤钐卣?,可以保持信號的幾何信息。這種方法計算過程簡單,僅需做形態(tài)運算(開/閉)與比較(最大、最小運算)。該方法的檢測精確性與結(jié)構(gòu)元素的大小以及信號采樣率等因素有關(guān)。(3)模板匹配法,即用一個標準的ECG 信號建立一個模板,然后將模板信號與待檢測信號對齊比較,并且每一步都必須計算整幅搜索子圖和模板信號的相關(guān)系數(shù)[16]。該算法運算量較大,實時性較差,難以對病理性的畸變R波進行檢測。
對于房顫分類器,以往研究中的數(shù)據(jù)集偏小,一般使用二維點圖線性分類[17]、支持向量機(Support Vector Machine, SVM)[18]等方法進行分類。隨著便攜ECG 功能設(shè)備的普及,大量醫(yī)學信號將開源發(fā)布,這些方法已不適用大數(shù)據(jù)集的分析。人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)作為一種通過模仿生物神經(jīng)網(wǎng)絡(luò)建立起來的計算模型,具有較好的自學習、建模能力和較強的魯棒性能等,目前已有廣泛的應(yīng)用[19-20]。
本研究針對單導聯(lián)的ECG 信號進行房顫研究,并從應(yīng)用的角度出發(fā),基于差分閾值法設(shè)計一種新型自適應(yīng)的R波閾值檢測方法,可直接對高通濾波后的ECG 信號進行閾值判定,提取ECG 中的R 波位置和幅度做為特征。對于正常和房顫ECG 的分類器將選擇多層感知器(Multilayer Perceptron, MLP),這是一種結(jié)構(gòu)簡單的ANN,其網(wǎng)絡(luò)參數(shù)采用深層置信網(wǎng)絡(luò)(Deep Belief Networks, DBN)預訓練算法進行初始化,之后再用誤差反向傳播(Back-Propagation,BP)算法對MLP網(wǎng)絡(luò)權(quán)重的參數(shù)進行精細調(diào)整。
正常的標準ECG 信號的每個周期是由P 波、QRS 波群、T 波和U 波構(gòu)成,如圖1 所示。對于一個標準的ECG 信號周期,R 波是變化最劇烈的部分,而且蘊含著豐富的病理信息,R 波的正確識別對病理ECG信號的識別有關(guān)鍵作用。
圖1 標準ECG的一個心動周期Fig.1 A cardiac cycle of the normal electrocardiogram(ECG)
本研究設(shè)計了一種自適應(yīng)閾值檢測R 波位置的方法,計算量小,可有效檢測R 波位置以及負向規(guī)律極值點,如S 波。具體流程為:(1)對ECG 信號進行降采樣,采樣率降為50 Hz。ECG 信號變換較慢,50 Hz 采樣率可滿足R 波的特征表現(xiàn),低采樣可以去除快速振動干擾并減少后續(xù)閾值判斷次數(shù)。(2)對ECG 信號進行5 Hz 高通濾波。ECG 信號比較微弱,僅為毫伏級,極易受環(huán)境的影響。在動態(tài)ECG 信號的記錄過程中,可能會伴隨有電極接觸噪聲、工頻噪聲,以及人體自身呼吸、肌肉收縮引起的基線漂移和肌電干擾。高通濾波可去除肌點噪聲干擾,得到平整的ECG 基線;同時濾波有差分作用,可提高R 波位置的幅度值。(3)在濾波后的ECG 信號中找出正負極點。不同的導聯(lián)方法和心臟異常都有可能導致QRS波的主波向下,因此要考慮負向的R波情況。(4)分別尋找針對正向和負向極值點的閾值。逐步增大閾值門限,大于閾值的極值點逐漸減少,選定閾值的條件為大于此閾值的極值點個數(shù)不再改變;同時考慮RR間期范圍為0.5~2.0 s。
ANN 是一種區(qū)分性分類模型,通過學習可找到數(shù)據(jù)不同類的分類面。MLP 是多個單層感知器的疊加,前一層神經(jīng)元的輸出組成后一層神經(jīng)元的輸入。由于輸入特征簡潔,研究樣本數(shù)量有限,本研究采用3 層MLP,只包含一個隱含層。采用全連接的網(wǎng)絡(luò),即網(wǎng)絡(luò)中每層的神經(jīng)元與前一層所有的神經(jīng)元都互相連接。MLP輸入層為R波檢測算法得到的ECG正負向極值點信息,具體輸入特征的計算方法為:(1)對于得到的正向極值點的位置,求出每個RR 間期,歸一化正向極值點的RR 間期,使其分布在[-1,1]范圍;(2)歸一化正向極值點的幅值,使幅值分布在[0,1]范圍;(3)對于負向極值點的位置,求出每個RR 間期并歸一化,使其分布在[-1,1]范圍;(4)歸一化負向極值點的幅值,使幅值分布在[-1,0]范圍;(5)按照30個正向RR 間期、30個正向極值點幅值、30個負向RR間期、30 個負向極值點幅值的順序形成一幀特征,共120維,因此輸入層為120個神經(jīng)元。
隱含層的神經(jīng)元個數(shù)為20,輸出層是兩個神經(jīng)元,分別表示正常、房顫的概率。確定MLP的網(wǎng)絡(luò)結(jié)構(gòu)后,MLP的網(wǎng)絡(luò)參數(shù)用DBN預訓練算法進行初始化。預訓練算法將每個相鄰兩層神經(jīng)網(wǎng)絡(luò)當作受限玻爾茲曼機(Restricted Boltzmann Machine,RBM)進行無監(jiān)督特征學習,并逐層學習每層的權(quán)重。網(wǎng)絡(luò)參數(shù)初始化之后,再用誤差BP算法對MLP網(wǎng)絡(luò)權(quán)重的參數(shù)進行精細調(diào)整。圖2為房顫檢測MLP網(wǎng)絡(luò)結(jié)構(gòu)示意圖。
圖2 房顫檢測MLP網(wǎng)絡(luò)結(jié)構(gòu)示意圖Fig.2 Multilayer perceptron(MLP)architecture used for atrial fibrillation recognition
MⅠT-BⅠH 心率失常數(shù)據(jù)庫是目前全球通用的開源ECG 數(shù)據(jù)集[21-22],包含有豐富的病理ECG 數(shù)據(jù)并且對每個R 波位置都有醫(yī)學專家標注。本研究運用MⅠT-BⅠH 心率失常數(shù)據(jù)對R 波檢測算法進行驗證。圖3 是對數(shù)據(jù)庫中含有強烈的噪聲和基線漂移的ECG數(shù)據(jù)106的V1通道檢測R波的結(jié)果。圖3a中紅色圈為數(shù)據(jù)庫原始人工標注R波位置,圖3b 中黑色圈為本算法測得的R 波位置。從圖3 可知,此段數(shù)據(jù)受到嚴重干擾,部分數(shù)據(jù)的R波特征點不明顯,但是本算法通過降采樣、高通濾波等簡單步驟進行去噪后,運用自適應(yīng)的幅度閾值可得到準確的R波位置。
圖3 106信號V1通道ECG波形Fig.3 ECG wave of 106 signals in V1 channel
此外,選取多組來自MⅠT-BⅠH 心率失常數(shù)據(jù)庫的ECG 數(shù)據(jù),把本算法的檢測結(jié)果與數(shù)據(jù)庫提供的R 波的位置進行逐次比較。根據(jù)美國關(guān)于動態(tài)ECG分析算法標準ANSⅠ/AAMⅠEC38,若由算法得到的QRS 復合波檢出點在標注時刻的150 ms 范圍內(nèi),則認為算法檢測到的QRS 復合波是正確的。本研究得出的檢測結(jié)果如表1 所示,平均檢出準確率達98.59%,而且只有漏檢,沒有誤檢。部分漏檢是由于病變導致R 波嚴重失真,這樣檢出的RR 間期就會增大,代表一定的病理信息。該算法實現(xiàn)簡便,可為后續(xù)房顫識別提供快速準確的特征。
為了研究單通道ECG數(shù)據(jù)的房顫現(xiàn)象,本研究選擇開源的PhysioNet/Computing in Cardiology Challenge 2017訓練集數(shù)據(jù)庫[6]。數(shù)據(jù)采集儀器是AliveCor單通道ECG記錄儀,數(shù)據(jù)平均長度約30 s,采樣率300 Hz,對每個信號都有專業(yè)病理標注,無R波位置標注。本研究選取正常集和房顫集作為研究,正常集包含5 076個ECG信號,房顫集有758個ECG信號,隨機選取90%的房顫信號(682個)、并取相同數(shù)量的正常信號作為本研究的訓練集,剩余的76個房顫信號、4 394個正常數(shù)據(jù)為測試集,用于驗證識別算法的性能。經(jīng)過訓練學習后,MLP對房顫ECG信號的識別靈敏度為96.00%,特異性為84.18%,平均識別率為90.09%。表2是本研究與其他相似研究的結(jié)果比較。
表1 MIT-BIH心率失常數(shù)據(jù)庫R波檢測結(jié)果Tab.1 R-wave detection results on MIT-BIH arrhythmia database
在Solikhah 等[7]的研究中,數(shù)據(jù)庫包含準確的R波位置信息,采用R波的標準偏差、平均值、模、范圍、最小值、最大值做特征,采用Adaptive Neuro-FuzzyⅠnference System 做分類器進行房顫識別。在求特征時,用于統(tǒng)計特征量的ECG 長度不同,得到最終的識別結(jié)果也不同,使用的ECG 越長,對R 波信息的統(tǒng)計越準確,識別結(jié)果也更好。最優(yōu)靈敏度和特異性分別為81.45%、90.81%。本研究中的特征使用30 個R波位置,所用ECG 長度約30 s,得到的結(jié)果也很有可比性,說明本研究的特征方法性能可靠。
Kruger 等[17]提 出Spectral Frequency Dispersion Metric(FDM)和RR間期的二維特征。最終的測試數(shù)據(jù)包含8個房顫信號以及21個正常信號,數(shù)據(jù)量較小,將二維特征畫成二維點圖,直接在特征點圖上劃線性分割線進行區(qū)分。Boon等[18]采用SVM方法進行正常/房顫分類,特征是心率變異性,識別靈敏度和特異性分別為86.8%、88.7%。通過分析對比,說明本研究提出的特征算法和分類算法具有良好的性能。在其他研究者的前期研究中,小數(shù)據(jù)樣本是大多數(shù)ECG研究者遇到的問題。但是隨著單通道便攜ECG功能設(shè)備的普及,會出現(xiàn)越來越多的ECG信號等醫(yī)學信號用于研究,應(yīng)借鑒大數(shù)據(jù)方法來分析醫(yī)學信息。
本研究針對日益增加的ECG 自動識別需求,提出一種基于MLP 的新型房顫ECG 識別算法。首先設(shè)計一種新型自適應(yīng)的R 波閾值檢測算法,計算量小,可有效檢測出噪聲、畸變情況下的R 波位置。然后以R 波位置和幅度為特征、以MLP 為分類器進行正常/房顫ECG 識別。MLP 的網(wǎng)絡(luò)參數(shù)采用DBN 預訓練算法進行初始化,然后再用誤差BP 算法對MLP網(wǎng)絡(luò)權(quán)重的參數(shù)進行精細調(diào)整。在開源數(shù)據(jù)集的驗證結(jié)果表明本算法的R 波檢測功能和房顫識別功能都有較高的準確率,結(jié)果與其他工作有可比性。該算法能針對單通道的ECG 信號進行分析,計算量小,可結(jié)合ECG便攜設(shè)備使用。
表2 本文與其他相似研究的比較Tab.3 Comparison of the study with other similar studies