武瑞倩,吳賢發(fā),詹何慶
(海南醫(yī)學(xué)院生物醫(yī)學(xué)信息與工程學(xué)院,海南 ???571199)
睡眠是人類一項(xiàng)重要的生理活動(dòng),研究發(fā)現(xiàn),腦電信號在不同睡眠的階段變化較大,可用于睡眠分期研究[1-3]。然而,相較于腦電,心電信號的檢測更為可靠和便利,且心率變異性的特征與睡眠的各個(gè)階段息息相關(guān)[4-6]。因此,利用心電信號進(jìn)行睡眠分期逐漸成為當(dāng)今研究的熱點(diǎn)。相關(guān)研究方法包括深度神經(jīng)網(wǎng)絡(luò)模型、隱馬爾可夫模型、梯度提升樹和極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)等[7-10]。本研究基于極限學(xué)習(xí)機(jī)的方法,對心電信號進(jìn)行識別以實(shí)現(xiàn)睡眠分期。
本研究選用麻省理工學(xué)院的多導(dǎo)睡眠數(shù)據(jù)庫(包含17 位受試者的睡眠記錄)[11],并提取了病人信息、心電信息、RR間期信息和睡眠注釋信息。在信號預(yù)處理環(huán)節(jié),采用巴特沃斯低通濾波器去除心電信號的工頻干擾,使用中值濾波去除肌電干擾和基線漂移。然后,通過特征提取以降低原始的冗余數(shù)據(jù)。該環(huán)節(jié)主要是對于心率變異性(heart rate variability,HRV)進(jìn)行特征提取,包括時(shí)域特征提取、頻域特征提取和非線性特征提取[12-15]。其中,時(shí)域特征包括平均值、標(biāo)準(zhǔn)差、相鄰RR 之間差異的標(biāo)準(zhǔn)差等;頻域指標(biāo)包括極低頻(very low frequency,VLF)、低頻(low frequency,LF)和高頻(high frequency,HF);非線性特征主要提取受試者的交感神經(jīng)指數(shù)與迷走神經(jīng)指數(shù)。
本研究屬于監(jiān)督學(xué)習(xí)中的分類問題,在進(jìn)行睡眠分期時(shí),將睡眠分別做三分類、四分類、六分類的預(yù)測。考慮到極限學(xué)習(xí)機(jī)具有學(xué)習(xí)速度快、泛化能力強(qiáng)的優(yōu)點(diǎn),本研究選用極限學(xué)習(xí)機(jī)對睡眠實(shí)現(xiàn)不同類別的分期。在提取各受試者心電信號特征之后,以7:3的比例劃分訓(xùn)練集與測試集,使用訓(xùn)練集在ELM 的分類模型上進(jìn)行訓(xùn)練,得到分類模型后,再利用測試集在分類模型上進(jìn)行分類,并測算準(zhǔn)確率。
心電信號噪聲預(yù)處理結(jié)果如圖1所示。其中紅色曲線為原始心電信號,綠色曲線為去除工頻干擾后的信號,藍(lán)色曲線為去除完三種噪聲后的信號。
圖1 心電信號預(yù)處理結(jié)果圖
在醫(yī)學(xué)界對睡眠進(jìn)行分析時(shí),主要是對HRV 進(jìn)行短程分析,即30 秒。因此,本設(shè)計(jì)的所有對于QRS波群的特征提取均以30 秒為單位。以66 號受試者為例,提取到的各個(gè)特征的相關(guān)信息以及特征值如表1所示。
表1 心電信號特征提取表
如前所述,本研究選用ELM 對睡眠分期進(jìn)行測試,并且選用了三分類、四分類和六分類等分期標(biāo)準(zhǔn),相關(guān)結(jié)果如表2所示。
表2 ELM分類結(jié)果
人睡眠狀態(tài)下,心電信號中的心率變異性與自主神經(jīng)系統(tǒng)存在密切關(guān)系,且睡眠受自主神經(jīng)系統(tǒng)的管制,而睡眠分期是剖析睡眠狀況和評估睡眠質(zhì)量的重要措施之一。本文提出基于心電信號的睡眠自動(dòng)分期方法,包括心電信號數(shù)據(jù)庫的處理、預(yù)處理、波群檢測、特征提取,以及分類方法選擇。
近年來,隨著人工智能的普及,利用機(jī)器學(xué)習(xí)的方法對睡眠進(jìn)行分期逐漸成為主流研究趨勢。利用支持向量機(jī)、隱馬爾可夫、隨機(jī)森林等發(fā)展較成熟的機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)睡眠分期的準(zhǔn)確率普遍都在70%以上[16]。由于極限學(xué)習(xí)機(jī)的概念提出較晚,因此目前利用極限學(xué)習(xí)機(jī)對睡眠進(jìn)行分期的研究依然較少,Utomo等采用加權(quán)極值機(jī)器學(xué)習(xí)處理非平衡學(xué)習(xí)數(shù)據(jù)集,特征選擇使用了粒子群優(yōu)化的方法,建立基于心電信號的睡眠階段分類模型,準(zhǔn)確率達(dá)到73.09%[17]。吳振華等提取了心電信號、呼吸信號以及心肺耦合信號的特征,將特征進(jìn)行最優(yōu)選擇后,使用粒子群優(yōu)化和極限學(xué)習(xí)機(jī)結(jié)合的方法對睡眠進(jìn)行二分類、三分類、四分類和六分類,準(zhǔn)確率均超過75%[18]。從實(shí)驗(yàn)結(jié)果來看,本研究的準(zhǔn)確率并不高,但算法較為簡單,可應(yīng)用范圍廣。未來的研究可以從以下幾個(gè)方面進(jìn)行優(yōu)化。
⑴原多導(dǎo)睡眠數(shù)據(jù)庫可能存在某些信號值的缺失,可以對這些缺失的信息進(jìn)行填補(bǔ)或刪除。
⑵在對HRV 特征提取完后沒有對異常的特征進(jìn)行剔除,在之后的研究中需要設(shè)定特征值的判別標(biāo)準(zhǔn)以剔除不合適的特征值。
⑶機(jī)器學(xué)習(xí)模型的參數(shù)是根據(jù)以往學(xué)者得出的經(jīng)驗(yàn)進(jìn)行調(diào)優(yōu)的,后續(xù)可以在大量實(shí)驗(yàn)的基礎(chǔ)上進(jìn)行參數(shù)的調(diào)節(jié)以獲得更高的準(zhǔn)確率。