劉 戈,劉洪運(yùn),石金龍,王國(guó)靜,胡敏露,王衛(wèi)東*
(1.解放軍總醫(yī)院海南醫(yī)院,海南三亞 572013;2.解放軍總醫(yī)院醫(yī)學(xué)創(chuàng)新研究部,北京 100853)
睡眠是一項(xiàng)非常重要的生命過程,但至今人們對(duì)其了解甚少。關(guān)于睡眠的研究最早在20 世紀(jì)30年代,德國(guó)精神病學(xué)家Berger[1]發(fā)現(xiàn)人在睡眠和清醒期(wakefulness,W)的腦電(electroencephalogram,EEG)活動(dòng)呈現(xiàn)不同的節(jié)律。1953 年,Aserinsky 等[2]發(fā)現(xiàn)了快速眼動(dòng)(rapid eye movement,REM)睡眠與非快速眼動(dòng)(non-rapid eye movement,NREM)睡眠。1968年,Rechtschaffen 和 Kales[3]提出 R&K 睡眠分期標(biāo)準(zhǔn),將 NREM 期細(xì)分為 S1、S2、S3、S4 4 個(gè)階段。S1、S2階段為淺度睡眠期(light sleep,LS),S3、S4 階段為慢波睡眠期(slow-wave sleep,SWS)。2007 年美國(guó)睡眠醫(yī)學(xué)學(xué)會(huì)(American Academy of Sleep Medicine,AASM)將R&K 金標(biāo)準(zhǔn)中的 S1、S2 期相應(yīng)更改為 N1(NREM 1)、N2(NREM 2)期,S3、S4 期合并為 N3(NREM 3)期。睡眠分期標(biāo)準(zhǔn)如圖1 所示。
圖1 睡眠分期標(biāo)準(zhǔn)
近年來,基于單通道EEG、多通道EEG、心電(electrocardiogram,ECG)、眼電(electro-oculogram,EOG)、肌電(electromyogram,EMG)和呼吸等生理信號(hào)提取特征并使用分類器進(jìn)行睡眠分期研究的國(guó)內(nèi)外學(xué)者越來越多。表1 列舉了一些代表性研究,可以發(fā)現(xiàn),對(duì)單一信號(hào)而言,基于EEG 的睡眠分期效果最好,ECG 次之,EOG 和 EMG 更差一些。因此,本文以分期準(zhǔn)確率為重點(diǎn),研究一種基于單通道EEG 特征提取的睡眠分期方法。
表1 睡眠分期國(guó)內(nèi)外代表性研究
傳統(tǒng)的睡眠EEG 特征提取方法主要有時(shí)域、頻域、非線性分析方法。時(shí)域分析是出現(xiàn)最早且最直觀的分析方法,頻域分析僅能發(fā)掘信號(hào)的頻域特征。這2 種分析方法對(duì)于EEG 這種非平穩(wěn)、非線性信號(hào)而言存在一定的局限性。非線性分析方法,如樣本熵、模糊熵、功率譜熵等適用于EEG 信號(hào),但忽略了非高斯過程的某些有用信息,如相位信息。而高階譜分析就可以發(fā)現(xiàn)睡眠EEG 的相位耦合信息。本文將在傳統(tǒng)特征的基礎(chǔ)上提取EEG 雙譜特征、遞歸性特征和符號(hào)動(dòng)力學(xué)特征,有針對(duì)性地補(bǔ)充傳統(tǒng)特征未能表現(xiàn)的睡眠EEG 有用信息或改進(jìn)傳統(tǒng)特征的不足,組成一組信息表達(dá)較為全面的特征向量并使用分類器進(jìn)行睡眠自動(dòng)分期。
本研究的技術(shù)路線如圖2 所示,首先獲取睡眠EEG 數(shù)據(jù)并進(jìn)行預(yù)處理,然后使用各種特征提取方法獲得EEG 樣本的特征參量,使用支持向量機(jī)(support vector machine,SVM)作睡眠時(shí)相分類,最后經(jīng)隱馬爾可夫模型(hidden Markov model,HMM)學(xué)習(xí)睡眠階段之間的過渡規(guī)則并對(duì)已分類得到的睡眠標(biāo)簽作修正,最終得到整夜睡眠分布及分期準(zhǔn)確率。下面將對(duì)各部分進(jìn)行具體介紹。
圖2 基于單通道EEG 進(jìn)行睡眠分期的技術(shù)路線圖
本文使用的睡眠EEG 數(shù)據(jù)來自于麻省理工學(xué)院(Massachusetts Institute of Technology,MIT)創(chuàng)建的睡眠生理信號(hào)開源數(shù)據(jù)庫(kù)(網(wǎng)址為https://physionet.org/physiobank/database/sleep-edfx/)[10]。隨機(jī)選取 10名受試者整夜睡眠實(shí)測(cè)數(shù)據(jù),共10 組EEG 數(shù)據(jù)。其中6 組為健康志愿者的睡眠數(shù)據(jù),另外4 組為有輕微失眠志愿者的睡眠數(shù)據(jù)。均使用Fpz-Cz 單導(dǎo)聯(lián)EEG 信號(hào),受試者包括3 名男性和7 名女性,年齡21~65 歲。測(cè)試過程中未使用任何藥物進(jìn)行干擾。采樣頻率均為100 Hz。睡眠分期結(jié)果由專家進(jìn)行了人工標(biāo)注(以R&K 睡眠分期標(biāo)準(zhǔn)標(biāo)記),以專家標(biāo)注結(jié)果作為標(biāo)簽來測(cè)試本文提出方法的分期準(zhǔn)確性。定義30 s 的EEG 為一個(gè)樣本,本文所選取的10 名受試者睡眠樣本分布見表2。
表2 受試者睡眠樣本分布情況 單位:個(gè)
由于EEG 信號(hào)具有很強(qiáng)的變異性和隨機(jī)性,且易受到其他生理信號(hào)和外界環(huán)境的干擾,所以需要對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理以消除可能存在的噪聲干擾。本研究選用0.5~47 Hz 的FIR(finite impulse response)帶通濾波器對(duì)原始EEG 數(shù)據(jù)作去噪處理。
本文提取了時(shí)域、頻域、雙譜、非線性特征共計(jì)48 個(gè),詳見表3。下面將著重介紹本研究中使用到的部分特征。
表3 特征列表
1.2.1 頻域特征
使用自回歸(auto-regression,AR)參數(shù)模型法求得EEG 的功率譜密度分布函數(shù),分別求取0.5~4 Hz(δ 波)、4~8 Hz(θ 波)、8~13 Hz(α 波)和 13~30 Hz(β波)4 個(gè)頻帶的功率以及0.5~30 Hz 頻率范圍的總功率(Ez)。以4 種特征波占總功率的比值作為其頻域的4 個(gè)特征。頻域能量特征被證實(shí)是應(yīng)用于睡眠分期的有效特征[7,11]。
將頻域的功率譜密度與香農(nóng)熵相結(jié)合,可得到功率譜熵。功率譜熵被發(fā)現(xiàn)對(duì)S2 期與SWS 期的區(qū)分有非常顯著的意義[12]。功率譜熵的計(jì)算公式為
式中,Pi為頻率值i 處的歸一化功率譜密度。
95%頻譜邊緣頻率(SEF95)是在功率譜密度分布函數(shù)的基礎(chǔ)上,計(jì)算95%曲線下面積的頻譜邊界頻率,指95%總功率譜處最高邊界的頻率。它將功率譜簡(jiǎn)化為單一的參數(shù)(即獨(dú)立的觀察指標(biāo)),能夠清楚地表示腦電圖功率與頻譜的移動(dòng)。麻醉過程中的SEF95 值反映EEG 信號(hào)從清醒時(shí)候的高頻波為主到麻醉后低頻波占優(yōu)勢(shì)的過程。而與麻醉深入過程類似,在睡眠由淺入深的過程中,SEF95 值也會(huì)隨著睡眠的加深而減小,REM 期又稍增大。圖3 為SC4112E0 受試者的982 個(gè)睡眠樣本6 個(gè)睡眠時(shí)相SEF95 值的平均值變化圖,其規(guī)律性明顯。說明SEF95 除可作為麻醉深度的指標(biāo)外,還可作為睡眠深度判別的依據(jù)之一。
圖3 SC4112E0 受試者睡眠6 期各期SEF95 平均值
1.2.2 雙譜特征
為補(bǔ)充傳統(tǒng)分析方法難以得到的EEG 信息或者改進(jìn)傳統(tǒng)特征的不足,本文引入了高階統(tǒng)計(jì)量。高階統(tǒng)計(jì)量是指階數(shù)大于二階的統(tǒng)計(jì)量,主要有高階矩、高階累積量和高階譜等[13]。高階統(tǒng)計(jì)量于傳統(tǒng)特征而言,其優(yōu)勢(shì)在于:(1)高階統(tǒng)計(jì)量可以展現(xiàn)EEG信號(hào)的相位耦合信息,而傳統(tǒng)特征僅能展現(xiàn)EEG信號(hào)的幅值信息。(2)高斯過程三階及以上累積量均為0,因此高階統(tǒng)計(jì)量可以有效抑制信號(hào)的背景高斯噪聲。
雙譜(即三階譜)是最常用、最簡(jiǎn)單的高階譜。雙譜是三階累積量的二維傅里葉變換,其公式表示如下:
式中,f1、f2為歸一化頻率;τ1、τ2為三階累積量 c3x的時(shí)延;ω1=2πf1,ω2=2πf2。雙譜值 B 反映的是(ω1,ω2)處的幅值相位耦合能量。本文將在雙譜值B 的基礎(chǔ)上,進(jìn)一步研究用于睡眠分期的定量特征。
(1)快慢同步比。
快慢同步比是應(yīng)用于麻醉深度檢測(cè)的EEG 雙頻指數(shù)(bispectral index,BIS)的子參數(shù),能夠定量反映不同頻帶信號(hào)相位耦合的程度[14]。在BIS 指數(shù)中,快慢同步比的定義為
式中,B0.5~47代表 EEG 整個(gè)頻域 0.5~47 Hz 的雙譜值之和;B40~47代表高頻區(qū)域 40~47 Hz 的雙譜值之和。兩者之比取對(duì)數(shù)作為反映雙譜分析中相位耦合信息的指標(biāo)——快慢同步比。
基于前期的研究,定義用于睡眠分期的最優(yōu)快慢同步比公式如下[15]:
式中,B0.5~40代表 EEG 頻域 0.5~40 Hz 的雙譜值之和,B10~40代表高頻區(qū)域 10~40 Hz 的雙譜值之和。
(2)雙譜熵。
與功率譜熵類似,將香農(nóng)熵應(yīng)用到雙譜域可得雙譜熵[16]。雙譜熵反映包含有相位耦合信息的雙譜值的非線性特性,其計(jì)算步驟如下:
①計(jì)算求得EEG 信號(hào)的雙譜值Bx(k1,k2);
②計(jì)算各點(diǎn)雙譜值占整個(gè)雙譜域雙譜值總和的概率:
③求出雙譜熵:
(3)快慢同步熵比。
基于雙譜熵的計(jì)算方法,結(jié)合快慢同步比的定義,可定義快慢同步熵比,公式如下:
式中,H0.5~40表示在 0.5~40 Hz 頻帶內(nèi)的雙譜熵,H10~40表示在10~40 Hz 頻帶內(nèi)的雙譜熵??炻届乇确从? 個(gè)雙譜作用域的雙譜熵的比值。
1.2.3 符號(hào)動(dòng)力學(xué)與熵
研究表明,對(duì)比時(shí)域、頻域和時(shí)頻分析方法,采用非線性方法對(duì)非平穩(wěn)EEG 信號(hào)作睡眠分期的效果最優(yōu)[17]。而熵運(yùn)算在非線性分析中占有重要地位。目前,以樣本熵、模糊熵、多尺度熵為特征作睡眠時(shí)相劃分是使用較普遍的一種方法。大量研究證明,這些熵對(duì)睡眠分期效果顯著[18-20]。3 種特征具體的計(jì)算流程本文不再詳述[7,20]。但傳統(tǒng)熵存在其不足之處,主要包括:(1)傳統(tǒng)熵值易受非平穩(wěn)突變干擾的影響;(2)傳統(tǒng)熵受序列概率分布的影響,從而導(dǎo)致其并非單純反映序列的信息增長(zhǎng)率。為了改進(jìn)這些不足,本文使用了將符號(hào)動(dòng)力學(xué)與熵運(yùn)算相結(jié)合的生物電研究方法。具體步驟:首先,定義符號(hào),對(duì)生物電信號(hào)進(jìn)行符號(hào)粗?;?;其次,定義維數(shù)m 和時(shí)延τ,得到短符號(hào)序列[21];最后,對(duì)短符號(hào)序列作不同的熵運(yùn)算,可得符號(hào)化熵。符號(hào)化就是利用有限的符號(hào)實(shí)現(xiàn)數(shù)據(jù)的離散化。定義短符號(hào)序列的過程就是進(jìn)行相空間重構(gòu),相空間重構(gòu)后的字包含有相鄰時(shí)間采樣點(diǎn)的動(dòng)態(tài)信息。因此,使用符號(hào)化熵作為睡眠分期的有效非線性特征以達(dá)到對(duì)生物電信號(hào)特征的有效提取和分析,本文中提取的符號(hào)化熵包括以下2 種:
(1)符號(hào)序列熵(F41)。
符號(hào)化序列求香農(nóng)熵可得符號(hào)序列熵[22]。將原始時(shí)間序列符號(hào)化,得到符號(hào)序列Y,定義短符號(hào)字長(zhǎng)(即維數(shù)m)為2、時(shí)延τ 為1 對(duì)符號(hào)序列進(jìn)行相空間重構(gòu),得到符號(hào)嵌入矢量。對(duì)符號(hào)嵌入矢量中的所有短符號(hào)序列求熵即可得到符號(hào)序列熵。
(2)符號(hào)序列樣本熵(F42)。
將原始時(shí)間序列符號(hào)化和相空間重構(gòu)后得到的短符號(hào)序列求樣本熵可得到符號(hào)序列樣本熵。它與樣本熵的計(jì)算相似,不同之處在于將樣本熵中“嵌入矢量相似”的判斷轉(zhuǎn)化為“符號(hào)嵌入矢量相等”的判斷[23]。
2 種符號(hào)化熵的計(jì)算流程圖如圖4 所示。
圖4 2 種符號(hào)熵計(jì)算流程圖
符號(hào)的定義可以有各種不同的方法,本文使用如下函數(shù)進(jìn)行符號(hào)定義:
式中,xi為 EEG 序列 X 中的元素;yi為得到的符號(hào)序列Y 中的元素;μ1為原始序列X 中大于等于0 的取樣信號(hào)的平均值;μ2為序列X 中小于0 的取樣信號(hào)的平均值;a 是一個(gè)特殊的參數(shù),其值過大會(huì)丟失原始數(shù)據(jù)的詳細(xì)信息,過小會(huì)造成時(shí)間序列受噪聲影響明顯,通常情況下取a=0.05[24]。圖5 為2 名受試者睡眠6 期符號(hào)序列樣本熵均值圖及組間統(tǒng)計(jì)學(xué)分析結(jié)果,可以發(fā)現(xiàn),隨著睡眠的加深,符號(hào)序列樣本熵逐漸減小,S4 期達(dá)到最小,到REM 期又有大幅增加。對(duì)該特征做統(tǒng)計(jì)學(xué)分析,發(fā)現(xiàn)僅標(biāo)注出的組間符號(hào)序列樣本熵,無顯著統(tǒng)計(jì)學(xué)差異(P>0.05),其他各組間均有顯著統(tǒng)計(jì)學(xué)差異。
圖5 2 名受試者睡眠6 期符號(hào)序列樣本熵均值圖
1.2.4 遞歸定量分析
遞歸性表述的是系統(tǒng)在特定時(shí)間狀態(tài)具有相似性,是動(dòng)態(tài)系統(tǒng)和非線性系統(tǒng)的基本特性之一。動(dòng)力學(xué)系統(tǒng)可以用向量集表示,當(dāng)動(dòng)力學(xué)系統(tǒng)中的某2個(gè)特定時(shí)刻的向量之間的歐氏距離小于一定數(shù)值時(shí),定義為遞歸。1987 年,Eckmann 等[25]第一次提出遞歸圖(recurrence plot,RP)分析方法。若2 個(gè)時(shí)刻遞歸,定義為Ri,j=1,在遞歸圖中表現(xiàn)為黑色;若2 個(gè)時(shí)刻非遞歸,定義為 Ri,j=0,在遞歸圖上表示為白色。1994 年,Webber 等[26]首次提出用遞歸定量分析(recurrence quantification analysis,RQA)方法對(duì)遞歸圖中的遞歸點(diǎn)和規(guī)則線段所占的比例進(jìn)行定量分析。RQA 的主要量化參數(shù)有遞歸率(RR)、確定性測(cè)度(DET)、平均對(duì)角線長(zhǎng)度(DLL)、遞歸熵(ENTR)、層狀度(LAM)、捕獲時(shí)間(TT)等。
在不同的睡眠時(shí)相,EEG 信號(hào)的遞歸特性不同,且呈現(xiàn)有規(guī)律的變化。圖6 為隨機(jī)選取的不同睡眠時(shí)相的30 s EEG 樣本各12 個(gè)計(jì)算得到的6 個(gè)遞歸定量特征變化規(guī)律圖??梢园l(fā)現(xiàn),由W 期到NREM 期,隨著睡眠的不斷加深,EEG 信號(hào)遞歸性增強(qiáng),混沌性變?nèi)?,隨機(jī)性減小,6 個(gè)定量特征值均逐漸增大,到S4期達(dá)到最大。在REM 期EEG 信號(hào)遞歸性減弱,6 個(gè)定量特征值又減小。本文使用RR、DET、DLL、ENTR、LAM、TT 這 6 種遞歸定量特征(F43~F48)作為睡眠自動(dòng)分期的特征值。
本文選擇臺(tái)灣的林智仁教授在2001 年開發(fā)的一套成熟、使用非常普遍的SVM 庫(kù)——Libsvm 工具包,采用徑向基核函數(shù)進(jìn)行非線性分類,同時(shí)使用網(wǎng)格搜索方法選取需要設(shè)置的2 個(gè)子參數(shù)c 和g,作多元分類。
使用Libsvm 工具包進(jìn)行分類的步驟如下:
(1)按照Libsvm 工具包要求的格式準(zhǔn)備數(shù)據(jù)集,要求格式為:<label><index1>:<value1><index2>:<value2><index3>:<value3>……
(2)對(duì)數(shù)據(jù)做標(biāo)準(zhǔn)化處理。對(duì)數(shù)據(jù)集進(jìn)行簡(jiǎn)單的縮放處理??s放的主要目的為:①避免一些特征值范圍過大而另一些特征值范圍過??;②避免計(jì)算過程過于復(fù)雜。本文使用Z-score 標(biāo)準(zhǔn)化方法(又叫零-均值規(guī)范化、標(biāo)準(zhǔn)差標(biāo)準(zhǔn)化)處理數(shù)據(jù),經(jīng)過處理的數(shù)據(jù)的均值為0,標(biāo)準(zhǔn)差為1。Z-score 標(biāo)準(zhǔn)化的公式如下:
(3)應(yīng)用徑向基核函數(shù)(RBF 核函數(shù))將輸入樣本映射到高維特征空間,解決在低維空間中線性不可分的問題。
(4)選擇得到最優(yōu)的c 和g。c 為懲罰因子,表示對(duì)類中離群樣本的重視程度,c 值越大說明越重視離群樣本;g 為核函數(shù)參數(shù)。c 和g 的選擇對(duì)分類精度影響很大,在本研究中,使用SVMcgForClass 函數(shù)完成c 和g 的選擇。
(5)用得到的最優(yōu)c 和g 訓(xùn)練分類模型。使用Libsvm 工具包中的svmtrain 函數(shù)訓(xùn)練多分類模型。
圖6 睡眠6 期EEG 數(shù)據(jù)6 種遞歸定量特征均值變化圖
(6)利用獲得的模型進(jìn)行測(cè)試。使用Libsvm 工具包中的svmpredict 函數(shù)測(cè)試分類的準(zhǔn)確度。
睡眠各階段之間的過渡模式不是隨機(jī)的和沒有聯(lián)系的,而是遵循一定的規(guī)則,如:從清醒狀態(tài)不可能直接進(jìn)入深度睡眠期。HMM 模型就是為了學(xué)習(xí)睡眠階段的轉(zhuǎn)換規(guī)則,減少分類產(chǎn)生的誤差,提高睡眠分期的準(zhǔn)確性。
本文中HMM 模型的具體表達(dá)如下:
(1)隱含狀態(tài)C:受試者5、受試者10 的專家人工標(biāo)注的R&K 標(biāo)準(zhǔn)睡眠分期標(biāo)簽,C={W,REM,S1,S2,S3,S4}。
(2)可觀測(cè)狀態(tài) O:將表 2 中受試者 1~4、6~9 作為訓(xùn)練模型,分類得到的受試者5、受試者10 的睡眠 6 期分期標(biāo)簽,O={W,REM,S1,S2,S3,S4}。
(3)隱含狀態(tài)概率轉(zhuǎn)移矩陣A(Transmit_matix):隱含狀態(tài)的6 種睡眠時(shí)相間相互轉(zhuǎn)變的概率矩陣。
(4)發(fā)射矩陣 B(Emission_matix):即可觀測(cè)狀態(tài)轉(zhuǎn)移矩陣,為可觀測(cè)狀態(tài)6 種睡眠時(shí)相間相互轉(zhuǎn)變的概率矩陣。
基于HMM 模型作睡眠分期修正的流程如圖7所示。
將10 名受試者共計(jì)10 925 個(gè)睡眠樣本整合在一起,總樣本睡眠各期分布見表2。由于樣本數(shù)據(jù)較多,使用90%的樣本作為訓(xùn)練集進(jìn)行SVM 分類模型的訓(xùn)練,另外10%作為測(cè)試集。睡眠6 期分類的測(cè)試準(zhǔn)確率達(dá)85.06%。具體睡眠各期的分類結(jié)果見表4。
從表 4 中可以看出,W 期、S2 期、S4 期和 REM期分期準(zhǔn)確率相對(duì)較高,分別為97.97%、91.68%、85.17%和82.50%。分期效果較差的是S1 期和S3 期,準(zhǔn)確率僅為41.27%和60.42%,測(cè)試集總體的睡眠分期準(zhǔn)確率達(dá)85.06%。在分期準(zhǔn)確率較低的S1 期和S3 期中,S1 期有 25.40%的樣本誤分為 REM 期,有17.46%的樣本誤分為W 期;S3 期有27.08%的樣本誤分為S2 期,有7.29%的樣本誤分為S4 期。本文使用十折交叉驗(yàn)證提高結(jié)果的可靠性,十折交叉驗(yàn)證的平均準(zhǔn)確率為83.68%。為使受試者睡眠分期結(jié)果更符合實(shí)際且改善個(gè)別睡眠時(shí)相分期結(jié)果較差的情況,本研究中增加了HMM 模型,構(gòu)造了SVM-HMM睡眠自動(dòng)分期模型提高睡眠分期的準(zhǔn)確率。
圖7 睡眠分期修正HMM 模型流程圖
表4 10 925 個(gè)樣本數(shù)據(jù)睡眠6 期測(cè)試結(jié)果(分類準(zhǔn)確率)單位:%
將表2 中10 名受試者共計(jì)10 925 個(gè)睡眠樣本作為訓(xùn)練集進(jìn)行SVM 分類模型的訓(xùn)練,得出訓(xùn)練模型用于全新受試者ST7052J0 的整夜睡眠樣本的睡眠時(shí)相分類,準(zhǔn)確率為79.16%。再增加隱馬爾可夫模型作睡眠分布修正后,得到睡眠6 期分期準(zhǔn)確率為87.34%。睡眠分期結(jié)果如圖8 所示??梢园l(fā)現(xiàn):(1)HMM 模型學(xué)習(xí)了睡眠階段之間的轉(zhuǎn)換規(guī)則,使分期結(jié)果較只使用SVM 分類器得到的分期結(jié)果更接近人的實(shí)際睡眠分布,能清晰地將睡眠時(shí)相的轉(zhuǎn)換表達(dá)出來。(2)專家標(biāo)注睡眠分布與經(jīng)HMM 模型修正后的該受試者的睡眠分布一致性高。
圖8 ST7052J0 受試者睡眠實(shí)際分布與分類結(jié)果分布圖
表5 給出了使用SVM-HMM 睡眠自動(dòng)分期模型ST7052J0 受試者的睡眠分期結(jié)果。由表5 可以看出,該睡眠分期模型對(duì)于S2 期、S4期與REM 期的分期準(zhǔn)確率分別為89.90%、99.21%和94.25%,準(zhǔn)確率較高。對(duì)比表4 中睡眠分期的測(cè)試結(jié)果,S1 期和S3 期的分期準(zhǔn)確率有了明顯的提升,S1 期的分期準(zhǔn)確率達(dá)到78.51%。說明HMM 模型的應(yīng)用大大提高了睡眠分期的準(zhǔn)確率,改進(jìn)了部分睡眠時(shí)相分期結(jié)果較差的不足。在眾多相關(guān)研究中,該模型對(duì)全新受試者睡眠6 期的分期準(zhǔn)確率較高,說明該方法泛化能力較強(qiáng),可以用于全新受試者的睡眠分期,具有潛在的臨床價(jià)值?;诒疚奶岢龅腟VM-HMM 睡眠自動(dòng)分期方法得到的T7052J0 受試者的睡眠6 期分期準(zhǔn)確率達(dá)87.34%。
表5 ST7052J0 受試者睡眠6 期分類結(jié)果(預(yù)測(cè)準(zhǔn)確率) 單位:%
本文將研究的重點(diǎn)放在睡眠分期的特征提取及分期修正上,構(gòu)造了一個(gè)基于EEG 信號(hào)特征提取的睡眠自動(dòng)分期模型(SVM-HMM 模型)。在特征提取方面,創(chuàng)新性定義了應(yīng)用于睡眠分期的雙譜域快慢同步比、快慢同步熵比等雙譜特征。將EEG 的95%邊緣頻率、遞歸定量分析特征、符號(hào)動(dòng)力學(xué)與熵結(jié)合的特征(如符號(hào)序列樣本熵、符號(hào)序列熵)用于睡眠分期。在傳統(tǒng)特征的基礎(chǔ)上,新增了EEG相位耦合特征、遞歸性特征和符號(hào)熵特征用于睡眠分期,并用樣本數(shù)據(jù)證明了以上特征應(yīng)用于睡眠分期的有效性??紤]睡眠分期的實(shí)際應(yīng)用場(chǎng)景,將SVM-HMM 睡眠自動(dòng)分期模型用于新的受試者ST7052J0 的整夜睡眠分期,睡眠分期結(jié)果與實(shí)際睡眠分布基本一致,睡眠6 期分期準(zhǔn)確率為87.34%。實(shí)驗(yàn)結(jié)果證實(shí)了本文所提出的EEG 自動(dòng)睡眠分期方法的可行性和有效性,且定義了幾種可應(yīng)用于睡眠分期的有效EEG 特征。
本研究避免了大量睡眠分期研究中數(shù)據(jù)樣本量較小、不作交叉驗(yàn)證及局限于單一受試者樣本進(jìn)行訓(xùn)練并測(cè)試等問題。在樣本量較大,使用十折交叉驗(yàn)證的情況下,所得模型可靠性較高。本文方法采用10名受試者的數(shù)據(jù)全部作為訓(xùn)練,1 名受試者數(shù)據(jù)全部做測(cè)試,測(cè)試結(jié)果與專家人工標(biāo)注結(jié)果的一致性較高,說明該方法泛化能力較強(qiáng),具有一定的臨床價(jià)值,為自動(dòng)睡眠分期應(yīng)用于臨床提供了更廣的思路。