高勝寒,熊 馨,相 艷,劉瑞湘,葉哲江
1(昆明理工大學(xué) 信息工程與自動(dòng)化學(xué)院,昆明 650500)
2(云南省第二人民醫(yī)院 臨床心理科,昆明 650000)
E-mail:478219759@qq.com
睡眠呼吸暫停綜合征(Sleep Apnea Syndrome)是一類最常見的睡眠呼吸系統(tǒng)疾病,包括阻塞型、中樞型、混合型.其主要由上呼吸道部分或完全阻塞引起,臨床表現(xiàn)為不同程度的打鼾、口鼻氣流基本停止以及心律失常等.在一次8小時(shí)左右的睡眠中,呼吸暫停事件會(huì)發(fā)生數(shù)十甚至數(shù)百次,嚴(yán)重時(shí)會(huì)導(dǎo)致一些神經(jīng)與心腦血管疾病.通常人們使用呼吸暫停低通氣指數(shù)(AHI)以評(píng)估SAS的嚴(yán)重程度,若AHI>5并伴有其他癥狀的受試者將被診斷為SAS[1-3].
多導(dǎo)睡眠圖(Polysomnography,PSG)分析是現(xiàn)今診斷SAS最常用的方法之一,利用患者睡眠期間的生理信號(hào)分析其睡眠狀態(tài),常用的生理信號(hào)包括口鼻氣流信號(hào)、腦電信號(hào)(Electroencephalography,EEG)、心電信號(hào)(Electrocardiogram,ECG)等.采集信號(hào)的過程要求患者在睡眠時(shí)佩戴多個(gè)電極帽,之后由睡眠醫(yī)學(xué)專家進(jìn)行睡眠狀態(tài)分析.近年來,隨著SAS患者的不斷增多,睡眠醫(yī)學(xué)專家的嚴(yán)重短缺導(dǎo)致許多患者得不到及時(shí)診斷和治療.因此,有不少研究者進(jìn)行關(guān)于SAS自動(dòng)檢測(cè)的研究.Laiali Almazaydeh等人[4]提出了一種基于聲音動(dòng)態(tài)檢測(cè)(Voice Activity Detection,VAD)算法的模型進(jìn)行特征提取,之后使用分類器進(jìn)行睡眠呼吸暫停檢測(cè).Song等人[5]利用EDR信號(hào)和ECG信號(hào)中的時(shí)域與頻域特征,提出一種隱馬爾可夫模型用于SAS檢測(cè).Sharma等人[6]提出一種基于Hermit基函數(shù)從心電信號(hào)RR區(qū)間提取特征方法,同時(shí)使用支持向量機(jī)(Support Vector Machine,SVM)進(jìn)行二分類.M.Emin Tagluk等人[7]提出一種基于雙譜分析提取EEG特征的方法進(jìn)行睡眠呼吸暫停檢測(cè).
上述關(guān)于SAS自動(dòng)檢測(cè)的研究,雖然取得不錯(cuò)的進(jìn)展,但工作重心還是停留在平均分割信號(hào)(傳統(tǒng)方法通常將信號(hào)分割成30s的數(shù)據(jù)段)后進(jìn)行分類,缺少發(fā)病的具體時(shí)間,無法詳細(xì)識(shí)別發(fā)病的中心時(shí)間與持續(xù)時(shí)間,而睡眠呼吸暫停綜合癥的實(shí)際發(fā)病情況是一個(gè)連續(xù)、不確定的過程.傳統(tǒng)的分割信號(hào)檢測(cè)機(jī)制存在特征信息與檢測(cè)精度的矛盾,如果每段信號(hào)被分得較短,攜帶的特征信息偏少,影響檢測(cè)性能,同時(shí)需要計(jì)算機(jī)更高的處理頻率;而分割信號(hào)較長(zhǎng)則導(dǎo)致時(shí)間精度下降,檢測(cè)結(jié)果更新緩慢.此外,信號(hào)分割還有可能破壞發(fā)病時(shí)期的連續(xù)性,在一定程度上割裂了發(fā)病開始、發(fā)病時(shí)、發(fā)病結(jié)束存在關(guān)聯(lián)的特征信息.除傳統(tǒng)的特征提取與機(jī)器學(xué)習(xí)分類器結(jié)合的方法外,近年來,深度學(xué)習(xí)也為本研究領(lǐng)域注入一些新的思路.卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)是一種源自模擬生物視覺信號(hào)處理機(jī)制的一種深層次神經(jīng)網(wǎng)絡(luò),其結(jié)構(gòu)特征、反向傳播以及權(quán)值自動(dòng)更新等機(jī)制決定了CNN強(qiáng)大的分析能力.Tao等人[8]提出了一種基于ECG心電信號(hào)與LeNet5網(wǎng)絡(luò)的睡眠呼吸暫停檢測(cè)模型,通過平均分割心電信號(hào)后進(jìn)行二分類.
由于心肺耦合程度高,心電信號(hào)已被廣泛應(yīng)用于睡眠呼吸暫停的檢測(cè).受人體內(nèi)外部病理?xiàng)l件的調(diào)節(jié),腦電信號(hào)與大腦對(duì)神經(jīng)信息的處理有關(guān).與其它信號(hào)相比,腦電信號(hào)的產(chǎn)生機(jī)制更為復(fù)雜,具備更多的神經(jīng)系統(tǒng)特征信息.例如,當(dāng)使用功率譜分析腦電信號(hào)時(shí),Zhou等人[9]分析了SAS發(fā)生之前、期間和之后睡眠腦電信號(hào)變化.當(dāng)SAS發(fā)生時(shí),EEG的絕對(duì)功率和相對(duì)功率在0~15Hz頻段存在升高,在15~30Hz頻段較SAS發(fā)病前降低.而在SAS發(fā)病后,各頻段的絕對(duì)功率均顯著高于SAS前,但在0~8Hz頻段的絕對(duì)功率有所恢復(fù).SAS發(fā)病時(shí)睡眠腦電信號(hào)的變化為利用睡眠腦電信號(hào)檢測(cè)SAS提供了支持,這些更全面的特征在其他PSG信號(hào)中是不存在的.腦電信號(hào)的研究頻段主要集中在0-30Hz,依據(jù)睡眠狀態(tài)與腦電信號(hào)的醫(yī)學(xué)原理與特征,可將腦電信號(hào)分為以下幾種節(jié)律波:1)δ波:0.5~3Hz;2)θ波:4~8Hz之間;3)α波:8~13Hz;4)β波:14~30Hz.
睡眠呼吸暫停綜合征檢測(cè)的難點(diǎn)在于特征提取與發(fā)病時(shí)間的確定.大腦功能連接性的衡量方法包括腦電信號(hào)通道間的相干性、相關(guān)性、鎖相值分析、相位滯后指數(shù)等,利用來自兩個(gè)通道或不同大腦區(qū)域的EEG信號(hào)之間的線性相關(guān)作用,如果兩個(gè)信號(hào)之間存在較高的一致性意味著存在同步的神經(jīng)元活動(dòng)、神經(jīng)元功能整合,反之低一致性則意味著存在獨(dú)立活動(dòng)的神經(jīng)元,此時(shí)神經(jīng)元功能存在分離[10-12].Li[13]等人在進(jìn)行神經(jīng)系統(tǒng)異常組與健康組對(duì)照實(shí)驗(yàn)中觀察到大腦功能連接性的差異.利用腦電功能連接性來研究神經(jīng)系統(tǒng)類疾病已取得一定成功,通過對(duì) EEG 信號(hào)構(gòu)建腦網(wǎng)絡(luò)并進(jìn)行量化分析,能在臨床上輔助睡眠呼吸暫停綜合癥的診斷[14].
針對(duì)目前SAS自動(dòng)檢測(cè)機(jī)制的不足,本文基于睡眠腦電信號(hào),利用腦電功能連接性與改進(jìn)目標(biāo)檢測(cè)算法[15,16]提出一種新的SAS自動(dòng)檢測(cè)模型SD-FCE(SAS Detection based on Functional Connectivity of Electroencephalography),其主要包含以下幾個(gè)方面:
1)在EEG的預(yù)處理中,引入經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)[17,18]進(jìn)行分解-去噪-重構(gòu),以降低EEG中噪聲的影響.同時(shí)為了避免特征信息的割裂,確保每一次發(fā)病的EEG信號(hào)完整性,本文通過較長(zhǎng)的固定滑動(dòng)窗口與相對(duì)較短的滑動(dòng)步進(jìn)從EEG中提取數(shù)據(jù)片段進(jìn)行分析,保證每次檢測(cè)模型獲得足夠的特征信息;
2)利用神經(jīng)系統(tǒng)異常時(shí)所產(chǎn)生的腦電功能連接異常作為主要特征構(gòu)建腦電功能連接矩陣,之后將功能連接矩陣輸入卷積神經(jīng)網(wǎng)絡(luò)以完成特征提?。?/p>
3)模型包含兩個(gè)用于識(shí)別SAS是否發(fā)病和發(fā)病時(shí)中心時(shí)間、持續(xù)時(shí)間的模塊.為同時(shí)進(jìn)行合理的優(yōu)化,本文模型的損失函數(shù)綜合了分類與回歸,標(biāo)簽中負(fù)樣本的位置數(shù)據(jù)不參與損失的計(jì)算,一定程度緩解樣本不均衡所帶來的影響.
相比于傳統(tǒng)的二分類算法,本文從SAS發(fā)病的神經(jīng)功能特征入手,基于SSD目標(biāo)檢測(cè)算法的改進(jìn),從根本上改變了SAS的檢測(cè)機(jī)制.直接檢測(cè)發(fā)病的中心時(shí)間點(diǎn)與持續(xù)時(shí)間將更加接近于真實(shí)情況,同時(shí)性能優(yōu)于其他基于EEG的目標(biāo)檢測(cè)[19,20]模型.
本文通過固定滑動(dòng)窗口從EEG中提取數(shù)據(jù)片段進(jìn)行處理.在單次檢測(cè)過程中,一段時(shí)間長(zhǎng)為120s的睡眠腦電信號(hào)被視為檢測(cè)載體的最小單位xn∈X(n∈N*),xn通過長(zhǎng)度為120s的滑動(dòng)窗口從某位受試者8小時(shí)左右的睡眠腦電信號(hào)X中提取.選擇長(zhǎng)度120s、步進(jìn)10s的滑動(dòng)窗口為了盡可能的使檢測(cè)載體的最小單位xn能夠完整的包含發(fā)病時(shí)間相對(duì)較長(zhǎng)的目標(biāo),同時(shí)選擇步進(jìn)較小的滑動(dòng)機(jī)制是為了應(yīng)對(duì)發(fā)病位置的不確定性,如圖1(a)所示.
圖1 EEG片段提取(a)、預(yù)選框與真實(shí)發(fā)病框的表征(b)、重疊度(c)Fig.1 Extract EEG segments(a),representation of default frame and true frame(b),intersection over union(c)
基于滑動(dòng)窗口提取到的數(shù)據(jù)段,以每z秒為一個(gè)中心時(shí)間點(diǎn)生成一系列用于密集采樣的預(yù)選框(Default frames),這些預(yù)選框的長(zhǎng)度從10s~120s均勻增加,步進(jìn)為10s.若z=1時(shí),則每段數(shù)據(jù)上將生成Nd=12×120s=1440個(gè)預(yù)選框,若z不確定,則每段數(shù)據(jù)上將生成Nd=1440/z個(gè)預(yù)選框.單個(gè)預(yù)選框定義為Di={ci,di}(i∈[1,Nd]),其中ci與di分別為預(yù)選框的中心時(shí)間點(diǎn)與持續(xù)時(shí)間,如圖1(b)所示.同理,將呼吸暫停實(shí)際發(fā)病的時(shí)間位置信息用真實(shí)發(fā)病框(True frames)表征為Tj={cj,dj}.
在訓(xùn)練開始之前,需要將預(yù)選框與真實(shí)發(fā)病框進(jìn)行匹配,匹配后得到真實(shí)發(fā)病框相對(duì)于預(yù)選框的偏移值.設(shè)偏移Oi={Ci,Di},則由公式(1)即可得到匹配后的偏移值.
(1)
此舉在于將每段數(shù)據(jù)對(duì)應(yīng)的發(fā)病情況進(jìn)行網(wǎng)格化整理與位置數(shù)據(jù)歸一化.例如,一些數(shù)據(jù)段存在著不同數(shù)量、時(shí)間長(zhǎng)短不一的發(fā)病片段,而其余數(shù)據(jù)不存在發(fā)病,這種隨機(jī)性將導(dǎo)致難以直接使用未處理的真實(shí)發(fā)病框.在訓(xùn)練與測(cè)試過程中,網(wǎng)絡(luò)對(duì)于目標(biāo)位置信息的輸出O′i={C′i,D′i}就是被預(yù)測(cè)的真實(shí)目標(biāo)相對(duì)于已知預(yù)選框的偏移值.匹配的原則包括以下幾個(gè)方面:
1)單個(gè)真實(shí)發(fā)病框能匹配多個(gè)預(yù)選框,反之則不能;
2)決定兩者之間是否匹配的參數(shù)是重疊度(IoU)[21].IoU定義為兩者交集與并集的比值,如圖1(c)所示.只有IoU值大于匹配的閾值才可進(jìn)行匹配,即IoU{Di,Tj}>μ,其中IoU,μ∈[0,1].若出現(xiàn)某一個(gè)預(yù)選框與多個(gè)真實(shí)發(fā)病框均大于匹配閾值,那么將選擇IoU值最高的真實(shí)發(fā)病框與其完成匹配.事實(shí)上,匹配閾值設(shè)定合理的前提下,上述情況非常少見;
3)對(duì)于匹配閾值的設(shè)置,為了盡可能降低正負(fù)樣本不平衡所帶來的影響,同時(shí)考慮任務(wù)的類型,我們需要使網(wǎng)絡(luò)對(duì)預(yù)選框的正向預(yù)測(cè)傾向于保守.這是因?yàn)閷?duì)于模型的預(yù)測(cè)結(jié)果還需進(jìn)行非極大值抑制(Non-Maximum Suppression,NMS)[15]處理,以消除一些正向預(yù)選框同時(shí)識(shí)別同一個(gè)目標(biāo),僅留下正向預(yù)測(cè)概率最大的一個(gè)預(yù)選框,所以不需要訓(xùn)練數(shù)據(jù)處于絕對(duì)平衡的二分類情況之下.通過相關(guān)研究[19-23],設(shè)置匹配閾值將正負(fù)樣本的比例控制在1:3左右能取得相對(duì)更好的效果.
4)將匹配成功的預(yù)選框標(biāo)記為正樣本,對(duì)應(yīng)位置信息為得到的偏移值;其余則標(biāo)記為負(fù)樣本,位置信息均為0.
在完成匹配之后,得到經(jīng)過處理的標(biāo)簽li={Ci,Di,Gi,Si},其中Gi與Si分別為背景信號(hào)與SAS發(fā)病的分類標(biāo)簽,且有Si,Gi∈{0,1}.
2.2.1 相干性分析
相干性用于分析信號(hào)之間的頻譜互相關(guān),其數(shù)學(xué)表達(dá)式如公式(2)所示:
(2)
其中n為每段信號(hào)的數(shù)據(jù)點(diǎn)數(shù),A和φ分別為信號(hào)的振幅和相位,分子表示在頻率f下信號(hào)x和y之間的交叉譜密度,分母表示頻率f下信號(hào)x和y功率估計(jì)乘積的平方根.在頻率f0處,Cohxy(f0)的值介于0~1之間,其中0表示無耦合,1表示兩個(gè)信號(hào)之間的最大線性相關(guān).
2.2.2 相關(guān)性分析
相關(guān)性用于估計(jì)信號(hào)間時(shí)域內(nèi)的線性相關(guān)的水平.
(3)
如公式(3)所示,Cov(x,y)是信號(hào)x和y之間的協(xié)方差,σx和σy分別是信號(hào)x和y的標(biāo)準(zhǔn)差.并且存在Corrxy∈[-1,1],當(dāng)Corrxy=±1時(shí),信號(hào)間呈現(xiàn)正或負(fù)線性相關(guān)性;當(dāng)Corrxy=0時(shí),信號(hào)間無相關(guān)性.
2.2.3 鎖相值分析
鎖相值分析(Phase Locked Value,PLV)是利用相位同步來分析信號(hào)之間可能存在的功能性相互作用.當(dāng)公式(2)中的Ax(f,k)=Ay(f,k)=1時(shí),可得到PLV的表達(dá)式如公式(4)所示:
(4)
在頻率f0處存在PLVxy(f0)∈[0,1],當(dāng)PLVxy(f0)=0時(shí),信號(hào)間缺乏相位同步;當(dāng)PLVxy(f0)=1時(shí),信號(hào)間完全相位同步.
2.2.4 相位滯后指數(shù)分析
相位滯后指數(shù)(Phase Lag Index,PLI)表示信號(hào)之間相位差分布的不對(duì)稱性,其定義如公式(5)所示:
(5)
式(5)中,n為信號(hào)通道的長(zhǎng)度,φx(f,k)-φy(f,k)表示頻率f下信號(hào)x與y之間的相位同步.在頻率f0處存在PLIxy(f0)∈[0,1],當(dāng)PLIxy(f0)=0時(shí),信號(hào)間沒有耦合;當(dāng)PLIxy(f0)=1時(shí),信號(hào)間完全耦合.
SD-FCE模型主要由特征提取模塊φT、分類模塊φC、位置回歸模塊φL共3個(gè)部分構(gòu)成.φT模塊主要包含腦電功能連接性特征提取與卷積神經(jīng)網(wǎng)絡(luò)的部分層組,經(jīng)過數(shù)據(jù)提取與預(yù)處理的EEG信號(hào)兩兩通道間進(jìn)行腦電功能連接性分析,得到腦電功能連接矩陣.隨后將腦電功能矩陣輸入卷積神經(jīng)網(wǎng)絡(luò)的層組,其主要包含k個(gè)大致相同并且依次相連的結(jié)構(gòu),每個(gè)層組均包含卷積層、最大池化、批標(biāo)準(zhǔn)化、RELU激活函數(shù).經(jīng)過特征提取后得到的特征向量將進(jìn)入分類模塊φC與位置回歸模塊φL.SD-FCE模型的結(jié)構(gòu)如圖2所示.
圖2 SD-FCE模型的結(jié)構(gòu)Fig.2 Architecture of SD-FCE
若輸入的EEG通道數(shù)為c、每個(gè)通道的數(shù)據(jù)點(diǎn)數(shù)為t,卷積神經(jīng)網(wǎng)絡(luò)寬度為w,φT模塊中第k組卷積神經(jīng)網(wǎng)絡(luò)特征提取層的輸入數(shù)據(jù)點(diǎn)數(shù)為tk,每段數(shù)據(jù)上生成Nd個(gè)預(yù)選框,模型參數(shù)如表1所示.
表1 模型參數(shù)Table 1 Model parameters
φC與φL模塊均包含一個(gè)相同的卷積層,其使用與特征向量等長(zhǎng)的卷積核(kernel)進(jìn)行處理,但網(wǎng)絡(luò)寬度(width)不再與φT相同,為了模型能按預(yù)選框的數(shù)量輸出對(duì)應(yīng)的分類與位置回歸結(jié)果,將網(wǎng)絡(luò)寬度設(shè)置為兩倍于每段數(shù)據(jù)上生成的預(yù)選框數(shù)量.φC與φL模塊不同的是分類模塊φC多出一個(gè)Soft-max層,為了將分類的輸出劃歸為類別預(yù)測(cè)概率.
損失函數(shù)(Loss function)是一類用于衡量預(yù)估事件與真實(shí)事件差別的函數(shù),通常作為模型的優(yōu)化準(zhǔn)則,通過尋求損失函數(shù)最小化進(jìn)行優(yōu)化.在SD-FCE模型中,損失函數(shù)L(p(xi),li)建立在模型預(yù)測(cè)值p(xi)={C′i,D′i,G′i,S′i}與真實(shí)標(biāo)簽li之間,G′i與S′i分別為模型對(duì)背景信號(hào)、SAS發(fā)病的概率,且有G′i,S′i∈[0,1].令∑L(p(xi),li)=φ++φ-,其中φ+與φ-的值分別如公式(6)、公式(7)所示:
(6)
(7)
(8)
公式(6)、公式(7)中m+與m-分別為某一批次訓(xùn)練標(biāo)簽中正、負(fù)樣本的個(gè)數(shù).將損失以正、負(fù)樣本分開計(jì)算后除以其樣本個(gè)數(shù),并且在負(fù)樣本中不計(jì)算位置信息的損失,此舉有利于緩解數(shù)據(jù)的不平衡性,同時(shí)盡可能降低背景信號(hào)位置標(biāo)簽所帶來的影響.L1smooth(Δx)損失函數(shù)源自Fast R-CNN[21]中計(jì)算目標(biāo)回歸框的損失,本文中我們將其用于計(jì)算正樣本位置信息的損失,詳見公式(8).
為了使不規(guī)律的真實(shí)發(fā)病框網(wǎng)格參數(shù)化,需要利用規(guī)則的預(yù)選框?qū)ζ溥M(jìn)行匹配,模型依托于規(guī)則的預(yù)選框輸出相應(yīng)的偏移量.在預(yù)測(cè)時(shí),輸出的偏移量需要與其對(duì)應(yīng)的預(yù)選框位置數(shù)據(jù)進(jìn)行解匹配,即逆向計(jì)算公式(1)才能得到實(shí)際預(yù)測(cè)的SAS發(fā)病位置.實(shí)際情況中,由于匹配時(shí)存在多個(gè)預(yù)選框均匹配了同一個(gè)真實(shí)發(fā)病框,所以在預(yù)測(cè)時(shí)也存在多個(gè)預(yù)選框同時(shí)預(yù)測(cè)一個(gè)SAS事件.對(duì)此,在解匹配之前,還需要通過非極大值抑制[15]對(duì)預(yù)選框進(jìn)行篩選,僅留下一個(gè)預(yù)測(cè)分?jǐn)?shù)最高的預(yù)選框用于解匹配得到真實(shí)預(yù)測(cè)的SAS事件.在非極大值抑制中,首先將這些預(yù)選框按預(yù)測(cè)分?jǐn)?shù)由高到低排序,然后將分?jǐn)?shù)最高的預(yù)選框依次與第2名、第3名等進(jìn)行IoU計(jì)算,如果IoU值高于一定閾值,則視為它和分?jǐn)?shù)最高的預(yù)選框預(yù)測(cè)的是同一個(gè)SAS事件,將其刪除,直至剩下最后一個(gè)分?jǐn)?shù)最高的預(yù)選框.依次計(jì)算IoU的過程是為了排除那些與分?jǐn)?shù)最高的預(yù)選框重疊度不高的其它預(yù)選框,因?yàn)橥唤M數(shù)據(jù)有可能存在預(yù)測(cè)其它SAS的預(yù)選框.
本文實(shí)驗(yàn)數(shù)據(jù)來自由葡萄牙克英布拉大學(xué)(Universidad de Coimbra)睡眠醫(yī)學(xué)中心采集并公開的多導(dǎo)睡眠圖(Polysomnography,PSG)數(shù)據(jù)集“ISRUC-Sleep”[24].數(shù)據(jù)集共包含3個(gè)數(shù)據(jù)子組(Subgroup I、II、III),分別為睡眠障礙受試者100例、服用睡眠藥物的受試者8例以及健康受試者10例.每位受試者的PSG均由完整的8小時(shí)左右睡眠行為構(gòu)成,大部分PSG提供了18個(gè)通道,其中有6個(gè)通道為睡眠EEG(F3-A2、C3-A2、O1-A2、F4-A1、C4-A1、O2-A1),采樣頻率200Hz,兩個(gè)通道為呼吸氣流,采樣頻率12.5Hz.數(shù)據(jù)集提供了每位受試者包括年齡、性別、其他病癥、藥物服用情況在內(nèi)的基本體征信息,以及由兩名訓(xùn)練有素的睡眠醫(yī)學(xué)專家進(jìn)行睡眠分期、睡眠事件、SAS發(fā)病情況的標(biāo)記.
數(shù)據(jù)集提供了睡眠障礙受試者單位時(shí)間段內(nèi)是否發(fā)生SAS的標(biāo)簽,結(jié)合PSG內(nèi)提供的呼吸氣流通道可得到受試者發(fā)病的具體時(shí)間信息[7],如圖3所示.
圖3 SAS發(fā)病的時(shí)間段[7]Fig.3 Case of SAS time [7]
本文使用了Subgroup I中僅患SAS的睡眠障礙受試者PSG數(shù)據(jù)共計(jì)12名,表2統(tǒng)計(jì)了每位受試者在一次完整的PSG采集中SAS的發(fā)病次數(shù)、最短與最長(zhǎng)的持續(xù)時(shí)間以及平均持續(xù)時(shí)間.選取的12名受試者的睡眠EEG經(jīng)過預(yù)處理后得到18485組包含6通道、每通道長(zhǎng)度為24000的數(shù)據(jù)與其對(duì)應(yīng)的分類、位置標(biāo)簽.表3統(tǒng)計(jì)了包含一定目標(biāo)數(shù)量的數(shù)據(jù)組數(shù).
表2 受試者的SAS發(fā)病信息Table 2 SAS information of subjects
表3 包含一定目標(biāo)數(shù)量的數(shù)據(jù)組數(shù)Table 3 Quantity of EEG segments with number of SAS
EEG以其信號(hào)微弱、極易混入噪聲等特性為研究人員帶來許多挑戰(zhàn).傳統(tǒng)的EEG預(yù)處理包括使用一個(gè)頻帶寬度為0-35Hz左右的低通濾波器進(jìn)行濾波,以此來濾除EEG中的高頻噪聲.但由于EEG是典型的非線性、非平穩(wěn)信號(hào),傅里葉變換以其固定的基函數(shù)為非平穩(wěn)信號(hào)的分析帶來一定的局限性.Norden E.Huang等人[17]提出一種新的處理非平穩(wěn)信號(hào)的方法——經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD),EMD可以依據(jù)數(shù)據(jù)自身的時(shí)間尺度特征來進(jìn)行信號(hào)分解,無須預(yù)先設(shè)定基函數(shù).這與建立在需要基函數(shù)的傅里葉變換、小波變換方法有著本質(zhì)區(qū)別,因而EMD在處理非平穩(wěn)及非線性數(shù)據(jù)上具有非常明顯的優(yōu)勢(shì),利用其自適應(yīng)性進(jìn)分解-降噪-重構(gòu)能獲得更為純凈的EEG信號(hào).
數(shù)據(jù)集提供的睡眠EEG為未經(jīng)過任何處理的原始EEG,一些片段不可避免的混入了噪聲,如果不能合理地削弱這些噪聲,低質(zhì)量數(shù)據(jù)將會(huì)使模型學(xué)習(xí)受到極大的干擾.在本文處理過程中,結(jié)合數(shù)據(jù)集的實(shí)際情況,采用兩種方法對(duì)數(shù)據(jù)進(jìn)行清洗:
1)將受噪聲污染嚴(yán)重的片段刪除;
2)使用EMD對(duì)其進(jìn)行分解、降噪、重構(gòu)操作,以去除高頻噪聲.將每段數(shù)據(jù)進(jìn)行EMD分解得到9-14不等個(gè)IMFs分量,由于EEG中含有的噪聲基本處于高頻部分,所以將最高頻率的IMF分量去除,剩下的IMFs分量進(jìn)行重構(gòu)獲得降噪后的信號(hào).原始EEG信號(hào)與降噪后的信號(hào)如圖4所示.
圖4 原始EEG與降噪后的EEG時(shí)域?qū)Ρ菷ig.4 Raw EEG and de-noised EEG in time domain
本文實(shí)驗(yàn)操作的環(huán)境為Ubuntu 18.04.3LTS操作系統(tǒng)、Inter Core i5 8250U、16GB RAM、Python3.7.3、Pytorch1.2.0.實(shí)驗(yàn)超參數(shù)設(shè)置如表4所示.
表4 超參數(shù)設(shè)置Table 4 Hyper-parameters settings
本文采用召回率(Recall)、精確率(Precision)、F1-score、最小二乘估計(jì)(Least Square Estimate,LSE)作為評(píng)價(jià)指標(biāo),設(shè)TP,F(xiàn)N,F(xiàn)P,TN分別為真陽性(True Positive)、假陰性(False Negative)、假陽性(False Positive)、真陰性(True Negative),那么召回率、精確率、F1-score、LSE分別如公式(9)-公式(12)所示.
(9)
(10)
(11)
LSE=∑(yi-y′i)2
(12)
在超參數(shù)設(shè)置中,k的取值直接決定了網(wǎng)絡(luò)的規(guī)模大小,本文通過對(duì)近年來相關(guān)論文的研究[19,20,25-27],在一定范圍內(nèi)沒有發(fā)現(xiàn)網(wǎng)絡(luò)規(guī)模與性能存在直接且固定的聯(lián)系,所以本文設(shè)置了一組對(duì)照試驗(yàn),將k分別取值為3、4、5、6,以驗(yàn)證不同網(wǎng)絡(luò)規(guī)模對(duì)于網(wǎng)絡(luò)性能的影響.對(duì)于本文的方法,z的取值也至關(guān)重要,這將直接影響網(wǎng)絡(luò)對(duì)于位置預(yù)測(cè)的精度與網(wǎng)絡(luò)的規(guī)模.依據(jù)得到Nd值的大小,本文將z分別取值為1、2、3,與此對(duì)應(yīng)的Nd值分別為1440、720、480.對(duì)照實(shí)驗(yàn)的結(jié)果如表5所示.
表5 網(wǎng)絡(luò)深度與預(yù)選框數(shù)量的實(shí)驗(yàn)結(jié)果對(duì)比Table 5 Experimental results of network depth and number of default frames
通過對(duì)比實(shí)驗(yàn),隨著網(wǎng)絡(luò)層數(shù)的加深,召回率(Recall)有一定程度的上升,但由此帶來的影響就是精確率(Precision)下降.同時(shí)隨著預(yù)選框生成的數(shù)量減少,也出現(xiàn)了召回率上升、精確率下降的結(jié)果,因此考慮模型回歸的精度與模型復(fù)雜度,最終選擇k=5、z=1.
為驗(yàn)證本文模型的性能,本文進(jìn)行了多次實(shí)驗(yàn),對(duì)比S.Chambon等人[20]提出的DOSED(Dreem One Shot Event Detector)檢測(cè)模型與其對(duì)比實(shí)驗(yàn)結(jié)果,其對(duì)比模型包括Parekh等人[28]與Lachner-Piza等人[29]提出的模型.上述對(duì)比模型在SSC(Stanford Sleep Cohort)[30]數(shù)據(jù)集進(jìn)行了實(shí)驗(yàn),對(duì)比本文模型的實(shí)驗(yàn)結(jié)果如表6所示.模型的ROC曲線如圖5所示,模型訓(xùn)練時(shí)的損失曲線如圖6所示.
圖5 ROC曲線Fig.5 ROC curve
圖6 損失曲線Fig.6 Loss curve
表6 實(shí)驗(yàn)結(jié)果Table 6 Experimental results
通過實(shí)驗(yàn)結(jié)果可以發(fā)現(xiàn),本文模型的性能在平均召回率(Recall)、平均精確率(Precision)方面優(yōu)于以往提出的基于EEG的檢測(cè)任務(wù).睡眠K-復(fù)合波(K-compose)、紡錘波(Spindle)與頻帶能量是EEG的主要特征,而SAS發(fā)病時(shí)間段與正常睡眠時(shí)間段的結(jié)合部分與K-復(fù)合波存在一定的關(guān)系,正常偏深睡眠時(shí)期下丘腦會(huì)產(chǎn)生一些紡錘波,睡眠的深淺與SAS發(fā)病時(shí)存在一定的關(guān)聯(lián),但K-復(fù)合波的產(chǎn)生并不一定是由于SAS發(fā)病產(chǎn)生的,所以網(wǎng)絡(luò)對(duì)特征較為明顯的K-復(fù)合波存在一定的誤判概率,除了對(duì)多個(gè)正向的預(yù)選框正確預(yù)測(cè)之外,還可能存在一些零散的負(fù)樣本被錯(cuò)誤地預(yù)測(cè)為正向,所以模型的結(jié)果相對(duì)于類似的任務(wù)對(duì)一些數(shù)據(jù)存在“選擇性”.
與傳統(tǒng)的均勻分割后進(jìn)行二分類的SAS檢測(cè)任務(wù)不同,傳統(tǒng)的檢測(cè)任務(wù)經(jīng)過特征提取與分類之后僅需要預(yù)測(cè)兩個(gè)數(shù)值,而在網(wǎng)絡(luò)規(guī)模相差不大的情況下本文提出的方法需要輸出1440×4個(gè)數(shù)值,這使得結(jié)果包含很多不確定性.但預(yù)測(cè)時(shí)并不是這1440個(gè)預(yù)選框的數(shù)據(jù)都有用,我們只需要那些相對(duì)來說評(píng)分較高、多個(gè)正向且重疊度較高的預(yù)選框,一些單獨(dú)存在于其他地方的正向預(yù)選框可以忽視,這是因?yàn)闄z測(cè)方法中使用了大量的預(yù)選框進(jìn)行密集采樣,某一個(gè)被檢測(cè)的目標(biāo)將會(huì)被多個(gè)預(yù)選框集中識(shí)別.最后通過非極大值抑制,留下一定范圍內(nèi)評(píng)分最高的預(yù)選框與其對(duì)應(yīng)的偏移量,解匹配得到真實(shí)的預(yù)測(cè)位置數(shù)據(jù).
實(shí)驗(yàn)結(jié)果表明,本文提出的全新SAS檢測(cè)模型具備可行性,同時(shí)模型性能優(yōu)于其他EEG目標(biāo)檢測(cè)任務(wù).
本文提出了一種全新的檢測(cè)SAS方法,通過腦電功能連接性分析與卷積神經(jīng)網(wǎng)絡(luò)為主要的模型結(jié)構(gòu)完成特征提取、分類與位置預(yù)測(cè).相比于傳統(tǒng)SAS檢測(cè)方法與EEG類似的研究,該方法不再局限于平均分割信號(hào)后進(jìn)行分類,而是在一定時(shí)間段內(nèi)預(yù)測(cè)每次發(fā)病的時(shí)段,因?yàn)镾AS發(fā)病的時(shí)長(zhǎng)與時(shí)間點(diǎn)對(duì)于醫(yī)生的診斷也蘊(yùn)含著非常重要的信息.為了使模型在學(xué)習(xí)預(yù)測(cè)中受干擾更小、更容易學(xué)習(xí)到特征,本文提出EMD等方法進(jìn)行信號(hào)去噪聲、去偽跡;使用特定的滑動(dòng)窗口數(shù)據(jù)提取機(jī)制,既提高了檢測(cè)頻率,同時(shí)也保證模型單次預(yù)測(cè)可用的數(shù)據(jù)量足夠多,以獲得更好的結(jié)果.如何處理不規(guī)則的發(fā)病時(shí)間標(biāo)簽是本文的關(guān)鍵一步.參考目標(biāo)檢測(cè)算法的過程,使用類似的用于密集采樣的預(yù)選框?qū)⒄鎸?shí)的發(fā)病時(shí)間標(biāo)簽網(wǎng)格參數(shù)化.特定的損失函數(shù)保證了分類與回歸的同時(shí)優(yōu)化.針對(duì)兩個(gè)分別用于分類與位置預(yù)測(cè)的模塊,損失函數(shù)進(jìn)行了功能區(qū)分,并且一部分預(yù)測(cè)結(jié)果不參與損失函數(shù)的計(jì)算.正樣本同時(shí)參與分類、回歸的損失計(jì)算,負(fù)樣本則僅參與分類的損失計(jì)算,以減輕數(shù)據(jù)不平衡所帶來的影響.
分析睡眠EEG是診斷SAS的重要途徑之一.睡眠EEG不僅提供了整體睡眠結(jié)構(gòu)與睡眠狀態(tài)的宏觀信息,還提供了時(shí)域中的微觀結(jié)構(gòu).Alattar M.A等人[31]的研究表明,SAS患者睡眠期間的覺醒與呼吸暫停事件對(duì)皮層腦電影響顯著,這決定了SAS患者的睡眠腦電在微觀結(jié)構(gòu)中存在異于健康人的部分,特別是CAP活動(dòng).CAP(Cyclic Alternating Pattern)[32]是一種涉及大腦皮層的一種腦電活動(dòng),常出現(xiàn)于睡眠的NREM期.CAP活動(dòng)由A相與B相組成,A相由一段主要成分包括慢波(Slow waves)、Detal波、K-復(fù)合波等高振幅波構(gòu)成,而B相為普通的背景節(jié)律波,以A相+B相組合為一次CAP循環(huán).SAS嚴(yán)重干擾睡眠結(jié)構(gòu)與穩(wěn)態(tài),而CAP作為睡眠穩(wěn)態(tài)的標(biāo)志,將直接導(dǎo)致睡眠EEG的微觀結(jié)構(gòu)發(fā)生一些特定的變化[32-34].
本文利用SAS發(fā)病時(shí)神經(jīng)系統(tǒng)異常特征與深度學(xué)習(xí)方法,以SSD目標(biāo)檢測(cè)算法為基礎(chǔ)提出一種新的SD-FCE模型,為SAS自動(dòng)檢測(cè)提供了新的思路與可靠的自動(dòng)檢測(cè)結(jié)果,該方法的提出為醫(yī)生在SAS臨床診斷中提供了更多的重要信息,這是傳統(tǒng)分類方法所不具備的絕對(duì)優(yōu)勢(shì).在下一步的研究中,本文將繼續(xù)尋求模型改進(jìn)方法,包括嘗試不同的網(wǎng)絡(luò)結(jié)構(gòu)、關(guān)注最新的相關(guān)算法,挖掘腦電內(nèi)更多維度的特征,以獲得更佳的性能.