王曉麗
(長春大學 電子信息工程學院,長春 130022)
癲癇疾病是大量腦神經(jīng)細胞群引起的腦皮質(zhì)興奮性異常的神經(jīng)系統(tǒng)紊亂性疾病,具有突然性[1]。癲癇發(fā)作期的腦電波形會成棘波、尖波狀等情況,臨床醫(yī)學中通常采用長時間的腦電監(jiān)測來判別患者是否發(fā)病。腦電圖(Electroencephalogram,EEG)是將腦部神經(jīng)活動通過電位的生理活動來記錄的方式,在對癲癇疾病的檢測中處于不可取代的地位[2]。但在監(jiān)測過程中產(chǎn)生大量的腦電信號數(shù)據(jù),依靠人工的識別需要耗費大量的時間,并且判定的結(jié)果存在著主觀性。因此,采用深度學習無疑是解決癲癇腦電信號自動識別的有力手段。
“機器學習”統(tǒng)屬于人工智能領(lǐng)域,包含有監(jiān)督學習、無監(jiān)督學習以及半監(jiān)督學習三種。近年來,“深度學習”逐漸成為機器學習研究中的一個新的領(lǐng)域[3]。
圖1 基本BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
深度學習從基本結(jié)構(gòu)看等同于深度神經(jīng)網(wǎng)絡(luò)。深度神經(jīng)網(wǎng)絡(luò)通過多層次特征學習方法,網(wǎng)絡(luò)層數(shù)越多,越能夠?qū)崿F(xiàn)復雜函數(shù)的逼近,進而使其可以表達淺層神經(jīng)網(wǎng)絡(luò)所不具有的特征表達能力。
基本BP(Back-Propagate)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖如圖1所示,它由L1輸入層、L2隱藏層和L3輸出層三個部分組成。深度學習通過組合低層特征形成更加抽象的高層表示屬性類別或特征,以發(fā)現(xiàn)數(shù)據(jù)中隱藏的分布式特征表示[5]。因此,對研究者相關(guān)先驗知識要求低,關(guān)鍵要數(shù)據(jù)充足,即提供了重組的輸入層,算法擬合程度才能夠達到最佳,再通過多次訓練,就會等到更好的結(jié)果。因此,深度學習越來越多地應(yīng)用于處理信息量較大的場合。
基于深度學習的癲癇腦電信號分析與檢測首先應(yīng)選取研究對象,即樣本。進而對其進行預(yù)處理,再提取電線腦電信號特征,然后進一步分析,最后采用分類器完成信號的分類,從而完成癲癇腦電信號的檢測。其結(jié)構(gòu)示意圖如圖2所示。
圖2 系統(tǒng)結(jié)構(gòu)示意圖
深度學習的實現(xiàn)要依靠真實有效的數(shù)據(jù)源作基礎(chǔ),目前世界上對癲癇腦電信號研究中最為普遍的腦電數(shù)據(jù)庫一共有兩個。
2.1.1 波恩大學癲癇數(shù)據(jù)庫
該數(shù)據(jù)庫共采集了10名志愿者的數(shù)據(jù),放于5個集合之中,分別標號為A、B、C、D、E。其中,A組和B 組的腦電數(shù)據(jù)采集于5 名健康志愿者的皮層腦電,A 組的志愿者處于意識清醒且睜眼狀態(tài),B 組的志愿者處于意識清醒且閉眼狀態(tài)。C、D、E 三組腦電數(shù)據(jù)采集于5 名癲癇病灶位于海馬區(qū)的癲癇患者術(shù)前的顱內(nèi)腦電。數(shù)據(jù)采樣頻率為173.61Hz。5 個數(shù)據(jù)子集中,每個子集包含100 段腦電信號段,每段數(shù)據(jù)包含4097 個數(shù)據(jù)點,時長約23.6 秒[4]。
2.1.2 CHB-MIT Scalp EEG兒童癲癇腦電數(shù)據(jù)庫
該數(shù)據(jù)庫收集了23個病例的記錄。其中共22名受試者,包括5名男性(3~22歲)、 17名女性(1.5~19歲),并且一名女性chb01在病例1.5年后又采集樣本為chb21。每個案例包含了9到42個連續(xù)的.edf文件。在大多數(shù)情況下,.edf文件只包含一小時的數(shù)字化EEG信號,只有案例chb10是2小時長,案例chb04,chb06, chb07,chb09和chb23是4小時長。所有信號均以每秒256個樣本采樣,分辨率為16位[5]。
提取腦電信號的特征是進行腦電信號分類的核心。對于癲癇腦電信號的特征提取主要包括時域分析方法、頻域分析方法、時頻域分析方法、非線性分析方法等。隨著人工智能的發(fā)展,又出現(xiàn)了多種分析角度的癲癇腦電特征提取方法。在深度學習中,捕捉數(shù)據(jù)最重要特征的神經(jīng)網(wǎng)絡(luò),即自編碼器神經(jīng)網(wǎng)絡(luò)。
自編碼器神經(jīng)網(wǎng)絡(luò)是一種無監(jiān)督學習技術(shù),利用神經(jīng)網(wǎng)絡(luò)進行表征學習。即輸入的特征x1、x2…xn之間存在某種特殊的聯(lián)系,但是這些聯(lián)系不需要人為地進行特征提取,而是放到網(wǎng)絡(luò)里面進行學習,最終濃縮為更精煉、數(shù)量更少的特征h1、h2…h(huán)m。其中m 圖3 自編碼器的一般結(jié)構(gòu) 2.3.1 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的癲癇腦電信號分析 RNN(Recurrent Neural Networks)循環(huán)神經(jīng)網(wǎng)絡(luò),允許信息的持久化。但在處理長期記憶時出現(xiàn)的缺陷,LSTM(Long Short Term)網(wǎng)絡(luò)可以彌補。LSTM是一種基于RNN的特殊變形,通過引入細胞狀的概念,不單單只考慮最近的狀態(tài),而是通過細胞的狀態(tài)來決定狀態(tài)的去留。其二結(jié)構(gòu)圖如圖4所示。 (a)RNN結(jié)構(gòu)示意圖 (b)LSTM結(jié)構(gòu)示意圖圖4 RNN 與LSTM的結(jié)構(gòu)示意圖 通過LSTM(Long Short Term)網(wǎng)絡(luò)可達到以下功能: (1)遺忘部分細胞狀態(tài) 通過最左邊的通路,也就是sigmoid函數(shù)實現(xiàn)。根據(jù)輸入和上一時刻的輸出來決定當前細胞狀態(tài)是否有需要被遺忘的內(nèi)容。 (2)加入新狀態(tài) 新進來的主語被加入到細胞狀態(tài)中,同理也是靠sigmoid函數(shù)經(jīng)過tanh來決定應(yīng)該記住哪些內(nèi)容。此處的sigmoid和前一步的sigmoid層的w和b不同,是分別訓練的層。進而形成下一時刻的細胞狀態(tài)輸入。 (3)當前狀態(tài)的輸入決定其輸出 最右側(cè)的通路,通過sigmoid函數(shù)作門,對第二步求得的狀態(tài)作tanh后的結(jié)果過濾,從而得到最終的預(yù)測結(jié)果。增加了對過去狀態(tài)的過濾,從而可以選擇哪些狀態(tài)對當前更有影響,而不是簡單地選擇最近的狀態(tài)。 2.3.2 基于Softmax回歸的癲癇腦電信號分類 隨著深度學習多分類的發(fā)展,Logistic 回歸模型推廣為Softmax 回歸形式。圖5是一個典型的神經(jīng)網(wǎng)絡(luò),由輸入層、特征處理層,全連接層組成。通過Softmax分類器在全連接層的輸出端得到一個輸入樣本的條件概率。 圖5 Softmax多分類神經(jīng)網(wǎng)絡(luò) Softmax回歸的函數(shù)表達式為: (1) 對應(yīng)于每個輸入值x都會有一系列的概率得出,即p(y=j|x),這一過程可以用向量表示: (2) 由此可以得到Softmax的代價函數(shù)定義式: (3) 其中,1{j=y(i)}是示性函數(shù),其取值規(guī)則為:1{值為真的表達式}=1,1{值為假的表達式}=0。Softmax回歸中將x分類為類別j的概率為: (4) (5) 對于J(θ)的最小化,使用迭代的優(yōu)化算法,如采用梯度下降算法,其中的偏導數(shù)求解如下: θj:=θj-αδθjJ(θ), (6) J(θ)對θj求偏導得到: (7) 最后通過迭代,使得損失函數(shù)達到最小,實現(xiàn) Softmax 回歸的分類。目前,Softmax 回歸在深度學習的多分類問題中被廣泛應(yīng)用。 基于深度學習的癲癇腦電信號分析與預(yù)測在近幾年走進人們的視野,對于腦電信號采用深度學習的方法目前存在以下問題: (1)深度神經(jīng)網(wǎng)絡(luò)層數(shù)的最優(yōu)化,不是越多的網(wǎng)絡(luò)層數(shù)就能得到最好的結(jié)果。 (2)非線性的大腦檢測到的腦電信號輸入大多數(shù)為圖像數(shù)據(jù),而采用數(shù)據(jù)點存在的數(shù)據(jù)目前仍受到一定的制約,數(shù)據(jù)的量也是造成深度學習方法無法深入的原因。本文主要就目前深度學習的腦電信號診斷癲癇作了籠統(tǒng)的總結(jié)與介紹,為未來采用深度學習方法診斷、檢測癲癇疾病可以提供一些理論參考。2.3 癲癇腦電信號的分析與分類
3 前景展望