丁尚文,王純賢
(1.合肥工業(yè)大學(xué)基礎(chǔ)部,安徽 宣城 242000; 2.合肥工業(yè)大學(xué)機(jī)械工程系,安徽 宣城 242000)
飲酒作為一種社會(huì)習(xí)俗和文化已經(jīng)流傳了幾千年。酒文化的巨大作用和影響推動(dòng)了社會(huì)的發(fā)展,同時(shí)也給社會(huì)帶來了巨大損失。長期過量飲酒會(huì)產(chǎn)生高血壓、糖尿病及心腦血管等疾病。高劑量攝入酒精會(huì)引發(fā)腦細(xì)胞毒性水腫,并且長期酗酒會(huì)導(dǎo)致腦部形態(tài)在額葉、胼胝體等部位發(fā)生特異性損傷[1]。
對(duì)于過量飲酒危害是否對(duì)腦認(rèn)知功能產(chǎn)生損傷,國內(nèi)外學(xué)者開展了相關(guān)研究工作。Michael等采用威斯康星卡片分類對(duì)急性飲酒志愿者進(jìn)行測(cè)驗(yàn),結(jié)果表明急性酒精中毒可導(dǎo)致大腦執(zhí)行控制能力下降,其相應(yīng)的持續(xù)語言功能由于受到酒精抑制而導(dǎo)致語言表達(dá)不連貫[2]。謝成娟等對(duì)酒精依賴患者進(jìn)行愛荷華博弈測(cè)試(Iowa gambling test,IGT)。試驗(yàn)結(jié)果表明,對(duì)照組的IGT凈得分顯著高于酒精依賴組,并推測(cè)認(rèn)為患者的IGT表現(xiàn)受損,可能與眶額葉皮質(zhì)、杏仁核受損等有關(guān)[3]。Ehler等采用腦電(electroencephalogram,EEG)技術(shù)研究發(fā)現(xiàn)酒精依賴患者在靜息態(tài)下額葉部位β功率明顯高于對(duì)照組[4]。劉桂青等[5]對(duì)酗酒者腦皮層EEG信號(hào)的同步性開展研究,結(jié)果發(fā)現(xiàn)酗酒者大腦不同區(qū)域間的功能連接強(qiáng)度受到一定程度的損傷。Korucuoglu等采用EEG方法研究急性飲酒對(duì)腦認(rèn)知功能的影響,結(jié)果發(fā)現(xiàn)與安慰劑組相比急性飲酒志愿組的額葉處EEG信號(hào)α功率有明顯的增強(qiáng)[6]。文獻(xiàn)[7]采用的Flanker范式考察被試者在清醒狀態(tài)和飲酒狀態(tài)下的事件相關(guān)電位(event-related potentials,ERP)的差異性,研究結(jié)果發(fā)現(xiàn)飲酒會(huì)導(dǎo)致前扣帶回處的神經(jīng)活動(dòng)興奮,進(jìn)而使得覺察、認(rèn)知功能和控制能力下降。
綜上分析可以發(fā)現(xiàn),國內(nèi)外研究人員采用認(rèn)知量表、EEG技術(shù)等研究了酗酒成癮者腦認(rèn)知功能損傷問題,研究結(jié)果給出了飲酒對(duì)腦認(rèn)知功能產(chǎn)生影響的定性結(jié)論。進(jìn)一步研究期望獲得研究個(gè)體EEG信號(hào)評(píng)估特征參數(shù);利用已經(jīng)獲得的評(píng)估參數(shù)對(duì)酗酒者EEG信號(hào)識(shí)別與分類。
支持向量機(jī)(support vector machine,SVM)是以統(tǒng)計(jì)學(xué)理論為基礎(chǔ)的一種模式分類識(shí)別技術(shù)[8]。為了對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行分類,SVM的基本原理就是要尋找一個(gè)最優(yōu)分類面,盡可能使得訓(xùn)練數(shù)據(jù)中樣本間距最大,從而將訓(xùn)練數(shù)據(jù)分類。最優(yōu)分類面如圖1所示。圖1中的虛線表示分類的邊界線,在邊界線上的向量稱之為支持向量。邊界線之間的距離稱之為分類間隔。
圖1 最優(yōu)分類面示意圖
wx+b=0為分類線方程。該方程滿足條件:
yi[(wxi)+b]-1≥0
(1)
采用Lagrange求極值方法,利用對(duì)偶理論將式(1)中目標(biāo)函數(shù)最值求解問題轉(zhuǎn)化為求下列目標(biāo)函數(shù)最值問題[8]:
(2)
求解式(2)中對(duì)偶問題,得到最優(yōu)分類面的權(quán)系數(shù)向量以及分類域值為:
(3)
x(1)為式(3)中的訓(xùn)練數(shù)據(jù)中第一類樣本點(diǎn),x(-1)為第二類樣本點(diǎn)。式(4)中的最優(yōu)分類函數(shù)稱之為支持向量機(jī),又稱之為最優(yōu)分類函數(shù)。
(4)
(xi·x)在式(4)中表示為內(nèi)積,且(xix)可選用核函數(shù)K(xix)替換,核函數(shù)的選取滿足Merce條件即可,但核函數(shù)表達(dá)式的不同對(duì)SVM分類結(jié)果有不同影響。另外,對(duì)于訓(xùn)練樣本不可分情況,SVM借助松弛變量ξ以判斷對(duì)訓(xùn)練數(shù)據(jù)xi的分類程度,懲罰因子C用來判斷最小錯(cuò)分樣本點(diǎn)個(gè)數(shù)和分類間隔,最終獲得最優(yōu)分類面。式(4)中的(x1,y1),(x2,y2),…,(xn,yn)為已知訓(xùn)練樣本。其中,xi∈Rl,yi∈{+1,-1},i=1,2,…,n。支持向量算法優(yōu)化的目標(biāo)函數(shù)為:
(5)
s.t.yi(w·xi+b)≥1-ξi,ξi≥0
常用的核函數(shù)形式主要有線性核函數(shù)、內(nèi)積核函數(shù)、徑向基核函數(shù)等[8]。
本文分析采用的數(shù)據(jù)均來自于紐約大學(xué)HenriB教授在互聯(lián)網(wǎng)上公開的EEG數(shù)據(jù)庫。該數(shù)據(jù)主要涉及的是酒精中毒病人的相關(guān)腦電信號(hào)數(shù)據(jù)。試驗(yàn)記錄了兩組試驗(yàn)對(duì)象,即酗酒者和對(duì)照組在3種視覺刺激條件下的EEG信號(hào)。試驗(yàn)時(shí),按照國際標(biāo)準(zhǔn)在受試者頭部放置64導(dǎo)電極,設(shè)備采樣頻率為256 Hz,每次試驗(yàn)記錄1 s的數(shù)據(jù)。試驗(yàn)過程施加單一刺激或者復(fù)合刺激。數(shù)據(jù)采集存放在兩個(gè)數(shù)據(jù)集SMNI_CMI_TRAIN和SMNI_CMI_TEST。數(shù)據(jù)選擇:本文數(shù)據(jù)選擇來源于該試驗(yàn)的大數(shù)據(jù)集(The Large Data Set),受試者包括酗酒者和正常人。各選擇10例受試者數(shù)據(jù)用來測(cè)試。從酗酒者和對(duì)照組的EEG數(shù)據(jù)中分別隨機(jī)選擇6段數(shù)據(jù)作為分析樣本,每組試驗(yàn)數(shù)據(jù)作為訓(xùn)練樣本或者測(cè)試樣本,共計(jì)三組數(shù)據(jù),分別簡稱數(shù)據(jù)1、數(shù)據(jù)2和數(shù)據(jù)3。
本文將酗酒者和健康者EEG信號(hào)相關(guān)參數(shù)作為標(biāo)準(zhǔn),采用SVM方法期望借助評(píng)估參數(shù)對(duì)酗酒者和健康者EEG信號(hào)進(jìn)行分類識(shí)別,同時(shí)優(yōu)選出用于識(shí)別兩類不同EEG信號(hào)的最佳評(píng)估因子。
能量參數(shù):在EEG節(jié)律特征研究中,大多選擇特征波的能量這一特征值對(duì)信號(hào)進(jìn)行特征識(shí)別。EEG信號(hào)的低頻率節(jié)律相關(guān)能量E可用式(6)計(jì)算得到:
(6)
式中:x(n)為EEG信號(hào)的幅值;N為采集到數(shù)據(jù)點(diǎn)個(gè)數(shù)。
通過式(6),能夠計(jì)算出低頻率節(jié)律波EEG中相關(guān)的α、β和θ節(jié)律波段的能量[9]。
EEG信號(hào)功率譜AR參數(shù):在信號(hào)頻譜分析方法中,AR譜估計(jì)(簡稱AR模型)由于可用較短時(shí)長數(shù)據(jù)獲得較高頻率分辨的優(yōu)點(diǎn)而被研究者廣泛使用。AR算法詳見文獻(xiàn)[10]。該算法是建立在數(shù)據(jù)基礎(chǔ)上的基于自回歸系數(shù)求解的有效算法。
EEG信號(hào)近似熵:Pincus等在研究混沌現(xiàn)象課題時(shí)發(fā)現(xiàn)熵可以用來描述混沌現(xiàn)象[11],他們利用信號(hào)的時(shí)間序列復(fù)雜度提出了近似熵模型。通過近似熵判斷時(shí)間序列中新信息發(fā)生的可能性,以此判斷混沌現(xiàn)象中產(chǎn)生新模式的可能性。近似熵具體算法詳見文獻(xiàn)[11-12]。
將酗酒者和健康者的EEG信號(hào)的特征參數(shù)集合{‘EEG信號(hào)能量參數(shù)’,‘EEG信號(hào)功率譜AR參數(shù)’,‘EEG信號(hào)近似熵’}中任意元素作為EEG信號(hào)評(píng)估參數(shù),將該參數(shù)對(duì)應(yīng)的信號(hào)數(shù)據(jù)作為支持向量的訓(xùn)練樣本。例如將EEG信號(hào)能量值作為訓(xùn)練樣本(x1,y1),(x2,y2),…,(xn,yn),xi∈R2,yi∈{+1,-1},i=1,2,…,n。酗酒者的EEG信號(hào)能量值標(biāo)簽對(duì)應(yīng)設(shè)定為1,健康者的EEG信號(hào)能量值標(biāo)簽對(duì)應(yīng)設(shè)定為-1。將10例酗酒者和10例健康者的EEG信號(hào)能量值數(shù)據(jù)作為訓(xùn)練樣本,對(duì)SVM模型參數(shù)進(jìn)行訓(xùn)練和估計(jì)。將對(duì)應(yīng)的兩類EEG信號(hào)能量值各10例為測(cè)試樣本,分別對(duì)應(yīng)的標(biāo)簽設(shè)置為1和-1,具體流程見圖2。根據(jù)圖2算法流程,對(duì)EEG數(shù)據(jù)采用SVM方法(使用libsvm軟件包)進(jìn)行訓(xùn)練和測(cè)試。本文選擇線性核函數(shù)作為SVM的核函數(shù),借助EEG信號(hào)不同頻率段對(duì)應(yīng)的能量值,將酗酒者和健康者EEG信號(hào)分類。
圖2 基于SVM的酗酒者和健康者的EEG信號(hào)分類流程圖
基于不同數(shù)據(jù)組的測(cè)試效果對(duì)比如表1所示。
表1 基于不同數(shù)據(jù)組的測(cè)試效果對(duì)比
從表1可以發(fā)現(xiàn),采用近似熵、AR參數(shù)作為訓(xùn)練樣本,能夠?qū)π锞普逧EG信號(hào)和健康者EEG信號(hào)分類識(shí)別,測(cè)試誤差率最小值分別為22.5%和25%。采用α、β和θ能量值作為訓(xùn)練樣本,能夠?qū)π锞普逧EG信號(hào)和健康者EEG信號(hào)分類識(shí)別,測(cè)試誤差率最小值分別為25%、35%和10%。對(duì)應(yīng)的基于θ能量評(píng)估參數(shù)的酗酒者和健康者EEG信號(hào)分類結(jié)果見圖3。通過以上的分類結(jié)果比較,可以發(fā)現(xiàn)最佳的評(píng)估因子為θ能量評(píng)估參數(shù),且使用θ能量評(píng)估參數(shù)采用SVM方法能夠?qū)深惒煌珽EG信號(hào)分類識(shí)別,識(shí)別精度最高達(dá)到90%。
圖3 第十通道EEG信號(hào)θ能量評(píng)估參數(shù)分類結(jié)果圖(分類誤差10%)
酗酒會(huì)對(duì)腦認(rèn)知功能產(chǎn)生嚴(yán)重?fù)p傷,國內(nèi)外研究者采用認(rèn)知量表、EEG等技術(shù)已進(jìn)行大量的研究,并給出較為可靠的腦認(rèn)知損傷報(bào)告。本文提出基于支持SVM方法的EEG信號(hào)自動(dòng)分類檢測(cè)技術(shù)。本文的工作能夠?yàn)楫?dāng)前國內(nèi)外研究機(jī)構(gòu)對(duì)酗酒成癮者評(píng)估檢測(cè)提供技術(shù)參考,能夠?qū)】碉嬀普呤欠裼行锞苾A向提供輔助檢測(cè)。