李丹陽 張晶晶
(新疆師范大學(xué),新疆 烏魯木齊830054)
精神障礙(mental disorder)是由多種原因所引起的嚴(yán)重程度不同的腦功能失調(diào)或者紊亂的精神疾病,并伴有不同的臨床癥狀(張勁松,2012)。其特征為認(rèn)知、情緒、行為等方面發(fā)生改變,這些改變使得患者感到痛苦、功能受損或增加患者死亡、殘疾等的危險(xiǎn)性(張理義,&耿德勤,2018)。精神障礙可分為“器質(zhì)性”精神障礙(如腦炎、慢性臟器衰竭所致的精神障礙)和“功能性障礙”,而功能性障礙又分為精神病性障礙(如精神分裂癥)和輕性精神障礙(如焦慮、抑郁癥、應(yīng)激所致的精神障礙)。目前,我國約有精神病性障礙1600 萬和3000 萬抑郁癥患者,而精神障礙的識別率、治療率較低是我國的精神衛(wèi)生事業(yè)的巨大挑戰(zhàn)之一(郝偉,&于欣,2013)。
傳統(tǒng)精神障礙的主要診斷一般是采用結(jié)構(gòu)性訪談和家族史追溯等方式,臨床心理醫(yī)師在診斷病患時(shí)常常會面臨溝通困境,例如患者故意隱瞞真實(shí)近況而不能實(shí)現(xiàn)問卷及訪談的信效度,而醫(yī)生在依據(jù)檢查形成癥狀學(xué)判斷時(shí)也有一定的主觀色彩,使得在不同的醫(yī)療環(huán)境背景下,診斷結(jié)果的一致性較低。
許多學(xué)者為此試圖運(yùn)用神經(jīng)影像學(xué)技術(shù)探索可以使精神疾病診斷標(biāo)準(zhǔn)客觀化和準(zhǔn)確化的生物標(biāo)記物,而在多種神經(jīng)影像技術(shù)中,腦電圖(EEG)由于其低成本和毫秒級時(shí)間分辨率得到了很多研究者的青睞(Miseon Shim,2016)。低成本可以使基于EEG 的輔助診斷投入臨床應(yīng)用成為可能,而高時(shí)間分辨率則能幫助研究者更好的監(jiān)測到各類精神障礙心理機(jī)制的動態(tài)過程。
在精神障礙的神經(jīng)影像學(xué)研究中,機(jī)器學(xué)習(xí)由于圖像處理方面的突出優(yōu)勢而逐漸成為有力工具?;跈C(jī)器學(xué)習(xí)和神經(jīng)影像的計(jì)算機(jī)輔助診斷研究也成為領(lǐng)域熱點(diǎn)(張家寧,2017)。我們期望通過EEG 的數(shù)據(jù)結(jié)合機(jī)器學(xué)習(xí)算法建立精神障礙的分類模型來輔助或完成臨床診斷,進(jìn)而提高精神類疾病的整體診斷效率、降低醫(yī)療成本、提高醫(yī)療資源的普惠性。
機(jī)器學(xué)習(xí)(machine learning)是一門涉及多領(lǐng)域的交叉學(xué)科,它是人工智能的核心,涉及到算法的選擇、分類器的構(gòu)建。計(jì)算機(jī)程序基于經(jīng)驗(yàn)E 學(xué)習(xí)任務(wù)T,完成任務(wù)的表現(xiàn)記為性能P,如果其習(xí)得性能P 隨著經(jīng)驗(yàn)E 的增大而不斷增長,則稱為機(jī)器學(xué)習(xí)(Tom Mitchell,1997)。廣義上說,機(jī)器學(xué)習(xí)即無需進(jìn)行明確的編程而讓計(jì)算機(jī)具有學(xué)習(xí)的能力。
機(jī)器學(xué)習(xí)有多種類型,可以根據(jù):(1)其用來訓(xùn)練算法的訓(xùn)練數(shù)據(jù)是否包含標(biāo)簽,分為監(jiān)督學(xué)習(xí)(多用于分類和回歸問題)、非監(jiān)督學(xué)習(xí)(如可視化算法和異常檢測)和半監(jiān)督學(xué)習(xí)(如圖片存儲標(biāo)記服務(wù));(2)是否可以動態(tài)漸進(jìn)學(xué)習(xí),分為在線學(xué)習(xí)和離線學(xué)習(xí);(3)是否只是通過簡單地比較新的數(shù)據(jù)點(diǎn)和已知的數(shù)據(jù)點(diǎn),或者在訓(xùn)練數(shù)據(jù)中進(jìn)行模式識別,以建立一個預(yù)測模型,分為基于實(shí)例學(xué)習(xí)和基于模型學(xué)習(xí);(4)根據(jù)是否需要人工提取特征,分為傳統(tǒng)淺層學(xué)習(xí)(支持向量機(jī)、K 近鄰等)和深度學(xué)習(xí)(卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)等)(Géron,2017)。
機(jī)器學(xué)習(xí)較傳統(tǒng)方法的優(yōu)勢表現(xiàn)在以下幾點(diǎn):(1)對于需要進(jìn)行大量傳統(tǒng)編程調(diào)整或需要有復(fù)雜規(guī)則才能解決的問題,機(jī)器學(xué)習(xí)算法通??梢院喕a、提高效率。(2)當(dāng)環(huán)境波動時(shí),機(jī)器學(xué)習(xí)算法可以適應(yīng)新數(shù)據(jù),而無需人工進(jìn)行繁瑣的修正維護(hù)。(3)使用機(jī)器學(xué)習(xí)方法可以挖掘大量數(shù)據(jù),發(fā)現(xiàn)原本數(shù)據(jù)中并不顯著但重要的規(guī)律,有時(shí)可能會發(fā)現(xiàn)新穎的關(guān)聯(lián)和趨勢,有助于對問題本身更好的理解。
20 世紀(jì)80 年代至今,機(jī)器學(xué)習(xí)達(dá)到了一個繁榮時(shí)期,由于這一時(shí)期物聯(lián)網(wǎng)大數(shù)據(jù)以及硬件GPU 的出現(xiàn),使得機(jī)器學(xué)習(xí)開始爆炸式發(fā)展,也由于其本身較傳統(tǒng)方法的優(yōu)勢,成為了一門獨(dú)立熱門學(xué)科并被應(yīng)用到數(shù)據(jù)標(biāo)記類別、推薦系統(tǒng)、信息檢索與排序、醫(yī)療決策支持等各個領(lǐng)域。
精神障礙患者疾病意識的不足、早期篩查方法的缺乏及傳統(tǒng)診斷方式的固有缺陷導(dǎo)致患者在被診斷時(shí)大多已發(fā)展至重性障礙。為改善現(xiàn)狀,近年來機(jī)器學(xué)習(xí)被逐漸應(yīng)用到多種精神障礙的預(yù)測、識別、輔助診斷和治療決策中。
抑郁癥(Depression),也稱抑郁障礙(Depressive disorder)(American Psychiatric Association,2013),其主要特征為持久而顯著的情緒低沉,具有慢性、反復(fù)發(fā)作、遷延不愈、自殺率高的特點(diǎn)。大約有8%的男性和15%的女性在他們的一生中會患上抑郁障礙,嚴(yán)重影響生活質(zhì)量,且其中有近15%的人選擇了自殺(Gold,Machado Vieira,& Pavlatou,2015)。
據(jù)世界衛(wèi)生組織(World Health Organization,WHO)預(yù)測,到2020 年,抑郁癥將代替癌癥成為世界第二大疾病。因此,對抑郁癥患者的診斷精度的提升需求迫在眉睫。
結(jié)合機(jī)器學(xué)習(xí)算法及EEG 數(shù)據(jù)建立抑郁癥輔助診斷模型的基本原理為采集抑郁癥患者及健康對照組的EEG 數(shù)據(jù),將進(jìn)行預(yù)處理和歸一化后的數(shù)據(jù)按一定比例分為訓(xùn)練集和測試集,訓(xùn)練集數(shù)據(jù)用于對機(jī)器學(xué)習(xí)算法進(jìn)行訓(xùn)練,測試集數(shù)據(jù)則用于對模型進(jìn)行性能評估,并在驗(yàn)證評估過程中對模型進(jìn)行不斷優(yōu)化。其思路框架如圖。
基于EEG 的機(jī)器學(xué)習(xí)抑郁癥預(yù)測模型思路框圖
劉巖、李幼軍和陳萌(2017)對重度抑郁患者及健康對照組的EEG 進(jìn)行特征提取,并建立支持向量機(jī)和線性分類模型,其分類準(zhǔn)確度最高達(dá)到90.0%;該團(tuán)隊(duì)又基于僅進(jìn)行濾波降噪處理的腦電信號建立深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)分類模型,分類準(zhǔn)確度達(dá)96.7%,由此得到基于深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)的抑郁癥分類效果比需要進(jìn)行特征提取的傳統(tǒng)機(jī)器學(xué)習(xí)模型更好。
Bailey 等(2019)研究顯示利用支持向量機(jī)基于抑郁癥患者治療一周時(shí)的靜息腦電信號EEG 的PSD、wPLI、theta cordance值的特征,可以預(yù)測患者對rTMS 治療是否應(yīng)答,從而指導(dǎo)無應(yīng)答患者盡早選擇其他適合的治療方法,避免其盲目接受無效、延誤治療時(shí)期且昂貴的rTMS 治療。
Hasanzadeh 等(2019)研究顯示利用K 近鄰基于抑郁癥患者治療前的靜息腦電信號EEG 的非線性特征可以預(yù)測其對rTMS 治療是否應(yīng)答,其基于Beta 頻率的能量譜特征的分類精度達(dá)到91.3%,高于Bailey 團(tuán)隊(duì),并省去了患者為期一周的rTMS 高額治療費(fèi)用。
注意缺陷多動障礙(attention deficit and hyperactivity disorder)是最具危害性的兒童青少年精神障礙之一,發(fā)病率在學(xué)齡兒童的3%~8%,近半數(shù)起病于4 歲以前,男孩多于女孩(張家寧,2017)。注意缺陷多動障礙患者多表現(xiàn)為明顯的注意力不集中,注意持續(xù)時(shí)間短暫,活動過度和沖動,并常伴有學(xué)習(xí)困難或品行障礙,ADHD 患者與品行障礙的同病率高達(dá)30%~58%。遺傳、生物化學(xué)因素、神經(jīng)解剖和神經(jīng)生理、發(fā)育異常、心理社會因素等都為本病的發(fā)病相關(guān)因素。(張理義,&耿德勤,2018)。
研究表明,ADHD 患者中65%的病例持續(xù)到成年期(Faraone SV,Biederman J,&Mick E,2006),而成年ADHD 患者的臨床癥狀又易與精神分裂或人格障礙等精神疾病產(chǎn)生混淆,使得傳統(tǒng)診斷方法下,成年ADHD 的誤診率偏高。
在多動癥患者感覺和認(rèn)知處理缺陷的背景下,有大量證據(jù)表明患者事件相關(guān)電位(ERP)發(fā)生了改變。Andreas Mueller(2010)采用支持向量機(jī)分類方法,用年齡和性別匹配的兩組成人(74 名ADHD 患者,74 名對照組)進(jìn)行視覺雙刺激GO/NOGO任務(wù)。利用獨(dú)立成分分析方法(ICA)將ERP 數(shù)據(jù)分解為獨(dú)立成分。特征選擇算法定義了一組獨(dú)立的成分特征,這些特征被輸入到支持向量機(jī)中,采用10 倍交叉驗(yàn)證方法,其分類準(zhǔn)確率達(dá)92%。該研究首次嘗試使用支持向量機(jī)對成人ADHD 進(jìn)行分類,并證實(shí)基于ERP 數(shù)據(jù)非線性特征的分類模型在臨床診斷中的可行性。
高度考試焦慮在各級學(xué)生中的比例都超過20%(陳睿,劉瀟楠,周仁來,2011),在一些地區(qū)的初中生中這一比例甚至高達(dá)35%(陳祉妍,2002)。
考試焦慮對個體的身心健康有著嚴(yán)重危害。首先,在面臨重要考試的時(shí)候,考試焦慮者會體會到一種強(qiáng)烈的擔(dān)憂和情緒反應(yīng),包括心慌、緊張的情緒體驗(yàn)及一系列生理反應(yīng),如出現(xiàn)與植物性神經(jīng)活動失調(diào)相關(guān)的身體反應(yīng)癥狀(如心跳加快、出冷汗、呼吸急促、顫抖等),并且由此影響個體的生理健康,影響內(nèi)分泌,降低免疫功能,增加感染性疾病、胃部不適及睡眠障礙等軀體疾病(閆慧,盧莉,2014)。
高度的考試焦慮往往與抑郁情緒相聯(lián)系(陳睿等,2011),而抑郁癥發(fā)病得越早,越可能影響至終生,且復(fù)發(fā)率和自殺率越高(王瑋文,謝希,邵楓,2008)。因此,對考試焦慮進(jìn)行早期的準(zhǔn)確診斷十分必要。
章文佩、沈群倫(2019)使用ERPs 技術(shù)采集并分析高、低考試焦慮者在情緒Stroop 中對考試相關(guān)威脅詞與中性詞下的ERP成分(P1,P2,N2,P3 和LPP),結(jié)合7 種常見的機(jī)器學(xué)習(xí)算法對個體考試焦慮程度進(jìn)行進(jìn)一步的診斷。結(jié)果表明相較6 種淺層學(xué)習(xí)算法,深度學(xué)習(xí)算法中的卷積神經(jīng)網(wǎng)絡(luò)(CNN)對考試焦慮診斷的分類效果最好,其準(zhǔn)確率達(dá)86.5%。
精神分裂癥是一種病因不明、臨床分類眾多且多發(fā)病于青壯年的重性精神障礙,患病率約為1%,患者表現(xiàn)出思維方式和行為舉止怪異、感知覺扭曲、認(rèn)知失調(diào)等癥狀并且常伴有情感遲鈍、社會退縮等特征(Carpenter & Buchanan,1994)。精神分裂癥可在發(fā)病后持續(xù)發(fā)展。個別患者的進(jìn)展可能有顯著差異。早期發(fā)現(xiàn)精神分裂癥的發(fā)病和發(fā)展階段,對于及時(shí)有效地預(yù)防或減輕疾病的進(jìn)一步惡化具有重要意義。
最近,越來越多的研究人員嘗試使用腦電生物標(biāo)記的機(jī)器學(xué)習(xí)方法來區(qū)分精神分裂癥患者和健康對照組。其中一些研究使用了傳感器水平的腦電生物標(biāo)志物。比如ERP 的振幅和潛伏期作為分類的特征。Neuhaus(2011)使用視覺和聽覺異常范式誘發(fā)了被試N100 和P300 的振幅/潛伏期來區(qū)分40 個精神分裂癥患者和40 個健康對照組,得到了72.4%的分類準(zhǔn)確率。2013年,Neuhaus 改變實(shí)驗(yàn)任務(wù),使用視覺目標(biāo)鎖定范式誘發(fā)的ERP成分作為數(shù)據(jù)源,將分類準(zhǔn)確率提高至79%。
Miseon(2016)使用從聽覺oddball 任務(wù)誘發(fā)的ERP 信號中提取的傳感器級和源級特征來對精神分裂癥患者和健康對照組進(jìn)行分類。研究人員記錄了34 名精神分裂癥患者和34 名健康對照組的腦電圖信號,同時(shí)要求他們注意奇怪的音調(diào)。結(jié)果表明,當(dāng)源級特征與傳感器級特征一起使用時(shí),與僅使用傳感器級特征時(shí)相比,具有更高的分類準(zhǔn)確率,為88.24%。
阿爾茲海默癥(Alzheminer's disease,AD)是一種原發(fā)性退行性腦病變疾病,多起病于老年期,臨床上以智能損害為主(郝偉,&于欣,2013)。它的特點(diǎn)是下降至少兩個認(rèn)知域(例如失去記憶、注意、語言、執(zhí)行功能),嚴(yán)重到影響患者的社會或職業(yè)功能。隨著社會老齡化的發(fā)展,全球范圍內(nèi)該病的發(fā)病率呈逐年上升的趨勢。預(yù)計(jì)在2050 年,AD 患者的數(shù)量預(yù)計(jì)將從4440 萬增加到1 億3550 萬(宋昕,洪羽蓉,&胡秋瑩,2015)。
AD 已經(jīng)與心腦血管疾病、腫瘤、腦卒共同成為老年人的四大殺手,嚴(yán)重的危害老年人的身體健康和老年生活質(zhì)量。提高AD 的早期診斷率,可以避免病患錯失最佳的治療時(shí)期,及時(shí)選取合適的治療緩解癥狀病情的惡化。
Lucas R. Trambaiolli 等(2011)開發(fā)了定量腦電圖(qEEG)的處理方法,并結(jié)合支持向量機(jī)建立了AD 分類模型,用以區(qū)分AD 患者與健康對照組。該研究記錄了19 名正常受試者(14 名女性/5 名男性,平均年齡71.6 歲)和16 名可能有輕度至中度癥狀的AD 患者(14 名女性/2 名男性,平均年齡73.4 歲)的腦電圖進(jìn)行模型的建立,最終得到87%的高分類準(zhǔn)確率。
Sonja Simpraga 等(2017)利用接受東莨菪堿(scopolamine)治療的受試者的EEG 數(shù)據(jù),建立了由14 個腦電圖生物標(biāo)志物組成的鼠毒堿乙酰膽堿受體拮抗劑(mAChR)指數(shù)。研究得出mAChR 指數(shù)比單一腦電圖生物標(biāo)志物具有更高的分類性能。該研究將mAChR 指數(shù)結(jié)合機(jī)器學(xué)習(xí)算法建立了AD 診斷模型,獲得了92%的分類準(zhǔn)確率。這一研究證實(shí)可以通過整合多個腦電圖生物標(biāo)記物的方式提高疾病或藥物干預(yù)的模型識別準(zhǔn)確率。
基于EEG 技術(shù)的機(jī)器學(xué)習(xí)在精神障礙的計(jì)算機(jī)輔助診斷研究目前仍存在一定的局限性。
4.1 樣本量不足。樣本量不足是現(xiàn)階段精神障礙診斷領(lǐng)域機(jī)器學(xué)習(xí)研究面臨的一大問題(Bailey,2018)。樣本量不足的主要原因包括數(shù)據(jù)提取成本高、樣本的特殊性和數(shù)據(jù)共享困難。精神障礙患者受到臨床癥狀和藥物副作用的影響,在采集數(shù)據(jù)時(shí)需要耗費(fèi)更多的人力和物力,采集難度大,因此與精神障礙有關(guān)的腦神經(jīng)科學(xué)研究樣本量通常較小。
4.2 樣本及特征代表性有限。對精神障礙如自閉癥、精神分裂癥等亞類型的樣本選擇偏歧會導(dǎo)致樣本類內(nèi)差異過大而影響分類模型的效能。而利用機(jī)器學(xué)習(xí)選擇不同的生物標(biāo)志物作為預(yù)測特征,其預(yù)測準(zhǔn)確度會存在差別。我們應(yīng)在同時(shí)考慮準(zhǔn)確度和成本情況不斷尋找最佳的預(yù)測特征來構(gòu)建精神障礙診斷分類模型。
不可否認(rèn)的是,近年來機(jī)器學(xué)習(xí)在精神障礙智能診斷及預(yù)測研究中進(jìn)步巨大,并有很大的研究空間。
未來,多個研究機(jī)構(gòu)可以建立能夠保障被試隱私和數(shù)據(jù)安全的協(xié)議,規(guī)范數(shù)據(jù)入組標(biāo)準(zhǔn),在不違背倫理的情況下實(shí)現(xiàn)多中心數(shù)據(jù)共享,增大樣本量,以解決當(dāng)前與精神障礙有關(guān)的腦神經(jīng)科學(xué)研究樣本量通常較小的問題。研究者在需要利用降維和特征選擇的方法保留有用的大數(shù)據(jù)特征,從而提高特征的有效性。研究者更可以在獲得大樣本數(shù)據(jù)的基礎(chǔ)上,嘗試使用更高分類能力的深度學(xué)習(xí)算法進(jìn)行建模,以期提高機(jī)器學(xué)習(xí)算法診斷模型的準(zhǔn)確率和泛化能力。
據(jù)國務(wù)院發(fā)布的《全國精神衛(wèi)生工作規(guī)劃(2015-2020年)》,目前我國精神衛(wèi)生服務(wù)資源十分短缺且分布不均,全國僅有精神衛(wèi)生專業(yè)機(jī)構(gòu)1650 家,精神科醫(yī)師2 萬余名。我們期待當(dāng)EEG 技術(shù)、精神診斷與機(jī)器學(xué)習(xí)算法各領(lǐng)域的合作日趨成熟后,在醫(yī)療資源有絕對優(yōu)勢的地區(qū)訓(xùn)練、驗(yàn)證精神障礙的計(jì)算機(jī)輔助診斷模型,而后在欠發(fā)達(dá)地區(qū)投入使用,以期平衡我國精神障礙診治水平的地域差異性,促進(jìn)醫(yī)療資源共享,推動精神衛(wèi)生事業(yè)全面均衡發(fā)展。