雷曼 郭志偉 母其文
腦血管疾病是我國第三大死亡原因,僅次于惡性腫瘤和心臟病,我國正面臨世界上最大的卒中風險挑戰(zhàn)[1]。急性缺血性卒中(acute ischemic stroke,AIS)占所有卒中的80%[2]。卒中的病死率嚴重受并發(fā)癥的影響[3],對卒中并發(fā)癥進行早期預(yù)測并及時做出相應(yīng)的處理對改善患者預(yù)后具有重要意義。
機器學習作為統(tǒng)計學和計算機科學的交叉領(lǐng)域,將高效的計算算法與數(shù)據(jù)結(jié)合,實現(xiàn)分類、預(yù)測及隱藏特征的挖掘,目前已經(jīng)應(yīng)用于包括醫(yī)療衛(wèi)生在內(nèi)的多個領(lǐng)域。其學習類型主要分為監(jiān)督學習和無監(jiān)督學習。監(jiān)督學習旨在預(yù)測一個已知的輸出,側(cè)重于分類、預(yù)測及評估風險,常見的模型包括隨機森林、決策樹、支持向量機等;相反,無監(jiān)督學習無輸出可預(yù)測,試圖從無標簽的訓練數(shù)據(jù)中挖掘有效的特征或表現(xiàn),常見的模型包括聚類分析和主成分分析。此外,深度學習作為機器學習的一種特殊類型,其與傳統(tǒng)的機器學習最大的區(qū)別在于如何從原始數(shù)據(jù)中學習表征,深度學習允許基于神經(jīng)網(wǎng)絡(luò)的多個處理層組成的計算模型去學習具有多個抽象級別的數(shù)據(jù)表征[4],常用的模型為卷積神經(jīng)網(wǎng)絡(luò)。近年來,隨著科學技術(shù)的發(fā)展,機器學習在醫(yī)療衛(wèi)生領(lǐng)域中的應(yīng)用越來越多,協(xié)助臨床醫(yī)師實現(xiàn)智能診斷、精準定位、疾病預(yù)測等,本文就機器學習在AIS并發(fā)癥中的應(yīng)用現(xiàn)狀進行綜述。
腦水腫可導致卒中后神經(jīng)功能惡化甚至死亡,但是目前尚無有效預(yù)防或準確預(yù)測腦水腫發(fā)生的方法?;诖?,Dhar等[5]開發(fā)了一種隨機森林模型,對153例AIS患者進行總計397次CT掃描并測量腦脊液體積,以量化缺血性卒中后腦水腫的進展。在此基礎(chǔ)上,該團隊又開發(fā)了卷積神經(jīng)網(wǎng)絡(luò)模型來量化大腦半球腦脊液在每個成像時間點的體積,證明腦脊液可以定量評估早期腦水腫形成,從基線期到CT掃描后24 h的腦脊液位移是腦水腫的早期生物標志物[6]。Foroushani等[7]首先基于598例大腦半球卒中患者的基線數(shù)據(jù)建立Logistic回歸機器學習模型,然后添加包括腦脊液位移在內(nèi)的CT掃描后24 h數(shù)據(jù),經(jīng)10倍交叉驗證,最終模型的受試者工作特征曲線下面積高達0.96。該研究結(jié)果表明,結(jié)合基線期和CT掃描后24 h的影像特征可幫助識別需要去骨瓣減壓術(shù)的惡性腦水腫患者。但是,這種基于圖像的機器學習模型需要進一步細化和外部驗證。Martha等[8]評估28例行機械取栓術(shù)的急性大血管閉塞患者的顱內(nèi)血栓遠端及近端動脈血液中84個炎性因子基因表達的相對濃度,并建立隨機森林模型來確定可預(yù)測梗死和水腫體積的炎性因子基因和患者人口統(tǒng)計學指標。此研究結(jié)果顯示,CC趨化因子受體4、干擾素A2、白細胞介素(IL)9、CXC趨化因子配體3、年齡、2型糖尿病、IL-7、CC趨化因子配體4、體質(zhì)量指數(shù)、IL-5、CC趨化因子受體3、腫瘤壞死因子 α 和IL-27可預(yù)測梗死體積(平均差異倍數(shù):2.56~35.06),而干擾素A2、IL-5、CC趨化因子配體11、IL-17C、CC趨化因子受體4、IL-9、IL-7、CC趨化因子受體3、IL-27、2型糖尿病、集落刺激因子2可預(yù)測水腫體積(平均差異倍數(shù):3.98~42.61),CC趨化因子受體4、干擾素A2、IL-9、IL-7、IL-5、CC趨化因子受體3和IL-27與2型糖尿病的重疊可預(yù)測梗死和水腫體積(平均差異倍數(shù):3.98~35.06)。利用機器學習確定缺血性卒中患者血液中的分子預(yù)測因子,可以為卒中領(lǐng)域的藥物研發(fā)開辟新途徑。綜上,機器學習可用于腦水腫的定量分析及惡性腦水腫的預(yù)測,但尚缺乏多中心外部驗證,未來研究需要更多樣化、更大的樣本量支持。
AIS的治療主要包括靜脈溶栓及血管內(nèi)介入治療,目的是恢復缺血區(qū)域的血流灌注,改善腦血液循環(huán),但這可能導致嚴重的并發(fā)癥,如腦出血[9]。因此,在再灌注治療之前預(yù)測出血轉(zhuǎn)化的發(fā)生對臨床決策十分重要。2013年,Scalzo等[10]納入多中心的263例在重癥監(jiān)護室治療的AIS患者,基于磁共振灌注加權(quán)成像滲透率直方圖,創(chuàng)建了多個機器學習模型來預(yù)測出血轉(zhuǎn)化的發(fā)生,結(jié)果表明,非線性回歸(譜回歸核判別分析)表現(xiàn)最佳,平均預(yù)測準確率達85%以上。Yu等[11]結(jié)合155例發(fā)病時間小于6 h的AIS患者的源磁共振灌注加權(quán)成像與擴散加權(quán)成像來預(yù)測患者經(jīng)再灌注治療后24 h隨訪時出血轉(zhuǎn)化的空間位置及范圍,并對支持向量機、線性回歸、決策樹、神經(jīng)網(wǎng)絡(luò)、核譜回歸這幾個機器學習模型的預(yù)測性能進行比較,結(jié)果顯示,核譜回歸表現(xiàn)最好,預(yù)測準確率為(83.7±2.6)%。可視化預(yù)測大腦不同區(qū)域出血轉(zhuǎn)化的空間位置可為神經(jīng)介入醫(yī)師行血管內(nèi)治療前提供新的思路。Feng等[12]基于90例前循環(huán)大動脈閉塞所致AIS患者的臨床特征及Willis環(huán)變異情況,建立決策樹模型和多元Logistic回歸模型,預(yù)測患者經(jīng)機械取栓后發(fā)生出血轉(zhuǎn)化的危險因素,兩個模型均證實,較差的側(cè)支循環(huán)及較高的血小板淋巴細胞比值與出血轉(zhuǎn)化顯著相關(guān)(受試者工作特征曲線下面積分別為0.817、0.855)。結(jié)合臨床實驗室數(shù)據(jù)及醫(yī)學影像數(shù)據(jù)能為機器學習模型提供更多的預(yù)測信息。盡管基于機器學習的成像模式還不是常規(guī)影像學研究的一部分,但是機器學習的預(yù)測作用有益于AIS的臨床決策。
據(jù)中國國家卒中登記中心的資料統(tǒng)計,國內(nèi)缺血性卒中患者中SAP發(fā)病率為11.4%[13]。SAP導致卒中患者的住院病死率(OR=5.87,95%CI:4.97~6.93)、0~90 d病死率(OR=2.17,95%CI:1.97~2.40)增加,91 d~365 d病死率相對風險增加31%[14]。因此,建立SAP發(fā)生的預(yù)測模型并對高風險患者做出有針對性的干預(yù)至關(guān)重要。Li等[15]收集了3 160例AIS患者的病歷資料,建立了5種機器學習模型(正則化Logistic回歸、支持向量機、隨機森林、極端梯度提升、全連接深度神經(jīng)網(wǎng)絡(luò))預(yù)測SAP,結(jié)果表明,極端梯度提升表現(xiàn)最佳,受試者工作特征曲線下面積為0.841。Ge等[16]也基于13 930例AIS患者電子病歷系統(tǒng)的時間序列數(shù)據(jù),建立了經(jīng)典機器學習(Logistic回歸、支持向量機、極端梯度提升)以及深度學習模型(多層感知機、基于注意力機制的門控循環(huán)單元),比較上述模型對卒中后7 d及14 d內(nèi)肺炎發(fā)生的預(yù)測性能,結(jié)果顯示,基于注意力機制的門控循環(huán)單元表現(xiàn)最佳,其7 d及14 d內(nèi)肺炎發(fā)病預(yù)測的受試者工作特征曲線下面積分別為0.928、0.905。盡管目前機器學習模型在SAP的預(yù)測中應(yīng)用相對較少,且均為基于中國卒中人群的數(shù)據(jù),但仍能說明機器學習模型較傳統(tǒng)的SAP風險評估量表略勝一籌,未來有待進一步優(yōu)化。
近年來,PSD患者的總數(shù)隨著卒中幸存者人數(shù)的增加而上升,大約1/3的卒中幸存者患有PSD,卒中后2年內(nèi)PSD的發(fā)病率為11%~41%[17]。PSD的典型癥狀表現(xiàn)為情緒低落、興趣缺失、乏力、注意力下降以及精神發(fā)育遲緩,不利于患者積極參與康復治療[18]。因此,早期診斷并治療PSD能改善卒中患者的預(yù)后。2016年,Hirata等[19]對546例卒中幸存者進行抑郁癥篩查,并建立隨機森林模型來確定與PSD相關(guān)并可預(yù)測的因素,其總體預(yù)測準確率為69%,年輕、貧困以及患有多種合并癥是獨立預(yù)測因素,有必要對上述患者進行抑郁癥篩查。Hama等[20]建立基于對數(shù)線性高斯混合神經(jīng)網(wǎng)絡(luò)的機器學習模型,將卒中幸存者分為對照組(80例)、情緒障礙組(抑郁組40例、冷漠組80例、焦慮組40例),并將對照組分別與情緒障礙組的每一組組合進行機器學習分析,結(jié)果表明,此種機器學習模型預(yù)測每一種情緒障礙的受試者工作特征曲線下面積都達到了0.85以上,優(yōu)于傳統(tǒng)的線性分類模型。Hong等[21]基于56例首次皮質(zhì)下卒中患者(PSD組33例,非PSD組23例)的腦灰質(zhì)體積建立支持向量機模型,由于樣本量相對較小,研究者采用5倍交叉驗證來檢驗?zāi)P偷念A(yù)測性能,結(jié)果顯示,此預(yù)測模型受試者工作特征曲線下面積為0.80,添加患者的臨床及人口學參數(shù)后,受試者工作特征曲線下面積提高至0.85。該研究表明,與非PSD組相比,PSD組左側(cè)額中回灰質(zhì)體積顯著減少(P<0.01,Cohen′s d =-1.25),額部邊緣網(wǎng)絡(luò)的變化表明,PSD可能是系統(tǒng)神經(jīng)變化的結(jié)果,與病變的位置無關(guān)。上述研究說明,機器學習模型可以運用于PSD的預(yù)測因素分析,甚至是發(fā)病機制的探討,但需要大的樣本量支持。
每年全球1/3卒中患者存在發(fā)展為認知障礙和癡呆癥的風險[22]。識別認知障礙的預(yù)測標志物,實施早期治療策略和對臨床試驗高危患者進行分層仍面臨嚴峻的挑戰(zhàn)。Betrouni等[22]基于160例卒中患者(PSCI組75例,非PSCI組85例)卒中后72 h的大腦海馬和內(nèi)嗅皮質(zhì)磁共振T1加權(quán)成像的紋理特征,建立支持向量機模型,運用主成分分析篩選顯著特征并結(jié)合患者年齡和性別,其預(yù)測PSCI的準確率達(88±3)%,說明機器學習可以處理多模態(tài)數(shù)據(jù),磁共振圖像的紋理特征可以代表神經(jīng)變化成為早期預(yù)測PSCI的篩選策略的一部分。Lopes等[23]基于首次缺血性卒中患者(72例)卒中后6個月的PSCI磁共振功能連接網(wǎng)絡(luò),開發(fā)嶺回歸機器學習模型,預(yù)測患者卒中后36個月的認知領(lǐng)域評分,結(jié)果表明,平均預(yù)測準確率語言領(lǐng)域最低(48%),注意/執(zhí)行功能領(lǐng)域最高(73%),記憶領(lǐng)域及視覺空間功能領(lǐng)域分別為67%、57%。此外,研究者在卒中患者(40例)組成的獨立數(shù)據(jù)集中進行驗證,結(jié)果表明,除注意/執(zhí)行功能(平均預(yù)測準確率50%)之外,基于PSCI磁共振功能連接網(wǎng)絡(luò)的模型對卒中后36個月認知領(lǐng)域評分的預(yù)測在首次缺血性卒中患者組和卒中患者組中同樣準確(語言、記憶、視覺空間功能的平均預(yù)測準確率分別為48%、65%、52%,P>0.05),說明PSCI磁共振功能連接網(wǎng)絡(luò)模型預(yù)測具有普遍性。但是,此研究隊列納入患者的卒中程度整體較輕,不同卒中程度對預(yù)測準確性的影響可以在未來研究中開展。
機器學習作為一種統(tǒng)計模型擬合方法,其結(jié)果受樣本量影響[24]。與在其他疾病中的應(yīng)用相似,機器學習在AIS并發(fā)癥中的應(yīng)用大多為回顧性研究,并且樣本量相對較小。為了避免因樣本量較小而出現(xiàn)的過度擬合、特征選擇偏倚、泛化不足等問題,研究者們采取了特征降維、交叉驗證等方法,根據(jù)數(shù)據(jù)特點建立合適的機器學習模型。大數(shù)據(jù)支持、多中心驗證、多學科合作對提高機器學習模型的預(yù)測準確率十分重要。隨著國家對精準醫(yī)療的重視、計算機技術(shù)的快速發(fā)展以及現(xiàn)代數(shù)據(jù)共享模型的建立,相信機器學習在醫(yī)療領(lǐng)域的應(yīng)用會越來越廣泛。