林 振,秦宇辰,秦嬰逸,李冬冬,吳 騁,賀 佳
(海軍軍醫(yī)大學(xué)衛(wèi)生勤務(wù)學(xué)系軍隊(duì)衛(wèi)生統(tǒng)計(jì)學(xué)教研室,上海 200433)
腦卒中,又稱為中風(fēng)、腦血管意外,是由腦血管阻塞或破裂而導(dǎo)致腦組織損傷的一類疾病,包括缺血性腦卒中(約占70%)和出血性腦卒中(約占30%)[1]。腦卒中為世界人口僅次于缺血性心臟病的第二大死因,而在我國已經(jīng)成為頭號(hào)死因[2]。在過去的10 a,隨著醫(yī)療技術(shù)水平的不斷發(fā)展,腦卒中的預(yù)后有所改善,但是其患病率和發(fā)病率仍持續(xù)上升[1]。進(jìn)入21世紀(jì)以來,生物醫(yī)學(xué)數(shù)據(jù)的爆炸式增長以及高性能計(jì)算機(jī)的出現(xiàn)給研究者提供了發(fā)現(xiàn)新的疾病相關(guān)影響因素的可能性,有利于提高護(hù)理質(zhì)量、改善醫(yī)療決策。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)分支[3],該領(lǐng)域見證了計(jì)算機(jī)在理解和分析數(shù)據(jù)如圖像[4-5]、語言[6]和語音[7]等方面的驚人進(jìn)步。與普通的機(jī)器學(xué)習(xí)相比,深度學(xué)習(xí)是一種表示學(xué)習(xí)形式,在這種學(xué)習(xí)中,計(jì)算機(jī)接收原始數(shù)據(jù),然后開發(fā)出多層神經(jīng)網(wǎng)絡(luò),這些神經(jīng)網(wǎng)絡(luò)層通常按順序排列,由大量原始的、非線性的算法組成,從原始數(shù)據(jù)輸入開始,每一層的表示被輸入到下一層,并轉(zhuǎn)換為更抽象的表示[3];數(shù)據(jù)流經(jīng)系統(tǒng)的各層時(shí)會(huì)不斷地轉(zhuǎn)換,直到得到最后的結(jié)果。通過這種學(xué)習(xí)方式,可以得到高度復(fù)雜的函數(shù)。常見的深度學(xué)習(xí)包括卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)及生成對(duì)抗網(wǎng)絡(luò)(generative adversarial networks,GAN)等,其中CNN廣泛應(yīng)用于腦卒中的診療[8],如圖1所示。CNN包括卷積層、匯聚層、Dropout層以及輸出層。其中,卷積層能夠?qū)W習(xí)數(shù)據(jù)特征;匯聚層通過聚集相似或冗余的特征減少特征數(shù)量;Dropout層有選擇地關(guān)閉感知器,以避免過度依賴網(wǎng)絡(luò)的單個(gè)組件;輸出層將學(xué)習(xí)到的特征整理成一個(gè)分?jǐn)?shù)或分類,例如基于給定的影像圖片分辨其是否有缺血的跡象。這些算法在圖像分類任務(wù)中取得了巨大的成功,且其準(zhǔn)確率已經(jīng)與專業(yè)人員讀片的準(zhǔn)確率不相上下[9-11]。
圖1 卷積神經(jīng)網(wǎng)絡(luò)[8]
隨著各類醫(yī)療設(shè)備和醫(yī)療信息系統(tǒng)的日益普及,醫(yī)學(xué)領(lǐng)域已積累了海量的醫(yī)學(xué)數(shù)據(jù),這些數(shù)據(jù)可以有效地用于深度學(xué)習(xí)[12]。隨著新型診斷和預(yù)后工具的發(fā)展,腦卒中診療研究領(lǐng)域也開始受到深度學(xué)習(xí)的影響。鑒于腦卒中的臨床診斷往往依賴于細(xì)微的癥狀和具有顆粒狀、高維信號(hào)的復(fù)雜成像模式,深度學(xué)習(xí)在這些方面具有天然的優(yōu)勢(shì)。本文對(duì)深度學(xué)習(xí)在腦卒中醫(yī)學(xué)影像分析、醫(yī)療文本分析、結(jié)構(gòu)化數(shù)據(jù)分析等方面的應(yīng)用展開綜述,并對(duì)其目前所面臨的挑戰(zhàn)進(jìn)行分析,以進(jìn)一步促進(jìn)深度學(xué)習(xí)在醫(yī)療保健領(lǐng)域的應(yīng)用。
腦卒中作為一種急性神經(jīng)系統(tǒng)疾病,及時(shí)明確診斷和治療十分關(guān)鍵,而CT和MRI起著至關(guān)重要的作用。計(jì)算機(jī)視覺是深度學(xué)習(xí)獲得巨大成功的領(lǐng)域之一,應(yīng)用深度學(xué)習(xí)可以實(shí)現(xiàn)對(duì)圖像進(jìn)行目標(biāo)檢測與分割以及預(yù)測等功能。在圖像分析領(lǐng)域,CNN相較于其他算法優(yōu)勢(shì)顯著,絕大多數(shù)與影像相關(guān)的深度學(xué)習(xí)研究采用基于CNN的神經(jīng)網(wǎng)絡(luò)框架,因此本章節(jié)主要針對(duì)CNN相關(guān)的研究進(jìn)行探討。
快速診斷腦卒中是改善患者預(yù)后的關(guān)鍵,目前一些基于深度學(xué)習(xí)的平臺(tái)已經(jīng)被應(yīng)用于自動(dòng)診斷腦卒中領(lǐng)域。這些平臺(tái)主要用于區(qū)分缺血腦組織和非缺血腦組織,如基于CT血管造影來檢測是否存在大動(dòng)脈閉塞,基于CT灌注區(qū)分正常腦組織、缺血腦組織和梗死腦組織。Stib等[13]采用基于CNN的DenseNet-121架構(gòu)來自動(dòng)診斷基于CT血管造影的大血管閉塞模型,經(jīng)過訓(xùn)練后AUC達(dá)到89%,敏感度達(dá)到100%,特異度達(dá)到77%。Sheth等[14]采用CNN在CT血管造影上診斷大血管閉塞和梗死體積,用于檢測大血管閉塞的AUC達(dá)到88%,而用于檢測梗死體積的AUC達(dá)到90%。Azwani等[15]則采用VGG-16、GoogleNet及ResNet-50架構(gòu)對(duì)正常和異常腦CT圖像進(jìn)行分類,結(jié)果表明ResNet-50在區(qū)分是否梗死方面的準(zhǔn)確性最高。此外,Shinohara等[16]應(yīng)用CNN從CT圖像中識(shí)別大腦的動(dòng)脈高密度征,準(zhǔn)確率達(dá)到86.5%。上述的應(yīng)用均達(dá)到了較高的準(zhǔn)確率,雖然這些應(yīng)用不能完全替代醫(yī)生對(duì)于腦卒中的診斷,但是作為一項(xiàng)輔助診斷技術(shù),可以為醫(yī)生在診斷腦卒中時(shí)提供一定參考。
在腦卒中的治療中,區(qū)分正常和病變腦組織至關(guān)重要。腦卒中損傷的定位和體積量化可以為腦卒中的康復(fù)治療提供重要信息,特別是指導(dǎo)血管內(nèi)治療,這往往受到隨機(jī)試驗(yàn)數(shù)據(jù)和醫(yī)生個(gè)人經(jīng)驗(yàn)的綜合影響。利用影像學(xué)指標(biāo)來確認(rèn)腦卒中患者是否應(yīng)該進(jìn)行溶栓治療或血管內(nèi)機(jī)械取栓,已開始成為標(biāo)準(zhǔn)的指導(dǎo)原則之一。臨床醫(yī)生急需先進(jìn)的數(shù)據(jù)分析技術(shù)來識(shí)別缺血核心和可挽救的缺血半暗帶,并以可重復(fù)和準(zhǔn)確的方式預(yù)測預(yù)后結(jié)局,而基于深度學(xué)習(xí)的圖像分割在這方面具有巨大的潛力。
Maier等[17]評(píng)估了9種不同的分類方法,包括傳統(tǒng)的機(jī)器學(xué)習(xí)方法和CNN,結(jié)果表明CNN優(yōu)于傳統(tǒng)的機(jī)器學(xué)習(xí)方法。目前,CNN模型是最常用的分割模型,而Dice相似系數(shù)是比較不同分割模型性能最常用的指標(biāo)[18]。運(yùn)用Dice相似系數(shù)比較2個(gè)樣本之間的相似性(如比較計(jì)算機(jī)和人類對(duì)病變進(jìn)行分割的相似程度),系數(shù)越接近1,代表計(jì)算機(jī)分割得越好。Chen等[19]早在2017年使用CNN模型在741例患者的彌散加權(quán)成像(diffusion weighted imaging,DWI)序列圖像中進(jìn)行急性腦卒中分割,Dice相似系數(shù)平均達(dá)到0.67。而Zhang等[20]則利用3D-CNN模型在DWI圖像中進(jìn)行自動(dòng)分割,Dice相似系數(shù)達(dá)到0.79。目前,大多數(shù)CNN模型的Dice相似系數(shù)為0.6~0.8。
隨著深度學(xué)習(xí)的發(fā)展,模型不僅僅局限于傳統(tǒng)的CNN。Wang等[21]利用CT灌注成像,提出一個(gè)基于灌注參數(shù)映射合成偽DWI的新框架,該框架利用3個(gè)CNN進(jìn)行端到端的訓(xùn)練,通過獲得更好的圖像質(zhì)量提高DWI圖像的合成質(zhì)量和分割精度。而Tomita等[22]則開發(fā)出一個(gè)基于深度殘差神經(jīng)網(wǎng)絡(luò)的框架,從腦卒中患者的T1加權(quán)MRI圖像中實(shí)現(xiàn)了對(duì)不可逆損傷腦組織病變體積分割,在評(píng)價(jià)識(shí)別病變準(zhǔn)確性的指標(biāo)如Dice相似系數(shù)、平均表面距離、Hausdorff距離等方面均取得了較好的成績,證明了該方法對(duì)病變體積分割的有效性。此外,Lucas等[23]引入臨床專家知識(shí),在結(jié)合卷積自編碼器構(gòu)建多尺度CNN的基礎(chǔ)上,對(duì)患者的組織病變概率進(jìn)行預(yù)測,得到的Dice相似系數(shù)為0.46。
鑒于腦卒中的高致殘率,預(yù)測預(yù)后及不良事件并及時(shí)做出適當(dāng)?shù)闹委煕Q定,對(duì)于降低發(fā)病率和死亡率、提高患者生活質(zhì)量至關(guān)重要,而深度學(xué)習(xí)在預(yù)測最終腦組織結(jié)局、腦卒中并發(fā)癥和功能結(jié)果等方面具有一定優(yōu)勢(shì)。目前幾種不同的深度學(xué)習(xí)模型已被廣泛應(yīng)用于腦卒中患者的預(yù)后預(yù)測。Tang等[24]認(rèn)為將臨床和影像學(xué)相結(jié)合的信息作為定量的生物標(biāo)志物,利用深度學(xué)習(xí)預(yù)測短期和長期腦卒中預(yù)后具有一定的前景。例如,Chauhan等[25]基于CNN框架,在最初診斷時(shí)使用3D MRI作為輸入來評(píng)估語言缺陷的嚴(yán)重程度,并將CNN模型與傳統(tǒng)的機(jī)器學(xué)習(xí)算法進(jìn)行比較,發(fā)現(xiàn)CNN模型與主成分分析相結(jié)合時(shí)表現(xiàn)更出色。與此類似,Bacchi等[26]將3D CNN和人工神經(jīng)網(wǎng)絡(luò)相結(jié)合以預(yù)測臨床結(jié)果,并將其與其他方法進(jìn)行比較,研究結(jié)果表明,將3D CNN和人工神經(jīng)網(wǎng)絡(luò)相結(jié)合,即包含了影像和臨床信息的模型效果最好。而Hilbert等[27]僅僅利用CT血管造影圖像,構(gòu)建基于殘差神經(jīng)網(wǎng)絡(luò)與自動(dòng)編碼器相結(jié)合的模型,以此預(yù)測血管內(nèi)治療的再灌注結(jié)局和功能,也取得了較好的效果。
在深度學(xué)習(xí)和預(yù)訓(xùn)練模型的幫助下,自然語言處理(natural language processing,NLP)技術(shù)也得到了迅速發(fā)展。NLP作為一種新興的人工智能技術(shù),主要研究利用計(jì)算機(jī)來處理、理解和運(yùn)用人類語言的各種理論和方法。所謂的自然語言,即與計(jì)算機(jī)等編程語言相區(qū)別,主要是指日常生活中所用的書面語言和口頭語言。預(yù)訓(xùn)練模型的出現(xiàn)顯著提升了NLP技術(shù)的性能。預(yù)訓(xùn)練模型是遷移學(xué)習(xí)的一種應(yīng)用,通過在超大型數(shù)據(jù)集進(jìn)行訓(xùn)練(如維基百科、百度百科),學(xué)習(xí)單詞的語義和句法意義,將相關(guān)模型參數(shù)保存后作為字向量?,F(xiàn)階段的預(yù)訓(xùn)練模型分為基于詞嵌入的預(yù)訓(xùn)練模型和基于語言模型的預(yù)訓(xùn)練模型,基于詞嵌入的預(yù)訓(xùn)練模型其向量是固定的[28],而基于語言模型的預(yù)訓(xùn)練模型可以對(duì)下游任務(wù)的文本的向量表示進(jìn)行微調(diào)[29-30],克服了一詞多義的問題。對(duì)于訓(xùn)練數(shù)據(jù)量較小的模型,預(yù)訓(xùn)練模型給下游的神經(jīng)網(wǎng)絡(luò)提供了更佳的初始狀態(tài),使訓(xùn)練的準(zhǔn)確率得到提升。
由于很多重要的臨床信息都被記錄在非結(jié)構(gòu)化的醫(yī)療文本中,醫(yī)生花費(fèi)了大量的時(shí)間來記錄,如現(xiàn)病史、體格檢查、病程記錄、影像學(xué)報(bào)告等,據(jù)專家估計(jì)這部分信息占總量的80%以上[31],NLP技術(shù)在包含了大量信息的醫(yī)療文本分析中逐漸得到應(yīng)用。Garg等[32]在電子健康檔案上使用深度學(xué)習(xí)算法,通過分析病歷及影像學(xué)報(bào)告,根據(jù)急性卒中治療低分子肝素試驗(yàn)分類系統(tǒng)實(shí)現(xiàn)了在入院時(shí)確定腦卒中的分類亞型。而Ong等[33]利用RNN開發(fā)了一個(gè)較為全面的NLP框架,用來分類腦卒中患者的影像學(xué)報(bào)告文本,并能夠識(shí)別腦卒中的亞型、位置等相關(guān)特征信息。Fu等[34]則采用CNN從影像學(xué)報(bào)告文本中發(fā)現(xiàn)無癥狀性腦梗死,準(zhǔn)確率達(dá)到了99.4%,證明了NLP技術(shù)的可行性。此外,Heo等[35]使用腦部MRI的影像學(xué)報(bào)告文本,利用深度學(xué)習(xí)預(yù)測了急性缺血性腦卒中患者的不良預(yù)后,算法包括CNN、RNN、多層感知機(jī)等,結(jié)果表明深度學(xué)習(xí)要優(yōu)于其他機(jī)器學(xué)習(xí)算法的性能,而在較差預(yù)后的預(yù)測中,CNN要優(yōu)于RNN。
結(jié)構(gòu)化數(shù)據(jù)一般存在于類似電子醫(yī)療索賠數(shù)據(jù)庫這種大型數(shù)據(jù)庫中,由于其收集過程的大規(guī)模性、縱向性以及收錄的患者健康信息的多樣性而成為一個(gè)有價(jià)值的數(shù)據(jù)源,而這種數(shù)據(jù)往往比影像學(xué)數(shù)據(jù)更容易收集,因此,將深度學(xué)習(xí)應(yīng)用于結(jié)構(gòu)化數(shù)據(jù)有較好的前景。Hung等[36]選擇了一個(gè)約80萬患者的基于人群的電子醫(yī)療索賠數(shù)據(jù)庫,利用深度學(xué)習(xí)來預(yù)測患者是否在5 a內(nèi)發(fā)生腦卒中。結(jié)果表明,基于深度學(xué)習(xí)的模型與其他機(jī)器學(xué)習(xí)模型的預(yù)測精度相當(dāng),而深度學(xué)習(xí)使用的患者數(shù)據(jù)量更少,獲得了最優(yōu)結(jié)果。而Cheon等[37]則利用韓國公立醫(yī)院2013—2016年的調(diào)查數(shù)據(jù),采用深度學(xué)習(xí)預(yù)測了腦卒中的發(fā)生及患者腦卒中后的死亡,AUC能達(dá)到0.8以上。
盡管深度學(xué)習(xí)在生物醫(yī)學(xué)領(lǐng)域取得了巨大的進(jìn)步,但在獲得廣泛應(yīng)用之前,仍面臨一些重大挑戰(zhàn)。
腦卒中相關(guān)的數(shù)據(jù)分散存儲(chǔ)在各家醫(yī)院中,然而電子醫(yī)療記錄高度異構(gòu),通常由臨床文字記錄和各種數(shù)字代碼組成。臨床文字記錄往往由不統(tǒng)一的用詞和縮略語組成,經(jīng)常因?qū)I(yè)不同而不同,且包含冗余信息,并受到隱私限制,使得這些數(shù)據(jù)不太容易獲取。此外,考慮到患者的表現(xiàn)和疾病過程的復(fù)雜性,訓(xùn)練腦卒中相關(guān)模型所需的可靠的真實(shí)標(biāo)簽非常昂貴,往往需要多個(gè)領(lǐng)域的專家共同努力。標(biāo)注數(shù)據(jù)的缺乏仍然是深度學(xué)習(xí)在醫(yī)學(xué)領(lǐng)域應(yīng)用發(fā)展的重要瓶頸。
目前,基于深度學(xué)習(xí)的腦卒中病變分割或梗死體積量化的研究使用了不同的評(píng)價(jià)指標(biāo),其中一部分使用了基于分割的統(tǒng)計(jì)度量,如Dice相似系數(shù),而另外一部分則使用了損傷體積相關(guān)度量,但損傷體積相關(guān)度量僅描述體積的大小,因此可能夸大病變結(jié)果。病變分割及梗死體積測量的準(zhǔn)確性對(duì)腦卒中患者的預(yù)后至關(guān)重要,因此相關(guān)部門有必要制定統(tǒng)一的評(píng)價(jià)指標(biāo)來檢驗(yàn)各種深度學(xué)習(xí)模型。
現(xiàn)有的與腦卒中相關(guān)的深度學(xué)習(xí)研究大多數(shù)均在探索新模型、新方法,而不是調(diào)查和驗(yàn)證當(dāng)前已有的方法,往往缺乏外部驗(yàn)證,且訓(xùn)練數(shù)據(jù)集的來源可能并不具有代表性,如樣本僅僅來自于同一家醫(yī)院,或者樣本量僅僅幾十例,因此這些模型、方法應(yīng)用在臨床實(shí)踐中的適用性還應(yīng)通過大型多中心隨機(jī)對(duì)照臨床試驗(yàn)進(jìn)一步驗(yàn)證。此外,基于深度學(xué)習(xí)的研究更多的是用來診斷腦卒中,而用于評(píng)估腦卒中預(yù)后的研究較少。因此,未來的研究可以進(jìn)一步利用深度學(xué)習(xí)模型的優(yōu)勢(shì)來開發(fā)評(píng)估腦卒中預(yù)后相關(guān)的模型,這將有助于醫(yī)生評(píng)估治療方式的效果。
深度學(xué)習(xí)具有映射復(fù)雜的非線性函數(shù)的能力,使其難以被解釋,這在腦卒中診療中是需要醫(yī)師著重考慮的問題。由于臨床決策支持系統(tǒng)旨在增強(qiáng)醫(yī)療保健專業(yè)人員的決策能力,可解釋性對(duì)于說服醫(yī)療保健專業(yè)人員相信算法提出的建議并采用至關(guān)重要。因此,解決可解釋性方面的問題才能進(jìn)一步促進(jìn)深度學(xué)習(xí)在腦卒中診療等醫(yī)療保健領(lǐng)域的使用。
深度學(xué)習(xí)給醫(yī)學(xué)實(shí)踐帶來了革命性的影響,隨著其算法的不斷創(chuàng)新,在未來類似于GAN、遷移學(xué)習(xí)等新技術(shù)將進(jìn)一步促進(jìn)其在腦卒中領(lǐng)域的發(fā)展。深度學(xué)習(xí)在腦卒中診療領(lǐng)域的貢獻(xiàn)尤為突出,其在成像中的應(yīng)用有可能發(fā)現(xiàn)肉眼幾乎看不到的腦損傷,可提高臨床醫(yī)生的決策能力,減少治療延誤,并預(yù)測患者的預(yù)后。如何將深度學(xué)習(xí)整合到日常臨床實(shí)踐中是其面臨的緊迫問題,在未來還需要更多標(biāo)準(zhǔn)化的數(shù)據(jù)集和更廣泛的深度學(xué)習(xí)研究來建立和驗(yàn)證其在腦卒中診療領(lǐng)域中的實(shí)際應(yīng)用效果。