湯影子,夏杰,劉慧敏,呂化杰,郭茂耘
1陸軍軍醫(yī)大學(xué)第一附屬醫(yī)院感染科,重慶 400038;2重慶大學(xué)自動化學(xué)院,重慶 400044
慢性肝病及肝硬化在全球的死亡原因中居第11位,每年造成110萬人死亡,其常見的原因包括乙型肝炎病毒(hepatitis B virus,HBV)感染、丙型肝炎病毒(hepatitis C virus,HCV)感染、酒精相關(guān)肝病及非酒精性脂肪性肝病(non-alcoholic fatty liver disease,NAFLD)等[1-2]。隨著精準(zhǔn)醫(yī)療的發(fā)展,以及醫(yī)療數(shù)據(jù)和數(shù)字圖像數(shù)量不斷增加,需要新的數(shù)據(jù)處理分析工具來幫助進(jìn)行疾病的診斷、監(jiān)測及療效預(yù)測。近年來,人工智能(artificial intelligence,AI)在醫(yī)療領(lǐng)域取得了突破性進(jìn)展,可通過模型及算法發(fā)現(xiàn)隱藏在數(shù)據(jù)中的循證醫(yī)學(xué)邏輯,從而為患者提供個性化的診療決策。與傳統(tǒng)統(tǒng)計模型相比,AI的優(yōu)勢在于可識別獨特的模式并結(jié)合多種因素創(chuàng)建更精確的預(yù)測模型、風(fēng)險分層及結(jié)果,特別適用于具有海量高維數(shù)據(jù)特征的臨床數(shù)據(jù)分析及預(yù)測建模任務(wù)。在肝臟病學(xué)的臨床實踐中會產(chǎn)生多種數(shù)據(jù)格式,如電子病歷、放射成像及肝臟病理資料等。AI在異質(zhì)性、復(fù)雜性及重疊混雜因素數(shù)據(jù)處理方面具有明顯優(yōu)勢,特別適用于慢性肝病領(lǐng)域的數(shù)據(jù)處理及分析[3]。本文對AI在慢性肝病領(lǐng)域的診斷、病變評估、協(xié)助治療、療效預(yù)測和預(yù)后,以及放射組學(xué)、病理學(xué)等方面的應(yīng)用情況及研究進(jìn)展綜述如下。
數(shù)據(jù)、應(yīng)用任務(wù)及算法是AI的3個關(guān)鍵組成部分。機(jī)器學(xué)習(xí)(machine learning,ML)是實現(xiàn)AI的核心技術(shù),通過ML可以建立算法及預(yù)測模型高效、有效地識別大數(shù)據(jù)集中的模式,通過算法對樣本數(shù)據(jù)特征進(jìn)行學(xué)習(xí),構(gòu)建決策預(yù)測模型,實現(xiàn)對新數(shù)據(jù)的判決及預(yù)測[4]。
1.1 人工神經(jīng)網(wǎng)絡(luò) 人工神經(jīng)網(wǎng)絡(luò)是由大量神經(jīng)元單元互聯(lián)組成的非線性、自適應(yīng)信息處理系統(tǒng),具有如下特點:(1)人工神經(jīng)元在數(shù)學(xué)上表現(xiàn)為一種非線性關(guān)系,可以提高容錯性及存儲容量;(2)通過神經(jīng)元之間的大量連接模擬大腦的判斷、預(yù)測及認(rèn)知功能;(3)自學(xué)習(xí)、自組織、自適應(yīng)性;(4)具有多個較穩(wěn)定的平衡態(tài),系統(tǒng)演化具備多樣性。以上特點使人工神經(jīng)網(wǎng)絡(luò)成為當(dāng)前類腦智能研究中的有效工具[5]。
1.2 深度學(xué)習(xí) 深度學(xué)習(xí)的概念源于人工神經(jīng)網(wǎng)絡(luò)的研究,通過組合低層特征形成更加抽象的高層屬性描述,以發(fā)現(xiàn)蘊涵在數(shù)據(jù)中的深層本質(zhì)特征。深度學(xué)習(xí)的優(yōu)勢在于用更多的數(shù)據(jù)或是更好的算法來提高學(xué)習(xí)算法的結(jié)果,與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)相比,深度學(xué)習(xí)能夠處理數(shù)據(jù)量更大、更復(fù)雜的問題[6-7]。
1.3 其他算法 支持向量機(jī)屬于淺層模型,在解決小樣本、非線性問題上具有優(yōu)勢。決策樹能夠直接體現(xiàn)數(shù)據(jù)的特點,易于理解及實現(xiàn)。隨機(jī)森林利用多棵樹對樣本進(jìn)行訓(xùn)練并預(yù)測,對于高維特征的數(shù)據(jù)集分類有很高的效率,準(zhǔn)確率較高,容易實現(xiàn)。k-近鄰是一種無建模過程的非線性分類器,也可用于回歸,在處理樣本量較大及維度較高的數(shù)據(jù)時有優(yōu)勢。
2.1 AI在肝病診斷分類中的應(yīng)用 利用電子病歷系統(tǒng)及大數(shù)據(jù)集,AI可以基于患者個體及人群的風(fēng)險因素發(fā)現(xiàn)肝病的表型特征。利用模糊c均值聚類等方法創(chuàng)建的肝病診斷分類器分類精度高,敏感度、特異度及準(zhǔn)確率均超過90%,用戶友好,對數(shù)據(jù)的解釋也容易理解,并可對肝病輔助診斷進(jìn)行全局及局部解釋[8-9]。Razali等[10]通過分析416例肝病患者及167例非肝病患者的臨床數(shù)據(jù),比較了貝葉斯點擊及神經(jīng)網(wǎng)絡(luò)等數(shù)據(jù)挖掘算法在肝臟疾病預(yù)測方面的性能及精度,并指出為提高肝臟疾病預(yù)測結(jié)果的準(zhǔn)確性,可將混合方法應(yīng)用于今后的工作中。
2.2 AI在NAFLD中的應(yīng)用 NAFLD現(xiàn)已取代慢性乙型肝炎成為我國第一大慢性肝病。利用AI技術(shù)細(xì)化疾病分型及判斷預(yù)后可以優(yōu)化臨床實踐,提高臨床診治效率。美國的Optum?研究納入了超過8000萬例患者的記錄,針對非酒精性脂肪性肝炎(nonalcoholic steatohepatitis,NASH)及健康(非NASH)人群創(chuàng)建ML分類器,并用其預(yù)測NAFLD患者隊列中的NASH。結(jié)果顯示,所有ML模型(邏輯回歸、決策樹、隨機(jī)森林及XGBoost)在識別NASH方面均表現(xiàn)良好,與現(xiàn)有非侵入性檢測相比,敏感度提高[受試者工作特征曲線下面積(AUC)為0.83~0.88],且可使用縱向臨床數(shù)據(jù)來識別個體的NASH風(fēng)險[11]。NASHMap?ML模型納入了兩個真實數(shù)據(jù)集:美國國家糖尿病、消化及腎臟疾病研究所注冊的一個子集(共704例經(jīng)組織學(xué)證實為NASH及非NASH患者)及Optum?驗證模型,包含14個臨床及實驗室參數(shù),并對每個參數(shù)進(jìn)行單獨評估,以預(yù)測其在NASH診斷方面的強(qiáng)度,結(jié)果顯示,NASHMap?模型能識別出879 269例未被Optum?模型診斷的NASH患者[11]。在識別NASH高危人群的基礎(chǔ)上,有研究進(jìn)一步開發(fā)了一種ML算法來識別NAFLD亞型,該研究納入13 290例患者,通過評估臨床、影像學(xué)及組織學(xué)等多項指標(biāo),使用無監(jiān)督聚類算法將患者進(jìn)一步劃分為5種亞型,結(jié)果顯示,占比較大的兩個大組(占全體患者的87%)主要為拉美裔及非洲裔美國人群,這兩組患者并發(fā)癥較少,肝纖維化程度更低,疾病進(jìn)展較慢,而占比較小的3組則表現(xiàn)為更嚴(yán)重的并發(fā)癥以及更差的預(yù)后[12]。
2.3 AI在肝纖維化及肝細(xì)胞癌中的應(yīng)用 肝活檢是診斷肝纖維化的金標(biāo)準(zhǔn),但由于其具有麻醉并發(fā)癥、有創(chuàng)性、出血風(fēng)險及取樣錯誤等缺點,適用性受到限制。超聲彈性成像診斷肝纖維化的準(zhǔn)確性良好,但其對硬度的測量受多種因素的影響,如肝靜脈充血、膽汁淤積、炎癥、飲食、肥胖、腹水及觀察者經(jīng)驗等,并最終導(dǎo)致彈性成像結(jié)果出現(xiàn)誤差。因此迫切需要一種準(zhǔn)確可靠的無創(chuàng)技術(shù)來診斷肝纖維化。Pu等[13]提出了一種優(yōu)化后的樸素貝葉斯模型,該模型評估了1023例HBV患者的55個常規(guī)實驗室及臨床參數(shù),其預(yù)測肝纖維化的準(zhǔn)確性可與肝活檢媲美(AUC為0.982)。Altay等[14]將基于關(guān)聯(lián)分析的進(jìn)化智能MOPNAR用于挖掘肝纖維化的規(guī)則,該算法可自行修改及調(diào)整,自動發(fā)現(xiàn)數(shù)值的關(guān)聯(lián)規(guī)則,且不需要修改或更改數(shù)據(jù),在敏感性、平均置信度、覆蓋記錄數(shù)等方面均優(yōu)于比較方法。一項回顧性多中心研究收集了埃及71 806例HCV感染患者的實驗室及組織病理學(xué)數(shù)據(jù),構(gòu)建了決策樹算法來評估糖尿病合并HCV患者肝纖維化進(jìn)展的預(yù)測因素,結(jié)果顯示在16個預(yù)測因素中,甲胎蛋白是最具決定性的因素,其臨界值為5.25 ng/ml,其次為年齡及血小板計數(shù)[15]。
Omran等[16]基于315例HCV相關(guān)慢性肝病患者的臨床數(shù)據(jù)構(gòu)建了一種預(yù)測肝細(xì)胞癌的決策樹學(xué)習(xí)模型,通過數(shù)據(jù)挖掘發(fā)現(xiàn)隱藏的模式,以利用常規(guī)數(shù)據(jù)替代計算機(jī)斷層攝影(computed tomography,CT)及肝活檢。楊儉等[17]基于肝癌患者的真實數(shù)據(jù)建立了肝癌AI臨床決策支持系統(tǒng),采用多分類器融合模型計算治療方案推薦系數(shù),并分析受試者工作特征曲線,采用DeepSurv算法實現(xiàn)對生存風(fēng)險及復(fù)發(fā)風(fēng)險的預(yù)測,并進(jìn)一步對比低、中、高風(fēng)險組的Kaplan-Meier生存曲線,結(jié)果顯示各風(fēng)險組間差異顯著,提示該系統(tǒng)能較準(zhǔn)確地進(jìn)行肝癌治療方案推薦及預(yù)后預(yù)測。Rau等[18]在2200萬例電子病歷數(shù)據(jù)的基礎(chǔ)上,建立了可預(yù)測2型糖尿病確診后6年內(nèi)肝癌發(fā)展的模型,并通過驗證證實該模型對2型糖尿病合并肝癌患者的診斷正確率達(dá)75.7%,對不合并肝癌患者的診斷正確率達(dá)75.5%。
2.4 終末期肝病患者的病情管理及生存期預(yù)測終末期肝病指各種原因所致肝病的晚期階段,其病死率高,預(yù)后差,為人類健康帶來了沉重的負(fù)擔(dān)。應(yīng)用AI技術(shù)可以幫助醫(yī)務(wù)人員對終末期肝病患者進(jìn)行病情評估、隨訪、生存期預(yù)測,以及篩選更合適的肝移植候選者。Lin等[19]開發(fā)的ML監(jiān)測系統(tǒng)涉及多層面分析,包括評估及診斷的各個方面,該系統(tǒng)的可視化界面提供了更易于理解的綜合評估患者病情的方法,且有助于對急性死亡患者及姑息治療患者進(jìn)行分類,可幫助醫(yī)務(wù)人員管理終末期肝病患者。Schoenberg等[20]采用隨機(jī)森林算法對181例肝癌患者的26個臨床參數(shù)進(jìn)行處理,在此基礎(chǔ)上根據(jù)風(fēng)險剖面特征對測試數(shù)據(jù)進(jìn)行分層,該模型對肝癌切除術(shù)后的無病生存期預(yù)測值為0.788,可用于篩選出哪些患者適合施行肝癌切除術(shù)而非肝移植。Kazemi等[21]采用多種ML算法(包括支持向量機(jī)、貝葉斯網(wǎng)絡(luò)、決策樹、多層感知器神經(jīng)網(wǎng)絡(luò)等)對902例肝移植患者的臨床數(shù)據(jù)進(jìn)行分析,以提取6個月生存期的有效特征,此模型的AUC及敏感度分別為0.90及0.81,識別出的影響因素的順序接近臨床試驗。Hu等[22]采用北美多中心終末期肝病研究聯(lián)盟隊列,對肝硬化住院患者出院后90 d的再入院及死亡情況進(jìn)行隨訪,評估多種AI技術(shù)預(yù)測其預(yù)后的能力,發(fā)現(xiàn)AI模型很難預(yù)測肝硬化患者30 d及90 d的再入院及死亡情況,其準(zhǔn)確性等同于僅使用血清鈉與終末期肝病模型聯(lián)合評分生成的模型,提示尚需要更多的生物標(biāo)志物來提高模型的預(yù)測能力。
2.5 AI在疑難肝臟疾病中的應(yīng)用 藥物性肝損傷是一種少見但重要的肝病,如何在電子病歷系統(tǒng)中診斷及識別藥物性肝損傷是一大難點。Heidemann等[23]提取并整理了一種從電子病歷中識別約14個肝損傷術(shù)語及200個字符文本的搜索算法,通過計算機(jī)提取口述文本,然后對文本片段進(jìn)行人工審查,可以快速識別出藥物性肝損傷案例。
利用AI技術(shù)將臨床數(shù)據(jù)與下一代基因測序分析整合有助于疑難肝病的診斷。有研究將在線人類孟德爾遺傳數(shù)據(jù)庫(online mendelian inheritance in man,OMIM)中單基因疾病的臨床特征映射到國際疾病分類(international classification of diseases,ICD)編碼庫ICD-10,通過在患者電子病歷中調(diào)用ICD-10,尋找OMIM中可能的疾??;同時將肝病相關(guān)致病基因突變進(jìn)行標(biāo)記,通過基因測序的結(jié)果篩查可能致病的突變,再返回OMIM尋找最佳的臨床表型-基因型的配對,以此來發(fā)現(xiàn)罕見變異與孟德爾病表型之間的關(guān)聯(lián)[24]。
影像組學(xué)與AI的融合可實現(xiàn)對疾病病理發(fā)展情況的整體性分析,展現(xiàn)細(xì)微的病理變化,在肝纖維化嚴(yán)重程度評估、肝脂肪變定性定量診斷、肝臟局灶性病變的鑒別及分類等方面具有明顯優(yōu)勢。
3.1 疾病診斷及肝纖維化程度的評估 一項納入19項研究的Meta分析探討了AI輔助超聲、彈性成像、CT、磁共振成像(magnetic resonance imaging,MRI)及臨床參數(shù)在肝纖維化及脂肪變性診斷中的敏感度及特異度,結(jié)果表明,AI輔助診斷肝纖維化的綜合敏感度、特異度分別為0.78、0.89,診斷肝脂肪變性的敏感度、特異度分別為0.97、0.91[25]。Gatos等[26]將基于硬度評估與支持向量機(jī)分類算法的計算機(jī)輔助診斷系統(tǒng)應(yīng)用于超聲剪切波彈性成像,該模型對85張超聲圖像(54張健康圖像、31張慢性肝病圖像)進(jìn)行了量化,結(jié)果顯示其準(zhǔn)確率為87.0%,敏感度為83.3%,特異度為89.1%。有研究進(jìn)一步采用優(yōu)化后的神經(jīng)網(wǎng)絡(luò)算法識別并區(qū)分超聲檢查下不同的硬度值區(qū)域,結(jié)果發(fā)現(xiàn)該方法可將慢性肝病纖維化分期診斷準(zhǔn)確率提高到95.5%[27]。Chen等[28]采用了4種經(jīng)典分類器(支持向量機(jī)、樸素貝葉斯算法、隨機(jī)森林、k-近鄰)建立了一個決策支持系統(tǒng),結(jié)果顯示上述分類器明顯優(yōu)于以往的肝纖維化指數(shù)方法,其中隨機(jī)森林分類器的平均準(zhǔn)確率最高。
3.2 肝臟局灶性病變的鑒別及分類 肝臟局灶性病變的影像鑒別診斷和分類是臨床的重點及難點,在超聲、超聲造影、CT及MRI圖像中采用ML技術(shù)鑒別病變性質(zhì)已取得明顯進(jìn)展[29-30]。Yasaka等[31]對460例患者的增強(qiáng)CT圖像進(jìn)行了回顧性研究,利用有肝臟腫塊的3個CT時相(平掃、動脈期、延遲期)共55 536個影像圖像進(jìn)行了卷積神經(jīng)網(wǎng)絡(luò)模型監(jiān)督訓(xùn)練,隨后用100個肝臟腫塊影像進(jìn)行測試,結(jié)果顯示其對肝臟腫塊的鑒別診斷準(zhǔn)確率達(dá)到84%。Schmauch等[32]采用367張超聲圖像及放射學(xué)報告通過監(jiān)督訓(xùn)練構(gòu)建了深度學(xué)習(xí)模型,其檢測肝臟局灶性病變的AUC為0.935,判定病灶性質(zhì)(良性/惡性)的AUC為0.916,但該模型仍需在大型獨立隊列中進(jìn)一步驗證。Guo等[33]提出了一種兩階段多視圖學(xué)習(xí)框架,用于超聲造影的肝腫瘤計算機(jī)輔助診斷:在第一階段,分別對動脈期與門靜脈期、動脈期與延遲期、門靜脈期與延遲期3對圖像進(jìn)行深度典型相關(guān)分析,共生成6個視圖特征;在第二階段,將這些多視圖特征輸入到基于多核學(xué)習(xí)的分類器中。結(jié)果顯示該框架的分類精度、敏感度、特異度分別為0.904、0.935、0.869。
3.3 監(jiān)測肝癌的復(fù)發(fā)及療效 肝癌術(shù)后早期復(fù)發(fā)是肝病治療中的重點及難點,及時識別并對患者進(jìn)行相應(yīng)干預(yù)具有重要意義。AI輔助技術(shù)可以從放射圖像中提取客觀的量化數(shù)據(jù),并揭示其與潛在生物過程的關(guān)聯(lián),在監(jiān)測腫瘤復(fù)發(fā)方面發(fā)揮重要作用[34]。Vivanti等[35]收集并整合了病程中腫瘤的初始表現(xiàn)、CT影像及腫瘤負(fù)荷量,在此基礎(chǔ)上設(shè)計出的腫瘤復(fù)發(fā)自動檢測模型準(zhǔn)確率達(dá)到86%。Morshid等[36]使用隨機(jī)森林分類器預(yù)測了105例肝癌患者對經(jīng)動脈化療栓塞術(shù)的治療反應(yīng),結(jié)果表明,結(jié)合了CT定量圖像特征的模型預(yù)測準(zhǔn)確率高于單獨使用巴塞羅那臨床肝癌分期模型(74.2%vs. 62.9%)。
AI輔助病理已應(yīng)用于肝纖維化、脂肪肝、肝細(xì)胞癌等患者。在NASH患者中,AI輔助病理工具(qFIBS)可用于識別及量化病理改變,包括脂肪變性、小葉炎癥、氣球樣變及纖維化[37]。PathAI是一種基于ML的肝組織學(xué)評估方法,該方法使用3個隨機(jī)對照試驗樣本來構(gòu)建并驗證深度卷積神經(jīng)網(wǎng)絡(luò),以評估NASH的關(guān)鍵組織學(xué)特征,可準(zhǔn)確地描述疾病的嚴(yán)重程度及異質(zhì)性,并敏感地量化NASH的治療反應(yīng),其預(yù)測結(jié)果與病理學(xué)專家的判斷高度一致,并能夠檢測到手工病理分期未檢測到的抗纖維化治療效果,且與組織學(xué)進(jìn)展一致[38]。Histindex是一種基于AI的二次諧波新技術(shù),采用多光子成像技術(shù),可用于定量評價肝脂肪變性[39]。Roy等[40]提出了一種基于深度學(xué)習(xí)的區(qū)域-邊界集成網(wǎng)絡(luò),用于精確量化整個肝臟組織切片病理圖像的脂肪變性,采用此方法進(jìn)行脂肪變性測量,在像素水平及脂肪變性水平上與病理學(xué)家注釋、影像學(xué)指標(biāo)及臨床數(shù)據(jù)均有很強(qiáng)的相關(guān)性。
在肝癌患者中,利用極限學(xué)習(xí)機(jī)聯(lián)合多重全連接卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行肝細(xì)胞癌核分級,在不同分化階段的腫瘤細(xì)胞分類方面表現(xiàn)出色[41]。Chen等[42]研究了卷積神經(jīng)網(wǎng)絡(luò)Inception V3用于肝癌切除后全視野數(shù)字切片的自動分類及基因突變預(yù)測,結(jié)果顯示,其預(yù)測腫瘤惡性程度(良性/惡性)的準(zhǔn)確率為96.0%,預(yù)測分化程度的準(zhǔn)確率為89.6%。有研究利用深度遷移學(xué)習(xí)對28種癌癥類型的17 355張?zhí)K木精-伊紅染色的組織病理學(xué)切片圖像進(jìn)行組織病理學(xué)模式量化,并將其與匹配的基因組、轉(zhuǎn)錄組及生存數(shù)據(jù)進(jìn)行關(guān)聯(lián),這種方法能準(zhǔn)確地區(qū)分腫瘤類型,并能在空間上分辨腫瘤組織與正常組織[43]。這些發(fā)現(xiàn)顯示了計算機(jī)視覺在表征腫瘤組織病理學(xué)分子基礎(chǔ)方面的巨大潛力。
AI技術(shù)推廣到臨床實踐尚面臨以下主要問題:(1)缺乏用于模型開發(fā)及驗證的高質(zhì)量訓(xùn)練及驗證數(shù)據(jù)集,尚需要建立高質(zhì)量且可及的慢性肝病患者的研究隊列;(2)大多數(shù)針對肝病開發(fā)的模型及算法尚缺乏在臨床實踐中的長期評估以及與傳統(tǒng)診斷方法的直接比較,其在真實世界中的表現(xiàn)如何有待證實;(3)算法開發(fā)者與臨床工作者之間的技術(shù)壁壘有待突破,AI輸出結(jié)論的可解釋性及透明度尚有待提高;(4)在醫(yī)學(xué)倫理方面,如果AI應(yīng)用過程中出現(xiàn)錯誤,其后果應(yīng)由誰來承擔(dān),以及該如何保證患者的最大獲益。這些問題尚需要進(jìn)一步解決[44]。
由于AI技術(shù)自身不斷進(jìn)步以及生物醫(yī)學(xué)問題本身固有的復(fù)雜性,AI在慢性肝病領(lǐng)域中發(fā)揮著越來越重要的作用,可以輔助肝病的診斷分類,預(yù)測慢性肝病患者纖維化風(fēng)險,客觀評估肝臟成像,以及進(jìn)一步完善肝臟組織學(xué)評估等。未來AI技術(shù)將被用于開發(fā)更精確的模型,以預(yù)測及監(jiān)測肝病進(jìn)展及潛在的并發(fā)癥。此外,AI可應(yīng)用于藥物研發(fā)、處理芯片數(shù)據(jù)及檢測腫瘤微環(huán)境等,幫助肝臟腫瘤患者實現(xiàn)更加精準(zhǔn)、個體化的治療。